百度推出计算机速记产品,速记员可能面临失业
未来,百度还计划增加对视频文件的语音识别支持,也会添加自动插入标点符号等功能。
近日,百度硅谷实验室(SVAIL)上线了网页应用SwiftScribe,该应用利用人工智能技术来完成传统速记员的工作,并且可以大大缩短逐字听写转录的时间。
目前,SwiftScribe还处在内测阶段,并未开放,不过你可以通过一个演示示例了解它是怎么工作的。SwiftScribe支持上传时长1个小时以内的wav 或 mp3文件,但是目前只接受英文。接下来它需要花点时间生成文字,官方说法是,1分钟的录音需要不到30 秒、1 小时的录音需要20 分钟左右。
很快,就能够在网页上看到转录好的文字,但是,现阶段文本还不会区分大小写,而且还没有标点符号和分段。所以,还需要人工在文本框中进行优化编辑,然后再做导出。
不过,人工操作的这一过程同样会被百度记录下来,用于人工智能的学习,以帮助算法纠正错误,提高文字转录的准确率。
项目主管Tian Wu说:“SwiftScribe 会在广泛的领域内带来积极影响,提高生产力,包括医疗机构、法律、商业和媒体。以后还会增加对视频文件的语音识别支持,也会添加自动插入标点符号等功能。”
除此之外,Tian Wu还介绍到,SwiftScribe是基于他们的最新研究成果Deep Speech 2研发而来。之后,百度还会花费更多的精力、更多的钱来进行人工智能的研究,这也是李彦宏一直在强调的未来方向。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新