智能降噪、独立4G联网、63个语种随意切换,搜狗AI录音笔“玩花招”

韩璐 4年前 (2020-03-09)

功能方面,搜狗S1几乎考虑到了用户的所有需求。

近几年来人们手中的录音设备经历了质的变革,在传统录音笔的多模态录音、播放以及编辑的基础上,越来越多的厂商也赋予了设备“AI”能力,并基于此能力为录音笔开发多样化功能。

就在前不久,国内AI录音笔赛道重度玩家之一的搜狗在线上发布了最新两款产品,分别是S1和E1。发布会后,镁客网也拿到了一部“S1”,并进行了数天的深度测评:

这只搜狗AI录音笔,到底能“玩出什么花样”?

3.5寸大屏+纳米注塑工艺,风格硬朗、便于携带

拿到产品包装盒,S1的机身造型赫然映入眼帘,而在包装盒背面,则以文字和图片的形式简单囊括了S1的四大特色功能,包括麦克风阵列超强拾音、录音准确转文字、根据语义智能提取重点以及语音翻译。

S1整体包装以黑色为主,除了S1机身之外,另外还有充电器、Type-C接口充电(数据)线、保护套、防风罩等配件,以及一份说明书。

这只搜狗AI录音笔,到底能“玩出什么花样”?

S1整机重146g,拿在手上较为轻巧,一只手便能实现全部机身操作,可以如同手机一般揣到兜里,做到随用随拿。机身内存为64G,电池容量2450mAh,从0%充电至100%仅需2个半小时,能够持续录音10个小时以上,对于多数用户而言已经绰绰有余。

机身主色调为黑、灰,机身正面配有一个3.5寸触摸显示屏,便于部分功能调用、实时查看语音实时转录和翻译的进度和内容;背面由树胶打造,经磨砂打磨处理,上面印有搜狗的logo,也贴上了防滑胶垫;边框采用纳米注塑工艺和6系铝材质。S1整体看起来,带给人一种干练、硬朗的商务感。

机身顶部设计为镂空样式,配备2颗哈曼驻极体指向麦克风,大屏左右两侧对称分布了6个小细孔,内置6颗全向麦克风,形成8麦阵列,实现360°拾音。机身底部为Type-C端口和扬声器。

其他方面,机身左侧排列有电源建、音量调节键、3.5mm耳机插孔和SIM卡槽。卡槽的加入让S1也能够实现4G联网,让用户在没有WiFi的场景中也能够实现录音的上传、转写、翻译等等。

这只搜狗AI录音笔,到底能“玩出什么花样”?

而在机身右侧,除了录音开始/暂停键,S1还拥有了一个全新功能键“M键”,通过短按、长按,用户可启用重点标记、语音助手等功能。

这只搜狗AI录音笔,到底能“玩出什么花样”?

智能降噪、远程拾音,多场景针对性进行录音

作为一款录音笔,S1最为基本的功能就是“录音”,但这件事并不是那么简单就能做好。

1对1采访时,声源方向是相对单一的,人们一般会将录音设备的麦克风指向声源,但周遭的杂音会往往带来一定的干扰;会议过程中的声源则是多方向的,最终录音文件中的人声有的清楚有的模糊,音质不一……

在“录音”方面,传统录音笔在过程中会将所有的声音都收录进去,其中声源的距离、方向以及周遭的杂音均会带来影响,为后期整理增加难度。这方面,S1针对性的提供了4种录音模式,覆盖场景包括会议、采访、听课、音乐。

这只搜狗AI录音笔,到底能“玩出什么花样”?

基于clairVoice8麦克风阵列算法,S1能够针对不同场景的录音需求进行智能调整,以实现360°拾音或定向拾音,打造一个好的收音效果。经实际测试,10米范围内,S1在安静或杂声较小的环境内的录音还是清晰的,转写准确率也处于高水平。

与此同时,S1还运用了pureVoice AI降噪算法,提供三种降噪模式:真实音质(保留真实人声和环境音)、人声增强(过滤环境音,显著增强人声)、纯净人声(深度删除环境音,仅保留人声),让用户在使用过程中能够依据自身需求进行选择。

选定录音模式和降噪方式之后,用户短按REC键即可一键开始录音,过程中可随时更换语种,以及暂定或继续录音。当录音结束并保存本地之后,用户可点击机身屏幕主页面的“录音文件”查看录音情况,若先前忘记选择降噪方式,用户也可点击录音详情页下方的“降噪方式”,打开“纯净人声降噪”以听取降噪处理之后的录音。

这只搜狗AI录音笔,到底能“玩出什么花样”?

为了测试降噪效果,笔者一手拿正在运作的吹风机(与S1距离60-70公分),一手拿S1进行录音(会议模式,机身距离嘴部约50-60公分)。依据测试成果,在80-101分贝干扰声的环境中,S1经降噪处理后的录音依旧存在少许杂音,不过人声部分听起来相当清楚,最终的转写效果即使受到了一点干扰,但已能够满足基本需求。

实时转写、翻译,告别难懂方言和外语小白

相比于传统录音笔,AI录音笔最大的特色在于语音识别与转写、中外文互译。

在实时转写方面,目前S1除普通话外还支持10种方言和9种外语,覆盖粤语、东北话、南京话、英语、日语、法语等。

需要注意的是,过程中每当息屏或是连续转写10分钟后,系统会判定用户未关注转写内容而暂停转写。若用户还需继续使用该功能,记得手动在录音界面发起继续转写。

针对实时转写功能,镁客网以一段24分钟时长的采访录音进行测试,原始录音文件以中文为主,间杂少量英文词汇的全拼及缩写,测试结果显示实时转写的速度延迟小,但在识别准确度上还存在些许误差。

在录音结束后,用户也可以选择在录音详情页将该文件全部转写成文字。本次测试用的24分钟录音转写共用时3分30秒,转写准确度较实时转写有所提升。

S1官方介绍称可准确识别财经贸易、医疗、IT 科技、政法、文化体育这5大领域的专业术语,实际测试中,不管是实时转写,还是录音完成后进行的转写,涉及专业词汇的转写都比较准确。值得注意的是,基于新增的M键,搜狗为S1增添了一些人性化功能,包括一键标记重点,便于系统基于NLP等技术提炼重点,用于后期查阅和快速定点回听。

这只搜狗AI录音笔,到底能“玩出什么花样”?

这只搜狗AI录音笔,到底能“玩出什么花样”?

若用户急需在众多保存的录音中找到某一段,也可长按M键唤醒智能语音助手,经由语音交互找出自己想要的录音记录。

这只搜狗AI录音笔,到底能“玩出什么花样”?

镁客网在使用过程中也发现,只要该录音在结束后进行了转写,系统便会自动提炼摘要。与重点标记一样,系统智能提炼摘要的目的也是方便用户后期查阅和快速定点回听,只不过精准度还需多加提升。

这只搜狗AI录音笔,到底能“玩出什么花样”?

另外基于声纹识别等技术,用户在录音完成转写之后,可以点击录音详情页面左下角的“智能整理”功能,随即S1将对录音中的说话者进行区分,让用户能够以一种更为直观的方式看到录音内容,也方便了之后的整理等工作。

这只搜狗AI录音笔,到底能“玩出什么花样”?

翻译方面,S1提供两种模式,分别是对话翻译和同声传译,前者能够提供63种语言交传互译服务(包括63个语种、13种外语口音、9种离线语言),覆盖全球200多个国家和地区,后者目前仅支持中英互译。

这只搜狗AI录音笔,到底能“玩出什么花样”?

在对话翻译模式中,REC键和M键将各自承担一种语言的录入工作,届时用户需长按以录入对应语音,继而系统会自动读出对应内容的翻译结果。对于两个语言不通的交流者而言,利用录音笔进行逐个转写或许会耗费些时间,但能有效避免交谈过程中因语音来回交叉而带来的错乱问题,保证内容的准确性。

相比于对话翻译,同声传译不需要用户在过程中长按某个键,点击屏幕顶端即可调换翻译方向。若中途需要暂停/继续,只需短按一下REC键即可。

从测试结果来看,在发音正常的情况下,S1的识别和翻译准确度接近完美,些微差错也在可接受范围内。

此外所有的录音文件和转写内容,用户可以通过微信小程序扫码、蓝牙连接手机APP后实现云端上传下载,以及多人共享。

总结

众所周知,录音笔市场一直都是相对小众的,主要受众群体集中在新闻媒体、政府、事业单位等。依据中国报告网数据,国内录音笔市场呈现行业发展缓慢、替代风险大等特点,一句话概括,因为手机等数码产品的冲击等因素,国内录音笔市场长时间处于“供过于求”的境遇,年度产量基本维持在400多万台左右,一度出现小幅下滑现象。长年以来,这一硬件品类的市场由索尼、爱国者等厂商所霸占。

就在近几年,随着语音识别、自然语言处理等AI语音技术的逐步发展,录音笔的AI化趋势也是不可逆的。数据显示,经过近几年的产品研发和推广,AI录音笔已经占据整个市场份额的35%,这其中,搜狗是其中的重度玩家之一。

基于搜狗AI录音笔S1的深度体验来看,自最初的单一语音转写服务,AI录音笔的功能发展至今已经较为多元化,倾向于人性化等,覆盖了转写、翻译等多个方面,而这些功能也挑动了用户心中那根敏感的神经,满足了多种需求。

如果套用主播风格来为这款搜狗AI录音笔下定义的话,那就是:买它、买它、买它!

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到