避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

韩璐 7年前 (2017-09-21)

特定场景进行特定培训,这是打造更连贯、更自然的人机语音交互的一个解决途径。

“iPhone的市场占有率是多少?”

—“目前80%。”

“那华为的呢?”

—“怎么都喜欢华为?”

以上是发生在镁客君与某一语音交互机器人之间的对话。

避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

你来我往之间,那些令人“头痛”的瞬间

在日常生活中,通过语音交互技术,我们能够与机器人进行交流,或者是让后者实时控制一些家居产品;在办公时间,借助于语音交互技术,我们也能够直接口头交代语音助理一些工作,从而提升工作效率……

可以说,随着背后语音识别和自然语言处理技术的逐步提升,人们对于“语音交互”这一人机交互方式正在变得渐渐适应。不过,在你来我往的语音对话之间,我们也不可避免的也遇到了一些有时令人“哭笑不得”的BUG。

2017国家服务机器人产业高峰论坛于近日落下帷幕,在圆桌环节的自由问答时间,有人提出一个问题,称当前的服务机器人在人机语音交互的过程中,常常会词不达意,或者是出现上下文不连贯的问题,导致最终的用户体验不佳。可以说,这是当前人机交互上最“头痛”的问题,也是导致人工智能被冠上“人工智障”称号的根本原因。

避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

避免“人工智障”,我们目前需要将机器人关在“笼子”里

谈及这种“人工智障”现象,其中主要涉及自然语言处理和深度神经网络的一个问题。

一般情况下,基于自然语言处理技术,人工智能系统即能够对人们的语句进行拆分和处理,从而做到“理解”这句话,继而对用户作出相应的回应。至于上下文连贯,这其中主要关乎深度神经网络的一个搭建,换一种说法,主要是“知识图谱”在起作用。仍以本文最开始的对话为例:

“iPhone的市场占有率是多少?”

—“目前80%。”

“那华为的呢?”

—“目前是xx%。”

在深度神经网络,或者是知识图谱的协助下,当我们提出第二个问题的时候,它会将华为与上一个问题的“市场占有率”进行关联,从而做到对这一问题更为完整、精准的理解。

事实上,为了达到更为完美、自然的人机交互体验,难道人工智能企业就没有搭建深度神经网络、构造知识图谱吗?当然不是,只不过在这基础之上,依据当前机器人的语音交互的整体情况,我们还需要附加一些场景条件。

这一块问题的解决还是需要根据不同的场景来做不同的定制,毕竟这也不是说一个模型、一个算法就能解决好所有的问题。武汉泰迪智慧科技有限公司创始人兼董事长李成华表示。

总结一下也就是说,要想解决当前这一上下文理解不连贯的问题,我们还需要依据特定的场景来对机器人进行特定的数据训练,从而打造一个特定机器人。举个例子,比如智能客服机器人,其所能提供服务的领域包括金融、教育、酒店等多个领域,每个领域都有着其所特有的问题或是对话场景,为了保证对话的连贯,我们就得利用这些特有数据进行培训,构建一个面向垂直领域的知识图谱,以避免问题交叉、逻辑混乱等情况的出现。

避免沦为“人工智障”,机器人还需找对语音交互的“打开方式”

面对无人驾驶的落地问题,我们都说低速行驶、封闭性场景是其当前能够快速实现落地的一个方向,简单粗暴的说,也就是将无人驾驶汽车关在一个相对“封闭”的场景里。而与此类似,要想机器人在语音交互上表现的没有那么“智障”,我们也需要将其关在一个限定的“笼子”里面来实施培训,不同的是,无人驾驶汽车的“笼子”是在真实的物理世界,而机器人则是在一个虚拟层面。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到