瞄准技术与时机,谷歌正式公布云自然语言API!

韩璐 8年前 (2016-07-21)

在自然语言理解方面,谷歌放出了一个大招!

瞄准技术与时机,谷歌正式公布云自然语言API!

近日,谷歌正式向公众发布其Beta版的云自然语言API(Cloud Natural Language API),这是继公测版的云语音API(Cloud Speech API)、云视觉(Vision API)以及云翻译API(Translate API)后,谷歌机器学习API阵营的又一新成员。可以为用户提供多平台、多语言服务。

Beta版的云自然语言API主要有三项功能:情感分析、实体识别以及语义分析,可以为用户提供多平台、多语言服务。

情感分析(Sentiment analysis)

又称倾向性分析,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,主要目的是识别用户对事物或人的看法、态度

在拥有情感词典的基础上,计算机通过对评价词语、评价对象等信息的提取,然后根据词典上对应的情感信息等,就能够分析得出文本中的情感分类(消极、积极、主观、客观等)或对评价对象未来趋势的一种预测,比如通过人们对于股票信息的一种文字表达进行分析,可对未来这只股票的买入量来进行预测。

然而凡事总有意外,并不是所有词汇都能够够在词典中找到,比如“蓝屏”这一间接意味着不满的词语。面对这种情况,机器学习就该上场了。在机器学习基础上,在一堆由人工标注或本身有明显区分标注(用星星表示的满意度等)的评论中,利用算法对系统进行大量的数据训练,从而让系统学会分类和归纳。

瞄准技术与时机,谷歌正式公布云自然语言API!

实体识别(Entity Recognition)

此项功能也是基于机器学习实现的,指在文本里自动识别并标出任务、机构、地点、事件等等名词或句子。

以它的一个子任务“命名实体识别”(Named Entity Recognition,简称NER)为例,该识别是指从文本中识别具有特定类别的实体,例如人名、地名、机构名等。

在这项功能上,机器学习算法的应用类似于数学中的“统计学”。以“Barack H. Obama is the 44th President of the United States”这句话来分析,其中 Barack H. Obama是人名,United States是国家名。通过对每个词制定标签,用以表明某个特定类型。以此类推,在用机器学习算法进行大量训练之后,系统也就可以在文本中抽取那些特定类别的名词。

此外,针对这项功能的实用性,英语真的是比中文更具有可实施性,主要有这些原因:一是中文没有类似英文文本中空格之类的显式标示词的边界标示符,而命名实体识别的第一步就是确定词的边界,即分词;二是英文中的那些特定名词的首字母一般都会大写,而中文一般是没有什么特殊表示的。

语义分析

在已经于市场推出的自然语言处理API中,以上两个功能已经不具有什么新鲜感了,而这第三点就是谷歌这次的主打“产品”

通过语义分析,系统可以识别文本中的各个部分,在用机器学习算法进行了大量训练的前提下,系统可以按照逻辑关系将这些部分组成一个“依存关系分析树”。在此基础上,系统就可以对人们的话语进行正确的理解,从而给予正确的反馈。

不管是对于一个API这样的程序接口,还是一个人工智能机器人,语义分析功能都是极其重要的一个组成部分。想象一下,当你对系统说出或打出“我想要给我的吉他买一个箱子,所以它必须得很结实”这句话,并要求它反馈一些网购页面的时候,你肯定不希望它给我们展示吉他的购买页面,再比如之前苹果Siri犯的那个“救护车”的错误,相信我,如果你在需要紧急呼叫救护车的时候,系统却回答说以后称呼你为救护车,那将真的可能造成一个无法挽回的错误。

瞄准技术与时机,谷歌正式公布云自然语言API!

谷歌掌握了一个公布的好时机

在目前的市场上,像谷歌这种具有语义分析功能的API还没有大范围普及,而谷歌对于云自然语言API的推出时机掌握的也相当不错。

就在前几日,一场针对聊天机器人自然语言理解的挑战赛刚刚落幕,而对于此次比赛的结果确实不尽如人意。成绩最好的两个团队,在运用了最前沿的机器学习算法之后,其聊天机器人答对的概率也只比人类蒙着眼睛选的正确率高了那么几个百分点,实在是有些拿不出手。

在此等事实的打击下,多数研究团队会将目光放在“如何提高自然语言理解准确性”上面。而在自然语言理解方面,谷歌的研究人员一直在进行努力,并曾多次暗示自己已经取得了不小的进步,再加上此次竞赛谷歌的缺席,更是让其技术蒙上了一层面纱。在这种种因素的推动下,谷歌此时推出了云自然语言API,不管是对其技术好奇的,还是急于提升自家机器人自然语言理解能力的,都不免会对其放入更多地关注。

其次,正如上面所说,在市场上面,由于具有语义分析功能的API还没有大范围普及。依仗着自家人工智能技术在全球的信誉,谷歌选择在此时推出API,无疑会在市场上引起一阵风潮。若是用户体验方面真的能有很好的效果,谷歌在名誉与利益方面势必会赢得一场大的胜利!

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到