微软用AI造福视觉障碍者,让办公软件中的图片自己 “说话”

巫盼 7年前 (2016-12-05)

微软用认知服务计算机视觉API为 Word 和 PPT 增加解读图像能力,让盲人也能“看”图。

微软用AI造福视觉障碍者,让办公软件中的图片自己 “说话”

读图和视频时代的来临,对于那些视力受损者来说,如果看不到这些内容是非常遗憾的,不过微软正在解决这一问题。近日 Office 官方博客宣布,已经增强了该办公套件的辅助选项功能,其中就包括利用人工智能来描述Word和PowerPoint文档中的图像,让盲人也能“看”到图片的内容。

PPT 或 Word 中插入图片的话,在设置图片格式哪里会有可选文字一项功能,通过它可以设置图片的标题和描述,目的就是为了让视力或者认知能力存在障碍的人能理解图片而设计的。但是绝大部分人都不会输入这部分的信息。

所以,微软决定自动完成对这个图片描述的过程,其解决方案是利用自己的认知服务计算机视觉(Cognitive ServicesComputer Vision)API,通过这项 API 将图片自动用文字描述出来,然后再由屏幕阅读器把图片标题和描述读出来。

微软的图像识别技术为深度学习技术,它可以识别图片当中的对象,然后想出最适当的文字来表述整幅图像。

这些新特性将会在 2017 年初正式推出,Office 365 订户可以在PC版的Word和 PowerPoint上先睹为快。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到