《1024计划》变“新”样、点亮AI科技树,一场科大讯飞与百万开发者的“狂欢”
科大讯飞表白百万开发者。
今天,科大讯飞1024开发者大会如期而至。
在现场,我们从科大讯飞董事长、CEO刘庆峰的演讲中,探析到科大讯飞已经取得的成果和未来的计划。
与此同时,我们也了解到最新版的《1024计划》、最新产品,还有科大讯飞技术构造的。
刘庆峰:AI成功核心唯有生态,才能生生不息
在演讲中,刘庆峰首先对科大讯飞开发者平台在过去10年间的成长,包括从早期只有语音合成和识别两个通用能力发展到如今的334种更为复杂的AI能力;从最早不到10万的应用终端数,到如今的超过20亿;开发者团队也从最早的十几个增加至如今的逾150万个等等。
我们也可以看到,发展至今,AI的落地应用越来越多,正如刘庆峰在现场所讲,人工智能正在解决人们的刚需。
图 | 科大讯飞董事长、CEO刘庆峰
刘庆峰表示,人工智能的价值是否兑现,可以看三点——是否有真实可见的实际应用案例、是否由能规模化推广的对应产品、是否有可用统计数据证明的应用成效。
而对于AI的未来,刘庆峰也在现场分享了自己的看法。在他看来,接下来AI的发展存在四大机遇,分别是场景牵引、数据支撑、技术驱动、资本助推。同时他也强调,这四个机遇中,不仅有利好的加速,也有着危险的倒逼。
如果总结当前AI创企或大企业在AI业务的成功,我们可以发现一个共同点——生态。对于这一点,刘庆峰也在现场明确表示,唯有生态,才能生生不息。
他也指出,AI生态目前正经历着三个变化:移动互联红利到期,万物互联红利开启;人口红利到期,工程师红利开启;从为产品赋能到为企业转型升级赋能。
《1024计划》4.0:先导计划、城市计划、公益计划
自首届1024开发者大会举办以来,《1024计划》的宣布就成为了一个固定节目。
想必大家也已经发现,今年的《1024计划》变了样子,以往是生态计划、教引计划、公益计划,而在科大讯飞消费者事业群总裁胡国平此次发布的4.0版本中,《1024计划》已经全新升级为“AI赋能计划”——先导计划、城市计划和公益计划。
· 先导计划
具体来看,该计划聚焦AI人才问题,面向行业推出“AI人才成长体系”,通过线上提供覆盖语音、图像等核心底层的机器学习和深度学习课程体系,包括专家录屏、实战案例等,共分为初、中、高三大学习阶段。
当然,理论学习之外,科大讯飞还会提供一个练手的机会——科大讯飞开发者竞赛平台。目前,这一竞赛已经举办到了第三届,在本届赛事中,共吸引了9118支参赛队伍。值得注意的是,科大讯飞开发者竞赛在赛题设置上相当多元化,覆盖了语音图像、文本挖掘、自然语言处理等传统课题,还增加了婴儿啼哭、温度预测等前瞻性课题。
此外,除了培养AI人才,科大讯飞同时也面向大学生创业推出扶摇计划,提供技术支持,资本对接、业务协同、风控管理、法律支持、项目路演等相关服务;面向创业团队推出鲲池计划,基于讯飞体系,以及自身在各个赛道的优势,为早期阶段的相关的创业团队,提供各领域的专业知识,帮助创业团队实现产品突破和商业化落地。
· 城市计划
城市计划更强调“线下”,赋能线下,主要有三个工作,分别是城市赋能、本地化服务和高校赋能。
其中,城市赋能过程中,科大讯飞将组织开放平台和研究院的核心团队去往各个城市、走进当地企业,依据当地的产业状况和AI需求,形成一个针对城市的专属AI赋能方案;
本地化服务中,除了针对特定城市中有重大需求保障的客户提供本地服务保障,科大讯飞也将融入当地的产业联盟,从而建立广泛的常态化连接,为以后服务本地企业打造一个长期有效的渠道;
至于高校赋能,全新打造AI开发者社区、AI实训营。截至目前,科大讯飞已经与5所高校建立了AI社团,另有16所高校正在沟通中。
图 | 科大讯飞消费者事业群总裁胡国平
· 公益计划
该计划是《1024计划》中唯一没有变化的。
这一计划目前主要有两个重点,一个是支持国家脱贫攻坚,另一个是关爱听障、视障人士。
围绕第一个重点,科大讯飞联合新华社共同策划了“听,中国反贫困斗争的声音”专项活动,建设线上小程序互动,并改造出公益大篷车,搭载讯飞智医助理和教育学习机、普通话学习平台等丰富的AI产品,以“追寻扶贫者的声音”为名,从安徽金寨大湾村(始发)奔赴云南怒江自治州、重庆城口鸡鸣乡湖等脱贫攻坚主战场的3个深度贫困地区开展巡展,沿路收集千万扶贫者的感动瞬间和脱贫者的澎湃心声。
围绕听障、视障人士,就在大会现场,讯飞开放平台正式发布第一个无障碍版AI开放平台,帮助视障开发者接用AI能力实现无障碍生活。
截至目前,讯飞开放平台已经服务了超过1000多个开发团队,创建22459个无障碍应用,每天为视听障人群超过5000万次服务,累计服务1087万视听障人群。
发布AI云,五大版块构建AI科技树
“企业数字化升级的终局是智能化,AI+大数据已经成为拓宽新局面的决定性因素。”科大讯飞集团副总裁于继栋在现场表示。
而为了更好地赋能企业数字化转型,科大讯飞在现场带来了全新生态新品——讯飞AI云。
根据现场介绍,讯飞AI云由磐石平台和擎天平台构成,前者针对AI服务对云主机集群进行了103项专业优化,降本提效的同时进行多种认证和加密,从而保证脏专属云用户接入安全;后者定位“授人以渔”,从数据标注、模型训练、引擎托管、服务编排等维度,满足更多用户不同业务场景组合下的AI需求。
随着讯飞AI云的发布,我们可以预想到,在未来,讯飞开放平台除了提供诸多AI基础服务之外,还将能够针对用户更多个性化的需求提供高效服务。
与此同时,科大讯飞AI研究院常务副院长刘聪也在大会现场提出“AI科技树”构造理念,并从5大板块掀开了科大讯飞技术全景的一角。
具体来看,此次介绍的5大板块分别是:
· 语音识别
科大讯飞的语音识别技术通过结合自学习更新的能力,可以对领域关键词、应用场景、口音、领域风格等个性化需求进行建模,真实、复杂场景下的语音交互也更自然。
这一技术上,科大讯飞还针对说话背景复杂多样、多人说话语音混叠、文字内容外的特殊声音现象等问题,给出了全场景音频解析的整体方案。
此外,针对包含语音的有效内容,使用基于富信息的语音降噪和分离方案,综合利用声音、文本、说话人等信息。在有条件的情况下,还可以使用多模态的唇形、视线以及麦克风阵列的空间位置等信息来进行联合建模,多次在国际语音识别与分离大赛中夺冠。
· 语音合成
过去,语音合成的效果主要用合成自然度MOS分来评估,但是未来的AI应用,不光追求技术可实现,还要更加人性化、更具有表现力、展示维度多模态。
科大讯飞的语音合成目前已经能够做到从语音到声音的全场景音频合成。基于自然语言理解技术,科大讯飞能够从文本当中分析到合适的情感焦点,以及与角色相关的信息。与此同时,他们也将单一的情感合成升级为微情绪合成,这意味着机器人能够对一些局部的情感做到精准预测和控制,从而让整个人机交互过程显得更加具备趣味性和人情味。
· OCR识别
科大讯飞在OCR识别领域,做的可谓是细致入微。目前讯飞的OCR框架已经进化到了第四代篇章级的Encoder+Decoder,可以完成高精度二维复杂版面的端到端识别,相关能力调用量已经超过10亿次。
· 多语种
目前,科大讯飞现在已经将语音合成、图文识别等AI能力成功迁移到了多个语种,文档拍照识别已经支持56种语言,并且平均正确率超过了85%,机器翻译更是扩展到了168种语言。
· 行业认知
当前,科大讯飞基于在各个行业积累的丰富经验,构建了一个行业认知中台,来降低问题定义的难度。
有了这个认知中台,就可以基本达到一个资深行业人士80%左右的认知能力,让场景定义的效率提升50%以上,而且认知中台可以完全私有化部署,数据安全无需担忧。目前,基于认知中台的讯飞智医机器人已经拿到了执业医师资格证,这也是全球第一个拿到医师执照的机器人。
在演讲的最后,刘聪表示:“除了上述的几个方向,伴随着科技树枝叶的持续点亮,讯飞科技树的全景已经展现在大家的眼前。我想从原始的一颗种子发展到参天大树,科技树的每一片枝叶、每一个技术背后都蕴含了大量的付出和努力。”他也说到,未来科大讯飞会用科学的方法,合理有序的侯建科技树,从而保证科技树的根基稳固,以及多个技术职业之间的高效协同。
最后
时至今日,科大讯飞1024开发者大会已经办过四届,而距离讯飞开放平台推出也已经走过10年光阴。
前面也说到,这10年间,“(讯飞开放平台)从早期的只有语音合成和识别两个能力,到现在300多个AI能力。从最早的十几个团队,到现在超过150万团队。”与此同时,平台也已对外开放了334项AI能力及方案,链接超200万生态合作伙伴,累计支持超过29.9亿+终端。
在会后对开发者的采访中,我们知悉了科大讯飞开发者竞赛等项目对于他们的帮助,而反过来,开发者们的聚拢,也为科大讯飞的生态建设提供了极大的助力。正如刘庆峰所说,唯有生态,才能生生不息!
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新