编故事神器的完整版代码来了!但OpenAI不保证不被滥用

巫盼 4年前 (2019-11-08)

技术永远是把双刃剑。

时隔九月,OpenAI终于放出了旗下最强NLP模型 GPT-2模型的完整代码,包含15亿参数。

编故事神器的完整版代码来了!OpenAI不保证不被滥用

这套模型最初是被OpenAI的工程师用来根据文本中已知的单词预测下一个单词,后来经过大量数据训练后,成为了现在的AI文本生成系统。该模型不仅可以根据给定的文本流畅地续写句子,甚至可以形成成篇的文章,写作水平堪比人类,被外界成为新一代“编故事”神器。

另外,GPT-2模型还可以执行机器翻译、问答、阅读理解和总结段落等任务。之前,OpenAI 已经发布了不同参数大小的三种GPT-2模型,今年2月,他们原本要释出完整的GPT-2模型,期望GPT-2能够被用来开发成写作AI助手或是语言理解系统等应用。

但是许多研究人员持反对意见,认为该套模型会被用于制造假新闻,甚至被极端主义团体滥用进行意识形态的干涉影响,技术引发的争议让OpenAI决定暂缓完整代码的开源,仅发布较小型的模型、范例和技术白皮书,供外部研究人员使用。

经过几个月的调查,OpenAI表示还未发现改模型被滥用的证据,所以选择释出模型的完整代码。同时他们也开发了一种检测模型,来防范模型产生的造假文件,面对由GPT-2 生成的文本,检测模型能够带来95%的成功率。

编故事神器的完整版代码来了!OpenAI不保证不被滥用

但OpenAI的研究人员也表示,随着文字生成器的输出质量持续提升,被滥用的可能性就会提高,而检测的挑战性也更高。

所以,后续OpenAI会持续研究语言模型存在的偏差,并通过参与Partnership on AI的“Responsible Publication Norms forMachine Learning”项目,与其他AI研究人员共同探讨此类问题。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到