生成AI不如狗聪明?Meta把AI的路走窄了呀……

jh 10个月前 (06-16)

搞商业化,还是搞研究?Meta的两难选择。

生成AI不如狗聪明?Meta把AI的路走窄了呀……

“你以为的商战勾心斗角,真实的商战其实朴素无华。”

这句调侃的话,放在当下科技巨头们的AI竞赛上,竟然也能对得上。

当地时间周三,在巴黎举行的Viva科技大会上,Facebook母公司Meta首席人工智能科学家Yann LeCun(杨立昆)在谈到生成式AI时口出金句:“AI还缺失了一些真正重要的东西…别说是赶上人类的智力水平了,现在是连狗都不如。

为何无所不能的ChatGPT,在LeCun口中仿佛一无是处?

为新模型打广告,科技大佬惹争议

Yann LeCun,世界深度学习三巨头之一,“CNN之父”。

自从2013年加入Facebook后,LeCun一直为这家科技巨头搭建AI体系。

生成AI不如狗聪明?Meta把AI的路走窄了呀……

同时,他一直在打造自己理想中的AI——一种能够学习世界如何运作的内部模型,可以快速学习,并且随时应对不熟悉的新情况

这种机器被LeCun称为“世界模型”,光从名字就看得出来,这不是什么简单能捣鼓出来的东西。

相比之下,基于文本训练的GPT大模型就简单地多,并抢先引起了AI革命。

LeCun始终认为,GPT大模型根本不是所谓的“人工智能”,因此完全不会威胁人类。

在最近一次演讲中,LeCun再次批评GPT大模型所使用的方法(根据概率生成自回归的大模型),根本无法破除幻觉难题,直接发出断言:GPT模型活不过5年。

而在这次大会上,LeCun在被问到AI 当前的局限性时,他又一次借机“嘲讽”了GPT大模型:“那些 AI 系统仍然非常有限,它们对现实世界的基本现状没有任何理解,只是纯粹基于大量的文本进行训练。但大部分人类知识与语言无关,所以这部分人类经验不会被AI捕捉到。”

LeCun举例称,AI现在可以通过美国的律师资格考试,却不会安装一台洗碗机,但一个10岁的孩子可以“在10分钟内学会”,因此“生成AI的智商甚至不如狗”。

虽然这是一种诡辩,但LeCun确实有点底气这么说——就在会议前一天,Meta震撼发布人工智能模型 I-JEPA,报道称它可以比现有模型更准确地分析和完成缺失的图像,而这正是“世界模型”的雏形。

生成AI不如狗聪明?Meta把AI的路走窄了呀……

这里我们就不仔细介绍该模型的细节,只要知道该模型可以通过自监督学习获取常识,不需要依赖人工数据进行增强预训练(总之就是,真的很强)。

在评价完GPT大模型后,LeCun赶紧接上话称,Meta正致力于基于视频内容训练 AI,这比语言训练更为艰难。

“就好比五个月大的婴儿看到一个漂浮在空中的物体不会想太多,但九个月大的婴儿就已经会对此感到惊讶,因为他已经能意识到通常情况下物体不应该处于漂浮状态。”

I-JEPA之所以强悍,就是因为它可以像人一样,在成长中不断学习,而不依赖人类去预设数据。

趁着新品发布宣布一波,顺便提一嘴友商的AI产品,Meta在AI竞赛里要弯道超车了?

模型虽好,仍需商业化

很不幸,I-JEPA虽然很强大,但终究还是一款偏向研究的产品,而当下的Meta急需一款商业化AI产品给外界再次画出一个大饼。

此前,Meta被元宇宙狠狠拖累了一把,股价在去年11月跌至谷底,扎克伯格赶紧宣布裁员。

不可否认,在采取一系列降本增效的措施后,Meta实现了触底反弹。

截止本月初,Meta股价已经从88美元/股一路涨回到了281美元/股。

生成AI不如狗聪明?Meta把AI的路走窄了呀……

结合美股其他公司的强劲表现来看,Meta或多或少也沾了AI的光,因此趁着AI的风口仍未散退,扎格伯格也希望借助这个长赛道来为业绩和资本注入一剂强心针。

生成AI不如狗聪明?Meta把AI的路走窄了呀……

事实上,Meta的AI实力并不弱,靠着LeCun这类大佬自研多年,Meta的AI产品并不输于其他几家科技巨头,I-JEPA就是最好的例证。

但问题在于,Meta在商业化路线上出现了大问题——自研的生成式AI技术都被用在自家产品层面,而LeCun主推的下一代AI在商业化进度上又远远落后生成式AI

今年2月,Meta发布了全新大模型系列LLaMA,据称其13B版本可以与GPT-3相媲美。

最初该模型并没有开源,但在发布一周后,它突然在匿名论坛4chan上泄露,引发大量下载,这下不得不成为无需付费的“开源”大模型。

此后,基于LLaMA构建的模型雨后春笋般冒出,包括斯坦福大学推出的Alpaca大模型,仅需52k数据、花费600美元、训练3小时,就能对标GPT-3.5。

这样的开源神器,谁不爱呢?

有人认为,Meta是故意泄露,目的是跟ChatGPT形成竞争,但从近期扎格伯格接受采访时的回答来看,Meta高层内部一直把LLaMA定义为“供研究人员使用”,因此LLaMA更多还是无意中泄露。

在采访中,扎格伯格表示,会在LLaMAV2版本上考虑商业化进程,其目的还是希望于为微软、谷歌们扳扳手腕。

显然,与GPT大模型属于同类型的LLaMA,与LeCun主导的I-JEPA互相矛盾。

是坚持研究,还是想办法实现商业化,Meta需要做选择了。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到