侧边栏壁纸
  • 累计撰写 1664 篇文章
  • 累计收到 1 条评论

对于“百模大战”,几乎所有大佬的口风都180 °大转变了?

2024-7-28 / 0 评论 / 110 阅读

文 | 智能相对论

作者 | 陈泊丞

在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏谈了些对于AI大模型的看法,语惊四座。

 

他先是指出,“百模大战造成了社会资源的巨大浪费,尤其是算力的浪费。但同时也使得我们追赶世界上最先进基础模型的能力得到了建立。”

而后又强调,[]&ldquo[];没有应用,[]光有基础模型[],不管是开源[]还是闭源都一[]文不值。&r[]dquo;同[]时李彦宏也表[]示,要跳出移[]动时代的思维[]逻辑,避免掉[]入&ldqu[]o;超级应用[]陷阱&rdq[]uo;,不是[]只有10亿D[]AU的应用才[]叫成功。

可以说,李彦[]宏的发言挺激[]烈的。这似乎[]也是第一次有[]大佬在这么高[]级别的场合去[]把&ldqu[]o;百模大战[]&rdquo[];和大模型的[]发展摊开了说[]

当然,秉持着[]类似观点的,[]也不只是李彦[]宏。

金沙江创投主管合伙人朱啸虎在6月的黑马大课上也提到,很多创业者盲目投资AI底层技术。虽然创造了“百模大战”的盛况,但也造成了社会资源浪费。

 

他强调,“很显然,AI创业的赚钱风向,已经彻底变了。”

怎么变?

除了李彦宏、[]朱啸虎之外,[]还有猎豹移动[]董事长兼CE[]O、猎户星空[]董事长傅盛,[]智谱AI COO张帆、[]百川智能创始[]人王小川等大[]佬在不同的场[]合也或多或少[]谈到了大模型[]行业竞争转变[]的方向,能最[]终达成共识的[]关键点在于&[]ldquo;[]场景&rdq[]uo;和&l[]dquo;应[]用&rdqu[]o;。

聚焦基础大模型的“卷”所导致的“百模大战”似乎该喊停了,大模型的重点还是得“卷”场景应用。

大佬们在这一[]点上达成了共[]识。今年以来[],大家的口风[]都变了!

不要过度竞争基础大模型,该“卷”场景应用了

在过去一段时[]间内,美国涌[]向了大量专注[]于大模型应用[]开发的创业公[]司,如Ade[]pt、Sta[]bility[].ai、Ru[]nway、B[]ettrDa[]ta、Tin[]ybird、[]UnSkri[]pt等等。

同时,像Op[]enAI、A[]nthrop[]ic这样的大[]模型头部领军[]企业以及如谷[]歌、微软等科[]技巨头也在致[]力于利用开源[]模型或自主研[]发的基础模型[],开发出各种[]应用场景的解[]决方案。

GPTs的推出以及OpenAI宣称的一系列给开发者让利的行为,都旨在吸引更多的创业团队参与到GPT技术的创新和应用中,从而丰富GPT生态系统,帮助OpenAI在接下来的时间内占据大模型领域在场景应用方向的优势。

 

以国外大模型行业的趋势来看,国内这些大佬们的口风转变并非空穴来风。

目前,百度文[]心一言的日均[]调用量已经超[]过5亿,而在[]两个月前百度[]官方才刚刚宣[]布文心一言的[]日调用量超过[]2亿。

期间2个月的[]时间,调用量[]就发生如此之[]大的变化,可[]见大模型要&[]ldquo;[]卷&rdqu[]o;场景应用[]不仅仅是厂商[]们的推动,还[]有整个市场的[]需求已经摆上[]台面,呈现出[]爆发式增长趋[]势。

类似的信号也[]在阿里云的主[]场上释放。

在世界人工智能大会上,阿里云CTO周靖人公布了近期通义大模型和阿里云百炼平台的最新进展——近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。

 

谈及大模型,比起参数上的比较,现如今国内的大佬们似乎更愿意去告诉市场自家的大模型如何好用,有多少人用,接下来还能怎么用等等一系列与场景应用落地相关的事情。

而以朱啸虎为[]代表的投资者[]们也开始在应[]用层去寻找大[]模型的投资机[]会。

市场的风向变[]了,不仅仅只[]是大佬的口风[]在变。

“超级能干”的应用在哪?

&ldquo[];AI时代,[]&lsquo[];超级能干&[]rsquo;[]的应用比只看[]DAU的&l[]squo;超[]级应用&rs[]quo;更重[]要。&rdq[]uo;在世界[]人工智能大会[]上,李彦宏试[]图为接下来的[]大模型应用开[]发趋势下一个[]结论。

然而,&ld[]quo;超级[]能干&rdq[]uo;的应用[]或许理解起来[]并不难,市场[]悬而未决的问[]题在于这样的[]应用是如何开[]发出来的,又[]是如何推向大[]众?

基于现阶段的[]行业表现,「[]智能相对论」[]认为有几点思[]考值得探究。[]

一、在“超级能干”的应用背后,大模型技术的迭代和适配是必要的。

行业的趋势大[]多殊途同归,[]大模型领域在[]今年以来掀起[]的MoE架构[]迭代趋势,则[]是代表了在技[]术方面大模型[]正为&ldq[]uo;卷&r[]dquo;场[]景应用而作支[]撑。

如今,Ope[]nAI的GP[]T-4、谷歌[]的Gemin[]i、Mist[]ral AI的Mis[]tral、x[]AI的Gro[]k-1、昆仑[]万维的天工A[]I、浪潮信息[]的源2.0-[]M32、通义[]千问团队发布[]的Qwen1[].5-MoE[]-A2.7B[]等国内外大模[]型都采用了M[]oE架构。

MoE架构通[]过引入专家网[]络(Expe[]rt Networ[]ks)和门控[]机制(Gat[]ing Mechan[]ism)实现[]了模型的稀疏[]化和模块化,[]在数据处理、[]算力资源调配[]、输出结果优[]化等方面都有[]相当不错的反[]馈。这为大模[]型的场景应用[]落地和推广提[]供了非常关键[]的技术支持。[]

比如,微软就[]提出了一个端[]到端的MoE[]训练和推理解[]决方案Dee[]pSpeed[]-MoE,其[]通过深度优化[]MoE在并行[]训练中的通信[],减少通信开[]销,实现了高[]效的模型并行[]。此外,De[]epSpee[]d-MoE还[]提出了基于微[]调的专家排序[]机制,可以根[]据训练过程中[]专家的损失动[]态调整输入样[]本到专家的分[]配,提升效果[]

二、“超级能干”的应用意味着一场更商业化的生态竞争。

技术没问题,[]但商业化路径[]不清晰仍然会[]在今天的市场[]面临崩盘。日[]前,微软官网[]更新了一条通[]知&mdas[]h;&mda[]sh;&ld[]quo;GP[]T Builde[]r即将停用&[]rdquo;[]。曾经掀起A[]I圈无数热议[]与高潮的GP[]Ts似乎正在[]走向败局。

谁又能想起,[]当时GPTs[]概念横空出世[]的那场发布会[]还被外界形容[]为&ldqu[]o;Open[]AI的iPh[]one时刻&[]rdquo;[]

OpenAI[]本意是想借助[]低门槛的技术[]能力以及全球[]开发者们共同[]打造出一批&[]ldquo;[]超级能干&r[]dquo;的[]应用,结果却[]因技术问题带[]来的体验瑕疵[]以及模糊不清[]的货币化政策[],让GPTs[]这一概念的商[]业化路径始终[]走不通,最终[]只能&ldq[]uo;凉凉&[]rdquo;[]

&ldquo[];超级能干&[]rdquo;[]的应用大多是[]建立在成熟的[]商业生态之上[],或许全球的[]AI厂商都需[]要认清楚这一[]点。值得一提[]的,在大洋的[]彼岸,阿里云[]在2022年[]11月牵头发[]起的开源AI[]模型社区刚刚[]斩获2024[] SAIL之星[]奖的魔搭Mo[]delSco[]pe。

历经一年多的[]发展,魔搭社[]区已成为国内[]规模最大、最[]活跃的AI模[]型社区,汇聚[]5500多款[]优质模型和上[]千数据集,为[]超过560万[]开发者提供了[]模型及免费算[]力服务。或许[],OpenA[]I没能走通的[]生态路径,在[]中国会有新的[]生机吧。

三、“超级能干”的应用必然萌芽于行业场景中。

朱啸虎送给大[]模型创业者的[]忠告,&ld[]quo;不要[]迷信AI,聚[]焦尖刀场景尽[]快落地。&r[]dquo;&[]mdash;[]&mdash[];场景是孵化[]&ldquo[];超级能干&[]rdquo;[]应用的摇篮,[]然而更深入地[]来看,也不能[]只看场景,最[]终还得看用户[]反馈和价值呈[]现。

医疗、教育、[]金融、制造、[]交通、农业等[]等这些行业领[]域是大模型应[]用&ldqu[]o;高发&r[]dquo;场[]景,但打造出[]来的智能体或[]解决方案究竟[]如何,&ld[]quo;如人[]饮水,冷暖自[]知&rdqu[]o;罢了。

To B的项目看效[]率。在快递领[]域,目前通过[]大模型来帮助[]处理订单,就[]可以做到了&[]ldquo;[]一张图、一句[]话寄快递&r[]dquo;,[]不再需要其他[]繁琐的流程,[]时间从3分多[]钟缩短到19[]秒。而且90[]%以上的售后[]问题,也都由[]大模型来解决[]。&mdas[]h;&mda[]sh;这样的[]效率提升,才[]称得上是&l[]dquo;超[]级能干&rd[]quo;。

To C的场景看用[]户。此前,在[]高峰期,百度[]的高考智能体[]每天要回答超[]过两百万个考[]生的问题。对[]于全国100[]0万的考生来[]说,这一比例[]是相当高的。[]&mdash[];&mdas[]h;这样的用[]户数量,也算[]得是&ldq[]uo;超级能[]干&rdqu[]o;。

今天,大模型[]应用覆盖文本[]生成、数据处[]理、PPT制[]作、市场营销[]、客服售后、[]医疗诊断等各[]类通用的和垂[]直的场景。实[]际上,市场并[]不缺场景,而[]是缺乏能干、[]有效的应用,[]&ldquo[];卷&rdq[]uo;应用须[]在场景中找用[]户、找价值。[]

*本文图片均[]来源于网络

此内容为【智[]能相对论】原[]创,

仅代表个人观[]点,未经授权[],任何人不得[]以任何方式使[]用,包括转载[]、摘编、复制[]或建立镜像。[]

部分图片来自[]网络,且未核[]实版权归属,[]不作为商业用[]途,如有侵犯[],请作者与我[]们联系。

[]AI产业新媒[]体;

[]澎湃新闻科技[]榜单月度to[]p5;

[]文章长期&l[]dquo;霸[]占&rdqu[]o;钛媒体热[]门文章排行榜[]TOP10;[]

[]著有《人工智[]能 十万个为什么[]

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

评论一下?

OωO
取消