李开复:“DeepSeek时刻”大幅加速模型落地
“大概9个月前,我曾经沮丧地说,中国还没有‘ChatGPT时刻’,虽然过去也有表现不错的模型出现,但是始终缺少一个一枝独秀的模型,能够支撑ToB、ToC 应用百花齐放,能够让每个企业CEO都在追问IT部门‘什么时候能在企业里接入大模型?’而现在,企业和用户已经经历过‘DeepSeek时刻’的市场教育。”
3月27日至31日,2025中关村论坛年会举行,人工智能主题日系列活动贯穿整个年会期间。在人工智能主题日核心论坛“未来人工智能先锋论坛”上,零一万物 CEO、创新工场董事长李开复分享了他基于全球视角对生成式AI的展望。
李开复正在发表演讲。官方供图
2025年 大模型“落地为王”
李开复认为,AI 2.0是有史以来最伟大的科技革命与平台革命,大模型走出实验室,穿透各行各业成为驱动实体经济的新质生产力,“在过去两年间,从 ChatGPT 推出之后,大模型智力在不断地提升,而且目前看起来远没有触及天花板。与此同时,大模型的推理成本在以每年降低十倍的速度快速下降,这为AI-First应用爆发提供了非常重要的条件。两年前性能不够好的模型,现在已经够好了;两年前推理成本太高的模型,现在已经是‘白菜价’了。”
基于此,他推测AI-First 应用将很快井喷,2025 年会是AI-First应用爆发、大模型“落地为王”的元年。
几个月前,OpenAI联合创始人苏茨克维公开表示,预训练阶段的Scaling Law(规模效应)放缓,因为模型训练所用的数据量已经触及瓶颈,算力方面超大GPU集群效益降低,随着GPU数量增加容错问题等导致边际效益降低。
对此,李开复认为,行业内已经出现了新的曙光,Scaling Law正从预训练阶段转向推理阶段,也就是慢思考模式。目前来看,在慢思考Scaling Law下,模型性能的成长速度非常快,而且还有很大的增长空间。
值得注意的是,DeepSeek正以思考见长,这也从侧面印证了李开复的观点。
DeepSeek开源推理模型思考训练过程 缩小了中美差距