跳动百科

中美AI研发竞逐“贴身战” 技术追赶步入新阶段

澹台心功
导读 近期,斯坦福大学AI项目团队陷入一场争议,其开源模型Llama3-V被指抄袭了中国大模型公司面壁智能与清华大学共同推出的“小钢炮”MiniCPM-Ll

近期,斯坦福大学AI项目团队陷入一场争议,其开源模型Llama3-V被指抄袭了中国大模型公司面壁智能与清华大学共同推出的“小钢炮”MiniCPM-Llama3-V 2.5。对此,两位项目负责人森德哈斯·沙玛和阿克沙·加格在6月4日通过社交平台公开道歉,并宣布将撤下涉事模型。事件中,面壁智能的首席科学家、清华大学副教授刘知远指出,虽然这一事件令人遗憾,但它侧面反映了中国AI研发水平的提升,尤其体现在创业公司的大模型产品正日益获得国际认可。

事件起因于5月29日,斯坦福大学AI团队声称以极低成本训练出了高性能的多模态模型Llama3-V,并迅速引起关注。然而,不久后就有用户发现Llama3-V与MiniCPM-Llama3-V 2.5存在高度相似性,不仅模型结构和配置相同,就连特有的分词器也一致。尽管团队成员穆斯塔法·阿尔贾德里辩解称使用MiniCPM-V的配置仅是为了修复bug,非抄袭行为,但众多证据指向Llama3-V确实基于MiniCPM-Llama3-V 2.5进行了改头换面。

随着抄袭指控的增多,斯坦福团队最终承认错误并致歉,强调对未能验证项目原创性的失望,并承担全部责任。此次风波也引发了行业内的深刻反思,斯坦福人工智能实验室主任曼宁对抄袭行为表示谴责,并对MiniCPM模型给予了正面评价。

近年来,中美在大模型领域的竞争日趋激烈,美国在模型数量和技术层面上保持领先,而中国则在应用场景、算法优化及数据资源上展现出独特优势。据统计,中国人工智能领域的独角兽企业不断涌现,特别是在AIGC和大模型相关领域,新晋公司数量显著增加,表明中国在该领域的追赶速度正在加快。

零一万物的李开复在对比中美大模型发展时提到,两国间的差距已从一年前的约7至10年缩短至目前的6个月左右,显示出中国在大模型研发上的快速进步。清华大学的刘知远教授则通过个人经历回顾了中国AI科研从追求国际论文发表到实现国际前沿成果的转变,强调当前国内大模型团队正通过持续的开源共享赢得国际关注。

此外,清华大学与生数科技联合发布的视频大模型Vidu,被视为中国在多模态大模型领域的突破,进一步证明了中国在大模型赛道上积极探索的潜力。然而,启明创投的周志峰和生数科技的唐家渝均指出,尽管多模态大模型研究尚处初期,面临技术成熟度不高的挑战,但也是国内团队实现赶超的重要机遇。北京智源人工智能研究院的林咏华则强调,数据质量与数量仍是多模态模型发展的关键,尽管存在挑战,但中国在这一领域内实现弯道超车的可能性不容忽视。