中美AI研发竞逐“贴身战” 技术追赶步入新阶段

2024-06-05 08:28:06 来源：用户：澹台心功

近期，斯坦福大学AI项目团队陷入一场争议，其开源模型Llama3-V被指抄袭了中国大模型公司面壁智能与清华大学共同推出的“小钢炮”MiniCPM-Llama3-V 2.5。对此，两位项目负责人森德哈斯·沙玛和阿克沙·加格在6月4日通过社交平台公开道歉，并宣布将撤下涉事模型。事件中，面壁智能的首席科学家、清华大学副教授刘知远指出，虽然这一事件令人遗憾，但它侧面反映了中国AI研发水平的提升，尤其体现在创业公司的大模型产品正日益获得国际认可。

事件起因于5月29日，斯坦福大学AI团队声称以极低成本训练出了高性能的多模态模型Llama3-V，并迅速引起关注。然而，不久后就有用户发现Llama3-V与MiniCPM-Llama3-V 2.5存在高度相似性，不仅模型结构和配置相同，就连特有的分词器也一致。尽管团队成员穆斯塔法·阿尔贾德里辩解称使用MiniCPM-V的配置仅是为了修复bug，非抄袭行为，但众多证据指向Llama3-V确实基于MiniCPM-Llama3-V 2.5进行了改头换面。

随着抄袭指控的增多，斯坦福团队最终承认错误并致歉，强调对未能验证项目原创性的失望，并承担全部责任。此次风波也引发了行业内的深刻反思，斯坦福人工智能实验室主任曼宁对抄袭行为表示谴责，并对MiniCPM模型给予了正面评价。

近年来，中美在大模型领域的竞争日趋激烈，美国在模型数量和技术层面上保持领先，而中国则在应用场景、算法优化及数据资源上展现出独特优势。据统计，中国人工智能领域的独角兽企业不断涌现，特别是在AIGC和大模型相关领域，新晋公司数量显著增加，表明中国在该领域的追赶速度正在加快。

零一万物的李开复在对比中美大模型发展时提到，两国间的差距已从一年前的约7至10年缩短至目前的6个月左右，显示出中国在大模型研发上的快速进步。清华大学的刘知远教授则通过个人经历回顾了中国AI科研从追求国际论文发表到实现国际前沿成果的转变，强调当前国内大模型团队正通过持续的开源共享赢得国际关注。

此外，清华大学与生数科技联合发布的视频大模型Vidu，被视为中国在多模态大模型领域的突破，进一步证明了中国在大模型赛道上积极探索的潜力。然而，启明创投的周志峰和生数科技的唐家渝均指出，尽管多模态大模型研究尚处初期，面临技术成熟度不高的挑战，但也是国内团队实现赶超的重要机遇。北京智源人工智能研究院的林咏华则强调，数据质量与数量仍是多模态模型发展的关键，尽管存在挑战，但中国在这一领域内实现弯道超车的可能性不容忽视。

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！