跳动百科

面壁智能CEO回应斯坦福AI团队抄袭 技术创新应获尊重

秦宜芳
导读 在大模型领域,近期发生了一起引人注目的事件。斯坦福大学的一个AI研究团队被指控抄袭了面壁智能的开源研究成果,二者在模型结构和代码上的

在大模型领域,近期发生了一起引人注目的事件。斯坦福大学的一个AI研究团队被指控抄袭了面壁智能的开源研究成果,二者在模型结构和代码上的高度相似性引发了“套壳”疑云。

对此,知乎CTO及面壁智能CEO李大海表达了公司的立场,既感遗憾又略带无奈。他指出,这从一个侧面反映出国际团队对该公司成果的认可,但同时强调应共同营造一个开放、合作且基于信任的行业生态。

李大海进一步透露,经过内部核查,他们发现被指抄袭的模型Llama3V展现出了与面壁智能产品“小钢炮”极为相近的特征,包括在处理特定清华简样本时的错误表现完全一致。值得注意的是,这部分训练数据并未公之于众,其背后凝聚了团队成员数月的努力,从海量的清华简文献中逐字扫描并细致标注,精心整合至模型中。更加微妙的是,即便在引入高斯扰动的验证环节,两个模型的正确与错误反馈模式依旧高度吻合。

该事件起源于5月29日,斯坦福团队高调发布Llama3V项目,声称仅需500美元就能训练出性能可比肩顶尖大模型的产品。凭借其亲民的成本和团队的优良背景,该项目在社交媒体上迅速吸引了广泛关注。

然而,在聚光灯下,网友们的火眼金睛发现了Llama3V与面壁智能新近推出的MiniCPM-Llama3-V 2.5之间存在诸多雷同之处。随着抄袭指控的声浪渐高,起初尝试辩解的斯坦福团队最终选择删除项目资料并回避争议,从而使得这场风波逐渐平息。

李大海在事后反思中表示,技术创新之路充满艰辛,每一分成就都是团队不懈努力的结晶,也是在有限资源下对全球科技创新的诚挚贡献。他希望团队的辛勤工作能够获得更广泛的认可,但应当基于其原创价值,而非通过此类负面事件。