您现在的位置是:网站首页>

太阳神集团娱乐网站app

叶以亦 2024-06-05 4600 人已围观

近期,斯坦福大学AI团队疑似抄袭中国大模型创业公司的消息引发AI圈内高度关注。事情的起因是,一个来自斯坦福的AI团队宣布,只需500美元就可训练出一个超越GPT-4V的SOTA多模态大模型。随后,在一个源代码开放平台上,有用户质疑该AI团队的项目疑似窃取国内大模型初创企业面壁智能刚于5月21日推出的开源端侧多模态模型。 在路人的质疑下,斯坦福AI团队删除质疑帖并隐藏了Llama3-V项目页面。得知此事后,面壁智能CEO李大海发文回应开源模型被斯坦福大学AI团队抄袭一事,称“Llama3V展现出和小钢炮一样的‘清华简’识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。”李大海还感慨称,这也是一种受到国际团队认可的方式,但还是呼吁大家共建开放、合作、有信任的社区环境。

抄得“连做错样例都一模一样”

5月29日,一个来自斯坦福的AI团队开始在网络上宣传500美元就能训练出一个SOTA多模态模型,该模型名为Llama3-V,作者声称Llama3-V比GPT-4V、Gemini Ultra、Claude Opus性能更强。公开资料显示,团队内有两位成员为斯坦福大学本科生,曾发表多篇机器学习领域论文,实习经历包括亚马逊云平台AWS和特斯拉SpaceX等。

如此亮眼的实习经历加上斯坦福大学的背书,很快引起了网友的围观。不料,有技术圈人士发起了质疑。该人士称,名为Llama3-V的模型有大量作品疑似从MiniCPM-Llama3-V 2.5项目中窃取而来,后者为国内大模型初创企业面壁智能推出的开源端侧多模态模型,于2024年5月21日刚发布。

在路人的质疑下,斯坦福AI团队删除质疑帖并隐藏了Llama3-V项目页面。这引起了该质疑人士的愤怒,进一步举证证明抄袭。南都记者梳理发现,质疑人士认为,Llama3-V具有与面壁智能开源大模型完全相同的模型结构和配置文件,仅在变量名称上有所不同;其次Llama3-V作者害怕面对质疑,删除了质疑评论,还隐藏了与Llama3-V相关的项目页面。

随后,面壁智能员工亲自下场,将面壁智能模型MiniCPM-Llama3-V 2.5的识别“清华简”功能与Llama3-V类似功能相对照。据悉,“清华简”是一种罕见写在竹子上的战国时代文字,在研发实验该功能的过程中,面壁智能团队从新近出土的文物中扫描了这些图片,并在大模型中进行原始注释。不料当该员工用Llama3-V识别“清华简”时,Llama3-V给出了近似的识别反应。

面对此次抄袭事件,面壁智能CEO李大海发文表示,来自斯坦福团队的Llama3V项目与面壁小钢炮最新发布的多模态模型MiniCPM-Llama3-V 2.5展现出惊人的相似度。“经过团队核实,除了社区网友列出的证据外,我们还发现Llama3V展现出和小钢炮一样的清华简识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加tricky的是,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。我们对这件事深表遗憾,一方面感慨这也是一种受到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。一起加油合作,让世界因AGI的到来变得更好!”

面壁智能核心团队来自清华NLP实验室、知乎

此次被牵涉进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室 ——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。

今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据基础的建构以及推动大模型高效训练和应用落地。

在放眼望去清一色的清华系实验室创始团队中,面壁智能的CEO李大海是其中最特殊的存在,这不仅因为他兼任着知乎的CTO,也因为他在去年的大模型浪潮中一番探索后,选择了面壁智能来开启他人生中的第四次创业,这也是他第一次担任创业团队的一号位。

在加入知乎前,2006年大学毕业后,李大海还有加入Google成为Google中国创始员工之一,与时任Google北京工程副院长刘俊一起做出了国内第一个社会化搜索引擎“云云网”,以及加入豌豆荚负责搜索业务等亮眼创业经历。

2023年,随着ChatGPT浪潮席卷科技圈,时任知乎CTO的李大海在深入调研后知乎决定与面壁智能合作。4月,知乎宣布对面壁智能进行了数千万人民币的天使轮投资,同为清华系的头部大模型企业智谱参与跟投。后续,面壁智能陆续发布了共研的知乎大模型“知海图AI”、基于大模型的对话产品“面壁Luca”等。此前,面壁智能的基座模型产品“面壁露卡Luca”已获备案审批并对外开放。

而在一年后的这一次融资中,除了知乎作为战略股东持续跟投支持以外,投资者中还多了春华创投、华为哈勃,以及北京市人工智能产业投资基金。其中北京市人工智能产业投资基金刚于今年年初投资了智谱AI。

据媒体报道,面壁智能联合创始人刘知远对此事评论称,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。但开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。

刘知远还提到,国内大模型团队如智谱-清华GLM、阿里Qwen、DeepSeek和面壁-清华OpenBMB正在通过持续的开源共享,在国际上受到了广泛的关注和认可。

采写:南都记者 林文琪

很赞哦!

随机图文

标签云