设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗

2024-06-16 17:43:47 来源:

21世纪经济报道记者冯恋阁 实习生孔雅萱 广州报道rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

#斯坦福抄袭中国大模型#的话题近日出现在各大平台热搜中,引发了全网关注。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2名斯坦福学生和1名南加州大学学生组成的AI团队发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,称训练出了一个开源多模态模型Llama 3-V。这一模型比GPT-4、Gemini Ultra、Claude Opus等模型能力更强,更引人注目的是,其训练成本只需要500美元。很快,Llama 3-V 冲上了全球知名开源社区HuggingFace的趋势榜首页。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不久,有网友发现,Llama 3-V与清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5在模型结构、代码、配置文件等方面几乎一模一样,只是将变量名称做了更改。该网友更是直接将相关的关键证据一一截图,进行列举证明。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

随后,面壁智能团队证实,Llama3-V与MiniCPM一样,可以识别出“清华简”上的战国古文字(清华大学于2008年7月收藏的一批战国竹简),“不仅对得一模一样、连错得都一模一样”。 这一古文字数据是研究团队花费数月从竹简上逐字扫描、人工标注得到的,并未对外公开。Llama 3-V模型的团队成员 Aksh Garg在其社交平台上发文回应了质疑,表示所有训练代码由团队另一位成员编写,自己并不知情,并对原作者表达歉意。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

至此,此次大模型套壳抄袭事件暂告一段落。不过,公众对于大模型套壳的讨论并未止歇。斯坦福团队错在何处?大模型“套壳”争议频出,究竟是开源常态还是原创性缺失? rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

开源,开的是什么?

早在生成式AI影响力大爆炸前,开源和闭源就是软件开发过程中必须要经历的决策。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“源”最初指的就是源代码。公开与否,决定了后来者在使用、改编这个软件时有多大的自由度。闭源意味着只有编写者或者系统开发商掌握着修改源代码的权力,这虽然为经营者带来了先发优势,但一定程度上也抑制了后来者的创造能力,进而导致后期影响力扩大变得相对困难。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不过,随着技术进步,开源逐渐成为互联网精神的一部分。比如,操作系统Linux,在上世纪90年代初发布时就坚持开源至今。Linux开源极大推动了互联网发展。此前,360公司创始人周鸿祎评论“没有开源就没有 Linux,没有 Linux 就没有互联网。” rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

从字面意思来看,开源似乎意味着开源模型成为一种公共资源,可以被随意使用、修改。但事实上,开源生态不是“法外之地”,其使用行为将受到开源许可的约束和管理。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

研发者作为版权所有人,可以通过开源许可授予不特定的使用者附条件的版权许可。使用者需要按约定,通过特定使用方式、在约定包含的场景中使用开源模型。“大模型开源的程度、方式不尽相同,开源协议自然也不一样。”阿里研究院AI治理中心主任傅宏宇指出。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

当前通行的开源协议包括GPL、BSD、MIT、Mozilla、Apache和LGPL等,它们在修改后是否可闭源、修改后是否需要说明等方面要求各不相同。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

面壁智能联合创始人、首席科学家刘知远在朋友圈发表了一篇言辞恳切的回应,认为Llama3-V团队未能遵守开源协议对前人成果尊重,严重破坏了开源共享的基石。“Llama3-V团队的问题不仅仅在于违反了哪项开源协议,而是将他人成果声称为自己的成果。”刘知远在接受21世纪经济报道记者采访时进一步指出。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本次事件主角MiniCPM采用的开源协议Apache Licence 2.0。这一协议允许使用者修改代码,也允许使用者将成果开源或商用。对应的交换条件则是,后续使用者需要在被修改的文件中说明修改过代码;在修改后以及源代码衍生的代码中需要包含源代码的协议、商标、专利声明等说明。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

如何分清“壳”与“核”?

违背开源协议的“套壳”行为是如何被发现的? rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

虽然针对特殊数据集的识别能力并不是惯用的防伪手段,但这次风波中“套壳”嫌疑最终被确认,直接证据是能够识别“清华简”上的战国古文字。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

根据刘知远介绍,除了类似“清华简”识别能力这样的“水印”外,“套壳”一般通过大模型的分词词表、架构设置(如层数、向量维数等)和能力表现等判断。“这次之所以能够比较确认Llama3-V套壳MiniCPM-Llama3-V 2.5,主要还是这层‘壳’薄到近乎透明,能够找到多方面的直接证据。”刘知远表示。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在傅宏宇看来,窃取模型参数、谎报模型来源等不负责任的使用行为,违背了诚信原则和开源精神,开源社区可采取措施予以处理和规范。如果对开源模型的“抄袭”构成知识产权侵权行为,开源模型权利人则可以依据开源许可协议保护自身权益。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

他认为,此次Llama 3-V对MiniCPM的套壳,符合知识产权侵权行为的定义。“虽然项目已经开源,但研发者依然是工作成果的版权权利人,有权对其作品主张权益保护。”傅宏宇指出,斯坦福团队这种将他人开源的工作成果微调并直接转化为自己的工作成果公开发布的行为,可参考《计算机软件保护条例》的相关规定构成传统软件知识产权侵权,具体涉及复制著作权人软件、向公众发行、通过网络传播软件、故意删除或者改变软件权利管理电子信息等侵权行为。rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

围绕大模型套壳的是非之争并不是首次上演。在此之前,多家国内外企业都曾卷入类似纷争。比如,李开复零一万物发布的大模型“Yi”就曾被指控使用了Llama的架构,只对两个张量进行了重命名。rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不过,这些争议到最后似乎都没有迎来一个确定的结果。在几个回合的指控与回应后,没有判决、赔款或者标准来回应各界的关注。rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

站在巨人的肩膀上 

“套壳”争议屡屡出现,可能是由于各界对这一概念存在不同的理解和判断。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

刘知远告诉21世纪经济报道记者,“套壳”的说法,很多时候宽泛地包括了所有已有开源模型利用自有数据进一步训练和微调,从而形成定制模型的行为。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

但与大众对“套壳”的负面看法有些许不同的是,对开源模型的微调动作,实际上是被允许和鼓励的。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“套壳”这种说法本身就带有贬义的意味。刘知远坦陈:“很多开源模型的协议允许定制和修改,只要遵守开源协议就应当支持和保护。” rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“善用前人成果,努力站在巨人肩膀上实现高质量发展,是开源社区的重要价值。”他指出。rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

AI技术日新月异,市场需求也瞬息万变。金沙江创投主管合伙人朱啸虎曾经公开表态,AI应用应该尽可能实现快速商业化,而Llama的发布增大了创业者在逐渐收紧的时间窗口活下来的几率。rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

除了时间,算力、算法、数据无一不是自研大模型需要面对的难关。这种情况下,以开源模型为基础微调的定制模型成为性价比最高的选择。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

此前,现象级AI搜索产品Perplexity所在公司的CEO Aravind Srinivas在一档播客上直白地表示,“一个拥有十万用户的套壳产品显然比拥有自有模型却没有用户更有意义”。rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

就如通往成功的路站在巨人的肩膀上更好走,“质疑套壳、理解套壳、成为套壳”或许是AI应用元年的一种求生思路。 rjM流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗http://www.llsum.com/show-2-6922-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 对话丨面壁智能刘知远谈被斯坦福学生AI团队抄袭:善用开源成果,将快速提升AI能力的“下限”

下一篇: 马斯克赢下天价薪酬关键一战 560亿美元可以买下中芯国际

热门资讯

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • 马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

      马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI  《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然

  • 什么是“时空连续体”?

    英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuu

  • 新疗法可有效治疗多发性骨髓瘤

    据埃菲社报道,多发性骨髓瘤是成年人中继淋巴瘤之后第二常见的血液肿瘤。最近,西班牙的一个科研团队开发出了一种新的免疫疗法来对抗它。实验室实验表

  • 科学家用人工智能设计全新抗体

    据英国《自然》杂志网站19日报道,美国华盛顿大学科学家首次使用生成式人工智能(AI)工具,帮助他们制造全新抗体。研究团队表示,AI设计抗体或能更好靶向一

  • 专家:警惕常见睡眠认知误区

    3月21日是世界睡眠日,中国主题为“健康睡眠 人人共享”。近日发布的《2023年中国居民睡眠白皮书》显示,我国居民平均睡眠时长6.75小时,平均在零点后入

  • 我科学家实现最小资源消耗的量子态分辨

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局

  • 突发!Kimi,崩了!

    因流量突然剧增,3月21日,陆续有用户在社交平台上表示,月之暗面旗下大模型应用Kimi智能助手的APP和小程序均无法正常使用。截至记者发稿时,相关

  • 盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明

      盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明  澎湃新闻记者 吴遇利  Neuralink新技术或将造福数千万名失明人士。  当地时间3月21日,特斯拉C

  • Kimi掀起国产大模型长文本竞赛

    作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得

  • 英国2026年试飞电动“飞的”

    据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出

  • “穿上就走”的通用外骨骼面世

    美国佐治亚理工学院机械工程师开发了一种控制机器人外骨骼的通用方法。无需专门训练、特别校准,对复杂算法进行调整后,用户穿上外骨骼就可以直接行走

推荐资讯

  • 日榜
  • 周榜
  • 月榜