Wap 公众号 评论
设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗

2024-06-16 17:43:47 来源:

21世纪经济报道记者冯恋阁 实习生孔雅萱 广州报道ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

#斯坦福抄袭中国大模型#的话题近日出现在各大平台热搜中,引发了全网关注。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2名斯坦福学生和1名南加州大学学生组成的AI团队发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,称训练出了一个开源多模态模型Llama 3-V。这一模型比GPT-4、Gemini Ultra、Claude Opus等模型能力更强,更引人注目的是,其训练成本只需要500美元。很快,Llama 3-V 冲上了全球知名开源社区HuggingFace的趋势榜首页。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不久,有网友发现,Llama 3-V与清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5在模型结构、代码、配置文件等方面几乎一模一样,只是将变量名称做了更改。该网友更是直接将相关的关键证据一一截图,进行列举证明。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

随后,面壁智能团队证实,Llama3-V与MiniCPM一样,可以识别出“清华简”上的战国古文字(清华大学于2008年7月收藏的一批战国竹简),“不仅对得一模一样、连错得都一模一样”。 这一古文字数据是研究团队花费数月从竹简上逐字扫描、人工标注得到的,并未对外公开。Llama 3-V模型的团队成员 Aksh Garg在其社交平台上发文回应了质疑,表示所有训练代码由团队另一位成员编写,自己并不知情,并对原作者表达歉意。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

至此,此次大模型套壳抄袭事件暂告一段落。不过,公众对于大模型套壳的讨论并未止歇。斯坦福团队错在何处?大模型“套壳”争议频出,究竟是开源常态还是原创性缺失? ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

开源,开的是什么?

早在生成式AI影响力大爆炸前,开源和闭源就是软件开发过程中必须要经历的决策。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“源”最初指的就是源代码。公开与否,决定了后来者在使用、改编这个软件时有多大的自由度。闭源意味着只有编写者或者系统开发商掌握着修改源代码的权力,这虽然为经营者带来了先发优势,但一定程度上也抑制了后来者的创造能力,进而导致后期影响力扩大变得相对困难。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不过,随着技术进步,开源逐渐成为互联网精神的一部分。比如,操作系统Linux,在上世纪90年代初发布时就坚持开源至今。Linux开源极大推动了互联网发展。此前,360公司创始人周鸿祎评论“没有开源就没有 Linux,没有 Linux 就没有互联网。” ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

从字面意思来看,开源似乎意味着开源模型成为一种公共资源,可以被随意使用、修改。但事实上,开源生态不是“法外之地”,其使用行为将受到开源许可的约束和管理。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

研发者作为版权所有人,可以通过开源许可授予不特定的使用者附条件的版权许可。使用者需要按约定,通过特定使用方式、在约定包含的场景中使用开源模型。“大模型开源的程度、方式不尽相同,开源协议自然也不一样。”阿里研究院AI治理中心主任傅宏宇指出。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

当前通行的开源协议包括GPL、BSD、MIT、Mozilla、Apache和LGPL等,它们在修改后是否可闭源、修改后是否需要说明等方面要求各不相同。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

面壁智能联合创始人、首席科学家刘知远在朋友圈发表了一篇言辞恳切的回应,认为Llama3-V团队未能遵守开源协议对前人成果尊重,严重破坏了开源共享的基石。“Llama3-V团队的问题不仅仅在于违反了哪项开源协议,而是将他人成果声称为自己的成果。”刘知远在接受21世纪经济报道记者采访时进一步指出。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本次事件主角MiniCPM采用的开源协议Apache Licence 2.0。这一协议允许使用者修改代码,也允许使用者将成果开源或商用。对应的交换条件则是,后续使用者需要在被修改的文件中说明修改过代码;在修改后以及源代码衍生的代码中需要包含源代码的协议、商标、专利声明等说明。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

如何分清“壳”与“核”?

违背开源协议的“套壳”行为是如何被发现的? ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

虽然针对特殊数据集的识别能力并不是惯用的防伪手段,但这次风波中“套壳”嫌疑最终被确认,直接证据是能够识别“清华简”上的战国古文字。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

根据刘知远介绍,除了类似“清华简”识别能力这样的“水印”外,“套壳”一般通过大模型的分词词表、架构设置(如层数、向量维数等)和能力表现等判断。“这次之所以能够比较确认Llama3-V套壳MiniCPM-Llama3-V 2.5,主要还是这层‘壳’薄到近乎透明,能够找到多方面的直接证据。”刘知远表示。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在傅宏宇看来,窃取模型参数、谎报模型来源等不负责任的使用行为,违背了诚信原则和开源精神,开源社区可采取措施予以处理和规范。如果对开源模型的“抄袭”构成知识产权侵权行为,开源模型权利人则可以依据开源许可协议保护自身权益。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

他认为,此次Llama 3-V对MiniCPM的套壳,符合知识产权侵权行为的定义。“虽然项目已经开源,但研发者依然是工作成果的版权权利人,有权对其作品主张权益保护。”傅宏宇指出,斯坦福团队这种将他人开源的工作成果微调并直接转化为自己的工作成果公开发布的行为,可参考《计算机软件保护条例》的相关规定构成传统软件知识产权侵权,具体涉及复制著作权人软件、向公众发行、通过网络传播软件、故意删除或者改变软件权利管理电子信息等侵权行为。ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

围绕大模型套壳的是非之争并不是首次上演。在此之前,多家国内外企业都曾卷入类似纷争。比如,李开复零一万物发布的大模型“Yi”就曾被指控使用了Llama的架构,只对两个张量进行了重命名。ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不过,这些争议到最后似乎都没有迎来一个确定的结果。在几个回合的指控与回应后,没有判决、赔款或者标准来回应各界的关注。ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

站在巨人的肩膀上 

“套壳”争议屡屡出现,可能是由于各界对这一概念存在不同的理解和判断。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

刘知远告诉21世纪经济报道记者,“套壳”的说法,很多时候宽泛地包括了所有已有开源模型利用自有数据进一步训练和微调,从而形成定制模型的行为。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

但与大众对“套壳”的负面看法有些许不同的是,对开源模型的微调动作,实际上是被允许和鼓励的。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“套壳”这种说法本身就带有贬义的意味。刘知远坦陈:“很多开源模型的协议允许定制和修改,只要遵守开源协议就应当支持和保护。” ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“善用前人成果,努力站在巨人肩膀上实现高质量发展,是开源社区的重要价值。”他指出。ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

AI技术日新月异,市场需求也瞬息万变。金沙江创投主管合伙人朱啸虎曾经公开表态,AI应用应该尽可能实现快速商业化,而Llama的发布增大了创业者在逐渐收紧的时间窗口活下来的几率。ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

除了时间,算力、算法、数据无一不是自研大模型需要面对的难关。这种情况下,以开源模型为基础微调的定制模型成为性价比最高的选择。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

此前,现象级AI搜索产品Perplexity所在公司的CEO Aravind Srinivas在一档播客上直白地表示,“一个拥有十万用户的套壳产品显然比拥有自有模型却没有用户更有意义”。ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

就如通往成功的路站在巨人的肩膀上更好走,“质疑套壳、理解套壳、成为套壳”或许是AI应用元年的一种求生思路。 ybI流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗http://www.llsum.com/show-2-6922-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 对话丨面壁智能刘知远谈被斯坦福学生AI团队抄袭:善用开源成果,将快速提升AI能力的“下限”

下一篇: 马斯克赢下天价薪酬关键一战 560亿美元可以买下中芯国际

热门资讯

  • 日学者提出“深海激励化学”新概念

    日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温

  • 太空培育类器官或带来疾病新疗法

    自2019年以来,科学家已经在国际空间站上培育出了包括人类大脑、心脏和乳房在内的多个类器官模型。这些类器官通常利用人类干细胞培育而成,在一系列化

  • 突发!Kimi,崩了!

    因流量突然剧增,3月21日,陆续有用户在社交平台上表示,月之暗面旗下大模型应用Kimi智能助手的APP和小程序均无法正常使用。截至记者发稿时,相关

  • 我国建立“天-空-地-深”一体化铀矿勘查技术体系

    记者3月21日从核工业北京地质研究院(以下简称核地研院)获悉,该院自1959年成立以来,在天然铀保障、高放废物地质处置、核遥感技术与应用、分析测试等领

  • 新疆筹建国家级融合算力中心

    记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • huawei回应P70预售时间曝光:假的 最近没有官方消息透露

    3月22日消息,根据huawei旗舰机型迭代策略,今年上半年将发布影像旗舰huaweiP70系列。然而,这两天一张流出的图片声称huaweiP70将于3月23日开始预售,并附有各

  • 限量抢!xiaomiCivi 4 Pro限定色真机照来了:3599元

    3月23日消息,xiaomi集团王晓雁晒出了xiaomiCivi 4 Pro限定色真机照,该系列共有三款颜色,分别是蓝色、粉色和黑与白,定价为3599元,将于4月1日开始发售。据了

  • huaweiP70系列发布在即!供应链已开始批量供货:出货目标相当乐观

    3月24日消息,据媒体报道,huawei电话供应链公司,已开始向huaweiP70系列高端旗舰电话批量供货。同时有产业链人士透露,huawei给出的P70系列出货目标指引相对

  • 英媒:人工智能助力抗体设计

    据英国《自然》周刊网站3月19日报道,研究人员首次利用生成式人工智能(AI)制造出全新抗体。报道称,本周生物学预印本资料库中的一份预印本报告的原理验

  • 英国2026年试飞电动“飞的”

    据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出

  • 首批未来产业创新成果惊艳亮相

    全球首台无细胞蛋白质合成生物反应器、全球首台全高温超导托卡马克装置(洪荒70)、64比特超导量子计算机研发与产业化项目、深海可燃冰探采重载作业机

推荐资讯

  • 日榜
  • 周榜
  • 月榜