设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗

2024-06-16 17:43:47 来源:

21世纪经济报道记者冯恋阁 实习生孔雅萱 广州报道gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

#斯坦福抄袭中国大模型#的话题近日出现在各大平台热搜中,引发了全网关注。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2名斯坦福学生和1名南加州大学学生组成的AI团队发布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,称训练出了一个开源多模态模型Llama 3-V。这一模型比GPT-4、Gemini Ultra、Claude Opus等模型能力更强,更引人注目的是,其训练成本只需要500美元。很快,Llama 3-V 冲上了全球知名开源社区HuggingFace的趋势榜首页。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不久,有网友发现,Llama 3-V与清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5在模型结构、代码、配置文件等方面几乎一模一样,只是将变量名称做了更改。该网友更是直接将相关的关键证据一一截图,进行列举证明。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

随后,面壁智能团队证实,Llama3-V与MiniCPM一样,可以识别出“清华简”上的战国古文字(清华大学于2008年7月收藏的一批战国竹简),“不仅对得一模一样、连错得都一模一样”。 这一古文字数据是研究团队花费数月从竹简上逐字扫描、人工标注得到的,并未对外公开。Llama 3-V模型的团队成员 Aksh Garg在其社交平台上发文回应了质疑,表示所有训练代码由团队另一位成员编写,自己并不知情,并对原作者表达歉意。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

至此,此次大模型套壳抄袭事件暂告一段落。不过,公众对于大模型套壳的讨论并未止歇。斯坦福团队错在何处?大模型“套壳”争议频出,究竟是开源常态还是原创性缺失? gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

开源,开的是什么?

早在生成式AI影响力大爆炸前,开源和闭源就是软件开发过程中必须要经历的决策。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“源”最初指的就是源代码。公开与否,决定了后来者在使用、改编这个软件时有多大的自由度。闭源意味着只有编写者或者系统开发商掌握着修改源代码的权力,这虽然为经营者带来了先发优势,但一定程度上也抑制了后来者的创造能力,进而导致后期影响力扩大变得相对困难。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不过,随着技术进步,开源逐渐成为互联网精神的一部分。比如,操作系统Linux,在上世纪90年代初发布时就坚持开源至今。Linux开源极大推动了互联网发展。此前,360公司创始人周鸿祎评论“没有开源就没有 Linux,没有 Linux 就没有互联网。” gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

从字面意思来看,开源似乎意味着开源模型成为一种公共资源,可以被随意使用、修改。但事实上,开源生态不是“法外之地”,其使用行为将受到开源许可的约束和管理。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

研发者作为版权所有人,可以通过开源许可授予不特定的使用者附条件的版权许可。使用者需要按约定,通过特定使用方式、在约定包含的场景中使用开源模型。“大模型开源的程度、方式不尽相同,开源协议自然也不一样。”阿里研究院AI治理中心主任傅宏宇指出。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

当前通行的开源协议包括GPL、BSD、MIT、Mozilla、Apache和LGPL等,它们在修改后是否可闭源、修改后是否需要说明等方面要求各不相同。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

面壁智能联合创始人、首席科学家刘知远在朋友圈发表了一篇言辞恳切的回应,认为Llama3-V团队未能遵守开源协议对前人成果尊重,严重破坏了开源共享的基石。“Llama3-V团队的问题不仅仅在于违反了哪项开源协议,而是将他人成果声称为自己的成果。”刘知远在接受21世纪经济报道记者采访时进一步指出。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本次事件主角MiniCPM采用的开源协议Apache Licence 2.0。这一协议允许使用者修改代码,也允许使用者将成果开源或商用。对应的交换条件则是,后续使用者需要在被修改的文件中说明修改过代码;在修改后以及源代码衍生的代码中需要包含源代码的协议、商标、专利声明等说明。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

如何分清“壳”与“核”?

违背开源协议的“套壳”行为是如何被发现的? gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

虽然针对特殊数据集的识别能力并不是惯用的防伪手段,但这次风波中“套壳”嫌疑最终被确认,直接证据是能够识别“清华简”上的战国古文字。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

根据刘知远介绍,除了类似“清华简”识别能力这样的“水印”外,“套壳”一般通过大模型的分词词表、架构设置(如层数、向量维数等)和能力表现等判断。“这次之所以能够比较确认Llama3-V套壳MiniCPM-Llama3-V 2.5,主要还是这层‘壳’薄到近乎透明,能够找到多方面的直接证据。”刘知远表示。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在傅宏宇看来,窃取模型参数、谎报模型来源等不负责任的使用行为,违背了诚信原则和开源精神,开源社区可采取措施予以处理和规范。如果对开源模型的“抄袭”构成知识产权侵权行为,开源模型权利人则可以依据开源许可协议保护自身权益。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

他认为,此次Llama 3-V对MiniCPM的套壳,符合知识产权侵权行为的定义。“虽然项目已经开源,但研发者依然是工作成果的版权权利人,有权对其作品主张权益保护。”傅宏宇指出,斯坦福团队这种将他人开源的工作成果微调并直接转化为自己的工作成果公开发布的行为,可参考《计算机软件保护条例》的相关规定构成传统软件知识产权侵权,具体涉及复制著作权人软件、向公众发行、通过网络传播软件、故意删除或者改变软件权利管理电子信息等侵权行为。gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

围绕大模型套壳的是非之争并不是首次上演。在此之前,多家国内外企业都曾卷入类似纷争。比如,李开复零一万物发布的大模型“Yi”就曾被指控使用了Llama的架构,只对两个张量进行了重命名。gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不过,这些争议到最后似乎都没有迎来一个确定的结果。在几个回合的指控与回应后,没有判决、赔款或者标准来回应各界的关注。gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

站在巨人的肩膀上 

“套壳”争议屡屡出现,可能是由于各界对这一概念存在不同的理解和判断。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

刘知远告诉21世纪经济报道记者,“套壳”的说法,很多时候宽泛地包括了所有已有开源模型利用自有数据进一步训练和微调,从而形成定制模型的行为。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

但与大众对“套壳”的负面看法有些许不同的是,对开源模型的微调动作,实际上是被允许和鼓励的。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“套壳”这种说法本身就带有贬义的意味。刘知远坦陈:“很多开源模型的协议允许定制和修改,只要遵守开源协议就应当支持和保护。” gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“善用前人成果,努力站在巨人肩膀上实现高质量发展,是开源社区的重要价值。”他指出。gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

AI技术日新月异,市场需求也瞬息万变。金沙江创投主管合伙人朱啸虎曾经公开表态,AI应用应该尽可能实现快速商业化,而Llama的发布增大了创业者在逐渐收紧的时间窗口活下来的几率。gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

除了时间,算力、算法、数据无一不是自研大模型需要面对的难关。这种情况下,以开源模型为基础微调的定制模型成为性价比最高的选择。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

此前,现象级AI搜索产品Perplexity所在公司的CEO Aravind Srinivas在一档播客上直白地表示,“一个拥有十万用户的套壳产品显然比拥有自有模型却没有用户更有意义”。gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

就如通往成功的路站在巨人的肩膀上更好走,“质疑套壳、理解套壳、成为套壳”或许是AI应用元年的一种求生思路。 gvV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:斯坦福学生AI团队抄袭国产大模型背后 开源模型能摆脱抄袭阴影吗http://www.llsum.com/show-2-6922-0.html

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 对话丨面壁智能刘知远谈被斯坦福学生AI团队抄袭:善用开源成果,将快速提升AI能力的“下限”

下一篇: 马斯克赢下天价薪酬关键一战 560亿美元可以买下中芯国际

热门资讯

  • 12项首创技术助力高速公路改扩建

    记者3月20日来到广东深汕西高速公路改扩建施工现场,看到智能机器人、自动化生产线等智能制造设备在不停运行。3月19日—20日,由茅以升科技教育

  • 原来,中国空间站里“四季如春”

    春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日

  • 多层人造皮肤18天内长成

    美国和法国的科学家联合团队借助新的3D打印技术,开发出一种多层人造皮肤,只需18天即可长成。这种仿真皮肤可用于提升护肤品测试效率,并催生更好的皮肤

  • 小龙虾能将锂离子转入食物链

    从手机到手表再到电动汽车,锂离子充电电池为众多设备提供动力。但随着消费者丢弃电子产品的增加,越来越多的锂可能会进入环境。研究人员在美国化学会

  • 人工纳米流体突触可实现存内计算

    瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬

  • AI芯片巨头低调赚钱

      AI芯片巨头低调赚钱  骆轶琪  在过去一年半导体行业下行周期中,除了英伟达以GPU霸主身份实现业绩快速成长之外,另一些主营虽非GPU,但是立足于AI定制芯片市场的半导体巨

  • 我国成功发射云海二号02组卫星

      我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面

  • 首批量子测量领域国家标准发布

    随着量子技术的发展,利用量子特性突破传统测量技术极限的新一代精密测量技术——量子测量开始得到应用。记者从中国计量科学研究院获悉,由

  • huaweiMate 70细节曝光!芯片性能比肩5.5nm、新鸿蒙5.0系统

    3月24日消息,今天数码博主“厂长是关同学”曝光了huaweiMate 70系列电话的部分配置信息。该博主表示,huawei全新的Mate 70系列首发会搭载新的芯片,芯片的

  • 中国科学技术大学发现第六大植物激素的首个运输蛋白

    在日常生活中,隧道可以帮助人们翻山越岭。在植物细胞内,当内部物质穿过细胞膜时,往往也会通过类似的“隧道”。记者从中国科学技术大学获悉,该校孙林峰

  • 聚焦AI框架技术创新 加速大模型规模化落地

    “人工智能作为数字新基建重点建设方向,前景广阔,大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动,无疑将为人工智能技术在

  • “地球一小时”背后:绿色低碳生产生活蔚然成风

    3月23日20时30分许,内蒙古自治区鄂尔多斯市,约200米的高楼、磐石造型博物馆、书籍外形图书馆等主要地标建筑纷纷关闭灯光,人们在静下来的城市里感受

推荐资讯

  • 日榜
  • 周榜
  • 月榜