设置

日夜间

随系统

浅色

深色
主题色

黑色

首页 > 科技

赶超GPT-4！APUS大模型3.0伶荔问世

2024-02-07 23:15:33 来源：千龙网

观看：188

近日，APUS与深圳大学大数据系统计算技术国家工程实验室（以下简称“大数据国家工程实验室”）联合训练伶荔Linly-70B中文大模型，并在GitHub上正式首发开源，这是APUS大模型3.0的首个开源大模型。

据了解，APUS大模型3.0伶荔在中文基准测评榜单C-Eval上评分80.6分，中文能力超越GPT-4，在所有参评模型中排名第三，相比原始开源模型标杆LLaMa2-70B取得了大幅提升。

值得注意的是，大数据国家工程实验室由深圳大学牵头，与国家信息中心、清华大学和腾讯科技等联合建设；更有中国科学院陈国良院士、国家重点研发项目首席科学家李坚强等一批拔尖人才组成研发组，实验室副主任沈琳琳教授领导的伶荔项目团队支撑了此次模型的联合训练和开源发布。

此次APUS与大数据国家工程实验室联合训练开源的APUS大模型3.0伶荔中文大模型，进一步推动了AI技术创新与国内场景应用深化融合。“伶荔是国内仅有的几家700亿参数规模的中文开源大模型之一，相信能让更多国人开发者参与到人工智能产业大潮中。”伶荔项目团队李煜东博士如此表示。

可以看到，APUS大模型3.0伶荔中文大模型在词表大小、训练语料等方面进行了定制化调优，基于模块化增量预训练框架开发，针对中文场景扩充词表，增加汉字和中文符号支持，实现综合性能达到同量级开源模型的领先水平。在语料训练上，APUS大模型3.0伶荔采用高质量中英文公开数据源包括悟道、万卷、MNBVC等，并结合自研数据选择策略，构成模型高效训练的混合语料库。基于APUS郑州智算中心的算力支持，APUS大模型3.0伶荔耗时3个月完成训练，当前上下文长度设定为4K（约8000-10000汉字）。

此外，伶荔项目团队还提出课程学习策略，基于动态数据采样，在训练中调整数据的分布，实现将模型的英文语言能力平稳迁移学习到中文能力领域，为训练出高性能中文大模型提供有力保障。

随着APUS大模型3.0伶荔的联合发布、开源，国产开源大模型向构建中文场景大型语言模型又迈出了重要一步。此次合作也是双方深化践行“为中国定制人工智能大模型，积极构建人工智能生态，让大模型应用和价值创造接轨”战略的重要举措。

据悉，APUS还将与大数据国家工程实验室持续推动模型的能力提升和应用拓展，积极探索深化大模型在工具使用、剧情生成和角色扮演、医疗等领域的专业能力，聚力构建大模型生态，让为中国打造的AI大模型真正驱动中国AI产业高质量发展，实现价值共创，赋能千行万业。

近日，APUS与深圳大学大数据系统计算技术国家工程实验室（以下简称“大数据国家工程实验室”）联合训练伶荔Linly-70B中文大模型，并在GitHub上正式首发开源，这是APUS大模型3.0的首个开源大模型。

据了解，APUS大模型3.0伶荔在中文基准测评榜单C-Eval上评分80.6分，中文能力超越GPT-4，在所有参评模型中排名第三，相比原始开源模型标杆LLaMa2-70B取得了大幅提升。

值得注意的是，大数据国家工程实验室由深圳大学牵头，与国家信息中心、清华大学和腾讯科技等联合建设；更有中国科学院陈国良院士、国家重点研发项目首席科学家李坚强等一批拔尖人才组成研发组，实验室副主任沈琳琳教授领导的伶荔项目团队支撑了此次模型的联合训练和开源发布。

此次APUS与大数据国家工程实验室联合训练开源的APUS大模型3.0伶荔中文大模型，进一步推动了AI技术创新与国内场景应用深化融合。“伶荔是国内仅有的几家700亿参数规模的中文开源大模型之一，相信能让更多国人开发者参与到人工智能产业大潮中。”伶荔项目团队李煜东博士如此表示。

可以看到，APUS大模型3.0伶荔中文大模型在词表大小、训练语料等方面进行了定制化调优，基于模块化增量预训练框架开发，针对中文场景扩充词表，增加汉字和中文符号支持，实现综合性能达到同量级开源模型的领先水平。在语料训练上，APUS大模型3.0伶荔采用高质量中英文公开数据源包括悟道、万卷、MNBVC等，并结合自研数据选择策略，构成模型高效训练的混合语料库。基于APUS郑州智算中心的算力支持，APUS大模型3.0伶荔耗时3个月完成训练，当前上下文长度设定为4K（约8000-10000汉字）。

此外，伶荔项目团队还提出课程学习策略，基于动态数据采样，在训练中调整数据的分布，实现将模型的英文语言能力平稳迁移学习到中文能力领域，为训练出高性能中文大模型提供有力保障。

随着APUS大模型3.0伶荔的联合发布、开源，国产开源大模型向构建中文场景大型语言模型又迈出了重要一步。此次合作也是双方深化践行“为中国定制人工智能大模型，积极构建人工智能生态，让大模型应用和价值创造接轨”战略的重要举措。

据悉，APUS还将与大数据国家工程实验室持续推动模型的能力提升和应用拓展，积极探索深化大模型在工具使用、剧情生成和角色扮演、医疗等领域的专业能力，聚力构建大模型生态，让为中国打造的AI大模型真正驱动中国AI产业高质量发展，实现价值共创，赋能千行万业。

本文链接：赶超GPT-4！APUS大模型3.0伶荔问世http://www.llsum.com/show-2-2779-0.html

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：上交所专项工作组调研进行时：已走访 30 余家科创板上市公司

下一篇：国产工业软件为装备数字化提供核心支撑

热门资讯

洞悉竹类植物有了称手“利器”
竹类植物是竹亚科植物的总称，与水稻、小麦、大麦和燕麦同属于禾本科BOP分支，具有重要的经济、生态和文化价值。为更好地服务竹类植物的系统进化和功
全国爱肝日丨专家提醒注意“小心肝”
3月18日是第24个“全国爱肝日”。今年活动的主题是，“早防早筛，远离肝硬化”。重庆多所医院开展义诊咨询活动，通过普及肝病的防治知识，让民众主动筛查
我科学家发现的两种新矿物获国际认定
记者19日从西北大学获悉，该校地质学系、大陆动力学国家重点实验室刘鹏副教授与中国地质大学（北京）李国武教授团队申请的两种新矿物，近日经国际矿物学学
培生2023年财报业绩超出预期，持续加码数字产品
21世纪经济报道记者王峰北京报道近日，全球教育集团培生（NYSE：PSO）公布2023财年财报。2023财年，培生的销售额为36.74亿英镑（下同），同比下降4%，但基
联想与英伟达推出全新混合AI解决方案
在近日举行的全球AI盛会GTC（GPU Technology Conference）2024上，联想集团与NVIDIA（英伟达）宣布合作推出全新混合人工智能解决方案，帮助企业和云提供商获得
联合国机构报告称2022年全球产生6200万吨电子垃圾
联合国机构3月20日发布的《全球电子垃圾监测》报告显示，2022年全球范围内共产生6200万吨电子垃圾，其中仅有不到四分之一被回收利用。报告显示，2022年
“认知选择”或影响人类语言演化
人类的语言自产生以来，就不断演化发展。发音、词汇、语法的演变过程，是语言学家较为关注的领域。语言演化的根本动力是什么，演化又呈现出怎样的规律？我
“婴儿香”原来是真的香
所谓香喷喷的婴儿，到底是源于人们的爱意，还是说确有其香？《通讯·化学》21日一项小型研究首次分析了婴儿和青少年体味化学组成的差异。研究显示
iPhone迈入AI时代！曝国行版苹果 16 AI效果由百度提供
3月23日消息，据媒体报道，iPhone与百度公司已达成合作协议，百度将为苹果内置的生成式人工智能大模型提供技术支持。报道指出，iPhone生成式人工智能大模型的
中国科学技术大学发现第六大植物激素的首个运输蛋白
在日常生活中，隧道可以帮助人们翻山越岭。在植物细胞内，当内部物质穿过细胞膜时，往往也会通过类似的“隧道”。记者从中国科学技术大学获悉，该校孙林峰
25日再次“露脸”，水星为啥这么难看见？
3月25日6时左右将迎来水星东大距。这是水星今年第二次大距、首次东大距，也是公众尝试观测水星的好机会。届时，水星位于太阳东边，与太阳张角约为18.7度
甘蓝育种大突破：“一步法”快速创制不育系
3月24日，记者从中国农业科学院获悉，该院蔬菜花卉研究所甘蓝类蔬菜遗传育种创新团队，开发了快速创制细胞质雄性不育系的新方法——“一步法

推荐资讯

百亿私募灵均投资深夜道歉：将改进交易模型，严格把控交易进度
　　中新经纬2月21日电百亿私募灵均投资21日凌晨发布公告回应2月19日开盘大量卖出沪深股票，同时道歉。　　来源：灵均投资官网　　灵均投资表示，2024年2月20日，沪深交易所发布公
小米总裁卢伟冰：2024年是“人车家全生态”全面展开之年_小米总裁卢伟冰身价
通信世界网消息（CWW）2月22日，小米14 Ultra暨“人车家全生态”新品发布会在京召开，小米集团合伙人、总裁卢伟冰表示，2024年将是小米“人车家全生态”全面展开之年，在“人车家全生态
Differential Diffusion官网体验入口 AI图像生成编辑平台免费在线使用地址
Differential Diffusion是一个图像生成和编辑的平台，可以根据文本提示以及指定每个区域变化量的地图来修改图片。它能够为每个像素或图像区域提供定制化的变化量控制。这种细
IPO财务数据倒查情况如何？证监会答21记者问
21世纪经济报道记者崔文静北京报道2月23日，证监会召开龙年春节后首场新闻发布会，证监会首席风险官、发行司司长严伯进就IPO财务倒查相关
CBN Special丨Holiday consumption booms as Year of Loong “jumps over dragon gate”
您的浏览器不支持音频播放。 For the Chinese people, the eternal theme of the Spring Festival, or C
报告：节后首周38城平均招聘月薪10361元
　　中新经纬2月23日电智联招聘发布《2024年春招市场行业周报(第一期)》显示，节后首周平均招聘月薪10361元，比去年同期上涨3%。　　节后首周平均招聘月薪10361元　　数据显示
欧洲央行2004年来首亏！加息推高净利息支出
　　中新经纬2月23日电据英国《金融时报》23日报道，欧洲央行录得2004年以来首次亏损。　　该报道指出，欧洲央行宣布了近二十年来的首次年度亏损，促使政策制定者首次结转年度赤
最高检：2023年前11月起诉网络制售伪劣商品犯罪上升85.7%
　　中新经纬2月23日电 23日，最高人民检察院党组成员、副检察长葛晓燕在通报2023年检察机关“依法惩治网络犯罪助力网络空间综合治理”工作情况时表示，2023年1至11月，起诉网络
朗博科技信披不及时被警示
　　中新经纬2月23日电 23日，江苏证监局发布关于对常州朗博密封科技股份有限公司(下称“朗博科技”)、戚建国、范小凤、张国忠采取出具警示函措施的决定。　　来源：江苏证监局
过去十年A股8连阳后如何演绎？曾开启了一轮大牛市！
本周是龙年A股交易第一周，延续了年前强势表现，随着周五市场探底回升，沪指重新站上了3000点整数关口。加上过年前的3根阳线，截止到本周五，沪指收
开年券商调研忙！一周调研上百股，Sora概念最关注，多股评级上调
龙年首周，A股市场行情火爆，各板块股票持续反弹。券商分析师也快速进入繁忙的日常工作状态，频繁地调研、出差、路演。券商中国记者注意到，春节

日榜
周榜
月榜