设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

中国电子首席科学家蒋国飞:高质量数据集是AI发展核心驱动力

2025-04-12 08:05:58 来源:

21世纪经济报道记者林典驰 实习生林绮蓓 深圳报道 1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

4月9日至11日,第十三届中国电子信息博览会(简称“电博会”)在深圳会展中心举行。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

中国电子首席科学家蒋国飞在会上发表主题演讲,系统阐述了数据如何驱动人工智能发展,强调在算力与模型能力逐步拉平的竞争格局下,高质量数据集已成为AI发展的核心驱动力,而数据基础设施建设与数据处理技术创新是破解行业应用落地瓶颈的关键路径。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

数据流通基础设施加速数据开放共享1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

蒋国飞谈到,人工智能发展要素可归纳为算力、数据、模型与应用四大维度。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

从长期竞争来看,芯片供给能力与模型开源趋势将逐步消弭技术壁垒,而数据作为具有强知识产权属性的核心要素,正成为AI竞争的主战场。尤其是生成式AI的发展,对大规模高质量数据产生刚性需求。 1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

他以历史经验佐证,2009年美国通过构建大规模图像数据库,为计算机视觉研究提供标准化数据集,推动了从早期深度学习到当前大模型的技术演进。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“在Scaling Law规则下,AI模型参数规模已突破2万亿级,理论上需要同等量级的有效数据支撑,否则庞大参数将无法转化为实际效能。”蒋国飞强调,数据规模与质量直接决定大模型的学习精确度与泛化能力,当前大模型训练已消耗50万亿token,预计2025年将触及人类数据总量边界。 1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

针对行业AI应用面临的数据困境,蒋国飞指出,互联网领域的海量数据积累催生了豆包、元宝、DeepSeek等大模型发展,但进入垂直行业时,数据分散化、碎片化、质量不足等问题成为主要瓶颈。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

因此,大模型非常需要建设数据流通的基础设施,加速数据开放共享,同时归集数据之后才能推动人工智能的发展。最下面一层是数据基础设施,不断汇集原材料,加工高质量数据集,利用这些数据集训练AI模型。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

近两年,国家高度重视数据流通基础设施建设,提出了数场、数联网、数据元件、数据空间、隐私计算和区块链六条技术路线。中国电子作为“数据元件”概念提出者,正在北京、西安等地推进国家数据基础设施试点,致力于构建跨行业数据流动的底层架构。 1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

高质量数据集成为AI应用发展的重点支点

数据技术归集后,更大的挑战在于如何加工高质量数据集。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

谈及高质量数据集的核心特征,蒋国飞定义其为“将分散、碎片、杂乱的数据加工为高价值、高密度、标准化的数据集合”,这一过程涵盖数据归集、清洗、标注、评测等多个环节,且对技术创新提出更高要求。 1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在技术层面,传统数据标注正从劳动密集型向知识密集型转型。以医疗影像标注为例,医疗行业的图片只有医生能标注,非常难适应AI时代对数据的要求。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

AI学习的本质是在高维的空间里学习复杂的曲线,基于足够的样本拟合曲线。针对医生资源稀缺问题,可通过任务分解技术将复杂标注拆分为普通人可完成的子任务,再经算法合成最终结果。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

其次,真实数据的稀缺性导致模型训练很难覆盖到各个场景。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

数据定义存在认知边界,很多时候数据分布不均匀,必然导致大模型在某些区域的认知盲区,机器从来没有见过,那便会出现幻觉等问题,因为它根本不知道这个区域应该是怎样的结果。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

蒋国飞提出,数据合成技术可通过行业知识引导实现“举一反三”,例如在自动驾驶场景中对特定车辆或路况进行多样化模拟,填补数据分布盲区。质量评测环节则需结合行业知识库,通过算法剔除违背专业逻辑的数据,确保生成数据的真实性与场景适配性。 1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

他分享了中国电子在交通物流、建筑供应链、农业等领域的实践案例:通过处理千万级行业数据构建智能问答模型,服务物流场景决策;基于数据集开发供应链匹配系统,提升建筑材料采购效率;利用1TB农业数据训练图像识别模型,实现精准施肥指导。1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

他强调,行业数据处理必须形成“数据流动-处理建设-智能应用”的完整闭环,方能释放数据要素价值。 “基于大模型,行业数据若未经有效归集处理,100万条低质量数据在万亿级大模型训练中犹如‘一滴盐融入大海’,难以产生实质作用。”1yV流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:中国电子首席科学家蒋国飞:高质量数据集是AI发展核心驱动力http://www.llsum.com/show-1-40271-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 广州城市创新指数报告(2024)发布,天河位列第二!

下一篇: 电博会上,我们看到了AI硬件的新变化

热门资讯

推荐资讯

  • 墨绿色连衣短裙配什么鞋?

    墨绿色连衣短裙配什么鞋?墨绿色连衣短裙是一种经典且具有高雅气质的服装,配上合适的鞋子能够提升整体的穿搭效果。以下是一些适合搭配墨绿色连衣短裙的鞋子建议: 高跟鞋:黑色

  • 男士工装裤一般搭配什么衣服?

    男士工装裤一般搭配什么衣服?1.工装裤+T恤 版型简洁的工装裤,没有过多的修饰,颜色淡雅不花哨,简约素雅范,与T恤搭配很协调。简单的T恤搭配工装裤,大气有格调。勾勒出男士的健硕

  • 胸针搭配衣服技巧

    胸针搭配衣服技巧胸针是一种优雅的装饰品,正确搭配可以提升整体造型的高级感。 选择合适的胸针: 选择设计精美、质地优良的胸针,可以是珠宝类、珍珠类或者有别致设计的胸针。

  • 女士老爹鞋穿搭图片:时尚圈的新宠儿,让你成为街头潮流焦点

    一、引言近年来,老爹鞋这一时尚单品在女士穿搭中逐渐成为新宠儿。这种鞋子凭借着其独特的设计和舒适的穿着体验,赢得了越来越多女性的喜爱。本文将为大家分享一些女士老爹鞋

  • 粉色卫衣怎么搭配下身?这三种方法让你时尚又减龄

    粉色卫衣是一种非常受欢迎的时尚单品,无论是男生还是女生,都可以轻松驾驭。但是,如何搭配下身才能既时尚又减龄呢?本文将为你介绍三种搭配方法,让你轻松穿出少女心。一、粉色卫

  • 橘色配哪三种颜色好看?这三种搭配让你时尚感爆棚!

    在时尚界,色彩搭配一直是备受关注的话题。而对于那些追求时尚的人来说,如何将橘色与其他颜色搭配得当,以达到视觉上的完美呈现,成为了一个值得探讨的问题。今天,我就来给大家分

  • 陈皮十种最佳搭配吃法

    一、引言陈皮是一种常见的中药材,具有很高的药用价值和食用价值。不仅能够调理肠胃、促进消化,还具有清热解毒、润肺止咳等功效。如今,陈皮已经成为了人们日常生活中不可或

  • 短款黑色羽绒服搭配下身:探索时尚新境界

    一、引言寒冬腊月,羽绒服成为了我们日常生活中的保暖必备品。在众多款式和颜色的羽绒服中,短款黑色羽绒服无疑是最受欢迎的一款。那么,如何搭配下身才能更好地展现时尚品味呢

  • 工装裤搭配什么上衣女?一款时尚又实用的穿搭指南

    随着时尚潮流的不断变迁,人们对于穿搭的追求也越来越多元化。其中,工装裤作为一种休闲时尚的服饰,越来越受到女性的喜爱。那么,如何搭配工装裤才能既时尚又实用呢?本文将为您提

  • 揭开谜底!测试自己适合的穿衣风格,让你焕然一新

    穿着是一个人的门面,一个适合自己的穿衣风格能让人在生活中更加自信。但是,很多人在面对琳琅满目的服装时,会开始迷茫,不知道自己到底适合哪种风格。别担心,今天我将带你一起测

  • 灰色大衣搭配图片:时尚与经典的碰撞,让你成为街头焦点

    一、引言随着时尚潮流的不断演变,人们对于穿搭的追求也越来越高。在众多服饰中,灰色大衣始终以其简约、优雅的特点备受青睐。那么如何将灰色大衣穿出独特的时尚感呢?本文将为

  • 男人专用头像图片 成熟稳重:打造魅力形象的秘诀

    随着社交媒体的日益普及,人们在网上展示自己的形象变得愈发重要。对于成熟稳重的男性来说,选择一款合适的头像图片不仅能够体现个人气质,还能够给人留下深刻的印象。本文将为

  • 日榜
  • 周榜
  • 月榜