设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

腾讯混元文生图大模型全面开源

2024-05-29 08:51:07 来源: 科技日报

记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

记者5月25日获悉,腾讯近日宣布旗下混元文生图大模型全面升级,并对外开源。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这是业内首个中文原生的DiT架构文生图开源模型,具备原生中文理解能力和双语编码能力,参数量15亿。此次开源的模型包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用,目前已在专注于自然语言处理的开源机器学习平台Hugging Face及面向软件开发者的代码托管平台Github上发布。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

腾讯混元文生图技术负责人芦清林介绍,升级后的混元文生图大模型采用了与Sora一致的DiT架构,不仅可支持文生图,也可作为文生视频等多模态视觉生成的基础。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

过去,视觉生成扩散模型主要基于U-Net架构。随着模型参数量增加,DiT架构展现出更好的扩展性,有助于提升模型生成质量和效率。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

记者了解到,混元文生图大模型是业界最早探索并将大语言模型结合DiT架构的文生图模型之一。2023年7月,腾讯混元文生图团队明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

评测数据显示,最新腾讯混元文生图模型效果相比前代提升超20%,远超开源的Stable Diffusion模型。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

目前,主流文生图开源生态基本围绕英文建设,Stable Diffusion等主流开源模型虽一定程度支持中文输入,但其核心数据集仍以英文为主。建设中文原生大模型以及相应的开源生态对国内大模型产业有重要意义。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

混元文生图大模型以中文原生为基础,支持中英文双语输入及理解。其文生图能力已被广泛用于素材创作、商品合成、游戏出图等业务场景。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“腾讯混元文生图大模型的研发思路就是实用,坚持从实践中来,到实践中去。此次把最新一代模型完整开源,是希望与行业共享实践经验和研究成果,加速大模型行业发展。”芦清林表示,目前开源的混元文生图大模型版本,也是腾讯内部正在使用的版本。基于该模型,开发者和企业无需从头训练,可直接将其用于推理,并可打造专属的AI绘画应用及服务。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

此外,目前文生图开源社区主要还是以Stable Diffusion等为主的英文开源社区。混元文生图大模型的开源,将丰富以中文为主的文生图开源生态,推动中文文生图技术研发和应用。AeO流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:腾讯混元文生图大模型全面开源http://www.llsum.com/show-2-6308-0.html

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 山西大学团队用图调控网络 实现高性能点云分割

下一篇: 具身智能:步入AI舞台中央?

热门资讯

  • “桃花癫”是种病,得治

    民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精

  • 数字化管理已在故宫广泛应用

    在今天的故宫,工作人员使用的数字化办公平台名叫“内务辅”,这款应用的开发者,是与故宫博物院合作的钉钉(中国)信息技术有限公司(以下简称“钉钉”)。3月1

  • 中经社发布垂直领域数字化应用系统 为行业提供数智化解决方案

    3月18日,中国经济信息社(以下简称中经社)垂直领域数字化应用系统发布仪式在北京举行。在发布仪式上,锚定建设“国家级经济信息旗舰”的目标,中经社推出

  • 负碳复合建材助力减缓全球变暖

    美国太平洋西北国家实验室的科学家设计了一种复合装饰材料,可以储存更多二氧化碳,提供了一种既符合建筑规范,又比标准复合饰面板便宜的“负碳”选择。

  • “95后”的无人机“造像师”

    “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自

  • Kimi概念股风起:月之暗面的资本征途与技术突破

    21世纪经济报道记者雷晨 北京报道随着人工智能技术的飞速发展,Kimi概念股成为资本市场的新宠。3月21日,受Kimi智能助手技术突破的催化,相关概

  • 重要数据识别有了国家标准!专家:对数据跨境流动安全管理意义重大

    南方财经全媒体记者马嘉璐 广州报道如何划分一般数据、重要数据、核心数据终于有了国标版“参考答案”。3月21日,国家标准GB/T 43697-2024

  • 新疆筹建国家级融合算力中心

    记者从近日举办的新疆筹建融合算力中心研讨会上获悉,新疆将构建具备国家级算力水平的涵盖超算、智算的融合算力中心。到2024年底,建成超算算力(FP64)不

  • 黑场显微镜让单个颗粒实现无标记光学显微成像

    3月21日记者从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。科研人员将该滤

  • 光储行业迎来2000V新时代

    3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光

  • 京东与OPPO重磅合作:销售额3年翻倍!

    3月23日消息,京东与OPPO战略合作协议签约仪式举行,双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上,OPPO高级副CEO、首席产

  • 北京市青少年科学教育基地揭牌

    为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科

推荐资讯

  • 日榜
  • 周榜
  • 月榜