设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

英特尔也加入了:针对DeepSeek进行深度优化

2025-02-02 18:35:40 来源: 观察者网

t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

美国科技巨头正积极拥抱DeepSeek。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2月1日,美国芯片巨头英特尔表示,近日中国AI公司DeepSeek发布Janus Pro模型,其超强性能和高精度引起业界关注,英特尔Gaudi 2D AI加速器现已针对该模型进行深度优化,这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

作为一款创新性的AIGC模型,DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一的Transformer架构,突破了传统AIGC模型依赖多路径视觉编码的限制,实现了理解与生成任务的一体化支持。在此基础上,Janus Pro通过优化训练策略和扩展模型规模,显著提升了文生图等功能的性能与稳定性,并提供了10亿参数和70亿参数两个版本,在性能与精度上展现了较强的竞争力。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

图源:github.com t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在Janus Pro统一的Transformer架构下,文生图模型的吞吐量高低已经从依赖加速器的高算力,向充分利用HBM内存高带宽和大容量转换。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

英特尔表示,Gaudi 2D凭借2.45TB/秒的高带宽和96GB HBM大容量内存,为Janus Pro模型提供了强大的计算支持,使其在生图批处理任务中,随着批量大小(Batch Size)的增加,吞吐性能得到显著提升,大幅缩短任务处理时间。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

与此同时,结合英特尔Optimum-Habana框架的优化,英特尔Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率,仅需约10秒即可生成16张高质量的图片。而且,开发者仅需调整数行代码,即可实现这一结果,极大降低了开发门槛和迁移成本。此外,DeepSeek的蒸馏模型在至强和Gaudi平台上也得到了支持。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这家美国芯片巨头还提到,DeepSeek-R1让轻量化模型本地部署更为简单,DeepSeek目前能够在英特尔产品上运行,更可以在AI PC上实现离线使用。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不止英特尔,一开始便对DeepSeek赞赏有加的英伟达,也在昨天(1月31日)宣布推理模型DeepSeek-R1正式登陆NVIDIA NIM微服务。据介绍,在单个NVIDIA HGX H200系统上,完整版DeepSeek-R1 671B的处理速度可达3872 Token/秒。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

与此同时,亚马逊也在Amazon Bedrock和SageMaker AI中,上线了DeepSeek-R1模型。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

曾经冲出来和OpenAI一起高调质疑DeepSeek“偷窃”数据的微软,甚至在前一天就把DeepSeek-R1抢先部署在了自家的云服务Azure上。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

图源:微软社交媒体 t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

英特尔的老对手AMD,也早在一周前就宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型经过SGLang强化,针对Al推理进行了优化。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在人工智能专家吴恩达看来,本周围绕DeepSeek的热议,让许多人清晰地看到了几个一直存在的重要趋势:美国在生成式AI领域的领先地位正在被中国迎头赶上,AI供应链格局将被重塑;开放权重模型正在推动基础模型层商品化,为应用开发者带来新机遇;扩大规模并非通往AI进步的唯一途径,尽管算力备受追捧,但算法创新正在快速降低训练成本。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

他在社交媒体上写道,当ChatGPT在2022年11月发布时,美国在生成式AI领域明显领先于中国。人们的印象转变是缓慢的,因此即使在最近,我仍然听到美国和中国的朋友都认为中国落后。但实际上,过去两年里,这种差距正在迅速缩小。凭借Qwen、Kimi、InternVL和DeepSeek等来自中国的模型,中国显然一直在缩小差距,并且在视频生成等领域,中国似乎已经处于领先地位。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

“我很高兴DeepSeek-R1以开源权重模型发布,并附带技术报告,分享了许多细节。与此形成鲜明对比的是,一些美国公司为了扼杀开源,大肆炒作诸如人类灭绝等假设性的AI危险,推动监管。现在,开源/开源权重模型显然是AI供应链的关键组成部分:许多公司都将使用它们。如果美国继续阻碍开源,中国将主导AI供应链的这一环节,许多企业最终将使用更多反映中国价值观而非美国价值观的模型。”他表示。t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文系观察者网独家稿件,未经授权,不得转载。 t7V流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:英特尔也加入了:针对DeepSeek进行深度优化http://www.llsum.com/show-3-60412-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 华为云支撑,生产级DeepSeek推理服务上线

下一篇: 韩国股市补跌:内存芯片巨头暴跌10%

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜