超越ChatGPT，中国“神秘力量”火爆全球

2025-01-28 08:53:50 来源：新快报综合

观看：135

近日，国产AI DeepSeek在中国、美国的科技圈受到广泛关注，甚至被认为是大模型行业的最大“黑马”，在外网，DeepSeek被不少人称为“神秘的东方力量”。

1月27日，DeepSeek应用登顶苹果中国地区和美国地区应用商店免费App下载排行榜，在美区下载榜上超越了ChatGPT。

苹果美国区应用商店

苹果AppStore中国区免费榜

DeepSeek是啥？

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。

近日，DeepSeek发布推理模型R1，在性能逼近OpenAI o1正式版的同时，推理成本却仅为后者的几十分之一。

纽约时报称，DeepSeek大模型以极低成本（600万美元）和少量芯片（2000块）实现了与OpenAI等巨头相媲美的性能，挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

低成本实现高性能模型研发，对用户来说体验感也立竿见影——它功能强大，但却免费使用，并且DeepSeek还将代码面向开发者进行了开源。

据了解，DeepSeek R1没有使用业内普遍使用的监督微调（SFT）训练范式，而是直接通过强化学习让模型自主进化出复杂的推理能力，包括反思和长链思考等能力。这种方法不仅提高了训练效率，还减少了对昂贵计算资源的依赖。与OpenAI的o1相比，DeepSeek模型的百万token输入成本从15美元锐减到0.55美元，输出成本则从60美元降低到2美元。

有人提出，DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。

1月26日，DeepSeek出现了短时闪崩现象。不少网友反映，使用时遇到 “服务器繁忙” 的提示。对此，DeepSeek回应称，当天下午确实出现了局部服务波动，但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后，用户访问量激增，服务器一时无法满足大量用户的并发需求。

团队不到140人

创始人来自湛江

据悉，DeepSeek创始人梁文锋来自广东省湛江市，本科、研究生毕业于浙江大学，拥有信息与电子工程学系本科和硕士学位。2008年起，他开始带领团队使用机器学习等技术探索全自动量化交易。2023年7月，DeepSeek正式成立，进军通用人工智能领域。

近日，梁文锋还现身《新闻联播》，以DeepSeek创始人的身份参加了一场座谈会，并现场发言。

梁文锋（左一）

在团队配置上，DeepSeek团队最大的特点是名校、年轻。不到140人的团队，工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校，工作时间都不长。

来源：澎湃新闻（记者李潇潇胡含嫣）、北京日报（记者孙奇茹）、长安街知事、中国新闻社

本文链接：超越ChatGPT，中国“神秘力量”火爆全球http://www.llsum.com/show-1-34240-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：巴黎又一古建遭火灾，三十米高钟楼被烧毁

下一篇：两部门：规范通过电子渠道销售电子式储蓄国债

超越ChatGPT，中国“神秘力量”火爆全球

热门资讯

推荐资讯

快讯最热文章