95后AI界新星引发科技圈轰动！ (95后的世界)

eeekj • 2024年12月30日 22:23 • 自学教程 • 阅读 5

最近，一款名为DeepSeek，V3的大语言模型引起了AI界的广泛关注，这款模型的研发背后，有一个引人注目的名字——95后AI天才少女罗福莉，她曾参与DeepSeek，V2的研...

最近，一款名为DeepSeek-V3的大语言模型引起了AI界的广泛关注。这款模型的研发背后，有一个引人注目的名字——95后AI天才少女罗福莉。她曾参与DeepSeek-V2的研发，并在DeepSeek-V3的发布前夕，被小米创始人雷军以千万年薪招至麾下，未来将在小米AI实验室领导大模型团队。

DeepSeek-V3的技术报告显示，其参数量高达671B，激活参数为37B，使用的预训练token量为14.8万亿。在多项评测中，DeepSeek-V3超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等其他开源模型，并且在性能上与世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet相媲美。

更令人瞩目的是，DeepSeek-V3的训练预算非常低。前OpenAI联创、知名AI科学家Andrej Karpathy在其个人社交平台上提到，DeepSeek-V3整个训练过程仅用了不到280万GPU小时，而相比之下，Meta旗下顶尖的开源模型Llama-3405B的训练时长是3080万GPU小时。

如果DeepSeek-V3的优良表现能够得到广泛验证，那么这将是资源有限情况下对研究和工程的一次出色展示。从成本角度来看，假设H800的租金为每GPU小时2美元，DeepSeek-V3的总训练成本仅为600万美元不到，是Llama-3405B超6000万美元训练成本的十分之一不到。

极高的性价比让DeepSeek-V3一经发布便引发国内外广泛关注。Meta的AI研究科学家田渊栋称赞道，在非常有限的预算下实现强劲表现，这是一项了不起的工作。知名AI数据公司ScaleAI创始人兼CEO Alexandr Wang也表示，DeepSeek-V3训练所需计算量减少了10倍，展现了其在更低的成本、更快的速度和更强的实力上的竞争力。

DeepSeek由国内知名量化资管巨头幻方量化于2023年创立，被美国硅谷誉为来自东方的神秘力量。DeepSeek专注于开发先进的大语言模型和相关技术，其发布的DeepSeek-V2就因其性能达到GPT-4级别，开源、可免费商用、且API价格仅为GPT-4-Turbo的百分之一而引发业内关注。

DeepSeek-V2之所以能做到如此高的性价比，官方解释称，采用了创新的架构，例如注意力机制方面的MLA（多头潜在注意力）和前馈网络方面的DeepSeekMoE架构等，以实现具有更高经济性的训练效果和更高效的推理。正因为在训练效率和成本方面的优势，DeepSeek也是国内最早开启大模型降价的厂商，也是大模型价格战的源头和推动者。在其发布DeepSeek-V2之后，字节、阿里、百度等厂商纷纷跟进降价。

同时，DeepSeek也是中国互联网大厂以外，唯一一家储备了万张A100芯片的公司，这为其早期的技术研发提供了坚实的算力基础。DeepSeek创始人梁文锋表示，他们并非有意成为一条鲶鱼，只是不小心成了一条鲶鱼。这位毕业于浙江大学电子工程系的80后，一直潜心研究技术，在工作中始终保持着低调的作风。

一名人工智能行业资深业内人士分析称，DeepSeek以200人左右的小团队，且不依靠外部融资，做出了一个有性价比并被全球主流AI界人士所认可的大模型。一是他们在早期就买了很多算力卡，投入了很多资源做研究；二是他们是做量化的，不像大厂有其他各种各样的盈利需求，也跟他们不构成竞争关系，能更专注于模型开发。

DeepSeek-V3的发布不仅是技术上的一次突破，也是AI领域开源模型与闭源模型竞争格局的一次重要变化。它的出现，不仅为AI研究和应用提供了新的可能，也为资源有限的团队展示了如何在竞争激烈的AI领域中脱颖而出。

本文来自作者[eeekj]投稿，不代表白鹜号立场，如若转载，请注明出处：https://vip.eeekj.cn/zixue/202412-82981.html

训练研究梁文锋技术阿里雷军千 DeepSeek 模型成本罗福莉雷军小米少女

5 4

本文作者

eeekj签约作者

6080 文章

1209771 评论

1 粉丝

我是白鹜号的签约作者[eeekj],本篇文章《95后AI界新星引发科技圈轰动！ (95后的世界)》主要讲述了:最近，一款名为DeepSeek，V3的大语言模型引起了AI界的广泛关注，这款模型的研发背后，有一个引人注目的名字——95后AI天才少女罗福莉，她曾参与DeepSeek，V2的研...

E科技

快手看谁点赞要钱吗-qq免费领取vip一年链接,刷空间访客量app

前言在这个信息爆炸的时代，社交媒体平台如快手、QQ空间等成为了我们日常生活中不可或缺的一部分，它们不仅让我们能够分享生活点滴，还能通过点赞、评论等方式与他人互动，随着这些平台的商业化，一些功能开始需要付费才能使用，比如快手的点赞功能，一些用户为了增加自己的社交影响力，开始寻找各种方法来提升自己的空间

乾刘新
2024年12月04日
16
E科技

抖音如何上热门和提高播放量-快手业务网,抖音双击能赚钱吗

抖音上热门攻略想要在抖音上热门，提高播放量，你需要掌握一些技巧和策略，以下是一些实用的步骤和方法，帮助你的内容脱颖而出。内容创作原创性：确保你的内容是原创的，抄袭或模仿他人的内容很难获得推荐。质量：视频和图片的质量要高，清晰度和分辨率是吸引用户的重要因素。热点：紧跟社会热点和流行趋势，利用热门话题或

迎曼
2024年12月04日
16
E科技

卡盟vip业务-qq空间点赞购买网站dns商城,qq卡盟自助

卡盟VIP业务介绍在互联网的海洋中，卡盟VIP业务已经成为了一种流行趋势，卡盟，即卡片联盟，是一种提供各种虚拟商品和服务的平台。QQ空间点赞购买服务是卡盟中非常受欢迎的一项业务，用户可以通过购买点赞服务来增加自己QQ空间的人气，提升社交影响力。卡盟平台通常会提供自助服务，用户可以根据自己的需求选择合

恨蓉
2024年12月04日
19
E科技

每天收入10到30元的游戏 - 快手买100个赞,小哥代刷网

前言在数字时代，游戏不仅仅是娱乐，更是许多人赚取额外收入的途径之一，我们将探讨那些每天可以带来10到30元收入的游戏，以及如何通过快手买赞和代刷网来提升游戏体验和收益，我们将以小红书分享类文章的结构，为你提供一篇原创攻略文章，帮助你在游戏中获得更多收益。游戏选择与收益分析选择游戏：在选择可以带来收益

灵旋
2024年12月09日
16
E科技

0元免费领取qq赞 - bilbil刷关注_汤圆创作下载 0元免费领取qq10000赞网站

前言在这个数字化的时代，社交媒体的影响力不言而喻，QQ作为中国最大的社交平台之一，拥有庞大的用户群体，许多人都希望能够在QQ上获得更多的关注和赞，以提升自己的社交影响力，本文将为你详细介绍如何通过合法途径，0元免费领取QQ赞，以及如何通过BilBil刷关注，以及汤圆创作下载的相关信息。0元免费领取Q

幻儿
2024年12月10日
16
E科技

今日头条账号购买商城 - 免费听歌软件全免费,抖音投放100元500左右的点赞

今日头条账号购买商城在数字营销的今天，拥有一个高质量的今日头条账号对于品牌推广和内容营销至关重要，今日头条账号购买商城提供了一个平台，让用户能够购买到具有一定粉丝基础和影响力的账号，从而快速提升品牌曝光度和用户互动。购买账号时，用户需要考虑账号的粉丝数量、活跃度、内容质量等多个因素，一个高质量的账号

蓝子悉
2024年12月10日
17
E科技

qq手业务秒刷网自助下单平台 - 什么软件刷快手浏览量形容人气量大

在当今这个信息爆炸的时代，短视频平台如快手成为了人们日常生活中不可或缺的一部分，对于很多创作者来说，如何快速提升视频的浏览量和人气成为了一个重要的课题，我们将深入探讨如何利用各种工具和平台来实现这一目标，并分享一些实用的技巧和方法。什么是秒刷网自助下单平台秒刷网自助下单平台是一种在线服务，它允许用户

南双
2024年12月13日
13
E科技

拼多多内部组织架构 - dy业务低价自助平台超低价微博小号自助批发平台_小苹果虾皮刷关注软件

拼多多内部组织架构揭秘拼多多，作为中国领先的电商平台之一，其内部组织架构一直是业界关注的焦点，拼多多的组织架构以灵活、高效著称，能够快速响应市场变化，拼多多的组织架构主要由以下几个部分组成：核心管理层：负责公司的战略规划和决策，包括CEO、CFO等高层管理人员。业务部门：包括商品运营、市场营销、技术

尧照南
2024年12月13日
18
E科技

54代刷 - 酷吧平台刷抖音不费流量的手机卡

在这个信息爆炸的时代，抖音已经成为了我们生活中不可或缺的一部分，无论是在通勤路上，还是闲暇时光，我们都习惯于打开抖音，刷一刷那些有趣的短视频，流量的消耗问题也随之而来，就让我们一起来探讨一下，如何在不消耗流量的情况下，享受抖音的乐趣。54代刷-酷吧平台介绍54代刷-酷吧平台是一个专门为用户解

郁鑫丹
2024年12月15日
11
网络资讯

qq空间说说浏览次数怎么算 - 抖音刷赞网站推广永久快手如何买粉丝步骤

前言在数字时代，社交媒体的影响力不容小觑，无论是QQ空间、抖音还是快手，这些平台都成为了人们展示自我、分享生活的重要场所，而在这个过程中，浏览次数、点赞数和粉丝数成为了衡量影响力的重要指标，本文将深入探讨如何在这些平台上增加浏览次数和粉丝数，以及如何通过合法途径提升个人影响力。QQ空间说说浏览次数计

弭东成
2024年12月27日
5

发表回复

本站作者后才能评论

评论列表（4条）

eeekj 2024年12月30日

我是白鹜号的签约作者“eeekj”！

回复
eeekj 2024年12月30日

希望本篇文章《95后AI界新星引发科技圈轰动！ (95后的世界)》能对你有所帮助！

回复
eeekj 2024年12月30日

本站[白鹜号]内容主要涵盖：国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

回复
eeekj 2024年12月30日

本文概览：最近，一款名为DeepSeek，V3的大语言模型引起了AI界的广泛关注，这款模型的研发背后，有一个引人注目的名字——95后AI天才少女罗福莉，她曾参与DeepSeek，V2的研...

回复

95后AI界新星引发科技圈轰动！ (95后的世界)

本文作者

文章推荐

发表回复

评论列表（4条）

联系我们