首页>软件教程>历史时刻：DeepSeek GitHub星数超越OpenAI，仅用时两个月

历史时刻：DeepSeek GitHub星数超越OpenAI，仅用时两个月

来源：网络时间：2025-05-19 15:03:36

在人工智能的浩瀚宇宙中，一颗新星正以无法忽视的光芒崛起——DeepSeek-V3，它不仅是代码世界的一场革命，更是人类智慧与未来对话的桥梁。在这场前所未有的科技盛宴里，GitHub见证了历史的书写，一个超越OpenAI的传奇诞生。深邃的数字海洋中，DeepSeek项目犹如一位智慧巨匠，其麾下明星产品DeepSeek-V3，携带着6710亿参数的庞大脑力，却以惊人的效率舞动着每一个数据之魂，仅需激活区区370亿参数，便能编织出超越想象的文本梦境。

这不仅仅是一次技术的跃迁，它是对成本与效能边界的勇敢挑战。在266.4万H800GPU小时的孕育下，DeepSeek-V3以区区557.6万美元的成本，挑战着价值数倍于此的竞争对手，犹如智能界的大卫，以精准的石子对抗着行业巨人。它不仅是一个模型，更是一个宣言，向世界宣告开源精神的力量与创新的无限可能。

在2023年的寒风中，一场由代码编织的春天悄然降临，全球AI爱好者如潮水般汇聚，共同目睹这一划时代的壮举。DeepSeek-V3，这个拥有动态注意力机制的智者，正引领我们穿越语言的迷雾，探索未知的科技大陆，它的故事，正等待着每一个梦想触碰未来的你，共同续写。

　　开源AI世界的里程碑事件！　　我们正在见证历史：DeepSeek项目在全球最大代码托管平台GitHub上的Star量超过了OpenAI。截至本周五下午两点，DeepSeek旗下热度最高的项目DeepSeek-V3大模型Star量已达7.77万，超越了同平台中OpenAI最热门项目。

???????????????DeepSeek项目的星数还在以肉眼可见的速度增长。去年12月26日，DeepSeekAI开源了其最新混合专家（MoE）大语言模型?DeepSeek-V3，它立即成为通用语言模型的性能标杆，受到了全球AI社区热议。DeepSeek-V3模型引入了动态注意力机制（DynamicAttentionMechanism），通过实时调整注意力权重优化文本生成质量。其MoE架构共包含6710亿参数，但每Token仅激活370亿参数，大幅降低了计算成本，训练成本仅为同类闭源模型的1/20。据技术报告介绍，DeepSeek-V3的预训练过程只花费266.4万H800GPUHours，再加上上下文扩展与后训练的训练共为278.8H800GPUHours（训练成本557.6万美元）。相较之下，Llama3的训练预算约为3930万H100GPUHours。

?????????????????图源：随后在1月23日，DeepSeek以V3为基础使用强化学习（ReinforcementLearning）驱动重构训练范式，提出了DeepSeek-R1，彻底改变了开源AI世界。DeepSeekR1性能完全对标OpenAIo1，与DeepSeekV3相比性能有大幅提升，其论文指出纯强化学习可以赋予LLM强推理能力，而无需大量监督微调，震动了AI业界。从技术角度来看，DeepSeek展示了国内科研团队的创新能力，并在ScalingLaws之后揭开了大模型发展的新范式，大幅降低了AI对算力的依赖，并用自我进化的方式平衡了数据优势。R1还支持将推理能力迁移至更小模型，为边缘计算和即时应用开辟了大量的可能性。

由于OpenAI自GPT-3起并未开源其基础AI大模型，目前OpenAI的热门开源项目包括openai-cookbook，即使用OpenAIAPI完成常见任务的示例代码和指南；以及Whisper，这是一个2022年9月开源的通用语音识别模型。除此之外，同属开源大模型的Llama系列最高星数达到了5.75万，阿里云的Qwen2.5有1.49万Star，零一万物的Yi有7800Star。

DeepSeekV3和R1的推出仿佛为全球大模型社区打了一针强心剂，在AI研究领域，围绕R1核心强化学习方法GRPO的进一步研究已经出现。DeepSeek开源的策略也为应用创造了大量机会。目前虽然DeepSeekApp官方报告正在受到高频次网络攻击，但仅在国内就有阿里云、华为云、腾讯云、百度智能云、360数字安全、云轴科技等多个平台宣布上线了DeepSeek大模型，方便各路开发者调用。在海外，英伟达、亚马逊和微软云服务也宣布接入了DeepSeekR1。DeepSeek系列模型被公认为是目前最先进的大语言模型之一，随着技术开源的推动，我们或许将见证生成式AI更快的发展。

以上就是历史时刻：DeepSeekGitHub星数超越OpenAI，仅用时两个月的详细内容，更多请关注其它相关文章！

<上一篇：即梦变脸ai使用教程下一篇：原来，这些顶级大模型都是蒸馏的 >