再等等梁文锋,再等等歌词

都说梁文锋变了。

在备受瞩目的DeepSeek V4发布前夕，DeepSeek首轮融资浮出水面——据悉，DeepSeek正以约100亿美元估值寻求新一轮融资。然而一年前，梁文锋明确表示对商业化不感兴趣，拒绝了一批试图洽谈融资的人。

那时正逢DeepSeek初芒乍现。2025年1月，DeepSeek R1发布，彼时英伟达单日狂泻17%，市值蒸发近6000亿美元。这场极其优雅的东方开源革命，以超低成本带来顶尖模型，此后DeepSeek及梁文锋声名鹊起。

只是时过境迁，眼下大模型江湖日卷夜嚣，世界变化紧凑剧烈，DeepSeek却迟迟未拿出外界苦等的续作。

有人开始着急，有人开始怀疑，但持续封神的叙事对任何人都是一种负担。

如无意外，DeepSeek V4本周即将登场。AI圈注定不会平静。

梁文锋保持沉默

“任何事情在你怀疑并想突破它的时候，是最吸引人的阶段”，《三体》中如此写道。

这正如今天人们对DeepSeek的期待。

自2025年初以来，国内智谱、MiniMax、Kimi以及字节、阿里等在Agent和coding强化上已经更新了数版模型，春节“百模大战”一幕更是历历在目，造就覆盖文本、图像、视频多模态的AI最强春节档。

但DeepSeek仿佛不问战事。

至今，多次传闻要上线的DeepSeek V4还是没有来。有人戏言，“DeepSeek已成Next Week。”

不可否认，外界对DeepSeek的好奇、关心从来不减。最近一次DeepSeek关于模型动态的推文官宣，则停留在2025年12月初，彼时其发布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

其实水面之下，并非没有新鲜事：今年1月，DeepSeek团队连续发布了两篇由梁文锋署名的论文，mHC（流形约束超连接）及Engram（条件记忆），瞄准对大模型长序列处理的提升。4月8日凌晨，DeepSeek悄悄上线了分层模式界面，出现快速模式和专家模式两个入口，甚至还埋下了一个视觉模式的新选项。

一切都隐隐被解读为：V4快了。

有爆料称，DeepSeek创始人梁文锋近日在内部沟通中透露，DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。依然，DeepSeek官方没有澄清，没有回应。这风格，相当“DeepSeek”。

任江湖喧嚣鼎沸，无论是梁文锋还是DeepSeek团队，与外界的互动从来都克制。

这种克制足够深入，一位AI猎头就聊起：有认识的大厂员工跳槽去DeepSeek后就“失联”了，再也没回复过微信。投资界此前和一位DeepSeek研究员交流，聊及公司，一律保持缄默。

人们为什么期待V4

DeepSeek此前坚定不融资。

多年前，中国前首富陈天桥曾与梁文锋对谈四小时，然后梁文锋婉拒了陈天桥的投资。2024年初，联想创投也找到梁文锋想投一笔钱，但同样无果。

再后来，无论大模型江湖融资如何热闹非凡，DeepSeek融资通道始终紧闭。甚至一度有消息称：梁文锋不急于获得投资，担心外部投资者会干预DeepSeek的决策。

专注，低调，不太做没把握的事——梁文锋及DeepSeek给外界留下如此印象。

依稀记得2025年初，DeepSeek R1横空出世，在纯强化学习激发推理能力这条路径上开创了先河，它向世界宣告着：中国能够以极低成本做出世界级的模型。

更优雅的是，还是开源的。

以至于2025年的精彩仿佛就是由“DeepSeek时刻”开启，这年中国大模型江湖迅速崛起和急剧变化，不仅是价格战与开源潮袭来，竞争路线也开始高度集中在AI编程和多模态。

时至今日，开源者DeepSeek依然无可避免寄托着中国人工智能的厚望，诚如今天外界对DeepSeek V4的期冀。

如无意外，本周，DeepSeek将推出新一代大模型DeepSeek V4。此时，距离上一次重大版本更新已经过去15个月。

此前有市场传闻，DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口，更首次实现与华为昇腾等国产芯片的深度适配，标志着中国AI产业在去CUDA化道路上迈出关键一步。

一个细节是，2025年DeepSeek V3发布时，就有开发者发现模型代码里出现了大量PTX（Parallel Thread Execution）指令的踪迹——这是英伟达GPU的汇编语言，比CUDA更底层，当时市场就开始猜测：DeepSeek在修炼脱离CUDA的内功。

隐隐约约，梁文锋依然是那个要做出创新的人。

中国AI叙事沸腾

别催梁文锋

短短一年，中国AI叙事翻天覆地。

应用端的繁荣肉眼可见。国家数据局3月一则数据显示，中国日均Token调用量已突破140万亿，较两年前的1000亿增长超过1400倍。

这带来了全产业链的景气：Kimi、智谱、Minimax等大模型商，还有阿里、字节等各大云厂商，以及芯片层、服务器层、算力调度层的参与者，无一不在积极承接这波需求冲击。

因此，一种声音翻涌得更加厉害：DeepSeek应该趁现在来一波大的。

但天下英雄如过江之鲫，巨大机会敞口意味着更激烈的竞争。就在这个传闻V4将发布的4月，由姚顺宇统筹的混元大模型也将发布HY 3.0，内部称之为：混元系列重大版本迭代。

可以感受到，DeepSeek本身压力也在显现——2026年开年来，DeepSeek上演了至少7次大规模服务中断，例如3月29日晚至当月30日上午，其网页端与APP端同时无法使用，宕机时间持续约12小时。

以及肉眼可见的人才流失。2025年底至2026年初，DeepSeek有郭达雅、魏浩然、王炳宣、阮翀、罗福莉等多名核心研发骨干离开。当这次传出DeepSeek融资，市场也不可避免想到：DeepSeek不融资就没有市场估值锚点，无法给拿了期权的核心员工吃下定心丸。

而对于令人兴奋的适配国产芯片消息，亦是一项成本极高而沉重的重写工程。外界几乎一致认为，DeepSeekV4多次跳票，就与重写底层代码试图适配国产芯片密切相关。

“我们不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼。”梁文锋曾如此坦言。此时此刻，或许更不该让曾无意成为鲶鱼的DeepSeek，承担商业世界的慕强叙事。

不可否认，DeepSeek曾真真切切给中国AI带来破壁时刻。无论DeepSeek能否再给世人以震撼，它所展现的世界观和方法论，都极大支撑了对通用大模型的理解甚至对顶尖人才的理解。

不妨再给DeepSeek一些耐心。