都说梁文锋变了。
在备受瞩目的DeepSeek V4发布前夕,DeepSeek首轮融资浮出水面——据悉,DeepSeek正以约100亿美元估值寻求新一轮融资。然而一年前,梁文锋明确表示对商业化不感兴趣,拒绝了一批试图洽谈融资的人。
那时正逢DeepSeek初芒乍现。2025年1月,DeepSeek R1发布,彼时英伟达单日狂泻17%,市值蒸发近6000亿美元。这场极其优雅的东方开源革命,以超低成本带来顶尖模型,此后DeepSeek及梁文锋声名鹊起。
只是时过境迁,眼下大模型江湖日卷夜嚣,世界变化紧凑剧烈,DeepSeek却迟迟未拿出外界苦等的续作。
有人开始着急,有人开始怀疑,但持续封神的叙事对任何人都是一种负担。
如无意外,DeepSeek V4本周即将登场。AI圈注定不会平静。
梁文锋保持沉默
“任何事情在你怀疑并想突破它的时候,是最吸引人的阶段”,《三体》中如此写道。
这正如今天人们对DeepSeek的期待。
自2025年初以来,国内智谱、MiniMax、Kimi以及字节、阿里等在Agent和coding强化上已经更新了数版模型,春节“百模大战”一幕更是历历在目,造就覆盖文本、图像、视频多模态的AI最强春节档。
但DeepSeek仿佛不问战事。
至今,多次传闻要上线的DeepSeek V4还是没有来。有人戏言,“DeepSeek已成Next Week。”
不可否认,外界对DeepSeek的好奇、关心从来不减。最近一次DeepSeek关于模型动态的推文官宣,则停留在2025年12月初,彼时其发布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
其实水面之下,并非没有新鲜事:今年1月,DeepSeek团队连续发布了两篇由梁文锋署名的论文,mHC(流形约束超连接)及Engram(条件记忆),瞄准对大模型长序列处理的提升。4月8日凌晨,DeepSeek悄悄上线了分层模式界面,出现快速模式和专家模式两个入口,甚至还埋下了一个视觉模式的新选项。
一切都隐隐被解读为:V4快了。
有爆料称,DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。依然,DeepSeek官方没有澄清,没有回应。这风格,相当“DeepSeek”。
任江湖喧嚣鼎沸,无论是梁文锋还是DeepSeek团队,与外界的互动从来都克制。
这种克制足够深入,一位AI猎头就聊起:有认识的大厂员工跳槽去DeepSeek后就“失联”了,再也没回复过微信。投资界此前和一位DeepSeek研究员交流,聊及公司,一律保持缄默。
人们为什么期待V4
DeepSeek此前坚定不融资。
多年前,中国前首富陈天桥曾与梁文锋对谈四小时,然后梁文锋婉拒了陈天桥的投资。2024年初,联想创投也找到梁文锋想投一笔钱,但同样无果。
再后来,无论大模型江湖融资如何热闹非凡,DeepSeek融资通道始终紧闭。甚至一度有消息称:梁文锋不急于获得投资,担心外部投资者会干预DeepSeek的决策。
专注,低调,不太做没把握的事——梁文锋及DeepSeek给外界留下如此印象。
依稀记得2025年初,DeepSeek R1横空出世,在纯强化学习激发推理能力这条路径上开创了先河,它向世界宣告着:中国能够以极低成本做出世界级的模型。
更优雅的是,还是开源的。
以至于2025年的精彩仿佛就是由“DeepSeek时刻”开启,这年中国大模型江湖迅速崛起和急剧变化,不仅是价格战与开源潮袭来,竞争路线也开始高度集中在AI编程和多模态。
时至今日,开源者DeepSeek依然无可避免寄托着中国人工智能的厚望,诚如今天外界对DeepSeek V4的期冀。
如无意外,本周,DeepSeek将推出新一代大模型DeepSeek V4。此时,距离上一次重大版本更新已经过去15个月。
此前有市场传闻,DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口,更首次实现与华为昇腾等国产芯片的深度适配,标志着中国AI产业在去CUDA化道路上迈出关键一步。
一个细节是,2025年DeepSeek V3发布时,就有开发者发现模型代码里出现了大量PTX(Parallel Thread Execution)指令的踪迹——这是英伟达GPU的汇编语言,比CUDA更底层,当时市场就开始猜测:DeepSeek在修炼脱离CUDA的内功。
隐隐约约,梁文锋依然是那个要做出创新的人。
中国AI叙事沸腾
别催梁文锋
短短一年,中国AI叙事翻天覆地。
应用端的繁荣肉眼可见。国家数据局3月一则数据显示,中国日均Token调用量已突破140万亿,较两年前的1000亿增长超过1400倍。
这带来了全产业链的景气:Kimi、智谱、Minimax等大模型商,还有阿里、字节等各大云厂商,以及芯片层、服务器层、算力调度层的参与者,无一不在积极承接这波需求冲击。
因此,一种声音翻涌得更加厉害:DeepSeek应该趁现在来一波大的。
但天下英雄如过江之鲫,巨大机会敞口意味着更激烈的竞争。就在这个传闻V4将发布的4月,由姚顺宇统筹的混元大模型也将发布HY 3.0,内部称之为:混元系列重大版本迭代。
可以感受到,DeepSeek本身压力也在显现——2026年开年来,DeepSeek上演了至少7次大规模服务中断,例如3月29日晚至当月30日上午,其网页端与APP端同时无法使用,宕机时间持续约12小时。
以及肉眼可见的人才流失。2025年底至2026年初,DeepSeek有郭达雅、魏浩然、王炳宣、阮翀、罗福莉等多名核心研发骨干离开。当这次传出DeepSeek融资,市场也不可避免想到:DeepSeek不融资就没有市场估值锚点,无法给拿了期权的核心员工吃下定心丸。
而对于令人兴奋的适配国产芯片消息,亦是一项成本极高而沉重的重写工程。外界几乎一致认为,DeepSeekV4多次跳票,就与重写底层代码试图适配国产芯片密切相关。
“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”梁文锋曾如此坦言。此时此刻,或许更不该让曾无意成为鲶鱼的DeepSeek,承担商业世界的慕强叙事。
不可否认,DeepSeek曾真真切切给中国AI带来破壁时刻。无论DeepSeek能否再给世人以震撼,它所展现的世界观和方法论,都极大支撑了对通用大模型的理解甚至对顶尖人才的理解。
不妨再给DeepSeek一些耐心。