打通模型落地的“最后一公里”
撰文/ 陈邓新
编辑/ 李 季
排版/ Annalee
“模型是引擎,Harness是把引擎变成整车的工程,发动机决定上限,Harness决定能不能跑、跑多远、跑多稳。”
在2026年4月28日的腾讯云城市峰会重庆站上,腾讯集团副总裁、政企业务总裁李强对AI重塑产业场景进行了如此诠释。
基于此,腾讯云升级全栈企业级Agent产品能力,首发ClawPro专有云版、Agent Memory、Agent Storage等多款产品,依托大模型+Harness全链路的“整车交付”能力,推动千行百业重塑企业生产力。
这意味着,从“会回答”走向“会干活”,产数融合又进了一步。
不过,当Agent不断深入,新问题也浮出水面:Harness怎么从幕后走到了前台?腾讯云的Harness到底长什么样?重庆为何是AI落地的最佳样本?
模型军备竞赛正在失去意义
AI普惠,已初见成效。
中国互联网络信息中心的最新报告显示,截至2025年12月,中国生成式AI用户规模已达6.02亿人,每10个网民中约5个在日常使用生成式AI。
关于此,从Token调用量就可见一斑。
国家数据局的数据显示,中国日均Token调用量从2024年初的1000亿跃升至今年3月的140万亿,两年增长超千倍。
与之对应的是,Token价格一跌再跌,整体缩水了99%,昔日大企业才可以享受的AI赋能,已下沉到千千万万的中小企业。
尽管如此,真正把场景Token跑通的企业并不多。
麦肯锡的最新数据显示,90%的被调研企业已经启动数字化和AI转型,但仅有25%取得切实成果,仅10%实现AI规模化应用。
究其原因,则是过去数年侧重模型能力,而非注重落地方法。
复盘来看,行业热衷于比拼模型参数,从百亿、千亿、万亿、十万亿不断变大,每次参数跃迁都被视为智能涌现,再叠加打榜盛极一时,大模型的排名越高仿佛自我叙事就越成功。
模型军备竞赛虽然如火如荼,但重塑产业生产力总是差了一步。
事实上,当下主流大模型的能力大差不差,谁能率先将工具调用、分层上下文工程、长记忆管理、工作流设计等在内的系统工程手段用好,谁就可以在产业赋能上获得更大的势能,从而跑得更快、跑得更远。
通俗易懂地说,AI的竞争焦点出现了转向,从“谁的模型参数更大”走向“谁能帮企业把模型跑起来”。
此背景下,Harness成为竞争的新焦点。
Harness直译为马具,涉及缰绳、马鞍、挽具等骑马的配套物品,如若没有缰绳,骑手难以驾驭,没有马鞍则难以坐稳,没有挽具则难以运输……
落脚到AI,模型之外的一切,包括代码、配置、执行逻辑、反馈循环、约束机制,都属于Harness的范畴。
不难看出,Harness是驯服大模型澎湃动力的诀窍,也是差异化竞争力的关键所在,通过优化工程化能力,就可以达到化腐朽为神奇的效果。
Anthropic的一组实验数据显示,同一个模型、同一句提示词,用简单方式跑20分钟花9美元,核心功能完全无效;而用完整的Harness跑6小时,花200美元,交付了一个真正可用的游戏,核心交互全部跑通。
一言以蔽之,Harness可以满足企业“向智能化要产业效率”的核心诉求。
腾讯云的Harness长什么样
以上可见,唯有帮助企业搭好Harness,才可以打通AI的全栈能力,真正解决AI落地的“最后一公里”问题。
中金公司也持有同样的观点:“云厂商的竞争格局在重构,过去比算力和带宽,未来比的是Harness、场景和生态。云的商业模式,正在从卖算力升级为以AI能力为核心的价值定价。”
基于此,腾讯云提供了Harness全栈组件,对模型能力进行了全链路工程化,与一辆F1赛车有异曲同工之妙。
首先是引擎,好比模型服务,作为Agent的“大脑”。为了持续保持的竞争力,企业智能体对模型选择、成本控制等提出了更高的要求,问题在于主流大模型存在交替领跑的现象,“各领风骚100天”,且不同大模型的Token优惠不一样、费用不一样。
于是乎,“物优价廉”成为Agent的核心诉求。
针对企业多样化的模型调用需求,腾讯云将MaaS迭代为TokenHub,集成自研的混元大模型以及DeepSeek、MiniMax、Kimi、GLM等主流大模型,并允许企业通过Token Plan统一计费、按需选用。
对此,巨日禄深有体会。
巨日禄是一家AI漫剧创作平台,创始人杰夫把自己比喻成一个短剧制作的山姆超市,希望把最新最好的AI工具提供给内容创作者,按照每周更新的进度来更新平台上的素材。
他告诉锌刻度:“云厂像养牛的,我们是做牛排的,腾讯云有最新的AI技术,我们有一线的know how,非常天然丝滑的上下游关系”。
其次是底盘,也就是基础设施,充当Agent的“操作系统”。 扎实的底盘是F1赛车平稳行驶的关键所在,即便高速极限驾驶车手也可以踏实放心,ADP、Agent Runtime等基础设施对Agent而言也是如此。
ADP是腾讯云的智能体开发平台,深度整合了RAG、知识库、自动化工作流等能力,支持智能体一站式开发,进而率先在行业内实现零代码配置多智能体协同构建,大幅降低了智能体的开发门槛。
而Agent Runtime是腾讯云的Agent运行底座,以安全沙箱为核心执行环境,支持毫秒级启动与数万实例并发,可以实现百毫秒启动,比传统容器快50倍。
再者是仪表盘,堪称知识中台,担任Agent的“数据治理系统”。F1赛车每秒采集胎压、油温、风阻等上千个数据点,并通过仪表盘呈现实时车况,而企业在经营过程中也在不断产生知识与经验,源源不断为智能体提供可调用资产。
即依托腾讯乐享AI知识库、腾讯文档、知识引擎等能力,可以将知识与经验沉淀成企业知识库,让每一个员工站在同一起跑线上。
当下,业内首个AI原生知识库腾讯乐享从“智能问答工具”迭代为“驱动业务执行的智能中枢”,可以自动完成知识分类、更新与合规审核,并融汇内外部知识、穿透复杂业务场景,从而彻底解决“用不好、质量差、答不对、太封闭、不合规”的行业痛点。
腾讯乐享商业化负责人杨志强告诉锌刻度:“如果没有知识库,你让龙虾干活的时候,每一次对话都要完整地把过去的记忆看一遍,然后重新调大模型,调模型次数越多那ToKen消费越高,企业的知识库越来越成熟,在某些场景下是不需要调大模型的,对ToKen的消耗一定是降低的。”
简而言之,有了知识中台,企业智能体才更具性价比。
接着,赛车操控系统等同Skills,作为Agent的“技能生态”。F1赛车的转向、悬挂、差速器等操控系统可以实时响应车手的所有指令,而AI的实时响应企业的需求,则需要Skills牵线搭桥。
Skills是大模型能直接读懂的通用指令,有了具体的指令大模型才知道该干什么、能干什么以及应该怎么干,是智能体从“对答如流”走向“踏实干活”的关键。
正因为如此,腾讯云将腾讯会议、企业微信、腾讯地图等诸多企业级产品封装成Skills,以供第三方企业智能体灵活调用,并上线了Skills社区-SkillHub,打造一个繁荣的Agent技能圈,让AI的能力共享,让大小企业共生、让智能体生态共荣。
不仅如此,腾讯云推出了全方位智能办公助手WorkBuddy、“企业版龙虾”ClawPro,借助Skills与企业微信、腾讯会议、腾讯文档等办公应用彻底打通,从而实现办公场景全域覆盖。
其中,ClawPro尤为值得一提。
ClawPro首创了“企业—部门—个人”三级Token配额体系,Token消耗更合理、更可控、更均衡,搭载了专为智能体优化的Ai2云服务器,算力成本较传统机型降低40%,成为企业降本增效的关键抓手。
以财税SaaS平台“慧算账”为例,500多名会计要同时服务20万家小微企业,腾讯云ClawPro嵌入企业微信后,帮助“慧算账”实现了会计查社保、开发票、调账、跑财税RPA流程一站式完成,每个会计的服务能力从300家提升到400家~500家,整体提效50%。
更为重要的是,“ADP+ClawPro”构建了企业智能体的完整闭环。
企业基于ADP开发的知识库,可以被ClawPro直接调用,便于员工及时更新信息;而员工在ClawPro上调用的数据,也能直接回馈于ADP,便于智能体持续迭代,形成正反馈循环。
最后,赛车的钛合金护杆等效安全体系,为Agent的“红线”。
F1赛车标配了一根钛合金护杆,突发状况下可以硬扛数十倍车重的冲击,是名副其实的“生命柱”,而安全也是企业拥抱智能体的首要前提。
毕竟,“不解决安全问题,AI Agent很难正式在To B落地”。
巧的是,安全也是腾讯云的底色:腾讯成立了科恩实验室、玄武实验室、湛泸实验室、云鼎实验室等七大安全实验室,荟萃了大批顶尖安全高手,走在安全技术的最前沿,多年与黑灰产对抗沉淀了丰富的经验,无惧高并发等各类攻击,足以将“安全即云”贯彻到底。
具体来看,腾讯云提供了AI Agent安全中心、AI Agent安全网关、Agent管家、天御Token防刷等系统性的安全解决方案,足以扫除智能体在企业落地的安全障碍。
如此一来,企业拥抱智能体无需从0到1去搭建,依托腾讯云涵盖基础设施、模型、生态到应用的Agent产品全景布局,可以开箱即用,接上即跑。
“腾讯云不是帮企业造马,是把整辆车交到手里。”一名业内人士如是说。
一个飞轮看透Harness的价值
Harness成为企业用好AI的最佳搭子,MiniMax就是最好的明证。
MiniMax是国内风头正盛的大模型之一,其能够保持月度发版、跻身全球开源模型的第一梯队,离不开沙箱这个Harness能力的强力支撑。
大模型要不断进化,就需要不断进行训练,即“写代码→跑测试→看报错→再改进”,为了加快训练进度,高并发成为常态,甚至需要同时开启上万个测试环境,更为严苛的是每个测试环境都需要独立运行,这意味着高并发与快响应必须并存。
问题在于,传统容器K8S开启一个测试环境要几十秒,开启上万个就会过载,导致GPU空等任务开始,白白浪费了宝贵的算力。
毕竟,Agent是按次调起、按毫秒计费的,大模型训练哪怕启动慢一毫秒,也会抬高企业训练成本、降低测试体验。
为了解决上述痛点,腾讯云与MiniMax一起打造了Agent Runtime沙箱。
Agent Runtime沙箱可以百毫秒启动,比传统容器快50倍,在大规模Agent训练场景下可以实现 “环境秒开、用完即删”,让Agent训练更快、更省。
需要注意的是,传统Agent沙箱为了启动快、省资源,往往选择共享一个操作系统内核,一旦某个测试环境触发了内核漏洞,则可能导致穿出沙箱波及主机。
而腾讯云的每个沙箱都运行在独立的操作系统内核之上,在硬件层面就进行了彻底隔离,即便单个沙箱出现异常,也不会影响溢出。
不久前,腾讯云正式开源了Agent Runtime沙箱的底座Cube Sandbox,惠及更多Agent助力更多企业重塑生产力。
技术之外,Harness也打通了商业化链路。
财报显示,MiniMax 2025年国际市场的营收占比高达73%,业绩遍及超200个国家及地区,累计服务超过2.36亿名用户。
在此过程中,腾讯云覆盖全球的计算节点和CDN加速,助力MiniMax的Token成功出海。
由于中国Token超高的性价比,成为海外用户的“心头好”,在OpenRouter平台上,MiniMax长期排名位列前茅,其M2系列文本模型在2026年2月的平均单日Token消耗量较2025年 12月增长6倍以上。
需求激增之下,对Harness的要求也水涨船高。
腾讯云不但通过弹性扩容与智能流量调度,让MiniMax从容应对Token爆炸式增长,还在安全、合规等方面大力支持,帮助MiniMax在不同国家和地区复杂的监管环境中成功落地生根。
“MiniMax的模型今天已经跑在我们的CodeBuddy、WorkBuddy里面了,我们帮他们的模型进化更快,他们的模型让我们的产品更强。”李强如是说。
腾讯集团副总裁、政企业务总裁李强
这意味着,MiniMax模型在腾讯云上训练得更快、成长得越久,腾讯云的Harness也会相应变得更强大更优秀。
彼此信任与共识之下,一个不断循环、共生共荣的飞轮正在加速转动,带动技术优势不断放大、数据资产不断沉淀,最终迎来强者恒强的竞争格局。
需要注意的是,MiniMax并非个例。
华住集团基于腾讯云智能体开发平台,打造了业界首个规模化落地的酒店智能体“AI住中服务”,已在1万家门店落地,73%高频需求5秒自动处理,部分门店日使用率94%;拓竹接入腾讯混元3D后,将3D打印建模周期从过去的数小时压缩到分钟级;德国软件公司 Maxon将混元3D集成进C4D——中国模型能力反向输出全球……
上述公司所处的行业不同,面临的却是同一个问题:在模型到位的背景之下,怎么在业务里跑起来,释放最大的生产力。
这就是Harness的拿手好戏,通过解决落地的“最后一公里”,让AI从“能用、好用”走向“易用、爱用”。
重庆为何是AI落地的最佳样本
Harness全链路的“整车交付”能力,唯有与产业共振才可以释放最大的价值,而重庆提供了最佳的舞台。
作为中国西部唯一的超大规模制造业城市,重庆坐拥全国41个工业大类中的39个,实现31个制造业大类全覆盖,为AI落地提供了广泛的真实场景和海量的数据支撑。
更为关键的是,重庆正在进行产业结构升级。
其中,新能源汽车产业发展得如火如荼,五年之内产量增长了29倍,助力重庆汽车产量重返全国城市首位。
由此一来,智能驾驶、智能质检、智能工厂等落地场景在重庆不断崛起。
新兴产业之外,传统产业也在不断突破:重庆张雪机车在WSBK世界超级摩托锦标赛上夺冠,这是国产机车品牌首次在世界顶级赛事中登顶。
因此,重庆的AI落地场景充满活力与潜力,企业沉淀的数据也有了用武之地,选择重庆就相当于抢占了产业数字化的高地。
此背景下,腾讯扎根重庆已有13年。
公开资料显示,2013年,腾讯西部云计算数据中心在重庆建立;2018年,设立了腾讯西南总部,重庆成为腾讯服务整个西南地区的战略支点;2021年,腾讯工业互联网智能产业总部落户两江新区,深度赋能重庆制造业转型升级……
长期的生态共建之下,腾讯与重庆可谓“水乳交融”。
腾讯在重庆落户了15家以上云计算等业务主体,并在西南地区服务客户超过9万家,覆盖制造、农业、文旅、零售、教育等领域。
以长安汽车为例,早在2017年双方就达成战略合作,一直延续至今:腾讯为长安汽车提供智驾算力、数据合规等技术支持,数据存储规模达到百PB级;长安汽车结合腾讯车道级导航地图能力,打造了舱驾一体的智能驾驶体验……
产业之外,文化等领域也是结缘的重点。
在文化领域,通过“电竞+文旅”的打法,助力重庆城市文旅业态升级和发展,腾讯2025年在重庆累计落地了50多场电竞赛事,包括6场全国总决赛和1场全球总决赛,线下参与人数破百万,线上观赛总人次突破6000万。
种种迹象表明,当大模型成为水电煤一样的通用基础能力,AI的竞争焦点从技术层面转向产业深度融合,谁能持续助力产业拥抱“智能化”与“全球化”,谁就能获得更大的势能,而重庆背靠完整制造业体系以及复合型物流枢纽优势,为AI单点应用走向体系化落地提供了肥沃的土壤,自然成为AI落地的最佳样本。
总而言之,Harness从幕后走到了前台,为企业提供全链路的AI Agent落地解决方案,重塑企业的生产力,“技术变量变成企业增长的定量”,从而让AI的技术红利惠及千行百业,并推动中国制造走向全球。
毋庸置疑,人工智能正式进入Harness时代。