2026061006:12星期三 申请收录 标签云 工具箱
当前位置:首页资讯详情页

华为大模型负责人创业:一个框架帮Agent省75%的token钱

资讯 admin 2026-06-06 18

一家成立仅几个月的公司,估值就干到了1亿美元。

它做的事很简单:帮AI Agent省token钱。省到什么程度?同样的任务,成本直接砍掉75%。

一、Agent公司正在被token账单逼死

一个Agent完成一次任务,背后可能跑十几步,每一步都在烧token。

模型调用成本1元,用户付费1.15元,毛利只有15%。而行业生死线是30%。

很多Agent公司不是死于产品不行,是死于越用越亏。

二、四层架构,刀刀砍在成本上

第一层,智能路由。不是每一步都需要最强模型。OpenSquilla在调用前先判断任务复杂度,简单任务用便宜模型,复杂任务才上旗舰。把token成本从事后结算变成调用前决策。

第二层,上下文管理。很多Agent把所有Skill说明、历史记忆、网页内容一股脑塞进prompt。OpenSquilla按需加载,用不到的不加载,无关的不召回。

第三层,MetaSkill。用户说一个目标,AI自动拆步骤、选Skill组合、安排依赖关系。用户只管提需求,Harness负责编排。

第四层,可进化。用户纠正了三次才满意的任务,系统会记住这些纠正,下次不再从零开始。

三、华为大模型团队出来创业

创始人王云鹤曾任华为大模型负责人,CTO韩凯是原实验室首席研究员。两人长期研究模型压缩和高效计算。

他们押注的是:模型提供能力,应用定义场景,Harness决定成本的下限。

四、为什么Harness突然这么重要?

Claude Code、OpenClaw、Codex,所有顶级Agent产品都在卷Harness。

因为模型能力正在拉平,真正拉开差距的是模型外面那层系统——怎么调度、怎么编排、怎么省钱。

OpenSquilla开源在GitHub上,已经成了热门项目。

当所有Agent公司都在烧钱的时候,能帮他们省钱的人,反而先赚到了钱。

你觉得,Harness会成为AI创业的下一个万亿赛道吗?

相关文章