华为大模型负责人创业:一个框架帮Agent省75%的token钱
一家成立仅几个月的公司,估值就干到了1亿美元。
它做的事很简单:帮AI Agent省token钱。省到什么程度?同样的任务,成本直接砍掉75%。
一、Agent公司正在被token账单逼死
一个Agent完成一次任务,背后可能跑十几步,每一步都在烧token。
模型调用成本1元,用户付费1.15元,毛利只有15%。而行业生死线是30%。
很多Agent公司不是死于产品不行,是死于越用越亏。
二、四层架构,刀刀砍在成本上
第一层,智能路由。不是每一步都需要最强模型。OpenSqu
资讯
admin
2026-06-06
19