开云(中国)2026世界杯IOS|Android手机app下载 当AI从租GPU走向卖Token, 谁会赚到实在的钱?


出品|妙投APP
作家|张博
头图|AI生图
往常两年,AI产业最密致的主角是大模子,随后阛阓的眼神赶快转向“算力”——谁有GPU、谁有机房、谁能更快把管事器架起来,似乎谁就站在了波浪前排。
但任何产业往前走一步,底层逻辑齐会变一层。
若是说试验大模子更像“造发动机”,那么今天越来越伏击的推理管事,更像是让汽车实在跑开赴。模子再强,若是弗成被踏实、低成本、大畛域地调用,就很难实在进入企业、进入场景、进入日常生计。
而推理本色上是一种捏续性的算力浮滥。用户每一次发问、每一次生成内容,背后齐会浮滥Token。跟着AI应用畛域越来越大,行业实在比拼的,也不再仅仅“有莫得GPU”,而是谁能更低成本、更踏实地分娩和转换Token。
也正因为如斯,AI算力管事正在发生一场伏击变化:往常主流是“算力租赁”,说白了等于租GPU、租管事器;而当今,新的扮装运转浮出水面——Token工场与Token运营平台。
这两个词听起来新,但若是换成更宽泛的话,其实不难清楚。所谓Token工场,等于挑升“分娩AI输出能力”的工场,它不仅仅把机器租给你,而是胜利把模子跑起来,按执行输出量收费。所谓Token运营平台,则像AI期间的“模子中转站”或“调和进口”,把不同模子、不同管事商整合起来,让企业和开发者更便捷地调用。
若是说往常卖的是“铲子”,那么当今越来越多公司思卖的,是“挖出来的矿”;若是说往常比的是“谁有机器”,那么当今比的,是“谁能用相似的机器,产出更多、更低廉、更踏实的智能管事”。
这背后,不仅仅新成见,而是AI产业单干运转深入的信号。更现实的问题是:从卖GPU到卖Token,AI推理管事到底是不是一门更好的生意?
因为“租算力”运转不够用了。
任何新产业在早期,齐会资格一个“资源稀缺”的阶段。AI也一样。前两年,人人最温雅的是有莫得高端GPU,能弗成拿到英伟达的卡,能弗成尽快把集群搭起来。
于是,“算力租赁”成了一个很热的生意:有资源的东谈主把GPU管事器租赁去,客户按月、按年付费。这个口头在产业早期成立,因为其时最稀缺的是“资源自己”。
但跟着AI从试验走向推理,这种口头的局限运转透露。
起先,它更像“出租开荒”,而不是“托付收尾”。客户租的是GPU,不是最终的AI能力。就像租了一台机器,至于机器终末作念出若干产物、赚了若干钱,和出租方干系不大。这意味着,哪怕卑鄙AI应用瞬息爆发,算力租赁方也很难实在共享到增长红利,收入宽泛是固定的,弹性有限。
其次,它容易堕入同质化竞争。若是人人作念的齐是“谁有卡、谁低廉、谁托付快”,那么这门生意最终很容易走向价钱战,利润空间会被捏续压缩。
更伏击的是,对大模子公司和互联网大厂来说,我方扛着一谈推理体系越来越重。今天的大模子管事,还是不是“把模子部署上去”这样未必,它背后要科罚的是机房、电力、散热、采集、存储、转换、模子优化、延迟收敛、踏实性保险、成本管束等一整套复杂问题。
对许多大厂来说,算力插足还是不仅仅时期问题,更是财务问题、组织问题,致使是风险问题。本钱开支太重,运营太复杂,合规要求又越来越高,企业当然会思:有莫得一种神色,不错既拿到推理能力,又无谓我方事事亲力亲为?
这就像制造业发展到一定阶段,品牌商会把部分分娩措施外包给更专科的工场。AI产业也正在出现肖似的单干。于是,问题不再仅仅“有莫得算力”,而是谁能更高效、更踏实、更低成腹地把模子能力更动成Token,并捏续托付给应用和客户?
而这里实在的变化还不仅仅“管事外包”,更在于计价神色变了,收入逻辑也就变了。
所谓Token工场,本色上是一种新的推理管事口头。它有重财富底座——机房、管事器、集群、电力、采集;但它不仅仅把这些硬件租赁去,而是胜利连结模子推理任务,分娩Token,并按Token浮滥收费,致使和模子方按收入分红。
若是用制造业作念类比,它有点像AI期间的“代工场”;若是用动力行业作念类比,它也有点像“真金不怕火油厂”——实在决订价值的,不仅仅有莫得原料,而是能弗成高效能地加工出有价值的产出。
为什么这个口头更有蛊惑力?
因为它同期圆润了险峻游两头的需求。对上游模子厂商来说,不错把一部分推理产能外包出去,我方更专注于模子研发和应用生态;对下搭客户来说,不需要我方深度介入复杂的部署和调优,唯有通过表率API调用,就能拿到踏实的AI管事。
对Token工场我方来说,收入不再是固定房钱,而是和卑鄙调用量接洽,若是AI应用越来越普及,Token浮滥越来越多,它就有契机共享到更大的增漫空间。
这亦然为什么,一些公司透露的Token工场业务毛利率,会显贵高于传统算力租赁。传统租赁更像资源生意,而Token工场更接近“资源+工程优化+管事托付”的复合型生意。
2026世界杯赛事竞猜中国官网固然,许多东谈主第一反应会认为,Token工场的壁垒在于“卡多”。但实在往下看,未必如斯。因为在推理期间,更重要的问题不是“有莫得卡”,而是在相似的卡、相似的电、相似的机房条目下,谁能产出更多Token?
这背后拼的是一整套工程能力,比如模子压缩和量化能力、推理引擎优化能力、模子与芯片的适配能力、并行转换和资源摆布率、自动扩缩容和踏实性保险。全球阛阓上,推理优化团队越来越受到怜爱,原因就在这里。因为它们作念的事情,本色上是在贬低单元Token成本。而谁能把成本作念低,谁就更有可能在来日的竞争中活下来。
不外,从投资角度看,Token工场实在需要回复的,还是不仅仅“有没灵验率上风”,而是这种效能上风能捏续多久。
这是一个弗成闪避的问题。因为推理优化并不是某一家公司的专利,英伟达、模子厂商、开源社区齐在快速鼓动接洽器具和框架。今天靠工程优化拿到的最初,未来可能就会被更闇练的通用决策赶快松开。换句话说,这种壁垒更像动态最初,而不是静态护城河。
另一个值得警惕的方位,是客户干系的双重性。名义上看,绑定字节、阿里、腾讯这样的头部客户固然是上风;但反过来看,这些客户自己亦然最强的时期公司。
它们今天向外采购Token工场管事,可能是因为当下需要补充波峰算力、优化组织效能、搬动部分本钱开支;可一朝自身推理成本降得满盈低,或者里面体系更闇练,外部工场还能拿到多大的经久价值,就需要重新评估。
是以,Token工场确乎是一种更先进的产业单干,开云(中国)2026世界杯IOS|Android手机app下载但这并不料味着它自然等于一门高壁垒、高通告的生意。从投资上看,它更像“AI期间的重财富基础设施”——收入看得见,订单也可能看得见,但终末能弗成千里淀为高通告,还要看产能摆布率、折旧周期、捏续再投资压力,以及最重要的:它到底有莫得订价权。
若是上游模子厂商捏续降价,下搭客户又越来越强势,那么Token工场即便能保捏较高毛利率,也未必一定能创造满盈好的本钱通告。这极少,远比单纯盘考毛利率更值得怜爱。
若是说Token工场科罚的是“分娩问题”,那么Token运营平台科罚的等于“通顺问题”。
今天的AI模子越来越多,不同模子有不同能力、不同价钱、不同接口。关于开发者和企业来说,实在辛勤的赓续不是“莫得模子可用”,而是“模子太多、接口太散、管事不够踏实”。
于是,Token运营平台的价值运转出现。它作念的事情,不错用一句很宽泛的话详细:把复杂的模子寰球,变成一个更未必、更好用的管事进口。
这类平台实在的价值,不仅仅“团聚”,而在于三件事:贬低接初学槛;提供踏实性保险;作念智能路由,让不同任务匹配不同模子,在后果和成本之间找到最优解。
是以,Token运营平台并不仅仅“中间商”,它更像AI期间的“流量转换中心”。从生意口头看,这类平台宽泛相比轻财富,收入主要来精真金不怕火上游价钱基础上的管事溢价。它的经久价值,不在于赚若干差价,而在于能弗成酿成平台效应和客户粘性。
但这里相似存在一个容易被忽略的问题:谁才是企业客户实在的进口?
在许多B端场景里,企业底本就还是深度绑定某一家云厂商。它的账户体系、数据体系、运维体系、合规体系,赓续齐建立在云平台之上。关于这类客户来说,模子调用自然会优先选拔云厂商我方的MaaS平台,而不是再非凡引入一个孤苦的Token运营商。
这意味着,孤苦Token运营平台思要成立,必须提供云厂商作念不到、或者暂时作念不好的独到价值。比如更强的跨云转换能力、更极致的故障切换能力,或者在跨模子调用中酿成实在的数据飞轮和使用粘性。不然,它很容易被云厂商的功能所经受,终末只剩下一层很薄的通谈价值。
是以,至少在现阶段,Token运营平台更像一个思象空间很大、但实在护城河还莫得十足跑出来的赛谈。它有契机成为进口,但也很容易停留在器具层;它有契机作念成平台,但也可能最终仅仅云厂商功能的一部分。
这亦然为什么,从投资角度看,Token运营平台更适当被当作一种“期权型契机”来不雅察,而不是等闲当作还是被考据的中枢基础设施。
若是只把Token工场和Token运营当作两个新成见,钦慕并不大。真碰劲得怜爱的是,它们反应出AI产业正在发生三个深层变化。
第一,从“卖资源”走向“卖收尾”。往常卖的是算力自己,来日卖的是模子输出能力。这意味着产业竞争的中枢,从资源占有,转向效能和托付能力。
第二,从“大厂全包”走向“专科单干”。模子厂商不可能始终把整个事情齐我方作念完。当产业闇练,专科化单干一定会出现。有东谈主专注模子,有东谈主专注Token分娩,有东谈主专注Token分发,这反而会培植通盘产业的效能。
第三,从“成见驱动”走向“生意闭环驱动”。前几年,许多AI故事讲的是思象空间。但实在决定企业价值的,最终照旧能弗成酿成可捏续收入、可复制口头和可考据利润。
从这个钦慕上说,Token工场和Token运营不是成见的延迟,而是生意化更进一步的体现。仅仅,站在投资视角看,还需要多补一句:新单干不等于新护城河,生意口头升级也不自动等于本钱通告升级。
若是保留极少投资酌量视角,那么这个赛谈值得看的,不仅仅“谁先提成见”,而是谁更接近真实落地。
一类是绑定头部客户的Token工场。这类公司若是还是和互联网大厂、模子厂商酿成踏实合营,那么它们的业务详情味会更强。但实在更值得怜爱的,赓续不是管事于最强自研模子体系的“补充性外采”,而是那些深度绑定了非自研模子、或者在经久合营中还是镶嵌客户中枢经由的玩家。
一类是有垂直场景闭环的公司。比如在AICoding、企业管事、智能营销等畛域,自己就有应用进口和客户基础的企业。若是它们把场景与推理管事纠合起来,赓续更容易酿成捏续的Token浮滥和生意闭环。
还有一类是专注推理优化的时期型公司。这类公司不一定最显眼,但若是能在特定芯片、特定模子、特定场景上把效能作念到极致,来日可能领有很强的议价能力。固然,这里相似要警惕:时期上风若是弗成捏续演进,就可能很快被开源生态追平。
终末,是具备平台属性的Token运营商。它们的重要看点,不是接入若干模子,而是能弗成酿成调和进口、踏实管事和智能转换能力。更伏击的是,它们必须阐发我方提供的是云厂商以外的增量价值,而不是一个朝夕会被整合掉的中间层。
Token工场和Token运营真的代表了一种值得怜爱的新趋势,但这并不料味着这条路会一帆风顺。
首先摆在目下的,照旧算力自己的敛迹。AI推理管事说到底,仍然建立在高端芯片、踏实集群和捏续供给之上。若是核默算力资源捏续病笃,或者供应链再度收紧,那么许多看上去很好意思的膨胀探究,终末齐可能慢下来。
与此同期,这个行业来日也很难幸免价钱竞争。模子越来越多,管事越来越丰富,价钱下行简直是时期产业闇练过程中的常见步地。一朝价钱束缚下探,企业比拼的就不再是谁讲得更美妙,而是谁能把成本收敛得更低、把效能作念得更高。
还有一个弗成残酷的变量,是时期跳跃自己。今天一些公司看起来最初,赓续是因为它们在推理优化、模子部署和转换方面走在前边。但AI行业变化太快,许多最初上风齐可能在开源器具和通用框架快速演进后被镌汰。是以,今天的壁垒,更像是阶段性的最初,而不是一劳久逸的护城河。
比这些更需要防备的,是成见先行。每当一个新赛谈受到关注,阛阓上总会出现一些“听起来很像、执行上还差得很远”的公司。作念算力,不一定就能作念好Token工场;能团聚接口,也不等于就能成为实在的Token运营平台。这中断绝着的,不仅仅时期,更是客户、托付、转换、踏实性和经久运营能力。
若是再往投资层面多看一眼,还要补上两个宽泛被忽略的问题:一个是本钱通告。Token工场看上去毛利率不低,但它本色上仍然是重财富、强插足的生意。高毛利并不势必等于高通告,实在需要看的,是经久ROIC、解放现款流,以及高折旧能否被捏续增长遮蔽。另一个是订价权。若是上游模子厂商越来越强势,下搭客户又越来越会压价,那么夹在中间的Token工场未必能经久吃到最厚的一层利润。
是以,对这个新赛谈最佳的清楚神色,不是急着判断谁会成为明星,而是先分清:哪些公司是实在在作念能力成就,哪些公司仅仅借成见讲故事。因为实在能穿越周期的,从来不是最早喊标语的东谈主,而是最早把能力作念塌实的东谈主。
而对投资者来说,也许还要再记取一句更冷静的话:在这场“卖Token”的飞扬里,最终赚得最稳的,未必是Token工场自己开云(中国)2026世界杯IOS|Android手机app下载,也可能依然是那些卖HBM、光模块和重要基础设施的“铲子商”。