“不是?他们怎么赚钱啊?”
真正先炸开的,不是普通用户圈,而是行业内。
就像LKS和徐贤在打车时遇到的聂师傅一样,普通用户看到五千块一年的订阅价格,第一反应大多是贵。
华国的消费水平提高不过是最近这十来年的事,几十块一个月的视频软件会员,尚且推广艰难,腾讯系的付费软件被字节系的免费软件打得溃不成军。
实打实五千一年,对于普通消费者而言,更是天文数字。
山姆的卓越会员一年才890。
哪怕虹星的概念已经足够火爆,真到掏钱的时候,哪怕是林燃的忠实粉丝,也会下意识地按下取消支付的按钮。
另外包括营销上,腾讯做的也远远不足。
除了开了场发布会外,几乎是无声无息。
微信没有宣传,微博首页没有投放广告,b站也没有投流。
别说和年初浩浩荡荡的元宝比,就连Kimi日常营销的烈度都达不到。
但对真正懂行的人来说,看到这个价格后的第一反应是太便宜了。
便宜得不正常。
因为只要稍微懂一点大模型推理成本、Agent任务链路、长期上下文维护、语音交互、图像输入和多模态实时分析的人,脑子里都会下意识先做一道最基础的算术题。
五千块一年,平均下来,一个月四百多,一天十几块。
十几块钱,能买到什么级别的模型调用?
如果只是一个低配聊天助手,那当然够了。
可问题是,虹做的根本不是低配聊天助手。它不是那种问一句答一句的普通对话框,更不是调用一个通用API、套一层人设提示词就能跑起来的壳子产品。
它要持续维护用户画像,要记忆上下文,要根据用户习惯动态调整交互策略,还要执行任务、拆解目标、接管节奏,甚至要吃摄像头、电脑行为权限、手表生理数据这些高频、多模态输入。
这背后的Token消耗,根本不是线性的。
业内人一眼就能看出来,所谓和AI聊聊天的消耗,在整个系统里反而可能是最便宜的一部分。
真正烧钱的,是那些用户看不见的地方。
你让它帮你安排一天的工作,这不是简单吐出几句话就结束了。
它要先解析目标,再调取你的历史上下文,再判断你的当前状态,再决定用什么语气跟你说话,接着还可能要根据你的反馈动态重规划。
这一整套下来,后台很可能已经跑了不止一轮推理。
如果再涉及任务执行,比如帮你梳理论文结构、拆分科研计划、筛选文献、生成提醒、调度设备权限,那消耗会更夸张。
更不用说摄像头监控这件事。
真正懂技术的人,看到实时观测用户深度工作状态这句话,第一反应几乎都是头皮一麻。
因为这意味着什么,大家都很清楚。
这意味着它要维持相当高频率的视觉输入,去判断用户视线是否偏移、表情是否疲惫、是否走神、是不是在真正阅读、有没有在假装工作。
哪怕不是全帧率持续分析,只要是一个能用的实时系统,这背后的视觉编码、特征提取和状态判断都会是惊人的成本黑洞。
再叠加电脑端监控。
浏览器切换、文档停留、键盘节奏、应用频率、输入停顿,这些东西单拿出来看好像不贵,但一旦你想把它们组织成一个真正能工作的认知操作系统,问题就完全变了。
因为它不只是采集数据,它还要实时理解这些数据。
理解意味着推理,推理意味着Token。
更别提语音交互。普通人会觉得一句“你好,刘鹏,我是绯”,只是一个语音包而已。
可行业里的人知道,如果这个声音背后真的是动态生成、实时响应、带情感起伏和人格一致性的表达,那么这套链路从文本生成到语音合成,再到上下文对齐,本身就是另一层成本。
所以行业里最早的讨论,是这东西到底怎么活。
有人在私下里算过一笔很粗的账。
如果一个重度用户每天和虹交互两三个小时,期间有文字、有语音、有任务执行、有多模态输入,还有一定长度的长期记忆维护,那么单用户的日均推理成本很可能就已经逼近,甚至超过这个用户每天所支付的订阅收入。
如果是轻度用户还好,重度用户越多,亏得越狠。
这还是建立在一切都高度优化、底层算力成本足够低、调度系统足够成熟的前提下。
一旦真像宣传里那样,让虹去承担同行者的角色,那它在后台消耗的是接近企业级Agent系统的资源消耗。
五千块一年?
这几乎相当于拿企业级服务的消耗,按消费级产品的价格卖出去。
最让业内人士不安的,是低价背后释放出来的信号。
第一种可能,是深红在补贴市场,根本没想着短期盈利,就是要用远低于成本的价格把用户习惯砸出来,先把赛道占住。只要能建立足够强的用户粘性和数据壁垒,前期烧钱根本不是问题。
这也能解释为什么腾讯不宣传,越宣传亏越多。
第二种可能,更可怕。
那就是深红的底层推理成本,已经低到了一个行业外部难以想象的地步。
如果是前者,那只是凶狠。
如果是后者,那就是恐怖。
因为这意味着别家还在按调用一次模型多少钱来做生意的时候,深红已经在按一个数字人格全年陪伴用户多少钱来重新定义价格体系了。
价格战最可怕的地方,是别人便宜得理直气壮。
这在现实世界中没有发生过,为什么说华国是工业克苏鲁,因为它是一整套成本比你便宜。
以纺织业为例,这是一个极度依赖劳动力的传统行业,也是全球产业转移的风向标。
过去几十年里,它一路从欧美转移到日韩,再转移到华国,接着又向东南亚迁移。
原因很简单,哪里人工便宜,产业就往哪里走。
在很多人的认知里,这个逻辑应该是线性的。
比如华国纺织工人的月薪,大致在五千人民币左右,而像孟加拉、安南、印尼这些国家,类似岗位的工资大概在一千到两千人民币之间,有的甚至更低。
单从工资来看,后者只有前者的三分之一,甚至更少。
按照传统逻辑,这种差距几乎是决定性的。
所以一度有很多判断认为,纺织业迟早会大规模从华国转移出去,这是不可逆的趋势。
但现实发生的事情,却让很多人看不懂。
产业确实在转移,但转移的同时,华国的纺织产能并没有被完全替代,反而在某些环节上,继续对外形成压制。
甚至出现了一些反直觉的案例。
孟加拉的纺织业被华国给逆向挤兑了。
Keya Group是孟加拉比较大的纺织集团之一,2025年宣布关闭4家纺织工厂,造成了8000人失业。
这个数字还在不断上升,孟加拉的服装厂大规模关闭工厂,整个2025年到2026年之间关闭250到260家工厂,22万工人失业,形成了系统性的逆向挤兑,孟加拉的纺织协会直接宣布全国纺织厂可能会集体停产。
华国的优势,已经从劳动力便宜,进化成了整条链路被压到极致。
原材料供应、设备制造、产业配套、物流体系、港口效率、订单响应速度、融资成本、产业集群带来的协同效应...
这些因素叠加在一起,形成了一种结构性的优势。
单看人工,华国更贵。
但看整体,华国更便宜。
更重要的是,这种便宜是长期积累出来的系统能力。
所以当华国企业给出一个价格时,它不是在打价格战。
它是在报一个真实成本。
这才是最可怕的地方。
因为对手没有办法通过“忍一忍”、“亏一段时间”来跟上。
你可以补贴一年、两年,但不可能一直补贴下去。
而对方,不需要补贴。
回到虹。
行业里最让人不安的,是它可能真的就值这个成本。
如果只是补贴,那大家还能等,等它涨价,等它收缩,等它回归正常商业逻辑。
可如果它的底层推理成本、调度效率、系统设计,已经低到可以支撑这个价格。
那问题就完全不一样了。
那就意味着,它不是在用价格抢市场。
它是在用价格,定义市场。
更糟糕的地方在于,虹是全新的架构,大家刚搞懂逻辑链怎么玩,新玩法,别说国内的厂商,硅谷头部的谷歌和OpenAI都还在摸索。
这给华国的同行们当头一击。
相比华国的热闹,硅谷的反应要晚半拍,但一旦反应过来,情绪却更直接。
最先炸开的,是几个大模型公司内部的Slack频道。
一开始只是有人丢了一张截图,虹的订阅页面,五千人民币一年。
下面还附了一句简单的换算:按1比6算,也就八百多美元。
消息刚发出来的时候,频道里还有人调侃。
“八百?一年?还没有GPT最高配一年的价格高。”
“也许是功能阉割版?”
“或者限调用次数?”
但很快,气氛变了。
因为有人把Youtube上住在华国的阿美莉卡用户,完整的体验流程发了出来。
持续上下文、任务拆解、多模态输入、语音交互、甚至还包括设备级权限接管。
这些东西,任何一个单独拿出来,在硅谷都是可以单独做产品、单独收费的模块。
而在虹这里,是打包的。
而且是无限制订阅。
Slack频道里安静了几秒。
然后第一句比较认真的发言出现了:
“这个价格不对。”
紧接着,有人回:
“不是不对,是不可能。”
很快,就有人开始算账。
“我们现在的推理成本,如果用同等级别的模型,按这个交互频率跑,一个用户一年至少要烧掉多少?”
“别说一年了。”有人直接打断,“重度用户一个月都不止这个数。”
“还没算视觉输入、语音、Agent循环。”
“更别说长期记忆和个性化建模。”
有人贴了一行简单的结论:
“他们在卖的东西,价格低于成本。”
这句话发出来之后,频道里反而更安静了。
因为所有人都明白,这种情况只有两种解释。
要么是补贴。
要么是成本结构完全不同。
不管是哪一种,都不是什么好消息。
用户开始绕过他们。
一开始是Reddit上有人发帖,说可以通过中间商帮忙注册虹的账号,只需要提供一个华国手机号或者代付服务,额外加几十美元手续费。
下面的评论区一开始还在讨论可行性。
“有人试过吗?”
“安全吗?”
“会不会封号?”
但很快,帖子变成了晒单贴。
“已经用了三天。”
“比我现在用的任何一个助手都更像人。”
“它会记住我说过的事情。”
“它会主动安排我该干什么。”
再往下,是更直接的评价。
“我不知道他们怎么做到的,但这东西不该只卖800美元一年。”
这句话被大量点赞。
硅谷这边的人看到这些内容的时候,非常警觉。
因为他们太清楚一件事。
用户是最现实的。
当用户愿意翻墙、找中间商、承担额外风险,只为了用一个产品的时候,这已经不是有点吸引力的问题了。
OpenAI内部很快开了紧急会议。
产品经理在白板上写下三个词:价格、能力、体验。
然后划掉了价格。
“我们现在不讨论价格。”他说,“因为这个价格我们跟不了。”
会议室里没有人反对。
因为所有人都知道,如果他们把自己的产品也降到800美元一年,按照当前的成本结构,基本等于直接宣布财务失血。
那剩下的就只有两个方向。
要么提高能力。
要么重构成本。
但问题在于,虹做的事情,不只是“能力更强”这么简单,它改变的是产品形态。
有人在会议上直接说了一句:
“他们不是在做assistant,他们在做operator。”
这句话一出来,很多人都沉默了。
因为assistant是响应式的,你问,它答。
operator是主动的,它会判断、会安排、会介入你的行为。
这两者的差距,不只是模型参数量,还包括了整个产品哲学。
如果要追赶,他们需要重写一整套交互逻辑。
这意味着什么?
意味着之前所有围绕“调用次数”“token计费”“套餐分层”的商业模型,都要重算。
有人苦笑了一下,说了一句很直白的话: