2026年7月1日,一笔8亿美元的C轮融资落地,Together AI的估值从上一轮跃升至83亿美元。领投方不是硅谷的老牌风投,而是沙特阿美旗下的风险投资部门Aramco Ventures。这个组合本身就是一个信号:当全球最大的石油公司押注一家”neocloud”(新型云计算)创业公司时,算力正在成为这个时代的新石油——不是比喻,而是资本配置的现实。

(来源: TechCrunch, 2026-07-01; BusinessWire, 2026-07-01)

这笔交易的背景是:AWS、Azure、GCP三巨头控制着全球云计算市场超过65%的份额,它们的GPU集群规模以十万卡计,资本开支以千亿美元计。在这样的垄断格局下,Together AI凭什么值83亿美元?答案藏在一个正在被重新定义的市场结构中——neocloud不是要取代大厂云,而是在AI时代算力供需严重错配的窗口期,占据了一个大厂暂时无法(或不愿)覆盖的生态位。

但更深层的问题是:这个生态位是暂时的套利机会,还是一个可持续的结构性位置?Together AI的83亿美元估值,究竟定价的是当下的收入增长,还是对AI基础设施未来格局的一次豪赌?


第一章:800M融资落地——一场精心设计的资本叙事

融资细节与估值跃升

Together AI此次C轮融资8亿美元,投后估值83亿美元。(来源: BusinessWire, 2026-07-01)这意味着新投资者以约9.6%的稀释比例入场。对于一家基础设施公司而言,83亿美元的估值反映的不仅是当前收入,更是市场对neocloud赛道增长曲线的定价。

从公开信息来看,Aramco Ventures领投这一轮,这是沙特阿美在AI基础设施领域最大的单笔投资之一。(来源: TechCrunch, 2026-07-01)Together AI此前在2024年完成了由Salesforce Ventures、Kleiner Perkins等参与的融资轮次,当时估值据报道约为13亿美元。从13亿到83亿美元,不到两年时间估值增长超过5倍——这个速度即使在AI领域也属于头部水平。

作为对比,CoreWeave在2024年底以190亿美元估值完成融资,而在2025年3月的IPO中市值一度超过230亿美元。Together AI的83亿美元估值意味着它已经进入了neocloud赛道的第一梯队,但与CoreWeave之间仍有显著差距——这个差距恰好反映了两家公司在规模和模式上的差异。

资金用途的战略信号

8亿美元的资金将用于什么?根据Together AI的官方声明,其目标是”使前沿AI对所有人可及”(Make Frontier AI Accessible to All)。(来源: BusinessWire, 2026-07-01)这句话翻译成商业语言意味着三件事:

第一,扩大GPU集群规模。 Neocloud的核心资产是算力,没有足够的GPU库存,就无法承接大规模训练和推理任务。8亿美元中的相当部分将用于采购NVIDIA H200/B200系列GPU,以及可能的定制化ASIC芯片。按照当前B200的市场价格(约3-4万美元/卡),8亿美元理论上可以采购约2万-2.5万块B200 GPU——但考虑到数据中心建设、网络设备、冷却系统等配套投入,实际GPU采购量可能在1万-1.5万块左右。

第二,强化开源模型生态。 Together AI的差异化不仅在于卖算力,更在于围绕开源模型(如Meta的Llama系列、Mistral、DeepSeek等)构建的完整服务栈——从模型微调、部署到推理优化,形成一个”算力+软件”的复合价值主张。

第三,全球化扩张。 Aramco的参与暗示中东市场将成为Together AI的重要增长极。沙特的NEOM智慧城市项目、阿联酋的AI战略都需要大规模算力支撑,而这些国家对数据主权的敏感性使得它们不愿完全依赖美国三大云厂商。

估值合理性的冷思考

83亿美元的估值是否合理?让我们做一个简单的框架分析。

根据行业数据,2025年neocloud整体行业收入已超过250亿美元。(来源: Data Center Dynamics, 2025)如果Together AI在这个市场中占据2-3%的份额,其年化收入就在5-7.5亿美元区间。以83亿美元估值计算,对应的收入倍数约为11-17倍——对于一家高增长的基础设施公司而言,这个倍数虽然激进,但在当前AI资本周期中并非不可理解。

然而,这里存在一个关键的方法论问题:我们无法确认Together AI的实际收入数字。作为一家未上市公司,Together AI没有义务披露财务数据。如果其实际收入远低于上述估算(例如仅有2-3亿美元),那么17-28倍的收入倍数就显得更加激进,更多反映的是对未来增长的预期而非当前基本面。

更重要的是,这个估值隐含了一个关键假设:neocloud的增长必须持续。如果大厂云通过降价、定制化服务或收购来挤压neocloud的生存空间,这个估值的基础就会动摇。


第二章:Neocloud赛道解码——AI时代的”算力中间商”

什么是Neocloud?

Neocloud这个词在2024年之前几乎不存在于主流商业词汇中。它的崛起与一个结构性矛盾直接相关:AI训练和推理对GPU的需求呈指数级增长,但传统云厂商的GPU供给受限于其通用化架构和排队机制。

传统云(AWS、Azure、GCP)的设计哲学是”什么都能做”——从存储、计算、数据库到AI,一站式服务。这种通用性的代价是:当你需要一个由数千块GPU组成的高带宽集群来训练一个千亿参数模型时,传统云的网络拓扑、调度系统和定价模型都不是为这个场景优化的。

Neocloud的本质是:专门为AI工作负载设计的云基础设施。它不卖通用计算,不卖数据库服务,只做一件事——以最高效率、最低延迟、最优成本把GPU算力交付给AI开发者。CoreWeave、Lambda Labs、Together AI、Crusoe Energy等都属于这个阵营。

为何AI需求催生了Neocloud?

要理解neocloud的必然性,需要看清AI工作负载与传统云工作负载的本质差异:

规模差异:训练一个前沿大模型需要连续占用数千甚至数万块GPU数周到数月。以Meta训练Llama 3 405B为例,据报道使用了超过16000块H100 GPU持续训练数月。传统云的按需(on-demand)模式和竞价实例(spot instance)机制无法保证这种长时间、大规模的连续算力供给。

网络拓扑差异:大模型训练是高度并行化的分布式计算任务,GPU之间需要极高带宽、极低延迟的互联(如InfiniBand或NVLink)。传统云的数据中心网络是为Web服务设计的,GPU集群之间的通信效率远低于专用AI数据中心。NVIDIA的DGX SuperPOD架构要求GPU之间的互联带宽达到900GB/s级别,这在传统云的共享网络环境中很难实现。

定价模型差异:传统云的GPU定价包含了大量”税”——通用基础设施的分摊成本、多层软件栈的许可费、企业级SLA的保险金。以AWS的p5.48xlarge实例(8块H100)为例,按需价格约为98美元/小时。而neocloud提供商的同等配置价格通常低30-50%,因为它们剥离了不必要的通用服务层。

Neocloud正是在这三个痛点上建立了自己的价值主张:专用拓扑、长期合约、更低单位成本。

Gartner的市场预测与行业规模

Gartner在2026年6月23日发布的预测报告中指出:到2030年,neocloud提供商将占据2670亿美元AI云市场的20%份额。(来源: Gartner, 2026-06-23)这意味着neocloud到2030年的潜在市场规模约为534亿美元。

这个预测的含义是深远的:

第一,neocloud不是昙花一现的过渡态,而是一个被主流分析机构认可的长期生态位。Gartner给出20%的份额预测,说明他们认为大厂云不会完全吞噬这个市场。

第二,从2025年的250亿美元行业收入到2030年的534亿美元潜在规模,neocloud的复合年增长率约为16-17%。考虑到AI基础设施支出的整体增速(据IDC预测,2024-2028年全球AI基础设施支出CAGR超过25%),这个预测实际上相当保守——它暗示neocloud的市场份额可能在某个时点达到峰值后趋于稳定,而非无限扩张。

第三,2670亿美元的AI云总市场规模意味着,即使在2030年,大厂云仍将控制约80%的AI算力市场。Neocloud的生存空间是”大厂阴影下的20%”,而非颠覆者。

这里有一个大多数人没有看到的洞察:Gartner的20%预测实际上划定了neocloud的天花板,而非地板。 很多投资者将这个数字解读为”neocloud还有巨大增长空间”,但更准确的解读是”neocloud的份额扩张将在某个时点遇到结构性阻力”。这个阻力来自大厂云的规模经济——当AI工作负载从训练为主转向推理为主时,大厂云的全球分布式网络和边缘计算能力将重新成为优势。


第三章:Together AI的差异化壁垒——不只是卖算力

开源模型平台+定制化GPU租用的双轮驱动

Together AI与CoreWeave、Lambda Labs等纯基础设施neocloud的关键区别在于:它不只是一个GPU租用平台,更是一个围绕开源模型构建的完整AI开发平台。

Together AI的产品栈包括四个核心层次:

推理服务(Inference):企业可以通过Together AI的API调用各种开源模型(Llama 3.1、Mistral Large、DeepSeek-V2等),无需自己部署和优化。Together AI通过自研的推理优化引擎(包括模型量化、连续批处理调度、PagedAttention式KV缓存优化等技术),将单位推理成本压低到远低于直接在大厂云上部署的水平。根据其官网公布的定价,Llama 3.1 70B的推理价格约为0.88美元/百万token,显著低于在AWS上自行部署的等效成本。

微调服务(Fine-tuning):企业可以在Together AI平台上对开源基座模型进行定制化微调,使其适配特定领域的任务。这个服务的价值在于:企业不需要自己维护GPU集群和训练框架,只需上传数据、选择模型、设定参数,就能获得一个定制化的AI模型。

训练服务(Training):对于需要从头训练或进行大规模预训练的客户,Together AI提供高性能GPU集群的长期租用服务,配合其自研的分布式训练框架。

研究贡献:Together AI的创始团队由斯坦福大学教授Matei Zaharia(同时也是Apache Spark和Databricks的联合创始人)领导,在开源AI研究社区有深厚积累。公司持续投入基础研究,发布了FlashAttention等被广泛采用的开源工具,这使其在开发者社区中建立了强大的技术信誉。

这种”基础设施+平台+研究”的三层架构,使得Together AI的客户粘性远高于纯卖GPU的竞争对手。一旦企业在Together AI平台上完成了模型微调和部署,迁移到其他平台的成本就显著上升——不仅是数据迁移的成本,更是重新优化推理管线和重新验证模型性能的隐性成本。

与竞争对手的定位差异

Neocloud赛道内部的竞争格局正在分化:

CoreWeave:定位为”AI时代的AWS”,主打大规模GPU基础设施,客户包括大型AI实验室和企业。CoreWeave在2025年3月完成IPO,募资约15亿美元,其优势在于规模——拥有neocloud中最大的GPU集群之一(据报道超过10万块NVIDIA GPU),并与NVIDIA有深度合作关系(NVIDIA是其早期投资者)。但CoreWeave的模式更接近”裸金属IaaS”,软件层较薄,客户集中度高(据其IPO招股书披露,前两大客户贡献了超过60%的收入)。

Lambda Labs:起步于深度学习工作站销售,后转型为GPU云服务。Lambda的优势在于开发者社区的认知度和易用性,2024年完成了由Khosla Ventures领投的约3.2亿美元融资,但规模相对较小。

Together AI:定位为”开源AI的云平台”,核心差异化在于软件栈的深度。Together AI不仅提供算力,还提供围绕开源模型的完整工具链——从推理优化到微调再到评估。这使得它的客户画像更偏向”想用开源模型但不想自己搞基础设施”的中大型企业。

Crusoe Energy:以清洁能源驱动的数据中心为卖点,主打ESG叙事和低电力成本,2024年完成了由Fidelity领投的约6亿美元融资。

Together AI的独特定位可以用一句话概括:它是开源AI生态的”Heroku”——把复杂的模型部署和优化变成简单的API调用,同时底层由高性能GPU集群支撑。这种”平台即服务”(PaaS)模式的毛利率天然高于纯基础设施(IaaS)模式,因为软件层的边际成本趋近于零。

企业客户为何选择Neocloud而非大厂云?

这是一个必须回答的问题。AWS已经有了SageMaker和Bedrock,Azure有了Azure AI Studio,GCP有了Vertex AI——为什么企业还要去一家创业公司买算力和AI服务?

答案有四层:

成本:对于纯GPU工作负载,neocloud的价格通常比大厂云低30-50%。原因很简单——neocloud没有大厂的通用基础设施开销,也没有企业销售的多层渠道成本。对于一家每月GPU支出在50万美元以上的AI公司来说,30%的成本差异就是每年180万美元的节省。在AI创业公司普遍面临资金压力的环境下,这个差异足以影响生死。

灵活性:大厂云的GPU配额需要提前预约,热门型号(如H100/H200)的等待时间可能长达数周甚至数月。Neocloud通常能提供更快的交付和更灵活的合约条款——从按小时计费到6个月/12个月的预留实例,选择更多。

避免锁定:许多企业对依赖单一云厂商有战略顾虑。使用neocloud作为”第二供应商”可以增强议价能力,降低供应链风险。特别是当企业的核心AI能力建立在开源模型之上时,使用Together AI这样的开源友好平台可以避免被大厂生态绑定。

开源模型的原生支持:如果一家企业决定使用Llama或Mistral而非GPT-4o或Claude,那么Together AI提供的优化推理引擎、微调工具和模型评估框架就比大厂云上的通用工具更有针对性。Together AI的推理引擎针对每个主流开源模型都做了深度优化,这种专注带来的性能优势是大厂云的通用平台难以匹配的。


第四章:中东资本的AI基础设施野心——Aramco领投的深层逻辑

石油资本向算力资本的转型

Aramco Ventures领投Together AI的C轮,这不是一个孤立事件。它是中东主权资本系统性布局AI基础设施的最新一步。(来源: TechCrunch, 2026-07-01)

过去3年,中东资本在AI领域的布局呈现出明确的系统性:

  • 沙特公共投资基金(PIF)投资了多家AI芯片和数据中心公司,并在2024年宣布了400亿美元的AI投资计划
  • 阿联酋的Mubadala和ADIA持续加码AI基础设施投资,MGX(阿布扎比AI投资公司)在2024年成立后迅速部署了数十亿美元
  • 阿联酋的Technology Innovation Institute(TII)开发了Falcon系列开源大模型,Falcon 180B一度是最大的开源模型之一
  • 微软在2024年宣布向阿联酋AI公司G42投资15亿美元,进一步深化了中东AI生态

Aramco投资Together AI的逻辑可以从三个层面理解:

财务回报:作为全球最赚钱的公司之一(2024年净利润约1060亿美元),Aramco有充足的现金流需要配置到高增长领域。AI基础设施是当前最确定的技术投资主题之一,而neocloud的增长曲线与Aramco熟悉的”重资产+长期合约”模式有结构相似性。

战略协同:沙特正在大规模建设数据中心(NEOM项目规划中包含大型AI计算设施),需要可靠的云服务合作伙伴。Together AI可以为沙特本地的AI项目提供技术栈和运营经验,同时帮助Aramco理解AI计算的前沿动态。

能源-算力的天然联结:数据中心是能源密集型产业。一个大型GPU数据中心的电力消耗可达数百兆瓦。沙特拥有全球最低的能源成本之一(约2-3美分/千瓦时,远低于美国平均的7-8美分),这使得在沙特建设AI数据中心具有天然的成本优势。Aramco投资Together AI,可能暗示双方未来在沙特共建GPU数据中心的可能性。

主权资本在AI供应链中的角色演变

中东资本对AI基础设施的兴趣不仅仅是财务投资。它反映了一个更深层的地缘政治逻辑:在AI时代,控制算力供应链等同于控制战略资源

对于沙特和阿联酋而言,AI是”后石油时代”经济转型的核心支柱(沙特Vision 2030战略明确将AI列为优先领域)。它们不满足于仅仅做AI的消费者——它们想成为AI基础设施的提供者和标准的参与制定者。投资Together AI这样的neocloud公司,是获取AI供应链话语权的一种方式。

这里有一个大多数人没有看到的洞察:中东资本对neocloud的偏好,部分源于它们对美国三大云厂商的结构性不信任。AWS、Azure、GCP背后分别是Amazon、Microsoft、Google——三家美国科技巨头,受美国政府出口管制和制裁政策的约束。对于中东主权国家来说,将国家级AI基础设施完全托管在美国公司的平台上,存在地缘政治风险——2024年美国对中国AI芯片出口管制的升级,已经让所有非美国盟友国家意识到”技术依赖”的脆弱性。

而neocloud作为独立第三方,提供了一个相对中立的选择。Together AI的开源模型定位进一步强化了这一优势:使用开源模型意味着不依赖任何单一公司的闭源API,降低了技术锁定和地缘政治风险。这解释了为什么Aramco不是投资AWS或Azure的AI服务,而是选择了一家独立的neocloud公司。

投资背后的风险对冲逻辑

从Aramco的角度看,这笔投资还有一层”对冲”含义。如果AI确实成为”新石油”,那么石油需求的长期下降(随着能源转型推进)可以部分被算力需求的增长所对冲。投资Together AI,本质上是Aramco在对冲自己核心业务的长期风险——用石油时代的利润,购买算力时代的入场券。

以83亿美元估值计算,Aramco在这一轮中可能获得了约5-10%的股份(取决于其具体出资金额和其他投资者的参与比例)。对于一家年利润超过1000亿美元的公司而言,这是一笔可以承受的”期权”式投资——下行有限,上行可观。


第五章:算力中间商的终局——Neocloud是过渡态还是长期生态位?

看多派的论点

看多neocloud的逻辑链条是清晰的:

  1. AI计算需求的增长速度远超大厂云的GPU供给扩张速度。据NVIDIA CEO黄仁勋在2025年GTC大会上的表述,全球数据中心的AI计算能力需要在未来5年增长100倍。
  2. 大厂云的通用化架构在服务AI工作负载时存在效率损失——网络拓扑、调度系统、定价模型都不是为纯GPU工作负载优化的。
  3. 开源模型的崛起使得越来越多的企业不再需要大厂的闭源AI服务,只需要算力。Meta的Llama 3.1 405B在多个基准测试上已经接近GPT-4级别,而且完全免费。
  4. Gartner预测neocloud到2030年占据20%的AI云市场,这是一个被机构认可的长期趋势。(来源: Gartner, 2026-06-23)

在这个逻辑下,Together AI的83亿美元估值是合理的——它正处于一个534亿美元(2030年)潜在市场的早期阶段,且拥有差异化的”平台+基础设施”定位。

看空派的论点

但另一面的论点同样有力:

大厂反击的必然性:AWS、Azure、GCP不会坐视neocloud蚕食自己的市场。它们已经在行动——AWS推出了Trainium2芯片和UltraCluster专用AI集群服务,Azure与OpenAI深度绑定提供一体化AI解决方案,GCP通过TPU v5e/v5p提供差异化的AI算力。当大厂开始针对性地优化AI工作负载的定价和服务时,neocloud的成本优势可能被压缩。AWS在2025年已经推出了针对AI训练的专用实例定价方案,价格比标准按需实例低40%——这直接瞄准了neocloud的核心卖点。

GPU供给瓶颈的缓解:Neocloud的崛起很大程度上得益于2023-2025年间GPU的严重短缺。随着NVIDIA产能的扩张(台积电CoWoS封装产能在2025年翻倍)、AMD MI300X/MI350系列的成熟、以及各种定制芯片(Google TPU v6、Amazon Trainium2、Microsoft Maia 100)的量产,GPU供给的紧张程度正在缓解。当GPU不再稀缺时,neocloud的”有货就是竞争力”的逻辑就会弱化。

资本密集型的死亡螺旋风险:Neocloud本质上是一个重资产生意——你需要不断投入资金购买最新一代GPU,否则就会被淘汰。每一代GPU的生命周期只有2-3年,折旧压力巨大。以H100为例,其2023年的市场价约4万美元,到2025年二手市场价格已跌至约1.5万美元。如果收入增长不及预期,neocloud可能陷入”借钱买GPU→GPU贬值→再借更多钱买新GPU”的恶性循环。CoreWeave的IPO招股书显示其负债率极高,这正是这种模式的体现。

客户集中度风险:Neocloud公司的客户往往高度集中。CoreWeave的前两大客户贡献了超过60%的收入,如果Together AI有类似的客户结构,那么任何一个大客户的流失都可能对收入造成重大冲击。

我的判断:Neocloud是一个”窗口期生态位”,但Together AI有机会超越它

我的核心判断是:纯粹的GPU租用neocloud(如早期的CoreWeave模式)确实面临被大厂挤压的风险,但Together AI的”平台+开源生态”模式有可能建立起更持久的护城河。关键在于它能否在窗口期内完成从”基础设施公司”到”平台公司”的转型。

原因如下:

第一,算力是商品,但软件不是。 GPU的价格最终会趋于透明和标准化,但围绕开源模型的推理优化、微调工具、评估框架等软件资产具有累积性和网络效应。Together AI越多客户使用其平台,其推理引擎的优化数据就越丰富,服务质量就越好——这是一个正反馈循环。这类似于Snowflake在数据仓库领域的逻辑:底层存储是商品化的,但上层的查询优化和数据治理工具构成了真正的壁垒。

第二,开源模型的崛起是不可逆的趋势。 Meta的Llama系列、Mistral、DeepSeek等开源模型的能力已经逼近甚至在某些任务上超越闭源模型。企业选择开源模型的动机(成本、可控性、定制化、避免供应商锁定)只会越来越强。Together AI作为开源模型生态的核心基础设施提供者,其价值随着开源生态的壮大而增长——这是一个比GPU库存更持久的结构性优势。

第三,但83亿美元的估值需要Together AI在未来2-3年内实现收入的大幅增长。 如果其年化收入能在2027年达到10亿美元以上(对应约8倍收入倍数),这个估值就是合理的;如果增长放缓至5亿美元以下,市场将重新定价,可能出现类似2022年SaaS公司估值回调的情况。

大厂反击的可能路径

大厂最可能的反击路径不是直接降价(这会伤害自己的利润率),而是通过”捆绑销售”和”生态锁定”:

  • Azure策略:通过与OpenAI的独家合作,将最强的闭源模型与Azure基础设施绑定,使得企业在选择AI服务时自然倾向于Azure。同时通过Azure AI Foundry整合开源模型部署,让企业觉得”在Azure上用开源模型也很方便”。
  • AWS策略:通过Bedrock平台整合多种模型(包括开源模型),同时用Trainium2芯片提供差异化的性价比(据AWS宣称,Trainium2的性价比是同等NVIDIA GPU的2倍),让企业在AWS生态内就能满足所有AI需求。
  • GCP策略:通过TPU的独特架构优势和Gemini模型的整合,提供端到端的AI开发体验,同时利用Google在AI研究领域的品牌优势吸引技术导向的客户。

对Together AI而言,最大的威胁不是大厂的价格战,而是大厂将开源模型的部署和推理做得”足够好”——好到企业不再需要一个专门的neocloud平台。如果AWS Bedrock上的Llama推理成本和延迟与Together AI相当,且企业已经在AWS上有大量其他工作负载,那么选择Together AI的理由就会大幅减弱。

Together AI的下一步挑战

Together AI在拿到8亿美元后,面临的核心挑战包括:

规模扩张的执行力:8亿美元需要迅速转化为GPU集群的扩张,但在当前NVIDIA GPU的交付周期和定价环境下,资金效率至关重要。过快扩张可能导致GPU利用率不足(每块闲置的B200每天的折旧成本约为30-40美元),过慢则可能错失市场窗口。

从推理到训练的能力跃升:Together AI目前在推理服务上有明确的差异化,但在大规模训练服务上,其集群规模相比CoreWeave仍有差距。要服务那些需要训练千亿参数模型的头部客户,Together AI需要证明其在万卡级别集群上的稳定性和效率。这不仅是硬件问题,更是分布式系统工程的挑战——万卡集群的故障率、通信效率、检查点管理都需要深厚的工程积累。

国际化扩张的复杂性:Aramco的投资暗示中东市场将是重要方向,但在中东建设和运营GPU数据中心面临独特挑战——电力基础设施的可靠性、冷却系统(沙漠环境下的散热成本可能比温带地区高30-50%)、技术人才招聘(需要从全球吸引工程师到利雅得或迪拜)、以及数据合规要求(沙特的数据本地化法规)都需要针对性解决。

开源模型生态的不确定性:Together AI的价值很大程度上绑定在开源模型的持续繁荣上。如果未来开源模型的发展速度放缓(例如Meta缩减Llama的投入),或者闭源模型(如GPT系列、Claude系列、Gemini)重新拉开显著的能力差距,Together AI的”开源AI平台”定位的吸引力就会下降。不过从当前趋势看,这个风险在短期内较低——Meta已经明确将开源作为长期战略,而Mistral、DeepSeek等独立玩家也在持续推动开源模型的前沿。


第六章:更广视角——Neocloud在全球AI算力格局中的位置

与全球AI资本开支的比较

要理解neocloud的相对规模,需要将其放在全球AI资本开支的大背景下。据各大科技公司2025年财报披露:

  • Microsoft 2025财年资本开支约800亿美元,其中大部分用于AI数据中心
  • Google 2025年资本开支约750亿美元
  • Amazon 2025年资本开支约1000亿美元
  • Meta 2025年资本开支约400亿美元

仅这四家公司的AI相关资本开支就接近3000亿美元/年。相比之下,整个neocloud行业250亿美元的年收入,仅相当于大厂资本开支的不到10%。这个比例说明:neocloud虽然增长迅速,但在绝对规模上仍然是大厂的”零头”。

然而,这也恰恰是neocloud的机会所在:大厂的资本开支主要服务于自身的AI产品(如Microsoft的Copilot、Google的Gemini应用、Meta的AI助手),真正面向外部客户的GPU算力供给仍然不足。Neocloud填补的正是这个”大厂自用优先、外部客户排队”的缺口。

中国市场的对照

值得注意的是,中国市场也出现了类似的neocloud趋势,但路径不同。由于美国对华AI芯片出口管制,中国的neocloud更多围绕国产GPU(如华为昇腾、寒武纪等)和国产大模型(如百度文心、阿里通义、智谱等)构建。这种”平行宇宙”的格局意味着:全球neocloud市场实际上被分割为两个相对独立的生态系统,Together AI的可触达市场主要在非中国地区。

这也解释了为什么中东资本对Together AI特别感兴趣——中东国家在中美之间寻求平衡,而Together AI的开源模型定位提供了一种不完全依赖任何一方的技术路径。


结语:So What——对从业者和投资者意味着什么

Together AI的83亿美元估值和Aramco的领投,传递了几个关键信号:

对AI创业者:Neocloud赛道已经过了”有GPU就能赚钱”的初级阶段。未来的竞争将在软件层展开——谁能围绕算力构建最深的开发者体验和客户粘性,谁就能在大厂反击时存活下来。纯粹的”GPU二道贩子”模式正在走向终结。如果你正在创建一家AI基础设施公司,你的护城河不能只是”我有GPU”,而必须是”我的软件让GPU的价值翻倍”。

对企业CTO:多云策略正在从”AWS+Azure+GCP”扩展为”大厂云+neocloud”。对于AI密集型工作负载,将neocloud纳入采购选项不再是冒险行为——Gartner的背书和数十亿美元的融资规模已经让这个选择变得”安全”。但要注意三点:一是评估neocloud供应商的财务可持续性,避免选择那些可能在下一轮GPU升级周期中资金断裂的小型玩家;二是确保你的AI工作负载具有足够的可移植性,不要从大厂锁定跳入neocloud锁定;三是对于推理工作负载,Together AI这类平台型neocloud可能比纯IaaS型neocloud提供更好的性价比。

对投资者:Neocloud赛道的估值已经不便宜。83亿美元的Together AI、超过200亿美元市值的CoreWeave——这些数字反映的是市场对AI基础设施长期增长的乐观预期。但投资者需要区分两种neocloud:一种是有软件护城河的平台型公司(如Together AI),另一种是纯靠资本开支堆砌GPU的基础设施公司。前者在行业下行周期中有更好的韧性,因为软件收入的边际成本接近零,而后者在GPU价格下跌时面临资产减值风险。此外,关注客户集中度——如果一家neocloud超过50%的收入来自前3大客户,其估值应该打折。

对大厂云:Neocloud不会消失,但它的份额有天花板。Gartner给出的20%是一个合理的上限预测。大厂的正确策略不是打价格战消灭neocloud(这会伤害自己的利润率),而是确保自己在剩余80%的市场中提供足够的AI能力,同时通过生态锁定(模型绑定、数据引力、合规认证)防止大客户的AI工作负载大规模迁移。更聪明的策略可能是:与neocloud建立合作关系而非对抗关系——例如允许neocloud在大厂的边缘节点上运行,或者将neocloud作为overflow capacity的补充。

最后一个洞察:Together AI的成功本质上是开源AI运动的商业化胜利。当企业可以免费获得接近前沿水平的开源模型时,它们需要的不再是模型本身,而是运行这些模型的最佳基础设施。Together AI精准地占据了这个”开源模型的商业化基础设施层”——这可能是AI时代最具结构性的商业机会之一。但这个机会的持久性取决于一个前提:开源模型必须持续保持与闭源模型的竞争力。如果这个前提成立,Together AI的护城河将随时间加深;如果不成立,83亿美元的估值将面临严峻考验。

8亿美元的弹药已经上膛。接下来的18个月,将决定Together AI是成为AI基础设施领域的Snowflake(平台型赢家),还是成为又一个在大厂阴影下逐渐边缘化的挑战者。而对于整个neocloud赛道而言,2026-2028年将是决定性的窗口期——GPU供给瓶颈的缓解速度、开源模型的进化速度、大厂反击的力度,这三个变量的交汇将最终定义这个赛道的终局形态。


参考资料

  1. Neocloud Together AI raises $800M, leaps to $8.3B valuation — TechCrunch, 2026-07-01

  2. Together AI Raises $800 Million at $8.3 Billion Valuation to Make Frontier AI Accessible to All — BusinessWire, 2026-07-01

  3. Gartner Predicts Neocloud Providers Will Capture 20% of the $267 Billion AI Cloud Market by 2030 — Gartner, 2026-06-23

  4. Neocloud revenue exceeds $25bn in 2025 — Data Center Dynamics, 2025

  5. CoreWeave IPO: AI Cloud Company Prices Shares at $40 — Reuters, 2025-03-27

  6. NVIDIA GTC 2025: Jensen Huang Keynote on AI Infrastructure Scaling — NVIDIA Newsroom, 2025-03-17

  7. Neocloud Market Size, Share & Growth Trends Report — Mordor Intelligence, 2025

主题分类:AI基础设施 / 云计算 / 风险投资 / 地缘政治与技术