被180个VC拒绝的语音AI公司，正在赢得企业市场最难的战场

2023年，Isaiah Granet在Y Combinator参加融资路演。3周时间，他见了180个投资人，得到了180次拒绝。

拒绝的理由高度一致：语音通话这个市场要消失了，所有人都在用文字和应用，谁还会打电话？投资人们用的逻辑有据可查——Z世代越来越不喜欢打电话，企业客服正在转向聊天机器人和自助服务，语音通话量在全球范围内整体下滑。

Granet没有能够反驳这个逻辑。他只是认为这些投资人看错了方向。

2026年6月16日，Granet与联合创始人Sobhan Nejad创立的语音AI公司Bland宣布完成5000万美元C轮融资。领投方是Dell Technologies Capital，HubSpot Ventures、Archerman、Tribeca跟投。ElevenLabs CTO Piotr Dąbkowski、Twilio创始人Jeff Lawson、Affirm联合创始人Max Levchin以及Emergence Capital、Upfront Ventures、Scale Venture Partners继续参与。这是Bland成立3年来累计获得的第三轮机构融资，总融资额突破1亿美元。

电话没有消失。Bland每周处理超过350万通电话，去年全年处理了1.75亿通AI电话，累计服务超过250家企业客户，包括物联网平台Samsara、保险科技公司Kin Insurance和金融服务集团CNO Financial Group。

这家公司从被180个投资人否定，走到今天这个规模，背后是一个核心选择：在AI工具普遍走向同质化的时代，它选择了最难、最慢、但护城河最深的路——完全自研语音模型，专注30到45分钟的企业长电话场景。

这个选择，现在看起来是对的。

AI工具同质化时代的一个结构性问题

要理解Bland为何值得认真研究，需要先了解当前语音AI市场的主流做法是什么。

今天大多数语音AI工具的商业模式，本质上是”大模型封装”：接入OpenAI的语音API、Anthropic的对话能力或Google的语音识别服务，在这些基础能力上构建一层应用，提供预约提醒、基础路由、密码重置等短脚本任务。这个模式开发快、成本低、原型效果好，是目前市场上绝大多数语音AI公司选择的路径。

但它有一个根本问题：当所有人都接了同样的底层模型，当OpenAI发布了更好的语音API，当Anthropic推出了更强的对话能力，这些差异化瞬间消失。一个基于第三方API构建的语音AI公司，本质上是在转售别人的能力，没有技术护城河，没有议价能力，面对的是越来越激烈的价格战。

a16z在2025年的语音AI行业报告中记录了这个现象：进入语音AI赛道的创业公司数量在2024-2025年急剧增加，但大多数公司的核心技术差异点几乎为零。竞争的主要维度集中在价格、集成便利度和销售团队的执行力，而不是技术本身。

这是AI工具同质化的典型表现。它不只是语音AI面临的问题，而是整个AI应用层的结构性困境：当底层模型能力被少数大公司主导且日益开放，基于这些能力构建的应用层公司，如何建立不依赖”谁先集成了最新模型”的持久竞争优势？

Bland的答案是：不集成任何外部模型，自己做模型，自己承担所有技术责任。

为什么自研是这个赛道的正确选择

Bland的自研选择，不是技术自大，而是来自对具体问题的深刻认识。

语音AI面临的核心挑战，远比文字AI复杂。在真实通话场景中，AI系统需要同时处理多个维度的复杂性：背景噪音（医院走廊的广播声、呼叫中心的嘈杂环境、老年用户家中的电视声）；多种口音和方言（保险客服需要服务来自不同地区、不同背景的用户）；情绪波动（患者焦虑、用户愤怒、家属悲伤）；突然的话题转换（从询问账单到突然提到家里的紧急情况）；网络延迟和信号中断；以及最难处理的——30分钟以上的长程上下文保持，在整个通话过程中始终记住5分钟前说过的信息，并在后续回应中保持一致性。

用通用大模型套一层语音接口，可以处理简单的5分钟脚本化通话。但在30到45分钟的真实企业通话中，这种方案的可靠性会快速下降。这不是理论推测，是真实使用场景中可以观察到的系统性限制。

Bland最核心的产品指标是单次通话平均时长30到45分钟。在医疗场景，这个数字有时更长——帮助老年患者读取血压数据、排查设备错误、与医疗系统对接，在实时判断后决定是否需要转接急救服务。整个过程可能涉及20到30个不同的信息交换节点，需要AI在每个节点都做出准确的判断和响应，同时始终保持对整体任务目标的把握。

这种时长和复杂度的真实通话，需要专门为长电话场景构建和优化的模型——训练数据的分布、推理方式的优化、上下文管理的机制，都需要针对这个具体场景进行深度定制，而不是用一个通用模型做一层适配。

Dell Technologies Capital合伙人Elana Lian领投了这轮融资，她将语音定义为”AI最难的问题之一”，并明确将Bland的模型自研能力视为核心差异化要素。这个判断来自对技术难度的清醒认识，不是营销话术。

公司起源：一个无法回避的真实问题

Bland的产品方向，来自一个具体的、不可回避的个人经历。

Nejad的阿姨无法联系上保险公司，被拒绝了医疗治疗。她需要的不是更好的手机应用，不是更清晰的网页界面，而是一个真正能在电话里坚持到问题被解决的声音——不会被转接之后就断线，不会因为占线而放弃，不会在听了3分钟电话菜单之后进入死循环，而是能够理解她的情况、记住对话中出现的所有信息，并持续推进直到实际解决问题为止。

这个场景在美国医疗系统中极为普遍。医疗机构的运营依赖大量电话通信：预约确认、保险核实、处方续开、随访追踪、紧急情况评估。这些任务过去需要大量的人工坐席，成本高、效率低、出错率高，且对患者而言体验极差。自助服务系统（语音菜单、在线门户）可以处理最简单的情况，但一旦情况变得稍微复杂，用户就必须等待真人介入，而这意味着漫长的等待时间。

Bland的核心产品假设是：如果AI语音代理能够真正可靠地处理这类30到45分钟的复杂通话，它可以从根本上改变医疗、保险、金融等高监管行业的运营模式，而不只是在边缘上做一些简化工作。

这个产品假设，在2023年被180个投资人评估为”太难实现”。在2026年，它被350万通/周的实际处理量所证明。

竞争格局：进入一个正在变得拥挤的战场

成功从来不会长久属于一家公司。Bland现在面对的竞争格局，比被180个投资人拒绝时要复杂得多。

PolyAI是最值得关注的直接竞争对手。这家剑桥大学衍生公司服务FedEx、万豪酒店和凯撒娱乐，2025年12月在7.5亿美元估值下完成了8600万美元融资。与Bland一样，PolyAI也专注于企业级电话场景，主张为特定行业深度定制语音解决方案，而不是通用的语音API封装。

其他竞争者包括Replicant（专注保险和金融客服自动化）、Observe.ai（语音分析和质量监控）、Retell AI（更偏向开发者工具的API平台）和Cognigy（深度集成企业软件系统的对话式AI）。这些公司各有侧重，但都在争夺同一批企业预算：那些正在寻找人工坐席替代方案的大型机构。

Granet对竞争格局的判断非常直白：”当你仔细看大多数谈论语音AI的公司，他们没有连贯的产品，大规模处理的通话数量非常有限。他们做的通话通常很短，是转接电话。”（Fortune，2026年6月16日）

这个评价指向了Bland的竞争策略的核心：不是做更多数量的短通话，而是做其他人做不了的长通话。在竞争对手大量进入”简单脚本化通话”市场的同时，Bland持续深挖”复杂长通话”这个对技术要求最高、进入门槛最高的细分。

但Bland也面临一个不可忽视的市场现实。Granet坦承：”人们低估了目前市场上对AI有多大的抵触情绪。”他描述了与纽约大型呼叫中心的会面，这些公司在某些情况下更担心的不是技术是否成熟，而是变革管理和员工关系——工会合同、员工安置、内部反弹。这个市场阻力，在高监管的医疗和金融场景尤为明显，也恰恰是Bland深度布局的领域。技术层面的成功，不自动等同于商业层面的大规模落地。

市场规模：这个战场究竟值多少钱

Bland选择的战场究竟有多大？这个问题有多个角度的答案。

从呼叫中心AI市场的传统定义看，根据EzyCalls的市场研究，该市场目前规模约30亿美元，预计2034年达到135亿美元。在这个框架下，Bland是一个快速成长的赛道参与者，但市场规模本身尚未巨大。

Granet使用了一个更大的参照系：Twilio、Genesys、8×8、NICE inContact等纯电话基础设施公司，每年合计营收约120亿到150亿美元（Granet的估算为150亿美元，经媒体核实实际数字约为120亿美元）。这些公司提供的是”电话基础设施”——企业打电话的管道和接口，本质上是商品化服务。

Bland的赌注是：当AI语音代理达到足够的可靠性和复杂度，它可以系统性地替代这个基础设施中最昂贵的部分——人工坐席。这个替代不是”一部分任务转移到AI”，而是”整个工作流在AI层面重构”。如果这个重构成功，可以触及的市场价值，远超当前”呼叫中心AI”分类所涵盖的范围。

“这个空间将支撑多个市值数百亿美元的赢家。”Granet告诉Fortune。这个判断的前提是：AI语音技术的可靠性将继续提升，高监管行业的采购决策将在未来几年加速，而能够在这个窗口建立深度市场壁垒的公司，将获得不成比例的市场回报。

C轮融资的资金用途——扩大研究、增加工程团队、进入更多监管行业——是对这个时间窗口的主动把握：在通用大模型公司开始针对企业电话场景提供更专项服务之前，加速在高监管行业建立足够深的运营壁垒和客户信任，让切换成本高到后来者难以轻易替代。

Dell Technologies Capital和HubSpot Ventures的加入，值得特别关注。Dell的企业客户网络覆盖全球数万家大型机构，HubSpot的CRM平台服务数十万家中小企业。这两家机构的参与，不只是财务投资，更是市场渠道的战略布局——它们为Bland进入企业采购清单，提供了直接的推荐路径。

自研路径的深层逻辑：合规信任不可外包

Bland的自研语音模型策略，在高监管行业的实际落地中有一个通常被忽视的维度：合规审计能力。

在医疗、金融和保险行业，任何涉及客户服务的AI系统，都必须满足严格的合规要求。医疗场景需要HIPAA合规（美国健康保险可携带性与责任法案），金融场景需要满足FINRA或SEC的客户沟通录制和保留要求，保险场景需要遵循各州的消费者保护法规。这些要求的共同点是：系统必须能够提供完整的、可审计的决策记录——在电话的每个关键节点，AI做出了什么判断，依据是什么，是否在规定范围内。

当一个语音AI系统的核心模型来自OpenAI或Anthropic时，这个审计能力是有根本限制的。第三方模型的内部决策逻辑对使用方是黑箱，无法在监管要求的精度上提供完整的决策溯源。当监管机构要求解释”为什么AI在某个特定节点做出了某个决定”，基于外部API的系统无法给出满足合规要求的答案。

Bland的自研路径，让它可以对系统中的每个决策节点提供完整的内部审计路径——不只是”对话记录”，而是包括模型状态、置信度、判断依据在内的完整决策链条。这个能力，是Bland向高合规要求的医疗和金融机构销售时，比任何性能基准测试都更有说服力的竞争优势。

这也解释了为什么Dell Technologies Capital和HubSpot Ventures这样的企业机构型投资者，对Bland的自研路径尤为看好——他们的企业客户网络里，最大的采购需求恰恰来自对合规审计有最高要求的行业。

被拒绝180次之后：反共识投资的结构性逻辑

从投资角度看，Bland在2023年被拒绝的经历提供了一个值得深度分析的案例。

180个投资人用了相同的框架否定了同一个机会。这个现象本身有一个结构性原因：早期风险投资的决策，高度依赖”市场趋势是否支持”的判断框架。当所有可观察到的数据都指向”语音通话量在下降”时，否定一个语音AI投资是理性的、一致的判断。

但这个框架有一个盲点：它混淆了”消费级语音通话的下降”和”企业高价值语音通话的消失”。消费级语音通话（闲聊、简单查询、家庭联络）确实在向消息应用迁移。但企业级的高价值语音通话——需要持续沟通、实时判断、复杂信息交换的医疗、保险、金融服务电话——并没有一个可以替代它的渠道。你无法用消息应用完成一次血压读数核实和后续医疗建议的对话，这个过程需要实时的、双向的、持续的人声交流。

180个投资人看到了第一类数据，错过了第二类机会。这不是他们的判断失误，而是使用了与机会本身不完全匹配的分析框架——这是早期投资中最常见也最难避免的错误类型。

Bland的案例提供给创业者的最重要洞察是：如果你的机会正在被主流框架系统性低估，你需要的不只是”坚持下去”的决心，更需要能够清晰说明”为什么主流框架在这个具体情况下失效”的分析能力。Granet在被拒绝之初可能做不到这一点，但3年的产品开发和市场验证，让他现在能够用数字说话：350万通/周，1.75亿通/年，250+企业客户。数字是最好的框架修正工具。

高监管行业AI落地的系统性机会

Bland的选择，指向了一个比语音AI更大的结构性机会：高监管行业的AI落地，是整个AI产业中速度最慢、难度最高，但同时价值密度最高的市场。

医疗、金融、保险、法律这些行业的共同特征是：错误的成本极高（可能影响患者健康、触犯合规法规、产生法律责任）；流程被严格规范（大量的监管要求和审计标准）；人力成本极高（高技能员工处理大量重复性但不可省略的任务）；AI替代的政治阻力较大（监管机构、从业者组织、消费者保护团体的持续关注）。

这些特征共同决定了：AI工具在高监管行业的落地，不是一个”插上API就能用”的过程，而是一个需要在技术可靠性、合规审计能力、组织变革管理和监管关系维护多个维度同时投入的长期工程。

这正是大多数AI工具公司不愿意进入的原因，也是Bland选择专注这里的战略逻辑——在一个准入门槛足够高的市场里，先发者的优势更难被后来者侵蚀。

整个呼叫中心AI市场预计从目前的30亿美元增长到2034年的135亿美元，但这个数字捕捉的只是”呼叫中心软件”的市场。如果算上AI语音代理所能替代的人力成本——仅美国一国的呼叫中心行业每年雇佣约300万名工人，平均薪资约3.5万美元，总人力成本超过1000亿美元——潜在的市场规模要大得多。当然，替代率不会是100%，但即便是20%的替代，也是一个200亿美元级别的商业机会。

另一面的声音：这是否一个可持续的赌注？

公平起见，必须呈现对Bland自研路径的核心质疑。

大型模型公司在通用大模型能力上的投入，已经超过了任何垂直公司能够单独匹敌的规模。OpenAI、Anthropic、Google、Meta每年在基础模型研究上的投入，合计数百亿美元。随着这些通用模型在语音理解、情感感知、长上下文处理等方面持续提升，Bland的自研语音模型相对于”接入最新通用API的竞争者”，还能保持多大的性能差距？

这是一个没有简单答案的合理问题。

Bland的反驳是：性能的绝对值不是差异化的核心来源，在特定工作场景下的可靠性、可控性和可审计性才是。一个在30分钟医疗电话中能够稳定运行、合规审计记录清晰的系统，远比一个在前5分钟表现出色但在复杂场景下行为不可预测的系统更有实际价值。高监管行业的采购决策者，在评估AI供应商时，不会把”通用基准测试排名”作为主要评判标准——他们需要的是”在我们的具体工作场景中可靠运行，出问题时可以审计，出事了谁负责”的承诺。这是Bland可以给出的承诺，而依赖第三方模型的竞争者无法做到相同的程度。

但这个反驳有一个时间维度的脆弱性：如果大型模型公司开始针对企业电话场景提供专项的高可靠性服务，并且愿意为合规需求提供定制化的审计能力，Bland的护城河可能在未来3到5年内被系统性压缩。这是一个真实的风险，Bland的应对是加速在高监管行业建立足够深的客户信任和切换成本，在这个竞争加剧之前完成市场壁垒的构建。

C轮融资的5000万美元，用于扩大研究、增加工程团队、进入更多监管行业，正是这个时间赛跑的具体表达。

从工具到系统：语音AI的下一个演化方向

Bland的成长轨迹，也指向了企业AI落地的一个更大趋势：AI工具正在从”功能替代”向”流程重构”演化。

在AI落地的早期阶段，大多数企业关注的是”用AI替代某个具体的重复性任务”——用AI生成营销文案、用AI自动回复简单客服问题、用AI提取文档关键信息。这个阶段的AI工具，本质上是”效率提升工具”，它在现有流程的边缘做减法，而不改变流程本身。

Bland代表的是第二个阶段：流程重构。当一个AI语音代理能够真正可靠地完成30到45分钟的复杂通话，它不只是”替代了某个步骤”，而是让一种全新的服务模式成为可能——24小时无等待时间的医疗随访、实时保险核实、个性化金融服务的大规模交付。这些服务模式在人力限制下是不可能实现的，AI让它们成为可能。

这个演化，对企业的影响超出了”降低成本”的范畴，进入了”创造新的服务能力”的区间。医疗机构可以对所有出院患者提供24小时后续随访（过去只有高风险患者才能得到这个资源）；保险公司可以在理赔过程中提供更密集的用户指导（过去因为人力成本无法规模化）；金融顾问可以服务更多长尾客户（过去的客户门槛限制了服务范围）。

在这个框架下，Bland的定位不只是”AI电话软件”，而是”企业服务能力扩展的基础设施”。这个重新定位，改变了它在企业采购决策中的分类——它不再只是与其他语音AI工具比较，而是在与”增加人力坐席”或”限制服务范围”的现有选择对比。

这个定位的商业意义，在于定价权的转移：当一个工具从”替代现有流程”变成”实现此前不可能的服务”，它可以参与分享它所创造的新价值，而不只是以”节省成本”为理由要求一个折让价格。这是从工具溢价到系统溢价的跨越，也是Bland在未来几年商业化的关键逻辑。

语音数据的战略价值：一个通常被低估的资产

Bland自研路径的另一个通常被低估的战略价值，是数据积累。

每年1.75亿通电话，不只是商业规模的体现，更是一个巨大的语音AI专项训练数据资产。这些数据涵盖了真实企业场景中最复杂的语音交互：带有情绪的沟通、领域专业词汇的正确处理、方言和口音的识别、长时段上下文的保持。这类数据，是通用大模型训练数据集中极为稀缺的部分——公开互联网上几乎没有大量高质量的、带有专业标注的企业级长电话语音数据。

因此，Bland通过日常运营积累的数据飞轮，为其自研模型的持续改进提供了一个强大的、竞争对手难以复制的来源：越多企业使用Bland，Bland积累的专项训练数据越多；数据越多，自研模型在企业场景的性能越好；性能越好，越多企业选择Bland。这是一个典型的数据飞轮正向循环。

这个飞轮，对于那些依赖第三方API的竞争对手来说，是无法仅凭模型性能提升来超越的。即便OpenAI或Anthropic发布了更强大的语音API，它们在特定企业行业场景下的专项优化，仍然无法匹配一个在这个场景中积累了1.75亿通真实通话训练数据的专项模型。

这是Bland的自研选择在数据层面的长期价值——它不只是今天的差异化，更是未来竞争格局演变中的持久护城河。

结语：反共识，或许是AI创业时代最被低估的护城河

从被180个投资人拒绝，到完成超过1亿美元融资，Bland的故事容易被讲成一个关于”坚持”的励志叙事。但它更深层的含义，是关于在高度同质化的AI工具市场里，如何通过选择最难的路建立真正的竞争优势。

当AI工具的底层能力越来越被少数大公司垄断，当所有人都在用同样的API构建同样的功能，差异化只能来自两个方向：更深（深度专有化，自研关键能力，在特定场景建立无法被快速复制的系统性积累）或更宽（网络效应，平台化，建立不依赖单一技术能力的生态优势）。Bland选择了前者，在一个具体的、艰难的场景下做到了真正的深度。

被180个投资人拒绝，不是因为这180个人都判断失误，而是因为他们用了与机会本身不完全匹配的分析框架。这个框架的盲点，在Bland的真实数字面前，已经逐渐变得清晰。

350万通/周，1.75亿通/年，250+企业客户，5000万美元C轮。电话没有消失——真正消失的，是那个认为电话会消失的主流共识。

参考资料

Fortune（独家）— Voice AI startup Bland raises $50 million after being rejected by 180 investors, Isaiah Granet采访, 2026年6月16日. https://fortune.com/2026/06/16/voice-ai-bland-50-million-after-being-rejected-by-180-investors/
Bland AI官方博客 — Bland Raises a $40M Series B to Transform Enterprise Phone Communications, 2025年1月. https://www.bland.ai/blog/bland-raises-a-40m-series-b
Andreessen Horowitz — Voice AI agents 2025 update, 2025年6月. https://a16z.com/ai-voice-agents-2025-update/
Forbes — PolyAI Raises $86 Million As Fight To Answer Calls With AI Heats Up, 2025年12月15日. https://www.forbes.com/sites/iainmartin/2025/12/15/polyai-raises-86-million-as-fight-to-answer-calls-with-ai-heats-up/
EzyCalls — Call Center AI Market Research, 呼叫中心AI市场规模预测（$3B→$13.5B, 2024-2034）. https://ezycalls.com/call-center-ai-market/
Emergence Capital — AI that speaks volumes: Why we’re backing Bland, 2025年1月. https://www.emcap.com/thoughts/ai-that-speaks-volumes-why-were-backing-bland