被180个VC拒绝的语音AI公司,正在赢得企业市场最难的战场
2023年,Isaiah Granet在Y Combinator参加融资路演。3周时间,他见了180个投资人,得到了180次拒绝。
拒绝的理由高度一致:语音通话这个市场要消失了,所有人都在用文字和应用,谁还会打电话?投资人们用的逻辑有据可查——Z世代越来越不喜欢打电话,企业客服正在转向聊天机器人和自助服务,语音通话量在全球范围内整体下滑。
Granet没有能够反驳这个逻辑。他只是认为这些投资人看错了方向。
2026年6月16日,Granet与联合创始人Sobhan Nejad创立的语音AI公司Bland宣布完成5000万美元C轮融资。领投方是Dell Technologies Capital,HubSpot Ventures、Archerman、Tribeca跟投。ElevenLabs CTO Piotr Dąbkowski、Twilio创始人Jeff Lawson、Affirm联合创始人Max Levchin以及Emergence Capital、Upfront Ventures、Scale Venture Partners继续参与。这是Bland成立3年来累计获得的第三轮机构融资,总融资额突破1亿美元。
电话没有消失。Bland每周处理超过350万通电话,去年全年处理了1.75亿通AI电话,累计服务超过250家企业客户,包括物联网平台Samsara、保险科技公司Kin Insurance和金融服务集团CNO Financial Group。
这家公司从被180个投资人否定,走到今天这个规模,背后是一个核心选择:在AI工具普遍走向同质化的时代,它选择了最难、最慢、但护城河最深的路——完全自研语音模型,专注30到45分钟的企业长电话场景。
这个选择,现在看起来是对的。
AI工具同质化时代的一个结构性问题
要理解Bland为何值得认真研究,需要先了解当前语音AI市场的主流做法是什么。
今天大多数语音AI工具的商业模式,本质上是”大模型封装”:接入OpenAI的语音API、Anthropic的对话能力或Google的语音识别服务,在这些基础能力上构建一层应用,提供预约提醒、基础路由、密码重置等短脚本任务。这个模式开发快、成本低、原型效果好,是目前市场上绝大多数语音AI公司选择的路径。
但它有一个根本问题:当所有人都接了同样的底层模型,当OpenAI发布了更好的语音API,当Anthropic推出了更强的对话能力,这些差异化瞬间消失。一个基于第三方API构建的语音AI公司,本质上是在转售别人的能力,没有技术护城河,没有议价能力,面对的是越来越激烈的价格战。
a16z在2025年的语音AI行业报告中记录了这个现象:进入语音AI赛道的创业公司数量在2024-2025年急剧增加,但大多数公司的核心技术差异点几乎为零。竞争的主要维度集中在价格、集成便利度和销售团队的执行力,而不是技术本身。
这是AI工具同质化的典型表现。它不只是语音AI面临的问题,而是整个AI应用层的结构性困境:当底层模型能力被少数大公司主导且日益开放,基于这些能力构建的应用层公司,如何建立不依赖”谁先集成了最新模型”的持久竞争优势?
Bland的答案是:不集成任何外部模型,自己做模型,自己承担所有技术责任。
为什么自研是这个赛道的正确选择
Bland的自研选择,不是技术自大,而是来自对具体问题的深刻认识。
语音AI面临的核心挑战,远比文字AI复杂。在真实通话场景中,AI系统需要同时处理多个维度的复杂性:背景噪音(医院走廊的广播声、呼叫中心的嘈杂环境、老年用户家中的电视声);多种口音和方言(保险客服需要服务来自不同地区、不同背景的用户);情绪波动(患者焦虑、用户愤怒、家属悲伤);突然的话题转换(从询问账单到突然提到家里的紧急情况);网络延迟和信号中断;以及最难处理的——30分钟以上的长程上下文保持,在整个通话过程中始终记住5分钟前说过的信息,并在后续回应中保持一致性。
用通用大模型套一层语音接口,可以处理简单的5分钟脚本化通话。但在30到45分钟的真实企业通话中,这种方案的可靠性会快速下降。这不是理论推测,是真实使用场景中可以观察到的系统性限制。
Bland最核心的产品指标是单次通话平均时长30到45分钟。在医疗场景,这个数字有时更长——帮助老年患者读取血压数据、排查设备错误、与医疗系统对接,在实时判断后决定是否需要转接急救服务。整个过程可能涉及20到30个不同的信息交换节点,需要AI在每个节点都做出准确的判断和响应,同时始终保持对整体任务目标的把握。
这种时长和复杂度的真实通话,需要专门为长电话场景构建和优化的模型——训练数据的分布、推理方式的优化、上下文管理的机制,都需要针对这个具体场景进行深度定制,而不是用一个通用模型做一层适配。
Dell Technologies Capital合伙人Elana Lian领投了这轮融资,她将语音定义为”AI最难的问题之一”,并明确将Bland的模型自研能力视为核心差异化要素。这个判断来自对技术难度的清醒认识,不是营销话术。
公司起源:一个无法回避的真实问题
Bland的产品方向,来自一个具体的、不可回避的个人经历。
Nejad的阿姨无法联系上保险公司,被拒绝了医疗治疗。她需要的不是更好的手机应用,不是更清晰的网页界面,而是一个真正能在电话里坚持到问题被解决的声音——不会被转接之后就断线,不会因为占线而放弃,不会在听了3分钟电话菜单之后进入死循环,而是能够理解她的情况、记住对话中出现的所有信息,并持续推进直到实际解决问题为止。
这个场景在美国医疗系统中极为普遍。医疗机构的运营依赖大量电话通信:预约确认、保险核实、处方续开、随访追踪、紧急情况评估。这些任务过去需要大量的人工坐席,成本高、效率低、出错率高,且对患者而言体验极差。自助服务系统(语音菜单、在线门户)可以处理最简单的情况,但一旦情况变得稍微复杂,用户就必须等待真人介入,而这意味着漫长的等待时间。
Bland的核心产品假设是:如果AI语音代理能够真正可靠地处理这类30到45分钟的复杂通话,它可以从根本上改变医疗、保险、金融等高监管行业的运营模式,而不只是在边缘上做一些简化工作。
这个产品假设,在2023年被180个投资人评估为”太难实现”。在2026年,它被350万通/周的实际处理量所证明。
竞争格局:进入一个正在变得拥挤的战场
成功从来不会长久属于一家公司。Bland现在面对的竞争格局,比被180个投资人拒绝时要复杂得多。
PolyAI是最值得关注的直接竞争对手。这家剑桥大学衍生公司服务FedEx、万豪酒店和凯撒娱乐,2025年12月在7.5亿美元估值下完成了8600万美元融资。与Bland一样,PolyAI也专注于企业级电话场景,主张为特定行业深度定制语音解决方案,而不是通用的语音API封装。
其他竞争者包括Replicant(专注保险和金融客服自动化)、Observe.ai(语音分析和质量监控)、Retell AI(更偏向开发者工具的API平台)和Cognigy(深度集成企业软件系统的对话式AI)。这些公司各有侧重,但都在争夺同一批企业预算:那些正在寻找人工坐席替代方案的大型机构。
Granet对竞争格局的判断非常直白:”当你仔细看大多数谈论语音AI的公司,他们没有连贯的产品,大规模处理的通话数量非常有限。他们做的通话通常很短,是转接电话。”(Fortune,2026年6月16日)
这个评价指向了Bland的竞争策略的核心:不是做更多数量的短通话,而是做其他人做不了的长通话。在竞争对手大量进入”简单脚本化通话”市场的同时,Bland持续深挖”复杂长通话”这个对技术要求最高、进入门槛最高的细分。
但Bland也面临一个不可忽视的市场现实。Granet坦承:”人们低估了目前市场上对AI有多大的抵触情绪。”他描述了与纽约大型呼叫中心的会面,这些公司在某些情况下更担心的不是技术是否成熟,而是变革管理和员工关系——工会合同、员工安置、内部反弹。这个市场阻力,在高监管的医疗和金融场景尤为明显,也恰恰是Bland深度布局的领域。技术层面的成功,不自动等同于商业层面的大规模落地。
市场规模:这个战场究竟值多少钱
Bland选择的战场究竟有多大?这个问题有多个角度的答案。
从呼叫中心AI市场的传统定义看,根据EzyCalls的市场研究,该市场目前规模约30亿美元,预计2034年达到135亿美元。在这个框架下,Bland是一个快速成长的赛道参与者,但市场规模本身尚未巨大。
Granet使用了一个更大的参照系:Twilio、Genesys、8×8、NICE inContact等纯电话基础设施公司,每年合计营收约120亿到150亿美元(Granet的估算为150亿美元,经媒体核实实际数字约为120亿美元)。这些公司提供的是”电话基础设施”——企业打电话的管道和接口,本质上是商品化服务。
Bland的赌注是:当AI语音代理达到足够的可靠性和复杂度,它可以系统性地替代这个基础设施中最昂贵的部分——人工坐席。这个替代不是”一部分任务转移到AI”,而是”整个工作流在AI层面重构”。如果这个重构成功,可以触及的市场价值,远超当前”呼叫中心AI”分类所涵盖的范围。
“这个空间将支撑多个市值数百亿美元的赢家。”Granet告诉Fortune。这个判断的前提是:AI语音技术的可靠性将继续提升,高监管行业的采购决策将在未来几年加速,而能够在这个窗口建立深度市场壁垒的公司,将获得不成比例的市场回报。
C轮融资的资金用途——扩大研究、增加工程团队、进入更多监管行业——是对这个时间窗口的主动把握:在通用大模型公司开始针对企业电话场景提供更专项服务之前,加速在高监管行业建立足够深的运营壁垒和客户信任,让切换成本高到后来者难以轻易替代。
Dell Technologies Capital和HubSpot Ventures的加入,值得特别关注。Dell的企业客户网络覆盖全球数万家大型机构,HubSpot的CRM平台服务数十万家中小企业。这两家机构的参与,不只是财务投资,更是市场渠道的战略布局——它们为Bland进入企业采购清单,提供了直接的推荐路径。
自研路径的深层逻辑:合规信任不可外包
Bland的自研语音模型策略,在高监管行业的实际落地中有一个通常被忽视的维度:合规审计能力。
在医疗、金融和保险行业,任何涉及客户服务的AI系统,都必须满足严格的合规要求。医疗场景需要HIPAA合规(美国健康保险可携带性与责任法案),金融场景需要满足FINRA或SEC的客户沟通录制和保留要求,保险场景需要遵循各州的消费者保护法规。这些要求的共同点是:系统必须能够提供完整的、可审计的决策记录——在电话的每个关键节点,AI做出了什么判断,依据是什么,是否在规定范围内。
当一个语音AI系统的核心模型来自OpenAI或Anthropic时,这个审计能力是有根本限制的。第三方模型的内部决策逻辑对使用方是黑箱,无法在监管要求的精度上提供完整的决策溯源。当监管机构要求解释”为什么AI在某个特定节点做出了某个决定”,基于外部API的系统无法给出满足合规要求的答案。
Bland的自研路径,让它可以对系统中的每个决策节点提供完整的内部审计路径——不只是”对话记录”,而是包括模型状态、置信度、判断依据在内的完整决策链条。这个能力,是Bland向高合规要求的医疗和金融机构销售时,比任何性能基准测试都更有说服力的竞争优势。
这也解释了为什么Dell Technologies Capital和HubSpot Ventures这样的企业机构型投资者,对Bland的自研路径尤为看好——他们的企业客户网络里,最大的采购需求恰恰来自对合规审计有最高要求的行业。
被拒绝180次之后:反共识投资的结构性逻辑
从投资角度看,Bland在2023年被拒绝的经历提供了一个值得深度分析的案例。
180个投资人用了相同的框架否定了同一个机会。这个现象本身有一个结构性原因:早期风险投资的决策,高度依赖”市场趋势是否支持”的判断框架。当所有可观察到的数据都指向”语音通话量在下降”时,否定一个语音AI投资是理性的、一致的判断。
但这个框架有一个盲点:它混淆了”消费级语音通话的下降”和”企业高价值语音通话的消失”。消费级语音通话(闲聊、简单查询、家庭联络)确实在向消息应用迁移。但企业级的高价值语音通话——需要持续沟通、实时判断、复杂信息交换的医疗、保险、金融服务电话——并没有一个可以替代它的渠道。你无法用消息应用完成一次血压读数核实和后续医疗建议的对话,这个过程需要实时的、双向的、持续的人声交流。
180个投资人看到了第一类数据,错过了第二类机会。这不是他们的判断失误,而是使用了与机会本身不完全匹配的分析框架——这是早期投资中最常见也最难避免的错误类型。
Bland的案例提供给创业者的最重要洞察是:如果你的机会正在被主流框架系统性低估,你需要的不只是”坚持下去”的决心,更需要能够清晰说明”为什么主流框架在这个具体情况下失效”的分析能力。Granet在被拒绝之初可能做不到这一点,但3年的产品开发和市场验证,让他现在能够用数字说话:350万通/周,1.75亿通/年,250+企业客户。数字是最好的框架修正工具。
高监管行业AI落地的系统性机会
Bland的选择,指向了一个比语音AI更大的结构性机会:高监管行业的AI落地,是整个AI产业中速度最慢、难度最高,但同时价值密度最高的市场。
医疗、金融、保险、法律这些行业的共同特征是:错误的成本极高(可能影响患者健康、触犯合规法规、产生法律责任);流程被严格规范(大量的监管要求和审计标准);人力成本极高(高技能员工处理大量重复性但不可省略的任务);AI替代的政治阻力较大(监管机构、从业者组织、消费者保护团体的持续关注)。
这些特征共同决定了:AI工具在高监管行业的落地,不是一个”插上API就能用”的过程,而是一个需要在技术可靠性、合规审计能力、组织变革管理和监管关系维护多个维度同时投入的长期工程。
这正是大多数AI工具公司不愿意进入的原因,也是Bland选择专注这里的战略逻辑——在一个准入门槛足够高的市场里,先发者的优势更难被后来者侵蚀。
整个呼叫中心AI市场预计从目前的30亿美元增长到2034年的135亿美元,但这个数字捕捉的只是”呼叫中心软件”的市场。如果算上AI语音代理所能替代的人力成本——仅美国一国的呼叫中心行业每年雇佣约300万名工人,平均薪资约3.5万美元,总人力成本超过1000亿美元——潜在的市场规模要大得多。当然,替代率不会是100%,但即便是20%的替代,也是一个200亿美元级别的商业机会。
另一面的声音:这是否一个可持续的赌注?
公平起见,必须呈现对Bland自研路径的核心质疑。
大型模型公司在通用大模型能力上的投入,已经超过了任何垂直公司能够单独匹敌的规模。OpenAI、Anthropic、Google、Meta每年在基础模型研究上的投入,合计数百亿美元。随着这些通用模型在语音理解、情感感知、长上下文处理等方面持续提升,Bland的自研语音模型相对于”接入最新通用API的竞争者”,还能保持多大的性能差距?
这是一个没有简单答案的合理问题。
Bland的反驳是:性能的绝对值不是差异化的核心来源,在特定工作场景下的可靠性、可控性和可审计性才是。一个在30分钟医疗电话中能够稳定运行、合规审计记录清晰的系统,远比一个在前5分钟表现出色但在复杂场景下行为不可预测的系统更有实际价值。高监管行业的采购决策者,在评估AI供应商时,不会把”通用基准测试排名”作为主要评判标准——他们需要的是”在我们的具体工作场景中可靠运行,出问题时可以审计,出事了谁负责”的承诺。这是Bland可以给出的承诺,而依赖第三方模型的竞争者无法做到相同的程度。
但这个反驳有一个时间维度的脆弱性:如果大型模型公司开始针对企业电话场景提供专项的高可靠性服务,并且愿意为合规需求提供定制化的审计能力,Bland的护城河可能在未来3到5年内被系统性压缩。这是一个真实的风险,Bland的应对是加速在高监管行业建立足够深的客户信任和切换成本,在这个竞争加剧之前完成市场壁垒的构建。
C轮融资的5000万美元,用于扩大研究、增加工程团队、进入更多监管行业,正是这个时间赛跑的具体表达。
从工具到系统:语音AI的下一个演化方向
Bland的成长轨迹,也指向了企业AI落地的一个更大趋势:AI工具正在从”功能替代”向”流程重构”演化。
在AI落地的早期阶段,大多数企业关注的是”用AI替代某个具体的重复性任务”——用AI生成营销文案、用AI自动回复简单客服问题、用AI提取文档关键信息。这个阶段的AI工具,本质上是”效率提升工具”,它在现有流程的边缘做减法,而不改变流程本身。
Bland代表的是第二个阶段:流程重构。当一个AI语音代理能够真正可靠地完成30到45分钟的复杂通话,它不只是”替代了某个步骤”,而是让一种全新的服务模式成为可能——24小时无等待时间的医疗随访、实时保险核实、个性化金融服务的大规模交付。这些服务模式在人力限制下是不可能实现的,AI让它们成为可能。
这个演化,对企业的影响超出了”降低成本”的范畴,进入了”创造新的服务能力”的区间。医疗机构可以对所有出院患者提供24小时后续随访(过去只有高风险患者才能得到这个资源);保险公司可以在理赔过程中提供更密集的用户指导(过去因为人力成本无法规模化);金融顾问可以服务更多长尾客户(过去的客户门槛限制了服务范围)。
在这个框架下,Bland的定位不只是”AI电话软件”,而是”企业服务能力扩展的基础设施”。这个重新定位,改变了它在企业采购决策中的分类——它不再只是与其他语音AI工具比较,而是在与”增加人力坐席”或”限制服务范围”的现有选择对比。
这个定位的商业意义,在于定价权的转移:当一个工具从”替代现有流程”变成”实现此前不可能的服务”,它可以参与分享它所创造的新价值,而不只是以”节省成本”为理由要求一个折让价格。这是从工具溢价到系统溢价的跨越,也是Bland在未来几年商业化的关键逻辑。
语音数据的战略价值:一个通常被低估的资产
Bland自研路径的另一个通常被低估的战略价值,是数据积累。
每年1.75亿通电话,不只是商业规模的体现,更是一个巨大的语音AI专项训练数据资产。这些数据涵盖了真实企业场景中最复杂的语音交互:带有情绪的沟通、领域专业词汇的正确处理、方言和口音的识别、长时段上下文的保持。这类数据,是通用大模型训练数据集中极为稀缺的部分——公开互联网上几乎没有大量高质量的、带有专业标注的企业级长电话语音数据。
因此,Bland通过日常运营积累的数据飞轮,为其自研模型的持续改进提供了一个强大的、竞争对手难以复制的来源:越多企业使用Bland,Bland积累的专项训练数据越多;数据越多,自研模型在企业场景的性能越好;性能越好,越多企业选择Bland。这是一个典型的数据飞轮正向循环。
这个飞轮,对于那些依赖第三方API的竞争对手来说,是无法仅凭模型性能提升来超越的。即便OpenAI或Anthropic发布了更强大的语音API,它们在特定企业行业场景下的专项优化,仍然无法匹配一个在这个场景中积累了1.75亿通真实通话训练数据的专项模型。
这是Bland的自研选择在数据层面的长期价值——它不只是今天的差异化,更是未来竞争格局演变中的持久护城河。
结语:反共识,或许是AI创业时代最被低估的护城河
从被180个投资人拒绝,到完成超过1亿美元融资,Bland的故事容易被讲成一个关于”坚持”的励志叙事。但它更深层的含义,是关于在高度同质化的AI工具市场里,如何通过选择最难的路建立真正的竞争优势。
当AI工具的底层能力越来越被少数大公司垄断,当所有人都在用同样的API构建同样的功能,差异化只能来自两个方向:更深(深度专有化,自研关键能力,在特定场景建立无法被快速复制的系统性积累)或更宽(网络效应,平台化,建立不依赖单一技术能力的生态优势)。Bland选择了前者,在一个具体的、艰难的场景下做到了真正的深度。
被180个投资人拒绝,不是因为这180个人都判断失误,而是因为他们用了与机会本身不完全匹配的分析框架。这个框架的盲点,在Bland的真实数字面前,已经逐渐变得清晰。
350万通/周,1.75亿通/年,250+企业客户,5000万美元C轮。电话没有消失——真正消失的,是那个认为电话会消失的主流共识。
参考资料
-
Fortune(独家)— Voice AI startup Bland raises $50 million after being rejected by 180 investors, Isaiah Granet采访, 2026年6月16日. https://fortune.com/2026/06/16/voice-ai-bland-50-million-after-being-rejected-by-180-investors/
-
Bland AI官方博客 — Bland Raises a $40M Series B to Transform Enterprise Phone Communications, 2025年1月. https://www.bland.ai/blog/bland-raises-a-40m-series-b
-
Andreessen Horowitz — Voice AI agents 2025 update, 2025年6月. https://a16z.com/ai-voice-agents-2025-update/
-
Forbes — PolyAI Raises $86 Million As Fight To Answer Calls With AI Heats Up, 2025年12月15日. https://www.forbes.com/sites/iainmartin/2025/12/15/polyai-raises-86-million-as-fight-to-answer-calls-with-ai-heats-up/
-
EzyCalls — Call Center AI Market Research, 呼叫中心AI市场规模预测($3B→$13.5B, 2024-2034). https://ezycalls.com/call-center-ai-market/
-
Emergence Capital — AI that speaks volumes: Why we’re backing Bland, 2025年1月. https://www.emcap.com/thoughts/ai-that-speaks-volumes-why-were-backing-bland