6月15日,极佳视界宣布于近日再获10亿元B2轮融资。本轮融资将主要用于极佳视界“双金字塔”数据与算法体系的持续投入、物理AGI基础模型的研发迭代,以及C端家庭场景与B端工业场景的规模化落地。
在此之前,极佳视界在今年3月和4月已分别完成10亿元Pre-B轮和15亿元B1轮融资。
这意味着,短短三个月,极佳视界累计完成了35亿元融资,可谓充分凸显了资本对极佳视界技术路线与落地潜力的认可,以及对“世界模型+物理AGI”这条赛道的极高期待。
那么,极佳视界所坚持的“世界模型”路线,与当前行业主流的VLA模型相比,究竟有何差异?其宣称要成为“物理世界的OpenAI”,又走到了哪一步?
从数字AGI到物理AGI:世界模型成为新风口
极佳视界成立于2023年,是国内第一家系统布局世界模型的科技企业,也是全球率先实现世界模型产业化落地的公司之一。
其核心判断是:语言模型之后,下一个最重要的事情是世界模型。
在极佳视界看来,数字AGI已经走过了“GPT-3时刻”“ChatGPT时刻”和“Claude Code时刻”三个关键阶段,彻底改变了数字世界,释放出令人惊叹的数字生产力。
目前,物理AGI正沿着几乎相同的路径展开,把这场智能革命从数字世界带入物理世界,从“无限的数字生产力”走向“无限的物理生产力”。
图片来源:极佳视界
基于这一判断,极佳视界自成立起便All in世界模型,并系统化地提出了物理AGI的“双金字塔”体系——一座面向数据,一座面向算法,用以解决物理通用智能Scaling面临的两大瓶颈:规模化物理规律数据的缺失,以及高效学习物理规律的算法架构缺失。
其中,数据金字塔自底向顶分为五层:互联网视频数据、真人数据、世界模型模拟器、仿真合成数据、真机数据。
图片来源:极佳视界
针对这一架构,极佳视界自研了低成本手持数采硬件U-01、低成本Ego数采硬件E-01、具身世界模型平台GigaWorld-0、轮臂机器人本体拾光S1、低成本真机数采硬件Maker M01等完整全栈软硬件体系。
值得一提的是,极佳视界也是行业首个对这五层完整数据金字塔进行了系统性布局的公司。
图片来源:极佳视界
而算法金字塔,自底向顶分为三层:世界模拟、动作对齐、经验强化。
基于“双金字塔”,极佳视界进一步打造了“世界生成-行动”双模型体系。其中世界生成模型,即理解、模拟并生成物理世界,为行动模型提供数据与仿真底座以及预训练参数;而世界行动模型,即把世界模型的理解与预测转化为机器人的行动策略。
在极佳视界联合创始人兼首席科学家朱政看来,VLA在处理单一任务、拥有海量数据的场景中表现尚可,但在具身智能面对的多任务、泛化场景中,其数据Scaling效率比较低效,世界模型更有优势。
不过,尽管技术路线听起来性感,真正落到产品上,极佳视界也走过弯路。
创业早期,极佳视界曾奉行“一脑多型”的策略——开发一个通用的具身大脑,适配市面上各种机器人本体。这一想法在理论上极具吸引力:如果成功,极佳视界将成为具身智能领域的“安卓”。
但现实很快给出了教训。不同厂商的机器人在底层接口、通信协议、运动控制逻辑上差异巨大,且关键设计并不对外开放。团队尝试了近半年,几乎适配了所有主流本体,最终发现:训练出来的模型很难在不同本体之间平滑迁移,更谈不上极致的产品体验。
于是,极佳视界做出了一个在当时并不轻松的决定:从“一脑多型”收敛到“一脑一型”,也即自己造本体,然后用自研本体采集数据,用于持续训练并迭代模型,再将训练出来的模型部署在自研本体上。
当然,这也意味着更重的资产投入和更长的研发周期。但显然,从资本的态度来看,这条技术叙事与战略路径的说服力正在增强。
C端进家庭、B端进工厂:两条腿跑通商业化
有了本体,接下来就是场景。
极佳视界的商业化路径非常清晰:C端进家庭,B端进工厂,两条腿并行。
图片来源:极佳视界
在C端,极佳视界已经推出了家庭场景子品牌“拾光SeeLight”,其中首款产品拾光S1已拿下国内首个真实家庭场景百台订单,将于2026年第三季度开启规模化运营;下一代家庭通用机器人拾光S2也将于第三季度发布,真实家庭创始版预定通道将同期同步开启。
在极佳视界看来,这对应的是物理AGI的“ChatGPT时刻”——让普通技能在真实家庭场景中被大规模应用。
但一个无法回避的现实是:家庭环境的非结构化程度极高,对机器人的泛化能力、安全性、成本都提出了严峻挑战。拾光S1的百台订单固然是一个突破,但距离真正的“千家万户”还有很长的路。
相比之下,极佳视界在B端工业场景的落地节奏要快得多。
今年4月,极佳视界联合一汽模具、阿里云,完成了国内首个具身智能机器人在真实工业制造场景的全流程解决方案落地——极佳视界的世界模型GigaWorld、具身基础模型GigaBrain与物理AGI原生本体Maker H01“三件套”进入一汽模具真实工厂,围绕箱体拆垛、跨区域搬运、动态避障、精准操作等高频任务,将传统自动化方案数月的场景适配周期压缩至数周。
图片来源:极佳视界
6月,极佳视界又宣布与隆盛科技合作,计划三年内在无锡部署1000台搭载极佳视界世界模型具身大脑与Maker系列的通用机器人。
相较于C端场景,工业场景的优势在于:任务相对固定,环境可控,且客户对投资回报的计算更加理性。
此外,极佳视界的自动驾驶世界模型DriveDreamer系列,也已与多家国内头部主机厂、海外及合资主机厂,以及AI芯片、Tier 1巨头达成签约定点与量产合作,累计服务海内外头部主机厂与自动驾驶公司超30家。
极佳视界指出,以工业系列产品为代表的B端布局,对应的是物理AGI的Claude Code时刻。
值得关注的是,除了对外提供AGI原生产品,极佳视界也会面向行业伙伴输出基础模型能力,通过软件、API、授权等方式赋能本体厂商、自主系统开发商与工业客户,为他们提供基础模型服务。
最终,按照极佳视界的预估,2028年将是判断人形机器人能否初步进入家庭的重要节点——届时具身基座模型有望实现单一模型处理多任务,并具备Few-shot学习能力,从而适应家庭的非结构化场景。
这是一个比许多同行更乐观的判断,但考虑到极佳视界在世界模型路线上的先发积累,这个时间表并非没有依据。
来源:第一电动网
作者:盖世汽车
本文地址:https://www.d1ev.com/news/shichang/303185
以上内容转载自盖世汽车,目的在于传播更多信息,如有侵仅请联系admin#d1ev.com(#替换成@)删除,转载内容并不代表第一电动网(www.d1ev.com)立场。
文中图片源自互联网,如有侵权请联系admin#d1ev.com(#替换成@)删除。