作者:来源:IT时报
2025-08-08 17:47:25
IT时报记者 毛宇
2025世界人工智能大会(WAIC)期间,启明创投主办的“创业与投资论坛——创业投资开启AI技术与应用共振周期”如期举行。作为连续第三年承办该论坛的投资机构,启明创投再次聚集了AI领域的学界权威与产业领军者。
当前,AI领域的投资动态与具身智能的发展前景是行业关注的焦点。从投资层面看,市场对AI的信心持续显现。启明创投主管合伙人周志峰在开场演讲中提及,2025年上半年AI已占据全球50%以上的投资份额,2024年全球模型公司融资额达330亿美元,占全年全球风险投资总额近20%。这组数据有力回击了“大模型天花板论”,印证了行业对其潜力的坚定信心。
与此同时,具身智能作为AI领域的重要分支,在2025年展现了惊人的爆发力,发展态势同样受到关注。随着技术的不断推进,具身智能从实验室走向产业场景的进程正在加速,这一领域正经历从概念到实用的关键跨越,成为AI技术落地的新标杆。
过去12个月,MOE架构、合成数据技术、超长上下文窗口等创新不断涌现,其中推理能力的跃升堪称里程碑,技术层面的突破持续为大模型注入活力。
周志峰以近期开源的“阶跃星辰Step-3”模型为例——这款启明创投投资企业阶跃星辰推出的模型,在人类智商测试中得分达120分,超越全球近80%以上人类的智商水平,较2024年GPT-4o不到70分的成绩实现质的飞跃。这种进步让大模型从“信息搬运工”转变为具备复杂逻辑思维的“决策者”,为复杂任务处理奠定基础。
大模型正从单一文本交互向多维度感知世界演进,多模态能力的进化同样引起行业关注。谷歌发布的Veo 3视频生成模型可自动添加音效、对白与背景噪音,达到“以假乱真”的效果;而启明创投投资公司生数科技推出的新一代视频模型,支持输入“最多七个主体”的参考图片,并在生成视频中保持这些主体的“高度一致性”,已在广告制作、影视特效等领域实现商业化落地。
成本优化则为大模型规模化应用扫清障碍。DeepSeek V3/R1模型将推理成本压缩至OpenAI对应模型的5%,目前主流大模型的推理成本已降至每百万Token约1美元,较2024年下降近100倍。成本下降直接推动了应用爆发:豆包的Token调用量12个月增长超100倍,生数科技的视频生成平台Vidu AI上线3个月用户破千万,其中80%来自海外市场,展现出AI应用的全球化潜力。
当算法的创新遇上硬件的突破,软硬件的协同会如何推动AI技术的范式变革?
清华大学电子工程系长聘教授、系主任,无问芯穹发起人汪玉在主题为《软硬协同推进AI基础设施演进》的演讲中指出,在将人工智能真正转化为实际生产力的过程中,Token作为大模型输入输出的基本单元,已成为智能时代最核心的生产要素之一。过去的价值链路是由电能驱动算力提升,以完成简单任务,而现在则演变为将电能转化为算力,再由算力生成Token,最终支撑复杂任务的执行。伴随这一转变,评价基础设施效能的核心指标也正随之变化——传统的“每焦耳能量所能支持的计算次数(TOPS/J)”正被“每焦耳能量所能处理的有效Token数量(Token/J)”所取代。
如何优化单位能耗下的Token效率,将是AI 2.0时代基础设施与系统设计的核心命题。
从2015年启明创投投资优必选时泛机器人行业的冷清,到2025年中国出现100多家具身智能和通用人形机器人企业,这一领域的热度飙升并非偶然——技术突破与产业需求的碰撞,正推动具身智能从实验室快速迈向产业场景。
周志峰在“2025 启明创投AI十大展望”中提出,具身智能机器人将率先在拣选、搬运、组装等场景实现规模化部署,构建“模型-本体-场景数据”的闭环飞轮。这一判断已得到市场验证:优必选近期签署全球最大人形机器人订单,智元与宇树科技也在工业场景中标落地项目,标志着具身智能从概念走向实用。
技术层面的加速成熟是这一跨越的核心驱动力。它石智航创始人兼首席执行官陈亦伦表示,过去两年具身智能的技术进展速度已超越此前多年积累,进入“越跑越快”阶段:机器人本体控制技术逐渐成熟;有量产潜力的高自由度灵巧手方案已经出现,且正在飞速迭代。原力灵机联合创始人兼首席执行官、旷视科技联合创始人唐文斌则认为,大模型在链式推理(CoT)和智能体(Agent)能力达到一定的临界值,对物理世界的高精度多模态感知能力与复杂的规划与推理能力的结合,让机器人走向通用成为可能。
谈及技术收敛问题,唐文斌认为当前具身智能的技术尚未收敛。算法框架、数据来源、硬件形态与稳定性以及场景落地的先后顺序仍处于开放探索阶段。虽然业内正逐步形成“端到端、纯数据驱动、采用类VLA(视觉-语言-动作)框架”的共识,并普遍认同多模态信息(视觉、触觉、力觉、深度等)需统一纳入大模型,但终极模型架构尚无定论。
陈亦伦则认为,在具身智能领域,业界已在宏观层面形成高度共识,如数据被视为核心驱动力,模型最终部署形态大概率采用端到端架构等,但在具体实践中,从数据获取到算法层面再到硬件选型,各个团队的路径差异明显,整个行业宏观共识与微观多元化并存。
对于具身智能的落地场景,陈亦伦认为制造业是刚需且痛点明显的领域,有望率先落地。它石智航挑选场景遵循“高价值、有规模、有难度”的“黄金三角”逻辑;唐文斌所在的原力灵机则坚持在技术发展正向梯度,即不过早将技术形态固化于特定垂直场景,避免牺牲泛化性;注重技术可达性,选择容错率高、对操作时间容忍度更强的场景,逐步从90%向100%优化;场景须具备规模与强需求,机器人的规模化应用大概率将从工业、物流等领域的后端场景起步,逐步向商用场景拓展,最终走向民用。
当下,具身智能领域已从概念迈向实用,硬件与AI融合是关键,该领域面临“算力-能耗-响应速度”挑战,需要芯片、算法、系统协同优化。例如,启明创投投资的无问芯穹构建的云端协同算力调度平台,为大规模部署提供支撑。数据闭环则是具身智能迭代的核心驱动力,正如未来智能首席执行官马啸所言,精准感知世界对于强大的AI大脑至关重要。
AI投资正经历从“追逐热点”到“深耕价值”的范式转型。作为中国AI领域最早布局的投资机构之一,启明创投累计投资100余个AI项目,其投资逻辑的演进折射出行业的成熟轨迹。
“我们的观点并非闭门造车,而是整合产业界一手信息的成果。”周志峰强调。
当前AI投资更注重“技术可落地性”与“产业价值密度”的匹配。这种扎根产业的方法论,在技术快速迭代的周期中显得尤为重要——避免因追逐概念而忽视商业本质,也避免因保守而错失技术拐点。
垂直场景的深耕成为差异化竞争的关键。启明创投提出的“Go Narrow and Deep”(深耕细分领域)策略,在多个投资公司得到验证:未来智能聚焦办公场景,通过耳机这一高频硬件切入,逐步拓展至会议纪要、报告生成等全流程服务;生数科技深耕视频生成细分领域,凭借主体一致性技术建立行业壁垒。这种“小切口、深挖掘”的路径,让初创公司在与大厂的竞争中找到独特价值支点。
商业化模式的创新加速价值释放。AI BPO(业务外包)模式的崛起便是典型案例,一些公司已从单纯提供智能工具转向“按服务结果收费”,在金融、电商领域实现规模化收入。这种“交付结果而非工具”的模式,推动AI从成本中心向利润中心转变。
针对当下大热的Agent,周志峰在十大展望中表示,未来12~24个月,Agent形态将从“工具辅助”走向“任务承接”,首批真正意义上的“AI员工”将进入企业,广泛参与客户服务、销售、运营、研发等核心流程,不再仅作为助手存在,而是具备协同作业、主动反馈、承担OKR等能力,推动从成本工具向价值创造转变。