Featured image of post OpenAI双线出击:Codex Sites变身企业应用工厂,机器人团队时隔6年重启

OpenAI双线出击:Codex Sites变身企业应用工厂,机器人团队时隔6年重启

2026年6月初,OpenAI同时推进两大战略方向:一是将Codex从编程助手升级为企业级应用构建平台,推出Sites功能让非技术人员也能生成可托管的交互式应用;二是时隔6年重启机器人团队,由世界模拟研究负责人Aditya Ramesh领导,目标是'让每个人拥有可以做任何事的个人机器人'。本文深度解析OpenAI从数字AI到具身AI的战略扩张,以及Codex Sites如何重新定义AI编程工具的边界。

摘要

2026年6月初,OpenAI同时在数字世界和物理世界两条战线上发力,展现了其从"AI聊天工具"向"全栈AI平台“转型的雄心。在数字端,Codex for Business/Enterprise推出重大更新,Sites功能让非技术用户也能生成和托管交互式网站、应用、仪表盘和内部工具,将Codex从"编程助手"升级为”代理式工作产品生成器"。在物理端,OpenAI时隔6年重启机器人团队,由世界模拟研究项目负责人Aditya Ramesh领导,CEO Sam Altman明确愿景:"让每个人都能拥有一个可以做任何事情的个人机器人。“这两个动作合在一起,勾勒出OpenAI的下一个十年蓝图:从屏幕到现实世界的全面AI化

笔记本电脑工作台 Codex Sites让非技术用户也能在浏览器中构建和托管交互式应用

事件背景

OpenAI的"全栈AI"野心

2025年以来,OpenAI一直在从"模型公司"向"产品公司"转型。ChatGPT是消费端的成功故事,但企业市场才是AI公司真正的收入引擎。2026年初,OpenAI宣布向AI Agent应用战略转型,并在4月正式推出了面向企业的Codex服务。

6月的这次更新是OpenAI企业战略的进一步深化。Codex不再只是"帮你写代码"的工具,而是一个能够生成完整工作产品的平台——包括可托管的网站、应用和仪表盘。

机器人团队的"前世今生”

OpenAI的机器人研究有着曲折的历史。2018-2020年,OpenAI曾有一个活跃的机器人团队,开发了Dactyl灵巧手机器人等项目。但2020年,该团队被关闭,资源转向大语言模型。

6年后,在大语言模型、多模态AI和世界模拟技术大幅进步的背景下,OpenAI认为重启机器人研究的时机已经成熟。更关键的是,Sora视频生成团队在2025年被关闭后,其世界模拟研究能力被整合到了Aditya Ramesh的领导下,为机器人团队的重启提供了技术基础。

核心技术解析

Codex Sites:从代码到应用

技术架构

  graph TD
    A["用户请求<br/>(自然语言描述)"] --> B["Codex Agent"]
    B --> C["代码生成"]
    B --> D["UI/UX 设计"]
    B --> E["数据集成"]
    
    C --> F["Sites 托管平台"]
    D --> F
    E --> F
    
    F --> G["交互式网站"]
    F --> H["内部工具"]
    F --> I["数据仪表盘"]
    F --> J["业务流程应用"]
    
    style B fill:#10A37F,color:#fff
    style F fill:#4A90D9,color:#fff

Codex Sites的核心创新在于将代码生成应用托管整合在一个闭环中:

  1. 自然语言输入:用户用自然语言描述需要的应用(如"创建一个项目进度跟踪仪表盘")
  2. AI代理生成:Codex Agent生成完整的前端+后端代码
  3. Sites托管:生成的应用自动部署到企业内部环境,生成可访问的URL
  4. 角色插件:支持role-specific插件,针对不同岗位(产品经理、数据分析师、设计师)优化交互
  5. 注释与协作:团队成员可以在应用上添加注释,进行协作迭代

关键能力

超越编程的应用构建

  • 内部工具:HR管理面板、审批流程自动化、员工入职向导
  • 数据仪表盘:销售数据可视化、KPI跟踪、实时监控
  • 高管材料:交互式演示文稿、数据分析报告
  • 品牌约束创意:在品牌指南约束下生成营销素材
  • 业务工作流:随业务需求变化的动态工作流应用

企业级安全与治理

  • 所有应用部署在企业身份验证和权限体系内
  • 支持公司IT策略和合规要求
  • 非技术用户可以安全地请求、检查、使用和更新应用

机器人团队重启

团队结构

  • 负责人:Aditya Ramesh(世界模拟研究项目负责人)
  • 技术基础:此前被整合的Sora团队世界模拟能力
  • 招聘方向:硬件工程师、运维工程师、系统工程师、机器学习工程师

技术路线

  graph TD
    A["短期目标"] --> B["帮助专业人员<br/>建设基础设施"]
    A --> C["中期目标"]
    A --> D["长期目标"]
    
    C --> C1["探索替代AI技术路径<br/>获取具身训练数据"]
    D --> D1["通用机器人<br/>推动AGI进步"]
    
    style B fill:#10A37F,color:#fff
    style C1 fill:#F5A623,color:#fff
    style D1 fill:#D0021B,color:#fff

Sam Altman在X平台上阐述了清晰的路线图:

短期(1-2年):机器人首先帮助专业人员建设基础设施——建筑施工、电网安装、工厂装配等。这些领域的劳动力短缺严重,AI机器人的经济价值最直接。

中期(3-5年):通过具身AI获取独特的训练数据,探索大语言模型之外的替代AI技术路径。这是一个重要的技术信号——OpenAI可能认为纯粹的文本/视觉训练不足以达到AGI,需要从物理交互中学习。

长期(5-10年):开发通用机器人,能够执行任何人类能做的物理任务,成为推动AGI进步的关键力量。

与NVIDIA Cosmos 3的差异化

值得注意的是,OpenAI的机器人战略与NVIDIA的Cosmos 3走了不同的技术路线

维度 OpenAI 机器人 NVIDIA Cosmos 3
定位 端到端自主机器人产品 开源物理AI基础模型
方法 可能结合大语言模型+世界模拟 Mixture-of-Transformers统一架构
数据 利用Sora世界模拟能力生成训练数据 20万亿token多模态训练数据
商业模式 机器人产品/服务 模型+芯片+平台
开放性 预计闭源 完全开源

关键创新点

1. Codex的"工作产品"范式转变

传统的AI编程助手(Copilot、Cursor等)输出的是代码片段,开发者需要自己组装、测试、部署。Codex Sites的输出是完整可用的应用——部署好了、可以访问、可以直接使用。这是一个从"代码助手"到"应用工厂"的质变。

2. 非技术用户的应用构建民主化

Sites的真正革命性在于目标用户的扩展——从开发者到所有企业员工。产品经理可以请求一个数据仪表盘,HR可以创建一个入职向导,销售可以构建一个客户提案工具。这直接挑战了低代码/无代码平台(如Retool、Bubble、Appsmith)的市场。

3. 具身AI作为AGI路径

OpenAI重启机器人团队的最深层动机可能不是制造机器人产品,而是探索具身AI(Embodied AI)作为通向AGI的路径。通过与物理世界的交互,AI可能获得纯文本/视觉训练无法提供的认知能力——因果推理、空间理解、时间感知等。

机器人自动化手臂 OpenAI重启机器人团队,探索具身AI作为通向AGI的新路径

行业影响

对市场的影响

1. 低代码/无代码平台的生存危机

Codex Sites直接威胁传统低代码/无代码平台的核心价值主张。如果AI可以直接从自然语言生成完整应用,那么拖拽式界面的必要性将大幅降低。Retool、Bubble、Appsmith等平台面临被"跳过"的风险。

2. AI编程工具市场的重新定义

Codex Sites将AI编程工具的竞争从"谁的代码补全更好"推向"谁能生成更完整的可部署应用"。GitHub Copilot、Cursor、Windsurf等竞品需要重新思考产品方向。

3. 机器人赛道的竞争加剧

OpenAI重启机器人团队增加了该赛道的竞争强度。现有玩家包括:

  • Tesla Optimus:已在工厂内部测试
  • Figure AI:获得OpenAI投资的独立机器人公司
  • Boston Dynamics:硬件能力最强但AI能力相对薄弱
  • Google DeepMind:RT-2等模型已有研究积累

对开发者的意义

机遇:

  • Codex Sites可以作为快速原型工具,大幅缩短从想法到可用应用的时间
  • 企业内部的"影子IT"问题可能得到缓解——AI生成的应用在企业安全体系内
  • 开发者可以将Codex生成的应用作为起点,进行二次开发

挑战:

  • 非技术用户生成的应用可能存在安全隐患和代码质量问题
  • AI生成应用的可维护性存疑——当需要修改时,非技术用户是否能有效指导AI
  • 可能导致技术债务积累——大量AI生成的应用缺乏文档和标准化

商业化前景

  graph TD
    A["OpenAI 双线战略"] --> B["数字世界<br/>Codex Sites"]
    A --> C["物理世界<br/>机器人"]
    
    B --> B1["企业订阅<br/>Codex for Business"]
    B --> B2["低代码替代<br/>Sites托管服务"]
    
    C --> C1["短期:基建机器人"]
    C --> C2["中期:数据+技术探索"]
    C --> C3["长期:通用机器人"]
    
    B1 --> D["收入引擎<br/>(1-3年)"]
    C1 --> D
    C3 --> E["AGI推动力<br/>(5-10年)"]

实际体验

使用场景演示

场景1:产品经理构建数据仪表盘 一位产品经理需要跟踪产品发布进度。以前需要找开发团队排期,现在只需对Codex说:“创建一个仪表盘,显示最近30天的用户注册趋势、功能采用率和错误报告数据。“Codex生成一个包含图表、过滤器和数据连接的交互式仪表盘,部署在企业内部URL上。

场景2:HR创建入职向导 HR团队可以创建一个交互式的新员工入职应用,包含公司文化介绍、政策文档、IT设备设置指南和团队介绍。所有步骤通过AI生成,无需开发人员参与。

场景3:机器人辅助基础设施建设 在短期愿景中,OpenAI的机器人可以帮助专业人员进行重复性的基础设施建设任务——如电缆布线、管道安装、标准化零件装配。这些任务的共同特点是:劳动密集、技能要求可标准化、劳动力严重短缺。

优势与不足

优势:

  • Codex Sites实现了从代码到应用的闭环,降低了企业应用构建门槛
  • 企业级安全和治理,所有应用在企业权限体系内
  • 机器人团队的重启展示了OpenAI的长期技术视野
  • 结合Sora的世界模拟能力,机器人训练数据生成有独特优势

不足:

  • Codex Sites目前仅面向Business和Enterprise用户,普通用户无法使用
  • AI生成的应用质量高度依赖用户描述的精确度
  • 机器人团队的成果至少需要1-2年才能看到实质性进展
  • 硬件方面的能力积累相对薄弱,可能需要收购或合作

总结与展望

OpenAI在2026年6月的双线出击,展示了一个清晰的战略图景:

在数字世界,Codex Sites正在重新定义"AI编程工具"的含义。从代码补全到完整应用生成,从服务开发者到服务所有企业员工,这是一个产品范式的跃迁。如果Sites能够在企业环境中稳定运行并保证应用质量,它将深刻改变企业软件的构建方式。

在物理世界,机器人团队的重启反映了OpenAI对AGI路径的深层思考。纯数字AI可能不足以实现真正的通用智能,通过与物理世界的交互获得新的认知能力,可能是一条必要的补充路径。

将这两个方向结合起来看,OpenAI的长期愿景正在浮现:一个能够理解、操控数字世界和物理世界的通用AI系统。这不仅是技术愿景,更是一个关于AI未来的宏大赌注。


参考来源: