摘要
2026年6月初,OpenAI同时在数字世界和物理世界两条战线上发力,展现了其从"AI聊天工具"向"全栈AI平台“转型的雄心。在数字端,Codex for Business/Enterprise推出重大更新,Sites功能让非技术用户也能生成和托管交互式网站、应用、仪表盘和内部工具,将Codex从"编程助手"升级为”代理式工作产品生成器"。在物理端,OpenAI时隔6年重启机器人团队,由世界模拟研究项目负责人Aditya Ramesh领导,CEO Sam Altman明确愿景:"让每个人都能拥有一个可以做任何事情的个人机器人。“这两个动作合在一起,勾勒出OpenAI的下一个十年蓝图:从屏幕到现实世界的全面AI化。
Codex Sites让非技术用户也能在浏览器中构建和托管交互式应用
事件背景
OpenAI的"全栈AI"野心
2025年以来,OpenAI一直在从"模型公司"向"产品公司"转型。ChatGPT是消费端的成功故事,但企业市场才是AI公司真正的收入引擎。2026年初,OpenAI宣布向AI Agent应用战略转型,并在4月正式推出了面向企业的Codex服务。
6月的这次更新是OpenAI企业战略的进一步深化。Codex不再只是"帮你写代码"的工具,而是一个能够生成完整工作产品的平台——包括可托管的网站、应用和仪表盘。
机器人团队的"前世今生”
OpenAI的机器人研究有着曲折的历史。2018-2020年,OpenAI曾有一个活跃的机器人团队,开发了Dactyl灵巧手机器人等项目。但2020年,该团队被关闭,资源转向大语言模型。
6年后,在大语言模型、多模态AI和世界模拟技术大幅进步的背景下,OpenAI认为重启机器人研究的时机已经成熟。更关键的是,Sora视频生成团队在2025年被关闭后,其世界模拟研究能力被整合到了Aditya Ramesh的领导下,为机器人团队的重启提供了技术基础。
核心技术解析
Codex Sites:从代码到应用
技术架构
graph TD
A["用户请求<br/>(自然语言描述)"] --> B["Codex Agent"]
B --> C["代码生成"]
B --> D["UI/UX 设计"]
B --> E["数据集成"]
C --> F["Sites 托管平台"]
D --> F
E --> F
F --> G["交互式网站"]
F --> H["内部工具"]
F --> I["数据仪表盘"]
F --> J["业务流程应用"]
style B fill:#10A37F,color:#fff
style F fill:#4A90D9,color:#fff
Codex Sites的核心创新在于将代码生成和应用托管整合在一个闭环中:
- 自然语言输入:用户用自然语言描述需要的应用(如"创建一个项目进度跟踪仪表盘")
- AI代理生成:Codex Agent生成完整的前端+后端代码
- Sites托管:生成的应用自动部署到企业内部环境,生成可访问的URL
- 角色插件:支持role-specific插件,针对不同岗位(产品经理、数据分析师、设计师)优化交互
- 注释与协作:团队成员可以在应用上添加注释,进行协作迭代
关键能力
超越编程的应用构建:
- 内部工具:HR管理面板、审批流程自动化、员工入职向导
- 数据仪表盘:销售数据可视化、KPI跟踪、实时监控
- 高管材料:交互式演示文稿、数据分析报告
- 品牌约束创意:在品牌指南约束下生成营销素材
- 业务工作流:随业务需求变化的动态工作流应用
企业级安全与治理:
- 所有应用部署在企业身份验证和权限体系内
- 支持公司IT策略和合规要求
- 非技术用户可以安全地请求、检查、使用和更新应用
机器人团队重启
团队结构
- 负责人:Aditya Ramesh(世界模拟研究项目负责人)
- 技术基础:此前被整合的Sora团队世界模拟能力
- 招聘方向:硬件工程师、运维工程师、系统工程师、机器学习工程师
技术路线
graph TD
A["短期目标"] --> B["帮助专业人员<br/>建设基础设施"]
A --> C["中期目标"]
A --> D["长期目标"]
C --> C1["探索替代AI技术路径<br/>获取具身训练数据"]
D --> D1["通用机器人<br/>推动AGI进步"]
style B fill:#10A37F,color:#fff
style C1 fill:#F5A623,color:#fff
style D1 fill:#D0021B,color:#fff
Sam Altman在X平台上阐述了清晰的路线图:
短期(1-2年):机器人首先帮助专业人员建设基础设施——建筑施工、电网安装、工厂装配等。这些领域的劳动力短缺严重,AI机器人的经济价值最直接。
中期(3-5年):通过具身AI获取独特的训练数据,探索大语言模型之外的替代AI技术路径。这是一个重要的技术信号——OpenAI可能认为纯粹的文本/视觉训练不足以达到AGI,需要从物理交互中学习。
长期(5-10年):开发通用机器人,能够执行任何人类能做的物理任务,成为推动AGI进步的关键力量。
与NVIDIA Cosmos 3的差异化
值得注意的是,OpenAI的机器人战略与NVIDIA的Cosmos 3走了不同的技术路线:
| 维度 | OpenAI 机器人 | NVIDIA Cosmos 3 |
|---|---|---|
| 定位 | 端到端自主机器人产品 | 开源物理AI基础模型 |
| 方法 | 可能结合大语言模型+世界模拟 | Mixture-of-Transformers统一架构 |
| 数据 | 利用Sora世界模拟能力生成训练数据 | 20万亿token多模态训练数据 |
| 商业模式 | 机器人产品/服务 | 模型+芯片+平台 |
| 开放性 | 预计闭源 | 完全开源 |
关键创新点
1. Codex的"工作产品"范式转变
传统的AI编程助手(Copilot、Cursor等)输出的是代码片段,开发者需要自己组装、测试、部署。Codex Sites的输出是完整可用的应用——部署好了、可以访问、可以直接使用。这是一个从"代码助手"到"应用工厂"的质变。
2. 非技术用户的应用构建民主化
Sites的真正革命性在于目标用户的扩展——从开发者到所有企业员工。产品经理可以请求一个数据仪表盘,HR可以创建一个入职向导,销售可以构建一个客户提案工具。这直接挑战了低代码/无代码平台(如Retool、Bubble、Appsmith)的市场。
3. 具身AI作为AGI路径
OpenAI重启机器人团队的最深层动机可能不是制造机器人产品,而是探索具身AI(Embodied AI)作为通向AGI的路径。通过与物理世界的交互,AI可能获得纯文本/视觉训练无法提供的认知能力——因果推理、空间理解、时间感知等。
OpenAI重启机器人团队,探索具身AI作为通向AGI的新路径
行业影响
对市场的影响
1. 低代码/无代码平台的生存危机
Codex Sites直接威胁传统低代码/无代码平台的核心价值主张。如果AI可以直接从自然语言生成完整应用,那么拖拽式界面的必要性将大幅降低。Retool、Bubble、Appsmith等平台面临被"跳过"的风险。
2. AI编程工具市场的重新定义
Codex Sites将AI编程工具的竞争从"谁的代码补全更好"推向"谁能生成更完整的可部署应用"。GitHub Copilot、Cursor、Windsurf等竞品需要重新思考产品方向。
3. 机器人赛道的竞争加剧
OpenAI重启机器人团队增加了该赛道的竞争强度。现有玩家包括:
- Tesla Optimus:已在工厂内部测试
- Figure AI:获得OpenAI投资的独立机器人公司
- Boston Dynamics:硬件能力最强但AI能力相对薄弱
- Google DeepMind:RT-2等模型已有研究积累
对开发者的意义
机遇:
- Codex Sites可以作为快速原型工具,大幅缩短从想法到可用应用的时间
- 企业内部的"影子IT"问题可能得到缓解——AI生成的应用在企业安全体系内
- 开发者可以将Codex生成的应用作为起点,进行二次开发
挑战:
- 非技术用户生成的应用可能存在安全隐患和代码质量问题
- AI生成应用的可维护性存疑——当需要修改时,非技术用户是否能有效指导AI
- 可能导致技术债务积累——大量AI生成的应用缺乏文档和标准化
商业化前景
graph TD
A["OpenAI 双线战略"] --> B["数字世界<br/>Codex Sites"]
A --> C["物理世界<br/>机器人"]
B --> B1["企业订阅<br/>Codex for Business"]
B --> B2["低代码替代<br/>Sites托管服务"]
C --> C1["短期:基建机器人"]
C --> C2["中期:数据+技术探索"]
C --> C3["长期:通用机器人"]
B1 --> D["收入引擎<br/>(1-3年)"]
C1 --> D
C3 --> E["AGI推动力<br/>(5-10年)"]
实际体验
使用场景演示
场景1:产品经理构建数据仪表盘 一位产品经理需要跟踪产品发布进度。以前需要找开发团队排期,现在只需对Codex说:“创建一个仪表盘,显示最近30天的用户注册趋势、功能采用率和错误报告数据。“Codex生成一个包含图表、过滤器和数据连接的交互式仪表盘,部署在企业内部URL上。
场景2:HR创建入职向导 HR团队可以创建一个交互式的新员工入职应用,包含公司文化介绍、政策文档、IT设备设置指南和团队介绍。所有步骤通过AI生成,无需开发人员参与。
场景3:机器人辅助基础设施建设 在短期愿景中,OpenAI的机器人可以帮助专业人员进行重复性的基础设施建设任务——如电缆布线、管道安装、标准化零件装配。这些任务的共同特点是:劳动密集、技能要求可标准化、劳动力严重短缺。
优势与不足
优势:
- Codex Sites实现了从代码到应用的闭环,降低了企业应用构建门槛
- 企业级安全和治理,所有应用在企业权限体系内
- 机器人团队的重启展示了OpenAI的长期技术视野
- 结合Sora的世界模拟能力,机器人训练数据生成有独特优势
不足:
- Codex Sites目前仅面向Business和Enterprise用户,普通用户无法使用
- AI生成的应用质量高度依赖用户描述的精确度
- 机器人团队的成果至少需要1-2年才能看到实质性进展
- 硬件方面的能力积累相对薄弱,可能需要收购或合作
总结与展望
OpenAI在2026年6月的双线出击,展示了一个清晰的战略图景:
在数字世界,Codex Sites正在重新定义"AI编程工具"的含义。从代码补全到完整应用生成,从服务开发者到服务所有企业员工,这是一个产品范式的跃迁。如果Sites能够在企业环境中稳定运行并保证应用质量,它将深刻改变企业软件的构建方式。
在物理世界,机器人团队的重启反映了OpenAI对AGI路径的深层思考。纯数字AI可能不足以实现真正的通用智能,通过与物理世界的交互获得新的认知能力,可能是一条必要的补充路径。
将这两个方向结合起来看,OpenAI的长期愿景正在浮现:一个能够理解、操控数字世界和物理世界的通用AI系统。这不仅是技术愿景,更是一个关于AI未来的宏大赌注。
参考来源: