从视频生成到世界模型:CVPR 2025 重磅教程来了!
一次跳跃、一场碰撞,是否只是像素的移动,还是蕴藏着因果、物理与交互的世界逻辑?
随着 AIGC 的飞速发展,图像生成已经"卷"入日常,视频生成也不再是最初的"抖动幻影",而是跃升为能够讲故事、控制动作、进行较长时推理的高质量动态内容。
可灵、Sora、Genie、Cosmos、Movie Gen 等一系列模型的突破正在不断拓宽视频生成的边界,研究者们开始重新关注更深层次的问题:
- 视频生成是否能成为通往世界模型的桥梁?
- 它是否具备成为可执行、可交互、可推理的智能中枢?
- 它是否正在走向支撑具身智能(Embodied Intelligence)的核心能力?
这些问题正是我们将在《From Video Generation to World Models – 从视频生成到世界模型》中深入探讨的核心议题。我们希望系统梳理这一技术路径:
如何将视频生成作为强大的视觉先验,赋能 AI 感知世界、理解交互、推理物理,从而迈向更通用、更具具身智能能力的世界模型。
官网地址:https://world-model-tutorial.github.io/
顶尖讲者,重磅阵容集结
本教程汇聚来自学术界与产业界的一线研究者:
他们将在生成建模、3D理解、强化学习与物理推理等方向展开分享,探讨如何将生成能力转化为感知、预测与决策的智能基座。
日程安排一览(CVPR 2025 |6 月 11 日)
时间 | 内容 |
08:30 – 08:40 | 开场致辞 |
08:40 – 09:30 | 特邀讲座1 |
09:30 – 10:20 | 特邀讲座2 |
10:20 – 10:40 | 茶歇 |
10:40 – 11:30 | 特邀讲座3 |
12:00 – 13:30 | 午休 |
13:30 – 14:20 | 特邀讲座4 |
14:20 – 15:10 | 特邀讲座5 |
15:10 – 15:30 | 茶歇 |
15:30 – 16:20 | 特邀讲座6 |
16:20 – 17:10 | 特邀讲座7 |
不只是生成,更是理解与交互
视频生成技术本身,已经初步展现出对时空一致性、视觉因果链的建模能力。我们更关心的是:
●它是否能被用来理解物体之间的交互?
●是否能捕捉人类行为背后的物理与语义因果?
●是否具备从"生成"走向"交互式世界模型(Interactive World Model)"的潜力?
可灵、Sora、Genie、Cosmos、Movie Gen 等模型的发展已提供初步答案:
视频生成可以不仅仅是输出,更是通向感知-建模-推理-决策一体化世界模型的入口。
✅ 如果你正在关注:
●视频生成与多模态理解
●Embodied AI、机器人与交互智能
●用生成式模型进行世界建模与物理推理
那么,这场教程将为你提供思路、工具与未来研究的方向感。
教程组织团队
时间:2025年6月11日
地点:美国 Music City Center, Nashville TN
欢迎大家现场参与,一起探讨:
如何以视频生成为基石,迈向理解、交互与建模真实世界的下一代智能系统。
生成只是起点,理解世界、构建智能,才是终局。
Video is just the start. World modeling is the goal.
最新资讯
亚马逊云科技入局Vibe Coding,推出Kiro重塑开发流程
马斯克的XAI推出【智能伙伴】功能,居然支持18禁模式?
Google开源了一个AI命令行神器,程序员狂欢!这就是传说中的Gemini CLI
Cursor AI编程工具模型全面解析:2025年最新完整模型列表与深度对比
用Veo 3+Suno做了个AI Rapper,吊打音乐节上的流量明星
热门工具
Cursor
Cursor是一款AI驱动的代码编辑器,专为提升开发者生产力而设计。它集成了强大的AI功能,包括智能代码补全、自然语言编程、代码生成和重构等,让编程变得更加高效和直观。

Kimi
Moonshot AI推出的智能助手,支持200万字超长文本处理,具备强大的文档理解分析能力、多格式文件解析和深度推理功能,适合学术研究和商务应用。

DeepSeek
DeepSeek是一家专注于AGI的AI公司推出的大语言模型,具备O1级别的深度推理能力、强大的代码生成能力和数学推理能力,以极低成本提供高质量AI服务。

ChatGPT
OpenAI公司开发,AI时代的开创者和先行者。

Leonardo.Ai - Image Generator
Ai , the ultimate AI art image generator, now available on iOS

Microsoft 365 Copilot
Microsoft 365 Copilot 应用是一款用于工作和生活的日常高效办公应用,可帮助你在一个应用中随时随地使用 Microsoft 365 Co...,支持多种AI功能。

创客贴设计-AI海报图片设计、拼图抠图作图神器
创客贴设计--“打工人”必备AI作图神器 创客贴设计为用户提供丰富的AI智能作图工具,如AI海报、AI商品图、智能抠图、AI消除、智能改图、AI绘画等,输...,支持多种AI功能。

百度文库-DeepSeek R1联网满血版
百度文库,一站式智能写作与文档资源集合平台,正式接入DeepSeek R1满血版,文档查找、编辑、资料管理一应俱全,AI内容生成能力再升级,办公学习好助手,支持多种AI功能。