近日,OpenAI推出的视频生成模型Sora引起了广泛关注。虽然Sora功能强大, 但也引发了人们的猜想,Sora到底懂不懂物理世界?
Sora在生成复杂场景时面临了诸多物理挑战。例如,在生成“海盗船在咖啡杯中缠斗”的场景时,Sora需要调整海盗船和咖啡杯的尺寸比例,模拟液体动力学效果,处理光线和阴影,以及确保海盗船的运动符合物理规律。这些都对AI模型提出了更高的要求。
然而,图灵奖得主Yann LeCun对Sora的能力持保留意见。他认为,仅仅根据Prompt生成逼真的视频并不能证明模型真正理解了物理世界。相反,他认为更理想的做法是生成视频后续内容的抽象表达,并消除与可能采取的动作无关的场景细节。
Keras之父François Chollet也表达了对Sora模型的关注。他认为,尽管Sora嵌入了物理模型,但该模型是否准确、能否泛化到新的情况仍是未知数。这些问题将决定生成图像的应用范围,是仅限于媒体生产还是可以用作现实世界的模拟。
总之,Sora模型的出现为视频生成领域带来了新的挑战和机遇。未来,我们期待看到更多关于该模型的研究和改进,以及其在现实世界中的应用潜力。