🌐 教授使用GPT-4和DELL-3进行多模态历史模拟,通过互动方式改变历史走向,丰富了历史教学。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
小型语言模型(SLM)已经出现,成本效益和可持续发展的考虑将加速这一趋势。
看上去,这种「简单的美好」很容易实现,但为何其他游戏难以复刻?事实上,这背后有着多个结实的骨架在支撑着。
项目地址:https://top.aibase.com/tool/paint3d