7 月 10 日消息,谷歌今天在 Gemini 應用中上線了基于 Veo 3 模型的圖像轉視頻功能,用戶可以將照片變成帶有背景音效、環境聲、語音的 8 秒鐘短視頻。
谷歌表示,這項視頻功能現已在部分地區向 AI Ultra 和 AI Pro 用戶開放,今起先在網頁版推出,移動端將在本周逐步上線。

使用時,Gemini 用戶只需點擊提示欄的“工具”,選擇“視頻”,上傳照片并添加提示詞,描述希望照片如何動起來。用戶還可以加入對白、音效或環境聲等音頻描述,谷歌表示音頻和畫面會實現“完美同步”。最終視頻為 720p、16:9 橫屏的 MP4 格式。
谷歌表示,用戶可以為日常物品賦予動畫效果,讓繪畫作品“活”起來,或為自然景象添加動態,盡情發揮創意。據IT之家了解,所有生成視頻均帶有明顯的 AI 水印和隱形的 SynthID 數字水印。