Google 在 I/O 2026 開發者大會正式發表全新 AI 影片模型「Gemini Omni」,主打「任何素材都能生成任何內容」,並率先支援 AI 影片生成。不同於過去只能單純輸入文字生成影片,Gemini Omni 能混合圖片、影片、語音與文字素材,甚至透過聊天方式直接修改影片內容。究竟 Gemini Omni 怎麼用?如何使用它來生成影片?這篇教學帶你一次看懂。
▲Gemini Omni 可以製作 10 秒影片、內建語音生成、將相片轉成影片(最多 5 張),但有些新功能目前還暫時無法使用,使用前務必特別留意!
另外,目前影片輸出功能雖然已經開放使用,但圖片、音訊等更多輸出模態仍會分階段推出。至於 AI 虛擬化身(Avatar)與語音修改功能,目前 Google 也還在測試與安全評估階段。
▲打開 Gemini App,接著點擊左下角「+號」,然後選擇「影片」,最後再點擊「相簿」、「相機」或「檔案」等檔案來源,上傳你欲編輯成影片的檔案。
▲接著在對話框中輸入你想生成的內容,點擊發送就可以開始生成影片了。
▲靜待一段時間後,Gemini Omni 就會生成出符合生成條件的影片了,你可以點擊影片右上角的「下載」鍵,將影片下載到手機,以便分享到社群媒體或分享給親友。
▲實際測試 Gemini Omni,目前並沒有 Google 官方說的那麼厲害,會有不自然的說話口音、繁體中文怪異等問題,再加上生成不到 10 次就遇到使用上限的問題,都讓使用體驗不如預期。
Gemini Omni 可以說是 Google 目前最接近「AI 導演」概念的一項技術,不只讓 AI 影片生成變得更簡單,也大幅降低創作門檻。過去需要剪輯軟體、特效工具甚至動畫團隊才能完成的內容,現在只靠幾句對話就有機會快速完成。隨著未來支援更多輸出模態與 API 開放,Gemini Omni 很可能會成為下一波 AI 影音創作的重要核心工具。
Gemini Omni 是什麼?
Gemini Omni 最大特色,在於它不只是單純的 AI 影片工具,而是 Google 首款真正結合「推理能力 + 創作能力」的原生多模態模型。用戶可以直接上傳照片、草圖、影片甚至語音檔,讓 Gemini Omni 自動生成完整影片,還能透過自然語言持續修改內容,例如改變場景、加入角色、調整動作、切換風格或重新設計背景。Google 也特別強調,Gemini Omni 對於物理邏輯、角色一致性與場景連續性的理解大幅提升,影片看起來會更自然、更接近真實世界。Gemini Omni 有哪些使用限制?
目前 Gemini Omni 仍有一些使用限制。現階段率先推出的是「Gemini Omni Flash」版本,僅開放給 Google AI Plus、Google AI Pro 與 Google AI Ultra 訂閱用戶搶先體驗,主要透過 Gemini App、Google Flow、YouTube Shorts 與 YouTube Create 使用,並且只能生成 10 秒短片、將相片轉成影片 (最多 5 張)。
另外,目前影片輸出功能雖然已經開放使用,但圖片、音訊等更多輸出模態仍會分階段推出。至於 AI 虛擬化身(Avatar)與語音修改功能,目前 Google 也還在測試與安全評估階段。
Gemini Omni 怎麼用它來生成影片?
想使用 Gemini Omni 生成影片,目前主要可透過 Gemini App 或 Google Flow 操作,整體流程其實很像跟 AI 聊天,實際操作步驟如下:▲實際測試 Gemini Omni,目前並沒有 Google 官方說的那麼厲害,會有不自然的說話口音、繁體中文怪異等問題,再加上生成不到 10 次就遇到使用上限的問題,都讓使用體驗不如預期。
Gemini Omni 可以說是 Google 目前最接近「AI 導演」概念的一項技術,不只讓 AI 影片生成變得更簡單,也大幅降低創作門檻。過去需要剪輯軟體、特效工具甚至動畫團隊才能完成的內容,現在只靠幾句對話就有機會快速完成。隨著未來支援更多輸出模態與 API 開放,Gemini Omni 很可能會成為下一波 AI 影音創作的重要核心工具。
Sponsor
相關新聞
2025/07/13
最新消息
2026/05/24
2026/05/23
熱門新聞
2026/04/28
留言