
科技巨頭 Google(GOOGL) 今日宣佈為其人工智慧助理 Gemini 新增自定義音樂生成功能,目前已於桌面版應用程式率先推出測試版 (Beta)。這項新功能讓使用者能夠透過多元的方式進行創作,不僅支援文字指令,還能根據圖像或影片內容生成音樂,大幅降低了音樂創作的門檻,展現生成式 AI 在多媒體應用上的突破。
DeepMind 最新模型 Lyria 3 支援多模態輸入與歌詞創作
這項新功能的核心動力來自 Google DeepMind 開發的最新一代音樂生成模型 Lyria 3。使用者在輸入提示後,系統能產出長達 30 秒的音樂曲目,若有需求還能同步生成歌詞。此外,透過內建的 AI 影像生成器 Nano Banana,系統還會自動為每首樂曲設計專屬的封面藝術圖。目前該服務已支援英文、德文、西班牙文、法文、印地文、日文、韓文及葡萄牙文等多種語言,Google(GOOGL) 也承諾未來將持續擴展語言支援的廣度與品質。
整合 YouTube Shorts 生態並將於近日推向行動裝置
為了強化創作者生態圈,Lyria 3 模型也同步導入 YouTube 的 Dream Track 功能中,讓 YouTube Shorts 的短影音創作者能夠直接使用該技術製作專屬背景音樂。雖然目前 Gemini 的音樂生成功能僅限於桌面版使用,但 Google(GOOGL) 表示,預計在未來幾天內就會將此功能推送到行動版應用程式,讓使用者能隨時隨地進行 AI 音樂創作。
嚴格把關版權規範避免侵犯藝術家權益
在推動 AI 創新的同時,Google(GOOGL) 也特別強調對版權的重視。官方聲明指出,雖然部分生成的音樂靈感可能源自真實藝術家,但該功能的設計初衷絕非為了模仿特定歌手或侵犯既有內容。為了維護創作者權益,Google 建議藝術家或使用者若發現有潛在的版權侵權疑慮,應立即透過檢舉機制回報,以確保平台的合規性與創作環境的健康發展。
Apple 與 Spotify 競相投入 AI 音樂功能佈局
隨著生成式 AI 技術成熟,音樂串流市場的競爭日益白熱化。除了 Google(GOOGL) 之外,其他競爭對手也積極利用 AI 優化產品體驗。例如 Apple(AAPL) 近期在針對開發者釋出的 iOS 測試版本中,加入了能根據訂閱戶聆聽紀錄自動生成 AI 播放清單的功能;而串流音樂龍頭 Spotify(SPOT) 早在 2024 年就已針對 Premium 訂閱戶推出類似的 AI 輔助功能,顯示各大平台正加速搶攻 AI 音樂應用的市佔率。
發表
我的網誌