人工智能模型所做的遠不止將文本轉換爲語音。
Facebook 和 Instagram 的母公司 Meta 於6 月 16 日宣布了一種名爲 Voicebox 的語音生成 AI 模型。
該公司表示,Voicebox 可以從文本中生成語音,並指出該模型可以根據僅兩秒長的樣本匹配音頻風格。
Voicebox 還可以將文本樣本轉換爲另一種語言,並在給定單獨的語音樣本的情況下,以說話者的原始語音朗讀翻譯後的文本。此功能支持六種語言:英語、法語、德語、西班牙語、波蘭語和葡萄牙語。
AI 模型還可以編輯現有錄音以消除背景噪音。更一般地說,它可以創建以不同語音樣本爲模型的語音。
各種用戶都可以使用 Voicebox
Meta 表示,Voicebox 和其他類似的人工智能模型可以讓其元宇宙中的虛擬助手和非玩家角色擁有逼真的聲音。它說,該工具還可以用於內容創建者和有可訪問性需求的用戶。
Meta 表示,Voicebox 目前是一個研究項目。它沒有說明該功能何時可以公开使用,但它分享了一個演示視頻。
Meta在 6 月初宣布了數款消費類 AI 工具,在 5 月份披露了有關其AI 芯片的詳細信息,並在 4 月份的投資者電話會議上討論了內部 AI 應用。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。