• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

Meta發表語音生成AI模型 “Voicebox”:「上下文學習」完成文本轉語音、為元宇宙化身配音

Natalia Wu by Natalia Wu
2023-06-17
in AI
A A
Meta發表語音生成AI模型 “Voicebox”:「上下文學習」完成文本轉語音、為元宇宙化身配音

Souce: Milenio

181
SHARES
分享至Facebook分享至Twitter

Meta 在今日公布自家研發的語音生成 AI 模型 “Voicebox”,可以執行語音生成任務,例如編輯、採樣和語音風格塑造,這種技術在未來可以用來幫助創作者輕鬆編輯音軌,讓視障人士能夠用他們的聲音聽到朋友的書面訊息,並讓人們能夠用自己的聲音說任何外語。
(前情提要:前進矽谷考察AI公司》走完微軟、Google、Nvidia、Meta的心得是? )
(背景補充:Meta再裁數千人!轉型自製「AI晶片MTIA」;祖克伯:將打造人工智慧運算中心)

 

社群巨頭 Meta 今(17)日宣佈在語音生成式 AI 方面取得突破性進展,發表自家研發的語音生成 AI 模型 “Voicebox”,號稱這是第一個可以將未經專門訓練的文本轉成語音生成任務的「最通用語音生成 AI」。

Voicebox 可以執行語音生成任務,例如編輯、採樣和語音風格塑造,而這些任務統避開了傳統的語音合成(Text-To-Speech,TTS) 架構, 不需使用精選的訓練數據對每項任務進行專門訓練,可以通過「上下文學習」來完成」。

延伸閱讀:Meta再裁數千人!轉型自製「AI晶片MTIA」;祖克伯:將打造人工智慧運算中心

Meta 推出語音生成 AI 模型:Voicebox

利用 Meta 的突破性技術,Voicebox 能夠支持多樣的任務,包括:

  • 上下文文本到語音合成:使用短至兩秒的音頻樣本,Voicebox 可以匹配樣本的音頻風格並將其用於文本到語音的生成。未來預計可以為言語功能障礙人士提供語音生成功能、讓視障人士聽到 AI 朗讀朋友的書面消息,或是允許人們為元宇宙中的虛擬助手和非玩家角色提供聲音。
  • 語音編輯和降噪:Voicebox 可以重新創建被噪音打斷的部分語音或替換說錯的詞,而無需重新錄製整個語音,就像用於音頻編輯的橡皮擦一樣。
  • 跨語言風格轉換:Voicebox 目前支援英語、法語、德語、西班牙語、波蘭語和葡萄牙語,如給定一段文本,能夠用上述支援語言閱讀翻譯後的文本內容。這個功能預計能幫助人們能夠用自己的聲音說任何外語(即使他們不會說該種外語)。
  • 多樣化的語音採樣:從不同的數據中學習後,Voicebox 可以生成更能代表人們在現實世界中使用上述六種語言的談話方式的語音。未來,此功能可用於語音生成合成數據,以幫助更好地訓練語音助手模型。

    Meta 表示現階段仍不計劃向公眾發佈 Voicebox 應用程式和開源它的程式碼,如同 AI 換臉技術被濫用在詐騙上,該公司也坦承認識到這項工具帶來濫用和意外傷害的可能性,並聲稱為此構建了一個分類器,以區分真實的音頻和 Voicebox 生成的語音,旨在減輕這些未來可能存在的風險。

 

📍相關報導📍

中國的AI發展有多強?《經濟學人》剖析中美差距

AI免費線上課程!哈佛、Google、微軟、OpenAI.. 分享8堂人工智慧教學

Meta Q1財報》元宇宙再虧40億鎂;祖克伯要AI部門買大量顯卡

Tags: MetaVoicebox生成式AI語音生成


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.