• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

Google 翻譯升級:Gemini 3.5 讓即時語音口譯不再有尷尬停頓

Token 形上學 by Token 形上學
2026-06-10
in AI
A A
Google 翻譯升級:Gemini 3.5 讓即時語音口譯不再有尷尬停頓
36
SHARES
分享至Facebook分享至Twitter

Google 宣布推出 Gemini 3.5 Live Translate,一個能同步翻譯 70 多種語言、保留說話者語調與節奏的即時語音模型,並已同步上線開發者預覽、企業版 Meet 與 Google 翻譯 App。
(前情提要:Google 即時翻譯正式開放所有耳機品牌:70+ 語言上線,美墨印 Android 手機先發 )
(背景補充:林上倫律師專文》當你問 AI 今天中午吃什麼,世界正在為這個提問重新規劃能源版圖)

 

每個月一兆字。這是 Google 翻譯今天的吞吐量,也是它二十年累積的成果。6 月 9 日,Google 在官方部落格宣布推出 Gemini Live API 的最新音訊模型:Gemini 3.5 Live Translate。它的目標只有一個,讓語言不再是對話裡的停頓。

一兆字的起點與終點

Gemini 3.5 Live Translate 的核心是「語音對語音」翻譯,並且要求保留說話者的語調(intonation)、節奏(pacing)與音高(pitch)。

過去的系統要等說話者講完一句才開始翻譯,中間的停頓讓對話節奏完全碎裂。Gemini 3.5 Live Translate 則採用「持續生成」方式,在「等待更多上下文以提升準確度」與「立即輸出以跟上說話者」之間即時調整,整體落差只有幾秒,且自動偵測 70 多種語言,不需手動切換。

Google 同步開放三個入口:透過 Gemini Live API 與 Google AI Studio 的開發者公開預覽;本月起在 Google Meet 啟動的企業私人預覽;以及 Android 與 iOS 上的 Google 翻譯 App 全球更新。

Android 還新增「聆聽模式」,把手機貼近耳朵,翻譯語音就從聽筒播出,不需耳機、也不會打擾旁人,適合在博物館聽外語導覽、或在安靜場合接外語電話。

通路才是護城河

即時語音翻譯並不是 Google 的獨角戲。Meta 的 SeamlessM4T、三星 Galaxy AI 的即時通話翻譯、Apple 的 Live Translation、OpenAI 的 Realtime API,這個賽道已經擠滿了不缺技術也不缺資本的競爭者。

差距在於分發。Google 翻譯 App 的月活躍用戶以十億計,Google Meet 在企業市場的滲透率是現成基礎,Android 裝置的全球出貨量確保了觸及範圍。每一個新功能,都是直接更新進幾十億人已經在用的工具,而不是要他們再裝一個新 App。

Grab 的案例說明瞭這條護城河有多實際。這家東南亞的叫車與外賣平台,正在測試讓司機與乘客透過 Gemini 3.5 Live Translate 進行即時多語溝通。Grab 用戶每月透過其平台撥打超過 1,000 萬通語音通話,這意味著在一個語言高度碎片化的市場(泰語、越南語、馬來語、印尼語、菲律賓語交雜),即時口譯從附加功能變成了基礎設施。

CJ ENM、LiveKit 等早期夥伴也回饋翻譯品質、準確度與延遲均達預期。

加入動區 Telegram 頻道

📍相關報導📍

川普喊停火、以色列卻偏要打!美以同床異夢:一個需要戰爭,一個需要和平

NotebookLM 重大升級:支援 Antigravity 幫你寫程式跑分析,換上 Gemini 3.5 Flash 引擎

蘋果 WWDC 2026 發表新版 Siri AI!結盟 Google Gemini、iOS 27 迎史詩升級

OpenAI 推出「AI照辨識工具」,網紅修圖藏不住了

從 TON 到 BIO:為什麼市場開始重新定價強敘事資產?

Tags: GeminiGoogleGrabSynthID即時翻譯


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News MEXC

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.