• 【超完整懶人包】認識比特幣!原理與應用全面解析|動區新手村
  • Account
  • Account
  • BlockTempo Beginner – 動區新手村
  • Change Password
  • Forgot Password?
  • Home 3
  • Login
  • Login
  • Logout
  • Members
  • Password Reset
  • Register
  • Register
  • Reset Password
  • User
  • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
  • 動區動趨 BlockTempo – 最有影響力的區塊鏈新聞媒體 (比特幣, 加密貨幣)
  • 所有文章
  • 最完整的「區塊鏈入門懶人包」|動區新手村
  • 服務條款 (Terms of Use)
  • 關於 BlockTempo
  • 隱私政策政策頁面 / Privacy Policy
動區動趨-最具影響力的區塊鏈新聞媒體
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
  • 所有文章
  • 搶先看
  • 🔥動區專題
  • 🔥Tempo 30 Award
  • 加密貨幣市場
    • 市場分析
    • 交易所
    • 投資分析
    • 創投
    • RootData
    • 比特幣 BTC 即時價格
    • 以太幣 ETH 即時價格
    • Solana SOL 即時價格
    • 瑞波幣 XRP 即時價格
    • Pi Network PI 即時價格
  • 區塊鏈商業應用
    • 金融市場
    • 銀行
    • 錢包
    • 支付
    • defi
    • 區塊鏈平台
    • 挖礦
    • 供應鏈
    • 遊戲
    • dApps
  • 技術
    • 比特幣
    • 以太坊
    • 分散式帳本技術
    • 其他幣別
    • 數據報告
      • 私人機構報告
      • 評級報告
  • 法規
    • 央行
    • 管制
    • 犯罪
    • 稅務
  • 區塊鏈新手教學
  • 人物專訪
    • 獨立觀點
  • 懶人包
    • 比特幣概念入門
    • 從零開始認識區塊鏈
    • 區塊鏈應用
  • 登入
No Result
View All Result
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Home 區塊鏈商業應用 AI

喜歡特斯拉聲音?xAI 正式開放 Grok 語音 API,TTS 每百萬字元 4.2 美元、辨識率擊敗 ElevenLabs

Token 形上學 by Token 形上學
2026-04-19
in AI
A A
喜歡特斯拉聲音?xAI 正式開放 Grok 語音 API,TTS 每百萬字元 4.2 美元、辨識率擊敗 ElevenLabs
36
SHARES
分享至Facebook分享至Twitter

xAI 本週正式推出獨立的 Grok 語音轉文字(STT)與文字轉語音(TTS)API,這套技術棧已在 Grok Voice、特斯拉車輛與 Starlink 客服系統中實際運行。STT 定價為批次每小時 $0.10、串流每小時 $0.20,支援 25 種以上語言。
(前情提要:Grok 4.3 beta 開放 Heavy 訂閱用戶!馬斯克:真正旗艦版本初訓 5 天後完成)
(背景補充:Google 上線 Gemini 3.1 Flash TTS:音訊標籤讓 AI 配音更生動、支援 70+ 語言,Google AI Studio 免費體驗)

本文目錄

Toggle
  • STT:詞級時間戳+說話者區分,批次轉錄每小時僅 0.1 美元
  • TTS:5 種語音個性+語音標籤,每百萬字元 4.2 美元
  • 同一技術棧已驅動特斯拉與 Starlink

 

同一套讓特斯拉車輛開口說話、讓 Starlink 客服回應使用者的語音技術,現在透過 API 對外開放了。xAI  17 日正式宣布推出獨立的 Grok 語音轉文字(STT)與文字轉語音(TTS)API,讓外部開發者得以直接呼叫這套已在 xAI 旗下產品中運作的語音基礎設施。

STT:詞級時間戳+說話者區分,批次轉錄每小時僅 0.1 美元

根據官方說明,Grok STT API 提供兩種接入模式:透過 REST API 進行批次處理,以及透過 WebSocket API 進行低延遲即時串流。定價方面,批次處理為每小時 $0.10、串流為每小時 $0.20,官方表示相較 ElevenLabs 和 Deepgram 等主流競爭對手,定價具備顯著優勢。

功能面,Grok STT 支援 25 種以上語言,具備詞級時間戳、說話者區分(speaker diarization),以及多聲道音訊和智慧反向文字規範化。適合會議轉錄、法律與醫療記錄、客服通話日誌等需要高精確度的企業場景。

在實體識別基準測試中,Grok STT 展現出優勢。在電話通話中辨識姓名、帳號、日期等關鍵實體時,Grok STT 的錯誤率為 5.0%,而 ElevenLabs 為 12.0%、Deepgram 為 13.5%、AssemblyAI 則高達 21.3%。

TTS:5 種語音個性+語音標籤,每百萬字元 4.2 美元

Grok TTS API 提供五種各具風格的語音選項:Ara(女聲,溫暖親切)、Eve(女聲,活潑積極)、Leo(男聲,權威有力)、Rex(男聲,自信清晰)、Sal(中性,流暢均衡)。

API 自動偵測輸入語言,原生支援 20 種以上語言,並透過 BCP-47 語言程式碼控制發音。

音訊輸出格式涵蓋 MP3、WAV、PCM(Linear16)、G.711 μ-law 以及 G.711 A-law,後兩者為電話系統常見的電話編解碼格式,顯示 xAI 對電信業整合的布局。

TTS API 的特色功能是「語音標籤」,開發者可以在文字中內嵌指令,精細控制停頓、笑聲、耳語、語調強調、語速與音高,讓合成語音更貼近人類自然表達。定價為每百萬字元 $4.20。

同一技術棧已驅動特斯拉與 Starlink

xAI 強調,兩項 API 背後並非全新研發的技術,而是已在 Grok Voice、特斯拉車輛語音互動,以及 Starlink 客戶支援系統中實際執行的相同基礎設施。

這套基礎設施首先在 2025 年底以 Grok Voice Agent API 的形式亮相,當時提供即時語音對話代理能力,並在 Big Bench Audio 基準測試中排名第一,首次音訊回應時間低於 1 秒,約為最近競爭對手的 5 倍速度。

此次推出的 STT 和 TTS 獨立端點,等於將這套整合式語音管道的個別元件拆分開放,讓開發者可以依需求組合。

加入動區 Telegram 頻道

📍相關報導📍

Grok 4.3 beta 開放 Heavy 訂閱用戶!馬斯克:真正旗艦版本初訓 5 天後完成

Google 上線 Gemini 3.1 Flash TTS:音訊標籤讓 AI 配音更生動、支援 70+ 語言,Google AI Studio 免費體驗

Gemini App 正式登陸 Mac 桌面:Option+Space 一鍵喚醒,螢幕共享讓 AI 直讀資料

馬斯克 Terafab 來台挖角!三倍薪找 2 奈米與 CoWoS 人才;台積電魏哲家:這行沒有捷徑

Tags: ElevenLabsGrokTTSxAI語音識別


關於我們

動區動趨

為您帶來最即時最全面
區塊鏈世界脈動剖析
之動感新聞站

訂閱我們的最新消息

動區精選-為您整理一週間的國際動態

戰略夥伴

Foresight Ventures Foresight News MEXC

主題分類

  • 關於 BlockTempo

動區動趨 BlockTempo © All Rights Reserved.

No Result
View All Result
  • 所有文章
  • 搶先看
  • 市場脈動
  • 商業應用
  • 區塊鏈新手教學
  • 區塊鏈技術
  • 數據洞察
  • 政府法規
  • RootData
  • 登入

動區動趨 BlockTempo © All Rights Reserved.