查看排行榜
Zoom Speech 在 Open ASR 排行榜上名列前茅 查看排行榜
close banner
Zoom AI 服務:Scribe API
Zoom AI 服務:Scribe API

全球最精準的語音轉文字 API

值得信賴的高品質轉錄文字,由 Zoom 的 ASR Model 專業版提供支援。

 

Scribe API 榮獲 HuggingFace Open ASR 排行榜評選為表現最佳的模型,提供快速同步和批次轉錄服務,而這些服務則是建立於每天為數百萬場 Zoom 會議提供支援的相同 ASR 技術之上。

Zoom AI 服務:Scribe API
功能
功能

語音轉文字所需的一切

從近乎即時到批次處理,Zoom Scribe API 提供高準確度和速度的轉錄服務。

快速同步轉錄

快速同步轉錄

存取個別音訊檔案的同步、低延遲轉錄內容。一次處理一個檔案,完成後立即回覆。

批次轉錄

批次轉錄

大規模處理預先錄製的音訊和視訊檔案。支援 MP3、WAV、MP4、FLAC、OGG 等格式,並具備自動格式偵測功能。

詞級時間戳記

字層級時間戳記

取得每個單字的精確開始和結束時間,進而實現完美的字幕生成、音訊搜尋和內容索引。

立即試用

親自體驗準確性

按一下麥克風即可使用瀏覽器的音訊輸入模擬轉錄。示範僅提供英文版。

Zoom Scribe API Playground
按一下麥克風即可開始示範轉錄
轉錄輸出
Latency: Confidence:

轉錄文字將顯示於此處…

績效
績效

Zoom Speech 在 Open ASR 排行榜上名列前茅

我們很榮幸與大家分享,Zoom 的語音辨識技術Open ASR Leaderboard(自動語音辨識排行榜)上名列前茅,該排行榜為全球自動語音辨識效能的基準。此里程碑體現我們對於語音技術卓越性的不懈追求,以及 Zoom AI 服務的 Scribe API的強大實力。
此模型的主要優點包括:

  • 業界頂尖的準確度:我們可擴展的創新框架持續提升模型品質,在準確性和可讀性至關重要的領域提供業界頂尖的轉錄結果。
  • 精通企業術語:該模型針對商業和技術語境進行最佳化,可準確處理公司名稱、產品術語和特定領域的行話 — 這正是會議、支援電話和專業文件的關鍵優勢。
  • 減少幻覺:Zoom 的進階建模策略最大限度地減少轉錄文字中的「幻覺」,因此識別出的內容能真實反映發言者的目的,而非人為的或無關緊要的詞語。
開發人員優先
開發人員優先

幾分鐘內即可開始轉錄

  • 簡單且文件齊全的 API
  • REST API 和 OpenAPI 規範
  • 全面的錯誤處理
  • 適用於非同步工作的 Webhook 回撥
定價
定價

簡單透明的定價

套用預付額度,即可享有 Zoom Scribe API 的透明費率。

開發人員資源

使用 Zoom Scribe API 進行整合、建構和發布,滿足您所需的一切。

準備好使用領先的語音轉文字 API 進行開發