查看排行榜
Zoom Speech 在 Open ASR 排行榜上名列前茅 查看排行榜
close banner
Zoom AI 服務:Scribe API
Zoom AI 服務:Scribe API

全球最精準的語音轉文字 API

值得信賴的高品質轉錄文字,由 Zoom 的 ASR Model 專業版提供支援。

 

Scribe API 榮獲 HuggingFace Open ASR 排行榜評選為表現最佳的模型,提供快速同步和批次轉錄服務,而這些服務則是建立於每天為數百萬場 Zoom 會議提供支援的相同 ASR 技術之上。

Zoom AI 服務:Scribe API
功能
功能

語音轉文字所需的一切

從近乎即時到批次處理,Zoom Scribe API 提供高準確度和速度的轉錄服務。

快速同步轉錄

快速同步轉錄

存取個別音訊檔案的同步、低延遲轉錄內容。一次處理一個檔案,完成後立即回覆。

批次轉錄

批次轉錄

大規模處理預先錄製的音訊和視訊檔案。支援 MP3、WAV、MP4、FLAC、OGG 等格式,並具備自動格式偵測功能。

詞級時間戳記

字層級時間戳記

取得每個單字的精確開始和結束時間,進而實現完美的字幕生成、音訊搜尋和內容索引。

使用自有儲存空間

使用自有儲存空間

將您的轉錄文字安全地儲存於您自己的 AWS S3 貯體中,以增強資料控制和法規遵循。

發言者辨識

發言者辨識

自動標註多方對話中的不同發言者,且準確度極高。(即將推出)

多語言支援

多語言支援

使用在各種資料集上訓練而成、具有強大口音識別能力的模型,以多語言和方言進行轉錄。(即將推出)

立即試用

親自體驗準確性

按一下麥克風即可使用瀏覽器的音訊輸入模擬轉錄。示範僅提供英文版。

Zoom Scribe API Playground
按一下麥克風即可開始示範轉錄
轉錄輸出
Latency: Confidence:

轉錄文字將顯示於此處…

績效
績效

Zoom Speech 在 Open ASR 排行榜上名列前茅

我們很榮幸與大家分享,Zoom 的語音辨識技術Open ASR Leaderboard(自動語音辨識排行榜)上名列前茅,該排行榜為全球自動語音辨識效能的基準。此里程碑體現我們對於語音技術卓越性的不懈追求,以及 Zoom AI 服務的 Scribe API的強大實力。
此模型的主要優點包括:

  • 業界頂尖的準確度:我們可擴展的創新框架持續提升模型品質,在準確性和可讀性至關重要的領域提供業界頂尖的轉錄結果。
  • 精通企業術語:該模型針對商業和技術語境進行最佳化,可準確處理公司名稱、產品術語和特定領域的行話 — 這正是會議、支援電話和專業文件的關鍵優勢。
  • 減少幻覺:Zoom 的進階建模策略最大限度地減少轉錄文字中的「幻覺」,因此識別出的內容能真實反映發言者的目的,而非人為的或無關緊要的詞語。
開發人員優先
開發人員優先

幾分鐘內即可開始轉錄

  • 簡單且文件齊全的 API
  • REST API 和 OpenAPI 規範
  • 全面的錯誤處理
  • 適用於非同步工作的 Webhook 回撥
定價
定價

簡單透明的定價

套用預付額度,即可享有 Zoom Scribe API 的透明費率。

Scribe API 快速版

開發人員資源

使用 Zoom Scribe API 進行整合、建構和發布,滿足您所需的一切。

準備好使用領先的語音轉文字 API 進行開發