Zoom AI 服務：Scribe API

Zoom AI 服務：Scribe API

全球最精準的語音轉文字 API

值得信賴的高品質轉錄文字，由 Zoom 的 ASR Model 專業版提供支援。

Scribe API 榮獲 HuggingFace Open ASR 排行榜評選為表現最佳的模型，提供快速同步和批次轉錄服務，而這些服務則是建立於每天為數百萬場 Zoom 會議提供支援的相同 ASR 技術之上。

試用示範取得 API 金鑰

Zoom AI 服務：Scribe API

功能

語音轉文字所需的一切

從近乎即時到批次處理，Zoom Scribe API 提供高準確度和速度的轉錄服務。

快速同步轉錄

存取個別音訊檔案的同步、低延遲轉錄內容。一次處理一個檔案，完成後立即回覆。

批次轉錄

大規模處理預先錄製的音訊和視訊檔案。支援 MP3、WAV、MP4、FLAC、OGG 等格式，並具備自動格式偵測功能。

字層級時間戳記

取得每個單字的精確開始和結束時間，進而實現完美的字幕生成、音訊搜尋和內容索引。

使用自有儲存空間

將您的轉錄文字安全地儲存於您自己的 AWS S3 貯體中，以增強資料控制和法規遵循。

發言者辨識

自動標註多方對話中的不同發言者，且準確度極高。（即將推出）

多語言支援

使用在各種資料集上訓練而成、具有強大口音識別能力的模型，以多語言和方言進行轉錄。（即將推出）

立即試用

親自體驗準確性

按一下麥克風即可使用瀏覽器的音訊輸入模擬轉錄。示範僅提供英文版。

Zoom Scribe API Playground

按一下麥克風即可開始示範轉錄

轉錄輸出

Latency: — Confidence: —

轉錄文字將顯示於此處…

績效

Zoom Speech 在 Open ASR 排行榜上名列前茅

我們很榮幸與大家分享，Zoom 的語音辨識技術在 Open ASR Leaderboard（自動語音辨識排行榜）上名列前茅，該排行榜為全球自動語音辨識效能的基準。此里程碑體現我們對於語音技術卓越性的不懈追求，以及 Zoom AI 服務的 Scribe API的強大實力。
此模型的主要優點包括：

業界頂尖的準確度：我們可擴展的創新框架持續提升模型品質，在準確性和可讀性至關重要的領域提供業界頂尖的轉錄結果。
精通企業術語：該模型針對商業和技術語境進行最佳化，可準確處理公司名稱、產品術語和特定領域的行話 — 這正是會議、支援電話和專業文件的關鍵優勢。
減少幻覺：Zoom 的進階建模策略最大限度地減少轉錄文字中的「幻覺」，因此識別出的內容能真實反映發言者的目的，而非人為的或無關緊要的詞語。

使用案例

專為每一次對話打造

從董事會議室到 Contact Center，Zoom Scribe API 可將口頭語言轉換為可據以行動的情報。

Contact Center 分析工具

轉錄客戶通話、偵測情緒、識別主題和挖掘見解，以提升代理人績效。
媒體處理

將錄音轉換為帶有時間戳記的轉錄文字和字幕，以便編輯和搜尋。
對話式智慧應用程式

將精準的語音轉文字功能整合至任何對話平台或應用程式，用於虛擬助理、自動轉接，進而提供無縫的客戶自助服務體驗。
企業級知識管理

擷取並轉錄數千場錄製的會議、全員大會和網路研討會，建立集中且可即時搜尋的企業知識庫。
教育科技與課程存檔

非同步轉錄整個過往講座和線上課程的資料庫，建立全面的學習指南，並確保嚴格遵守無障礙存取法規遵循。
市場研究與質性分析

快速轉錄數百小時的焦點小組錄製檔案、使用者訪談和實地研究內容，加速主題分析和報告撰寫。

開發人員優先

幾分鐘內即可開始轉錄

簡單且文件齊全的 API
REST API 和 OpenAPI 規範
全面的錯誤處理
適用於非同步工作的 Webhook 回撥

查看 API 文件

定價

簡單透明的定價

套用預付額度，即可享有 Zoom Scribe API 的透明費率。

Scribe API 快速版

Scribe API 批次版

開發人員資源

使用 Zoom Scribe API 進行整合、建構和發布，滿足您所需的一切。

包含每個端點範例的 API 參考資料

快速啟動指南

從零開始完成您的第一份轉錄文字

範例應用程式：探索現成的應用程式

Postman Collection：使用預先建構的請求立即測試端點

開發人員論壇：提出問題和分享技巧

開始使用

查看定價