リーダーボードを表示
Zoom Speechは、Open ASRリーダーボードでトップクラスのモデルとして評価 リーダーボードを表示
close banner
Zoom AIサービス: Scribe API
Zoom AIサービス: Scribe API

世界で最も正確な音声テキスト変換API

ZoomのASR Model Proを搭載した、信頼できる高品質な文字起こし。

 

HuggingFace Open ASRリーダーボードでトップクラスのモデルに評価されたScribe APIは、毎日数百万ものZoomミーティングを支えているものと同じASRに基づいて構築されており、Fast Syncと一括文字起こしの両方のサービスを提供します。

Zoom AIサービス: Scribe API
機能
機能

音声テキスト変換に必要な全機能

準リアルタイムから一括処理まで、Zoom Scribe APIは高精度かつ高速な文字起こしサービスを提供します。

高速同期文字起こし

高速同期文字起こし

個々のオーディオファイルに対して、同期された低遅延の文字起こしにアクセスします。一度に1つのファイルを処理し、完了後すぐにレスポンスを返します。

一括文字起こし

一括文字起こし

録音済みのオーディオファイルやビデオファイルを大規模に処理します。フォーマットを自動検出し、MP3、WAV、MP4、FLAC、OGGなどをサポートします。

単語レベルのタイムスタンプ

単語レベルのタイムスタンプ

単語ごとに正確な開始時間と終了時間を取得し、完璧な字幕生成、オーディオ検索、コンテンツインデックス作成を可能にします。

今すぐ試す

その精度を実際にご確認ください

マイクをクリックして、ブラウザのオーディオ入力を使用して文字起こしのシミュレーションを行います。デモは英語でのみご利用いただけます。

Zoom Scribe API Playground
マイクをクリックして、文字起こしのでもを開始
文字起こしのアウトプット
Latency: Confidence:

文字起こしはここに表示されます...

パフォーマンス
パフォーマンス

Zoom Speechは、Open ASRリーダーボードでトップクラスのモデルとして評価

Zoomの音声認識テクノロジーが、自動音声認識(ASR)パフォーマンスのグローバルベンチマークであるOpen ASRリーダーボードでトップクラスのモデルとして評価されました。このマイルストーンは、音声テクノロジーにおける当社の絶え間ない卓越性の追求と、Zoom AI ServicesのScribe APIの優れたパフォーマンスを反映したものです。
このモデルの主な特長は以下のとおりです。

  • クラス最高の精度: 大規模な処理に対応する当社のイノベーションフレームワークは、モデル品質を継続的に強化しており、精度と読みやすさが重視される環境において、最高水準の文字起こし結果を提供します。
  • エンタープライズ用語の習熟: ビジネスや技術的な文脈に向けて最適化されたこのモデルは、社名、製品用語、業界特有の専門用語を正確に処理します。これはミーティング、サポートの通話、専門的なドキュメントにおいて極めて有用です。
  • ハルシネーションの低減: Zoomの高度なモデリング戦略により、文字起こしにおける「ハルシネーション」を最小限に抑えます。これにより、認識された内容は不自然な言葉や無関係な言葉ではなく、話者の意図を忠実に反映したものになります。
ユースケース
ユースケース

あらゆる会話に対応

役員会議室からコンタクトセンターまで、Zoom Scribe APIは話し言葉を実行可能なインテリジェンスへと変換します。

デベロッパーファースト
デベロッパーファースト

数分で文字起こしを開始できます

  • ドキュメントが充実したシンプルなAPI
  • REST APIおよびOpenAPI仕様
  • 包括的なエラー処理
  • 非同期ジョブ用のWebhookコールバック
料金
料金

シンプルで透明性の高い料金

透明性の高い料金体系です。Scribe APIの使用にはプリペイドクレジットが適用されます。

開発者向けリソース

Zoom Scribe APIの統合、構築、展開に必要なすべてが揃っています。

先進的な音声テキスト変換APIで構築する準備を整えましょう