Visualizza la classifica
Zoom Speech si posiziona tra i primi modelli nella classifica Open ASR Leaderboard Visualizza la classifica
close banner
Zoom AI Services: Scribe API
Zoom AI Services: Scribe API

L’API di conversione da voce a testo più accurata al mondo

Trascrizione di qualità affidabile, resa possibile dal modello ASR Pro di Zoom.

 

Classificato come uno dei modelli migliori nella classifica HuggingFace Open ASR, Scribe API offre sia servizi di sincronizzazione rapida che di trascrizione batch, basati sullo stesso sistema ASR che supporta milioni di riunioni Zoom ogni giorno.

Zoom AI Services: Scribe API
Funzionalità
Funzionalità

Tutto quello che ti serve per la sintesi vocale

Dal quasi tempo reale all’elaborazione batch, Zoom Scribe API offre servizi di trascrizione con grande precisione e velocità.

Trascrizione con sincronizzazione veloce

Trascrizione sincronizzata rapida

Accedi alla trascrizione sincrona a bassa latenza per singoli file audio. Elabora un file alla volta con risposta immediata dopo il completamento.

Trascrizione batch

Trascrizione batch

Elabora file audio e video preregistrati su larga scala. Supporto per MP3, WAV, MP4, FLAC, OGG e altro ancora con rilevamento automatico del formato.

Data/ora a livello di parola

Marcatori temporali a livello di parola

Ottieni tempi precisi di inizio e fine per ogni parola, consentendo una generazione perfetta dei sottotitoli, la ricerca audio e l’indicizzazione dei contenuti.

Prova ora

Verifica tu stesso

Fai clic sul microfono per utilizzare l’input audio del tuo browser per simulare una trascrizione. Demo disponibile solo in inglese.

Zoom Scribe API Playground
Fai clic sul microfono per avviare una trascrizione dimostrativa
Output di trascrizione
Latency: Confidence:

La trascrizione apparirà qui...

Prestazioni
Prestazioni

Zoom Speech si posiziona tra i primi modelli nella classifica Open ASR Leaderboard

Siamo orgogliosi di condividere che la tecnologia di riconoscimento vocale di Zoom è tra i modelli migliori dell’Open ASR Leaderboard, un benchmark globale per le prestazioni di riconoscimento automatico del parlato (ASR). Questo traguardo riflette la nostra incessante ricerca dell’eccellenza nella tecnologia vocale e la forza della Scribe API di Zoom AI Services.
I punti di forza chiave del modello includono:

  • Precisione ai massimi livelli: il nostro framework di innovazione scalabile migliora continuamente la qualità del modello, garantendo risultati di trascrizione di altissimo livello proprio dove l’accuratezza e la leggibilità sono fondamentali.
  • Padronanza della terminologia Enterprise: ottimizzato per contesti aziendali e tecnici, il modello gestisce con precisione nomi di aziende, termini relativi ai prodotti e gergo specifico del settore: un vantaggio fondamentale per riunioni, chiamate all’assistenza e documentazione professionale.
  • Riduzione delle allucinazioni: le strategie di modellazione avanzate di Zoom riducono al minimo le “allucinazioni” nella trascrizione, in modo che ciò che viene riconosciuto rifletta fedelmente l’intenzione di chi parla, senza parole artificiali o estranee.
Prima gli sviluppatori
Prima gli sviluppatori

Inizia a trascrivere in pochi minuti

  • API semplici e ben documentate
  • API REST e specifiche OpenAPI
  • Gestione completa degli errori
  • Richiamate automatiche webhook per lavori asincroni
Prezzi
Prezzi

Prezzi semplici e trasparenti

Applica crediti prepagati al tuo utilizzo di Scribe API con tariffe trasparenti.

Risorse per sviluppatori

Tutto ciò che ti serve per integrare, costruire e distribuire con Zoom Scribe API.

Pronto a creare con un’API leader per il riconoscimento vocale