Ver clasificación
Zoom Speech se encuentra entre los principales modelos del ranking de Open ASR Ver clasificación
close banner
Zoom AI Services: API Scribe
Zoom AI Services: API Scribe

La API de conversión de voz a texto más precisa del mundo

Transcripción de calidad en la que puede confiar, impulsada por el Modelo ASR Pro de Zoom.

 

La API Scribe, clasificada como uno de los modelos de mejor rendimiento en el ranking Open ASR de HuggingFace, ofrece servicios de sincronización rápida y transcripción por lotes, usando como base el mismo sistema ASR que hace posibles millones de reuniones de Zoom cada día.

Zoom AI Services: API Scribe
Capacidades
Capacidades

Todo lo que necesita para la conversión de voz a texto

La API Scribe de Zoom proporciona servicios de transcripción con alta precisión y velocidad, tanto en el procesamiento casi en tiempo real como en el procesamiento por lotes.

Transcripción de sincronización rápida

Transcripción con sincronización rápida

Acceda a transcripciones sincrónicas y de baja latencia para archivos de audio individuales. Procese un archivo a la vez con respuesta inmediata una vez completado.

Transcripción por lotes

Transcripción por lotes

Procese archivos de audio y vídeo pregrabados a gran escala. Compatibilidad con MP3, WAV, MP4, FLAC, OGG y más con detección automática de formato.

Marcas de tiempo para cada palabra

Marcas de tiempo por palabra

Obtenga tiempos de inicio y finalización precisos para cada palabra, lo que permite generar subtítulos perfectos, buscar en el audio e indexar el contenido.

Use su propio almacenamiento

Utilice su propio almacenamiento

Guarde sus transcripciones de forma segura en su propio bucket de AWS S3 para mejorar el control y el cumplimiento normativo de los datos.

Diarización de oradores

Diarización de oradores

Etiquete automáticamente a los diferentes oradores en conversaciones de varios participantes con alta precisión (próximamente).

Compatibilidad multilingüe

Compatibilidad multilingüe

Transcriba en varios idiomas y dialectos con modelos robustos en cuanto a acentos, entrenados en conjuntos de datos diversos (próximamente).

Pruébelo ahora

Compruebe la precisión en persona

Haga clic en el micrófono para utilizar la entrada de audio de su navegador y simular una transcripción. Demostración disponible solo en inglés.

Entorno de pruebas de la API de Zoom Scribe
Haga clic en el micrófono para iniciar una transcripción de demostración
Resultado de la transcripción
Latency: Confidence:

La transcripción aparecerá aquí...

Rendimiento
Rendimiento

Zoom Speech se encuentra entre los principales modelos del ranking de Open ASR

Nos enorgullece comunicar que la tecnología de reconocimiento de voz de Zoom se sitúa entre los mejores modelos del ranking Open ASR, punto de referencia mundial en cuanto al rendimiento del reconocimiento automático de voz (Automatic Speech Recognition, ASR). Este hito refleja nuestra búsqueda incesante de la excelencia en lo que respecta a la tecnología de voz y la fortaleza de la API Scribe de Zoom AI Services.
Los principales puntos fuertes del modelo incluyen:

  • Precisión de primera clase: nuestro marco de innovación ampliable mejora continuamente la calidad del modelo, proporcionando resultados de transcripción de primer nivel donde la precisión y la legibilidad son lo más importante.
  • Dominio de las terminologías empresariales: el modelo, optimizado para contextos comerciales y técnicos, maneja con precisión nombres de empresas, términos de productos y jerga específica del dominio, una gran ventaja para reuniones, llamadas de soporte y documentación profesional.
  • Reducción de alucinaciones: las estrategias avanzadas de modelado de Zoom reducen las «alucinaciones» de transcripción al mínimo, para que el audio reconocido refleje la verdadera intención del hablante, no palabras artificiales o superfluas.
El desarrollador en primer lugar
El desarrollador en primer lugar

Empiece a transcribir en cuestión de minutos

  • API sencillas y bien documentadas
  • Especificaciones de API REST y OpenAPI
  • Gestión exhaustiva de errores
  • Callbacks de webhook para trabajos asíncronos
Precios
Precios

Precios sencillos y transparentes

Aplique créditos de prepago al uso de la API Scribe con tarifas transparentes.

API Scribe Fast

Recursos para desarrolladores

Todo lo que necesita para integrar, crear e implementar con la API Scribe de Zoom.

Listo para desarrollar con una API líder de conversión de voz a texto