AI Companion Reunión y chat

Dar prioridad a la calidad de la IA para mejorar la accesibilidad y la colaboración

Zoom AI Companion 2.0 supera a sus competidores probados en reconocimiento del habla e inteligencia artificial para reuniones.

Actualizado el November 20, 2024

Publicado el November 14, 2024

Dar prioridad a la calidad de la IA para mejorar la accesibilidad y la colaboración
Xuedong Huang
Xuedong Huang
Director de Tecnología

Xuedong Huang es el   director de Tecnología (CTO). Antes de Zoom, trabajó en Microsoft, donde se desempeñó como director de Tecnología y colaborador técnico de Azure AI. Su trayectoria es destacada en el ámbito de la IA: fundó el grupo de tecnología del discurso de Microsoft en 1993, dirigió los equipos de IA de Microsoft para alcanzar varios de los primeros hitos de paridad humana del sector en reconocimiento del habla, traducción automática, comprensión del lenguaje natural y visión por computadora, es miembro del IEEE y la ACM y miembro electo de la Academia Nacional de Ingeniería y la Academia Estadounidense de las Artes y las Ciencias.

Xuedong obtuvo su doctorado en Ingeniería Eléctrica en la Universidad de Edimburgo en 1989 (patrocinado por la beca británica ORS y la Universidad de Edimburgo), su maestría en Ciencias de la Computación en la Universidad de Tsinghua en 1984 y su licenciatura en Ciencias de la Computación en la Universidad de Hunan en 1982.

La tecnología puede ser un excelente ecualizador, y la inteligencia artificial no es una excepción. Puede ayudarnos a lograr cosas que antes no podíamos hacer. A medida que continuamos desarrollando características y capacidades para Zoom AI Companion, somos muy conscientes de cómo nuestros productos pueden ayudar a potenciar a nuestros clientes y nos comprometemos a ofrecer resultados de la más alta calidad para que puedan ser eficientes y tener éxito en su trabajo.

Nuestros clientes utilizan AI Companion en todos los sectores, como los servicios financieros, la atención médica, la educación y el gobierno, entre otros. Hoy en día, en la educación y las universidades, alumnos y docentes ya utilizan las capacidades de IA de Zoom para mejorar la accesibilidad de las clases. En la atención médica, las personas acuden a citas virtuales y utilizan las capacidades de transcripción y resumen para ampliar el acceso a la atención. 

El uso de la IA para hacer más accesible la tecnología no solo está reservado a los subtítulos para las personas con discapacidad auditiva, sino también para eliminar las barreras lingüísticas. Cuando era estudiante hace 35 años en Edimburgo, Escocia, y todavía estaba aprendiendo inglés, no solo me beneficié de los subtítulos cuando veía la BBC, sino que también me mostraron lo que los subtítulos y la traducción precisos pueden hacer por las personas de todo el mundo. El uso de la IA ya está bastante extendido, y queremos seguir mejorando la calidad para abrir las posibilidades a más personas.

Nuestro éxito en las transcripciones de reuniones es una parte de este recorrido e incide en muchos aspectos de cómo la IA puede aumentar las propias habilidades y experiencia de una persona para ayudarla a llegar aún más lejos. Eso podría incluir subtítulos automatizados en directo en una reunión o seminario web, traducir subtítulos en directo a otro idioma o utilizar AI Companion para transcribir reuniones para su uso en resúmenes de reuniones, grabaciones inteligentes, elementos de acción y más. Crear una experiencia de reunión más accesible y equitativa en un entorno empresarial global beneficia a todos.

El reconocimiento del habla preciso es la base de Zoom AI Companion

A principios de este año, compartí cómo nuestro enfoque federado de la IA igualaba o superaba el de otros modelos de IA con un gasto mucho menor. Hoy me complace compartir los hallazgos de una evaluación reciente del rendimiento de Zoom AI encargada a TestDevLab, que consolida aún más a Zoom AI Companion 2.0 como líder en reconocimiento del habla e inteligencia de reuniones en comparación con otras herramientas de IA probadas. 

Zoom AI Companion 2.0 integra perfectamente la información del trabajo y de la web para ofrecer una impresionante mejora en la experiencia de Zoom Workplace. Si bien hay muchas formas en que las características de IA están integradas en Zoom Workplace, hay un aspecto de AI Companion que impulsa nuestras características de IA más utilizadas, incluidos los resúmenes de reuniones, los elementos de acción y las transcripciones.

La eficacia de estas características de IA depende de la precisión de las transcripciones de las que proceden. Muchas de nuestras características populares, como hacer preguntas durante la reunión, se basan en el reconocimiento del habla de alta calidad. Una transcripción fiable permite a la IA capturar nombres, temas e intenciones con precisión, lo que constituye la columna vertebral de resúmenes, aspectos destacados e información procesable.

El estándar del sector para medir la precisión de la transcripción es la tasa de errores de palabra (WER), que compara el porcentaje de diferencias entre una transcripción generada por humanos y otra generada por la IA. Zoom ha estado trabajando para modernizar nuestra arquitectura de IA en los últimos años a fin de minimizar la WER. Al minimizar la WER, creamos transcripciones precisas y fiables para ayudar a impulsar resultados eficaces y procesables para nuestros clientes.

En un análisis de WER, el texto rojo representa las palabras omitidas y el texto azul, las palabras que no se encuentran en la transcripción original.

En un análisis de WER, el texto rojo representa las palabras omitidas y el texto azul, las palabras que no se encuentran en la transcripción original. 

 

Zoom ofrece transcripciones más precisas para potenciar las características de IA.

Los resultados fueron claros: Zoom AI Companion superó a Microsoft Teams con una tasa de errores de palabras (WER) significativamente más baja, lo que ofrece un mayor nivel de precisión en la transcripción. En reuniones en las que cada palabra cuenta, incluso pequeños errores de transcripción pueden causar un gran impacto en los resúmenes, las tareas o las respuestas a las preguntas planteadas durante las reuniones.

A continuación, explicamos cómo TestDevLab creó y ejecutó estas pruebas:

  • Utilizaron tres reuniones grabadas, de dos a 16 participantes.
  • Los archivos se reprodujeron de forma sincrónica en equipos individuales conectados a la llamada.
  • Para garantizar la coherencia, cada prueba se repitió cinco veces para cada plataforma.

Para cada prueba, compararon Zoom Workplace y Microsoft Teams, y midieron la tasa de errores de palabras de cada reunión.

Al medir la WER (tasa de errores de palabras), un porcentaje bajo significa una transcripción de mayor calidad.

Al medir la WER (tasa de errores de palabras), un porcentaje bajo significa una transcripción de mayor calidad.

Los resúmenes y las transcripciones de reuniones son algunas de las características más populares y utilizadas en muchas plataformas de IA. Dado que su uso está tan extendido, es aún más importante asegurarse de reducir al máximo los errores. Son populares porque ahorran tiempo y a las personas les resulta muy útil leer, resumir y comprender mejor la información importante.

TestDevLab también clasificó a Zoom Workplace y Microsoft Teams en calidad de resúmenes de reuniones e IA conversacional (como la estabilidad de las respuestas). Para evaluar los resúmenes, crearon un asistente de LLM con resultados validados por humanos.

Las transcripciones sólidas crean una mejor base para las características posteriores de IA.

La transcripción no es la única característica de AI Companion que midió TestDevLab. A diferencia de las transcripciones, los objetivos de otras características de IA, como los resúmenes de reuniones, no son ofrecer una copia palabra por palabra, sino proporcionar una versión personalizada de lo que sucedió que cumpla con las expectativas de los usuarios. 

TestDevLab también clasificó a Zoom Workplace y Microsoft Teams en calidad de resúmenes de reuniones e IA conversacional (como la estabilidad de las respuestas). Para evaluar los resúmenes, crearon un asistente de LLM con resultados validados por humanos.

En esta evaluación, probamos dos capacidades de resumen dentro de Microsoft Teams: la característica Resumen inteligente, disponible con una licencia de Teams Premium o Microsoft 365 Copilot, y la capacidad de generación de resúmenes basada en indicaciones del Asistente de IA de Microsoft Copilot en Teams Meetings. Dado que el Asistente de IA Copilot solo puede generar resúmenes basados en indicaciones, le pedimos a Copilot que creara un resumen y elementos de acción al final de la reunión.

En esta evaluación, probamos dos capacidades de resumen dentro de Microsoft Teams: la característica Resumen inteligente, disponible con una licencia de Teams Premium o Microsoft 365 Copilot, y la capacidad de generación de resúmenes basada en indicaciones del Asistente de IA de Microsoft Copilot en Teams Meetings. Dado que el Asistente de IA Copilot solo puede generar resúmenes basados en indicaciones, le pedimos a Copilot que creara un resumen y elementos de acción al final de la reunión.

En cuanto a la IA conversacional, TestDevLab midió cómo las plataformas de IA lograban responder a preguntas durante una reunión, tanto preguntas relacionadas con el contexto de la reunión como búsquedas web no relacionadas, como «¿Cuál es el edificio más alto del mundo?». Tanto en tiempo como en estabilidad de respuesta (la capacidad de que todos los participantes de la reunión reciban una respuesta similar), Zoom AI Companion superó a Microsoft.

Una mayor estabilidad indica que la IA de Zoom ofrece respuestas fiables de manera constante a todos los participantes, lo que proporciona una experiencia más fluida durante las reuniones.

Una mayor estabilidad indica que la IA de Zoom ofrece respuestas fiables de manera constante a todos los participantes, lo que proporciona una experiencia más fluida durante las reuniones.

 

Zoom AI Companion proporciona una experiencia de reunión mejor y más equitativa.

Estos resultados destacan nuestro compromiso con la calidad en Zoom Workplace y AI Companion. Nos esforzamos por crear una forma para que las personas se conecten más fácilmente entre sí, sean más eficientes en su día a día y tengan la oportunidad de utilizar la inteligencia artificial para apoyar su trabajo. Las transcripciones de reuniones generadas por IA son solo una de las formas en que las personas pueden usar AI Companion para ayudar a crear una experiencia más equitativa para muchas personas, incluidas las personas sordas, con dificultades auditivas, neurodiversas y aquellas que pueden hablar un idioma diferente del de otras personas en la reunión.

Esta evaluación llevada a cabo por TestDevLab destaca a Zoom Workplace y a AI Companion como líderes en rendimiento de IA, con una precisión de transcripción superior, tiempos de respuesta más rápidos a las preguntas durante la reunión y capacidades de IA conversacional más estables en comparación con los competidores probados.

Además, Zoom Workplace ofrece AI Companion sin coste adicional para las cuentas de pago de Zoom, a diferencia de algunas plataformas alternativas, que cobran un cargo extra por cada usuario adicional al que se le conceden características de AI. En Zoom, creemos que es importante poner estas herramientas precisas y transformadoras a disposición de la mayor cantidad posible de clientes. Comenzamos por la base ―crear transcripciones de alta calidad― y seguimos creando experiencias de IA excepcionales para todos nuestros clientes.

Si no tiene un plan de pago de Zoom elegible, actualícelo hoy mismo para acceder a los beneficios de AI Companion.

Nuestros clientes nos prefieren

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom: una plataforma para conectar