En noviembre de 2023, expliqué cómo el enfoque de IA federada de Zoom alcanzaba una calidad casi igual a la GPT-4 de OpenAI con solo un 6 % del coste de inferencia. A pesar de lo impresionantes que fueron esos resultados, ahora podemos ofrecer una calidad de IA aún mejor en comparación con la GPT-4 de OpenAI para nuestras características de reuniones más populares. Zoom AI Companion redujo los errores relativos en más de un 20 % (para los «resúmenes» de reuniones de Zoom) y un 60 % (para los «siguientes pasos») en comparación con GPT-4 en nuestra evaluación comparativa interna a ciegas con validación humana.
Para respaldar nuestros esfuerzos de formación y perfeccionar la calidad de la realización de tareas, nuestro excepcional enfoque federado de la IA aprovecha la colaboración de muchos grandes modelos lingüísticos (LLM) tanto de código cerrado como de código abierto, para lograr mejores resultados. Esto contrasta con otros proveedores que están vinculados a LLM específicos. Por ejemplo, Microsoft Copilot se basó en GPT-4 y Google, en Gemini.
Este enfoque de la IA es lo que distingue a Zoom AI Companion, que ofrece a nuestros clientes una experiencia de alta calidad con nuestras características más populares. Como expliqué en mi última actualización, utilizamos nuestro propio sistema de puntuación Z para juzgar la calidad de los resultados generados por la IA. En primer lugar, empleamos el LLM de menor coste que resulte más adecuado para cada tarea. A continuación, nuestro sistema de puntuación Z evalúa la calidad de la finalización de la tarea inicial. Si es necesario, podemos utilizar otro LLM complementario para optimizar la tarea. Este proceso genera un resultado de mayor calidad, del mismo modo que un equipo de personas puede obtener más logros en conjunto que de manera individual.
Desde entonces, hemos mejorado nuestro sistema de puntuación Z incorporando indicadores de calidad adicionales procedentes de diversos LLM. Además, para adaptarnos mejor a las preferencias humanas, hemos mejorado el aprendizaje federado de refuerzo. Al federar el LLM de Zoom junto con una serie de LLM complementarios, el popular resumen de reuniones de Zoom ofrece resultados de alta calidad y, según nuestra reciente evaluación comparativa, ahora puede superar a GPT-4, que se utiliza para impulsar Copilot en Microsoft Teams.
Respecto de la seguridad de la IA, también redujimos el sesgo inherente a la mayoría de los LLM mediante la formación de un comité compuesto por múltiples LLM como Claude-3, Gemini y GPT-4 para reducir las alucinaciones y mejorar nuestro LLM de Zoom. Por ejemplo, es poco probable que diferentes LLM cometan el mismo error de alucinación, por lo que podemos extraer respuestas más coherentes y reducir el impacto de los datos atípicos.