AI Companion Réunion et chat

La qualité de l’IA au service de l’accessibilité et de la collaboration

Zoom AI Companion 2.0 devance ses concurrents testés en matière de reconnaissance vocale et de qualité de l’intelligence générée par l’IA lors des réunions.

Mis à jour le November 20, 2024

Publié le November 14, 2024

La qualité de l’IA au service de l’accessibilité et de la collaboration
Xuedong Huang
Xuedong Huang
Directeur informatique

Xuedong Huang est le directeur informatique. Avant de rejoindre Zoom, il a occupé chez Microsoft le poste de directeur informatique et de Technical Fellow d’Azure AI. Son parcours dans le monde de l’IA est brillant : il a créé le groupe de technologie vocale de Microsoft en 1993 et organisé la mise en place, au sein de l’équipe d’IA de Microsoft, des premières mesures en faveur de la parité dans les domaines de la reconnaissance vocale, de la traduction automatique, de la compréhension du langage naturel et de la vision par ordinateur. Membre de l’IEEE et de l’ACM, il est également membre élu de la National Academy of Engineering et de l’American Academy of Arts and Sciences.

Xuedong Huang a obtenu un doctorat en génie électrique à l’université d’Édimbourg en 1989 (financé par l’ORS britannique et une bourse de l’université d’Édimbourg), une maîtrise en informatique à l’université Tsinghua en 1984 et une licence en informatique à l’université du Hunan en 1982.

La technologie peut être un formidable niveleur et l’intelligence artificielle en est un bon exemple. Elle peut nous aider à accomplir des choses que nous n’étions pas en mesure de faire auparavant. À mesure que nous développons les fonctionnalités et les capacités de Zoom AI Companion, nous restons extrêmement attentifs à la façon dont nos produits peuvent contribuer à l’autonomisation de nos clients et nous nous engageons à fournir des résultats de la plus haute qualité afin qu’ils puissent être efficaces et performants dans leur travail. 

Nos clients utilisent AI Companion dans tous les secteurs, y compris les services financiers, la santé, l’éducation, le gouvernement, etc. Aujourd’hui, dans les écoles et les universités, les étudiants et les enseignants utilisent déjà les capacités d’IA de Zoom pour améliorer l’accessibilité des cours. Dans le domaine de la santé, les patients assistent à des rendez-vous virtuels et utilisent des capacités de transcription et de synthèse pour élargir l’accès aux soins. 

L’utilisation de l’IA pour rendre la technologie plus accessible n’est pas seulement réservée aux sous-titres codés pour les malentendants, mais aussi à l’élimination des barrières linguistiques. Lorsque je faisais mes études à Édimbourg en Écosse il y a 35 ans et que j’apprenais encore l’anglais, j’ai non seulement bénéficié des sous-titres codés pour regarder la BBC, mais j’ai aussi compris ce qu’un sous-titrage et une traduction corrects pouvaient apporter aux populations du monde entier. Le recours à l’IA est déjà très répandu, et nous voulons continuer à en améliorer la qualité pour que davantage de personnes puissent en bénéficier.

Notre succès en matière de transcription de réunions est l’un des éléments de ce parcours. Il touche à de nombreux aspects de la façon dont l’IA peut augmenter les compétences et l’expérience d’une personne pour l’aider à aller encore plus loin. Il peut s’agir de sous-titres automatisés en direct lors d’une réunion ou d’un webinaire, de la traduction de sous-titres en direct dans une autre langue ou de l’utilisation d’AI Companion pour transcrire des réunions en vue d’en faire des synthèses, des enregistrements intelligents, des mesures à prendre, etc. La création d’une expérience de réunion plus accessible et équitable dans un environnement de travail mondial profite à chacun.

La précision de la reconnaissance vocale est au cœur de Zoom AI Companion

Plus tôt cette année, j’ai partagé la façon dont notre approche fédérée de l’IA égalait ou surpassait celle d’autres modèles d’IA à un coût bien moindre. Aujourd’hui, je me réjouis de partager les résultats d’une récente évaluation de la performance de Zoom AI commandée à TestDevLab, qui renforce la position de Zoom AI Companion 2.0 en tant que leader de la reconnaissance vocale et de l’intelligence lors des réunions par rapport à d’autres outils d’IA testés. 

Zoom AI Companion 2.0 intègre de manière transparente les informations professionnelles et les informations Web pour offrir une amélioration impressionnante de l’expérience Zoom Workplace. Bien qu’il y ait de nombreuses façons d’intégrer les fonctionnalités d’IA dans Zoom Workplace, il y a un aspect d’AI Companion qui optimise nos fonctionnalités d’IA les plus utilisées, comme les synthèses de réunions, les mesures à prendre et les transcriptions.

L’efficacité de ces fonctionnalités d’IA dépend de la précision des transcriptions dont elles s’inspirent. Une grande partie de nos fonctionnalités les plus populaires, telles que la possibilité de poser des questions en cours de réunion, reposent sur une reconnaissance vocale de haute qualité. Une transcription fiable permet à l’IA de capturer les noms, les sujets et les intentions avec précision, formant ainsi l’épine dorsale des synthèses, des points forts et des informations exploitables.

La norme du secteur pour mesurer la précision des transcriptions est le taux d’erreur de mots (WER), qui compare le pourcentage de différences entre une transcription générée par un humain et une transcription générée par l’IA. Zoom cherche à moderniser son architecture d’IA depuis plusieurs années afin de minimiser le WER. En réduisant le WER, nous créons des transcriptions précises et fiables pour aider nos clients à obtenir des résultats efficaces et exploitables.

Dans une analyse WER, le texte rouge représente les mots manqués alors que le texte bleu représente les mots non trouvés dans la transcription source.

Dans une analyse WER, le texte rouge représente les mots manqués et le texte bleu représente les mots non trouvés dans la transcription source. 

 

Zoom fournit des transcriptions plus précises pour alimenter les fonctionnalités d’IA

Les résultats sont sans appel : Zoom AI Companion a surpassé Microsoft Teams avec un WER nettement inférieur, offrant un niveau de précision de transcription plus élevé. Dans les réunions où chaque mot compte, des erreurs de transcription, même mineures, peuvent avoir un impact important sur les synthèses, les tâches ou les réponses aux questions posées pendant les réunions.

Voici comment l’équipe TestDevLab a créé et exécuté ces tests :

  • Elle a utilisé trois réunions enregistrées, comprenant de deux à seize participants.
  • Les fichiers ont été lus de manière synchronisée sur des ordinateurs individuels connectés à l’appel.
  • Pour des raisons de cohérence, chaque test a été répété cinq fois pour chaque plateforme.

Pour chaque test, l’équipe a comparé Zoom Workplace et Microsoft Teams, et mesuré le taux d’erreurs de mots pour chaque réunion.

Lors de la mesure du taux d’erreur de mots (WER, Word Error Rate), un faible pourcentage correspond à une transcription de meilleure qualité.

Lors de la mesure du taux d’erreur de mots (WER, Word Error Rate), un faible pourcentage correspond à une transcription de meilleure qualité.

Les synthèses et les transcriptions de réunions font partie des fonctionnalités les plus populaires et les plus utilisées sur de nombreuses plateformes d’IA. Leur utilisation étant très répandue, il est d’autant plus important de veiller à ce que les erreurs soient réduites au maximum. Ces fonctionnalités sont populaires parce qu’elles offrent un gain de temps et parce qu’il est très utile de lire, de synthétiser et de mieux comprendre les informations importantes.

La société TestDevLab a également comparé la qualité des synthèses des réunions et l’IA conversationnelle (comme la stabilité des réponses) de Zoom Workplace et de Microsoft Teams. Pour évaluer les synthèses, elle a créé un assistant LLM avec des résultats validés par l’homme.

Grâce à des transcriptions solides, les fonctionnalités d‘IA en aval reposent sur de meilleures bases

La transcription n’est pas la seule fonctionnalité de Zoom AI Companion mesurée par TestDevLab. Contrairement aux transcriptions, les objectifs d’autres fonctionnalités d’IA telles que les synthèses de réunion ne sont pas de fournir une copie mots pour mots, mais plutôt de fournir une version personnalisée de ce qui s’est passé, correspondant aux attentes des utilisateurs. 

La société TestDevLab a également comparé la qualité des synthèses des réunions et l’IA conversationnelle (comme la stabilité des réponses) de Zoom Workplace et de Microsoft Teams. Pour évaluer les synthèses, elle a créé un assistant LLM avec des résultats validés par l’homme.

Lors de cette évaluation, nous avons testé deux fonctionnalités de synthèse de Microsoft Teams : la fonctionnalité Résumé intelligent, disponible avec une licence Teams Premium ou Microsoft 365 Copilot, et la capacité de génération de synthèse basée sur des requêtes de l’assistant IA de Microsoft Copilot dans les réunions Teams. Étant donné que l’assistant IA de Copilot ne peut générer des synthèses qu’à partir de requêtes, nous avons demandé à Copilot de créer une synthèse et des mesures à prendre à la fin de la réunion.

Lors de cette évaluation, nous avons testé deux fonctionnalités de synthèse de Microsoft Teams : la fonctionnalité Résumé intelligent, disponible avec une licence Teams Premium ou Microsoft 365 Copilot, et la capacité de génération de synthèse basée sur des requêtes de l’assistant IA de Microsoft Copilot dans les réunions Teams. Étant donné que l’assistant IA de Copilot ne peut générer des synthèses qu’à partir de requêtes, nous avons demandé à Copilot de créer une synthèse et des mesures à prendre à la fin de la réunion.

En ce qui concerne l’IA conversationnelle, TestDevLab a mesuré la manière dont les plateformes d’IA parvenaient à répondre à des questions pendant une réunion, tant pour des questions liées au contexte de la réunion que pour des recherches hors contexte sur le Web comme « Quel est le bâtiment le plus haut du monde ? ». En termes de temps de réponse et de stabilité (capacité de tous les participants à la réunion à recevoir une réponse similaire), Zoom AI Companion a surpassé Microsoft.

La stabilité supérieure indique que l’IA de Zoom fournit constamment des réponses fiables à tous les participants, ce qui offre une expérience plus fluide pendant les réunions.

La stabilité supérieure indique que l’IA de Zoom fournit constamment des réponses fiables à tous les participants, ce qui offre une expérience plus fluide pendant les réunions. 

 

Zoom AI Companion offre une expérience de réunion optimisée et plus équitable

Ces résultats soulignent notre engagement en faveur de la qualité à travers Zoom Workplace et AI Companion. Nous nous efforçons de faciliter les contacts entre les personnes, de rendre leur travail plus efficace et de leur donner la possibilité d’utiliser l'intelligence artificielle pour les aider dans leur travail. Les transcriptions de réunions générées par l’IA ne sont qu’un moyen parmi d’autres d’utiliser AI Companion pour créer une expérience plus équitable pour de nombreuses personnes, y compris les sourds, les malentendants, les personnes neurodivergentes et celles qui parlent une langue différente de celle des autres participants à la réunion.

Cette évaluation menée par TestDevLab met en évidence les performances de Zoom Workplace et AI Companion en matière d’IA, avec une précision de transcription supérieure, des temps de réponse aux questions en réunion plus rapides et des capacités d’IA conversationnelle plus stables par rapport aux concurrents testés.

De plus, Zoom Workplace propose AI Companion sans frais supplémentaires pour les comptes Zoom payants, contrairement à d’autres plateformes qui facturent un supplément pour chaque utilisateur supplémentaire bénéficiant des fonctionnalités d’IA. Chez Zoom, nous pensons qu’il est important de mettre ces outils précis et transformationnels à la disposition du plus grand nombre de clients possible. Nous commençons par la base, la création de transcriptions de haute qualité, et continuons à créer des expériences d’IA exceptionnelles pour tous nos clients.

Si vous n’avez pas souscrit un forfait Zoom payant, changez de forfait dès aujourd’hui pour bénéficier de tous les avantages d’AI Companion.

Nos clients nous aiment

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom, une plateforme pour se connecter