Xuedong Huang ist Chief Technology Officer (CTO). Vor Zoom war er bei Microsoft, wo er als CTO und Technical Fellow von Azure AI tätig war. Er hat im KI-Bereich eine glanzvolle Karriere vorzuweisen: Er gründete 1993 die Sprachtechnologiegruppe von Microsoft und führte die KI-Teams von Microsoft dazu, einige der ersten Meilensteine der Branche auf dem Niveau menschlicher Parität bei Spracherkennung, maschineller Übersetzung, natürlichem Sprachverständnis und Computer Vision zu erreichen. Darüber hinaus ist er IEEE- und ACM-Fellow und gewähltes Mitglied der National Academy of Engineering und der American Academy of Arts and Sciences.
Xuedong erhielt 1989 seinen Ph.D. in Elektrotechnik von der Universität Edinburgh (gefördert durch die britische ORS und den Edinburgh University Scholarship), 1984 seinen M.Sc. in Informatik von der Universität Tsinghua und 1982 seinen B.Sc. in Informatik von der Universität Hunan.
Technologie kann ein großartiger Gleichmacher sein. Das gilt auch für künstliche Intelligenz. Sie eröffnet uns Möglichkeiten, die uns vorher verschlossen waren. Bei der Weiterentwicklung der Funktionen und Fähigkeiten von Zoom AI Companion ist es uns ein wichtiges Anliegen, dass unsere Produkte eine echte Bereicherung für die Kunden sind. Mit Ergebnissen von höchster Qualität sollen sie ihnen effizientes, produktives Arbeiten ermöglichen.
Unsere Kunden nutzen AI Companion in verschiedensten Branchen, von Finanzdienstleistungen über das Gesundheits- und Bildungswesen bis hin zu Behörden. An Schulen und Universitäten nutzen Studierende und Lehrkräfte die KI-Funktionen von Zoom bereits für mehr Barrierefreiheit im Unterricht. Im Gesundheitswesen können Patienten ihre Termine virtuell wahrnehmen. Dabei erweitern Transkriptions- und Zusammenfassungsfunktionen den Zugang zur Versorgung.
Der Einsatz von KI für einen besseren Zugang zu Technologien beschränkt sich aber nicht nur auf Untertitel für Hörgeschädigte. Auch Sprachbarrieren lassen sich mit ihr abbauen. Als ich vor 35 Jahren zum Studium nach Edinburgh in Schottland ging und mein Englisch noch nicht so gut war, halfen mir Untertitel, wenn ich BBC schaute. Dabei erkannte ich, was gute Untertitel und Übersetzungen für Menschen auf der ganzen Welt bewirken können. Heute wird KI schon in recht großem Maßstab genutzt. Unser Ziel ist nun, ihre Qualität weiter zu verbessern, damit noch mehr Menschen von ihrem Potenzial profitieren können.
Durch die nahtlose Integration von Arbeits- und Onlinedaten kann Zoom AI Companion 2.0 die Zoom Workplace-Erfahrung eindrucksvoll bereichern. KI-Funktionen sind auf vielfältige Weise in Zoom Workplace eingebettet. Doch es gibt einen Aspekt von AI Companion, der unsere meistgenutzten KI-Funktionen, wie Meeting-Zusammenfassungen, Aktionspunkte und Transkripte, erst möglich macht.
Diese KI-Funktionen sind nur so gut wie die Transkriptionen, auf die sie zugreifen. Viele unserer beliebten Funktionen, wie z. B. Fragen im Meeting, basieren auf einer hochwertigen Spracherkennung. Mit einem verlässlichen Transkript kann die KI Namen, Themen und Absichten genau erfassen, die dann als Grundlage für Zusammenfassungen, Highlights und umsetzbare Erkenntnisse dienen.
Der Branchenstandard zur Messung der Transkriptionsgenauigkeit ist die Wortfehlerquote (Word Error Rate, WER). Sie gibt die Unterschiede zwischen einem von einem Menschen erstellten und einem KI-generierten Transkript als Prozentsatz an. Zoom hat in den letzten Jahren daran gearbeitet, unsere KI-Architektur so zu modernisieren, dass die WER immer kleiner wird. Durch diese Minimierung der WER erstellen wir präzise, zuverlässige Transkripte, mit denen unsere Kunden effektive, umsetzbare Ergebnisse erzielen können.
Bei einer WER-Analyse werden fehlende Wörter rot dargestellt. Der blaue Text sind Wörter, die im Ausgangstranskript nicht enthalten sind.
Genauere Transkripte von Zoom zur Unterstützung von KI-Funktionen
Die Ergebnisse waren eindeutig: Zoom AI Companion übertraf Microsoft Teams mit einer deutlich niedrigeren WER und erreichte eine höhere Transkriptionsgenauigkeit. Bei Meetings kommt es auf jedes Wort an. Da können selbst kleinste Transkriptionsfehler große Auswirkungen auf Zusammenfassungen, Aufgaben oder Antworten auf Fragen haben, die während des Meetings gestellt werden.
So hat TestDevLab die Tests angelegt und durchgeführt:
Es wurden drei aufgezeichnete Meetings mit zwei bis 16 Teilnehmern verwendet.
Die Dateien wurden synchron auf verschiedenen Computern wiedergegeben, die mit dem Meeting verbunden waren.
Aus Gründen der Konsistenz wurde jeder Test mit jeder Plattform fünfmal wiederholt.
Bei jedem Test wurden Zoom Workplace und Microsoft Teams verglichen und die Wortfehlerquoten für die einzelnen Meetings gemessen.
Bei der Messung der Wortfehlerquote (Word Error Rate, WER) weist ein niedrigerer Prozentsatz auf eine höhere Qualität der Transkription hin.
Meeting-Zusammenfassungen und -Transkriptionen gehören zu den beliebtesten und meistgenutzten Funktionen vieler KI-Plattformen. Sie sind beliebt, weil sie Zeit sparen und viele Menschen es als nützlich empfinden, wichtige Informationen direkt lesen, zusammenfassen und besser verstehen zu können. Gerade weil sie so viel genutzt werden, ist es wichtig, dass Fehler auf ein Minimum reduziert werden.
TestDevLab hat Zoom Workplace und Microsoft Teams auch hinsichtlich der Qualität von Meeting-Zusammenfassungen und dialogorientierter KI (z. B. Antwortstabilität) beurteilt. Um die Zusammenfassungen zu bewerten, wurde ein LLM-Assistent mit von Menschen validierten Ergebnissen erstellt.
Gute Transkripte als ideale Grundlage für nachgelagerte KI-Funktionen
Die Transkription ist nicht die einzige Funktion von AI Companion, die TestDevLab untersucht hat. Im Gegensatz zu Transkripten sollen andere KI-Funktionen wie Meeting-Zusammenfassungen keine Wort-für-Wort-Kopie erstellen. Stattdessen sollen sie eine auf die Erwartungen der Benutzer zugeschnittene Version der Geschehnisse liefern.
TestDevLab hat Zoom Workplace und Microsoft Teams auch hinsichtlich der Qualität von Meeting-Zusammenfassungen und dialogorientierter KI (z. B. Antwortstabilität) beurteilt. Um die Zusammenfassungen zu bewerten, wurde ein LLM-Assistent mit von Menschen validierten Ergebnissen erstellt.
In dieser Beurteilung wurden zwei Zusammenfassungsfunktionen in Microsoft Teams getestet: die Intelligente Besprechungszusammenfassung, die mit Teams Premium- oder Microsoft 365 Copilot-Lizenzen verfügbar ist, und die Prompt-basierte Zusammenfassungsfunktion des KI-Assistenten Microsoft Copilot in Teams-Besprechungen. Da Copilot Zusammenfassungen nur anhand von Prompts generieren kann, haben wir Copilot aufgefordert, am Ende der Besprechung eine Zusammenfassung und Aktionspunkte zu erstellen.
Zum Test der dialogorientierten KI hat TestDevLab gemessen, wie gut die KI-Plattformen Fragen während eines Meetings beantworten. Dabei wurden sowohl Fragen zum Meeting-Kontext als auch zu davon unabhängigen Websuchen gestellt, wie etwa „Was ist das höchste Gebäude der Welt?“. Sowohl bei der Reaktionszeit als auch bei der Stabilität (d. h. alle Meeting-Teilnehmer erhalten eine ähnliche Antwort) schnitt Zoom AI Companion besser ab als Microsoft.
Eine höhere Stabilität lässt darauf schließen, dass die KI von Zoom allen Teilnehmern durchweg zuverlässige Antworten liefert und so zu einem reibungslosen Meeting-Ablauf beiträgt.
Bessere, einheitliche Meeting-Erfahrung mit Zoom AI Companion
Diese Ergebnisse verdeutlichen unser Engagement für Qualität bei Zoom Workplace und AI Companion. Wir möchten Menschen ermöglichen, leichter miteinander in Kontakt zu treten, effizienter zu sein und bei der Arbeit Unterstützung durch künstliche Intelligenz zu erhalten. KI-generierte Meeting-Transkriptionen sind nur eine Möglichkeit, wie AI Companion für mehr Gleichberechtigung in Meetings sorgen kann, etwa für gehörlose, schwerhörige und neurodiverse Menschen sowie für Menschen, die eine andere Sprache sprechen als die übrigen Teilnehmer.
In dieser von TestDevLab durchgeführten Bewertung hatten Zoom Workplace und AI Companion bei der KI-Leistung die Nase vorn: Die Transkriptionen waren präziser, die Antwortzeiten bei Fragen im Meeting kürzer und die dialogorientierten KI-Funktionen stabiler als bei den getesteten Wettbewerbern.
Darüber hinaus ist AI Companion bei kostenpflichtigen Zoom Konten ohne zusätzliche Kosten in Zoom Workplace enthalten. Bei anderen Plattformen fallen für jeden Benutzer, dem KI-Funktionen bereitgestellt werden, zusätzliche Gebühren an. Wir bei Zoom halten es für wichtig, diese präzisen, revolutionären Tools so vielen Kunden wie möglich zur Verfügung zu stellen. Dabei kümmern wir uns zuerst um die Grundlagen – die Erstellung genauer Transkripte. Darauf aufbauend entwickeln wir außergewöhnliche KI-Erfahrungen für alle unsere Kunden.
Wenn Sie kein geeignetes kostenpflichtiges Zoom Abo haben, führen Sie jetzt ein Upgrade durch, mit dem Sie die Vorteile von AI Companion nutzen können.
Zoom Blog abonnieren
Die neuesten Zoom-Posts direkt in Ihrem E-Mail-Posteingang