AI Companion Spotkanie i czat

Nacisk na jakość sztucznej inteligencji w celu zwiększenia dostępności i poprawy współpracy

Zoom AI Companion 2.0 jest liderem wśród testowanych konkurentów pod względem rozpoznawania mowy i jakości analizy danych ze spotkań generowanych przez sztuczną inteligencję.

Aktualizacja: November 20, 2024

Opublikowano November 14, 2024

Nacisk na jakość sztucznej inteligencji w celu zwiększenia dostępności i poprawy współpracy
Xuedong Huang
Xuedong Huang
Dyrektor ds. technologii

Xuedong Huang jest dyrektorem ds. technologii (CTO). Przed dołączeniem do Zoom pracował w firmie Microsoft, gdzie pełnił funkcję dyrektora ds. technologii i pracownika technicznego ds. sztucznej inteligencji dla platformy Azure. Jego kariera w przestrzeni sztucznej inteligencji jest wybitna: w 1993 r. założył grupę ds. technologii mowy w firmie Microsoft, kierował zespołami ds. sztucznej inteligencji w firmie Microsoft, które osiągnęły kilka pierwszych w branży kamieni milowych w zakresie rozpoznawania mowy na poziomie ludzkim, tłumaczenia maszynowego, rozumienia języka naturalnego i widzenia komputerowego, jest członkiem IEEE i ACM oraz wybranym członkiem Narodowej Akademii Inżynierii i Amerykańskiej Akademii Sztuki i Nauki.

Xuedong uzyskał tytuł doktora nauk ekonomicznych na Uniwersytecie w Edynburgu w 1989 r. (sponsorowany przez brytyjski ORS i stypendium Uniwersytetu w Edynburgu), tytuł magistra informatyki na Uniwersytecie Tsinghua w 1984 r. oraz licencjat z informatyki na Uniwersytecie Hunan w 1982 r.

Technologia może skutecznie wyrównywać szanse, a sztuczna inteligencja nie jest wyjątkiem. Może pomóc nam osiągnąć rzeczy, których wcześniej nie byliśmy w stanie zrobić. W miarę jak kontynuujemy tworzenie funkcji i możliwości dla Zoom AI Companion jesteśmy niezwykle świadomi tego, w jaki sposób nasze produkty mogą pomóc naszym klientom. Dokładamy wszelkich starań, aby dostarczać naszym klientom najwyższej jakości wyniki i wspierać ich wydajność oraz pomagać w odnoszeniu sukcesów w pracy. 

Nasi klienci korzystają z asystenta AI Companion w różnych branżach, w tym w branży usług finansowych, opieki zdrowotnej, edukacji, administracji rządowej i nie tylko. W edukacji i na uniwersytetach uczniowie i nauczyciele już korzystają z możliwości sztucznej inteligencji Zoom, aby poprawić dostępność nauczania. W opiece zdrowotnej pacjenci biorą udział w wirtualnych wizytach lekarskich i korzystają z możliwości transkrypcji i podsumowania, aby rozszerzyć dostęp do opieki. 

Wykorzystanie sztucznej inteligencji do zwiększania dostępności technologii nie jest zarezerwowane tylko dla napisów dla osób niedosłyszących, ale także do przełamywania barier językowych. Kiedy byłem studentem 35 lat temu w Edynburgu w Szkocji i wciąż uczyłem się angielskiego, nie tylko korzystałem z napisów podczas oglądania BBC, ale także pokazało mi to, co dokładne napisy i tłumaczenie mogą zrobić dla ludzi na całym świecie. Wykorzystanie sztucznej inteligencji jest już dość szerokie i chcemy nadal poprawiać jakość, aby otworzyć możliwości dla większej liczby osób.

Nasz sukces w zakresie transkrypcji spotkań jest jednym z elementów tej podróży i dotyka wielu aspektów tego, w jaki sposób sztuczna inteligencja może rozwinąć umiejętności i poprawić doświadczenia danej osoby. Mogą to być zautomatyzowane napisy na żywo podczas spotkania lub webinaru, tłumaczenie napisów na żywo na inny język lub korzystanie z asystenta AI Companion do transkrypcji spotkań w celu ich wykorzystania w podsumowaniach spotkań, inteligentnych nagraniach, zalecanych działaniach i nie tylko. Tworzenie bardziej dostępnego i sprawiedliwych spotkań w globalnym środowisku biznesowym przynosi korzyści wszystkim.

Dokładne rozpoznawanie mowy jest podstawą Zoom AI Companion

Na początku tego roku podzieliłem się informacjami o tym, jak nasze integracyjne podejście do sztucznej inteligencji dorównuje innym modelom AI lub przewyższa je przy znacznie niższych kosztach. Dziś cieszę się, że mogę podzielić się wynikami niedawnej oceny wydajności Zoom AI zleconej TestDevLab, która jeszcze bardziej umacnia Zoom AI Companion 2.0 jako lidera w rozpoznawaniu mowy i analizie danych ze spotkań w porównaniu z innymi testowanymi narzędziami AI. 

Zoom AI Companion 2.0 płynnie integruje informacje firmowe i znalezione w Internecie, zapewniając imponujące udoskonalenie obsługi Zoom Workplace. Chociaż jest wiele sposobów integracji funkcji AI z Zoom Workplace, istnieje jeden aspekt asystenta AI Companion, który wspiera nasze najczęściej używane funkcje AI, w tym podsumowania spotkań, zalecane działania i transkrypcje.

Skuteczność tych funkcji AI zależy od dokładności transkrypcji, z których czerpią. Wiele z naszych popularnych funkcji, takich jak zadawanie pytań podczas spotkania, opiera się na wysokiej jakości rozpoznawaniu mowy. Niezawodna transkrypcja pozwala sztucznej inteligencji na dokładne uchwycenie nazwisk, tematów i zamiarów, tworząc podstawę podsumowań, najważniejszych momentów i przydatnych spostrzeżeń.

Branżowym standardem pomiaru dokładności transkrypcji jest Word Error Rate (WER), który porównuje procent różnic między transkrypcją wygenerowaną przez człowieka a transkrypcją wygenerowaną przez sztuczną inteligencję. Firma Zoom pracowała nad modernizacją naszej architektury AI w ostatnich latach, aby zminimalizować WER. Minimalizując WER, tworzymy precyzyjne, wiarygodne transkrypcje, aby pomóc naszym klientom w uzyskaniu skutecznych wyników umożliwiających podejmowanie działań.

W analizie WER czerwony tekst reprezentuje pominięte słowa, a niebieski tekst reprezentuje słowa, których nie znaleziono w transkrypcji źródłowej.

W analizie WER czerwony tekst reprezentuje pominięte słowa, a niebieski tekst reprezentuje słowa, których nie znaleziono w transkrypcji źródłowej. 

 

Zoom zapewnia dokładniejsze transkrypcje, aby wspierać funkcje AI

Wyniki były jasne: Zoom AI Companion przewyższył Microsoft Teams pod względem znacznie niższego WER, zapewniając wyższy poziom dokładności transkrypcji. Na spotkaniach, na których liczy się każde słowo, nawet drobne błędy w transkrypcji mogą mieć duży wpływ na podsumowania, zadania lub odpowiedzi na pytania zadawane podczas spotkań.

Oto jak firma TestDevLab stworzyła i przeprowadziła te testy:

  • Wykorzystano trzy nagrane spotkania, w których uczestniczyło od dwóch do 16 osób.
  • Pliki były odtwarzane synchronicznie na poszczególnych komputerach podłączonych do połączenia.
  • Aby zapewnić spójność, każdy test został powtórzony pięć razy dla każdej platformy.

W ramach każdego testu porównano Zoom Workplace i Microsoft Teams i zmierzono współczynnik błędów słów dla każdego spotkania.

Podczas pomiaru WER (Word Error Rate), niski procent oznacza wyższą jakość transkrypcji.

Podczas pomiaru WER (Word Error Rate), niski procent oznacza wyższą jakość transkrypcji.

Podsumowania spotkań i transkrypcje to jedne z najpopularniejszych i najczęściej używanych funkcji na wielu platformach AI. Ponieważ są one tak powszechnie używane, jeszcze ważniejsze jest upewnienie się, że błędy są ograniczone w jak największym stopniu. Rozwiązania te są popularne, ponieważ oszczędzają czas, a ludzie znajdują wiele korzyści w czytaniu, podsumowywaniu i lepszym zrozumieniu ważnych informacji.

Firma TestDevLab oceniła również Zoom Workplace i Microsoft Teams pod względem jakości podsumowań spotkań i konwersacyjnej sztucznej inteligencji (takiej jak stabilność odpowiedzi). Aby ocenić podsumowania, stworzono asystenta LLM z wynikami zweryfikowanymi przez człowieka.

Dokładne transkrypcje tworzą lepszą podstawę dla dalszych funkcji AI

Transkrypcja nie jest jedyną funkcją asystenta AI Companion, którą zmierzyła firma TestDevLab. W przeciwieństwie do transkrypcji, celem innych funkcji sztucznej inteligencji, takich jak podsumowania spotkań, nie jest podanie kopii słowo w słowo, ale zamiast tego dostarczenie dostosowanej wersji tego, co się wydarzyło, która spełnia oczekiwania użytkowników. 

Firma TestDevLab oceniła również Zoom Workplace i Microsoft Teams pod względem jakości podsumowań spotkań i konwersacyjnej sztucznej inteligencji (takiej jak stabilność odpowiedzi). Aby ocenić podsumowania, stworzono asystenta LLM z wynikami zweryfikowanymi przez człowieka.

W tej ocenie przetestowaliśmy dwie możliwości podsumowania w Microsoft Teams: funkcję inteligentnego podsumowania, dostępną z licencją Teams Premium lub Microsoft 365 Copilot, oraz możliwość generowania podsumowania opartego na podpowiedziach przez asystenta AI Microsoft Copilot w Teams Meetings. Ponieważ asystent Copilot może generować podsumowania tylko na podstawie podpowiedzi, poprosiliśmy go o utworzenie podsumowania i zalecanych działań po zakończeniu spotkania.

W tej ocenie przetestowaliśmy dwie możliwości podsumowania w Microsoft Teams: funkcję inteligentnego podsumowania, dostępną z licencją Teams Premium lub Microsoft 365 Copilot, oraz możliwość generowania podsumowania opartego na podpowiedziach przez asystenta AI Microsoft Copilot w Teams Meetings. Ponieważ asystent Copilot może generować podsumowania tylko na podstawie podpowiedzi, poprosiliśmy go o utworzenie podsumowania i zalecanych działań po zakończeniu spotkania.

Jeśli chodzi o konwersacyjną sztuczną inteligencję, firma TestDevLab zmierzyła, jak platformy AI radziły sobie z odpowiadaniem na pytania podczas spotkania, zarówno w przypadku pytań związanych z kontekstem spotkania, jak i niepowiązanych wyszukiwań w Internecie, takich jak "Jaki jest najwyższy budynek na świecie?". Zarówno pod względem czasu reakcji, jak i stabilności (zdolności wszystkich uczestników spotkania do otrzymania podobnej odpowiedzi), Zoom AI Companion przewyższył rozwiązanie Microsoft.

Wyższa stabilność wskazuje, że sztuczna inteligencja Zoom konsekwentnie zapewnia niezawodne odpowiedzi wszystkim uczestnikom, zapewniając płynniejsze wrażenia podczas spotkań.

Wyższa stabilność wskazuje, że sztuczna inteligencja Zoom konsekwentnie zapewnia niezawodne odpowiedzi wszystkim uczestnikom, zapewniając płynniejsze wrażenia podczas spotkań. 

 

Zoom AI Companion zapewnia lepsze, bardziej sprawiedliwe wrażenia ze spotkań

Wyniki te podkreślają nasze zaangażowanie w jakość Zoom Workplace i asystenta AI Companion. Dążymy do stworzenia sposobu, w jaki ludzie mogą łatwiej łączyć się ze sobą, być bardziej wydajni w swoim dniu i mieć możliwość wykorzystania sztucznej inteligencji do wspierania swojej pracy. Transkrypcje spotkań generowane przez sztuczną inteligencję to tylko jeden ze sposobów, w jaki można korzystać z asystenta AI Companion, aby stworzyć bardziej sprawiedliwe doświadczenie dla wielu osób, w tym osób niesłyszących, niedosłyszących, neuroróżnorodnych i tych, którzy mogą mówić innym językiem niż inni uczestnicy spotkania.

Ta ocena przeprowadzona przez TestDevLab podkreśla pozycję Zoom Workplace i asystenta AI Companion jako lidera w zakresie wydajności AI. Rozwiązania te wyróżniają się doskonałą dokładnością transkrypcji, krótszym czasem odpowiedzi na pytania podczas spotkania i bardziej stabilnymi możliwościami konwersacyjnej sztucznej inteligencji w porównaniu do testowanych konkurentów.

Co więcej, Zoom Workplace oferuje asystenta AI Companion bez dodatkowych kosztów dla płatnych kont Zoom, w przeciwieństwie do niektórych alternatywnych platform, które pobierają dodatkowe opłaty za każdego dodatkowego użytkownika, któremu przyznano funkcje AI. W Zoom uważamy, że ważne jest, aby te dokładne i transformacyjne narzędzia były dostępne dla jak największej liczby klientów. Zaczynamy od podstaw — tworzenia wysokiej jakości transkrypcji — i nadal tworzymy wyjątkowe doświadczenia AI dla wszystkich naszych klientów.

Jeśli nie masz kwalifikującego się płatnego planu Zoom, uaktualnij go już dziś, aby uzyskać dostęp do korzyści asystenta AI Companion.

Nasi klienci nas kochają

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom – jedna platforma do połączeń