AI Companion Конференции и чаты

Постановка на первое место качества ИИ для улучшения специальных возможностей и коллективной работы

Zoom превосходит протестированных конкурентов по качеству распознавания речи и генерируемой ИИ аналитики конференций

Опубликовано: 14 ноября 2024 г.

Постановка на первое место качества ИИ для улучшения специальных возможностей и коллективной работы
Xuedong Huang
Xuedong Huang (Сюэдун Хуан)
Технический директор

Сюэдун Хуан (Xuedong Huang) является техническим директором (CTO). До Zoom он работал в компании Microsoft CTO и техническим специалистом по ИИ Azure. Он построил выдающуюся карьеру в области ИИ: в 1993 году создал группу речевых технологий Microsoft, руководил отделами по работе с ИИ Microsoft и добился первых в отрасли успехов в области разработки технологий распознавания речи, машинного перевода, понимания языка и компьютерного зрения, равных возможностям человека. Сейчас он является действительным членом IEEE и ACM и избранным членом Национальной инженерной академии и Американской академии искусств и наук.

Сюэдун получил степень доктора философии в области электроэнергетики в Эдинбургском университете в 1989 году (обучение спонсировалось зарубежной Британской исследовательской стипендией и стипендией Эдинбургского университета), степень магистра в области компьютерных наук в Университете Цинхуа в 1984 году и степень бакалавра в той же области в Хунаньском университете в 1982 году.

Технологии могут стать мощным инструментом выравнивания возможностей, и ИИ — не исключение. Он может помогать нам с задачами, которые мы не могли выполнять раньше. Продолжая внедрять новые функции и возможности в Zoom Workplace, мы уделяем огромное внимание тому, как наши продукты могут помочь расширить возможности наших клиентов, и стремимся предоставлять им результаты высочайшего качества, чтобы они могли эффективно и успешно работать. 

Наши клиенты используют функции искусственного интеллекта в Zoom Workplace в самых разных областях применения, включая финансовые услуги, здравоохранение, образование, государственные учреждения и многие другие. Сегодня в образовательных учреждениях и университетах учащиеся, учителя и преподаватели уже используют функции ИИ Zoom для улучшения специальных возможностей на лекциях. В сфере здравоохранения люди посещают виртуальные приемы и используют возможности расшифровки и обобщения информации для расширения доступа к медицинской помощи. 

Использование ИИ для повышения доступности технологий не ограничивается созданием субтитров по требованию для слабослышащих, а направлено также на преодоление языковых барьеров. Когда 35 лет назад я был учащимся в Эдинбурге (Шотландия) и все еще изучал английский язык, я просматривал выпуски BBC с субтитрами по требованию и понял, насколько точные субтитры и перевод могут помочь людям во всем мире. ИИ уже довольно широко используется, и мы стремимся продолжать улучшать его качество, чтобы открыть возможности для большего количества людей.

Наш успех в области расшифровки конференций — лишь один из этапов этого пути, и он затрагивает многие аспекты того, как искусственный интеллект может расширить собственные навыки и опыт человека, помогая ему достичь ещё большего. Речь может идти об автоматизированных субтитрах в режиме реального времени во время конференций или вебинаров, переводе таких субтитров на другой язык, а также о транскрибировании конференций для использования в сводках конференций, смарт-записях, задачах и многом другом. Создание более доступной и равноправной среды проведения конференций в глобальной бизнес-среде приносит пользу всем.

Точное распознавание речи — основа Zoom AI

Ранее в этом году я рассказывал о том, как наш федеративный подход к ИИ соответствует или превосходит подходы других моделей ИИ при значительно меньших затратах. Сегодня я с радостью делюсь результатами недавней оценки эффективности Zoom AI, проведённой по заказу компании TestDevLab, которые ещё больше укрепляют позиции Zoom как лидера в области распознавания речи и интеллектуального управления конференциями по сравнению с другими протестированными ИИ-инструментами. 

Наши ИИ-функции обеспечивают бесшовную интеграцию рабочей и веб-информации, что приводит к впечатляющему улучшению работы в Zoom Workplace. Хотя функции ИИ интегрированы в Zoom Workplace разными способами, есть один аспект, который обеспечивает работу наших наиболее широко используемых функций ИИ, включая сводки конференций, задачи и расшифровки.

Эффективность этих функций ИИ зависит от точности расшифровок, из которых они черпают информацию. Многие из наших популярных функций, например функция вопросов в ходе конференции, основаны на высококачественном распознавании речи. Надежная расшифровка позволяет ИИ точно фиксировать имена, темы и намерения, что формирует основу для сводок, основных моментов и полезных аналитических выводов.

Отраслевым стандартом для измерения точности транскрипции является показатель частоты ошибок в словах (WER), сравнивает процент различий между расшифровкой, созданной человеком, и расшифровкой, созданной ИИ. В последние годы компания Zoom работает над модернизацией своей архитектуры ИИ, чтобы минимизировать WER. Минимизируя WER, мы создаем точные и надежные расшифровки, которые помогают нашим клиентам добиться эффективных и действенных результатов.

В анализе WER красным цветом выделены пропущенные слова, а синим — слова, не найденные в исходной расшифровке.

В анализе WER красным цветом выделены пропущенные слова, а синим — слова, не найденные в исходной расшифровке. 

 

Zoom предоставляет более точные расшифровки для работы функций ИИ

Результаты были очевидны: Zoom превзошёл Microsoft Teams по значительно более низкому показателю WER, обеспечив при этом более высокую точность расшифровки. На конференциях, где важно каждое слово, даже незначительные ошибки в расшифровке могут существенно повлиять на сводки, задачи или ответы на вопросы, задаваемые в ходе конференций.

Ниже описано, как компания TestDevLab создала и провела эти тесты.

  • Сотрудники использовали три записанные конференции с количеством участников от 2 до 16 человек.
  • Файлы воспроизводились синхронно на отдельных компьютерах, подключенных к вызову.
  • В целях получения последовательных результатов каждый тест был повторен пять раз для каждой платформы.

В каждом тесте сотрудники сравнивали Zoom Workplace и Microsoft Teams и рассчитывали показатель частоты ошибок в словах для каждой конференции.

При расчете показателя WER (частота ошибок в словах) низкий процент означает более высокое качество расшифровки.

При расчете показателя WER (частота ошибок в словах) низкий процент означает более высокое качество расшифровки.

Сводки и расшифровки конференций — одни из самых популярных и наиболее часто используемых функций на многих платформах ИИ. Поскольку они так широко применяются, становится еще более важно по максимуму сократить количество ошибок. Они популярны, потому что способствуют экономии времени и приносят людям много пользы: позволяют читать, лучше понять важную информацию и составить сводку по ней.

Компания TestDevLab также оценила Zoom Workplace и Microsoft Teams по качеству сводки конференции и диалоговому ИИ (например, по стабильности ответов). Чтобы оценить сводки, сотрудники создали помощника БЯМ, предоставляющего проверенные человеком результаты.

Надежные расшифровки создают лучшую основу для последующих функций ИИ

Расшифровка — не единственная функция ИИ, которую оценила компания TestDevLab. В отличие от расшифровок, цели других функций ИИ, таких как сводки конференций, заключаются в том, чтобы предоставить не дословную копию, а адаптированную версию произошедшего, которая соответствует ожиданиям пользователей. 

Компания TestDevLab также оценила Zoom Workplace и Microsoft Teams по качеству сводки конференции и диалоговому ИИ (например, по стабильности ответов). Чтобы оценить сводки, сотрудники создали помощника БЯМ, предоставляющего проверенные человеком результаты.

В рамках этой оценки мы протестировали две возможности составления сводок в Microsoft Teams — функцию Intelligent Recap, доступную с лицензией Teams Premium или Microsoft 365 Copilot, и возможность составления сводок на основе подсказок с использованием ИИ-помощника Microsoft Copilot в Teams Meetings. Поскольку ИИ-помощник Copilot может генерировать сводки только на основе подсказок, мы попросили Copilot создать сводку и списки задач по завершении конференции.

В рамках этой оценки мы протестировали две возможности составления сводок в Microsoft Teams — функцию Intelligent Recap, доступную с лицензией Teams Premium или Microsoft 365 Copilot, и возможность составления сводок на основе подсказок с использованием ИИ-помощника Microsoft Copilot в Teams Meetings. Поскольку ИИ-помощник Copilot может генерировать сводки только на основе подсказок, мы попросили Copilot создать сводку и списки задач по завершении конференции.

В плане диалогового ИИ TestDevLab оценила, как платформы ИИ отвечают на вопросы во время конференции: как на связанные с контекстом конференции, так и на несвязанные поисковые запросы в интернете, например «Какое самое высокое здание в мире?». По времени ответа и стабильности (возможности всех участников конференции получать одинаковые ответы) Zoom превзошёл Microsoft.

Более высокая стабильность указывает на то, что ИИ Zoom постоянно предоставляет надежные ответы всем участникам, обеспечивая более плавное проведение конференций.

Более высокая стабильность указывает на то, что ИИ Zoom постоянно предоставляет надежные ответы всем участникам, обеспечивая более плавное проведение конференций. 

 

Zoom делает участие в конференциях более удобным и равноправным.

Эти результаты подчеркивают нашу приверженность качеству во всем Zoom Workplace. Мы стремимся создать условия, которые позволят людям легче общаться друг с другом, эффективнее выполнять повседневные задачи и использовать искусственный интеллект для поддержки своей работы. Автоматически созданные расшифровки конференций — лишь один из способов, с помощью которых люди могут использовать Zoom Workplace для создания более равных условий для многих людей, включая глухих, слабослышащих, людей с нейроразличиями и тех, кто говорит на другом языке, чем другие участники конференции.

В ходе данного исследования, проведённого компанией TestDevLab, платформа Zoom Workplace была признана лидером по показателям эффективности искусственного интеллекта, продемонстрировав более высокую точность расшифровки, более быстрое время отклика на вопросы в ходе конференции, а также более стабильную работу диалоговых ИИ-функций по сравнению с протестированными конкурентами.

Более того, на платформе Zoom Workplace многие функции ИИ предоставляются пользователям платных учетных записей Zoom без доплат, в отличие от некоторых альтернативных платформ, на которых взимается дополнительная плата за каждого нового пользователя, которому предоставляются функции ИИ. В Zoom мы считаем важным сделать эти точные и преобразующие инструменты доступными для как можно большего числа клиентов. Мы начинаем с основ — создания высококачественных расшифровок — и продолжаем создавать исключительные возможности работы с ИИ для всех наших клиентов.

Если у вас нет подходящего платного плана Zoom, обновите его сегодня, чтобы воспользоваться преимуществами Zoom Workplace. 

Наши клиенты нас любят

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom — единая платформа для совместной работы