
Conheça o Zoom AI Companion, seu novo assistente de IA!
Aumente a produtividade e a colaboração em equipe com o Zoom AI Companion, disponível sem custo adicional em planos Zoom qualificáveis.
O Zoom AI Companion 2.0 é o líder entre os concorrentes testados em relação ao reconhecimento de fala e qualidade de inteligência de reunião gerada por IA
Atualizada em November 20, 2024
Publicado em November 14, 2024
Xuedong Huang é o diretor executivo de tecnologia (CTO). Antes de entrar no Zoom, ele trabalhava na Microsoft, onde era Diretor executivo de Tecnologia da Azure AI e Técnico especialista sênior. Sua carreira é bastante conhecida na área de IA: ele iniciou o grupo de tecnologia de fala da Microsoft em 1993, liderou as equipes de IA da Microsoft para alcançar vários dos primeiros marcos com paridade humana do setor em reconhecimento de fala, tradução automática, compreensão de linguagem natural e visão computacional, é membro do IEEE e da ACM e membro eleito da Academia Nacional de Engenharia e da Academia Americana de Artes e Ciências.
Xuedong conquistou o título de Ph.D. em EE pela Universidade de Edimburgo em 1989 (com bolsa de estudos acadêmica do British ORS e da Universidade de Edimburgo), o Mestrado em CS pela Universidade de Tsinghua em 1984 e a pós graduação em CS pela Universidade de Hunan em 1982.
A tecnologia pode ser um grande equalizador e a inteligência artificial não é exceção. Ela pode nos ajudar a realizar coisas que não conseguíamos fazer antes. À medida que continuamos a desenvolver recursos e capacidades para o Zoom AI Companion, estamos extremamente atentos a como nossos produtos podem ajudar a capacitar nossos clientes e temos o compromisso de fornecer resultados com a mais alta qualidade para que esses clientes possam ser eficientes e bem-sucedidos em seu trabalho.
Nossos clientes usam o AI Companion em todos os setores, incluindo serviços financeiros, saúde, educação, governo e muito mais. Hoje, na educação e nas universidades, estudantes e professores já usam os recursos de IA do Zoom para melhorar a acessibilidade das palestras. No setor de saúde, as pessoas comparecem a consultas virtuais e usam recursos de transcrição e resumo para ampliar o acesso ao atendimento.
O uso da IA para tornar a tecnologia mais acessível não está reservado apenas para legendas para deficientes auditivos, mas também para superar as barreiras do idioma. Quando eu era estudante, há 35 anos, em Edimburgo, na Escócia, e ainda estava aprendendo inglês, não só me beneficiei das legendas ao assistir à BBC, como também compreendi o que as legendas e uma tradução corretas podem fazer pelas pessoas em todo o mundo. O uso da IA já é bastante amplo, e queremos continuar melhorando a qualidade para abrir as possibilidades para mais pessoas.
Nosso sucesso nas transcrições de reuniões é uma parte dessa jornada e aborda muitos aspectos de como a IA pode aumentar as habilidades e a experiência de uma pessoa para ajudá-la a ir ainda mais longe. Isso pode ser feito com legendas ao vivo automatizadas em uma reunião ou webinar, traduzindo legendas ao vivo para outro idioma ou usando o AI Companion para transcrever reuniões para uso com resumos de reuniões, gravações inteligentes, itens de ação e muito mais. Criar uma experiência de reunião mais acessível e equitativa em um ambiente de negócios global beneficia a todos.
No início deste ano, compartilhei como nossa abordagem federada de IA estava igualando ou superando a de outros modelos de IA a um custo muito menor. Hoje, tenho o prazer de compartilhar as descobertas de uma avaliação recente do desempenho da IA do Zoom encomendada ao TestDevLab, que corrobora ainda mais a liderança do Zoom AI Companion 2.0 em reconhecimento de fala e inteligência de reunião quando comparado com outras ferramentas de IA testadas.
O Zoom AI Companion 2.0 integra perfeitamente as informações de trabalho e da web para oferecer uma atualização impressionante na experiência do Zoom Workplace. Embora existam muitas maneiras de integrar os recursos de IA ao Zoom Workplace, há um aspecto do AI Companion que funciona como o repositório dos nossos recursos de IA mais amplamente usados, incluindo resumos das reuniões, itens de ação e transcrições.
A eficácia desses recursos de IA depende da precisão das transcrições nas quais eles se baseiam. Muitos de nossos recursos populares, como fazer perguntas na reunião, dependem do reconhecimento de voz de alta qualidade. Uma transcrição confiável permite que a IA capture nomes, tópicos e intenções com precisão, formando a espinha dorsal dos resumos, destaques e insights acionáveis.
O padrão do setor para medir a precisão da transcrição é a taxa de erro por palavras, que compara a porcentagem de diferenças entre uma transcrição gerada por humanos e uma transcrição gerada por IA. O Zoom tem trabalhado para modernizar nossa arquitetura de IA nos últimos anos para minimizar a taxa de erro por palavras. Ao minimizar o WER, criamos transcrições precisas e confiáveis para ajudar a gerar resultados eficazes e acionáveis para nossos clientes.
Em uma análise da taxa de error por palavras, o texto vermelho representa palavras ausentes, e o texto azul representa palavras não encontradas na fonte da transcrição.
Os resultados foram claros: o Zoom AI Companion superou o Microsoft Teams com uma Taxa de erros por palavras significativamente menor, oferecendo um nível mais alto de precisão de transcrição. Em reuniões em que cada palavra conta, até mesmo pequenos erros de transcrição podem ter um grande impacto sobre resumos, tarefas ou respostas a perguntas feitas durante as reuniões.
Veja como o TestDevLab criou e executou esses testes:
Para cada teste, eles compararam o Zoom Workplace e o Microsoft Teams e mediram a taxa de erro de palavras em cada reunião.
Ao medir a Taxa de erros por palavras, uma porcentagem baixa significa uma transcrição de maior qualidade.
Os resumos e as transcrições de reuniões são alguns dos recursos mais populares e mais usados em muitas plataformas de IA. Por serem tão amplamente utilizados, é ainda mais importante garantir que os erros sejam reduzidos ao máximo. Eles são populares porque economizam tempo e as pessoas acham muito valioso ler, resumir e entender melhor as informações importantes.
O TestDevLab também classificou o Zoom Workplace e o Microsoft Teams em relação à qualidade do resumo da reunião e à IA de conversação (como estabilidade de resposta). Para avaliar os resumos, eles criaram um assistente LLM com resultados validados por humanos.
A transcrição não é o único recurso do AI Companion que o TestDevLab avaliou. Ao contrário das transcrições, o objetivo de outros recursos de IA, como os resumos das reuniões, não é fornecer uma cópia palavra por palavra, mas sim uma versão personalizada do que aconteceu que atenda às expectativas dos usuários.
O TestDevLab também classificou o Zoom Workplace e o Microsoft Teams em qualidade de resumo da reunião e IA de conversação (como estabilidade da resposta). Para avaliar os resumos, eles criaram um assistente LLM com resultados validados por humanos.
Nesta avaliação, testamos dois recursos do resumo no Microsoft Teams: o recurso Recapitulação inteligente, disponível com uma licença do Teams Premium ou do Microsoft 365 Copilot, e o recurso de geração de resumo baseado em prompt do Microsoft Copilot AI Assistant no Teams Meetings. Como o Copilot AI Assistant só pode gerar resumos com base em prompts, solicitamos ao Copilot que criasse um resumo e itens de ação no final da reunião.
Em termos de IA conversacional, o TestDevLab avaliou como as plataformas de IA conseguiram responder a perguntas durante uma reunião, tanto para perguntas relacionadas ao contexto da reunião quanto para pesquisas na Web não relacionadas à reunião, como "Qual é o prédio mais alto do mundo?". Tanto no tempo de resposta quanto na estabilidade (a capacidade de todos os participantes da reunião receberem uma resposta semelhante), o Zoom AI Companion superou a Microsoft.
Uma maior estabilidade indica que a IA do Zoom fornece consistentemente respostas confiáveis a todos os participantes, proporcionando uma experiência mais tranquila durante as reuniões.
Esses resultados destacam nosso compromisso com a qualidade no Zoom Workplace e no AI Companion. Nós nos esforçamos para criar uma maneira das pessoas se conectarem mais facilmente umas com as outras, serem mais eficientes em seu dia a dia e terem a oportunidade de usar a inteligência artificial para colaborar com seu trabalho. As transcrições de reuniões geradas por IA são apenas uma das maneiras pelas quais as pessoas podem usar o AI Companion para ajudar a criar uma experiência mais equitativa para muitas pessoas, incluindo surdos, deficientes auditivos, neurodiversos e aqueles que falam um idioma diferente dos outros na reunião.
Esta avaliação conduzida pelo TestDevLab destaca o Zoom Workplace e o AI Companion como líderes em desempenho de IA, com precisão de transcrição superior, tempos de resposta mais rápidos para perguntas na reunião e recursos de IA de conversação mais estáveis em comparação com os concorrentes testados.
Além disso, o Zoom Workplace oferece o AI Companion sem custo extra para as contas Zoom pagas, ao contrário de algumas plataformas alternativas, que cobram um valor extra para cada usuário adicional que tenha acesso aos recursos de IA. No Zoom, acreditamos que é importante disponibilizar essas ferramentas precisas e transformadoras para o maior número possível de clientes. Começamos pela base - criando transcrições de alta qualidade, e continuamos a criar experiências excepcionais de IA para todos os nossos clientes.
Se você não tiver um plano Zoom pago elegível, faça o upgrade hoje mesmo para acessar os benefícios do AI Companion.