O Diretor-executivo de tecnologia (CTO) do Zoom fala detalhadamente sobre como nossa abordagem federada da IA maximiza o desempenho, a qualidade e a economia
Xuedong Huang é o diretor executivo de tecnologia (CTO). Antes de entrar no Zoom, ele trabalhava na Microsoft, onde era Diretor executivo de Tecnologia da Azure AI e Técnico especialista sênior. Sua carreira é bastante conhecida na área de IA: ele iniciou o grupo de tecnologia de fala da Microsoft em 1993, liderou as equipes de IA da Microsoft para alcançar vários dos primeiros marcos com paridade humana do setor em reconhecimento de fala, tradução automática, compreensão de linguagem natural e visão computacional, é membro do IEEE e da ACM e membro eleito da Academia Nacional de Engenharia e da Academia Americana de Artes e Ciências.
Xuedong conquistou o título de Ph.D. em EE pela Universidade de Edimburgo em 1989 (com bolsa de estudos acadêmica do British ORS e da Universidade de Edimburgo), o Mestrado em CS pela Universidade de Tsinghua em 1984 e a pós graduação em CS pela Universidade de Hunan em 1982.
Embarcar na jornada transformadora da IA, desde a conceituação até a execução, assemelha-se a uma estrada sinuosa, marcada por interrupções, adaptações e inovações contínuas. Tendo participado dessa jornada nos últimos 30 anos, ocupei um lugar na primeira fila e desempenhei uma função ativa na evolução da IA, desde o reconhecimento de fala e a compreensão do idioma natural até a visão computacional. O ritmo da inovação nos últimos seis meses, desde que entrei no Zoom, tem sido particularmente surpreendente.
No Zoom, estamos usando a IA para melhorar a colaboração e a produtividade humana. O Zoom AI Companion é um dos pilares da nossa inovação, projetado para ajudar a aumentar a produtividade, facilitar uma colaboração mais simples, além de coletar insights mais profundos para aprimorar a forma como você trabalha na plataforma Zoom. A abordagem federada da AI pelo Zoom nos permite fornecer o AI Companion sem custo adicional juntamente com os serviços pagos atribuídos à sua conta de usuário Zoom. Veja a seguir uma análise mais detalhada da nossa IA e como ela oferece desempenho de alta qualidade com um custo menor.
A abordagem de IA federada do Zoom
Há anos, o Zoom oferece serviços de IA, como reconhecimento de fala, visão computacional, tradução automática e grandes modelos de linguagem (LLMs) para aprimorar a comunicação. Os LLMs que usamos incluem o LLM do Zoom, assim como modelos de terceiros como OpenAI GPT 3.5 e GPT 4 e Anthropic Claude 2. Nossa abordagem federada pode incorporar LLMs mais recentes, como o GPT 4 Turbo da OpenAI, de nossos parceiros, LLMs de código aberto e fechado, para continuarmos a aprimorar de ponta a ponta as experiências dos clientes do Zoom.
Usamos uma estratégia econômica que primeiro emprega um LLM de baixo custo mais adequado para a tarefa. Em seguida, nosso Z-Scorer avalia a qualidade da conclusão da tarefa inicial e, se necessário, usamos um LLM mais avançado para aumentar a conclusão da tarefa de acordo com o que foi obtido com o LLM inicial, de forma semelhante à maneira como uma equipe coesa que trabalha em conjunto é capaz de criar produtos de melhor qualidade com mais eficiência do que qualquer indivíduo sozinho.
Como comparar o desempenho com outros LLMs
Com nossa abordagem federada de IA, de acordo com testes internos, a nossa Equipe melhorou a qualidade relativa do AI Companion em relação às abordagens de modelo único, como as abordagens da OpenAI GPT-3.5 Turbo (a diferença relativa é de 99% contra 93% de classificação de qualidade, de acordo com nossa metodologia exclusiva de avaliação da qualidade) ou vários outros LLMs de última geração.
Estamos mensurando o desempenho como uma combinação de custo menor, tempo de resposta mais rápida e resultados de melhor qualidade. Em comparação com o modelo GPT-4-32k da OpenAI como proxy do Microsoft Copilot, o recurso de perguntas da reunião do Zoom AI Companion oferece custo reduzido e tempo de resposta mais rápido, mantendo uma qualidade de IA comparável conforme mostrado na Figura 1.
Figura 1. IA federada do Zoom em porcentagem relativa a do OpenAI GPT-4-32k nas principais métricas de custo e qualidade referente à tarefa de consultas de reunião do Zoom AI Companion. O Microsoft Copilot usou o OpenAI GPT-4 em combinação com o Microsoft Graph e outros componentes. Não usamos os dados do cliente para treinar nossos modelos de IA, mas usamos os dados de reunião interna do Zoom para benchmarking neste gráfico com o OpenAI GPT-4 como proxy do Microsoft Copilot.
O poder dos nossos modelos é demonstrado ainda mais no desempenho multi-idioma do AI Companion, que agora suporta 32 idiomas (em pré-visualização), além do inglês. Reconhecendo que a maioria dos LLMs é pré-treinada principalmente com dados dominados pelo inglês, incluímos modelos de tradução para ampliar nossos recursos multi-idioma. Ao traduzir a transcrição de um idioma diferente do inglês para o inglês usando os modelos de tradução do Zoom para o resumo da reunião multi-idioma do Zoom AI Companion, consideramos não apenas os dados traduzidos, mas também os dados originais simultaneamente. Conforme mostrado na Figura 2, nosso modelo levou não apenas a uma melhoria significativa da qualidade da IA em relação ao GPT-3.5, mas também a uma aproximação da qualidade da IA do GPT-4-32k (97% relativo) com menos de 6% do custo.
Figura 2. IA federada do Zoom em porcentagem relativa ao OpenAI GPT-4-32k para a tarefa de resumo multi-idioma do Zoom AI Companion em 32 idiomas diferentes do inglês, incluindo chinês, francês, alemão, italiano, japonês, português e espanhol. O Microsoft Copilot usou o OpenAI GPT-4 em combinação com o Microsoft Graph e outros componentes. Os dados de reunião interna do Zoom foram coletados para benchmarking neste gráfico com o OpenAI GPT-4 como proxy do Microsoft Copilot.
Esses exemplos ressaltam a eficácia da abordagem federada do Zoom para IA, simplesmente combinando os pontos fortes de diferentes sistemas de aprendizado de máquina para fornecer resultados de alto desempenho.
Uma abordagem vitoriosa em relação à IA
Acreditamos que os benefícios da IA devem ser amplamente disponibilizados para o maior número possível de pessoas. Nossa abordagem federada da IA desempenha um papel importante na concretização dessa visão. É por isso que, enquanto outras empresas podem cobrar um custo extra por usuário, podemos disponibilizar o AI Companion sem custo extra para clientes dos planos pagos elegíveis do Zoom.*
Recomendamos que você experimente o AI Companion por conta própria. Acesse nosso Guia de introdução para saber mais sobre como ativar e usar esses recursos. (Se você não tem um plano Zoom pago elegível, faça um upgrade hoje mesmo para acessar as vantagens do AI Companion.
*Observação: o AI Companion pode não estar disponível em todas as regiões ou segmentos.