Мы использовали модель федеративного ИИ Zoom в нашей исследовательской среде для нового тестирования Google DeepSearchQA — оценки ИИ-агентов по сложным, многоэтапным задачам поиска информации в 17 областях. Выпущенное 11 декабря 2025 г. вместе с Gemini Deep Research, это тестирование бросает вызов ИИ-системам, не ограничиваясь одним ответом или спектром фактов.
Вместо этого DeepSearchQA использует набор данных сложных, созданных вручную задач, предназначенных для оценки способности агента выполнять сложные планы поиска для генерации исчерпывающих списков ответов. Федеративный ИИ от Zoom в ходе тестирования показал точность 76,3 %, превзойдя предыдущий отличный результат в 66,1 %.
Это улучшение позволило выявить ключевую закономерность: самое главное это то, как искусственный интеллект создается и применяется. Благодаря интеграции OpenAI GPT-5 и Gemini 3 Pro Preview во внутренние тесты с помощью нашей агентной федеративной структуры рабочего процесса «исследование–проверка–объединение», мы стремимся обеспечить более глубокое логическое обоснование и более надежный синтез фактов по сравнению с одной моделью.
Последнее обновление результатов сторонних тестирований: 10 декабря 2025 г.
Скачок показателей говорит о том, что федеративная система Zoom — это масштабируемая структура рассуждений, которая может адаптироваться к различным уровням сложности и областям применения. Принципы, лежащие в основе нашего прорыва в проекте «Последний экзамен человечества» (HLE), оказываются весьма эффективными для агентных корпоративных сфер применения, где надежность и глубина рассуждений важнее, чем скорость отклика.
Наша инновация заключается не в создании очередной монолитной модели, а в объединении лучших моделей в систему, где акцент делается на повышении надежности и координации, а не на простом масштабировании.