AI

Zoom AI: Membuka kemungkinan baru, melampaui tantangan tersulit

Zoom menutup tahun 2025 dengan terobosan besar dalam AI. Riset arsitektur gabungan kini melampaui model-model terdepan dalam penalaran kompleks dan tolok ukur pencarian, membuktikan bahwa mengatur beberapa sistem dapat mencapai akurasi dan keandalan yang lebih tinggi di berbagai industri.
7 menit untuk membaca

Diperbarui pada December 29, 2025

Diterbitkan pada December 29, 2025

Zoom AI: Membuka kemungkinan baru, melampaui tantangan tersulit
Xuedong Huang
Xuedong Huang
Direktur Teknologi

Xuedong Huang adalah  Chief Technology Officer (CTO) Zoom. Sebelum bergabung dengan Zoom, dia bekerja di Microsoft sebagai CTO Azure AI dan Technical Fellow. Kariernya di bidang AI sangat cemerlang: dia mendirikan grup teknologi ucapan Microsoft pada tahun 1993, memimpin tim AI Microsoft untuk mencapai beberapa tonggak sejarah pertama di industri dalam pengenalan ucapan, terjemahan mesin, pemahaman bahasa alami, dan penglihatan komputer. Dia juga merupakan Fellow IEEE dan ACM, serta anggota terpilih dari National Academy of Engineering dan American Academy of Arts and Sciences.

Xuedong mendapatkan gelar Ph.D. dalam Ilmu Elektro dari Universitas Edinburgh pada tahun 1989 (disponsori oleh British ORS dan Beasiswa Universitas Edinburgh), gelar MS dalam Ilmu Komputer dari Universitas Tsinghua pada tahun 1984, dan gelar BS dalam Ilmu Komputer dari Universitas Hunan pada tahun 1982.

Menjelang akhir tahun 2025, saya bangga merefleksikan kemajuan yang telah dicapai tim kami dalam memajukan kemampuan AI Zoom: apa yang dimulai sebelumnya dengan pekerjaan kami pada tolok ukur Ujian Terakhir Kemanusiaan (HLE) — evaluasi ketat yang dirancang untuk menguji penalaran dan pemahaman tingkat ahli dalam AI — telah berkembang menjadi peningkatan kinerja yang lebih luas di berbagai evaluasi, memperkuat bahwa AI federasi agen eksklusif kami mampu memberikan peningkatan signifikan melampaui batas model perbatasan tunggal mana pun.

DeepSearchQA: Melampaui teknologi mutakhir.

Kami menerapkan AI gabungan Zoom di lingkungan riset kami ke tolok ukur baru DeepSearchQA dari Google: evaluasi agen AI pada tugas pencarian informasi multi-langkah yang kompleks di 17 bidang. Dirilis pada 11 Desember 2025 bersama dengan Gemini Deep Research, tolok ukurini menantang sistem AI di luar pengambilan jawaban tunggal atau faktualitas spektrum luas.
 
Sebaliknya, DeepSearchQA menampilkan dataset tugas-tugas menantang yang dirancang dengan tangan untuk mengevaluasi kemampuan agen dalam mengeksekusi rencana pencarian kompleks untuk menghasilkan daftar jawaban yang lengkap. AI terfederasi Zoom mencapai 76,3% akurasi dalam pengujian, melampaui teknologi mutakhir sebelumnya yaitu 66,1%.
 
Perbaikan ini mengungkapkan wawasan penting: aspek pentingnya terletak pada bagaimana AI dibangun dan diterapkan secara sistematis. Dengan mengatur OpenAI GPT‑5 dan Gemini 3 Pro Preview dalam pengujian internal melalui kerangka kerja federasi agen milik kami dari alur kerja "eksplorasi—verifikasi—federasi", kami bertujuan untuk memberikan cakupan penalaran yang lebih mendalam dan sintesis faktual yang lebih andal daripada yang dapat dicapai oleh satu model.

 

Model/Sistem
Keakuratan DeepSearchQA
Zoom Federated AI (GPT-5 + Gemini 3 Pro Preview)
76,3%
Google Gemini Deep Research Agent
66,1%
OpenAI GPT‑5 Pro
65,2%
OpenAI GPT-5
59,4%
Google Gemini 3 Pro Preview
56,6%
Anthropic Claude Opus 4.5 (pemikiran)
24,0%
Hasil benchmarking pihak ketiga terakhir diperbarui 10 Desember 2025
 
Lompatan ini menggarisbawahi bahwa federasi Zoom bukan hanya ansambel biasa - ini adalah sistem penalaran yang dapat diskalakan yang mampu beradaptasi di seluruh tingkat kesulitan dan domain. Prinsip-prinsip yang mendorong terobosan Humanity's Last Exam kami terbukti kuat untuk aplikasi perusahaan agen di mana keandalan dan kedalaman penalaran lebih penting daripada latensi.
 
Inovasi kami tidak terletak pada membangun model monolitik lain, tetapi dalam menghubungkan model terbaik ke dalam sistem yang menekankan peningkatan keandalan dan orkestrasi dibandingkan skala mentah.

HLE: Penskalaan dengan model-model mutakhir

Ketika model AI frontier baru muncul, arsitektur terus berkembang mampu memberikan kecerdasan yang lebih pintar dan lebih berpusat pada manusia di berbagai tugas, industri, dan aplikasi. Dengan peluncuran GPT-5.2 baru dari OpenAI, riset AI gabungan Zoom telah meningkatkan akurasi full-set HLE dari 48,1% menjadi 53,0%,sekali lagi melampaui semua model frontier individu.
 
Model/Sistem
HLE Akurasi Set Lengkap
Zoom Federated AI
(GPT-5.2 + Gemini 3 Pro Preview)
533,0%
OpenAI GPT‑5.2 Pro
Zoom Federated AI
(GPT-5 + Gemini 3 Pro Preview)
48,1%
Google Gemini Deep Research Agent
Google Gemini 3 Pro Preview
OpenAI GPT‑5.2
Anthropic Claude Opus 4.5
OpenAI GPT-5 Pro
OpenAI GPT-5

Implikasi untuk AI Agentik

Hasil inovatif ini menunjukkan bahwa pendekatan AI terdistribusi Zoom mewakili perubahan paradigma dalam mengoordinasikan model-model paling canggih di dunia. Pendekatan ini melampaui batasan model tunggal tradisional, menciptakan kerangka kerja yang kuat dengan implikasi mendalam untuk AI yang bersifat agentik dan evolusi Zoom AI Companion dan Zoom Virtual Agent.
 
Federasi agen milik Zoom telah meletakkan dasar bagi generasi baru agen AI yang mampu menghadapi tantangan paling kompleks umat manusia. Meskipun pencapaian tolok ukur ini menandai tonggak penting, fokus kami yang terus berlanjut pada pengoptimalan latensi akan membantu arsitektur terfederasi ini memberikan nilai transformatif di berbagai aplikasi dunia nyata.

Xuedong Huang adalah Chief Technology Officer di Zoom. Dia sebelumnya menjabat sebagai Technical Fellow dan Azure AI CTO di Microsoft. Dia adalah anggota terpilih dari National Academy of Engineering dan American Academy of Arts and Sciences.

Catatan tentang Hasil Pembandingan: Metrik ini mencerminkan riset berkelanjutan Zoom dengan model AI terdepan. Model yang dirujuk mungkin masih dalam pengujian untuk integrasi dalam penerapan AI gabungan Zoom untuk pelanggan.

Pelanggan kami mencintai kami

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom - Satu Platform untuk Berkomunikasi