Vào tháng 11 năm 2023, tôi đã chia sẻ cách tiếp cận AI liên kết của Zoom đạt được chất lượng gần bằng OpenAI GPT-4 với chỉ 6% chi phí suy luận bằng cách nào. Điều ấn tượng không kém những kết quả đó là giờ đây, chúng tôi có thể mang lại chất lượng AI thậm chí còn tốt hơn so với GPT-4 của OpenAI cho các tính năng cuộc họp phổ biến nhất của chúng tôi. Zoom AI Companion đã giảm hơn 20% các lỗi tương đối (đối với “phần tóm tắt” của tóm tắt cuộc họp Zoom) và 60% (đối với “các bước tiếp theo”) so với GPT-4 trong quy trình định chuẩn mù do con người xác thực trong nội bộ của chúng tôi.
Để hỗ trợ các nỗ lực đào tạo của chúng tôi nhằm cải tiến chất lượng hoàn thành nhiệm vụ, cách tiếp cận AI liên kết độc đáo của chúng tôi tận dụng nhiều mô hình ngôn ngữ lớn (LLM) tiên tiến có mã nguồn mở và đóng kết hợp với nhau để có kết quả tốt hơn. Cách này trái ngược với các nhà cung cấp khác bị ràng buộc với những LLM cụ thể. Ví dụ: Microsoft Copilot dựa vào GPT-4 và Google dựa vào Gemini.
Cách tiếp cận AI này giúp Zoom AI Companion trở nên khác biệt, mang đến cho khách hàng trải nghiệm chất lượng cao với các tính năng phổ biến nhất của chúng tôi. Như tôi đã chia sẻ trong lần cập nhật gần đây nhất, chúng tôi sử dụng công cụ chấm điểm Z độc quyền để đánh giá chất lượng đầu ra do AI tạo ra. Đầu tiên, chúng tôi sử dụng LLM có chi phí thấp hơn, phù hợp nhất cho từng nhiệm vụ. Tiếp đó, công cụ chấm điểm Z của chúng tôi sẽ đánh giá chất lượng hoàn thành nhiệm vụ ban đầu. Nếu cần, chúng tôi có thể sử dụng LLM bổ sung khác để tinh chỉnh nhiệm vụ. Quá trình này mang lại kết quả đầu ra có chất lượng cao hơn, giống như trường hợp một nhóm người có thể cùng nhau hoàn thành nhiều việc hơn so với bất kỳ cá nhân nào.
Kể từ đó, chúng tôi đã cải thiện công cụ chấm điểm Z bằng cách kết hợp các tín hiệu chất lượng khác từ nhiều LLM khác nhau. Ngoài ra, để phù hợp hơn với sở thích của con người, chúng tôi đã cải thiện phương pháp học tăng cường liên kết. Bằng cách liên kết LLM của Zoom kết hợp với một tập hợp LLM bổ sung, tóm tắt cuộc họp phổ biến của Zoom mang lại kết quả chất lượng cao và theo hoạt động định chuẩn gần đây của chúng tôi, giờ đây tóm tắt cuộc họp có thể vượt trội hơn so với GPT-4, vốn được sử dụng để hỗ trợ Copilot trong Microsoft Teams.
Về vấn đề an toàn AI, chúng tôi cũng giảm bớt thành kiến cố hữu trong hầu hết các LLM bằng cách thiết lập một nhóm chức năng bao gồm nhiều LLM như Claude-3, Gemini và GPT-4 để giảm mức độ ảo giác và cải thiện LLM của Zoom. Ví dụ: các LLM khác nhau khó có thể mắc cùng một lỗi do ảo giác, vì vậy, chúng ta có thể rút ra những phản hồi nhất quán hơn và giảm tác động của các trường hợp ngoại lệ.