AI Companion Cuộc họp và trò chuyện

Đặt chất lượng AI lên hàng đầu để tăng cường khả năng truy cập và cộng tác

Zoom AI Companion 2.0 vượt trội so với các đối thủ cạnh tranh đã được thử nghiệm trong lĩnh vực nhận dạng giọng nói và chất lượng thông tin cuộc họp tạo bởi AI

Cập nhật vào November 20, 2024

Đăng vào November 14, 2024

Đặt chất lượng AI lên hàng đầu để tăng cường khả năng truy cập và cộng tác
Xuedong Huang
Xuedong Huang
Giám đốc Công nghệ

Xuedong Huang là Giám đốc Công nghệ (CTO). Trước khi đến với Zoom, ông từng làm việc tại Microsoft với vai trò Lãnh đạo Kỹ thuật và CTO của Azure AI. Ông có sự nghiệp nổi bật trong lĩnh vực AI: ông thành lập nhóm công nghệ giọng nói của Microsoft vào năm 1993, dẫn dắt nhóm AI của Microsoft đạt được một số cột mốc đầu tiên trong ngành tương đồng với khả năng của con người về nhận diện giọng nói, dịch máy, hiểu ngôn ngữ tự nhiên và thị giác máy tính, là thành viên của Hội Kỹ sư Điện và Điện tử (IEEE) và Người đạt giải thưởng của Hiệp hội Máy tính (ACM), đồng thời là thành viên được bầu của Viện hàn lâm Kỹ thuật Quốc gia và Viện hàn lâm Khoa học và Nghệ thuật Hoa Kỳ.

Xuedong nhận bằng Tiến sĩ Kỹ thuật điện (EE) tại Đại học Edinburgh năm 1989 (được tài trợ bởi ORS của Anh và Học bổng của Đại học Edinburgh), bằng Thạc sĩ Khoa học máy tính của Đại học Thanh Hoa năm 1984 và bằng Cử nhân Khoa học máy tính từ Đại học Hồ Nam năm 1982.

Công nghệ có thể là công cụ cân bằng tuyệt vời và trí tuệ nhân tạo cũng không ngoại lệ. Nó có thể giúp chúng ta hoàn thành những việc mà trước đây chúng ta không thể làm được. Khi chúng tôi tiếp tục xây dựng các tính năng và khả năng cho Zoom AI Companion, chúng tôi đặc biệt lưu tâm đến cách sản phẩm của mình có thể giúp trao quyền cho khách hàng và cam kết mang lại kết quả chất lượng cao nhất để họ có thể làm việc hiệu quả và thành công. 

Khách hàng của chúng tôi sử dụng AI Companion trong nhiều ngành, bao gồm dịch vụ tài chính, chăm sóc sức khỏe, giáo dục, chính phủ và nhiều hơn nữa. Ngày nay, trong giáo dục và trường đại học, sinh viên và giáo viên đã sử dụng khả năng AI của Zoom để cải thiện khả năng tiếp cận bài giảng. Trong chăm sóc sức khỏe, mọi người tham gia các cuộc hẹn trực tuyến và sử dụng khả năng ghi chép và tóm tắt để mở rộng khả năng tiếp cận dịch vụ chăm sóc. 

Việc sử dụng AI để giúp công nghệ dễ tiếp cận hơn không chỉ dừng lại ở phụ đề dành cho người khiếm thính mà còn phá vỡ rào cản ngôn ngữ. Khi tôi còn là sinh viên cách đây 35 năm tại Edinburgh, Scotland và vẫn đang học tiếng Anh, tôi không chỉ được hưởng lợi từ phụ đề khi xem BBC mà còn thấy được những lợi ích mà một phụ đề và bản dịch chính xác có thể mang lại cho mọi người trên khắp thế giới. Việc ứng dụng AI hiện đã rất phổ biến, và chúng tôi muốn tiếp tục nâng cao chất lượng để mở ra nhiều cơ hội hơn cho mọi người.

Thành công của chúng tôi trong việc ghi chép cuộc họp là một phần của hành trình này và nó đề cập đến nhiều khía cạnh về cách AI có thể tăng cường các kỹ năng và kinh nghiệm của một người để giúp họ tiến xa hơn nữa. Đó có thể là phụ đề trực tiếp tự động trong cuộc họp hoặc hội thảo trên web, dịch phụ đề trực tiếp sang ngôn ngữ kháchoặc sử dụng AI Companion để ghi chép cuộc họp để sử dụng với bản tóm tắt cuộc họp, bản ghi thông minh, mục hành động, v.v.Việc tạo ra trải nghiệm cuộc họp dễ tiếp cận và công bằng hơn trong môi trường kinh doanh toàn cầu sẽ mang lại lợi ích cho tất cả mọi người.

Nhận dạng giọng nói chính xác là nền tảng của Zoom AI Companion

Đầu năm nay, tôi đã chia sẻ về cách tiếp cận liên kết của chúng tôi đối với AI đã phù hợp hoặc vượt trội hơn so với các mô hình AI khác với chi phí thấp hơn nhiều. Hôm nay, tôi rất vui mừng được chia sẻ những phát hiện từ đánh giá gần đây về hiệu suất AI của Zoom do TestDevLab ủy quyền, điều này củng cố thêm vị trí dẫn đầu của Zoom AI Companion 2.0 trong nhận dạng giọng nói và thông tin cuộc họp so với các công cụ AI khác đã được thử nghiệm. 

Zoom AI Companion 2.0 tích hợp liền mạch thông tin công việc và web để mang đến sự nâng cấp ấn tượng trong trải nghiệm Zoom Workplace. Mặc dù có nhiều cách để tích hợp các tính năng AI vào Zoom Workplace, nhưng có một khía cạnh của AI Companion hỗ trợ các tính năng AI được sử dụng rộng rãi nhất của chúng tôi, bao gồm tóm tắt cuộc họp, mục hành động và biên bản cuộc họp.

Hiệu quả của các tính năng AI này phụ thuộc vào độ chính xác của bản ghi mà chúng trích xuất. Nhiều tính năng phổ biến của chúng tôi, chẳng hạn như đặt câu hỏi trong cuộc họp, dựa vào khả năng nhận dạng giọng nói chất lượng cao. Bản ghi chép đáng tin cậy cho phép AI ghi lại tên, chủ đề và ý định một cách chính xác, tạo thành nền tảng cho bản tóm tắt, điểm nổi bật và thông tin chi tiết có thể hành động được.

Tiêu chuẩn công nghiệp để đo độ chính xác của bản ghi là Tỷ lệ lỗi từ (WER), so sánh tỷ lệ phần trăm khác biệt giữa bản ghi do con người tạo ra và bản ghi do AI tạo ra. Trong những năm qua, Zoom đã nỗ lực hiện đại hóa kiến trúc AI của mình để giảm thiểu WER. Bằng cách giảm thiểu WER, chúng tôi tạo ra các bản ghi chính xác, đáng tin cậy để giúp mang lại kết quả hiệu quả và khả thi cho khách hàng.

Trong phân tích WER, văn bản màu đỏ biểu thị các từ bị thiếu và văn bản màu xanh biểu thị các từ không có trong bản ghi gốc.

Trong phân tích WER, văn bản màu đỏ biểu thị các từ bị thiếu và văn bản màu xanh biểu thị các từ không có trong bản ghi gốc. 

 

Zoom cung cấp bản ghi chép chính xác hơn để hỗ trợ các tính năng AI

Kết quả rất rõ ràng: Zoom AI Companion hoạt động tốt hơn Microsoft Teams với WER thấp hơn đáng kể, mang lại mức độ chính xác cao hơn trong quá trình chép lời. Trong các cuộc họp mà từng từ đều có giá trị, ngay cả những lỗi ghi chép nhỏ cũng có thể ảnh hưởng lớn đến bản tóm tắt, nhiệm vụ hoặc câu trả lời cho các câu hỏi được nêu ra trong cuộc họp.

Sau đây là cách TestDevLab tạo và chạy các bài kiểm tra này:

  • Họ đã sử dụng ba cuộc họp được ghi âm, có sự tham gia của từ hai đến 16 người.
  • Các tập tin được phát lại đồng bộ trên từng máy tính được kết nối với cuộc gọi.
  • Để đảm bảo tính nhất quán, mỗi thử nghiệm được lặp lại năm lần cho mỗi nền tảng.

Đối với mỗi bài kiểm tra, họ so sánh Zoom Workplace và Microsoft Teams và đo Tỷ lệ lỗi từ trong mỗi cuộc họp.

Khi đo WER (Tỷ lệ lỗi từ), phần trăm thấp biểu thị chất lượng ghi chép cao.

Khi đo WER (Tỷ lệ lỗi từ), phần trăm thấp biểu thị chất lượng ghi chép cao.

Tóm tắt và bản chép lời cuộc họp là một số tính năng phổ biến và được sử dụng nhiều nhất trên nhiều nền tảng AI. Vì chúng được sử dụng rộng rãi nên việc đảm bảo giảm thiểu lỗi xuống mức thấp nhất có thể lại càng quan trọng hơn. Chúng phổ biến vì chúng tiết kiệm thời gian và mọi người tìm thấy rất nhiều giá trị trong việc đọc, tóm tắt và hiểu rõ thông tin quan trọng.

TestDevLab cũng xếp hạng Zoom Workplace và Microsoft Teams về chất lượng tóm tắt cuộc họp và AI đàm thoại (chẳng hạn như tính ổn định của câu trả lời). Để đánh giá các bản tóm tắt, họ đã tạo ra một trợ lý LLM với kết quả làm việc được xác thực bởi con người.

Bản chép lời chính xác tạo nền tảng vững chắc hơn cho các tính năng AI tiếp theo.

Chép lời không phải là tính năng AI Companion duy nhất được đo lường bởi TestDevLab. Không giống như bản chép lời, mục tiêu của các tính năng AI khác như tóm tắt cuộc họp không phải là cung cấp bản sao chính xác từng từ mà là cung cấp một bản tóm tắt được chỉnh sửa phù hợp với nhu cầu của người dùng. 

TestDevLab cũng xếp hạng Zoom Workplace và Microsoft Teams về chất lượng tóm tắt cuộc họp và AI đàm thoại (chẳng hạn như tính ổn định của câu trả lời). Để đánh giá các bản tóm tắt, họ đã tạo ra một trợ lý LLM với kết quả làm việc được xác thực bởi con người.

Trong đánh giá này, chúng tôi đã thử nghiệm hai khả năng tóm tắt trong Microsoft Teams: tính năng Tóm tắt thông minh, có sẵn trong giấy phép Teams Premium hoặc Microsoft 365 Copilot và khả năng tạo tóm tắt dựa trên lời nhắc của Microsoft Copilot AI Assistant trong Teams Meetings. Vì Trợ lý AI Copilot chỉ có thể tạo bản tóm tắt dựa trên các lệnh, chúng tôi đã yêu cầu Copilot tạo bản tóm tắt và các mục hành động khi kết thúc cuộc họp.

Trong đánh giá này, chúng tôi đã thử nghiệm hai khả năng tóm tắt trong Microsoft Teams: tính năng Tóm tắt thông minh, có sẵn trong giấy phép Teams Premium hoặc Microsoft 365 Copilot và khả năng tạo tóm tắt dựa trên lời nhắc của Microsoft Copilot AI Assistant trong Teams Meetings. Vì Trợ lý AI Copilot chỉ có thể tạo bản tóm tắt dựa trên các lệnh, chúng tôi đã yêu cầu Copilot tạo bản tóm tắt và các mục hành động khi kết thúc cuộc họp.

Về AI đàm thoại, TestDevLab đã đo lường cách các nền tảng AI trả lời các câu hỏi trong khi họp, đối với cả các câu hỏi liên quan đến bối cảnh cuộc họp và các tìm kiếm trên web không liên quan, như "Tòa nhà cao nhất thế giới là gì?" Xét về thời gian phản hồi và tính ổn định (khả năng tất cả người tham gia cuộc họp đều nhận được câu trả lời tương tự), Zoom AI Companion đều vượt trội hơn Microsoft.

Độ ổn định cao hơn thể hiện rằng AI của Zoom luôn đưa ra phản hồi đáng tin cậy cho tất cả người tham gia, mang lại trải nghiệm mượt mà hơn trong các cuộc họp.

Độ ổn định cao hơn thể hiện rằng AI của Zoom luôn đưa ra phản hồi đáng tin cậy cho tất cả người tham gia, mang lại trải nghiệm mượt mà hơn trong các cuộc họp. 

 

Zoom AI Companion mang đến trải nghiệm họp tốt hơn, công bằng hơn

Những kết quả này nêu bật cam kết của chúng tôi về chất lượng trên Zoom Workplace và AI Companion. Chúng tôi nỗ lực tạo ra phương thức giúp mọi người dễ dàng kết nối với nhau hơn, làm việc hiệu quả hơn và có cơ hội sử dụng trí tuệ nhân tạo để hỗ trợ công việc. Bản ghi chép cuộc họp do AI tạo ra chỉ là một trong những cách mọi người có thể sử dụng AI Companion để giúp tạo ra trải nghiệm công bằng hơn cho nhiều người, bao gồm người khiếm thính, người khiếm thính, người có hệ thần kinh đa dạng và những người có thể nói ngôn ngữ khác với những người khác trong cuộc họp.

Đánh giá này do TestDevLab thực hiện nêu bật Zoom Workplace và AI Companion là những công cụ dẫn đầu về hiệu suất AI, với độ chính xác khi phiên âm vượt trội, thời gian phản hồi câu hỏi trong cuộc họp nhanh hơn và khả năng AI đàm thoại ổn định hơn so với các đối thủ đã thử nghiệm.

Hơn nữa, Zoom Workplace cung cấp AI Companion mà không tính thêm chi phí cho các tài khoản Zoom trả phí, không giống như một số nền tảng thay thế tính thêm phí cho mỗi người dùng bổ sung được cấp các tính năng AI. Tại Zoom, chúng tôi cho rằng điều quan trọng là phải cung cấp những công cụ chính xác và có khả năng chuyển đổi này cho càng nhiều khách hàng càng tốt. Chúng tôi bắt đầu từ nền tảng - tạo ra các bản ghi chất lượng cao - và tiếp tục tạo ra những trải nghiệm AI đặc biệt cho tất cả khách hàng.

Nếu bạn không có gói Zoom trả phí đủ điều kiện, hãy nâng cấp ngay hôm nay để tiếp cận các lợi ích của AI Companion.

Khách hàng của chúng tôi yêu thích chúng tôi

Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox
Okta
Nasdaq
Rakuten
Logitech
Western Union
Autodesk
Dropbox

Zoom - Nơi bạn kết nối