Xem bảng xếp hạng
Zoom Speech được xếp hạng trong số các mô hình hàng đầu trên Bảng xếp hạng Open ASR Xem bảng xếp hạng
close banner
Dịch vụ Zoom AI: Scribe API
Dịch vụ Zoom AI: Scribe API

API chuyển đổi giọng nói thành văn bản chính xác nhất trên thế giới

Chép lời chất lượng mà bạn có thể tin tưởng, được hỗ trợ bởi ASR Model Chuyên nghiệp của Zoom.

 

Được xếp hạng là một trong những mô hình có hiệu suất hàng đầu trên Bảng xếp hạng HuggingFace Open ASR, Scribe API cung cấp cả dịch vụ Đồng bộ nhanh và Chép lời hàng loạt, được xây dựng dựa trên công nghệ ASR hỗ trợ hàng triệu cuộc họp Zoom mỗi ngày.

Dịch vụ Zoom AI: Scribe API
Chức năng
Chức năng

Mọi thứ bạn cần để chuyển đổi giọng nói thành văn bản

Từ xử lý gần thời gian thực đến xử lý hàng loạt, Zoom Scribe API cung cấp dịch vụ chép lời với độ chính xác và tốc độ cao.

Chép lời đồng bộ nhanh

Chép lời đồng bộ nhanh

Truy cập tính năng chép lời đồng bộ, độ trễ thấp cho từng tệp âm thanh riêng lẻ. Xử lý từng tệp một và phản hồi ngay lập tức sau khi hoàn tất.

Chép lời hàng loạt

Chép lời hàng loạt

Xử lý các tệp âm thanh và video ghi sẵn ở quy mô lớn. Hỗ trợ MP3, WAV, MP4, FLAC, OGG, v.v. với tính năng phát hiện định dạng tự động.

Dấu thời gian ở cấp độ từ

Dấu thời gian ở cấp độ từ

Nhận được thời gian bắt đầu và kết thúc chính xác cho từng từ, cho phép tạo phụ đề hoàn hảo, tìm kiếm âm thanh và lập chỉ mục nội dung.

Thử ngay

Hãy tự mình kiểm chứng độ chính xác

Hãy nhấp vào biểu tượng micro để sử dụng đầu vào âm thanh của trình duyệt nhằm mô phỏng bản chép lời. Bản demo chỉ có sẵn bằng tiếng Anh.

Sân chơi Zoom Scribe API
Nhấp vào biểu tượng micro để bắt đầu chép lời thử nghiệm
Đầu ra chép lời
Latency: Confidence:

Nội dung chép lời sẽ xuất hiện ở đây...

Hiệu suất
Hiệu suất

Zoom Speech được xếp hạng trong số các mô hình hàng đầu trên Bảng xếp hạng Open ASR

Chúng tôi tự hào thông báo rằng công nghệ nhận dạng giọng nói của Zoom nằm trong số những mô hình hàng đầu trên bảng xếp hạng Open ASR Leaderboard, một tiêu chuẩn toàn cầu về hiệu suất nhận dạng giọng nói tự động (ASR). Cột mốc này phản ánh sự nỗ lực không ngừng của chúng tôi để đạt được sự xuất sắc trong công nghệ nhận dạng giọng nói và sức mạnh của API Scribe của Zoom AI Services.
Các điểm mạnh chính của mô hình bao gồm:

  • Độ chính xác hàng đầu: Khung cải tiến có khả năng mở rộng của chúng tôi liên tục nâng cao chất lượng mô hình, cung cấp kết quả chép lời tốt nhất trong những lĩnh vực mà độ chính xác và khả năng đọc hiểu là quan trọng nhất.
  • Nắm vững thuật ngữ Doanh nghiệp lớn: Được tối ưu hóa cho bối cảnh kinh doanh và kỹ thuật, mô hình này xử lý chính xác tên công ty, thuật ngữ sản phẩm và biệt ngữ chuyên ngành — một lợi thế quan trọng cho các cuộc họp, cuộc gọi hỗ trợ và tài liệu chuyên nghiệp.
  • Giảm thiểu ảo giác: Các chiến lược mô hình hóa tiên tiến của Zoom giảm thiểu tối đa các "ảo giác" trong quá trình chép lời, đảm bảo những gì được nhận diện thực sự phản ánh ý định của người nói, chứ không phải là những từ ngữ giả tạo hoặc không liên quan.
Các trường hợp sử dụng
Các trường hợp sử dụng

Thiết kế cho mọi cuộc trò chuyện

Từ phòng họp đến các các trung tâm liên hệ, API Zoom Scribe chuyển đổi lời nói thành thông tin hữu ích có thể hành động được.

  1. Số liệu phân tích Trung tâm liên hệ

    Số liệu phân tích Trung tâm liên hệ

    Chép lời cuộc gọi của khách hàng, phát hiện cảm xúc, xác định chủ đề và cung cấp thông tin chi tiết để cải thiện hiệu suất của nhân viên.

  2. Xử lý đa phương tiện

    Xử lý đa phương tiện

    Chuyển đổi bản ghi âm thành bản chép lời và phụ đề có đánh dấu thời gian để chỉnh sửa và tìm kiếm.

  3. Ứng dụng trí tuệ hội thoại

    Ứng dụng trí tuệ hội thoại

    Tích hợp tính năng chuyển đổi giọng nói thành văn bản chính xác vào bất kỳ nền tảng hoặc ứng dụng hội thoại nào dành cho trợ lý ảo và định tuyến tự động để mang đến dịch vụ tự phục vụ liền mạch cho khách hàng.

  4. Quản lý tri thức doanh nghiệp lớn

    Quản lý tri thức doanh nghiệp lớn

    Nhập và chép lời hàng nghìn cuộc họp, cuộc họp hỏi đáp và hội thảo trực tuyến được ghi lại để xây dựng cơ sở kiến thức doanh nghiệp tập trung, có thể tìm kiếm tức thì.

  5. Công nghệ giáo dục và lưu trữ khóa học

    Công nghệ giáo dục và lưu trữ khóa học

    Chép lời không đồng bộ toàn bộ thư viện các bài giảng và khóa học trực tuyến trước đây để tạo ra các tài liệu hướng dẫn học tập toàn diện và đảm bảo tuân thủ nghiêm ngặt các quy định về trợ năng.

  6. Nghiên cứu thị trường và phân tích định tính

    Nghiên cứu thị trường và phân tích định tính

    Nhanh chóng chép lời hàng trăm giờ các nhóm tập trung, phỏng vấn người dùng và nghiên cứu thực địa đã ghi lại để đẩy nhanh phân tích và báo cáo theo chủ đề.

Ưu tiên nhà phát triển
Ưu tiên nhà phát triển

Bắt đầu chép lời trong ít phút

  • API đơn giản, được ghi chép đầy đủ và rõ ràng.
  • API REST và đặc tả OpenAPI
  • Xử lý lỗi toàn diện
  • Gọi lại Webhook cho các tác vụ bất đồng bộ
Mức giá
Mức giá

Mức giá đơn giản, minh bạch

Áp dụng số dư tín dụng trả trước vào việc sử dụng API của Scribe với mức phí minh bạch.

Tài nguyên dành cho nhà phát triển

Tất cả những gì bạn cần để tích hợp, xây dựng và triển khai với API Zoom Scribe.

Sẵn sàng xây dựng với API chuyển đổi giọng nói thành văn bản hàng đầu