DeepSeek ra mắt mô hình AI V3.2-exp, ‘hứa hẹn giảm nửa chi phí khi suy luận’

DeepSeek ra mắt mô hình V3.2-exp

Ngày 29/9, DeepSeek chính thức công bố mô hình thử nghiệm V3.2-exp trên các nền tảng Hugging Face và GitHub. Điểm nổi bật của mô hình này là khả năng giảm đáng kể chi phí suy luận khi xử lý các tác vụ yêu cầu chuỗi ngữ cảnh dài – một trong những thách thức lớn của trí tuệ nhân tạo hiện nay.

Theo DeepSeek, V3.2-exp được trang bị cơ chế Sparse Attention – một hệ thống phức tạp hoạt động dựa trên module chuyên biệt. Mô hình hiện vẫn đang trong quá trình thử nghiệm cuối và sẽ triển khai dưới dạng API (giao diện lập trình ứng dụng) cho các nhà phát triển thời gian tới. Thay vì xử lý toàn bộ dữ liệu đầu vào, Sparse Attention sử dụng hệ thống fine-grained token selection để lựa chọn các mã thông báo quan trọng từ những đoạn văn bản cần thiết, sau đó nạp vào cửa sổ Attention theo trình tự hạn chế. Cách tiếp cận này giúp tối ưu tài nguyên tính toán, cho phép mô hình xử lý ngữ cảnh dài ngay cả trên hạ tầng máy chủ có cấu hình vừa phải.

Giao diện truy vấn của DeepSeek
Giao diện truy vấn của DeepSeek

Kết quả thử nghiệm sơ bộ cho thấy, chi phí của một lệnh gọi API đơn giản có thể giảm tới 50% khi áp dụng cơ chế Sparse Attention. DeepSeek khẳng định, mặc dù cần thêm thời gian đánh giá trước khi tung ra bản chính thức cho người dùng cuối, những tín hiệu ban đầu cho thấy đây là bước tiến quan trọng trong việc tối ưu hóa chi phí vận hành AI.

Các chuyên gia nhận định, V3.2-exp có thể trở thành giải pháp đột phá cho bài toán cân bằng giữa hiệu năng và chi phí, vốn đang là mối quan tâm lớn trong ngành công nghệ khi ngày càng nhiều công ty đầu tư xây dựng hạ tầng huấn luyện mô hình AI.

DeepSeek được biết đến là công ty tập trung vào các mô hình AI hiệu suất cao với chi phí thấp. Trước đó, doanh nghiệp có trụ sở tại Trung Quốc này từng gây chú ý toàn cầu với các phiên bản DeepSeek V3 và R1. Khác với nhiều đối thủ, công ty theo đuổi phương pháp “chưng cất mô hình” (model distillation) giúp tối ưu hiệu suất trong khi giảm chi phí đào tạo và vận hành, qua đó mở rộng khả năng tiếp cận công nghệ AI tới nhiều nhóm người dùng hơn.

Tuy vậy, theo Reuters, những cải tiến này chưa tạo ra sự thay đổi mang tính cách mạng trong lĩnh vực huấn luyện AI, khiến DeepSeek phần nào mất đi sức hút trong giai đoạn gần đây. Với sự xuất hiện của V3.2-exp, công ty kỳ vọng sẽ lấy lại vị thế tiên phong, đồng thời tạo cú hích mới trong cuộc đua toàn cầu về AI hiệu năng cao, chi phí thấp.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *