
Tập đoàn Alibaba vừa chính thức ra mắt loạt mô hình trí tuệ nhân tạo (AI) mới mang tên Qwen3, nhanh chóng vượt qua đối thủ để trở thành mô hình AI mã nguồn mở đứng đầu thế giới, theo kết quả phân tích từ LiveBench.
LiveBench là một hệ thống đánh giá năng lực các mô hình ngôn ngữ lớn (LLM) – công nghệ cốt lõi đứng sau những dịch vụ AI như ChatGPT – dựa trên nhiều tiêu chí khắt khe như khả năng lập trình, toán học, phân tích dữ liệu và xử lý ngôn ngữ. Qwen3 của Alibaba đã vượt qua R1, vốn là mô hình dẫn đầu kể từ tháng 1/2025.
Mô hình mạnh mẽ, tham số khổng lồ
Qwen3 là sản phẩm do đơn vị điện toán đám mây của Alibaba tại Hàng Châu phát triển, bao gồm tám mô hình khác nhau, với quy mô từ 600 triệu đến 235 tỷ tham số.
Trong học máy, tham số là những biến số được điều chỉnh trong quá trình đào tạo, đóng vai trò quyết định khả năng học hỏi và tạo ra phản hồi chính xác từ dữ liệu.
Sự đa dạng trong quy mô giúp Qwen3 phù hợp với nhiều nhu cầu khác nhau của người dùng, từ cá nhân đến doanh nghiệp lớn.
Khác với các mô hình nguồn đóng như GPT-4o (OpenAI), Gemini Pro 2.5 (Google) hay Claude 3.7 (Anthropic), Qwen3 thuộc dạng mã nguồn mở. Điều này đồng nghĩa với việc mã nguồn được công khai và cộng đồng phát triển toàn cầu có thể truy cập, điều chỉnh hoặc cải tiến mô hình theo nhu cầu.
Việc lựa chọn hướng đi nguồn mở được xem là bước đi chiến lược của Alibaba nhằm đẩy mạnh ảnh hưởng của mình trong cộng đồng AI toàn cầu, đồng thời góp phần thúc đẩy phát triển ngành công nghệ AI trong nước, trong bối cảnh các công ty Trung Quốc ngày càng gặp khó khăn trong tiếp cận công nghệ cao từ phương Tây.
Theo LiveBench, Qwen3 không chỉ vượt trội về mặt khả năng mà còn có lợi thế lớn về chi phí vận hành. Chi phí chạy Qwen3 chỉ khoảng 4 nhân dân tệ (0,55 USD) cho mỗi triệu token – rẻ hơn nhiều so với mức 10 USD/một triệu token của mô hình GPT-4o hàng đầu hiện nay.
Chi phí hợp lý cùng hiệu suất mạnh mẽ đã giúp Qwen3 nhanh chóng được cộng đồng công nghệ hưởng ứng và triển khai rộng rãi.
Ngay sau khi ra mắt, nhiều tên tuổi lớn trong ngành công nghệ Trung Quốc như Huawei, Moore Threads, Cambricon và Hygon đã tuyên bố hỗ trợ mô hình Qwen3. Đặc biệt, Cambricon cho biết họ đã tối ưu hóa thành công Qwen3 để chạy hiệu quả trên bộ xử lý đồ họa (GPU) “made in China” của hãng – một nỗ lực nhằm giảm sự phụ thuộc vào chip phương Tây.
Bên cạnh đó, các công ty điện toán đám mây như Hyperbolic và Fireworks.ai cũng đã tích hợp Qwen3 vào hạ tầng của mình. Thậm chí, một số hãng công nghệ nước ngoài như Nvidia và Together.ai được cho là cũng đã bắt đầu hỗ trợ mô hình này.
Triển khai rộng rãi trong nước
Tại Trung Quốc, nhiều trung tâm dữ liệu lớn tại các thành phố như Bắc Kinh, Thượng Hải, Hàng Châu, cũng như các tỉnh Hồ Bắc, Cát Lâm và Thiểm Tây đã bắt đầu áp dụng Qwen3 vào các hệ thống AI thế hệ mới.
Mạng lưới siêu máy tính quốc gia, kết nối hơn 20 trung tâm dữ liệu trên khắp Trung Quốc, cũng đang thử nghiệm tích hợp Qwen3, mở đường cho việc triển khai mô hình này trên quy mô quốc gia.
Dù đứng đầu bảng xếp hạng các mô hình AI mã nguồn mở, Qwen3 vẫn chưa thể vượt qua các mô hình nguồn đóng hàng đầu thế giới về tổng thể. Microsoft – OpenAI hiện vẫn giữ vị trí số 1 với mô hình o3-mini high.
Tuy vậy, sự nổi bật của Qwen3 cho thấy tốc độ phát triển chóng mặt của ngành AI Trung Quốc, đặc biệt là trong lĩnh vực mã nguồn mở. Đây là tín hiệu tích cực cho tham vọng công nghệ của Trung Quốc trong cuộc đua AI toàn cầu, khi các rào cản về công nghệ và địa chính trị ngày càng lớn.
Theo SCMP