Alibaba công bố mô hình AI Qwen3 vượt trội DeepSeek R1

Qwen3 bao gồm tám mô hình với số lượng tham số dao động từ 600 triệu đến 235 tỷ tham số, hứa hẹn sẽ mang lại những cải tiến đáng kể so với các thế hệ trước.
Alibaba đã phát hành thế hệ thứ ba của loạt mô hình Qwen AI. Ảnh: Reuters.

Mới đây, Alibaba đã công bố thế hệ thứ ba của dòng sản phẩm trí tuệ nhân tạo (AI) mã nguồn mở, mang tên Qwen3. Với những cải tiến mạnh mẽ về khả năng xử lý nhanh hơn và hỗ trợ đa ngôn ngữ, Qwen3 hứa hẹn sẽ tăng cường sự cạnh tranh của Alibaba trên thị trường AI, đặc biệt là tại Trung Quốc, nơi đang ngày càng đông đúc với các công ty công nghệ lớn.

Qwen3: Mô hình AI nâng cao với sức mạnh đột phá

Qwen3 bao gồm tám mô hình với số lượng tham số dao động từ 600 triệu đến 235 tỷ tham số, hứa hẹn sẽ mang lại những cải tiến đáng kể so với các thế hệ trước. Các mô hình này đã được thử nghiệm và chứng minh hiệu suất vượt trội hoặc ngang bằng với các mô hình AI tiên tiến từ các đối thủ lớn như OpenAI, Google, và DeepSeek trong các lĩnh vực như tuân thủ hướng dẫn, hỗ trợ mã hóa, tạo văn bản, kỹ năng toán học và giải quyết vấn đề phức tạp.

Trong AI, tham số là chỉ số đo lường mức độ tinh vi của mô hình. Sự gia tăng số lượng tham số trong Qwen3 phản ánh khả năng xử lý tốt hơn và độ chính xác cao hơn trong việc giải quyết các tác vụ phức tạp.

Một trong những điểm nổi bật của Qwen3 là khả năng hỗ trợ hơn 119 ngôn ngữ, gấp ba lần so với phiên bản Qwen2.5 trước đó. Điều này giúp mô hình này cải thiện khả năng hiểu và dịch các hướng dẫn trong nhiều ngôn ngữ khác nhau, mở rộng phạm vi sử dụng của AI không chỉ trong Trung Quốc mà còn ở các quốc gia khác.

Qwen3 được đào tạo trên 36 nghìn tỷ mã token, giúp mô hình này có thể xử lý các yêu cầu phức tạp và đa dạng hơn. Nhờ vào quá trình đào tạo tiên tiến và học tăng cường, Qwen3 đạt được mức độ thông minh cao hơn, cho phép nó đáp ứng các yêu cầu ngày càng cao từ người dùng.

Được biết, Alibaba đã phát hành Qwen3 trên GitHub của Microsoft và dịch vụ lưu trữ mô hình AI - ModelScope. Điều này không chỉ giúp mở rộng tầm ảnh hưởng của Alibaba trong cộng đồng AI nguồn mở mà còn giúp người dùng dễ dàng truy cập và áp dụng mô hình này vào các ứng dụng thực tế.

Mỗi mô hình Qwen3 đều có khả năng lý luận lai, cho phép người dùng chuyển đổi giữa chế độ "suy nghĩ", phù hợp với các vấn đề phức tạp, và chế độ "không suy nghĩ", cho phép phản hồi nhanh hơn đối với các tác vụ hàng ngày. Điều này giúp tăng cường tính linh hoạt và hiệu quả khi sử dụng AI trong các ứng dụng khác nhau.

Cạnh tranh AI ngày càng gay gắt Trung Quốc

Việc ra mắt Qwen3 diễn ra ngay sau khi Baidu công bố hai mô hình AI tiên tiến của mình và trong bối cảnh DeepSeek chuẩn bị ra mắt R2. Sự cạnh tranh trên thị trường AI của Trung Quốc ngày càng gay gắt khi các công ty công nghệ lớn như Baidu, DeepSeek, và Alibaba chạy đua để phát triển và nâng cấp dịch vụ của mình. Alibaba đang nỗ lực không ngừng để duy trì lợi thế cạnh tranh trong một thị trường đầy thách thức.

Để duy trì vị thế của mình, Alibaba đã tăng cường đầu tư vào AI, với cam kết hơn 52 tỷ USD trong ba năm tới để xây dựng cơ sở hạ tầng AI. Đây là dự án điện toán lớn nhất của một công ty tư nhân tại Trung Quốc. Bên cạnh đó, Alibaba cũng ra mắt một chiến dịch tuyển dụng mùa xuân, với một nửa số vị trí thực tập dành cho các vai trò tập trung vào AI, cho thấy sự quan tâm mạnh mẽ của công ty đối với việc phát triển nguồn nhân lực trong lĩnh vực này.

Theo SCMP