
Công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek, có trụ sở tại Hàng Châu, Trung Quốc mới đây đã công khai ghi nhận sự đóng góp quan trọng từ Tập đoàn Tencent trong việc giải quyết một vấn đề kỹ thuật then chốt trong hệ thống AI của mình. Đây là một minh chứng điển hình cho sức mạnh của mô hình hợp tác mã nguồn mở đang ngày càng phát triển trong lĩnh vực AI tại Trung Quốc.
Zhao Chenggang, kỹ sư hạ tầng AI tại DeepSeek, cho biết DeepEP – một công cụ truyền thông giữa các chip xử lý – đã đạt được “tốc độ cải thiện đáng kể” sau khi áp dụng giải pháp kỹ thuật do bộ phận nền tảng mạng của Tencent phát triển.
“Giải pháp này không chỉ tăng cường tính ổn định mà còn cải thiện rõ rệt hiệu suất truyền dữ liệu trong hệ thống,” Zhao chia sẻ trong một ghi chú công bố trên GitHub – nơi DeepSeek lưu trữ các dự án mã nguồn mở.
DeepEP là một trong tám dự án mã nguồn mở mà DeepSeek công bố trong một tuần lễ đặc biệt vào tháng 2 nhằm giới thiệu nền tảng AI hiệu suất cao, chi phí thấp và các mô hình lý luận AI của công ty.
Sự hợp tác giữa DeepSeek và Tencent cho thấy cách các công ty công nghệ Trung Quốc đang bắt đầu áp dụng tư duy chia sẻ theo mô hình mã nguồn mở, thay vì cạnh tranh đơn độc trong một thị trường AI nội địa vốn đã đông đúc và khốc liệt.
Theo Tencent, giải pháp mà họ cung cấp được xây dựng trên kinh nghiệm dày dạn trong việc tối ưu hóa trung tâm dữ liệu và truyền thông giữa các bộ xử lý đồ họa (GPU) – yếu tố cốt lõi để huấn luyện các mô hình AI quy mô lớn. Công nghệ này cũng được Tencent sử dụng để phát triển mô hình AI nội bộ Hunyuan, vốn đã được mở mã nguồn cho cộng đồng, bao gồm cả DeepSeek.
Theo nguyên lý của mã nguồn mở, các công ty và nhà phát triển công bố mã của phần mềm, cho phép cộng đồng xem, sửa đổi và đóng góp. Cách tiếp cận này đã chứng minh hiệu quả trong việc thúc đẩy đổi mới, rút ngắn thời gian phát triển và nâng cao chất lượng sản phẩm thông qua sự tham gia của hàng nghìn lập trình viên trên toàn cầu.
Alibaba là một trong những doanh nghiệp tiên phong áp dụng triệt để chiến lược mã nguồn mở. Dòng mô hình Qwen của Alibaba hiện là một trong những hệ sinh thái AI nguồn mở lớn nhất thế giới, tạo ra hơn 100.000 mô hình phái sinh và đóng góp vào 10 mô hình mã nguồn mở hàng đầu toàn cầu, vượt qua cả Llama của Meta.
Theo bảng xếp hạng LiveBench mới nhất – một hệ thống đánh giá hiệu năng của các mô hình AI – hai đại diện Trung Quốc là Qwen 3 (Alibaba) và R1 (DeepSeek) đang nằm trong nhóm dẫn đầu thế giới.
Ngay cả OpenAI – nhà phát triển ChatGPT – cũng không nằm ngoài xu hướng. Mới đây, giám đốc sản phẩm của công ty, ông Kevin Weil, cho biết OpenAI dự kiến sẽ ra mắt một mô hình AI mã nguồn mở. Tuy nhiên, mô hình này sẽ “chậm hơn một thế hệ” so với sản phẩm tiên tiến nhất hiện có của công ty nhằm tránh tạo ra cạnh tranh trực tiếp với các mô hình đến từ Trung Quốc.
Sự kết hợp giữa DeepSeek và Tencent là một ví dụ điển hình về cách các công ty công nghệ Trung Quốc đang chuyển dịch chiến lược sang hợp tác và chia sẻ – một xu hướng từng được dẫn dắt bởi các cộng đồng phát triển phần mềm phương Tây. Khi AI ngày càng trở thành lĩnh vực chiến lược, mã nguồn mở có thể chính là chìa khóa để Trung Quốc rút ngắn khoảng cách với các quốc gia đi đầu như Mỹ, đồng thời tạo ra một hệ sinh thái AI năng động, sáng tạo và bền vững hơn.
Theo SCMP

Công nghệ DeepSeek bị "thổi phồng"?

Qwen3 đánh bại R1 của DeepSeek để trở thành mô hình AI được xếp hạng hàng đầu thế giới
