Trung Quốc có thêm một "DeepSeek" khác?

VietTimes - Shanghai Goku Technologies, một công ty tài chính cho biết trong một bài báo gửi tới "AI Olympics" rằng phương pháp đào tạo của họ vượt trội hơn so với phương pháp được DeepSeek, OpenAI áp dụng.
Shanghai Goku Technologies đã thành lập một công ty con về AI, theo con đường của DeepSeek có trụ sở tại Hàng Châu. Ảnh: SCMP.

Một quỹ giao dịch định lượng tại Trung Quốc vừa gây bất ngờ khi công bố một kỹ thuật đào tạo trí tuệ nhân tạo (AI) mới, được cho là có thể vượt qua các phương pháp đang được sử dụng phổ biến hiện nay bởi những tên tuổi lớn như OpenAI hay DeepSeek. Động thái này thể hiện rõ quyết tâm của các công ty công nghệ Trung Quốc trong việc dẫn đầu cuộc đua AI toàn cầu, bất chấp các rào cản từ phía Mỹ.

Tham vọng từ hội nghị hàng đầu ngành AI

Shanghai Goku Technologies, một công ty tài chính sử dụng AI trong chiến lược đầu tư, đã nộp bài nghiên cứu lên Hội nghị về Hệ thống Xử lý Thông tin Thần kinh (NeurIPS) – một trong những sự kiện uy tín bậc nhất thế giới trong lĩnh vực máy học và trí tuệ nhân tạo, thường được gọi là “Thế vận hội AI”.

Bài nghiên cứu được thực hiện bởi nhóm của Goku phối hợp cùng các nhà khoa học đến từ Đại học Giao thông Thượng Hải và công ty con mới thành lập Shanghai AllMind Artificial Intelligence Technology.

Trong bài viết, nhóm tác giả giới thiệu một phương pháp đào tạo mô hình ngôn ngữ lớn mới có tên SASR – viết tắt của Stepwise Adaptive Supervised Reinforcement (tạm dịch: Học tăng cường có giám sát thích ứng từng bước).

Phương pháp SASR được lấy cảm hứng từ cách con người hình thành khả năng suy luận, và theo Goku, nó vượt trội hơn các phương pháp kết hợp giữa điều chỉnh có giám sát (SFT – Supervised Fine-Tuning) và học tăng cường (RL – Reinforcement Learning), vốn đang là tiêu chuẩn của ngành.

SASR – Một hướng tiếp cận mới mẻ

Nhóm nghiên cứu của Goku cho rằng SFT và RL – dù đã giúp nâng cao đáng kể hiệu suất của các mô hình AI – vẫn còn những hạn chế về tính linh hoạt và khả năng thích ứng với các tình huống phức tạp. Trong khi đó, SASR được xây dựng theo cách “học từng bước”, giúp mô hình thích nghi tốt hơn và đưa ra các phản hồi có lý luận chặt chẽ hơn.

“Kết quả thử nghiệm chứng minh rằng SASR vượt trội hơn các phương pháp huấn luyện hiện tại về cả hiệu suất và độ ổn định”, nhóm tác giả khẳng định trong bài báo.

Việc một quỹ đầu tư như Goku, thay vì một công ty công nghệ truyền thống, lại có bước tiến đột phá trong lĩnh vực AI đã thu hút sự chú ý lớn. Công ty này hiện đang hoạt động theo khẩu hiệu “logic và sự thật là những nguyên tắc duy nhất chúng tôi tuân theo” và đang quản lý hơn 15 tỷ nhân dân tệ (tương đương 2,1 tỷ USD) tài sản trong và ngoài Trung Quốc.

Sự trỗi dậy của AI Trung Quốc

Bên cạnh Goku, một công ty AI khác tại Trung Quốc cũng đang nổi lên mạnh mẽ là DeepSeek – công ty con của quỹ đầu cơ High-Flyer. DeepSeek đã gây tiếng vang lớn trong giới công nghệ khi ra mắt mô hình ngôn ngữ V3 vào tháng 12 năm ngoái, sử dụng SFT và RL để huấn luyện, đạt kết quả cạnh tranh với các sản phẩm của các ông lớn như OpenAI.

Điểm chung giữa Goku và DeepSeek là cả hai đều có nguồn gốc từ các quỹ đầu cơ sử dụng AI làm công cụ chiến lược. Goku mới đây cũng thành lập công ty con AllMind chuyên nghiên cứu AI, với người sáng lập Wang Xiao là đại diện pháp lý. Theo tờ China Securities Journal, AllMind ra đời với mục tiêu “khám phá ranh giới công nghệ” của các mô hình AI thế hệ mới.

Sự đầu tư bài bản vào nghiên cứu AI từ các quỹ tài chính như Goku hay High-Flyer cho thấy cách tiếp cận chiến lược mới của Trung Quốc: thay vì chỉ tập trung vào phần cứng, họ đẩy mạnh nghiên cứu thuật toán và tích hợp phần mềm thông minh – hướng đi ít bị ảnh hưởng bởi các hạn chế từ phía Mỹ.

Trong bối cảnh Mỹ đang thắt chặt kiểm soát xuất khẩu chip AI sang Trung Quốc nhằm kiềm chế sự phát triển công nghệ của Bắc Kinh, nhiều chuyên gia cho rằng các nỗ lực này không mang lại hiệu quả mong muốn. CEO của Nvidia, ông Jensen Huang, gần đây đã nhận định rằng Trung Quốc hiện chiếm tới 50% lực lượng phát triển AI toàn cầu, và thị trường này vẫn là “ưu tiên chiến lược” bất chấp các lệnh cấm.

Sự nổi lên của Goku và DeepSeek cho thấy AI của Trung Quốc đang dần chuyển từ “bắt kịp” sang “dẫn đầu” trong một số lĩnh vực, đặc biệt là trong các kỹ thuật huấn luyện mô hình. Nếu các công ty này tiếp tục chứng minh được năng lực thuật toán, họ hoàn toàn có thể cạnh tranh sòng phẳng với các đối thủ Mỹ, bất kể những rào cản về phần cứng.

Theo SCMP