DeepSeek-R1 không đơn thuần là một bước tiến công nghệ mà còn đánh dấu sự chuyển mình mạnh mẽ của Trung Quốc trong cuộc đua trí tuệ nhân tạo toàn cầu. Với chi phí thấp, mã nguồn mở và hiệu suất vượt trội, mô hình này đã đặt ra thách thức lớn cho các gã khổng lồ công nghệ phương Tây.
Câu chuyện thành công của DeepSeek không chỉ khiến thị trường AI phải thay đổi cách nhìn mà còn mở ra một chương mới, nơi sáng tạo và tối ưu hóa được đặt lên hàng đầu.
DeepSeek-R1 sẽ làm thay đổi cách tiếp cận trong việc phát triển AI?
-Cách đây vài ngày, một công ty khởi nghiệp Trung Quốc mang tên DeepSeek đã tung ra một trợ lý trí tuệ nhân tạo (AI) miễn phí có tính năng tương đương các đối thủ đến từ Mỹ như OpenAI và Meta. Có thể nói đây là sự kiện làm rung động làng công nghệ thế giới đầu năm 2025. Cố vấn của ông Trump, Marc Andreessen, mô tả DeepSeek-R1 là “khoảnh khắc Sputnik của AI”. Ông có thể nói rõ hơn về sự kiện này không?
-Khoảnh khắc “Sputnik” mà Marc Andreessen nhắc đến là một phép so sánh mang tính biểu tượng. Khi Liên Xô phóng thành công vệ tinh Sputnik năm 1957, họ đã chứng minh rằng những kỳ tích kỹ thuật đã từng là niềm tự hào Mỹ không phải là bất khả xâm. Tương tự, DeepSeek-R1 đã tạo ra đột phá trong lĩnh vực AI khi chi phí phát triển chỉ là 6 triệu USD, nhưng hiệu suất lại có thể so sánh với các mô hình đáng giá hàng tỷ USD như OpenAI.
Về mặt kỹ thuật, mô hình R1 đã sử dụng kiến trúc đột phá như Mixture-of-Experts (MoE) và đào tạo bằng học tăng cường (Reinforcement Learning - RL) để tối ưu hoá hiệu năng trong khi chỉ sử dụng 2.000 GPU Nvidia H800. Việc đạt hiệu suất 97,3% trong bài kiểm tra MATH-500 đã chứng minh khả năng giải quyết bài toán logic phức tạp mà không phụ thuộc vào điện toán quy mô lớn. (Nguồn: DataCamp, 2025).
DeepSeek-R1 đã buộc các nhà đầu tư và các cơ quan quản lý phải xem xét lại giả định: liệu AI có thực sự cần chi phí cao đến vậy để đạt hiệu quả?
-Điều đáng nói, chi phí DeepSeek công bố chỉ có 6 triệu USD để làm ra loại sản phẩm tương đương chi phí đầu tư nhiều tỷ USD như ở Mỹ. Hơn nữa lại tốn rất ít điện so với lượng điện tiêu hao mà các nhà làm AI của Mỹ hiện tiêu thụ. Nhiều chuyên gia AI cho rằng, cú sốc này “có khả năng làm chệch hướng đầu tư cho toàn bộ chuỗi cung ứng AI”. Bởi các nhà đầu tư mạo hiểm sẽ nghĩ xem có nên “ném” nhiều tỷ USD vào một thứ như vậy nữa hay không. Trong khi một công ty 500 tỷ USD vừa được hàng loạt tỷ phú công nghệ và ông Tổng thống Trump cho ra mắt cách nay ít ngày. Ý kiến của ông về vấn đề này như thế nào?
-Chi phí phát triển DeepSeek-R1 chỉ 6 triệu USD - một con số đáng kinh ngạc, đặc biệt khi so sánh với các khoản đầu tư khổng lồ của các công ty như OpenAI, Meta hay Google, vốn lên tới hàng tỷ USD. Theo nghiên cứu từ Time (2025), các mô hình như o1 của OpenAI được phát triển trong một thập kỷ với nguồn lực khổng lồ, nhưng lại phải đối mặt với sự cạnh tranh từ một startup mới thành lập chưa đầy hai năm như DeepSeek.
Điểm đặc biệt nằm ở việc DeepSeek đã tối ưu hóa chi phí bằng cách sử dụng các GPU tầm trung (Nvidia H800) thay vì các GPU hàng đầu như H100, và ứng dụng kiến trúc Mixture-of-Experts (MoE) để chỉ kích hoạt một phần nhỏ các tham số trong mỗi lần tính toán. Nhờ vậy, DeepSeek không chỉ tiết kiệm chi phí mà còn giảm đáng kể tiêu thụ năng lượng, một vấn đề lớn trong ngành AI hiện nay. (Nguồn: DataCamp, 2025).
Tuy nhiên, sự xuất hiện của DeepSeek đã đặt ra những câu hỏi lớn đối với các nhà đầu tư và các tập đoàn công nghệ lớn. Theo TechRadar (2025), việc một công ty khởi nghiệp có thể đạt hiệu suất cao với chi phí thấp như vậy sẽ khiến các nhà đầu tư phải cân nhắc lại chiến lược rót vốn vào các dự án AI khổng lồ. Điều này có thể dẫn đến sự “phân tán” trong dòng vốn đầu tư, làm thay đổi cách tiếp cận truyền thống trong việc phát triển AI.
Ngoài ra, mối liên hệ giữa DeepSeek và chính phủ Trung Quốc, cùng với chiến lược nguồn mở của họ, cũng khiến các tập đoàn tại Mỹ gặp áp lực phải thích ứng nhanh hơn. Hugging Face (2025) chỉ ra rằng mô hình nguồn mở của DeepSeek đã thúc đẩy sự dân chủ hóa công nghệ AI, khiến các công ty Mỹ như OpenAI phải đối mặt với bài toán về tính minh bạch và giá trị thương mại của các mô hình độc quyền.
Tóm lại, sự kiện này không chỉ là một cú sốc kỹ thuật mà còn là một thử thách chiến lược đối với ngành công nghệ toàn cầu. Các tập đoàn lớn sẽ cần tìm cách điều chỉnh chiến lược, có thể là đầu tư vào các công nghệ mới hoặc tối ưu hóa các quy trình hiện có, thay vì tiếp tục dựa vào các phương pháp tốn kém hiện tại.
Các tập đoàn công nghệ Mỹ sẽ khó “ngồi yên”
-Theo ông, các tập đoàn công nghệ hàng đầu của Mỹ sẽ phản ứng như thế nào trước sự xuất hiện của DeepSeek: hợp tác, cạnh tranh hay tìm cách “tiêu diệt”?
-Sự xuất hiện của DeepSeek-R1 chắc chắn đặt các tập đoàn công nghệ lớn của Mỹ như OpenAI, Meta, Google và Microsoft vào tình thế phải đưa ra phản ứng nhanh chóng. Có ba kịch bản chính có thể xảy ra: hợp tác, cạnh tranh trực tiếp hoặc tìm cách loại bỏ mối đe dọa từ DeepSeek.
-Khả năng hợp tác: Một số công ty lớn có thể lựa chọn hợp tác với DeepSeek để tận dụng những điểm mạnh của công ty này, đặc biệt là về chi phí và hiệu quả. Theo báo cáo của TechRadar (2025), DeepSeek đã mở ra một con đường mới trong việc áp dụng AI nguồn mở, điều này có thể tạo động lực cho các công ty khác theo đuổi hướng đi tương tự. Một sự hợp tác như vậy không chỉ giảm bớt áp lực cạnh tranh mà còn mở ra cơ hội cùng phát triển các ứng dụng AI mới.
-Cạnh tranh trực tiếp: Tuy nhiên, phản ứng phổ biến hơn có thể là tăng cường đầu tư để cạnh tranh trực tiếp. Time (2025) chỉ ra rằng Meta đã thiết lập các “phòng chiến tranh” để phân tích các kỹ thuật của DeepSeek và tìm cách cải thiện mô hình của họ. Trong khi đó OpenAI đã lên kế hoạch ra mắt o3, được kỳ vọng sẽ là một bản nâng cấp vượt trội so với o1.
Sự cạnh tranh này sẽ thúc đẩy tiến bộ công nghệ nhanh hơn, nhưng cũng làm tăng chi phí đầu tư. Cố vấn An ninh Quốc gia của chính phủ Biden, Jake Sullivan từng cảnh báo rằng tốc độ phát triển của AI là "điều quan trọng nhất đang diễn ra trên thế giới hiện nay". Và chỉ vài ngày sau khi nhậm chức, Tổng thống Trump đã công bố một dự án mới trị giá 500 tỷ USD, được OpenAI và các công ty khác hỗ trợ, nhằm xây dựng cơ sở hạ tầng thiết yếu cho việc tạo ra "trí thông minh nhân tạo tổng quát" - bước tiến nhảy vọt tiếp theo trong AI, với các hệ thống đủ tiên tiến để tạo ra những đột phá khoa học mới và lý luận theo những cách mà cho đến nay vẫn nằm trong phạm vi khoa học viễn tưởng.
-Nỗ lực “tiêu diệt”: Một số tập đoàn có thể áp dụng các chiến lược pháp lý hoặc chính trị để hạn chế sự phát triển của DeepSeek. Chẳng hạn, việc áp dụng lệnh cấm vận chip đối với Trung Quốc đã phần nào gây khó khăn cho các công ty như DeepSeek. Tuy nhiên, Hugging Face (2025) nhấn mạnh rằng ngay cả trong bối cảnh hạn chế chip cao cấp, DeepSeek vẫn phát triển mạnh mẽ bằng cách tối ưu hóa nguồn lực hiện có. Điều này cho thấy rằng các biện pháp cấm vận sẽ khó có thể triệt tiêu hoàn toàn sự phát triển của họ.
Tóm lại, các tập đoàn Mỹ sẽ không dễ dàng “bỏ qua” sự xuất hiện của DeepSeek, vì điều này trực tiếp thách thức vị thế thống trị của họ. Sự cạnh tranh sẽ thúc đẩy các công ty Mỹ đổi mới mạnh mẽ hơn, nhưng đồng thời cũng buộc họ phải điều chỉnh chiến lược để đối phó với những mô hình hiệu quả hơn như DeepSeek.
Lương Văn Phong: truyền cảm hứng cho các startup tại Việt Nam
-Khi đọc và tiếp nhận thông tin về sự xuất hiện của DeepSeek, là chuyên gia về AI, ông và giới khởi nghiệp AI Việt Nam nghĩ gì về người đàn ông 40 tuổi Lương Văn Phong - ông chủ của DeepSeek?
-Lương Văn Phong, nhà sáng lập của DeepSeek, là một tấm gương tiêu biểu cho một thế hệ doanh nhân công nghệ có tư duy đột phá và khả năng tận dụng nguồn lực hiệu quả. Anh đã chứng minh rằng sự sáng tạo và đổi mới có thể vượt qua những giới hạn về tài nguyên, đặc biệt trong một lĩnh vực vốn bị chi phối bởi các tập đoàn khổng lồ như AI.
-Ấn tượng về tư duy chiến lược: Lương Văn Phong được biết đến là một nhà đầu tư thành công trong lĩnh vực tài chính trước khi chuyển hướng sang AI. Theo Al Jazeera (2025), anh đã xây dựng DeepSeek từ nền tảng của sự tò mò và mục tiêu phát triển trí tuệ nhân tạo tổng quát (Artificial General Intelligence - AGI). Phong không chỉ là người điều hành mà còn trực tiếp tham gia vào việc xây dựng mô hình, với cách tiếp cận “học hỏi để đổi mới.”
-Ý nghĩa đối với khởi nghiệp AI tại Việt Nam: Sự thành công của DeepSeek mang lại những bài học quý giá cho giới khởi nghiệp AI Việt Nam. Nó cho thấy rằng các startup không cần phải chạy đua vũ trang về tài nguyên mà có thể tối ưu hóa từ nguồn lực sẵn có. Ví dụ, DeepSeek đã sử dụng kiến trúc Mixture-of-Experts (MoE) và áp dụng Reinforcement Learning để đạt hiệu suất cao mà không cần hệ thống siêu máy tính. Đây là một hướng đi mà các doanh nghiệp khởi nghiệp Việt Nam hoàn toàn có thể học hỏi.
-Khuyến nghị cho Việt Nam: DeepSeek đã thành công nhờ tận dụng các công cụ và nghiên cứu nguồn mở. Việt Nam có thể thúc đẩy việc xây dựng các mô hình AI nguồn mở để giảm phụ thuộc vào công nghệ độc quyền từ nước ngoài.
Mặt khác, câu chuyện của Lương Văn Phong là minh chứng cho sức mạnh của tư duy sáng tạo. Các tổ chức tại Việt Nam nên đầu tư nhiều hơn vào việc phát triển nhân tài thông qua các chương trình nghiên cứu và hợp tác quốc tế.
Tôi tin rằng thành công của Lương Văn Phong không chỉ dừng lại ở DeepSeek mà còn là động lực truyền cảm hứng cho các startup tại Việt Nam. Đây là lời nhắc nhở rằng, ngay cả trong một thị trường cạnh tranh khốc liệt, sáng tạo và tầm nhìn chiến lược có thể mang lại những đột phá.
Việt Nam nên tận dụng bài học này để tối ưu hóa chiến lược đầu tư AI
Để đầu tư cho khoa học công nghệ (KHCN), theo tinh thần của Nghị quyết 57 của Bộ Chính trị, mỗi năm dành ra 2-3% GDP, tức khoảng 9 tỷ USD. Với sự xuất hiện của DeepSeek (đầu tư rất khiêm tốn, hiệu quả cao, quan trọng lại nguồn mở), chúng ta cần tính toán, chi phí như thế nào cho hiệu quả nhất. Theo ông nên như thế nào?
-Nghị quyết 57 là một định hướng rất đúng đắn cho việc đầu tư vào khoa học và công nghệ. Tuy nhiên, trong bối cảnh toàn cầu, bài học từ DeepSeek cho thấy rằng việc tối ưu hóa nguồn lực và tập trung vào những lĩnh vực cụ thể sẽ mang lại hiệu quả cao hơn là đầu tư dàn trải.
Một là, Việt Nam nên tập trung vào phát triển các mô hình AI nguồn mở, giống như DeepSeek, để tạo ra các giải pháp chi phí thấp nhưng hiệu quả cao. Theo Medium (2025), việc phát triển các mô hình chưng cất (distilled models) từ các mô hình lớn có thể giảm thiểu chi phí mà vẫn đảm bảo tính ứng dụng thực tế.
Hai là, y tế, giáo dục và logistics là những lĩnh vực có tiềm năng lớn cho AI tại Việt Nam, đặc biệt khi các mô hình nguồn mở có thể được tùy chỉnh để phù hợp với các bài toán cụ thể.
Ba là, về chiến lược tài chính, cần phân bổ ngân sách theo tầng ưu tiên, tập trung vào các dự án nghiên cứu cơ bản có tiềm năng ứng dụng cao. Ngoài ra, Chính phủ nên thúc đẩy hợp tác với các doanh nghiệp để cùng phát triển cơ sở hạ tầng AI, tương tự cách Trung Quốc hỗ trợ các công ty như DeepSeek.
Bốn là, thiết lập các trung tâm dữ liệu có chi phí thấp để hỗ trợ các dự án AI trong nước.
Năm là, tăng cường các chương trình đào tạo chuyên sâu về AI và khoa học dữ liệu, khuyến khích sinh viên và nhà nghiên cứu tham gia vào các dự án nguồn mở.
DeepSeek đã chứng minh rằng sự đổi mới không chỉ phụ thuộc vào ngân sách lớn mà còn vào cách sử dụng nguồn lực hiệu quả. Việt Nam nên tận dụng bài học này để tối ưu hóa chiến lược đầu tư AI, tập trung vào nguồn mở và các ứng dụng thực tiễn để đạt được hiệu quả cao nhất từ ngân sách khoa học công nghệ của mình.
-Xin cảm ơn ông!
So sánh chi tiết về các mô hình AI nguồn mở và độc quyền
1. Về khả năng tiếp cận và chi phí:
Nguồn mở: Mô hình AI nguồn mở như DeepSeek-R1, với giấy phép MIT, cho phép cộng đồng tiếp cận miễn phí hoặc chi phí rất thấp. Điều này giúp các nhà phát triển, tổ chức nhỏ, hoặc các quốc gia đang phát triển có thể sử dụng và tùy chỉnh theo nhu cầu cụ thể mà không gặp trở ngại tài chính lớn.
Ví dụ: DeepSeek-R1 chỉ tốn $0.55/million tokens (DataCamp, 2025), trong khi OpenAI o1 có chi phí lên tới $60/million tokens.
Độc quyền: Các mô hình độc quyền như OpenAI o1 thường yêu cầu chi phí cao để sử dụng, đặc biệt là với các doanh nghiệp lớn hoặc yêu cầu API quy mô lớn. Chi phí cao này có thể hạn chế khả năng tiếp cận của nhiều đối tượng người dùng.
2. Về tính minh bạch:
Nguồn mở: Mô hình nguồn mở minh bạch hơn vì mã nguồn, tài liệu, và nghiên cứu được công khai. Điều này tạo điều kiện cho việc kiểm tra, phát triển thêm, và giảm rủi ro từ các thuật toán không rõ ràng. DeepSeek-R1, chẳng hạn, cho phép cộng đồng sử dụng kiến trúc và thuật toán Mixture-of-Experts (MoE), giúp cải thiện tính hiệu quả trong học máy. (Medium, 2025).
Độc quyền: Mô hình độc quyền giữ bí mật các thuật toán và dữ liệu huấn luyện, điều này có thể tạo ra rào cản trong việc kiểm chứng tính chính xác hoặc khả năng tái hiện của kết quả. Tuy nhiên, điều này cũng bảo vệ các phát minh và công nghệ độc quyền của công ty.
3. Về khả năng tùy chỉnh:
Nguồn mở: Mô hình nguồn mở có thể được tùy chỉnh dễ dàng hơn để phù hợp với các bài toán cụ thể của từng ngành. Điều này rất hữu ích cho các ứng dụng trong y tế, giáo dục, hoặc nghiên cứu. Tuy nhiên, việc tùy chỉnh yêu cầu đội ngũ kỹ thuật có chuyên môn.
Độc quyền: Các mô hình độc quyền thường ít linh hoạt hơn do được thiết kế để phục vụ các trường hợp sử dụng phổ biến nhất định. Tuy nhiên, chúng thường đi kèm với dịch vụ hỗ trợ khách hàng chuyên nghiệp.
4. Về bảo mật:
Nguồn mở: Một số chuyên gia lo ngại về bảo mật dữ liệu khi sử dụng mô hình nguồn mở, đặc biệt nếu chúng liên quan đến các công ty hoặc quốc gia có vấn đề về quyền riêng tư dữ liệu, như Trung Quốc (TechRadar, 2025).
Độc quyền: Các công ty độc quyền thường cam kết bảo mật dữ liệu khách hàng, nhưng vẫn có nguy cơ dữ liệu bị lạm dụng do các hoạt động thương mại hóa.
5. Về hiệu suất và khả năng mở rộng:
Nguồn mở: Hiệu suất của các mô hình nguồn mở có thể tương đương hoặc vượt qua các mô hình độc quyền trong một số lĩnh vực nhất định, như khả năng toán học và lý luận (DeepSeek-R1 đạt 97.3% trên MATH-500, vượt OpenAI o1 ở một số bài kiểm tra). Tuy nhiên, khả năng mở rộng có thể bị hạn chế nếu không có hạ tầng tính toán đủ mạnh.
Độc quyền: Các mô hình độc quyền thường được tối ưu hóa với các nguồn lực lớn, giúp đảm bảo khả năng mở rộng và hỗ trợ quy mô lớn hơn.
Tóm lại, cả hai loại mô hình đều có ưu và nhược điểm. Mô hình nguồn mở mang tính dân chủ hóa cao, tiết kiệm chi phí, và khuyến khích đổi mới. Trong khi đó, mô hình độc quyền cung cấp dịch vụ toàn diện, ổn định hơn, nhưng chi phí cao và ít linh hoạt. Tùy thuộc vào mục đích sử dụng và nguồn lực, các tổ chức có thể chọn loại mô hình phù hợp với nhu cầu của mình.
DeepSeek là gì?
DeepSeek là một công ty khởi nghiệp AI của Trung Quốc, được thành lập vào cuối năm 2023 bởi Liang Wenfeng (Lương Văn Phong), một nhà quản lý quỹ phòng hộ. Dù chỉ mới ra đời hơn một năm, công ty này đã cho ra mắt nhiều mô hình AI tiên tiến, trong đó nổi bật nhất là DeepSeek R1 và DeepSeek R1 Zero.
Điểm đặc biệt của DeepSeek R1 là khả năng cạnh tranh với các mô hình hàng đầu như GPT-4 của OpenAI hay Gemini của Google, nhưng chi phí phát triển chỉ dừng ở mức 5,6 triệu USD – thấp hơn rất nhiều so với các đối thủ phương Tây.
DeepSeek còn gây chú ý khi sử dụng các chip AI công suất thấp để phát triển mô hình, bất chấp việc Mỹ hạn chế nguồn cung cấp công nghệ cao cấp cho Trung Quốc.