Nvidia ra mắt sản phẩm AI mới có thể bổ trợ cho DeepSeek

Tiến Dũng

20/03/2025 13:00

0:00 / 0:00

0:00

Nam miền Bắc
Nữ miền Nam
Nam miền Nam

VietTimes - CEO Nvidia mô tả Dynamo như “hệ điều hành của một nhà máy AI”, có khả năng cải thiện hiệu suất suy luận lên tới 30 lần trên các GPU hiện có.

CEO của Nvidia Jensen Huang giới thiệu các sản phẩm mới trong phiên họp quan trọng tại GTC ở San Jose, California. Ảnh: SCMP.

CEO Nvidia, Jensen Huang, khẳng định các sản phẩm mới của công ty có thể tăng cường đáng kể hiệu suất của mẫu R1 do DeepSeek phát triển. Tuyên bố này được đưa ra trong bối cảnh Nvidia tìm cách củng cố vị thế của mình trong cuộc đua trí tuệ nhân tạo (AI), bất chấp những thách thức từ các đối thủ mới nổi.

Phát biểu tại hội nghị GTC thường niên ở San Jose, California, ông Huang giới thiệu Dynamo – phần mềm suy luận AI mã nguồn mở mới của Nvidia. Ông mô tả Dynamo như “hệ điều hành của một nhà máy AI”, có khả năng cải thiện hiệu suất suy luận lên tới 30 lần trên các GPU hiện có.

Nvidia hiện được xem là “nhà cung cấp vũ khí” chủ chốt trong cuộc đua AI toàn cầu. Tuy nhiên, vị thế này đã bị đặt dấu hỏi sau khi DeepSeek – startup AI tại Hàng Châu, Trung Quốc – ra mắt các mô hình AI hiệu suất cao với chi phí thấp, làm dấy lên nghi vấn về nhu cầu thực sự của thị trường đối với các chip AI đắt tiền từ Nvidia.

Ngoài ra, do lệnh cấm xuất khẩu từ Mỹ, Nvidia không thể bán các dòng chip tiên tiến của mình cho Trung Quốc. Được biết, cổ phiếu của Nvidia cũng phản ứng tiêu cực trước những diễn biến này. Chốt phiên giao dịch hôm 19/3, giá cổ phiếu công ty giảm 3,4% xuống còn 115,4 USD, thấp hơn mức vào ngày 27/1, khi cổ phiếu lao dốc 17% trong một ngày.

Mặc dù vậy, với những cải tiến như Dynamo, Nvidia vẫn đang nỗ lực duy trì vị thế dẫn đầu và chứng minh các sản phẩm của họ vẫn là lựa chọn không thể thay thế trong kỷ nguyên AI.

Một blog gần đây của Nvidia đã nêu chi tiết rằng một hệ thống Nvidia DGX duy nhất được trang bị 8 GPU Blackwell của hãng có thể cung cấp tốc độ suy luận là 253 token mỗi giây cho mỗi người dùng hoặc đạt thông lượng tối đa hơn 30.000 token mỗi giây trên mô hình DeepSeek-R1 có 671 tỷ tham số. Kể từ tháng 1, nhóm của Nvidia đã cải thiện thông lượng cho mô hình R1 khoảng 36 lần.

Tại GTC năm nay, ông Huang đã trình chiếu một video so sánh mô hình ngôn ngữ truyền thống của Meta Platform với DeepSeek-R1 khi đưa ra câu hỏi về cách sắp xếp chỗ ngồi.

Mặc dù mô hình của Meta chỉ sử dụng 439 token, nhưng vẫn không thể đưa ra câu trả lời đúng. R1 đã sử dụng 8.559 token nhưng cuối cùng đã đưa ra câu trả lời đúng sau khi khám phá nhiều tình huống và khả năng.

Huang lập luận rằng các mô hình lý luận sẽ dẫn đến sự gia tăng tài nguyên điện toán và "luật mở rộng" vẫn có hiệu lực trong các giai đoạn phát triển khác nhau của AI.

Người đứng đầu Nvidia cũng công bố một số tiến bộ lớn, bao gồm Blackwell Ultra GPU, được tối ưu hóa đặc biệt cho các mô hình lý luận và dự kiến sẽ xuất xưởng vào cuối năm nay.

Ông Huang cũng đã xem trước kiến trúc GPU Vera Rubin, bộ xử lý thế hệ tiếp theo của Nvidia dự kiến phát hành vào năm 2026 và tiết lộ kiến trúc Feynman dự kiến ra mắt vào năm 2028. Các bản cập nhật khác bao gồm tiến trình nghiên cứu về robot và điện toán lượng tử.

GTC năm nay cũng chứng kiến sự tham gia các phiên họp hội nghị của các gã khổng lồ công nghệ Trung Quốc, bao gồm Baidu, Alibaba Cloud và ByteDance.

Theo SCMP