OpenAI tố DeepSeek sử dụng trái phép mô hình của mình để đào tạo AI

OpenAI cho biết họ đã tìm thấy bằng chứng cho thấy công ty DeepSeek sử dụng các mô hình độc quyền của OpenAI để đào tạo và tạo ra mô hình AI cạnh tranh.

OpenAI tố DeepSeek sử dụng trái phép mô hình của mình để đào tạo AI

"Có bằng chứng về việc sử dụng mô hình của OpenAI"

Nhà sản xuất ChatGPT có trụ sở tại San Francisco nói với tờ Financial Times rằng họ đã thấy một số bằng chứng về "sự chưng cất dữ liệu", mà họ nghi ngờ là từ DeepSeek.

Kỹ thuật này được các nhà phát triển sử dụng để đạt được hiệu suất tốt hơn trên các mô hình nhỏ hơn bằng cách sử dụng đầu ra từ các mô hình lớn hơn, có khả năng hơn, cho phép họ đạt được kết quả tương tự trên các tác vụ cụ thể với chi phí thấp hơn nhiều.

Chưng cất dữ liệu là một hoạt động phổ biến trong ngành nhưng điều đáng lo ngại là DeepSeek có thể thực hiện hoạt động này để xây dựng mô hình của riêng mình, điều này vi phạm các điều khoản dịch vụ của OpenAI.

Một người thân cận với OpenAI cho biết: "Vấn đề là khi bạn lấy nó ra khỏi nền tảng và thực hiện điều đó để tạo ra mô hình riêng cho mục đích của bạn".

OpenAI từ chối bình luận thêm hoặc cung cấp thông tin chi tiết về bằng chứng của mình.

Điều khoản dịch vụ của OpenAI nêu rõ người dùng không được "sao chép" bất kỳ dịch vụ nào của OpenAI hoặc "sử dụng đầu ra để phát triển các mô hình cạnh tranh với OpenAI".

Việc DeepSeek phát hành mô hình lý luận R1 đã gây ngạc nhiên cho thị trường, cũng như các nhà đầu tư và công ty công nghệ tại Thung lũng Silicon.

Các mô hình được xây dựng của DeepSeek đã đạt được thứ hạng cao và kết quả tương đương với các mô hình hàng đầu của Hoa Kỳ như ChatGPT-4 hay Gemini.

Sau khi DeepSeek xuất hiện, cổ phiếu của Nvidia đã giảm 17% vào thứ hai, làm bốc hơi 589 tỷ USD khỏi giá trị thị trường của công ty, vì các nhà đầu tư lo ngại rằng các khoản đầu tư lớn vào phần cứng AI đắt tiền của NVIDIA có thể không cần thiết nữa.

Ý kiến của chuyên gia trong ngành

Trước đó, chuyên gia AI và tiền điện tử của Tổng thống Donald Trump, David Sacks, đã nói rằng "có khả năng" đã xảy ra hành vi trộm cắp sở hữu trí tuệ.

Sacks trả lời Fox News hôm thứ ba rằng: "Có một kỹ thuật trong AI gọi là chưng cất... khi một mô hình học hỏi từ một mô hình khác và lấy kiến ​​thức từ mô hình mẹ".

Sacks nói thêm rằng: "Có bằng chứng đáng kể cho thấy DeepSeek đã chắt lọc kiến ​​thức từ các mô hình OpenAI và tôi không nghĩ OpenAI hài lòng về điều này", mặc dù ông không đưa ra bằng chứng.

DeepSeek cho biết họ chỉ sử dụng 2.048 card đồ họa Nvidia H800 và chi 5,6 triệu USD để đào tạo mô hình V3 của mình với 671 tỷ tham số, chỉ bằng một phần nhỏ so với chi phí mà OpenAI và Google đã chi để đào tạo các mô hình có quy mô tương đương.

Một số chuyên gia cho biết mô hình đã tạo ra các phản hồi cho thấy nó đã được đào tạo trên các đầu ra từ GPT-4 của OpenAI, điều này sẽ vi phạm các điều khoản dịch vụ của công ty.

Những người trong ngành cho biết các phòng thí nghiệm AI ở Trung Quốc và Hoa Kỳ thường sử dụng kết quả từ các công ty như OpenAI.

Ritwik Gupta, ứng viên tiến sĩ chuyên ngành AI tại Đại học California, Berkeley, cho biết: "Các công ty khởi nghiệp và học giả thường sử dụng kết quả từ các chương trình LLM thương mại dành cho con người như ChatGPT để đào tạo một mô hình khác".

“Điều đó có nghĩa là bạn nhận được bước phản hồi của con người này miễn phí. Tôi không ngạc nhiên khi DeepSeek được cho là sẽ làm như vậy. Nếu họ làm vậy, việc dừng chính xác hoạt động này có thể rất khó khăn”, ông nói thêm.

OpenAI và đối tác Microsoft đã điều tra các tài khoản được cho là của DeepSeek vào năm ngoái, những tài khoản này đã sử dụng giao diện lập trình ứng dụng (API) của OpenAI và chặn quyền truy cập của họ vì nghi ngờ có hành vi chưng cất dữ liệu vi phạm các điều khoản dịch vụ, một người khác có hiểu biết trực tiếp cho biết.

Những cuộc điều tra này lần đầu tiên được Bloomberg đưa tin. Microsoft từ chối bình luận và OpenAI không trả lời yêu cầu bình luận về chi tiết này.

DeepSeek cũng không trả lời yêu cầu bình luận của Financial Times.

Theo Financial Times, Bloomberg