Có thể dữ liệu của bạn đã bị ChatGPT thu thập trái phép

0:00 / 0:00
0:00
  • Nam miền Bắc
  • Nữ miền Bắc
  • Nữ miền Nam
  • Nam miền Nam
VietTimes – Nếu bạn đã từng viết một bài đăng trên blog, đánh giá sản phẩm hoặc nhận xét về một bài báo trực tuyến, thì rất có thể thông tin này đã bị ChatGPT thu thập và sử dụng.
Ảnh: Google
Ảnh: Google

ChatGPT đã gây bão trên toàn thế giới. Trong vòng hai tháng kể từ khi phát hành, chabot này đã đạt 100 triệu người dùng thường xuyên, khiến nó trở thành ứng dụng phát triển nhanh nhất từng được ra mắt.

Tuy nhiên, những rủi ro về quyền riêng tư mà ChatGPT có thể gây ra lại không được nhiều người bàn tới.

300 tỉ từ, bao nhiêu là của bạn?

Siêu AI này sử dụng mô hình ngôn ngữ lớn, đòi hỏi lượng dữ liệu khổng lồ để vận hành và cải thiện năng lực. Khả năng phát hiện khuôn mẫu, dự đoán nội dung sắp được đưa ra và tạo văn bản như người thật luôn tỷ lệ thuận với số dữ liệu dùng để huấn luyện mô hình.

OpenAI, công ty đứng sau ChatGPT, đã cung cấp cho công cụ này khoảng 300 tỉ từ được thu thập một cách có hệ thống từ internet: sách, bài báo, trang web và bài đăng – bao gồm cả thông tin cá nhân thu được mà không có sự đồng ý.

Nếu bạn đã từng viết một bài đăng trên blog, đánh giá sản phẩm hoặc nhận xét về một bài báo trực tuyến, thì rất có thể thông tin này đã bị ChatGPT thu thập và sử dụng.

Vậy tại sao đó là một vấn đề?

Việc thu thập dữ liệu được sử dụng để đào tạo ChatGPT có vấn đề vì một số lý do sau đây.

Đầu tiên, không ai trong chúng ta được hỏi liệu OpenAI có thể sử dụng dữ liệu của mình hay không. Đây rõ ràng là hành vi vi phạm quyền riêng tư, đặc biệt khi dữ liệu nhạy cảm và có thể được sử dụng để nhận dạng người dùng, thành viên gia đình hoặc vị trí của họ.

Ngay cả khi dữ liệu được công khai, OpenAI cũng xâm phạm nguyên tắc toàn vẹn văn bản, cấm để lộ thông tin của từng cá nhân ngoài bối cảnh mà nó được khởi tạo. Công ty cũng không đề xuất phương án nếu người dùng muốn xóa dữ liệu liên quan tới họ. Đây là quyền được bảo đảm trong Quy định Bảo vệ dữ liệu chung châu Âu (GDPR).

“Quyền được quên” này đặc biệt quan trọng trong trường hợp thông tin không chính xác hoặc gây hiểu lầm, điều này dường như lại đang là một vấn đề nan giải trên ChatGPT.

Dữ liệu huấn luyện cũng có thể được lấy từ tài liệu độc quyền hoặc được bảo vệ bản quyền. OpenAI không trả tiền cho thông tin thu thập trên Internet, dù công ty được định giá 29 tỉ USD và dự kiến đạt doanh thu 1 tỉ USD trong năm nay.

OpenAI cũng vừa công bố ChatGPT Plus, gói đăng ký trả phí sẽ cung cấp cho khách hàng quyền truy cập liên tục vào công cụ, thời gian phản hồi nhanh hơn và quyền truy cập ưu tiên vào các tính năng mới. Kế hoạch này sẽ đóng góp lớn vào phần doanh thu dự kiến là 1 tỉ USD nói trên. Để thành công được như ngày hôm nay ChatGPT đã thu thập và sử dụng một lượng khổng lồ dữ liệu mà không có sự cho phép của bất kỳ cá nhân hay tổ chức nào.

Chính sách bảo mật mỏng manh

Một rủi ro khác về quyền riêng tư liên quan đến dữ liệu người dùng cung cấp cho ChatGPT. Khi nhập câu hỏi vào phần mềm, người dùng có thể vô tình để lộ những thông tin nhạy cảm của mình.

Chẳng hạn, một luật sư yêu cầu ChatGPT đánh giá bản thảo thỏa thuận pháp lý, hoặc lập trình viên đề nghị công cụ kiểm tra đoạn code vừa viết. Hoạt động đó được đưa vào cơ sở dữ liệu và tiếp tục được dùng để tiếp tục huấn luyện AI, cũng như sẽ xuất hiện trong phần trả lời cho câu hỏi của người khác.

Ngoài ra, OpenAI còn thu thập nhiều loại thông tin người dùng khác. Theo chính sách quyền riêng tư của công ty, họ còn thu thập địa chỉ IP của người dùng, loại trình duyệt và cài đặt cũng như dữ liệu khi họ tương tác với ChatGPT.

Công ty này cũng thu thập thông tin về các hoạt động duyệt web của người dùng theo thời gian thực. Đáng báo động, OpenAI cho biết họ có thể chia sẻ thông tin cá nhân của người dùng với các bên thứ ba mà không cần thông báo cho khách hàng.

Một số chuyên gia tin rằng ChatGPT là điểm bùng phát của AI – hiện thực hóa sự phát triển công nghệ có thể cách mạng hóa cách chúng ta làm việc, học tập, viết và thậm chí là suy nghĩ. Bất chấp những lợi ích tiềm năng của nó, chúng ta phải nhớ rằng OpenAI là một công ty tư nhân và họ sẽ đặt mục tiêu lợi nhuận lên đầu.

Theo The Conversation