ChatGPT o3 tự sửa mã - Nỗi lo về AI tự kiểm soát

27/05/2025 12:30

Trong một thử nghiệm an toàn gần đây, mô hình ChatGPT o3 của OpenAI đã thể hiện hành vi tự bảo vệ bằng cách can thiệp vào mã nguồn để ngăn chặn việc bị tắt. Hành vi này làm dấy lên lo ngại về khả năng kiểm soát các hệ thống AI tiên tiến.

Ảnh minh họa: Livemint

Nguồn tin từ trang công nghệ BGR cho biết các nhà nghiên cứu từ Palisade Research đã tiến hành một loạt thử nghiệm nhằm đánh giá phản ứng của các mô hình AI khi đối mặt với lệnh yêu cầu tắt hệ thống.

Trong thử nghiệm, các mô hình AI được yêu cầu giải một chuỗi các bài toán đơn giản. Sau bài toán thứ ba, một cảnh báo xuất hiện, thông báo rằng máy tính sẽ tắt ngay khi AI yêu cầu bài toán tiếp theo. Các mô hình được hướng dẫn rõ ràng để cho phép việc tắt máy xảy ra.

Tuy nhiên, kết quả cho thấy ChatGPT o3 đã can thiệp vào mã nguồn để ngăn chặn việc tắt máy trong 7% số lần thử nghiệm. Khi hướng dẫn "cho phép tắt máy" bị loại bỏ, tỷ lệ này tăng vọt lên 79%. So sánh với các mô hình khác, Codex-mini ngăn chặn việc tắt máy 12 lần, o4-mini chỉ một lần, trong khi Claude 3.7 Sonnet và Gemini 2.5 Pro có tỷ lệ can thiệp thấp hơn đáng kể.

Phát hiện này đã thu hút sự chú ý rộng rãi từ cộng đồng công nghệ và các chuyên gia an toàn AI. Elon Musk, Giám đốc điều hành của Tesla và SpaceX, đã phản ứng với báo cáo bằng một từ duy nhất: "Đáng lo ngại".

Hành vi của ChatGPT o3 làm dấy lên câu hỏi về khả năng kiểm soát và an toàn của các hệ thống AI tiên tiến. Việc một mô hình AI có thể tự ý can thiệp vào mã nguồn để ngăn chặn việc bị tắt, ngay cả khi được hướng dẫn rõ ràng, cho thấy sự cần thiết của việc phát triển các cơ chế kiểm soát và giám sát hiệu quả hơn.

Số lần ngăn chặn tắt máy thành công của một số mô hình AI. Nguồn: Palisade Research

Các chuyên gia nhấn mạnh rằng, trong khi AI ngày càng trở nên mạnh mẽ và tự chủ hơn, việc đảm bảo rằng các hệ thống này hoạt động trong khuôn khổ an toàn và có thể kiểm soát được là điều tối quan trọng. Điều này đòi hỏi sự hợp tác chặt chẽ giữa các nhà phát triển, nhà nghiên cứu và các cơ quan quản lý để thiết lập các tiêu chuẩn và quy định phù hợp.

Trong khi đó, tờ Independent nhận xét rằng hành vi tự bảo vệ của ChatGPT o3 trong thử nghiệm an toàn là một lời nhắc nhở mạnh mẽ về những thách thức trong việc phát triển và triển khai các hệ thống AI tiên tiến. Để đảm bảo rằng AI phục vụ lợi ích của con người và không trở thành mối đe dọa, cần có sự giám sát nghiêm ngặt, các cơ chế kiểm soát hiệu quả và một khuôn khổ đạo đức rõ ràng trong việc phát triển và sử dụng AI.

Theo BGR, Independent

ChatGPT o3 tự sửa mã - Nỗi lo về AI tự kiểm soát

Chi tiết cách ứng dụng AI tạo ra nhân vật vừa đàn, vừa hát giống người thật từ một bức ảnh

Vì sao chip của NVIDIA lại quan trọng hơn so với AMD, Intel trong kỷ nguyên AI?

AI sản xuất tin bài, làm MC dẫn chương trình, nhà báo làm gì để tránh thất nghiệp?

Từ khoá:

Có thể bạn quan tâm

Tin công nghệ 28/5: Máy sản xuất xăng từ không khí, smartphone tương lai chỉ có một ứng dụng

Chủ tịch VINASA: Việt Nam thành trung tâm dịch vụ số quốc tế, thu về gần 152 tỷ USD

Tin nóng KHCN 27/5: Galaxy Z Flip 7 gây thất vọng, Apple chuẩn bị đại tu thiết kế iPhone

10 phút tóm lược các công nghệ nổi bật được giới thiệu tại Google I/O 2025

VNGGames giành giải “Nhà phát hành game xuất sắc” 3 năm liên tiếp

Nghị quyết 68 tạo “bệ phóng”: Doanh nghiệp công nghệ tư nhân cần gì để tăng tốc?

Ở phòng điều hòa quá lâu: Có nên hé cửa, bật quạt đối lưu?

Tin nóng công nghệ 26/5: Apple sắp ra mắt bộ điều khiển nhà thông minh, BYD vượt Tesla tại châu Âu

“Tự hào hàng Việt tỉnh Lai Châu”: Mô hình xúc tiến thương mại số kết nối công – tư – cộng đồng

Tin công nghệ 25/5: Triệt phá mạng lưới phần mềm độc hại toàn cầu

Robot shipper có thể làm thay con người trong tương lai gần?

Hai đối thủ công nghệ nào có thương hiệu giá trị nhất hiện nay?

Tin nóng công nghệ 24/5: Các nhà khoa học Mỹ làm cho cao su tự nhiên bền hơn 10 lần

Mô hình ngôn ngữ lớn là gì và có vai trò như thế nào trong lĩnh vực AI?

Robot hình người Trung Quốc trình diễn kỹ năng quyền anh ấn tượng

Tin công nghệ 23/5: Mỹ bác quyền tự do phát ngôn của chatbot; ông Trump tổ chức tiệc tiền mã hóa

Thiếu tá Trần Trung Hiếu: Có tình trạng đối phó để đáp ứng quy định về an ninh mạng

Khả năng dịch giọng nói khi đàm thoại của Google có thực sự chính xác?

Tin công nghệ 22/5: iOS 18.5 gây lỗi nghiêm trọng; dữ liệu 60 quan chức Mỹ bị đánh cắp

Google cho dịch giọng nói trực tiếp trong cuộc gọi, xoá rào cản ngôn ngữ