Chắc hẳn ai trong chúng ta khi truy cập vào một website bất kỳ cũng đã từng gặp phải trường hợp một box hiện ra và bạn phải tích vào ô "Tôi không phải robot" (I'm not a robot). Tiếp theo, bạn có thể phải vượt qua một bài test trực quan tìm hình ảnh. Vậy tại sao chúng ta lại phải thực hiện các bước đó?
Chặn bot
Một trong những hệ quả của việc ứng dụng máy tính vào vận hành xã hội loài người là nhiều hệ thống được tự động hóa bằng các chương trình phần mềm. Những chương trình tự động này được gọi là "bot", viết tắt của từ "robot".
Bot có thể gây ra nhiều rủi ro trên mạng internet. Vì vậy, vào thập niên 1990, các nhà nghiên cứu đã phát minh ra một kỹ thuật gọi là CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) nhằm loại bỏ những con bot tìm cách tự động nhập thông tin vào các website.
Có nhiều trường hợp những người chủ website muốn đảm bảo rằng những người truy cập và nhập thông tin trên website đều là người thật. Ví dụ, khi bạn tạo hoặc đăng nhập vào tài khoản (để ngăn lừa đảo hoặc hack), khi đăng bình luận (để ngăn spam), và khi mua hàng hay các loại vé (để ngăn đầu cơ).
Và đó là lý do tại sao bạn phải chứng minh mình không phải là một con robot.
Tại sao phải làm bài test tìm hình ảnh?
CAPTCHA ban đầu là các hình ảnh đi kèm ký tự, số hoặc chữ được viết bằng các loại font khó nhận biết, thường bị che khuất bởi những đường kẻ ngang hay hiệu ứng nhiễu hạt để vô hiệu hóa các thuật toán thị giác máy tính. Từ năm 2007, một dự án gọi là reCAPTCHA được khởi động nhằm tận dụng bài test CAPTCHA cho những mục đích có ý nghĩa khác, ví dụ như số hóa sách và huấn luyện các thuật toán học máy - reCAPTCHA cũng yêu cầu bạn phải đánh dấu vào ô “I’m not a robot”.
Năm 2009, Google mua lại reCAPTCHA và bắt đầu sử dụng nền tảng này để giải mã các địa chỉ trong Google Street View, bằng cách mượn vài giây công sức của những người truy cập để thực hiện bài test này (có người đã tìm cách kiện Google vì hành vi ăn cướp trắng trợn sức lao động vào năm 2015, nhưng vụ kiện sau đó đã bị hủy bỏ).
Google mua lại reCAPTCHA vào năm 2019 (Ảnh: How To Geek) |
Ngày nay, khi bạn thực hiện một bài test reCAPTCHA, bạn đang giúp Google huấn luyện các mô hình học máy AI bằng cách chỉ ra các vật thể trong những bức ảnh mà thông thường máy tính có thể gặp vấn đề nhận biết. Thật trớ trêu là chính việc sàng lọc các bot của người dùng lại vô tình giúp chúng trở nên ưu việt hơn trong những tác vụ nhận diện hình ảnh, vốn cực kỳ cần thiết để đánh bại CAPTCHA trong tương lai.
Theo How To Geek