Dữ liệu khuôn mặt thành hàng hóa trên Internet

Dữ liệu khuôn mặt được bán "rẻ như bèo" trên Internet và có thể dùng để theo dõi ngược lại người dùng khiến giới công nghệ bất an.

Tháng 10/2019, giáo sư Guo Bing của Đại học Khoa học Công nghệ Chiết Giang (Trung Quốc) đã khởi kiện công viên Safari Hàng Châu vì vi phạm thỏa thuận sử dụng, sau khi họ thay thế hệ thống kiểm soát vào cổng dựa trên dấu vân tay bằng nhận dạng khuôn mặt.

Vụ kiện đầu tiên liên quan đến nhận diện khuôn mặt khiến giáo sư Fu Hualing của Đại học Hong Kong đặt ra nghi vấn: "Tại sao một vườn thú thu thập dữ liệu khuôn mặt? Bởi vì dữ liệu có giá trị thương mại".

Dữ liệu khuôn mặt giá "rẻ như bèo"


"Bạn chỉ cần gửi hình ảnh mình cần, vài giây sau bạn sẽ có tất cả thông tin về người đó. Bạn sẽ có quyền truy cập vào toàn bộ hệ thống dữ liệu khuôn mặt của chúng tôi. Bạn cũng có thể lập danh sách theo dõi riêng. Giá cả phải chăng hơn bạn nghĩ..." - đó là những dòng giới thiệu về công cụ nhận diện khuôn mặt trên một website của Anh. Khách hàng mục tiêu của trang web này là các cửa hàng thời trang, nhà bán lẻ, nhà hàng, khách sạn...

Hình ảnh chứa 2.000 danh tính có trong cơ sở dữ liệu MS Celeb của Microsoft.
Hình ảnh chứa 2.000 danh tính có trong cơ sở dữ liệu MS Celeb của Microsoft.

Nếu muốn tìm dữ liệu khuôn mặt miễn phí, bạn có thể dùng PimEyes, một ứng dụng của Mỹ. Bạn tải lên công cụ này ảnh của một người bất kỳ. Hệ thống sẽ trả về ảnh khuôn mặt của người đó trên các website phổ biến, như Tumblr, YouTube, WordPress, các trang tin tức...

Để tạo ra doanh thu, PimEyes cung cấp gói trả phí, cho người dùng biết được kết quả trên được lưu trên website nào, gửi thông báo nếu hình mới của người đó được tải lên. Nhà phát triển cũng cho phép lập trình viên tìm kiếm hình ảnh trên cơ sở dữ liệu của họ. Nói cách khách, PimEyes đang công khai bán dữ liệu người dùng họ thu thập được cho khách hàng cá nhân.

PimEyes hoạt động tương tự Clearview AI - ứng dụng nhận diện khuôn mặt của kỹ sư gốc Việt từng gây tranh cãi ở Thung lũng Silicon. Khác biệt là Clearview AI chỉ cung cấp cho cơ quan chức năng để truy dấu tội phạm, còn PimEyes được bán không khai cho bất kỳ ai có nhu cầu theo dõi người nào họ muốn.

Trong khi phương Tây đang loay hoay nên nhìn nhận công nghệ này theo hướng nào, thì ở Trung Quốc, dữ liệu khuôn mặt đã trở thành một phần thiết yếu trong cuộc sống. Việc các gói dữ liệu khuôn mặt bị rò rỉ và rao bán rẻ mạt trên các trang thương mại điện tử không còn là tin chấn động.

Cuối 2019, 5.000 khuôn mặt biểu cảm khác nhau được rao bán công khai trên trang thương mại điện tử Zhuanzhuan với giá 10 nhân dân tệ (hơn 32 nghìn đồng). Giá trung bình cho mỗi bức hình chỉ khoảng 0,5 nhân dân tệ (1.600 đồng). Tuy nhiên, nếu người bán cung cấp thêm số chứng minh nhân dân, thông tin tài khoản ngân hàng và số điện thoại di động của người trong hình, giá sẽ tăng lên 4 nhân dân tệ (13.000 đồng). Phần lớn dữ liệu này được thu thập qua mạng xã hội Weibo hoặc công cụ tìm kiếm hình ảnh Baidu.

Đến đầu tháng 4/2020, Economic View phát hiện ảnh của hơn 20.000 người đeo khẩu trang được rao bán công khai. Giá mỗi bức là 0,05 nhân dân tệ. Điều đáng nói là gói dữ liệu này được rao bán ngay sau khi Trung Quốc thay đổi công nghệ nhận diện khuôn mặt do tác động của Covid-19. Điều này cho thấy dữ liệu khuôn mặt đang là món hàng được săn đón và "sản xuất" không khó.

Người dùng đang tự bán rẻ mình


Ban đầu, dữ liệu người dùng được thu thập công khai bởi các công ty lớn, phục vụ mục đích nghiên cứu. Về sau, với sự phát triển của công nghệ, việc thu thập dữ liệu trở lên dễ dàng hơn. Phân nửa dữ liệu khuôn mặt bị rao bán rẻ mạt được thu thập từ Weibo, Facebook, Instagram... Tất cả đều miễn phí. Đó là một trong những lý do khiến các gói dữ liệu này rẻ như vậy.

Tiếp đến, dữ liệu khuôn mặt cũng được thu thập bởi những phần mềm, ứng dụng miễn phí, như phần mềm chỉnh sửa ảnh, đoán tuổi, bạn giống ngôi sao điện ảnh nào... Ví dụ, trong ứng dụng "Xếp hạng sắc đẹp" ở Trung Quốc, nhà phát triển đã thêm vào điều khoản: "Nhà phát triển có quyền sử dụng bất kỳ nội dung nào được người dùng đăng tải (bao gồm ảnh tự chụp) miễn phí, lâu dài và không bị thu hồi trên phạm vi toàn thế giới".

Người dùng rất ít đọc những điều khoản này và nếu kiên nhẫn ngồi dò hàng dài các điều khoản, cuối cùng họ vẫn chấp nhận đánh đổi chút quyền riêng tư để được dùng miễn phí.

Sức mạnh của công nghệ nhận diện là không thể chối bỏ nhưng nó cũng khiến người dùng phải lo sợ khi bị lạm dụng. Ảnh: Techcrush.

Apple Daily dẫn lời Phương Bảo Kiều, Hội trưởng danh dự của Hội Khoa học kỹ thuật Thương mại Thông tin Hong Kong: "Trên mạng có rất nhiều loại ứng dụng theo dõi lộ trình, ngoại hình hoặc dấu vân tay. Từ đó, các đặc điểm sinh học cá nhân có thể bị đánh cắp. Vì vậy, người dùng cố gắng tránh tải các ứng dụng như vậy". 

Nhưng không phải lúc nào người dùng cũng được quyền chủ động về việc cung cấp dữ liệu khuôn mặt. Một số hệ thống chấm công, máy quay an ninh tại các công ty, nhà hàng, trung tâm thương mại... cũng âm thầm lưu trữ dữ liệu của khách và sử dụng vào những mục đích riêng.

Ngay cả những công ty lớn, như Facebook, Google, Amazon, IBM, Microsoft..., cũng đều phát triển kho dữ liệu khuôn mặt. Điều này có nghĩa là người dùng càng tải lên nhiều hình ảnh cá nhân, kho dữ liệu của nền tảng này càng lớn. Hệ thống AI sẽ càng có nhiều hình ảnh để học và cải thiện độ chính xác. Khi kho dữ liệu đủ lớn và cho kết quả tin cậy, các công ty công nghệ bắt đầu đem bán chúng cho các cơ quan chính phủ. Ban đầu, công nghệ tỏ ra hữu dụng khi chúng được dùng để tìm kiếm tội phạm, nhưng mọi thứ đang đi quá giới hạn khi công nghệ nhận diện khuôn mặt được dùng nhiều hơn vào việc kiểm soát công dân.

Nhiều nơi đã cấm công nghệ diện khuôn mặt

"Không giống các thông tin sinh học khác như dấu vân tay hay DNA, dữ liệu khuôn mặt có thể bị thu thập mà người dùng không biết hoặc không chấp thuận", SCMP dẫn lời giáo sư Lao Donyan của Đại học Thanh Hoa rằng, thông tin nhận dạng khuôn mặt có thể được bán cho các công ty quảng cáo. Nếu dữ liệu đó bị rò rỉ, thiệt lại thông thể khắc phục. Điều này đặc biệt nguy hiểm nếu các thông tin cá nhân lọt vào tay tội phạm công nghệ cao.

Bất chấp những lo ngại của người dân, Trung Quốc vẫn tiếp tục khuyến khích phát triển công nghệ nhận diện khuôn mặt với tham vọng dẫn đầu thế giới. Trong khi đó, ở Mỹ, các công ty công nghệ có cái nhìn nghiêm túc hơn về công nghệ nghệ này. IBM, Amazon và Microsoft đều tuyên bố ngừng bán công nghệ nhận diện khuôn mặt cho cảnh sát.

Lý do họ đưa ra là chính phủ liên bang chưa có luật lệ nào điều chỉnh việc sử dụng công nghệ này. IBM thậm chí tuyên bố rút khỏi thị trường nhận diện khuôn mặt do lo ngại sự thiếu kiểm soát. Ngay sau đó Amazon cũng đưa ra thông báo dừng cấp phép sử dụng cho cảnh sát Mỹ. Tuy nhiên, họ vẫn cho phép các tổ chức như Trung tâm tìm kiếm về trẻ mất tích và lạm dụng sử dụng bản thương mại. Tập đoàn Microsoft cũng yêu cầu chính phủ Mỹ ban hành luật quốc gia liên quan tới công nghệ nhận diện khuôn mặt.

Một số thành phố ở Mỹ như San Francisco, Somerville, thậm chí cấm cảnh sát sử dụng công nghệ nhận diện khuôn mặt. Liên minh Châu Âu đang cân nhắc ban hành lệnh cấm tạm thời trong vòng 5 năm đối với việc sử dụng công nghệ nhận diện khuôn mặt ở nơi công cộng. 

Trong khi công nghệ nhận diện đang trở thành vấn đề gây lo ngại và hệ thống pháp luật chưa kịp hoàn thiện để kiểm soát nó khỏi bị lạm dụng, cách duy nhất để người dùng tự bảo vệ mình là hạn chế sử dụng những ứng dụng yêu cầu thu thập dữ liệu hình ảnh và không đăng quá nhiều ảnh đời tư lên các nền tảng công cộng. Trong trường hợp bắt buộc phải đưa hình ảnh lên Internet, người dùng nên chỉnh sửa hình ảnh. Chúng sẽ thay đổi một số điểm ảnh trên khuôn mặt đảm bảo mắt thường khó phát hiện ra khác biệt. Nhưng những thay đổi nhỏ này lại khiến máy móc không nhận diện chính xác được khuôn mặt, vì dù sao chúng cũng hoạt động theo các thuật toán được lập trình sẵn và có thể bị đánh lừa bằng một thuật toán khác.

Theo VnExpress