|
Google AI tạo ra 'ngôn ngữ' đa năng riêng |
Google đã từng dạy cho hệ thống trí tuệ nhân tạo của họ cách chơi cờ và thậm chí là AI còn biết tạo mã bảo mật riêng. Đến nay, công cụ dịch thuật của Google đã chính thức áp dụng chức năng "máy học" (machine learning) để tạo ra ngôn ngữ riêng của nó.
Hồi tháng 9 vừa qua, Google đã "bật" hệ thống Google Neural Machine Translation (GNMT) để tự động cải thiện khả năng dịch thuật. Hệ thống machine learning này phân tích và xử lý ngôn ngữ bằng cách xem qua trọn một câu hoàn chỉnh, thay vì chỉ xét theo từng từ và cụm từ như trước đây để dịch.
Sau vài tháng thử nghiệm, các nhà nghiên cứu trong dự án AI này nhận thấy hệ thống thậm chí có thể dịch cả những ngôn ngữ mà trước nay chưa từng được đưa vào hệ thống. Ví dụ như tiếng Nhật và Hàn chưa được đưa vào Google Translate nhưng hệ thống vẫn dịch được, ít ra là theo thông tin của Mike Schuster đăng trên blog về Google Brain.
Các nhà nghiên cứu tại Google cho rằng hệ thống có thể dịch một cách "tương đối" những ngôn ngữ mà nó chưa từng được dạy, dựa trên sự tương đồng của những bài học khác. Như AI đã được học dịch từ tiếng Anh sang Tây Ban Nha và Bồ Đào Nha sang Anh. Dựa trên hai cách dịch này, AI của Google có thể dịch hai chiều giữa Bồ Đào Nha-Tây Ban Nha cho dù Google chưa có đưa vào.
Và để cho lối dịch chính xác hơn, các nhà khoa học sau đó sẽ thêm vào dữ liệu cho hệ thống về ngôn ngữ.
Tuy vậy, điểm đáng chú ý nhất trong nghiên cứu này của Google không phải là việc AI có thể học và dịch những ngôn ngữ mà nó chưa có ví dụ mẫu, nhưng là nó sử dụng kỹ năng "mềm" này để tạo ra ngôn ngữ của riêng nó. Vì AI khi học sẽ tạo ra mô hình đa ngôn ngữ giữa các cặp ngôn ngữ với nhau (interlingua). Mô hình interlingua là một loại ngôn ngữ trí tuệ nhân tạo, sử dụng cho một mục đích cụ thể nào đó. Trong trường hợp này, interlingua được sử dụng trong AI để giải thích cách mà ngôn ngữ đầu vào chưa hề biết đến mà AI Google vẫn có thể dịch được.
Nghiên cứu này của nhóm Google Brain tiếp ngay sau nghiên cứu về cách họ dạy AI tạo một loại mã hoá riêng. Trong nghiên cứu, Google tạo ra ba mạng thần kinh tên là: Alice, Bob và Eve. Mỗi mạng được gán cho một công việc riêng. Alice tạo mã hoá, Bob nhận mã hoá và giải mã tin nhắn, và cuối cùng Eve cố gắng giải mã tin nhắn mà không có khoá mã hoá. Sau khoá huấn luyện, AI có thể chuyển tin nhắn thuần văn bản thành tin nhắn mã hoá, sử dụng loại mã hoá riêng mà nó tạo ra, và sau đó nó cũng giải mã được tin nhắn này.
Theo PC World VN