Ứng dụng Gboard đã hỗ trợ 500 ngôn ngữ khác nhau

Chỉ hai năm sau khi chính thức phát hành, ứng dụng bàn phím ảo Gboard của Google đã hỗ trợ 500 ngôn ngữ khác nhau trên nền tảng Android.
Ảnh: CULT OF MAC
Ảnh: CULT OF MAC

Theo trang tin Engadget, với hỗ trợ ngôn ngữ phong phú này, Gboard hiện đã giúp khoảng 90% dân số thế giới có thể liên lạc với người khác trên điện thoại bằng ngôn ngữ thứ nhất của họ.

Tổng thể, Gboard hỗ trợ hơn 40 hệ chữ viết, từ những hệ chữ viết được sử dụng trong nhiều ngôn ngữ như Latinh, Devanagari, Kirin, cho tới những hệ chữ cái kiểu như Ol Chiki vốn chỉ sử dụng trong duy nhất một ngôn ngữ là tiếng Santali.

Để giúp người dùng trao đổi tự nhiên hơn, cách bài trí của bàn phím ảo cũng được tùy chỉnh linh hoạt theo từng biến thể ngôn ngữ. Các tính năng như tự sửa (autocorrect) và dự đoán văn bản theo ngữ cảnh cũng được tùy biến theo đó.

Google bắt đầu tung ra ứng dụng bàn phím ảo Gboard vào tháng 12-2016, hỗ trợ 100 ngôn ngữ ban đầu. Tuy nhiên trong vài tháng qua ứng dụng này đã được bổ sung thêm cả trăm ngôn ngữ khác.

Đạt mốc hỗ trợ 500 ngôn ngữ khác nhau với Gboard trong thời gian ngắn như vậy là một cột mốc đáng chú ý của Google. Bởi để bổ sung thêm một ngôn ngữ, Google sẽ phải thu thập đủ số văn bản chữ viết của ngôn ngữ đó để "đào tạo" cho hệ thống AI của họ.

Yêu cầu này khá đơn giản với các ngôn ngữ phổ biến như tiếng Anh, tiếng Pháp, nhưng sẽ rất khó với các ngôn ngữ kém phổ biến hơn, đặc biệt những ngôn ngữ vốn chỉ tồn tại ở dạng nói nhiều hơn dạng viết.

Theo đó để có đủ dữ liệu khi muốn bổ sung thêm một ngôn ngữ hỗ trợ, Google thường chia sẻ các thông tin văn bản với những người nói ngôn ngữ gốc để tạo cơ sở dữ liệu dạng text của ngôn ngữ.

Sau khi đã phác ra được thiết kế của bàn phím và đào tạo xong ngôn ngữ đó cho hệ thống AI, Google sẽ yêu cầu những người nói ngôn ngữ bản địa kiểm tra tính đa dạng của ngôn ngữ này và phản hồi cho họ những điểm chưa chuẩn.

Theo Tuổi Trẻ

https://congnghe.tuoitre.vn/ung-dung-gboard-da-ho-tro-500-ngon-ngu-khac-nhau-20181220104836688.htm