Ngày 19/10/2020, Facebook đã giới thiệu một phần mềm dịch thuật mới dựa trên công nghệ học máy. Công ty tự hào rằng các bản dịch của hệ thống mới được đánh giá có độ chính xác tới 90%.
Phần mềm dịch thuật mới của Facebook được đào tạo dựa trên một tập hợp các dữ liệu gồm 7,5 tỷ cặp câu của hơn 100 ngôn ngữ được thu thập từ các trang web.
“Điều tôi thực sự quan tâm nhất là phần mềm này đã giảm bớt được khâu dịch trung gian qua tiếng Anh. Có rất nhiều khu vực trên thế giới nói hai ngôn ngữ nhưng trong đó không có tiếng Anh”; bà Angela Fan, trợ lý nghiên cứu hệ thống dịch thuật trên - cho biết.
Ảnh: The Economic Times |
Mô hình trên được đào tạo bằng cách tập trung vào các nhóm ngôn ngữ thường được dịch sang nhau dựa trên sự tương đồng về địa lý và văn hóa. Điều này cho phép phần mềm tạo ra các bản dịch có chất lượng tốt hơn.
Ở một số cặp ngôn ngữ, hệ thống mới cho thấy đã có những cải tiến đáng kể so với chất lượng dịch hiện tại. Chẳng hạn, trước kia, để dịch từ tiếng Tây Ban Nha sang tiếng Bồ Đào Nha, hệ thống sẽ phải dịch từ tiếng Tây Ban Nha sang tiếng Anh rồi từ tiếng Anh sang tiếng Bồ Đào Nha. Nhưng thực tế thì tiếng Tây Ban Nha vốn là ngôn ngữ thứ hai được nói nhiều nhất trên toàn thế giới, chưa tính đến hai quốc gia Tây Ban Nha và Bồ Đào Nha có sự gần gũi về địa lý cũng như văn hóa.
Bản dịch giữa tiếng Anh và tiếng Belarus cũng được cải thiện đáng kể vì AI đã được đào tào để cải thiện chất lượng dịch từ việc dịch tiếng Nga, vốn có nhiều điểm tương đồng với tiếng Belarus.
Mặc dù hệ thống dịch thuật này vẫn chưa được áp dụng trên nền tảng mạng xã hội Facebook nhưng hãng có kế hoạch sớm đưa nó vào hoạt động nhằm xử lý tới 20 tỷ bản dịch mỗi ngày khi người dùng nhấp vào mục “dịch”, được viết bởi hơn 160 ngôn ngữ.
Bà Fan cho biết dự án này trong tương lai sẽ được mở rộng tới nhiều ngôn ngữ khác, “đặc biệt là các ngôn ngữ mà chúng tôi không có nhiều dữ liệu, bao gồm các ngôn ngữ Đông Nam Á và châu Phi”.
Sheila Castilho từ trường đại học danh tiếng Trinity College Dublin của Ireland đã khen ngợi hệ thống dịch thuật mới bằng AI của Facebook, rằng hệ thống đã cố gắng “thoát khỏi các mô hình lấy tiếng Anh làm trung tâm và xây dựng các mô hình đa ngôn ngữ phong phú hơn”.
Tuy nhiên, bà Castilho cũng bày tỏ sự băn khoăn bởi hệ thống chỉ được xem xét dựa trên các ví dụ giới hạn. Do đó, rất khó để đánh giá về cách thức hoạt động của phần mềm có chính xác hay không.
Bà cũng lo lắng rằng quá trình đánh giá được thực hiện bởi các tình nguyện viên dịch song ngữ chứ không phải các dịch giả chuyên nghiệp. “Những người thiếu chuyên môn về kiến thức dịch thuật có thể không nhận thấy những khác biệt nhỏ giữa các bản dịch” - bà nói.
Theo News Scientist