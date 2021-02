PV: Không phải người có học vấn chuyên môn về ngôn ngữ học hay ngữ văn, vì sao bạn lại có sự yêu thích đặc biệt với tiếng Việt và lập ra trang Tiếng Việt giàu đẹp (TVGĐ) trên Facebook?

anh Lê Trọng Nghĩa: Trang TVGĐ được tôi lập ra từ năm 2012 khi đang học lớp 11. Do có niềm yêu thích tiếng Việt nên việc này bước đầu cũng chỉ là chia sẻ cá nhân chứ chưa làm được gì nhiều.

Sau đó, tôi theo học ngành công nghệ thông tin (CNTT) nên đã bỏ mặc TVGĐ một thời gian. Thỉnh thoảng tôi cũng viết một số bài đăng lên. Mặc dù chỉ có một số bài ít ỏi nhưng đã thu hút sự quan tâm của rất nhiều người trong cộng đồng mạng. Thế rồi lượng người truy cập, tham gia TVGĐ cũng tăng dần theo thời gian.

Tới năm 2019, khi thực sự trưởng thành sau khi đã hoàn thành chương trình đại học và ở lại làm việc ở Nhật Bản, tôi cảm thấy phải có trách nhiệm hơn với TVGĐ, với tham vọng có thật nhiều người tham gia hưởng ứng.

Thuở nhỏ, tôi rất say mê đọc tạp chí Kiến thức Ngày nay với chuyên mục của học giả An Chi với rất nhiều kiến thức hay về ngôn ngữ tiếng Việt. Từ đó, tôi có một mong muốn được làm theo giả An Chi để chia sẻ những kiến thức về tiếng Việt. Khi đó chưa có một trang nào trên Internet giải thích chia sẻ về tiếng Việt. Trong khi đó, với nhu cầu rất cao của việc học ngoại ngữ nên trên Internet có rất nhiều trang về tiếng Anh, tiếng Pháp, tiếng Nhật… với nhiều phân tích rất hay.

Chính thực tế đó đã thôi thúc tôi phải xây dựng trang TVGĐ để mọi người cùng thấy tiếng Việt của chúng ta cũng rất hay, rất đáng nghiên cứu. Mặc dù bỏ bê suốt 7 năm nhưng lượng truy cập và tham gia TVGĐ cứ thế tăng lên. Thực tế đó khiến tôi được động viên và tin tưởng cho việc quảng bá tiếng Việt tới cộng đồng.

Ban đầu cũng chỉ là mò mẫm rồi chia sẻ những bài của học giả An Chi. Nhưng sau đó, tôi đã tra cứu tận gốc các tài liệu để đưa lên TVGĐ những kiến thức phong phú hơn. Cá nhân tôi cũng đã viết được những bài chuyên nghiệp hơn, có sự thu hút với cộng đồng. Cho tới nay, TVGĐ đã có được khoảng 35.000 lượt like (thích) và hơn 3.000 thành viên.

Trang Tiếng Việt giàu đẹp trên Facebook hiện đã có 3.100 thành viên

PV: Với tư cách là một người làm CNTT, bạn nghĩ CNTT có thể làm gì cho ngôn ngữ học?

anh Lê Trọng Nghĩa: Theo tôi, CNTT có một vai trò cực kỳ quan trọng trong nhiều lĩnh vực chứ không riêng gì ngôn ngữ. Tất nhiên, với ngôn ngữ học thì CNTT sẽ có nhiều ứng dụng. Nhưng trước mắt theo tôi là lưu trữ tài liệu vì ngôn ngữ học là ngành có nhu cầu tra cứu rất lớn.

Ở các nước trên thế giới, hầu như mỗi xã, phường, thị trấn đều có các thư viện. Và các thư viện đều có hệ thống tra cứu online. Qua tra cứu online, mọi người có thể tìm đến thư viện gần nhất để tìm cuốn sách mà mình cần. Bản thân tôi khi nghiên cứu về tiếng Việt đã nhận thấy có nhiều tài liệu rất hay nhưng hiện chưa được số hoá. Thậm chí, muốn tìm tài liệu đó ở đâu cũng là một việc không dễ. Đó là điều rất đáng tiếc.

Thứ hai là về các hội thảo chuyên đề thì ở các nước phát triển họ làm trực tuyến rất nhiều. Tuy nhiên ở Việt Nam thì hội thảo trực tuyến với ngôn ngữ học còn chưa nhiều. Và việc liên lạc với các chuyên gia là không dễ thực hiện. Cá nhân tôi chỉ thường nghe chương trình “Giữ gìn sự trọng sáng của tiếng Việt” trên sóng của Đài Tiếng nói Việt Nam.

Ngoài ra, chắc chắn còn rất nhiều ứng dụng CNTT cần cho ngôn ngữ học mà chúng ta phải tiếp tục đầu tư, nghiên cứu.

PV: Bạn nghĩ gì về công nghệ dịch máy, nhận dạng tiếng nói và liệu máy tính có thể thay thế được con người?

anh Lê Trọng Nghĩa: Cá nhân tôi cũng là một kỹ sư về trí tuệ nhân tạo (AI). Vì thế, tôi cũng đã được trang bị các kiến thức về ngôn ngữ học máy tính. Và chắc chắn, trong tương lai thì máy tính có thể thay thế phần nào cho con người trong hoạt động dịch thuật. Máy tính chỉ cần tích luỹ thật nhiều dữ liệu và có giải thuật phù hợp là có thể làm rất tốt về dịch thuật.

So với cách đây 10 năm thì máy dịch của Google và các công cụ dịch thuật khác đã tiến triển rất nhiều. Tuy rằng vẫn còn những sai sót nhưng rõ ràng tiềm năng của công nghệ dịch thuật là rất lớn. Có nhiều dữ liệu, máy tính sẽ tự học và làm việc ngày càng tốt hơn.

Nhận dạng tiếng nói cũng là một trong các lĩnh vực của AI. Việc này khó hơn là dịch thuật văn bản vì trước hết phải biến tiếng nói thành văn bản. Sau đó mới đến bước dịch nghĩa. Tuy nhiên, về tổng thể thì vấn đề cũng chỉ là phải có đủ dữ liệu. Nếu như chúng ta có đầy đủ dữ liệu và càng nhiều dữ liệu càng tốt thì mức độ chính xác sẽ càng cao. Tất nhiên, việc thu thập dữ liệu tiếng nói là khó khăn hơn rất nhiều và như Google thì chỉ có thể thu thập dữ liệu tiếng nói qua YouTube nên số lượng dữ liệu bị hạn chế hơn. Nhưng trong tương lai, các dữ liệu tiếng nói được đưa lên Internet sẽ càng nhiều và độ chính xác nhận dạng tiếng nói cũng vì thế mà tăng lên.

Tôi nghĩ, máy tính và AI không thể hoàn toàn thay thế con người. Cũng giống như các dây chuyền sản xuất công nghiệp, mặc dù máy móc đã hiện diện rất lớn nhưng vẫn phải có con người để tham gia điều khiển, kiểm tra. Dù máy móc có thông minh đến đâu thì vẫn phải có sự kiểm tra để đảm bảo an toàn, chính xác. Và ngay cả giữa con người với nhau thì vẫn phải có sự kiểm tra, kiểm soát.

Theo tôi, một lỗi dịch thuật có thể đưa đến những hậu quả rất khủng khiếp. Đương nhiên, máy móc làm việc rất máy móc chứ không linh hoạt như con người nên trong một dây chuyền công nghiệp hay trong công nghệ dịch thuật vẫn phải có sự tham gia của con người để giảm thiểu tối đa các rủi ro có thể gây ra. Ít nhất, con người phải có vai trò kiểm tra lại các quá trình tự động do máy móc đảm nhiệm.

PV: Bạn nghĩ sao về sự giao thoa văn hoá giữa Việt Nam với nước ngoài và chúng ta phải làm gì để giữ gìn sự trong sáng của tiếng Việt?

anh Lê Trọng Nghĩa: Đây là vấn đề có khá nhiều điều phải bàn, thậm chí là liên miên bất tận. Việc người Việt nói chèn các từ tiếng Anh trong giao tiếp rất đáng phải bàn mà tôi chỉ xin phép nói đến những gì liên quan đến cá nhân mình. Giao thoa văn hoá dẫn đến một điều trong công việc là mọi người sẽ dùng nhiều từ nước ngoài.

Kyo York - một ca sĩ người Mỹ biết hát tiếng Việt

Ngay trong ngành CNTT, khá nhiều thuật ngữ chúng ta phải dùng tiếng Anh. Nhiều từ rất khó dịch ra tiếng Việt hoặc dịch được thì cũng không tự nhiên. Tất nhiên, cái gì cũng có tính hai mặt của nó. Dùng thuật ngữ tiếng Anh có thể tiện trong công việc nhưng sẽ dẫn đến nguy cơ đưa tiếng Anh ra ngoài đời thực.

Ví dụ như từ “ý tưởng” thì tiếng Anh là “idea” và sẽ là không tốt nếu nói từ này bằng tiếng Anh trong các giao tiếp thông thường. Như thế, tiếng Anh từ trong công việc sẽ thâm nhập cuộc sống của người Việt rất nhanh và đặc biệt ảnh hưởng tới các thế hệ sau này đặc biệt là với các em được học tiếng Anh từ nhỏ. Cũng không thể trách họ được vì trên mạng Internet đang rất thiếu thông tin về tiếng Việt và không nên nghĩ rằng đã có hàng trăm tờ báo tiếng Việt lên mạng là đủ.

Chính thực tế này đã thôi thúc chúng tôi phải làm thế nào để TVGĐ trở thành địa chỉ tin cậy cho mọi người để thấy hết cái hay, cái đẹp của tiếng Việt. Cùng với việc đó, tôi cũng mong muốn chính các cơ sở đào tạo tiếng Việt cho người nước ngoài cần cung cấp thật nhiều thông tin trực tuyến về tiếng Việt không chỉ cho người nước ngoài.

Chúng tôi khẳng định, tiếng Việt của chúng ta cũng rất hay và cũng rất thuận tiện trong công việc. Ít nhất, chúng ta phải cho cộng đồng thấy được điều đó và khi đó, chính người Việt sẽ yêu quý ngôn ngữ của đất nước mình. Con cái cần phải có hiếu với cha mẹ vì cha mẹ cũng rất vất vả vì con cái. Đó là cội nguồn mà mọi người đều phải nhớ cho tiếng mẹ đẻ của mình.

PV: Bạn có mong muốn gì về sự hợp tác giữa hai ngành CNTT và ngôn ngữ học ở Việt Nam?

anh Lê Trọng Nghĩa: Thời đại này là thời đại của khoa học liên ngành và không chỉ ngành ngôn ngữ học mà mọi ngành học khác đều cần đến CNTT. Chúng tôi mong rằng CNTT sẽ được ứng dụng nhiều hơn với ngôn ngữ học. Trong đó, ít nhất là tra cứu tài liệu và các hội thảo trực tuyến để cho thật nhiều người được biết và có thể tham gia. CNTT phải làm thế nào để mọi người cùng thấy ngôn ngữ học không hề khô khan mà rất phong phú, đa dạng và có nhiều màu sắc.

Còn với dịch máy và nhận dạng tiếng nói, đây là những lĩnh vực rất mới không chỉ riêng với ngành ngôn ngữ học. Đây là những công nghệ có tiềm năng rất cao và độ chính xác là điều phải đạt được trong tương lai. Vì thế, đáng mừng là trong chương trình đào tạo của ngành ngôn ngữ học ở Việt Nam đã có những học phần này và tôi tin rằng sẽ có những cử nhân tương lai của ngành ngôn ngữ dấn thân theo định hướng này để cùng với các chuyên gia CNTT cho việc hoàn thiện các sản phẩm chung.

PV: Được biết, cũng chỉ còn ít ngày nữa thì các bạn sẽ tổ chức Ngày Tôn vinh tiếng Việt lần đầu tiên. Xin bạn cho biết, vì sao ngày 21/2 lại được lựa chọn?

anh Lê Trọng Nghĩa: Thời gian qua, TVGĐ đã đặt vấn đề là nên có một ngày tôn vinh tiếng Việt để cộng đồng cùng bình xét, lựa chọn. Đã có 4 đề cử là ngày sinh đại thi hào Nguyễn Du (3/1 Dương lịch), Ngày thơ Việt Nam (rằm tháng Giêng Âm lịch), ngày quốc tế ngôn ngữ tiếng mẹ đẻ được Tổ chức Văn hoá Giáo dục Liên hiệp quốc (UNESCO) công nhận (21/2) và ngày thành lập Nha Bình dân Học vụ (8/9) – cơ quan đảm nhận nhiệm vụ xoá nạn mù chữ sau khi Việt Nam độc lập năm 1945. Cuối cùng, kết quả bình chọn trên mạng của TVGĐ đã đạt được là ngày 21/2.

Để chào mừng ngày Tôn vinh tiếng Việt lần đầu tiên, TVGĐ có tổ chức 2 cuộc thi viết ca ngợi tiếng Việt và tiếng Việt qua tranh vẽ. Sau đó, chúng tôi sẽ thiết lập hẳn một website riêng của TVGĐ với sự tài trợ của một thành viên tham gia trang TVGĐ trên Facebook. Hy vọng, sau khi đã có website chính thức, TVGĐ sẽ trở thành một tổ chức hoạt động chuyên nghiệp, đáp ứng được những kỳ vọng về tiếng Việt của cộng đồng.

PV: Xin cảm ơn bạn!