Hợp tác tin học và ngôn ngữ học: Chưa bao nhiêu với giáo dục đại học (kỳ 2)

VietTimes – Tiếp theo bài báo đã đăng về những bước đi đầu tiên của việc cho ra đời những sản phẩm CNTT liên quan đến ngôn ngữ ở Việt Nam, chúng tôi muốn tiếp tục phản ánh đến vấn đề này trong giáo dục đại học. Đã có ý kiến cho rằng vấn đề này bị coi thường với ngành CNTT, còn với ngành ngôn ngữ học thì chưa qua đủ ngưỡng. 
Ngay cả với một trường đại học hàng đầu như ĐH Bách khoa Hà Nội thì cũng đến không dưới 50% sinh viên ngành CNTT không biết gì về mã tổ hợp và mã dựng sẵn của tiếng Việt trong Unicode mà báo chí đã tốn rất nhiều giấy mực
Ngay cả với một trường đại học hàng đầu như ĐH Bách khoa Hà Nội thì cũng đến không dưới 50% sinh viên ngành CNTT không biết gì về mã tổ hợp và mã dựng sẵn của tiếng Việt trong Unicode mà báo chí đã tốn rất nhiều giấy mực

Ngành CNTT còn coi thường yếu tố ngôn ngữ học

Đối với đào tạo CNTT ở bậc đại học tại Việt Nam, nói đến ngôn ngữ thì chỉ có yếu là các thuật ngữ chuyên môn như ngôn ngữ lập trình, ngôn ngữ hình thức. Cũng có một bộ môn thực sự liên quan đến ngôn ngữ học được gọi tên là “xử lý ngôn ngữ tự nhiên” nhưng về cơ bản, đây là nội dung của chương trình sau đại học. Tại các trường đại học phía Bắc, mới chỉ có duy nhất Đại học Bách khoa Hà Nội đã đưa môn “xử lý ngôn ngữ tự nhiên” vào chương trình đại học cách đây cỡ 5 năm. Tuy nhiên, môn học này cũng chỉ mang tính giới thiệu sơ lược về những việc có thể làm chứ còn vào chuyên sâu thì vẫn phải là chương trình sau đại học.

Hẳn nhiều người còn nhớ, vào cuối năm 2002 tại Việt Nam đã nổ ra một cuộc chiến trên công luận giữa mã tổ hợp và mã dựng sẵn cho phông chữ tiếng Việt trên môi trường Unicode 16 bit nhằm thay thế các bộ phông chữ cũ theo tiêu chuẩn 8 bit vốn không thể thống nhất (Trong khuôn khổ bài viết này, chúng tôi chỉ có thể giải thích một cách sơ lược mã dựng sẵn là loại mã mà mỗi phông chữ là toàn bộ hình hài với các ký tự có dấu. Còn mã tổ hợp là tập hợp riêng rẽ của chữ riêng và dấu riêng được ghép vào nhau). Vậy nhưng, trong những điều tra không chính thức tại những trường đại học hàng đầu về CNTT như Đại học Bách khoa Hà Nội, Đại học Quốc gia Hà Nội thì có đến không dưới 50% sinh viên năm cuối ngành CNTT không hề biết gì về mã tổ hợp và mã dựng sẵn của tiếng Việt trên môi trường Unicode mặc dù hàng ngày họ vẫn phải sử dụng để soạn thảo văn bản cho mình. Thậm chí, có em còn không ngần ngại nói rằng không muốn mất thời gian quan tâm đến tiếng Việt vì sau này nếu làm gia công phần mềm cho nước ngoài thì chỉ cần giỏi ngoại ngữ (!).

Không chỉ với sinh viên mà ngay cả với không ít giảng viên đại học của ngành CNTT thì hiểu biết của họ về mối quan hệ với ngôn ngữ học cũng rất hạn chế. Theo TS Ngô Trung Việt – nguyên chuyên viên Viện CNTT thuộc Viện Hàn lâm Khoa học Công nghệ Việt Nam, đây chính là “bóng tối dưới chân cột đèn” không được ai nhìn thấy của ngành CNTT Việt Nam. Trong tiềm thức của các bậc thầy suốt nhiều thế hệ, với họ chỉ nổi lên những bài toán về quản lý, lập trình, phân tích mổ xẻ cấu trúc máy tính… còn yếu tố ngôn ngữ học thì bị xem thường. Có chăng, người ta cũng chỉ dạy lướt qua rất nhanh các kiến thức về các bộ gõ tiếng Việt như Vietkey, Unikey… trong chương trình nhập môn. Với cách dạy và học như vậy, nếu như không có các đối tác bên ngoài đưa vào những buổi hổi thảo chuyên đề về vấn đề này thì không chỉ sinh viên ngành CNTT không biết gì về những việc có thể làm với ngôn ngữ cũng là dễ hiểu cho dù chính họ cũng đang dùng công cụ của Google để dịch tài liệu.

Hợp tác tin học và ngôn ngữ học: Chưa bao nhiêu với giáo dục đại học (kỳ 2) ảnh 1
 Phông chữ tiếng Việt trên môi trường Unicode

Ngành ngôn ngữ chưa qua ngưỡng

Cũng như nhiều ngành học khác của các trường về khoa học xã hội, suốt nhiều năm qua các kiến thức tin học mới chỉ được cung cấp là mang tính nhập môn với chương trình đào tạo cử nhân ngôn ngữ học. Tuy nhiên, do ngôn ngữ học được định nghĩa là “Toán học của Khoa học Xã hội” nên Khoa Ngôn ngữ học của Đại học Khoa học Xã hội và Nhân văn Hà Nội sớm hay muộn cũng phải đưa vào chương trình một môn học mang tính đặc thù về vai trò của CNTT với xử lý ngôn ngữ. Rất tiếc, điều này tự thân ngành ngôn ngữ không dễ tự làm được và chắc chắn phải có sự hợp tác của ngành CNTT.

Xuất phát từ đòi hỏi đó, cuối năm 2003 tại Đại học Khoa học Xã hội và Nhân văn Hà Nội lần đầu tiên đã có một hội thảo để đặt vấn đề cho mối quan hệ giữa CNTT và ngôn ngữ học. Hội thảo này được tổ chức theo đề xuất của Ban vận động Thành lập Hội Tin học Trẻ Việt Nam và nhận được sự quan tâm rất lớn của báo chí. Tại diễn đàn này, TS Nguyễn Chí Công – Trưởng ban Khoa học Công nghệ của Hội Tin học Việt Nam khi đó đã nhận định, "còn rất nhiều việc phải làm và tôi hy vọng chính các bạn trẻ sẽ tạo ra bản sắc của CNTT Việt Nam".

Tuy nhiên, cũng rất tiếc là sau cuộc hội thảo nói trên đã không có thêm một diễn đàn nào nữa về vấn đề này cho sinh viên ngành ngôn ngữ học. Còn việc phải có thêm môn học “Ngôn ngữ học Máy tính” trong chương trình đào tạo của ngành ngôn ngữ học thì cũng phải tới 2008 mới được thực hiện với sự tham gia của các giảng viên CNTT đã từng có những nghiên cứu về lĩnh vực này. Sau này, kể từ năm 2014 có một chuyên gia của Viện Ngôn ngữ học là TS Phạm Hiển sau khi tu nghiệp ở nước ngoài đảm nhận môn học này. Tuy nhiên, với chỉ có 2 đơn vị học trình (30 tiết) thì rất khó có thể “thắp lửa” cho sinh viên để đào sâu kiến thức về lĩnh vực hoàn toàn mới mẻ này.

Dẫu vậy, đến năm 2009 ở Khoa Ngôn ngữ học cũng có được duy nhất 1 sinh viên làm tốt nghiệp về định hướng này với sự giúp đỡ của các chuyên gia tin học. Tuy nhiên, không hiểu vì lý do gì mà các bậc thầy ở đây đã không chính thức thừa nhận TS Quách Tuấn Ngọc – Cục trưởng Cục CNTT Bộ Giáo dục và Đào tạo khi đó là thầy hướng dẫn mà chỉ coi là đề tài này là do sinh viên tự nghiên cứu (?). Kết quả là sinh viên này chỉ được hội đồng chấm thi tốt nghiệp cho điểm 8 trong khi bản thân em phải nỗ lực hơn rất nhiều so với các bạn bè cùng trang lứa vốn chỉ thực hiện các đề tài có sẵn. Tuy nhiên, sau đó sinh viên này đã được tuyển dụng vào làm việc tại Viện Ngôn ngữ học song cũng không tiếp tục nghiên cứu về CNTT mà chỉ chuyên tâm vào ngôn ngữ ký hiệu.

TS Phạm Hiển cho biết, dù sao CNTT cũng là một định hướng quá khó với sinh viên ngành ngôn ngữ. Vì thế, mỗi năm và thậm chí vài ba năm mà có được dù chỉ 1 sinh viên theo đuổi định hướng này thì cũng là rất thành công rồi.

Đôi điều về tương lai

Dẫu sao thì điều đáng mừng là Đại học Bách khoa Hà Nội đã đi đầu trong việc đưa môn học “xử lý ngôn ngữ tự nhiên” vào chương trình đào tạo chính thức hơn 5 năm và hy vọng các trường khác cũng ý thức được điều này để chính thức cập nhật. Tuy nhiên, theo TS Quách Tuấn Ngọc, vấn đề tồn tại duy nhất với ngành giáo dục chứ không chỉ ở bậc đại học chính là thiếu người lãnh đạo đủ tầm. Còn mọi thứ khác như cơ sở vật chất, đường truyền Internet cao tốc thì không cần phải bàn.

Cũng cần nói thêm là chúng ta đang bước vào Cách mạng Công nghiệp 4.0 và trong cuộc cách mạng này thì chắc chắn là không ai đợi ai. Chính các khoa CNTT cũng phải định hướng cho sinh viên về những định hướng liên quan đến ngôn ngữ vì có rất nhiều việc phải làm như nhận dạng tiếng nói, hỏi đáp thông minh, công nghệ dịch thuật, tổng hợp văn bản… Nếu định hướng này, chính các sinh viên ngành CNTT sẽ góp phần “truyền lửa” cho sinh viên ngành ngôn ngữ bởi chắc chắn, họ sẽ phải cần đến nhau cho những công việc chung. 

Xem thêm:
Hợp tác tin học và ngôn ngữ học: Những bước đi đầu tiên (Bài 1)
Hợp tác tin học và ngôn ngữ học: Cần khoa học liên ngành trong thời đại 4.0 (kỳ cuối)