Trí tuệ nhân tạo và báo chí: cuộc chạy đua với máy móc
Thuật ngữ Trí tuệ nhân tạo (AI) là một thuật ngữ chung chỉ các khả năng khác nhau được cung cấp bởi những công nghệ mới nổi. Từ máy học đến xử lý ngôn ngữ tự nhiên, báo chí có thể sử dụng AI để tự động hóa một số lượng lớn các nhiệm vụ tạo nên quy trình sản xuất báo chí - bao gồm phát hiện, trích xuất và xác minh dữ liệu, sản xuất nội dung, xuất bản (với phân loại, lựa chọn, ưu tiên bộ lọc) và tự động gắn thẻ các bài báo.
Các hệ thống được hỗ trợ bởi AI này có nhiều ưu điểm:
- Tốc độ thực hiện các công đoạn phức tạp (dựa trên khối lượng lớn dữ liệu) nhanh;
- Hỗ trợ hoạt động báo chí thông qua các cảnh báo về sự kiện và cung cấp các bản thảo văn bản;
- Mở rộng phạm vi phủ sóng của các phương tiện truyền thông;
- Tối ưu hóa việc đưa tin theo thời gian thực;
- Củng cố mối quan hệ của một đơn vị báo chí với độc giả thông qua việc cung cấp những nội dung được cá nhân hóa theo vị trí, sở thích,… của người đọc.
Tuy nhiên, hệ thống này cũng có nhược điểm: hiệu quả của chúng phụ thuộc vào chất lượng dữ liệu đã được lập trình viên cung cấp sẵn. Theo nguyên tắc GIGO (Garbage in, Garbage out - một thành ngữ phổ biến trong lĩnh vực phần mềm máy tính ám chỉ chất lượng đầu ra được quyết định bởi chất lượng đầu vào). Nếu đầu vào không đáng tin cậy, không chính xác thì chúng ta sẽ không thể có được đầu ra chính xác và đáng tin cậy. Tự động hóa tin tức là ví dụ dễ thấy nhất của nguyên tắc này.
Ý tưởng về “robot báo chí” thực tế đã tạo ra những cuộc tranh luận sôi nổi trong ngành báo chí.
Về mặt tiêu cực, nhiều người cho rằng tự động hóa có thể đe dọa việc làm của nhà báo do chúng tiếp nhận công việc thường do con người làm.
Về mặt tích cực, nó có thể tạo ra sự đổi mới trong báo chí thông qua việc tiếp nhận các công việc lặp đi lặp lại và tốn thời gian, giúp nhà báo tập trung vào sản xuất những nội dung có giá trị cao.
Việc tự động hóa các phương pháp sản xuất báo chí không chỉ giới hạn trong việc tạo ra các văn bản. Mới đây, BBC đã giới thiệu một giọng đọc AI để đọc các bài báo được đăng trên trang web của hãng tin này. Năm 2020, Reuters cũng giới thiệu một hệ thống sản xuất video tự động nhằm đưa tin về các trận đấu thể thao.
Sẽ không có AI nếu không có nguồn nhân lực và tài chính
Việc triển khai AI trong báo chí thường yêu cầu chi phí đầu vào cao, đó là lý do vì sao các công ty truyền thông lớn có khả năng tiếp cận chúng nhiều hơn. Ảnh: European Journalists |
Trong một cuộc khảo sát năm 2019 với 71 tổ chức tin tức ở 32 quốc gia tại châu Âu, Bắc Mỹ, Nam Mỹ và châu Á, Charlie Beckett - Giám đốc Journalism AI cho biết gần 4 trong số 10 tổ chức đã triển khai các chiến lược trí tuệ nhân tạo. Những trở ngại chính đối với sự phát triển của những công nghệ này nằm ở văn hóa phản kháng (cultural resistance) liên quan đến nỗi sợ hãi có thể mất việc và thói quen làm việc, đôi khi đó còn là thái độ chống lại công nghệ.
Tuy nhiên, việc triển khai AI trong báo chí cũng không hề đơn giản bởi nó yêu cầu chi phí đầu vào cao. Điều này giải thích tại sao các công ty lớn có khả năng tiếp cận chúng nhiều hơn.
Trong mục tiêu giảm bớt căng thẳng với các công ty báo chí sau khi họ chỉ trich Google sử dụng “chùa” nội dung của mình, Quỹ Đổi mới Tin tức số của Google (Google DNI) đã đóng góp đáng kể vào việc tài trợ cho các dự án ở châu Âu nhằm khảo sát khả năng của công nghệ mới.
Vào thời điểm quỹ được ra mắt vào năm 2015, Carlo D'Asaro Biondo - Chủ tịch Quan hệ Đối tác chiến lược của Google tại châu Âu đã phát biểu: “Tôi tin rằng Google luôn muốn trở thành một người bạn và đối tác của ngành công nghiệp tin tức. Tuy nhiên, chúng tôi cũng thừa nhận rằng chúng tôi đã mắc một số sai lầm trên con đường tiếp cận”. Hiện Google DNI đã hỗ trợ được hơn 662 dự án với tổng giá trị lên tới 150 triệu Euro, ông Carlo cho hay.
Một dự án tương tự khác tại Anh - RADAR (Reporters and Data and Robots - Phóng viên, dữ liệu và robot) cũng đã nhận được khoản tài trợ trị giá 706.000 Euro. Theo thông tin trên trang web của dự án: “Chúng tôi đã xây dựng một hãng tin tức địa phương AI duy nhất trên thế giới. Chúng tôi cung cấp các bài báo theo hướng điều khiển dữ liệu (data-driven) cho hàng trăm trang web tin tức, báo đài trên khắp nước Anh”. Tuy vậy, dịch vụ này không hẳn là tự động hoàn toàn bởi nó vẫn cần tới một nhóm các nhà báo làm việc với các thuật toán nhằm đảm bảo việc kiểm soát nội dung được biên tập.
Tại Italia, tờ SESAAB cũng nhận được 400.000 Euro để phát triển các thuật toán nhằm tự động sắp xếp nội dung theo hành vi của người dùng internet. Hệ thống đề xuất được thiết kế riêng với mục đích tăng số lượng đăng ký và thu nhập cho các nhà báo, tạo điều kiện để họ có thể cống hiến hết mình và sản xuất ra những nội dung chất lượng cao.
Bên cạnh đó, có nhiều cách để tận dụng các công cụ AI mà không cần thiết phải tiêu tốn nhiều chi phí như vậy. Ngoài các công nghệ được phát triển để đáp ứng những yêu cầu cụ thể của một công ty truyền thông nào đó, các gói phần mềm tạo giọng đọc AI vẫn luôn có sẵn với chi phí hợp lý.
Theo một báo cáo của công ty phân tích thị trường Gartner, chi phí để tiếp cận các nền tảng này dao động từ 250 USD đến 4.800 USD trong vòng một năm. Lợi thế của những hệ thống như trên nằm ở quyền kiểm soát mà người thiết lập ra chúng cung cấp cho người dùng cuối. Người dùng cuối có thể xác định các thông số của phần mềm - từ việc chọn dữ liệu đến hình thức văn bản được tạo ra mà không yêu cầu kỹ năng chuyên môn.
Tập đoàn truyền thông Tamedia (Thụy Sĩ) đã chọn giải pháp này để tự động hóa báo cáo về kết quả bỏ phiếu phổ thông ở quốc gia này. “Tobi” - tên gọi của hệ thống textbot này có khả năng tạo ra khoảng 40.000 bài báo chỉ trong vòng vài phút. Năm nhà báo của Tamedia đã mất khoảng thời gian 2-3 ngày để thiết lập trạng thái hoạt động cho Tobi.
Thách thức về vấn đề việc làm và đào tạo AI
Nội dung được viết bằng AI thường thiếu chiều sâu và cần tới các biên tập viên kiểm tra, phê bình các tin tức mà AI đưa ra. Ảnh: Tech Counsellor |
Hiện tại, chưa có bằng chứng nào cho thấy việc tự động hóa sản xuất tin tức khiến các nhà báo bị mất việc. Công ty duy nhất có kế hoạch tự động hóa hoàn toàn là “gã khồng lồ” công nghệ Microsoft tại trang thông tin MSN News của hãng. Mặc dù hiếm hoi, nhưng nó cũng cho thấy không có cái gọi là “rủi ro bằng 0” trong bối cảnh doanh thu bấp bênh đối với các công ty truyền thông báo chí.
Theo Věra Jourová - Phó Chủ tịch Ủy ban Giá trị và Minh bạch Châu Âu, AI không thể thay thế các nhà báo hoặc tự đưa ra các quyết định mà AI chỉ tồn tại để hỗ trợ nhà báo, thực hiện các công việc như dịch thuật, nghiên cứu hoặc tổng hợp các văn bản dài,…
Trong một nghiên cứu vào năm 2017, nhà báo Alexander Fanta (Áo) cho biết phần lớn các hãng thông tấn châu Âu đã áp dụng tự động hóa. Theo ông, “mặc dù những nội dung được viết bằng AI thường thiếu chiều sâu và cần tới các biên tập viên kiểm tra, phê bình các sự kiện mà AI đưa ra nhưng chúng có thể cung cấp một bản tóm tắt nhanh về các số liệu, tin tức hoặc phiên bản nền của một tin bài nào đó”.
Mặc dù những lo lắng về việc làm là chính đáng nhưng điều quan trọng hơn ở đây là báo chí không chỉ đơn giản là tổng hợp dữ liệu và AI cũng không thể tự cá nhân hóa các quan điểm, tư tưởng. “Thông tin chính xác cần một quá trình xác minh thích hợp. Robot không thể làm đúng trong mọi thời điểm”, Fernando Zamith - cựu nhà báo cũng là giáo sư tại Đại học Porto lập luận.
AI có thể viết được những bài báo chất lượng hơn một nhà báo? The Guardian đã dấy lên một cuộc tranh luận vào tháng 9/2020 khi công bố một văn bản được viết hoàn toàn bởi GPY-3 - một phần mềm tạo ngôn ngữ do công ty OpenAI của Mỹ phát triển. So với các trình tạo ngôn ngữ truyền thống, GPT-3 cung cấp được nhiều bài viết chuyên sâu hơn.
Điều nguy hiểm ở đây là máy móc sẽ tiếp quản công việc mà không có sự giám sát của con người. Như vậy, việc quan trọng của các nhà báo là phải phát triển các kỹ năng biên tập mới nhằm định hình cho các hệ thống “nhà báo AI” như trên.
Theo nhà nghiên cứu Nick Diakopoulos, Hoa Kỳ - quốc gia tiên phong trong lĩnh vực tin tức tự động đã chứng kiến sự nổi lên của các tài liệu mô tả chuyên sâu về cách thức sản xuất tự động ra một bài báo. Nội dung của các mô tả này bao gồm cả công việc thượng nguồn (upstream) của các hệ thống tự động (chuẩn bị các mẫu văn bản, tham số phần mềm, quản lý chất lượng dữ liệu tự động) cũng như hạ nguồn (downstream) - giám sát chất lượng dữ liệu và nội dung.
Việc tự động hóa tin tức cũng tạo ra một thách thức trong quá trình đào tạo nhà báo bởi họ cần trang bị thêm những kỹ năng mới. Tự động hóa tin tức đòi hỏi nhà báo phải hiểu các thuật toán đó là gì, nghiên cứu các yếu tố lập trình, thống kê và xác xuất cũng như giải quyết các khía cạnh liên quan đến kỹ thuật ngôn ngữ và chất lượng dữ liệu.
Đồng thời, nhiều người trong giới học thuật cũng đang kêu gọi các nhà báo phát triển tư duy điện toán (computational thinking - tư duy giải quyết các vấn đề theo thuật toán và logic) để thuận tiện đối thoại với các nhà khoa học máy tính. Loại tư duy này, bao gồm việc chia nhỏ các vấn đề thành các chuỗi, đối chiếu chúng với quá trình viết báo, được đặc trưng bởi sự nối tiếp của các lựa chọn (nguồn, góc độ, câu chuyện) và được thiết kế để giải quyết một vấn đề nào đó.
Nắm bắt hiện tượng để định hình sự phát triển của báo chí AI
“Những người chơi mới trong thế giới báo chí” hiện nay là các kỹ sư máy tính, nhà ngôn ngữ học và nhà khoa học dữ liệu. Mặc dù vậy, các công ty cung cấp giải pháp công nghệ cho giới truyền thông không cho rằng họ đang làm báo dù họ đang tích cực tham gia vào quá trình sản xuất báo chí.
Tuy nhiên, dù là lĩnh vực nào, chúng đều yêu cầu cái gọi là “đạo đức nghề nghiệp” và một trong những thách thức lớn của việc tích hợp công nghệ AI vào báo chí cũng nằm trong vấn đề đạo đức. Như nhà kinh tế học người Pháp Michel Volle đã viết: “Cái thiện và cái ác nằm ở ý định, mục đích chứ không phải ở công cụ”.
Năm 2017, theo một nghiên cứu của Tow Centre of Digital Journalism, các công nghệ AI nên được tích hợp các giá trị biên tập vào thiết kế của chúng. Báo cáo cũng nhấn mạnh rằng “người đọc xứng đáng được cung cấp một phương pháp luận minh bạch về cách AI được sử dụng, cách AI thực hiện phân tích, báo cáo về sự việc. Một yêu cầu nữa là mô tả đó phải được trình bày bằng ngôn ngữ tự nhiên, lối diễn đạt súc tích”.
AI: mối đe dọa hay cơ hội cho lĩnh vực truyền thông?
Các nhà báo có trách nhiệm gắn kết các giá trị báo chí vào AI. Ảnh: Dr Mark van Rijmenam |
Dù câu trả lời cho câu hỏi này là gì thì có một điều không thay đổi là AI ra đời để tồn tại và là tất yếu trong thời đại số. Trong Hội thảo trực tuyến “Trí tuệ nhân tạo và tương lai của báo chí” được tổ chức vào tháng 5/2021, Chủ tịch của EFJ Mogens Blicher Bjerregard đã làm sáng tỏ những gì ông coi là vấn đề cấp bách nhất.
Theo ông, việc triển khai AI trong tòa soạn có nguy cơ nối dài khoảng cách giữa các phương tiện truyền thông lớn và nhỏ. Trong khi các công ty truyền thông lớn có thể có nhiều nguồn lực hơn để đầu tư vào công nghệ mới thì các phương tiện truyền thông địa phương hoặc tổ chức báo chí nhỏ có nguy cơ bị tụt lại phía sau. Đó là lý do tại sao họ cần được hỗ trợ. Những thách thức khác bao gồm vấn đề đạo đức và thành kiến đằng sau các thuật toán, nhu cầu đào tạo báo chí về hiểu biết dữ liệu (data literacy). Trong kỷ nguyên kỹ thuật số, các nhà báo cần học hỏi nhiều kỹ năng và kiến thức hơn nữa.
“Những gã khổng lồ công nghệ tạo ra kỹ thuật số và sẽ luôn đón đầu công nghệ mới. Tuy nhiên, họ sẽ không quan tâm đến đạo đức cũng như vai trò của báo chí và các thuật toán của họ cũng vậy. Do đó, điều quan trọng là các phương tiện truyền thông và nhà báo phải có kỹ năng để đưa ra các thuật toán của riêng mình, tạo ra những “nhà báo AI” có đạo đức và phục vụ lợi ích cộng đồng”, ông Mogens nói.
Theo Equal Times, European Journalists