|
LLM là gì?
Theo định nghĩa của Cloud Flare, mô hình ngôn ngữ lớn (LLM) là một loại mô hình trí tuệ nhân tạo (AI) được huấn luyện trên lượng dữ liệu văn bản khổng lồ (do đó có tên là "lớn") để có thể hiểu, tạo và thao tác với ngôn ngữ tự nhiên của con người.
Các mô hình như ChatGPT của OpenAI, BERT của Google, hay LLaMA của Meta là những ví dụ điển hình cho LLM. Chúng sử dụng kiến trúc mạng nơ-ron tiên tiến như Transformer, cho phép mô hình học cách dự đoán từ tiếp theo trong một câu dựa trên ngữ cảnh trước đó.
Một LLM như GPT-4 có thể được huấn luyện trên hàng trăm tỷ từ, từ đó xây dựng khả năng suy luận ngôn ngữ một cách tinh vi. Khác với các chatbot truyền thống vốn bị giới hạn bởi tập luật cố định, LLM có thể đưa ra phản hồi linh hoạt, thậm chí sáng tạo trong nhiều ngữ cảnh khác nhau.
Ứng dụng của LLM - Không chỉ là chatbot thông minh
Theo Forbes, LLM không chỉ dừng lại ở việc trả lời câu hỏi hoặc trò chuyện. Vai trò của chúng đang ngày càng mở rộng trong nhiều lĩnh vực, bao gồm:
Giáo dục: Các LLM có thể hỗ trợ học sinh luyện tập viết văn, giải thích khái niệm phức tạp bằng ngôn ngữ dễ hiểu, thậm chí đóng vai trò là trợ giảng ảo. Nhiều nền tảng học tập trực tuyến đã tích hợp các mô hình như GPT để tạo nội dung và chấm bài tự động.
Y tế: LLM có thể hỗ trợ phân tích hồ sơ bệnh án, diễn giải kết quả xét nghiệm và thậm chí gợi ý chẩn đoán sơ bộ dựa trên mô tả triệu chứng. Tạp chí Nature Medicine từng công bố một nghiên cứu cho thấy GPT-4 có thể đưa ra chẩn đoán chính xác trong hơn 85% trường hợp mô phỏng.
Kinh doanh: Trong lĩnh vực tài chính và marketing, LLM giúp tự động hóa viết báo cáo, tạo nội dung quảng cáo và thậm chí hỗ trợ phân tích xu hướng thị trường. Các công ty như Morgan Stanley và PwC đã triển khai LLM để hỗ trợ công việc nội bộ.
Lập trình: GitHub Copilot – được xây dựng dựa trên LLM của OpenAI – hiện đang được hàng triệu lập trình viên sử dụng như một “trợ lý lập trình” giúp gợi ý dòng lệnh, sửa lỗi, và thậm chí viết cả đoạn mã phức tạp.
Cơ hội và thách thức từ LLM đối với xã hội hiện đại
Theo ông Ankit Virmani, chuyên gia kỹ thuật dữ liệu và AI của Google, sự phát triển mạnh mẽ của LLM mang lại nhiều cơ hội lớn, nhưng đồng thời cũng đặt ra không ít thách thức về đạo đức, quyền riêng tư và quản lý công nghệ.
Các cơ hội mà LLM mang đến là:
Tăng năng suất lao động: LLM có thể đảm nhiệm những công việc mang tính lặp lại, giúp con người tập trung vào các nhiệm vụ sáng tạo.
Hỗ trợ tiếp cận tri thức: LLM giúp phổ cập kiến thức và hỗ trợ học tập cho những đối tượng bị hạn chế về điều kiện giáo dục.
Thúc đẩy sáng tạo: Từ viết nhạc, vẽ tranh đến thiết kế sản phẩm, LLM mở ra không gian sáng tạo mới.
Tuy nhiên LLM cũng có những hạn chế như:
Quyền riêng tư và bảo mật dữ liệu: ông Ankit Virmani cho rằng đây là vấn đề cần được quan tâm hàng đầu. Trên thực tế, một số doanh nghiệp vội vàng triển khai LLM để hỗ trợ phân tích phản hồi của khách hàng, sau đó phát hiện ra rằng nó vô tình làm lộ dữ liệu nhạy cảm có trong bộ dữ liệu đào tạo. Từ đó, doanh nghiệp phải đối mặt với một vụ rò rỉ dữ liệu và lòng tin của khách hàng bị xói mòn.
Thiên kiến dữ liệu (bias): Chia sẻ với VietTimes, chuyên gia Đặng Hải Lộc nói rằng do được huấn luyện trên dữ liệu từ Internet, LLM có thể phản ánh định kiến giới, chủng tộc hoặc văn hóa nếu không được kiểm soát kỹ lưỡng.
Thông tin sai lệch hoặc ảo giác (hallucination): Cũng theo ông Đặng Hải Lộc, dù trả lời mạch lạc, LLM đôi khi “bịa ra” thông tin không chính xác mà người dùng khó nhận ra.
Ảnh hưởng đến lao động: Theo ông Đào Trung Thành, Phó Viện trưởng Viện Công nghệ Blockchain và Trí tuệ nhân tạo (ABAII), một số ngành nghề có thể bị ảnh hưởng khi LLM thay thế một phần công việc của con người. Việc đào tạo lại kỹ năng và chuyển đổi nghề nghiệp trở thành vấn đề cần quan tâm.
Quản lý và đạo đức: Luật pháp và đạo đức công nghệ vẫn đang chạy theo tốc độ phát triển của AI. Hiện mới chỉ có một số bang của Mỹ, Liên minh châu Âu và Trung Quốc đã ban hành được những bộ luật quản lý việc phát triển AI.
Tương lai nào cho LLM?
Thật bất ngờ là những nhà khoa học hàng đầu về AI lại cho rằng LLM đang phát triển gần như tới hạn.
Yann LeCun, một trong những bộ óc vĩ đại trong nghiên cứu AI, luôn tin rằng LLM không phải là đích đến cuối cùng cho AI. Ông cho rằng, dù LLM có thể trả lời câu hỏi rất thông minh, chúng vẫn thiếu khả năng lý luận và lập kế hoạch như con người.
Bà Fei-Fei Li, một nhà khoa học hàng đầu trong lĩnh vực AI tại Stanford, cũng chia sẻ quan điểm tương tự với Yann LeCun về những hạn chế của LLM. Bà cho rằng LLM chỉ có thể học từ dữ liệu văn bản, nhưng không có trải nghiệm chủ quan hoặc khả năng nhận thức về thế giới xung quanh.
Chia sẻ trên tài khoản LinkedIn cá nhân, ông Yan LeCun "tiên đoán" rằng LLM sẽ chỉ tồn tại trong 3-5 năm nữa trước khi được thay thế bằng một mô hình mới.
"Trong vòng 5 năm tới, không ai tỉnh táo sẽ sử dụng chúng nữa, ít nhất là không như một thành phần trung tâm của hệ thống AI", ông LeCun nói.
Hiện tại thì các công ty công nghệ vẫn tiếp tục chỉnh sửa và tung ra các mô hình LLM mới. Chúng ta sẽ chờ đợi xem trong tương lai gần LLM và AI để phát triển tới mức độ thông minh nào.
Riêng đối với Việt Nam, một nhóm chuyên gia thuộc dự án ViGen đang nỗ lực xây dựng các bộ dữ liệu tiếng Việt để các LLM nước ngoài có thể được đào tạo và cho các kết quả chính xác hơn khi nhận được các câu hỏi về Việt Nam.