Meta làm nóng cuộc chạy đua AI với mô hình ngôn ngữ mới

Tiến Dũng

26/02/2023 01:02

0:00 / 0:00

0:00

Nam miền Bắc
Nữ miền Bắc
Nữ miền Nam
Nam miền Nam

VietTimes – Ngôn ngữ LLaMA sẽ được cung cấp phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự và học viện, công ty cho biết trong một blog.

Meta hôm thứ 25/2 cho biết họ đã phát hành cho các nhà nghiên cứu một mô hình ngôn ngữ lớn mới, làm nóng cuộc chạy đua AI khi hàng loạt công ty công nghệ lớn đổ xô tích hợp AI vào sản phẩm của họ.

Cuộc chạy đua dường như đã bắt đầu vào cuối năm ngoái khi ChatGPT do Microsoft hậu thuẫn ra mắt khiến các đối thủ nặng ký trong lĩnh vực công nghệ từ Alphabet đến Baidu Inc của Trung Quốc tung ra các dịch vụ tương tự.

LLaMA, viết tắt của Large Language Model Meta AI, sẽ được cung cấp theo giấy phép phi thương mại cho các nhà nghiên cứu và các tổ chức liên kết với chính phủ, xã hội dân sự và học viện, công ty cho biết trong một blog.

Các mô hình ngôn ngữ này thường khai thác một lượng lớn văn bản để tóm tắt thông tin và tạo nội dung. Từ đó, nó có thể trả lời các câu hỏi bằng giọng điệu tương tự con người.

Trước mắt, LLaMA sẽ tập trung cho 20 ngôn ngữ dùng bảng chữ cái Latinh và Cyrillic. Tiếng Việt chưa nằm trong danh sách này. Theo công bố, mô hình của Meta đòi hỏi sức mạnh tính toán "ít hơn nhiều" so với các siêu AI trước đó. Nó có tối đa 65 tỷ tham số, bằng một phần ba so với ChatGPT, nhưng lại được huấn luyện trên 1.400 tỉ từ, cao gấp năm lần siêu AI của OpenAI.

Người phát ngôn của Meta cho rằng hiệu suất đạt được là nhờ số lượng lớn dữ liệu "sạch hơn" và "cải tiến kiến trúc" trong mô hình giúp nâng cao tính ổn định của đào tạo.

Gil Luria, nhà phân tích phần mềm cao cấp tại D.A. Davidson cho biết "AI sáng tạo là một ứng dụng mới của AI mà Meta có chưa có nhiều kinh nghiệm, nhưng rõ ràng đây là công nghệ rất quan trọng đối với tương lai của họ".

AI đã nổi lên như một điểm sáng cho các khoản đầu tư vào ngành công nghệ, trong bối cảnh tốc độ tăng trưởng chung chậm lại đã dẫn đến tình trạng sa thải nhân công trên diện rộng và cắt giảm các hoạt động thử nghiệm.

Vào tháng 5 năm ngoái, Meta đã phát hành mô hình ngôn ngữ lớn OPT-175B, cũng nhằm vào các nhà nghiên cứu, tạo cơ sở cho một phiên bản mới của chatbot BlenderBot.

Sau đó, Meta đã giới thiệu một mô hình có tên là Galactica, có khả năng viết các bài báo khoa học và giải toán. Tuy nhiên, gã khổng lồ công nghệ này cũng đã nhanh chóng gỡ bỏ bản demo sau khi nó tạo ra các phản hồi không chính xác.

Theo Reuters