Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI

Minh Quang

27/02/2023 15:47

VietTimes – Những gã khổng lồ công nghệ như Microsoft và Google, cùng với OpenAI đã và đang gây chú ý với những nghiên cứu và tiến bộ về AIcủa họ

Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI (Ảnh: Tech Spot)

Những gã khổng lồ công nghệ như Microsoft và Google, cùng với OpenAI đã và đang gây chú ý với những nghiên cứu và tiến bộ về AI sáng tạo của họ. Không chịu thua kém, Mark Zuckerberg và Meta đang phát triển một mô hình ngôn ngữ AI mới có tên LLaMA. Mô hình này được báo cáo là vượt trội so với GPT-3 trong hầu hết các điểm chuẩn.

Được công bố trong một bài đăng trên blog vào thứ Sáu, Mô hình ngôn ngữ lớn Meta AI (LLaMA) của Meta được thiết cho các nhóm nghiên cứu. Theo Meta, với kích thước chỉ bằng 10% của GPT-3 (Máy biến áp được đào tạo trước thế hệ thứ ba), mô hình LLaMA cung cấp một tài nguyên nhỏ nhưng hiệu suất cao có thể được tận dụng bởi ngay cả những nhóm nghiên cứu nhỏ nhất.

Kích thước mô hình này đảm bảo rằng các nhóm nhỏ với nguồn lực hạn chế vẫn có thể sử dụng mô hình và đóng góp vào những tiến bộ tổng thể của AI và học máy.

Cách tiếp cận của Meta với LLaMA khác biệt rõ rệt khi so sánh với ChatGPT của OpenAI, Bard của Google hoặc Prometheus của Microsoft. Công ty đang phát hành mô hình mới theo giấy phép phi thương mại, nhắc lại cam kết đã nêu về sự công bằng và minh bạch của AI. Truy cập cho các nhà nghiên cứu trong các tổ chức trên toàn chính phủ, học viện quan tâm đến việc tận dụng mô hình sẽ phải xin giấy phép và được cấp quyền truy cập.

Những nhà nghiên cứu nào xin được giấy phép thành công sẽ có quyền truy cập vào mô hình nền tảng nhỏ, dễ tiếp cận của LLaMA. Meta đang cung cấp LLaMA với một số tham số kích thước bao gồm 7B, 13B, 33B và 65B. Công ty cũng đã phát hành thẻ mô hình LLaMA trên GitHub, cung cấp thêm thông tin chi tiết về chính mô hình đó và các nguồn dữ liệu đào tạo công khai của Meta.

Theo thông tin đưa ra, mô hình này đã được đào tạo bằng CCNet (67%), C4 (15%), GitHub (4,5%), Wikipedia (4,5%), Sách (4,5%), ArXiv (2,5%) và Stack Exchange ( 2%).

Mặc dù đây là một mô hình nền tảng có khả năng thích ứng với một số trường hợp sử dụng khác nhau, nhưng công ty thừa nhận rằng những ẩn số liên quan đến thành kiến và các bình luận độc hại vẫn là một mối đe dọa cần được cải thiện. Hy vọng của công ty là việc chia sẻ mô hình nhỏ nhưng linh hoạt này sẽ dẫn đến những cách tiếp cận mới có thể hạn chế hoặc trong một số trường hợp loại bỏ các con đường khai thác mô hình tiềm năng.

Những người quan tâm có thể tải tài liệu nghiên cứu LLaMA hoàn chỉnh từ blog Meta Research. Những người quan tâm đến việc đăng ký quyền truy cập có thể làm như vậy trên mẫu yêu cầu trực tuyến của Meta.

Theo Tech Spot

Meta tiết lộ mô hình ngôn ngữ mới được thiết kế cho cộng đồng nghiên cứu AI

Từ khoá:

Có thể bạn quan tâm

Liệu Apple có bỏ lỡ thị trường điện thoại gập?

Google ra mắt máy tính bảng Pixel đi kèm với dock sạc không dây độc đáo

Google Pixel Fold ra mắt với thiết kế nhỏ gọn, chip Tensor G2

Lệnh trừng phạt chip của Hoa Kỳ khiến các doanh nghiệp Trung Quốc tìm đến các kỹ thuật sáng tạo

Ấn Độ thực hiện kế hoạch trở thành trung tâm cung cấp linh kiện bán dẫn hàng đầu thế giới

Nhập khẩu chip của Trung Quốc giảm mạnh trong 3 tháng đầu năm

Trung Quốc bắt giữ người đàn ông bị cáo buộc dùng ChatGPT để lan truyền tin giả

Xây dựng hệ sinh thái khởi nghiệp đổi mới sáng tạo vùng đồng bằng sông Hồng

10.000 doanh nghiệp sẽ được tặng bộ giải pháp văn phòng số MISA AMIS để tối ưu hóa vận hành

Tân Chủ tịch Hội đồng quản trị Viettel Global là ai?

Người dùng dần mất niềm tin vào iPhone

Dòng máy iPhone 16 sẽ được nâng cấp kích thước màn hình

Samsung thất thế trước Apple trong cuộc đua máy tính bảng

Samsung Galaxy Watch 6 ra mắt tính năng theo dõi nhịp tim được FDA chấp thuận

Sử dụng Internet thường xuyên có thể làm giảm nguy cơ mất trí nhớ

Do Kwon đối mặt với bản án 40 năm tù

Google hợp tác với Samsung giải quyết một trong những vấn đề khó chịu nhất của Android

Google có kế hoạch nâng cấp công cụ tìm kiếm bằng AI Chat

2 sếp mới của Kaspersky khu vực châu Á – Thái Bình Dương là ai?

Thể thao điện tử Việt Nam có huy chương vàng đầu tiên tại SEA Games 32