Robot hiện nay có thể thực hiện nhiều nhiệm vụ khác nhau khi thiết bị được đào tạo bằng dữ liệu thực tế. Nhưng nếu có phương pháp bỏ qua bước này, sẽ xuất hiện nhiều robot đa năng, phát triển với tốc độ nhanh hơn.
Công ty DeepMind của tập đoàn Google đã giới thiệu một mô hình AI tự học tập và hoàn thiện, được đặt tên RoboCat, có thể là chìa khóa giúp robot tự tạo dữ liệu đào tạo mới, nâng cao năng lực kỹ thuật của thiết bị mà không cần quá nhiều sự can thiệp của con người.
Trang Engineering Interesting dẫn một bài viết trên blog của công ty, xuất bản ngày 20/4 cho biết.
“RoboCat học nhanh hơn nhiều so với những mô hình robot hiện đại khác. Mô hình AI có thể nhận một nhiệm vụ mới chỉ với 100 bản trình diễn do được xây dựng trên cơ sở một tập dữ liệu lớn và đa dạng. Khả năng này sẽ giúp tăng tốc quá trình nghiên cứu robot do mô hình cho phép giảm nhu cầu đào tạo thiết bị với sự hỗ trợ, giám sát của con người, đồng thời là một bước quan trọng phát triển robot đa năng mục đích chung”, các nhà nghiên cứu nhận định.
Nhóm nhà khoa học giải thích, mô hình AI mới được phát triển trên nền tảng mô hình đa phương thức Gato (tiếng Tây Ban Nha có nghĩa là “con mèo”) của DeepMind. Mô hình đa phương thức cho phép xử lý ngôn ngữ, hình ảnh và hành động trong cả môi trường mô phỏng và vật lý thực tế.
Các nhà nghiên cứu đã sử dụng kiến trúc đa phương thức của Gato cùng với một tập dữ liệu đào tạo quy mô lớn, bao gồm các chuỗi hình ảnh và hành động của rất nhiều cánh tay rô-bốt khác nhau, giải quyết hàng trăm nhiệm vụ thực tế khác nhau.
Sau đó, nhóm nghiên cứu huấn luyện mô hình AI RobotCat học các nhiệm vụ mới với 5 bước sau:
1. Thu thập 100-1000 bản trình diễn của một nhiệm vụ hoặc robot mới, sử dụng cánh tay robot do con người điều khiển.
2. Điều chỉnh RoboCat trên nhiệm vụ cho cánh tay robot, tạo ra một chương trình phụ (spin-off) chuyên biệt.
3. Chương trình phụ chuyên biệt (spin-off) thực hành tác vụ của cánh tay robot mới này trung bình 10.000 lần, tạo ra tập dữ liệu huấn luyện lớn hơn.
4. Tích hợp dữ liệu trình diễn và dữ liệu tự tạo vào tập dữ liệu đào tạo hiện có của RoboCat.
5. Huấn luyện mô hình RoboCat mới trên tập dữ liệu huấn luyện mới.
Khóa đào tạo đa dạng này đã huấn luyện mô hình AI vận hành những cánh tay robot khác nhau trong vòng vài giờ và mô hình RobotCat nhanh chóng thích nghi với các cánh tay robot và nhiệm vụ mới. Mặc dù mô hình AI được huấn luyện về cánh tay với bộ kẹp hai ngạnh, nhưng RobotCat vẫn có thể thích ứng với một cánh tay phức tạp hơn với bộ kẹp ba ngón và gấp đôi lượng thông tin điều khiển đầu vào.
Ưu điểm của mô hình AI RoboCat là càng được học nhiều nhiệm vụ, mô hình AI càng nhanh chóng hơn học được cách thực hiện những nhiệm vụ mới bổ sung.
Các phiên bản đầu tiên của mô hình AI RoboCat chỉ thành công 36% thời gian đối với những tác vụ chưa từng thấy trước đó. Tuy nhiên, RoboCat mới nhất và tiên tiến nhất, được đào tạo về nhiều nhiệm vụ đa dạng trước đó, tăng hơn gấp đôi tỷ lệ thành công trên cùng một nhiệm vụ (một tác vụ hoàn toàn mới chưa được đào tạo).
Theo Interesting Engineering