Năm 2024, cuộc cách mạng về trí tuệ nhân tạo (AI) đánh dấu bước phát triển đột phá, khi AI có thể tạo thành vi khuẩn ăn nhựa mới, ứng dụng chữa trị ung thư, đến robot trợ giúp tự động và ô tô tự lái…Công nghệ AI tạo sinh (generative AI) đã đủ mạnh để thay đổi cuộc sống của con người theo nhiều cách khác nhau.
Công nghệ Transformer - nền tảng của AI hiện đại Nhiều người thường cho rằng đại diện cho AI hiện nay là các ứng dụng có thể viết, nói chuyện, mã hóa và tạo ra hình ảnh, mà không biết rằng tất cả những hình thức biểu đạt này đều dựa trên một công nghệ cơ bản gọi là Transformer, cũng là công nghệ đứng đằng sau ChatGPT.
Được công bố lần đầu tiên bởi các nhà nghiên cứu của Google vào năm 2017, Transformer là một loại thuật toán AI cho phép máy tính hiểu cấu trúc cơ bản của bất kỳ nhóm dữ liệu nào để tạo đầu ra tương tự.
Transformer đã mở đường cho công ty OpenAI ra mắt ChatGPT cách đây 2 năm và một loạt công ty hiện đang nghiên cứu cách sử dụng nó theo những cách mới: từ taxi robot cho đến thiết kế phân tử protein mới...Ứng dụng của Transformer rộng lớn đến mức trong 7 năm kể từ khi nghiên cứu của Google được công bố, nó đã được trích dẫn hơn 140.000 lần trong các bài báo khoa học khác nhau.
Hiểu ngữ cảnh văn bản, thiết kế protein
Trong nghiên cứu công bố vào năm 2017, các nhà nghiên cứu của Google đã có cách tiếp cận khác. Họ nhận ra rằng một hệ thống AI có thể hiểu tất cả các từ trong một đoạn văn bản và đặt nặng ý nghĩa của một số từ hơn những từ khác - nói cách khác là đọc trong ngữ cảnh - có thể tạo ra những bản dịch tốt hơn nhiều.
Ví dụ, trong câu tiếng Anh “I arrived at the bank after crossing the river” (Tôi đến bờ sau khi qua sông), một AI dựa trên Transformer nhận thấy rằng có từ “sông” nên sẽ dịch “bank” là bờ sông, thay vì dịch là ngân hàng. Mới đây, công ty công nghệ EvolutionaryScale đã tận dụng sức mạnh của Transformer để thiết kế ra các protein mới.
Công ty này đã tạo ra một loại protein có chức năng giống như protein khiến sứa phát sáng, nhưng hoàn toàn khác biệt so với tự nhiên. Mục tiêu của EvolutionaryScale là cung cấp công cụ để các công ty dược phẩm và hóa học tổng hợp tạo ra các hợp chất mới, từ vi khuẩn ăn nhựa đến các loại thuốc chữa ung thư - điều bất khả thi nếu không có công cụ AI của họ.
Cũng nhờ vào Transformer, các chatbot hiện đại như ChatGPT ngày nay không chỉ trò chuyện một cách tự nhiên mà còn hiểu ngữ cảnh và dự đoán các cuộc hội thoại tiếp theo. Điều này mở ra khả năng phát triển các robot trợ lý tự động có thể hỗ trợ con người nhiều việc trong cuộc sống thường nhật, từ tư vấn khách hàng cho đến hỗ trợ y tế.
Robot biết gấp quần áo và não robot
Cũng dựa trên nền tảng Transformer, công ty Physical Intelligence được thành lập với mục tiêu chế tạo ra một AI có thể điều khiển được tất cả các loại robot. Công ty này khởi đầu với một biến thể của mô hình ngôn ngữ lớn (LLM) mà ChatGPT sử dụng.
Mô hình ngôn ngữ mới này có thể kết hợp và hoạt động với hình ảnh, trở thành chìa khóa cho cách thức điều khiển robot. Trong một cuộc trình diễn gần đây, một cặp cánh tay robot - được điều khiển bởi AI mà công ty này nghiên cứu ra - đã thực hiện được một trong những nhiệm vụ khó khăn nhất đối với tất cả các loại robot: gấp quần áo.
Quần áo có thể có bất kỳ hình dạng nào sau khi giặt, bởi vậy đòi hỏi sự linh hoạt cũng như khéo léo đáng kinh ngạc khi xử lý. Đây là lý do mà các nhà chế tạo robot không thể lập trình để robot biết chính xác cách di chuyển các chi của nó để lấy và gấp quần áo.
Thế nhưng hệ thống của Physical Intelligent có thể điều khiển robot lấy quần áo ra khỏi máy sấy và gấp chúng gọn gàng bằng cách sử dụng một hệ thống AI đã học cách tự thực hiện nhiệm vụ này mà không cần con người nhập dữ liệu.
Màn trình diễn ấn tượng này đã giúp Physical Intelligent huy động được 400 triệu USD vào đầu tháng 11/2024, từ các nhà đầu tư có tiếng bao gồm tỷ phú Jeff Bezos và công ty OpenAI.
Vào tháng 10/2024, các nhà nghiên cứu tại Viện Công nghệ Massachusetts (MIT) tuyên bố họ đang theo đuổi một chương trình tương tự để tạo ra bộ não robot có thể tiếp nhận lượng dữ liệu khổng lồ từ nhiều nguồn khác nhau, từ đó giúp robot hoạt động linh hoạt trong nhiều môi trường khác nhau.
Xe tự lái và hệ thống giao thông thông minh
Giống như trong lĩnh vực robot, các nhà nghiên cứu và công ty nghiên cứu về ô tô tự lái cũng đang tìm cách sử dụng “mô hình ngôn ngữ hình ảnh” dựa trên Transformer để có thể tiếp nhận và kết nối không chỉ ngôn ngữ mà cả hình ảnh.
Các công ty Nuro có trụ sở tại California (Mỹ), Wayve có trụ sở tại London (Anh) và Waymo, thuộc sở hữu của công ty mẹ Google, nằm trong số các công ty đang phát triển các mô hình này.
Các mô hình tự lái trước đây thường sử dụng các hướng dẫn do con người viết ra cùng các loại AI cũ hơn để xử lý dữ liệu cảm biến để xác định các vật thể trên đường. Nhưng các mô hình tự lái mới dựa trên Transformer lại có hướng tiếp cận khác: cung cấp cho các hệ thống kiến thức chung về thế giới mà trước đây khó có thể làm được.
Trong một bài viết gần đây, các nhà nghiên cứu của Waymo đã chỉ ra cách sử dụng hệ thống AI thương mại của Google, Gemini, để giúp hệ thống tự lái của họ xác định và nhường đường cho các vật thể mà nó chưa được huấn luyện, ví dụ như một chú chó đang băng qua đường.
Tuy nhiên, dù mạnh mẽ đến mức nào, những hệ thống này vẫn có những giới hạn và chưa thể tự động hóa hoàn toàn công việc của con người. Những bước đột phá trong công nghệ AI không chỉ mang lại lợi ích kỹ thuật mà còn có tác động sâu rộng đến kinh tế và xã hội: tăng năng suất lao động, thay đổi thị trường lao động và đổi mới giáo dục...
AI, đặc biệt là các mô hình dựa trên công nghệ Transformer, đã tạo ra những bước đột phá lớn có khả năng làm biến đổi thế giới theo nhiều cách khác nhau. Từ ứng dụng trong y tế, giao thông, tự động hóa cho đến giáo dục, nó đang mở ra những cơ hội mới và cả những thách thức mới cho nhân loại.
Để tận dụng tối đa lợi ích của AI, chúng ta cần tiếp tục nghiên cứu, phát triển và áp dụng các công nghệ này một cách thông minh và bền vững.