Nhiều thiết bị trong cuộc sống hàng ngày ngày nay sử dụng máy ảnh được vi tính hóa để xác định đối tượng, ví dụ: máy rút tiền tự động có thể “đọc” số tiền viết tay khi bạn gửi séc, hoặc công cụ tìm kiếm trên internet có thể nhanh chóng khớp ảnh với các hình ảnh tương tự khác trong cơ sở dữ liệu. Những hệ thống kiểu này dựa vào một thiết bị để định hình đối tượng, đầu tiên là “nhìn thấy” đối tượng bằng máy ảnh hoặc cảm biến quang học, sau đó xử lý những gì thiết bị nhìn thấy thành dữ liệu, và cuối cùng sử dụng các chương trình tính toán để tìm ra đối tượng là gì.
Ảnh: Sơ đồ mạng nơron quang học: Chữ số “5” được gửi đi dưới dạng một tín hiệu ánh sáng qua các lớp bao gồm các nơron nhân tạo. Ánh sáng đó bị tán xạ khi nó di chuyển qua các lớp, nhưng khi ánh sáng đó thoát ra, tín hiệu sáng nhất được chọn bởi máy dò tìm, mà máy này chỉ tìm duy nhất số “5.”. Nhóm nghiên cứu Ozcan / UCLA.
Thiết bị được phát triển bởi UCLA đã có những khởi đầu thuận lợi. Được gọi là "mạng nơron sâu nhiễu xạ", nó sử dụng ánh sáng phản xạ từ chính đối tượng để xác định đối tượng đó trong một khoảng thời gian rất ngắn, chỉ tương đương với khoảng thời gian một máy tính cần để "nhìn thấy" đối tượng. Thiết bị UCLA không cần các chương trình tính toán tiên tiến để xử lý hình ảnh của đối tượng và có thể quyết định xem đối tượng là gì sau khi các cảm biến quang học của nó bắt được hình ảnh. Thiết bị này cũng không sử dụng năng lượng bởi vì nó chỉ sử dụng nhiễu xạ ánh sáng.
Các công nghệ mới dựa trên thiết bị này có thể được sử dụng để tăng tốc các tác vụ đòi hỏi nhiều dữ liệu chuyên sâu liên quan đến việc sắp xếp và xác định các đối tượng. Ví dụ, một chiếc xe không người lái sử dụng công nghệ này có thể phản ứng ngay lập tức - thậm chí nhanh hơn so với sử dụng công nghệ hiện tại - với các biển báo. Với một thiết bị dựa trên hệ thống UCLA, chiếc xe sẽ “đọc” biển báo ngay sau khi tín hiệu ánh sáng từ biển báo chạm vào nó, trái ngược với việc phải “đợi” camera của ô tô định hình đối tượng và sau đó sử dụng máy tính để tìm ra đối tượng là gì.
Công nghệ dựa trên sáng chế này cũng có thể được sử dụng trong hình ảnh vi mô và y học, ví dụ, để sắp xếp hàng triệu tế bào để tìm ra các dấu hiệu của bệnh.
“Công việc này mở ra những cơ hội mới để sử dụng một thiết bị thụ động dựa trên trí tuệ nhân tạo để phân tích dữ liệu, hình ảnh và phân loại ngay lập tức các đối tượng”, Aydogan Ozcan, nghiên cứu viên chính và là Giáo sư Kỹ thuật Điện và Máy tính của UCLA cho biết. “Thiết bị mạng nơron nhân tạo quang học này được mô hình hóa trực quan về cách bộ não xử lý thông tin. Nó có thể được mở rộng để cho phép thiết kế máy ảnh kiểu mới và các thành phần quang học độc đáo có thể hoạt động thụ động trong công nghệ y tế, rô bốt, bảo mật hoặc bất kỳ ứng dụng nào mà cần tới dữ liệu hình ảnh và video”.
Quá trình tạo mạng nơron nhân tạo bắt đầu bằng một thiết kế mô phỏng bằng máy tính. Sau đó, các nhà nghiên cứu đã sử dụng máy in 3D để tạo ra các tấm polyme vuông có kích thước 8 cm rất mỏng. Mỗi lớp rất mỏng này có bề mặt không đồng đều, giúp ánh sáng nhiễu xạ phát ra từ vật thể theo các hướng khác nhau. Các lớp trông mờ đục với mắt nhưng tần số terahertz bước sóng dưới milimet của ánh sáng được sử dụng trong các thí nghiệm có thể truyền qua chúng. Và mỗi lớp bao gồm hàng chục nghìn tế bào thần kinh nhân tạo - trong trường hợp này là các điểm ảnh nhỏ xíu mà ánh sáng truyền qua.
Cùng với nhau, một loạt các lớp pixelated (chia hình ảnh thành pixel) hoạt động như một “mạng quang” để định hình cách ánh sáng đến từ vật thể truyền qua chúng. Mạng xác định một đối tượng vì ánh sáng đến từ đối tượng chủ yếu là nhiễu xạ đối với một pixel đơn lẻ được gán cho loại đối tượng đó.
Các nhà nghiên cứu sau đó đào tạo mạng này bằng cách sử dụng một máy tính để xác định các đối tượng ở phía trước của nó bằng cách học các mẫu ánh sáng nhiễu xạ mỗi đối tượng tạo ra khi ánh sáng từ vật thể đó truyền qua thiết bị. Việc "Đào tạo" sử dụng một nhánh của trí tuệ nhân tạo được gọi là học sâu, trong đó các máy "học" qua sự lặp lại và theo thời gian khi các mẫu xuất hiện.
"Đây rất là trực quan giống như một mê cung rất phức tạp từ kính và gương", Ozcan nói. “Ánh sáng đi vào một mạng nhiễu xạ và bị trả lại xung quanh mê cung cho đến khi nó thoát ra. Hệ thống này xác định đối tượng tợi nơi mà hầu hết ánh sáng thoát ra ngoài".
Trong các thí nghiệm của họ, các nhà nghiên cứu đã chứng minh rằng thiết bị có thể xác định chính xác những con số được viết tay và các mặt hàng quần áo - cả hai đối tượng đều là các loại thử nghiệm thường được sử dụng trong các nghiên cứu trí tuệ nhân tạo. Để làm điều đó, họ đặt những hình ảnh ở phía trước nguồn sáng terahertz và để cho thiết bị “nhìn thấy” những hình ảnh đó qua nhiễu xạ quang học.
Họ cũng đào tạo thiết bị để hoạt động như một thấu kính chiếu hình ảnh của vật thể được đặt phía trước mạng quang vào phía bên kia của mạng quang - giống như cách một ống kính máy ảnh điển hình hoạt động, nhưng sử dụng trí tuệ nhân tạo thay vì vật lý.
Bởi vì các thành phần của nó có thể được tạo ra bởi một máy in 3D, mạng nơron nhân tạo có thể được tạo ra với các lớp lớn hơn và bổ sung, dẫn đến một thiết bị với hàng trăm triệu tế bào thần kinh nhân tạo. Những thiết bị lớn hơn này có thể xác định nhiều đối tượng hơn cùng một lúc hoặc thực hiện phân tích dữ liệu phức tạp hơn. Và các thành phần của hệ thống này có giá thành rẻ - thiết bị được tạo bởi nhóm UCLA có thể được sao chép với giá dưới 50 đô la.
Trong khi nghiên cứu sử dụng ánh sáng ở tần số terahertz, Ozcan cho biết cũng có thể tạo ra các mạng thần kinh sử dụng ánh sáng nhìn thấy, hồng ngoại hoặc các tần số ánh sáng khác. Một mạng cũng có thể được tạo ra bằng cách sử dụng in thạch bản hoặc các kỹ thuật in ấn khác, ông nói.
Theo VISTA
http://www.vista.gov.vn/UserPages/News/detail/tabid/73/newsid/18105/seo/18105/language/vi-VN/language/vi-VN/Default.aspx