|
Tesla bỏ cảm biến radar trên hệ thống tự lái. Ảnh: Getty Images |
Không có công ty nào trong ngành công nghiệp ô tô có thể thu hút sự chú ý như Tesla, một mặt là do CEO Elon Musk với phát ngôn gây tranh cãi, mặt khác cũng là do Tesla thường xuyên có những quyết định "bất thường".
Cuối tháng 5, Tesla lại một lần nữa trở thành tâm điểm của dư luận, và lần này không phải vì "lỗi phanh", mà là việc thay đổi cấu hình.
Mới đây, Tesla đã thông báo rằng bắt đầu từ tháng 5, Model 3 và Model Y tại thị trường Bắc Mỹ sẽ không còn được trang bị radar cảm biến, hủy bỏ radar sóng milimet phía trước xe và chỉ sử dụng camera làm nơi thu thập thông tin của hệ thống lái xe tự động. Điều này có nghĩa là Tesla đã sẵn sàng trở thành công ty xe hơi đầu tiên triển khai giải pháp lái tự động "tầm nhìn thuần túy".
Trong khi đó, các nhà sản xuất xe tự lái khác đang tích hợp cả radar, LiDAR và camera trong hệ thống lái xe tự động.
Trên thực tế, CEO Elon Musk của Tesla luôn kiên quyết phản đối LiDAR, thậm chí còn nhiều lần chỉ trích LiDAR trước công chúng. Ông cho rằng đây là một công nghệ đắt đỏ, không cần thiết. Thậm chí, Elon Musk đã gọi những ai tin tưởng vào công nghệ LiDAR là "ngu ngốc" và những hãng xe sử dụng công nghệ LiDAR sẽ không bao giờ đạt được thành công.
Vậy, tại sao Musk lại kiên quyết "không thích" LiDAR và thậm chí tất cả các radar, và chỉ ủng hộ giải pháp công nghệ camera?
Để làm rõ vấn đề này, chúng ta có thể cần có những hiểu biết cơ bản về sơ đồ hệ thống lái tự động.
Camera và LiDAR
Để xây dựng một bộ giải pháp hệ thống lái xe tự động, thuật toán lái xe tự động đương nhiên không thể tách rời. Để đạt được các phép tính, trước tiên cần có đủ thông tin.
Trong quá trình lái xe, nguồn thu thập thông tin của xe chính là các cảm biến lớn nhỏ trên thân xe. Trong số đó, để thực hiện lái xe tự động, các cảm biến quan trọng nhất là camera và LiDAR (tất nhiên phải bổ sung thêm radar sóng milimet và cảm biến siêu âm).
Do đó, hệ thống lái xe tự động được chia thành mảng tầm nhìn dựa vào camera và mảng LiDAR. "Tầm nhìn dựa vào camera" sử dụng máy ảnh độ nét cao kết hợp thuật toán nhận dạng hình ảnh, trong khi LiDAR để đảm bảo sự ổn định của hệ thống.
Mảng công nghệ camera, hay sơ đồ thị giác thuần túy, thực chất là mô phỏng hoàn toàn trạng thái của một người đang lái xe ô tô, đầu tiên nhìn thấy hình ảnh bằng "mắt (máy ảnh)", sau đó truyền nó đến "bộ não (bộ xử lý)" để xử lý và phán đoán, và sau đó đưa ra hành động "Chân (cơ chế lái)".
Ngoài Tesla, các công ty Trung Quốc bao gồm Jikrypton và Baidu cũng đã áp dụng các giải pháp tầm nhìn thuần túy.
Công nghệ LiDAR sử dụng tia laser để đo khoảng cách và xây dựng bản đồ 3D của vật thể, bằng cách phát ra và thu nhận tia laser phản hồi lại rồi phân tích các dữ liệu đó để cho ra kết quả mong muốn. Nhiều công ty xe hơi Trung Quốc bao gồm Xiaopeng, Weilai, BAIC ARCFOX, và nhiều sản phẩm mới khác cũng công bố áp dụng giải pháp này.
Giải pháp nào tốt hơn?
Ưu điểm của giải pháp "tầm nhìn thuần túy" là dữ liệu video do máy ảnh thu được gần giống nhất với thế giới thực mà mắt người cảm nhận được và cũng gần nhất với hình thức lái xe của con người. Đồng thời, với giá LiDAR hiện rất cao, giải pháp tầm nhìn thuần túy chỉ sử dụng camera nên dễ kiểm soát chi phí hơn.
|
Khả năng phân tích thuật toán tầm nhìn thuần túy của Tesla đã rất mạnh. |
Ngoài ra, hình ảnh do camera thu được rất phù hợp để xác định đối tượng và phân loại, trong trường hợp các thuật toán xuất sắc, nó có thể loại bỏ các hạng mục gây nhiễu và cho phép học tự động trong quá trình lái xe.
Tuy nhiên, là một thuật toán thị giác tương tự như mắt người, camera dễ bị ảnh hưởng bởi ánh sáng, trong điều kiện thời tiết khắc nghiệt hoặc ánh sáng kém sẽ dễ gây ra hiện tượng đánh giá sai. Trước đây, khi bật AutoPilot, các mẫu xe Tesla đã vô tình phanh tự động khi đi qua cầu vượt hoặc gầm cầu thông thường, do thuật toán sử dụng bóng đột ngột trong camera làm chướng ngại vật.
|
Kết xuất bản đồ môi trường 3D được vẽ bởi LiDAR |
So với giải pháp tầm nhìn thuần túy, ưu điểm của giải pháp LiDAR là khoảng cách giám sát dài hơn, độ chính xác cao hơn, tốc độ phản hồi nhạy hơn và không bị ảnh hưởng bởi ánh sáng xung quanh. Việc xử lý thông tin ba chiều, tính toán kích thước vật thể và tốc độ di chuyển của LiDAR có hiệu suất cao hơn.
Tuy nhiên, LiDAR có những vấn đề như khả năng nhận dạng vật thể yếu, giá thành cao và độ chính xác trong điều kiện thời tiết khắc nghiệt như mưa và tuyết. Vì vậy, LiDAR phải được sử dụng kết hợp với các cảm biến khác để đảm bảo lái xe an toàn.
Ngoài ra, việc thu thập một lượng lớn dữ liệu đòi hỏi khả năng tính toán cao của bộ xử lý, điều này tương đương với việc nâng cao giá thành của bộ xử lý phương tiện.
Về mặt lý thuyết, sự kết hợp giữa tầm nhìn dựa vào camera và LiDAR là một giải pháp tương đối hoàn thiện hiện nay, tuy nhiên sau khi kết hợp nhiều yếu tố như công nghệ hiện có và giá thành sản phẩm thì quá khó sử dụng "giải pháp thứ ba" tích hợp hai giải pháp lớn này.
Sự đánh đổi của Tesla
|
Giá thành của LiDAR cao hơn nhiều so với camera chất lượng cao. |
Trên thực tế, từ bỏ LiDAR, và thậm chí bây giờ từ bỏ radar sóng milimet, một trong những lý do quan trọng khiến Tesla lựa chọn như vậy là để đạt được chi phí thấp hơn.
Xét cho cùng thì giá thành của LiDAR rất cao, giá của công nghệ này thời kỳ đầu khởi điểm là 100.000 USD, nhưng hiện nay với sự phát triển của ngành công nghiệp điện tử, giá của nó đã giảm nhưng về cơ bản vẫn duy trì ở mức vài chục nghìn USD. Tuy nhiên, so với máy ảnh độ nét cao, giá chỉ mấy trăm USD thì vẫn cao hơn rất nhiều.
Tuy nhiên, bên cạnh chi phí, Tesla còn có những đánh đổi về mặt kỹ thuật. Trước hết, LiDAR không xác định được bản chất cụ thể của đối tượng nên dễ gây ra phán đoán sai. Ví dụ, nếu một túi nhựa lớn xuất hiện phía trước xe, giải pháp camera có thể nhận ra đó là túi nhựa và bỏ qua nó, nhưng LiDAR sẽ đánh giá đó là vật cản và dừng xe.
Thứ hai, radar sóng milimet cũng có nhiều hạn chế. Phạm vi phát hiện của radar sóng milimet bị hạn chế trực tiếp nếu băng tần yếu. Nó không thể xác định người đi bộ cũng như mô hình chính xác tất cả các chướng ngại vật xung quanh. Đồng thời, do lượng dữ liệu thu được lớn, nó cũng sẽ tiêu tốn sức mạnh tính toán quý giá của bộ xử lý.
Cuối cùng, đối với Tesla, công ty tốt nhất trong giải pháp hình ảnh, họ đã đầu tư rất nhiều vào các thuật toán hình ảnh. Để từ bỏ khoản tích lũy lớn từ trước đến nay, và quay đầu đi con đường khác, xét về tỷ lệ đầu vào - đầu ra, có thể nói là không đáng.
Tesla trung thành với giải pháp tầm nhìn dựa hoàn toàn vào camera
|
Hệ thống camera Tesla Vsion. |
Trên trang web chính thức Bắc Mỹ của Tesla, trong phần giới thiệu tính năng lái xe hoàn toàn tự động (Full Self-Driving FSD), thông tin hiển thị về hiệu suất của radar sóng milimet đã bị loại bỏ và chỉ giữ lại các cảm biến hình ảnh và siêu âm.
Đồng thời, Tesla cũng phát hành hệ thống giám sát tài xế vào ngày 28/5. Camera trên xe của Model 3 và Model Y có thể giám sát hành vi của người lái xe khi hệ thống Autopilot được kích hoạt, phát hiện và nhắc nhở người lái xe giữ sự chú ý. Tesla tuyên bố rằng "dữ liệu camera sẽ được lưu trữ trong xe, và hệ thống sẽ không gửi dữ liệu trở lại công ty trừ khi người dùng cho phép chia sẻ dữ liệu".
Ngoài ra, hệ thống lái tự động FSD V9.0 của Tesla cũng sẽ chính thức được ra mắt trong năm nay.
Theo tuyên bố trước đó của Musk, thuật toán FSD đã được "tái cấu trúc" để đạt được tầm nhìn thuần túy thông qua 8 camera xung quanh thân xe, đồng thời giải quyết hiệu quả vấn đề "lỗi phanh" trước đó.
Tesla cũng cảnh báo các hệ thống Autopilot và FSD sẽ kém hiệu quả trong giai đoạn điều chỉnh kỹ thuật này. "Trong một thời gian ngắn của quá trình chuyển đổi, xe sử dụng Tesla Vision có thể gặp một số hạn chế hoặc không hoạt động, như tính năng tự đánh lái Autosteer bị giới hạn ở tốc độ tối đa 120,7 km/h, tính năng Triệu hồi thông minh (nếu được trang bị) và Tránh làn đường khẩn cấp có thể bị vô hiệu hóa khi giao hàng", thông báo của Tesla viết.
Liệu LiDAR sẽ giành được thị trường với lợi thế an toàn trong tương lai, hay thuật toán tầm nhìn dựa trên camera thống trị thị trường với lợi thế chi phí thấp hơn, câu trả lời vẫn chưa thể rõ ràng.
Tuy nhiên, đánh giá từ những thông tin hiện có, Tesla sẽ lựa chọn trung thành với giải pháp tầm nhìn thuần túy.
Theo NetEase