Theo Engadget, YouTube đã sử dụng thuật toán để tự động phát lại lời nói trong 8 năm qua như là nỗ lực giúp những người khiếm thính hoặc khiếm thị tiếp cận với hàng tỉ video trên đây. Mặc dù khó khăn trong quá trình khởi động nhưng Google cho biết tính năng này đã cải thiện đáng kể theo thời gian.
Trong thông báo mới nhất, Google cho biết YouTube đã được áp dụng tính năng tự động thêm hiệu ứng phụ đề âm thanh dựa trên nền tảng AI của hãng, cho phép nó nhận diện ba lớp âm thanh là vỗ tay, nhạc và tiếng cười.
Google giải thích, áp dụng phụ đề cho âm thanh là cách làm thường xuyên nhất để giúp cho những người khiếm thính và khiếm thị có thể hiểu nội dung trong video nói gì. Để làm điều này, hệ thống AI của Google sẽ lắng nghe âm thanh và hiển thị chúng dưới dạng văn bản.
Nhóm YouTube của Google cho biết rằng việc bổ sung phụ đề tự động không phải là điều đơn giản, nhưng nhờ vào nền tảng vững chắc trước đó, điều này sẽ được áp dụng dễ dàng hơn. Trong tương lai, YouTube cho biết hệ thống có thể nhận diện những âm thanh thông thường như tiếng chó sủa, tiếng gõ cửa hoặc chuông đổ. Điều này sẽ mở ra một thách thức mới, ví dụ AI sẽ cần phải nhận ra đó là tiếng chuông từ một hệ thống báo động, điện thoại hay chuông cửa.
Theo Thanh niên