Sora - ứng dụng tạo video của OpenAI "kinh khủng" cỡ nào?

0:00 / 0:00
0:00
  • Nam miền Bắc
  • Nữ miền Bắc
  • Nữ miền Nam
  • Nam miền Nam

VietTimes – OpenAI, hãng công nghệ tạo ra ChatGPT, hôm 16/2 đã giới thiệu ứng dụng tạo video dựa trên trí tuệ nhân tạo với tên gọi là Sora. Sự ra mắt của Sora đã khiến giới công nghệ kinh ngạc, đồng thời làm dấy lên những lo lắng về nội dung ảo.

Một hoạt cảnh do Sora tạo ra
Một hoạt cảnh do Sora tạo ra

Sora hoạt động tương tự như công cụ AI tạo hình ảnh DALL-E của OpenAI. Người dùng nhập câu lệnh về hoạt cảnh mong muốn và Sora sẽ trả về một video clip có độ phân giải cao. Sora cũng có thể tạo các video clip lấy cảm hứng từ hình ảnh tĩnh và mở rộng các video hiện có hoặc điền vào các khung hình còn thiếu.

Video là chân trời tiếp theo cho AI sáng tạo, sau khi các chatbot và trình tạo hình ảnh đã trở nên phổ biến trong thời gian gần đây. Mặc dù sự sáng tạo này sẽ kích thích những người đam mê AI, nhưng các công nghệ mới như Sora cũng gây ra mối lo ngại nghiêm trọng về nội dung ảo, thông tin giả mạo. Theo dữ liệu từ Clarity, một công ty máy học, số lượng video và hình ảnh deepfake do AI tạo ra đã tăng 900% so với năm trước.

Với Sora, OpenAI đang tìm cách cạnh tranh với các công cụ AI tạo video từ các công ty như Meta và Google. Các công cụ AI tương tự cũng có sẵn từ các công ty khởi nghiệp khác, chẳng hạn như Stability AI, có sản phẩm có tên là Stable Video Diffusion. Amazon cũng đã phát hành "Create with Alexa", một mô hình chuyên tạo nội dung hoạt hình dạng ngắn dành cho trẻ em dựa trên câu lệnh (prompt).

Video do Sora tạo ra chân thực như thế nào?

Mặc dù Sora chưa được phát hành rộng rãi mà mới chỉ được lưu hành trong một nhóm những người thử nghiệm an toàn, hay còn gọi là "đội đỏ", nhưng những video mà OpenAI đưa ra khiến người xem phải kinh ngạc về mức độ chân thực cũng như sức mạnh của phần mềm tạo video.

Dưới đây là các video mẫu do Sora tạo ra

Chế độ xem bằng máy bay không người lái của những con sóng vỗ vào những vách đá gồ ghề dọc theo bãi biển
Một phụ nữ rảo bước trên đường phố Tokyo. Câu lệnh đã được đưa vào để thực hiện video này là “Cô gái mặc chiếc áo khoác da màu đen, đội chiếc váy dài đỏ, đi giày bốt màu đen và cầm theo chiếc ví cũng màu đen. Kính râm che kín đôi mắt, cùng lớp son đỏ tô điểm trên môi của cô. Bước đi của cô phản ánh sự tự tin và thản nhiên, trên con đường ẩm ướt phản chiếu ánh đèn, tạo nên hiệu ứng đèn sáng đa dạng màu sắc. Nơi đây còn thu hút nhiều người đi bộ đi lại”
Một đoạn video tổng hợp các hoạt cảnh

Sora không chỉ có thể tạo ra video mới mà còn có thể chỉnh sửa và tạo ra nhiều biến thể khác nhau từ 1 video mà người dùng cung cấp

Video gốc
Video biến thể từ video gốc
Video biến thể từ video gốc
Video biến thể từ video gốc

Một nhân viên của OpenAI đã chia sẻ một đoạn video để khoe thêm một khả năng khác của Sora: tạo ra các video liên quan. Cụ thể, với prompt về những hoạt cảnh khác nhau trong cùng một khung hình, Sora đã sản xuất ra một clip với 4 cảnh diễn ra đồng thời trong một khung hình:

OpenAI cho biết họ vẫn đang tiến hành cải thiện thuật toán của Sora để các video tạo ra có tính chân thực hơn nữa.

Bạn nghĩ sao về các video nói trên. Liệu Sora có thể thay thế các nhà làm phim và quay video trong tương lai?