OpenAI giới thiệu Sora, mô hình AI chuyển văn bản thành video

OpenAI (công ty mẹ của ChatGPT) đã tung ra một mô hình tạo video mới có tên là Sora. Mô hình AI này cho phép chuyển văn bản thành video chân thực dài tối đa một phút, tất cả đều dựa trên lời nhắc của người dùng.

Theo bài giới thiệu trên blog của OpenAI, Sora có khả năng tạo ra “những cảnh phức tạp với nhiều nhân vật, các kiểu chuyển động cụ thể cũng như các chi tiết chính xác về chủ đề và bối cảnh”. Công ty cũng lưu ý rằng mô hình này có thể hiểu cách các vật thể “tồn tại trong thế giới vật chất” cũng như “diễn giải chính xác các đạo cụ và tạo ra các nhân vật hấp dẫn thể hiện cảm xúc sống động”.

Sora cũng có thể tạo video dựa trên hình ảnh tĩnh cũng như điền vào các khung hình còn thiếu trên video hiện có hoặc mở rộng video đó. Các bản demo do Sora tạo có trong bài đăng trên blog của OpenAI bao gồm cảnh trên không của California trong cơn sốt vàng, một video trông như thể được quay từ bên trong một chuyến tàu ở Tokyo và các video khác.

OpenAI cho biết mô hình AI Sora có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của một cảnh phức tạp, nhưng kết quả nhìn chung khá ấn tượng.

Comments are closed!