Vào ngày 27 tháng 4, theo Wall Street Journal, trong bộ phim lịch sử kinh thánh "King of David" do Amazon sản xuất, các diễn viên có thật đóng vai thiên thần sa ngã và phụ nữ trần thế, và cảnh quan xung quanh là một kiệt tác do AI tạo ra, chẳng hạn như bầu trời xám xịt u ám và những rặng núi gồ ghề.

Hình 1: Bối cảnh của "The King of David" được tạo bằng AI

Có 850 cảnh quay hiệu ứng hình ảnh trong mùa đầu tiên của chương trình, 73 trong số đó được tạo bằng AI AI tổng hợp, bao gồm một công cụ được phát triển bởi trang web video Trung Quốc Kuaishou. Wonder Project, nhà sản xuất chương trình, cho biết điều này giúp tiết kiệm chi phí quay phim tại chỗ tốn kém.

Từ các bộ phim bom tấn của Hollywood đến các video ngắn trên mạng xã hội, những người sáng tạo video đang ngày càng chuyển sang sử dụng AI để sản xuất nội dung từng yêu cầu một đội ngũ làm phim lớn.

“Khi chi phí sản xuất giảm, ngưỡng để người sáng tạo thử nghiệm và thử nghiệm các ý tưởng mới cũng giảm đi.” Zeng Yushen, người đứng đầu hoạt động của mô hình lớn Keling AI của Kuaishou Video, cho biết. Mô hình AI do công ty phát triển đã được sử dụng trong quá trình sản xuất “Vua Đavít”.

Các mô hình video lớn của Trung Quốc dẫn đầu

Mặc dù hầu hết người Mỹ có thể không biết đến điều đó khi họ xem TV hoặc xem video trên điện thoại, nhưng Trung Quốc đang đóng một vai trò quan trọng trong lĩnh vực này. Các công ty Trung Quốc chiếm 7 trong số 10 mô hình tạo video hàng đầu được xếp hạng bởi nền tảng đánh giá Phân tích nhân tạo, cạnh tranh với các đối thủ như Google và xAI của Elon Musk.

Tháng này, một mô hình tạo video có tên “HappyHorse” đã lan truyền sau khi đánh bại đối thủ Hoa Kỳ trong cuộc đánh giá chất lượng mù quáng. Sau đó, gã khổng lồ thương mại điện tử Trung Quốc Alibaba tiết lộ rằng mô hình này là của riêng họ.

Hình 2: Trung Quốc chiếm 7 trong số 10 mẫu video hàng đầu

Seedance, trình tạo video AI mới nhất được ByteDance ra mắt vào đầu năm nay 2.0 cũng đang thu hút sự chú ý, nó có thể chuyển đổi lời nhắc văn bản thành những cảnh phim ngắn thực tế. TikTok của ByteDance cạnh tranh với Kuaishou, nơi có hàng trăm triệu người dùng ở Trung Quốc.

Tilly Zhang, nhà phân tích công nghệ tại công ty nghiên cứu Gavekal, cho biết những nền tảng này "tự nhiên có một lượng lớn dữ liệu video ngắn được gắn nhãn có thể được sử dụng để đào tạo mô hình. Điều này tạo ra rào cản dữ liệu khiến hầu hết các công ty khó có thể tái tạo."

Thách thức của các mô hình video

OpenAI gần đây đã quyết định đóng cửa dịch vụ tạo video Sora và chấm dứt quan hệ đối tác với Disney. Các công ty khác của Mỹ như Google tiếp tục đầu tư tích cực vào lĩnh vực này.

Việc đóng cửa của Sora nêu bật những thách thức về mặt kỹ thuật và pháp lý mà video AI phải đối mặt. Việc tạo video có thể cần sức mạnh tính toán gấp hàng trăm lần so với ứng dụng chatbot tạo ra câu trả lời bằng văn bản. OpenAI hy vọng tránh đầu tư vào các dự án tiêu thụ quá nhiều sức mạnh tính toán để tập trung vào các sản phẩm có tỷ suất lợi nhuận cao hơn.

Vấn đề bản quyền cũng là vấn đề gây khó khăn cho ngành này. ByteDance đã trì hoãn việc phát hành bản cập nhật Seedance tại Hoa Kỳ sau sự phản đối của Hollywood. Ở Trung Quốc, một số diễn viên nổi tiếng gần đây cũng đã công khai lên án việc sử dụng trái phép hình ảnh của họ trong các video do AI tạo ra.

Hình 3: OpenAI tắt Sora

Nền tảng video Trung Quốc iQIYI gần đây đã bị lôi kéo vào cuộc tranh cãi. Khi Giám đốc điều hành Gong Yu giới thiệu một dự án AI bao gồm thư viện ủy quyền chân dung người nổi tiếng, ông nói: “Chụp ảnh với các diễn viên thực thụ có thể sớm trở thành quá khứ”. Ngay khi tuyên bố này được đưa ra, nhiều diễn viên nổi tiếng đã nhanh chóng lên tiếng khẳng định họ không liên quan gì đến dự án.

Tuy nhiên, video AI đang ngày càng được tích hợp vào cuộc sống trực tuyến hàng ngày của mọi người, đặc biệt là ở Trung Quốc cũng như ở Hoa Kỳ, nơi hai siêu cường đang ảnh hưởng lẫn nhau. Đầu năm nay, một loạt phim võ thuật giả mạo AI ngắn vô lý đã thu hút hàng tỷ lượt xem trên mạng xã hội Trung Quốc và truyền cảm hứng cho một lượng lớn người hâm mộ tạo ra các video tương tự. Các video gốc được sản xuất bởi một công ty thực phẩm Trung Quốc sử dụng công cụ AI của ByteDance để quảng cáo sản phẩm vịt om của mình.

Một số công ty khởi nghiệp về mô hình video của Trung Quốc đang đầu tư vào “mô hình thế giới”, được thiết kế để mô phỏng thế giới vật chất. Một số nhà nghiên cứu cho rằng robot hình người được trang bị các mô hình thế giới xuất sắc có thể thể hiện những hành vi gần gũi hơn với con người.

Cho dù đó là mô hình thế giới hay thế hệ video AI, bạn phải nắm vững các định luật vật lý và toán học cơ bản về chuyển động của vật thể trong thế giới thực. Nhiều công ty như Aishi Technology và Shengshu Technology do Alibaba đầu tư đang đồng thời phát triển theo hai hướng kỹ thuật này.

Phim ngắn AI

Ngành công nghiệp kịch ngắn đang phát triển nhanh chóng đã sớm áp dụng công nghệ tạo video AI. Những loạt phim này, xoay quanh chuyện tình lãng mạn hoặc mối thù gia đình, mỗi phim chỉ dài vài phút và được thiết kế để khiến người xem dán mắt vào màn hình điện thoại của họ. Do nhịp độ chặt chẽ và tình tiết đảo ngược thường xuyên, người xem thường ít nhạy cảm hơn với sai sót về hình ảnh khi xem loại nội dung trên màn ảnh nhỏ này.

Loại nội dung này đã bùng nổ ở Trung Quốc và các loạt phim nhỏ đang được tích hợp vào các trang web thương mại điện tử và ứng dụng giao đồ ăn để cạnh tranh thu hút sự chú ý của người tiêu dùng. Gần đây, mô hình này cũng dần xuất hiện ở Mỹ. Các nền tảng như reelShort và DramaBox do các nhà sáng lập Trung Quốc xây dựng đã tạo ra doanh thu hàng chục triệu đô la từ khán giả Mỹ.

Trong một studio ở thành phố Hàng Châu phía đông Trung Quốc, Shao Zhikun (phiên âm) đang lãnh đạo một nhóm sản xuất phim truyền hình ngắn AI gồm 60 người. Anh ấy cho biết quy trình làm việc của họ giống như chơi xổ số hơn là làm một bộ phim.

Để tạo ra một cảnh có thể sử dụng được, nhóm của Shao Zhikun cần liên tục nhập các từ nhắc nhở vào mô hình AI, việc này tiêu tốn rất nhiều thời gian và sức mạnh tính toán. Ông nói, đôi khi, những clip thành công được tạo ra có đủ chất lượng để làm cơ sở cho việc trau chuốt thêm. Nhóm cũng đã tìm ra cách tiết kiệm tiền bằng cách trước tiên tạo ra các hình ảnh tĩnh rẻ hơn, sau đó sử dụng những hình ảnh này làm hướng dẫn để giúp mô hình tạo video, nhờ đó tiết kiệm chi phí.

Nhóm của Shao Zhikun sử dụng các công cụ của Bytedance để sản xuất 100 bộ phim truyền hình ngắn mỗi tháng cho các nền tảng như Hongguo Short Drama và reelShort của Bytedance. Shao Zhikun cho biết chi phí sản xuất dao động từ vài trăm đô la Mỹ đến hơn 10.000 đô la Mỹ, đây chỉ là một phần nhỏ trong ngân sách truyền thống.

Trưởng nhóm 29 tuổi cho biết: "Logic ở đây khác. Chúng tôi không cố gắng tạo ra những kiệt tác nghệ thuật. Chỉ cần một hoặc hai bộ truyện trở thành hit thì chi phí có thể thu hồi được."

Giống như trò chơi điện tử, các phim truyền hình nhỏ cũng cố gắng thu hút người xem bằng các tập hoặc đoạn giới thiệu miễn phí trước, sau đó yêu cầu họ trả tiền hoặc xem quảng cáo để mở khóa nội dung tiếp theo. Chúng cũng có thể bao gồm thời gian nghỉ quảng cáo trong chương trình.

Zeng Yushen, người đứng đầu hoạt động tại Kuaishou Keling AI, cho biết nhu cầu từ ngành công nghiệp giải trí cũng đang tăng lên bên ngoài Trung Quốc. Miracle Pictures, nhà sản xuất loạt phim "King of David", tiết lộ rằng trong mùa thứ hai, số lượng cảnh quay được thực hiện bằng công cụ AI tổng hợp đã nhiều hơn bốn lần so với mùa đầu tiên.

Zeng Yushen cho biết 70% doanh thu của Keling đến từ bên ngoài Trung Quốc và Hoa Kỳ là thị trường chính của công ty. Kuaishou cho biết họ có kế hoạch chi tiêu vốn khoảng 3,8 tỷ USD trong năm nay, chủ yếu để đáp ứng nhu cầu về sức mạnh tính toán ngày càng tăng của Keling.

“Tôi dự đoán rằng trong một hoặc hai năm tới, video AI sẽ đạt đến mức mà mọi người thực sự khó phân biệt được đâu là thật đâu là giả,” Zeng Yushen nói. “Công nghệ này sẽ trở thành trụ cột của ngành điện ảnh và giải trí.”