Hôm nay, Tencent đã chính thức phát hành và mở mã nguồn Hunyuan 3D World Model 2.0 (HY-World 2.0). Theo báo cáo, HY-World 2.0 là mô hình thế giới đa phương thức có thể hiểu các loại đầu vào khác nhau như văn bản, hình ảnh và video, đồng thời tự động tạo, tái tạo và mô phỏng thế giới 3D. Nó cũng hỗ trợ xuất nội dung 3D đa định dạng (Lưới/3DGS/đám mây điểm, v.v.) và có thể được kết nối liền mạch với quy trình làm việc của trò chơi hiện có để nhanh chóng tạo bản đồ trò chơi và nguyên mẫu cấp độ.

Có thông tin cho rằng, không giống như Genie 3 và Hunyuan World Model 1.5 của Google chỉ có thể tạo tệp video, World Model 2.0 thậm chí còn thực tế hơn: nó có thể trực tiếp tạo tệp nội dung 3D có thể chỉnh sửa hai lần. Những nội dung 3D được tạo này có thể được nhập trực tiếp vào sản xuất trò chơi hoặc các công cụ mô phỏng được thể hiện, khiến chúng thực sự có thể chơi được và sử dụng được.

Hiện tại, World Model 2.0 đã được ra mắt trên trang web chính thức của Tencent Hunyuan 3D Creation Engine và người dùng có thể đăng ký để sử dụng.

Hunyuan World Model 2.0 hỗ trợ nhiều đầu vào văn bản, hình ảnh và video. Nhập một đoạn văn bản hoặc hình ảnh và mô hình có thể phân tích chính xác ngữ nghĩa phức tạp và tạo ra nhiều thế giới có thể chuyển vùng chỉ bằng một cú nhấp chuột. So với Hunyuan World Model 1.0, kiến ​​trúc mô hình 2.0 đã được nâng cấp hoàn toàn, độ chính xác và độ chân thực của hình ảnh đã được cải thiện rất nhiều. Người dùng cũng có thể tùy chỉnh phong cách và tạo không gian 3D chân thực, truyện tranh hoặc phong cách trò chơi theo yêu cầu. Sau khi quá trình tạo hoàn tất, người dùng có thể nhập nội dung vào các công cụ như Unity và UE để chỉnh sửa thứ cấp, điều này làm giảm đáng kể ngưỡng tạo bản đồ trò chơi. Mẫu

cũng hỗ trợ chế độ ký tự. Người dùng có thể vận hành nhân vật để tự do khám phá đường phố, tòa nhà và khung cảnh không giới hạn thời gian và va chạm vật lý, giống như trong game. Đồng thời, World Model 2.0 hỗ trợ tái tạo các cảnh 3D thực tế. Người dùng có thể nhập video hoặc hình ảnh nhiều chế độ xem của không gian thực và mô hình có thể xây dựng không gian song sinh kỹ thuật số có độ chính xác cao. Dựa trên kiến ​​trúc WorldMirror 2.0 được nâng cấp, mô hình này hỗ trợ đầu vào hình ảnh và video ở mọi kích thước, dự đoán các đám mây điểm dày đặc, bản đồ độ sâu nhiều chế độ xem, quy chuẩn bề mặt và thông số camera cùng một lúc, đồng thời tạo chúng một lần và có thể tái sử dụng chúng vĩnh viễn. Trong tương lai, bản xem trước trang trí nội thất, quy hoạch đô thị, bảo vệ di sản văn hóa và các kịch bản khác có thể nhanh chóng được xây dựng và khôi phục dựa trên khả năng này.

Hunyuan World Model 2.0 lấy 3D làm trục chính và đạt được hiệu ứng tạo cấp độ SOTA thông qua kiến ​​trúc thống nhất về hiểu biết, tạo và tái thiết không gian. So với các mô hình thế giới khác, Hunyuan World Model 2.0 hoạt động tốt hơn về tính hoàn chỉnh của cảnh (các mặt và mặt sau của vật thể) cũng như tuân thủ hình ảnh đầu vào. Biểu diễn kết hợp giữa 3DGS và Mesh do Hunyuan tạo ra cũng cho phép người dùng bật chế độ nhân vật để tương tác với các va chạm với vật thể thực.