Gần đây, các nhà nghiên cứu đã công bố hai kết quả nghiên cứu mới sử dụng trí tuệ nhân tạo để tạo hình đại diện ba chiều từ văn bản, cho phép các ứng dụng như chỉnh sửa hình đại diện và điều chỉnh ảo. Những kết quả này đến từ các nhà nghiên cứu tại Viện Max Planck của Đức và các tổ chức khác và được công bố trên arXiv.
Nghiên cứu đầu tiên đề xuất một phương pháp gọi là DELTA có thể tạo hình đại diện ba chiều với các lớp cơ thể và quần áo/tóc độc lập. Các nhà nghiên cứu đã sử dụng các phương pháp biểu diễn 3D khác nhau để tạo mô hình cơ thể và quần áo/tóc riêng biệt, tạo hình đại diện từ video RGB một mắt. Sự phân tách này cho phép các ứng dụng như chỉnh sửa hình dạng và chỉnh sửa ảo, trong đó quần áo và tóc có thể dễ dàng chuyển đổi giữa các loại cơ thể khác nhau.
Nghiên cứu thứ hai đề xuất phương pháp chuyển văn bản thành hình đại diện có tên TECA bằng cách sử dụng khuếch tán ổn định và biểu diễn 3D lai DELTA. Phương pháp này có thể tạo hình đại diện chất lượng cao chỉ từ mô tả văn bản và cho phép chỉnh sửa thuộc tính mạnh mẽ. Trước tiên, hệ thống sử dụng sự khuếch tán ổn định để tạo ra các hình ảnh khuôn mặt làm tham chiếu, sau đó thêm tóc, quần áo và các yếu tố khác theo trình tự. Các nhà nghiên cứu cho biết chất lượng của các avatar tổng hợp được tạo ra bằng phương pháp này được cải thiện đáng kể và việc chuyển thuộc tính cho phép khả năng chỉnh sửa mạnh mẽ.
Hai nghiên cứu này cung cấp những ý tưởng mới cho thế hệ con người kỹ thuật số. Sử dụng thuật toán trí tuệ nhân tạo để giải cấu trúc các thành phần khác nhau của con người kỹ thuật số không chỉ có thể tạo ra hình ảnh ảo ba chiều thực tế mà còn hỗ trợ các ứng dụng như phụ kiện ảo trực tuyến, sẽ có tác động sâu sắc đến thương mại điện tử thời trang, nền tảng xã hội và metaverse.