Các nhà nghiên cứu từ nhóm nghiên cứu trí tuệ nhân tạo cơ bản MetaPlatforms cho biết hôm nay rằng họ sẽ phát hành phiên bản nâng cao hơn của Habitat, một môi trường mô phỏng trí tuệ nhân tạo dùng để dạy robot cách tương tác với thế giới vật chất.
Trong khi ra mắt Habitat 3.0, công ty cũng đã công bố phát hành Bộ dữ liệu cảnh tổng hợp Habitat (HabitatSynthe ticScenesDataset), một bộ dữ liệu ba chiều do nghệ sĩ viết có thể dùng để đào tạo các tác nhân điều hướng trí tuệ nhân tạo; và HomeRobot, một nền tảng phần cứng và phần mềm trợ lý robot giá cả phải chăng có thể được sử dụng trong môi trường mô phỏng và thế giới thực.
Các nhà nghiên cứu của FAIR giải thích trong một bài đăng trên blog rằng các sản phẩm mới được phát hành thể hiện sự tiến bộ không ngừng của họ trong "trí tuệ nhân tạo thể hiện". Khi nói đến "AI thể hiện", chúng có nghĩa là các tác nhân trí tuệ nhân tạo có khả năng cảm nhận và tương tác với môi trường của chúng, chia sẻ môi trường một cách an toàn với các đối tác của con người cũng như liên lạc và hỗ trợ các đối tác của con người trong thế giới vật lý và kỹ thuật số.
Môi trường sống là một danh mục các môi trường ảo, chẳng hạn như không gian văn phòng, nhà ở và nhà kho, có thể được sử dụng để đào tạo và cải thiện khả năng điều hướng trong thế giới thực của robot trí tuệ nhân tạo. Môi trường ảo được xây dựng cẩn thận bằng hệ thống chụp hồng ngoại có thể đo chính xác hình dạng và kích thước của các đồ vật như bàn, ghế và thậm chí cả sách. Trong những môi trường này, các nhà nghiên cứu có thể huấn luyện robot hoàn thành các nhiệm vụ phức tạp, gồm nhiều bước đòi hỏi khả năng nhìn và hiểu môi trường xung quanh của robot.
Habitat 3.0 được xây dựng dựa trên những khả năng hiện có này bằng cách hỗ trợ cả robot và hình đại diện hình người, cho phép con người và robot cộng tác trong nhiều nhiệm vụ khác nhau. Ví dụ, con người và robot có thể cùng nhau dọn dẹp phòng khách hoặc chuẩn bị các công thức nấu ăn trong nhà bếp. FAIR cho biết điều này mở ra những con đường mới để nghiên cứu sự hợp tác giữa con người và robot trong nhiều nhiệm vụ trong thế giới thực. FAIR tuyên bố rằng hình đại diện của con người trong "Habitat 3.0" rất thực tế, với dáng đi và chuyển động tự nhiên, cho phép thực hiện các tương tác cấp thấp và cấp cao thực tế nhất.
Các nhà nghiên cứu đã viết: "Sự cùng tồn tại của con người và robot trong môi trường mô phỏng cho phép chúng tôi, lần đầu tiên, tìm hiểu các chiến lược AI của robot với sự hiện diện của hình đại diện hình người trong môi trường giống như ở nhà và thực hiện chúng trong các công việc hàng ngày. "Habitat 3.0" sẽ giảm thời gian học tập của các tác nhân trí tuệ nhân tạo robot từ nhiều tháng hoặc thậm chí nhiều năm xuống còn vài ngày, FAIR cho biết. Nó cũng cho phép thử nghiệm nhanh hơn các mô hình mới trong môi trường an toàn.
Bộ dữ liệu Cảnh tổng hợp Habitat, được gọi là HSSD-200, cũng sẽ giúp đẩy nhanh quá trình nghiên cứu AI, vì mô phỏng ba chiều của các cảnh trong thế giới thực rất quan trọng cho việc đào tạo. FAIR giải thích rằng HSSD-200 vượt trội hơn các tập dữ liệu trước đó vì cảnh ba chiều phản ánh chính xác hơn cảnh của thế giới thực. Nó bao gồm 211 cảnh 3D chất lượng cao. tái tạo các ngôi nhà trong thế giới thực và các môi trường khác, đồng thời chứa 18.656 mô hình đối tượng trong thế giới thực trong 466 danh mục ngữ nghĩa.
Theo FAIR, HSSD-200 cung cấp phân loại ngữ nghĩa chi tiết tương ứng với bản thể luận của WordNet, trong khi khả năng nén tài sản của nó cho phép mô phỏng AI riêng lẻ có hiệu suất cao hơn được tạo ra bởi các nghệ sĩ 3D chuyên nghiệp để khớp chính xác với các thương hiệu đồ nội thất và thiết bị trong thế giới thực về hình thức. và kích thước.
Cuối cùng, FAIR giới thiệu thư viện HomeRobot mới, đặc tả phần cứng và phần mềm dành cho các nhà nghiên cứu muốn tạo ra robot vật lý để áp dụng các mô hình mà họ đã đào tạo trong Habitat vào thế giới vật chất
.HomeRobot dựa trên nền tảng phần mềm thân thiện với người dùng và các thành phần phần cứng giá cả phải chăng, điều đó có nghĩa là việc thiết lập nhanh chóng, dễ dàng và sẵn sàng để thử nghiệm trong thế giới thực. Nó được thiết kế để nghiên cứu thao tác di động từ vựng mở, đó là khả năng của robot nhặt đồ vật và đặt chúng vào các vị trí được chỉ định trong bất kỳ môi trường không nhìn thấy nào. Để làm được điều này, robot phải có khả năng cảm nhận và hiểu được các tình huống mới mà chúng gặp phải.
Holger Mueller của Constellation Research Inc. cho biết thông báo của Meta cho thấy công ty đã đạt được tiến bộ thực sự ngoài sự cường điệu về trí tuệ nhân tạo tổng hợp, với phần mềm mạnh mẽ có thể được sử dụng để đào tạo và kiểm tra robot thông minh trong thế giới ảo. Ông nói: "Habitat 3.0 hiện tập trung vào tương tác giữa con người và máy tính vì đây là cột mốc quan trọng cần phải được hoàn thiện nếu chúng ta muốn chế tạo những robot có thể hoạt động trong cuộc sống hàng ngày. Bộ dữ liệu HSSD-200 rất hữu ích vì việc tạo ra các vật thể vật lý trong những môi trường này rất tốn kém và mất nhiều thời gian."
FAIR cho biết còn nhiều điều hơn thế nữa từ những phát triển này.
Các nhà nghiên cứu giải thích: "Trong giai đoạn nghiên cứu tiếp theo, chúng tôi sẽ sử dụng trình mô phỏng Habitat3.0 để huấn luyện các mô hình trí tuệ nhân tạo để những robot này có thể hỗ trợ đối tác của con người và thích ứng với sở thích của họ. Chúng tôi sẽ kết hợp H abitat3.0 sử dụng HSSD-200 để thu thập dữ liệu về sự tương tác và cộng tác giữa con người và máy tính trên quy mô lớn để đào tạo các mô hình mạnh mẽ hơn. Chúng tôi sẽ tập trung triển khai các mô hình đã học được trong mô phỏng để đo lường hiệu suất của chúng tốt hơn "
.