Tác nhân NVIDIA AI mới dựa trên mô hình GPT-4 có thể được sử dụng để đào tạo các kỹ năng robot phức tạp

NVIDIA Research hôm nay thông báo rằng họ đã phát triển một tác nhân trí tuệ nhân tạo mới có tên "Eureka", được hỗ trợ bởi GPT-4 của OpenAI và có thể tự động dạy cho robot các kỹ năng phức tạp.

Truy cập trang mua hàng:

Tóm tắt sản phẩm dòng Jingdong NVIDIA
TA GPH57

Công ty cho biết trong một bài đăng trên blog rằng Eureka có thể viết thuật toán phần thưởng của riêng mình và lần đầu tiên huấn luyện một bàn tay robot hoàn thành các kỹ năng xoay bút nhanh như con người. Eureka cũng đã dạy cho robot gần 30 nhiệm vụ như mở ngăn kéo, tủ, ném và bắt bóng, vận hành kéo.

"Học tăng cường đã đạt được những chiến thắng ấn tượng trong thập kỷ qua, nhưng vẫn còn nhiều thách thức, chẳng hạn như thiết kế phần thưởng, vốn vẫn là một quá trình thử và sai", Anima Anandkumar, giám đốc cấp cao về nghiên cứu trí tuệ nhân tạo tại NVIDIA và là tác giả của bài báo Eureka, cho biết trong một bài đăng trên blog. "Eureka là bước đầu tiên trong việc phát triển các thuật toán mới tích hợp các phương pháp học tập tổng quát và học tập củng cố để giải quyết các nhiệm vụ khó khăn."

NVIDIA Research cũng đã phát hành thư viện thuật toán trí tuệ nhân tạo Eureka để mọi người thử nghiệm NVIDIAIsaacGym, một ứng dụng tham khảo mô phỏng vật lý cho nghiên cứu học tập tăng cường. IsaacGym được xây dựng trên NVIDIA Omniverse, một nền tảng phát triển để xây dựng các công cụ và ứng dụng 3D dựa trên khung OpenUSD.

Cơn sốt về các tác nhân trí tuệ nhân tạo đã diễn ra trong nhiều tháng, bao gồm cả sự nổi lên của các tác nhân trí tuệ nhân tạo tự động như Auto-GPT, BabyAGI và AgentGPT vào tháng 4 năm nay.

Công việc hiện tại tại NVIDIA Research được xây dựng dựa trên công việc trước đó, bao gồm cả Voyager gần đây, một tác nhân trí tuệ nhân tạo được chế tạo bằng GPT-4 có thể tự động chơi Minecraft. Tuần này, tờ New York Times đã đăng một bài viết về việc biến chatbot thành đại lý trực tuyến. Jeff Clune, giáo sư khoa học máy tính tại Đại học British Columbia và là cựu nhà nghiên cứu tại OpenAI, cho biết: "Đây là một cơ hội kinh doanh khổng lồ với tiềm năng mang lại lợi ích hàng nghìn tỷ đô la. Điều này mang lại lợi ích to lớn và lợi ích to lớn cho xã hội". Sự va chạm. "

Trong một bài nghiên cứu mới có tiêu đề "Eureka: Thiết kế phần thưởng ở cấp độ con người bằng cách mã hóa các mô hình ngôn ngữ lớn", các tác giả nói rằng "Eureka tận dụng khả năng tạo điểm 0, viết mã và cải thiện ngữ cảnh phi thường của các LLM tiên tiến như GPT-4 để phát triển mã phần thưởng."

Phần thưởng thu được có thể được sử dụng để có được các kỹ năng phức tạp thông qua học tập tăng cường "Trong trường hợp không có bất kỳ lời nhắc nhiệm vụ cụ thể hoặc mẫu phần thưởng được xác định trước nào, các chức năng khen thưởng do Eureka tạo ra sẽ vượt trội hơn các phần thưởng do chuyên gia thiết kế. Trong bộ 29 môi trường RL mã nguồn mở chứa 10 hình thái robot khác nhau, Eureka vượt trội so với các chuyên gia con người ở 83% nhiệm vụ, Mức cải thiện chuẩn hóa trung bình là 52%. Jim Fan, nhà khoa học nghiên cứu cấp cao tại NVIDIA và là người đóng góp cho dự án, cho biết trong bài đăng trên blog: "

"Eureka là sự kết hợp độc đáo giữa các mô hình ngôn ngữ lớn và công nghệ mô phỏng tăng tốc GPU của NVIDIA. "Chúng tôi tin rằng Eureka sẽ cho phép điều khiển robot khéo léo và cung cấp cho các nghệ sĩ một cách mới để tạo ra các hoạt ảnh chân thực về mặt vật lý."