Hãy tưởng tượng có hai phi công trên máy bay, một người và một máy tính. Cả hai người đều cùng “tay” điều khiển nhưng lại luôn tập trung vào những việc khác nhau. Nếu tất cả đều tập trung vào cùng một thứ, con người có thể nắm quyền điều khiển. Nhưng nếu con người bị phân tâm hoặc bỏ lỡ điều gì đó, máy tính sẽ nhanh chóng đảm nhận công việc đó. Kết hợp trực giác của con người với độ chính xác của máy móc sẽ tạo ra mối quan hệ cộng sinh hơn giữa phi công và máy bay.


Với Air-Guardian, một chương trình máy tính có thể theo dõi ánh mắt của phi công con người (sử dụng công nghệ theo dõi mắt) để hiểu rõ hơn những gì phi công đang chú ý. Điều này giúp máy tính đưa ra quyết định tốt hơn dựa trên những gì phi công đang làm hoặc dự định làm. Nguồn ảnh: Alex Shipps/MITCSAIL via Midjourney

Đây là hệ thống "Sky Guardian" được phát triển bởi các nhà nghiên cứu tại Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo MIT (CSAIL). Các phi công hiện đại cần phải xử lý lượng lớn thông tin từ nhiều màn hình, đặc biệt là vào những thời điểm quan trọng. Air-Guardian có thể hoạt động như một phi công phụ tích cực; đó là sự hợp tác giữa con người và máy móc về cơ bản dựa trên sự chú ý hiểu biết.

Nhưng chính xác thì nó quyết định sự chú ý như thế nào? Đối với con người, nó sử dụng tính năng theo dõi bằng mắt, trong khi đối với hệ thống thần kinh, nó dựa vào một khái niệm gọi là "bản đồ độ nổi bật", xác định hướng chú ý. Những bản đồ này có thể đóng vai trò là hướng dẫn trực quan, làm nổi bật các khu vực chính trong hình ảnh để giúp nắm bắt và giải thích hành vi của các thuật toán phức tạp. Air-Guardian sử dụng các điểm đánh dấu sự chú ý này để xác định sớm các dấu hiệu rủi ro tiềm ẩn, thay vì chỉ can thiệp khi xảy ra vi phạm an toàn, như trường hợp của các hệ thống tự lái truyền thống.

Tác động rộng rãi của hệ thống này vượt ra ngoài lĩnh vực hàng không. Các cơ chế điều khiển hợp tác tương tự một ngày nào đó có thể được sử dụng trong ô tô, máy bay không người lái và lĩnh vực robot rộng lớn hơn.

Tiến sĩ sau tiến sĩ MIT CSAIL Lianhao Yin, tác giả đầu tiên của bài báo mới về Air-Guardian, cho biết: "Một đặc điểm thú vị trong cách tiếp cận của chúng tôi là tính khác biệt của nó. Lớp hợp tác của chúng tôi và toàn bộ quy trình từ đầu đến cuối có thể được đào tạo. Chúng tôi đặc biệt chọn mô hình mạng lưới thần kinh sâu liên tục nhân quả vì các đặc tính động của nó trong việc lập bản đồ sự chú ý." Một tính năng độc đáo là khả năng thích ứng. Hệ thống Air-Guardian không cứng nhắc, có thể điều chỉnh theo tình hình thực tế, đảm bảo sự phối hợp cân bằng giữa con người và máy móc. "

T AGPH65Kết quả và thử nghiệm hiện trường

Trong thử nghiệm thực địa, cả phi công và hệ thống đều đưa ra quyết định dựa trên cùng một hình ảnh thô khi điều hướng đến một điểm tham chiếu mục tiêu. Thành công của Air-Guardian được đo bằng phần thưởng tích lũy kiếm được trong suốt chuyến bay và đường đi ngắn hơn tới điểm đó waypoint. Guardian giảm mức độ rủi ro khi bay và tăng tỷ lệ điều hướng thành công đến điểm mục tiêu.

Ramin Hasani, thành viên của viện nghiên cứu CSAIL của MIT và là nhà phát minh của Liquid Neural Network, cho biết thêm: “Hệ thống này thể hiện cách tiếp cận lấy con người làm trung tâm đối với đổi mới hàng không bằng trí tuệ nhân tạo. Chúng tôi sử dụng Mạng thần kinh lỏng để cung cấp một phương pháp năng động, thích ứng nhằm đảm bảo rằng trí tuệ nhân tạo sẽ không chỉ thay thế khả năng phán đoán của con người mà còn bổ sung cho nó, từ đó cải thiện sự an toàn và cộng tác trên bầu trời.Sức mạnh thực sự của Air-Guardian nằm ở công nghệ cơ bản của nó. Nó sử dụng lớp cộng tác dựa trên tối ưu hóa nhằm thúc đẩy sự chú ý trực quan của con người và máy móc, cũng như mạng thần kinh thời gian liên tục dạng đóng (CfC) dạng lỏng được biết đến để giải mã mối quan hệ nguyên nhân và kết quả, để phân tích các hình ảnh đến để tìm thông tin quan trọng. Bổ sung, thuật toán VisualBackProp xác định tiêu điểm của hệ thống trong hình ảnh, đảm bảo hiểu rõ về bản đồ chú ý của nó.

Để được sử dụng rộng rãi trong tương lai, giao diện người-máy cần phải được cải thiện. Phản hồi cho rằng một chỉ báo, chẳng hạn như biểu đồ thanh, có thể cung cấp cách trình bày trực quan hơn về thời điểm hệ thống giám sát bắt đầu nắm quyền kiểm soát.

SkyGuard báo trước một kỷ nguyên mới về bầu trời an toàn hơn, cung cấp mạng lưới an toàn đáng tin cậy cho những thời điểm mà sự chú ý của con người bị dao động.

Daniela Rus, Giáo sư Kỹ thuật Điện và Khoa học Máy tính Andrew (1956) và Erna Viterbi tại MIT, giám đốc CSAIL, đồng thời là tác giả cấp cao của bài báo, cho biết: "Hệ thống SkyGuard nêu bật sức mạnh tổng hợp giữa kiến thức chuyên môn của con người và học máy, tiếp tục cho phép hiện thực hóa các công nghệ tiên tiến với khả năng tiên tiến. và cải thiện khả năng diễn giải", Stephanie Gil, trợ lý giáo sư khoa học máy tính tại Đại học Harvard, cho biết. Điều này cho thấy một ví dụ tuyệt vời về cách AI có thể được tận dụng để làm việc với con người, hạ thấp ngưỡng đạt được sự tin tưởng bằng cách tận dụng các cơ chế giao tiếp tự nhiên giữa con người và hệ thống AI. "