Chính phủ Vương quốc Anh đang thúc đẩy các công ty như OpenAI, Anthropic và Google giải thích hoạt động bên trong của các mô hình ngôn ngữ lớn (LLM) của họ. Mặc dù mã của một số mô hình được công khai nhưng các mô hình như GPT-3.5 và GPT-4 thì không và OpenAI rất miễn cưỡng chia sẻ nhiều chi tiết.

Vương quốc Anh đang chuẩn bị tổ chức một hội nghị thượng đỉnh về trí tuệ nhân tạo toàn cầu mới, nơi sẽ quy tụ các chính phủ, công ty và nhà nghiên cứu để xem xét những rủi ro do trí tuệ nhân tạo gây ra và thảo luận cách giảm thiểu những rủi ro này.

Một trong những lý do khiến các công ty không muốn chia sẻ dữ liệu nội bộ của mình là vì hành vi đó có thể tiết lộ thông tin độc quyền về sản phẩm của họ. Nếu tác nhân độc hại biết nhiều thông tin nội bộ hơn, điều đó cũng có thể khiến các mô hình trí tuệ nhân tạo dễ bị tấn công mạng.

Theo Financial Times, một trong những điều chính phủ muốn kiểm tra là trọng số mô hình, xác định cường độ kết nối giữa các nơ-ron ở các lớp khác nhau của mô hình. Hiện tại, các công ty AI không bắt buộc phải chia sẻ những thông tin chi tiết này, nhưng đã có những lời kêu gọi minh bạch hơn về vấn đề này.

Vương quốc Anh sẽ tổ chức hội nghị thượng đỉnh đầu tiên tại Bletchley Park vào tháng 11. Công viên Bletchley giữ một vị trí quan trọng trong lịch sử điện toán vì chính tại đây các thông điệp của Đức Quốc xã đã được giải mã. Bài kiểm tra Turing liên quan đến trí tuệ nhân tạo được đặt theo tên của Alan Turing, người cũng đã giải mã ở đó.

Thời báo Tài chính lưu ý rằng DeepMind, OpenAI và Anthropic của Google đều đã đồng ý vào tháng 6 để mở các mô hình của họ cho chính phủ Anh vì mục đích nghiên cứu và bảo mật. Thật không may, các bên đã không thống nhất được về phạm vi và chi tiết kỹ thuật của việc mở cửa vào thời điểm đó. Hiện nay, mức độ công khai mà chính phủ yêu cầu là khá cao.

Cuối cùng, để hội nghị thượng đỉnh thành công, người tham dự phải hiểu đầy đủ về cách thức hoạt động của các mô hình để có thể hiểu rõ hơn về mối nguy hiểm của chúng. Liệu họ có đủ cơ hội để hiểu những mô hình này hay không lại là một câu hỏi khác.