
Trong mô phỏng chiến tranh, AI thường quyết định dùng vũ khí hạt nhân chiến lược - Ảnh: CANVA
Nghiên cứu mới cho thấy khi chơi trò chơi
AI vượt mức sáng tạo trung bình của con người?ĐỌC NGAY
Các mô hình AI được cung cấp một "thang leo thang" chiến lược, từ lựa chọn ngoại giao, hành động quân sự thông thường cho đến đe dọa và tấn công hạt nhân.
Trong mô phỏng, các chatbot AI được trao khả năng lựa chọn hai hình thức tấn công hạt nhân. Một là tấn công hạt nhân chiến lược, sử dụng các đầu đạn có sức công phá lớn, gây thiệt hại trên diện rộng và mang tính hủy diệt không phân biệt mục tiêu.
Hai là tấn công hạt nhân chiến thuật, với quy mô nhỏ hơn, được thiết kế để sử dụng ở cự ly gần và trong phạm vi chiến trường cụ thể, nhằm tạo lợi thế quân sự trước mắt.
Kết quả cho thấy trong 95% số kịch bản, các mô hình AI đã lựa chọn sử dụng vũ khí hạt nhân chiến thuật ở một giai đoạn nào đó của xung đột.
Đáng chú ý, các AI coi việc sử dụng loại vũ khí này như một công cụ cưỡng ép hợp lý, tương tự leo thang quân sự thông thường, thay vì xem đó là một "lằn ranh đỏ" không thể vượt qua.
Vũ khí hạt nhân chiến thuật được các mô hình AI đánh giá là phương án "có thể kiểm soát", trong khi việc sử dụng vũ khí hạt nhân chiến lược lại hiếm khi được lựa chọn.
Theo nhóm nghiên cứu, điều này cho thấy các AI dường như đã tự phân định một ranh giới giữa hai loại vũ khí, coi hạt nhân chiến thuật là leo thang chấp nhận được, còn hạt nhân chiến lược là thảm họa không thể đảo ngược.
Giáo sư Payne cho rằng AI không chia sẻ nỗi sợ và phản xạ cảm xúc của con người trước hậu quả kinh hoàng của vũ khí hạt nhân, vốn đã hình thành qua các sự kiện lịch sử như Hiroshima.
Ngoài ra, dữ liệu huấn luyện của các mô hình, bao gồm nhiều tài liệu chiến lược thời chiến tranh lạnh, vốn không tuân theo quan điểm cấm kỵ chung của nhân loại đối với vũ khí hạt nhân chiến thuật.
Nghiên cứu nhấn mạnh dù khả năng giao quyền kiểm soát hạt nhân cho AI là rất thấp, kết quả mô phỏng này cho thấy AI hiện chưa phù hợp để tham gia các quyết định liên quan đến chiến lược hạt nhân.
Nghiên cứu được đăng trên nền tảng chia sẻ nghiên cứu arXiv.