
Bộ chuẩn đánh giá VLegal - Bench của nhóm nghiên cứu C-OpenAI đăng ký trên cổng arXiv của Trường đại học Cornell - Mỹ phiên bản mới nhất cập nhật ngày 25-12-2025.
OpenAI và Microsoft bị kiện sau vụ con giết mẹ rồi tự tử nghi liên quan ChatGPTĐỌC NGAY
Nhóm nghiên cứu cho biết các mô hình thương mại tổng quát như GPT-4o, Claude hay Gemini vẫn hoạt động hiệu quả ở các nhiệm vụ phổ thông như nhận diện hoặc truy xuất thông tin.
Tuy nhiên khi chuyển sang các tác vụ yêu cầu suy luận pháp lý phức tạp hoặc tạo lập văn bản pháp lý theo cấu trúc và chuẩn viện dẫn của Việt Nam, hiệu năng của các mô hình này giảm đáng kể.
Trong khi đó, các mô hình được huấn luyện theo ngữ cảnh và đặc thù pháp luật Việt Nam lại cho kết quả vượt trội.
Song song với mô hình, bộ chuẩn VLegal-Bench được xem là trụ cột thứ hai của hệ sinh thái này. Bộ chuẩn gồm 10.450 mẫu dữ liệu có đáp án chuẩn, chia thành 22 tác vụ và được thiết kế theo 5 cấp độ suy luận tăng dần, từ nhận diện và truy xuất điều khoản, suy luận đa bước, diễn giải và tạo sinh nội dung pháp lý cho đến đánh giá các yếu tố đạo đức, công bằng và thiên lệch của mô hình.
VLegal-Bench được xây dựng bám sát đặc thù của hệ thống pháp luật Việt Nam theo truyền thống dân luật, bao gồm cấu trúc phân cấp của văn bản quy phạm, hiệu lực pháp lý, mối quan hệ sửa đổi - thay thế và yêu cầu viện dẫn điều luật cụ thể. Mỗi mẫu dữ liệu đều gắn với nguồn văn bản pháp luật cấp trung ương, bảo đảm khả năng kiểm chứng và truy xuất nguồn gốc.
Việc doanh nghiệp theo đuổi tầm nhìn xây dựng nền tảng AI mở, an toàn và do Việt Nam làm chủ sẽ thúc đẩy cộng đồng doanh nghiệp và nhà phát triển cùng tham gia xây dựng các ứng dụng AI trên nền tảng dùng chung.
CMC OpenAI dự kiến sẽ công bố mã nguồn, dữ liệu và quy trình đánh giá theo hướng minh bạch, đồng thời mời gọi sự tham gia của các chuyên gia trong và ngoài nước để từng bước hoàn thiện hệ sinh thái này.
Trong thời gian tới, CMC OpenAI dự kiến phát hành kho mã nguồn và dữ liệu của VLegal-Bench, mở rộng website đối sánh các mô hình và công bố các phiên bản mở theo từng giai đoạn trong năm 2026. Mục tiêu là hình thành một nền tảng tiêu chuẩn, có cơ chế kiểm chứng rõ ràng, phục vụ phát triển các ứng dụng AI chuyên ngành và đóng góp vào sự phát triển bền vững của hệ sinh thái AI Việt Nam.