Tạo video AI giờ chỉ cần kéo thả chuột

Chỉ với vài thao tác chuột, người dùng có thể định hướng chuyển động trong video AI, mở rộng khả năng tiếp cận công nghệ làm video.
Tạo video AI giờ chỉ cần kéo thả chuột - Ảnh 1.

Các nhà khoa học Israel phát triển công cụ tạo video AI bằng chuột máy tính - Ảnh minh họa: FREEPIK

Các nhà nghiên cứu tại Viện Công nghệ Technion (Israel) vừa phát triển một công nghệ mới cho phép người dùng điều khiển chuyển động trong các video do trí tuệ nhân tạo (AI) tạo ra chỉ bằng thao tác kéo thả chuột đơn giản.

Công nghệ mang tên Time to Move (TTM) được phát triển bởi các kỹ sư thuộc khoa khoa học máy tính Henry và Marilyn Taub của Technion.

Theo nhóm nghiên cứu, một trong những hạn chế lớn nhất của các hệ thống tạo video bằng AI hiện nay là khả năng kiểm soát chính xác chuyển động của nhân vật và vật thể theo thời gian. Dù người dùng có thể tạo video từ mô tả văn bản, việc can thiệp chi tiết vào cách các đối tượng di chuyển trong khung hình vẫn còn nhiều khó khăn.

TS Or Litany, trưởng nhóm nghiên cứu, cho biết TTM được thiết kế để giải quyết vấn đề này. Thay vì phải huấn luyện lại mô hình AI trên khối lượng dữ liệu video khổng lồ hoặc sử dụng các hệ thống tính toán chuyên dụng, người dùng chỉ cần thực hiện một số thao tác chuột đơn giản để định hướng chuyển động mong muốn trong video.

Điểm nổi bật của TTM là có thể tích hợp dưới dạng tiện ích mở rộng (plug-in) cho các mô hình tạo video hiện có mà không cần đào tạo lại hệ thống. Điều này giúp giảm đáng kể chi phí triển khai so với các phương pháp trước đây, vốn đòi hỏi tinh chỉnh riêng cho từng mô hình và tiêu tốn nhiều tài nguyên tính toán.

Cốt lõi của TTM là phương pháp "khử nhiễu hai đồng hồ thời gian" (dual-clock denoising). Kỹ thuật này cho phép hệ thống vừa tối ưu hóa chuyển động theo ý định của người dùng, vừa duy trì tính tự nhiên của video, hạn chế tình trạng chuyển động gượng ép hoặc thiếu chân thực.

Kết quả thử nghiệm cho thấy TTM đạt hiệu quả tương đương, thậm chí vượt một số phương pháp dựa trên huấn luyện truyền thống về độ chính xác và độ chân thực của chuyển động. Ngoài khả năng kiểm soát chuyển động, hệ thống còn cho phép chỉnh sửa hình dạng vật thể và bổ sung các đối tượng mới vào cảnh quay - những tính năng mà nhiều công nghệ hiện nay chưa hỗ trợ.

Các nhà nghiên cứu nhận định TTM là bước tiến quan trọng hướng tới thế hệ công cụ tạo video AI trực quan hơn, giúp người dùng kiểm soát nội dung dễ dàng thay vì phụ thuộc hoàn toàn vào các câu lệnh văn bản.

Đọc tiếp Về trang Chủ đề