LightFusion: Mô hình học sâu kết hợp RGB, depth và mask cho ước lượng tư thế 6D

Các tác giả

  • Quang Lộc Trần Trường Đại học Công nghiệp Thành phố Hồ Chí Minh
  • Lâm Nhựt Trương Trường Đại học Công nghiệp Thành phố Hồ Chí Minh
  • Ngọc Lễ Nguyễn Trường Đại học Công nghiệp Thành phố Hồ Chí Minh

Từ khóa:

6D Pose, LineMod, Robotics, ADD, ADDS

Tóm tắt

Trong những năm gần đây, bài toán ước lượng tư thế 6D của vật thể (6D Object Pose Estimation) đã trở thành một chủ đề quan trọng trong thị giác máy tính, với nhiều ứng dụng trong thao tác robot, thực tế tăng cường (AR) và các hệ thống tự hành. Trong nghiên cứu này, chúng tôi đề xuất một mô hình học sâu sử dụng ảnh RGB, ảnh độ sâu và mặt nạ vật thể để ước lượng chính xác phép quay và tịnh tiến trong không gian 3D. Hiệu quả của mô hình được đánh giá bằng hai chỉ số phổ biến là ADD và ADD-S. Kết quả thực nghiệm cho thấy mô hình đạt độ chính xác cao và có tiềm năng ứng dụng trong các hệ thống như robot gắp–đặt, tương tác AR và kiểm tra công nghiệp. Phương pháp được đề xuất đóng góp vào xu hướng phát triển các hệ thống thông minh có khả năng nhận thức và tương tác hiệu quả với môi trường thực tế.

Đã Xuất bản

29-05-2025

Số

Chuyên mục

Khoa học máy tính và Khoa học dữ liệu (Computer & Data Science)