Thiết kế và triển khai pipeline MLOps cho hệ gợi ý sản phẩm trên dữ liệu RetailRocket

Các tác giả

  • Huy Lê Iuh
  • Phan Hồng Tín Iuh
  • Bùi Thanh Hùng
  • Phạm Chánh Trực

Từ khóa:

FastAPI, Feast, GitHub Actions, hệ gợi ý, MLflow, MLOps, RetailRocket, Streamlit, XGBoost

Tóm tắt

Hệ gợi ý sản phẩm giữ vai trò quan trọng trong các nền tảng thương mại điện tử, tuy nhiên chất lượng mô hình đơn lẻ là chưa đủ nếu thiếu một quy trình huấn luyện, theo dõi, phục vụ suy luận và trình diễn được tích hợp thành một vòng đời học máy hoàn chỉnh. Bài báo này trình bày việc thiết kế và triển khai một pipeline MLOps theo hướng local-first cho hệ gợi ý sản phẩm trên bộ dữ liệu RetailRocket. Hệ thống được xây dựng với các thành phần chính gồm tiền xử lý dữ liệu, xây dựng đặc trưng, huấn luyện mô hình, theo dõi thí nghiệm bằng MLflow, quản lý đặc trưng bằng Feast, cung cấp REST API bằng FastAPI, giao diện trình diễn bằng Streamlit, và tự động hóa huấn luyện cục bộ bằng GitHub Actions kết hợp self-hosted runner. Pipeline gợi ý được tổ chức theo kiến trúc hai giai đoạn gồm candidate generation và reranking bằng XGBoost. Kết quả thực nghiệm cho thấy mô hình XGBoost hiện tại vượt baseline dựa trên độ phổ biến ở mức reranking, với Precision@10 đạt 0.1345 và NDCG@10 đạt 0.9515. Ngoài ra, ở mức đánh giá proxy end-to-end trên 200 người dùng, pipeline gợi ý đề xuất cũng tốt hơn baseline popularity\_global, với Precision@10 tăng từ 0.0035 lên 0.0105 và NDCG@10 tăng từ 0.0181 lên 0.0614. Các kết quả này cho thấy kiến trúc MLOps được đề xuất không chỉ hữu ích cho phát triển và quản lý mô hình mà còn hỗ trợ trình diễn end-to-end của hệ gợi ý trong môi trường triển khai cục bộ.

Đã Xuất bản

22-05-2026

Số

Chuyên mục

Hệ thống thông tin (Information System)