DESIGN AND IMPLEMENTATION OF AN END-TO-END MLOPS FRAMEWORK FOR AUTOMATED NEWS RECOMMENDATION: FROM WEB CRAWLING TO PRODUCTION DEPLOYMENT

Các tác giả

  • Thanh Thư Nguyễn Trường Đại học Công Nghiệp Thành phố Hồ Chí Minh
  • Thị Mỹ Duyên Nguyễn Trường Đại học Công nghiệp Thành phố Hồ Chí Minhng Đại học Công nghiệp Thành phố Hồ Chí Minh
  • Phương Nhật Hào Nguyễn Trường Đại học Công nghiệp Thành phố Hồ Chí Minh
  • Quốc Thiên Nguyễn Trường Đại học Công nghiệp Thành phố Hồ Chí Minh

Từ khóa:

cào tin web, gợi ý tin tức, huấn luyện lại tự động, mlops tinh gọn, phobert

Tóm tắt

Bài báo trình bày việc thiết kế và triển khai một khung làm việc (framework) MLOps tinh gọn (Lightweight MLOps) được tối ưu hóa cho hệ thống gợi ý tin tức tự động. Nghiên cứu này đề xuất một giải pháp cho phép các tổ chức nhỏ triển khai hệ thống AI tự động hóa mà không cần hạ tầng Cloud đắt đỏ. Framework giải quyết các thách thức về sự lỗi thời của mô hình bằng cách tích hợp module cào tin WISE dựa trên quy tắc và phân tích cú pháp DOM với kiến trúc lưu trữ tinh gọn sử dụng SQLite. Hệ thống sử dụng PhoBERT để nhúng ngữ nghĩa và thuật toán hiệu chỉnh kép nhằm tăng cường tính đa dạng của gợi ý. Để đảm bảo hiệu suất liên tục, chúng tôi triển khai chiến lược giám sát trôi dạt dữ liệu tự động thông qua độ đo KL Divergence và kích hoạt quy trình huấn luyện lại bằng trình lập lịch nội bộ. Kết quả thực nghiệm thông qua phương pháp kiểm thử ngược thời gian (Time-split Backtesting) trên tập dữ liệu hơn 5.000 bài báo cho thấy hệ thống đạt độ trễ suy luận dưới 50ms và duy trì độ chính xác ổn định.

Đã Xuất bản

22-05-2026

Số

Chuyên mục

Hệ thống thông tin (Information System)