MÔ HÌNH HỌC MÁY DỰ ĐOÁN TÌNH TRẠNG TỐT NGHIỆP CỦA SINH VIÊN NGÀNH HỆ THỐNG THÔNG TIN
Tóm tắt
Nghiên cứu này tập trung ứng dụng các mô hình học máy để dự đoán khả năng sinh viên ngành Hệ thống Thông tin tốt nghiệp đúng hạn. Sử dụng dữ liệu học tập thực tế của 626 sinh viên từ khóa 10 đến khóa 15 tại Trường Đại học Công nghiệp TP.HCM, chúng tôi triển khai và so sánh bảy mô hình học máy, bao gồm Logistic Regression, K-Nearest Neighbors, Decision Tree, Random Forest, Support Vector Machine, XGBoost và CatBoost. Kết quả thực nghiệm cho thấy Random Forest đạt độ chính xác cao nhất (87%) trong việc phân loại tình trạng tốt nghiệp của sinh viên, tiếp theo là XGBoost và CatBoost (cùng khoảng 83%). Các yếu tố quan trọng ảnh hưởng đến dự đoán bao gồm điểm của các học phần và việc hoàn thành chứng chỉ ngoại ngữ (TOEIC). Dựa trên những phát hiện này, nghiên cứu đề xuất các biện pháp hỗ trợ và can thiệp sớm cho sinh viên có nguy cơ tốt nghiệp muộn. Ngoài ra, việc áp dụng kỹ thuật tăng cường dữ liệu và phương pháp diễn giải mô hình (LIME) góp phần nâng cao độ tin cậy của kết quả dự báo và cung cấp thông tin minh bạch cho công tác cố vấn học tập.