Ứng dụng mô hình học sâu LSTM và GNN trong phân loại văn bản công thức nấu ăn

Các tác giả

  • Sơn Phạm Trung Trường đại học Công Nghiệp TP.HCM

Từ khóa:

Mạng Nơ-ron Đồ Thị, LSTM, phân loại công thức, xử lý ngôn ngữ tự nhiên

Tóm tắt

Bài báo này nghiên cứu việc ứng dụng mô hình LSTM (Long Short-Term Memory) và GNN (Graph Neural Networks) trong phân loại nhị phân dữ liệu văn bản công thức nấu ăn, phân biệt giữa công thức chay và không chay. Dữ liệu sử dụng bao gồm 105,000 công thức từ RecipeNLG và Allrecipes. Hiệu suất mô hình được đánh giá qua độ chính xác, độ chính xác phân lớp (precision), độ nhạy (recall) và F1-score. Mô hình LSTM đạt độ chính xác 85,2%, vượt trội hơn so với GNN (82,7%), nhờ vào khả năng xử lý dữ liệu tuần tự. GNN sử dụng cấu trúc đồ thị dựa trên nguyên liệu, tuy có tiềm năng nhưng bị giới hạn do đặc trưng đầu vào đơn giản. Hướng nghiên cứu tương lai
gồm tích hợp nhúng BERT và mở rộng sang dữ liệu đa ngôn ngữ. Công trình này đóng góp vào lĩnh vực phân loại văn bản trong ứng dụng ẩm thực.

Đã Xuất bản

29-05-2025

Số

Chuyên mục

Khoa học máy tính và Khoa học dữ liệu (Computer & Data Science)