RDFT-ProtoNet: Phân Loại Tổn Thương Da Ít Mẫu với Khai Thác Mẫu Khó và Tinh Chỉnh RDFT

Các tác giả

  • Sang Hoa Xuân Đại học công nghiệp TP.HCM

Từ khóa:

Episodic Fine-Tuning, Few-Shot Learning, Group Equivariant Convolution, Medical Imaging, Prototypical Networks, Skin Lesion Classification

Tóm tắt

Phân loại bệnh lý da từ ảnh y học là một bài toán thách thức trong bối cảnh học ít mẫu (few-shot learning) do sự đa dạng phức tạp của tổn thương. Mặc dù Mạng Prototypical (ProtoNet) là một phương pháp nền tảng phổ biến, khả năng tổng quát hóa của nó có thể được cải thiện. Trong nghiên cứu này, chúng tôi triển khai kiến trúc ProtoNet sử dụng backbone ResNet-50 tiêu chuẩn, được bổ sung một đầu chiếu (projection head) để nén đặc trưng xuống không gian 64 chiều và sử dụng tương đồng cosine (cosine logits) để phân loại. Để tăng cường tính tổng quát hóa, quá trình huấn luyện (meta-training) được thiết lập khó hơn so với đánh giá (5-lớp 5-mẫu) và áp dụng chiến lược khai thác tập khó (Hard-Episode Mining). Tại thời điểm đánh giá, chúng tôi áp dụng một chiến lược thích ứng nhanh có tên Rotational Division Fine-Tuning (RDFT), lấy cảm hứng từ các hướng tiếp cận meta-learning dựa trên tối ưu hóa. Thay vì sử dụng bộ mã hóa ở trạng thái cố định, RDFT thực hiện một vài bước tối ưu gradient nhanh, tinh chỉnh một bản sao của bộ mã hóa trên chính tập hỗ trợ của episode thử nghiệm. Quá trình thích ứng nhanh này cho phép mô hình tinh chỉnh các tham số để phù hợp với các đặc trưng cụ thể của tác vụ. Hiệu quả của phương pháp được đánh giá nghiêm ngặt trên bộ dữ liệu MILK10 các kịch bản 2-lớp với số lượng mẫu hỗ trợ đa dạng (1, 3 và 5-shot). Đặc biệt, đối với thiết lập 5-shot, chúng tôi sử dụng bộ các chỉ số AUG (bao gồm Balanced Accuracy, Macro F1, và Macro AUROC) để cung cấp một cái nhìn toàn diện về hiệu suất.

Đã Xuất bản

09-12-2025

Số

Chuyên mục

Khoa học máy tính và Khoa học dữ liệu (Computer & Data Science)