- MSc thesis
- Βιοπληροφορική και Νευροπληροφορική (ΒΝΠ)
- 07 Μαρτίου 2026
- Αγγλικά
- 81
- Βραχάτης, Αριστείδης
- Γεώργιος Δημητρακόπουλος | Θεμιστοκλής Έξαρχος | Αριστείδης Βραχάτης
- NSCLC | Radiomics | CT | TotalSegmentator | Machine Learning | Explainable Ai (XAI)
- ΒΙΟΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΝΕΥΡΟΠΛΗΡΟΦΟΡΙΚΗ/ ΒΝΠΔΕ
- 1
- 85
- Tables, Figures
-
-
Objectives:
Lung cancer remains one of the leading causes of cancer-related mortality worldwide, with non-small cell lung cancer (NSCLC) accounting for approximately 85% of cases. However, early and accurate diagnosis remains a major challenge. This study aims to develop and evaluate an explainable radiomics-based pipeline for discriminating NSCLC subtypes and differentiating NSCLC from small cell lung cancer (SCLC) using chest computed tomography (CT) images.Methods:
This retrospective multicenter study included approximately 1,000 patients with thoracic CT scans from six independent datasets. Regions of interest were automatically segmented using TotalSegmentator. For each patient, 1,100 radiomic features were extracted using the PyRadiomics toolkit. Six feature selection methods and nine classification algorithms were evaluated. Model training and selection were performed using 3-fold cross-validation on 90% of the data, while a fully independent 10% hold-out set was used for external validation. Performance was assessed using accuracy and F1-score. Explainability analyses, including SHAP and LIME, were conducted to identify the most influential features and evaluate model robustness across datasets.Results:
The optimal configuration combined recursive feature elimination with support vector machines and a Light Gradient Boosting Machine classifier, using 50 selected features. Cross-validation yielded an accuracy of 0.845 and an F1-score of 0.746. On the independent hold-out set, the model achieved an accuracy of 0.717 and an F1-score of 0.684. The most discriminative features were derived from wavelet-transformed and texture-based descriptors.Conclusions:
CT-based radiomics combined with explainable machine learning enables reliable and generalizable discrimination of lung cancer subtypes and differentiation of NSCLC. Further validation on larger cohorts is required to ensure robustness and support clinical integration. -
Στόχοι:
Ο καρκίνος του πνεύμονα αποτελεί μία από τις κυριότερες αιτίες θνησιμότητας παγκοσμίως, με τον μη μικροκυτταρικό καρκίνο του πνεύμονα (NSCLC) να αντιπροσωπεύει περίπου το 85% των περιπτώσεων. Ωστόσο, η έγκαιρη και ακριβής διάγνωση παραμένει σημαντική κλινική πρόκληση. Σκοπός της παρούσας μελέτης είναι η ανάπτυξη και αξιολόγηση ενός μοντέλου μηχανικής μάθησης, βασισμένου σε ραδιομικά χαρακτηριστικά, για τη διάκριση των υποτύπων του NSCLC και τη διαφοροποίησή του από τον μικροκυτταρικό καρκίνο του πνεύμονα (SCLC), με χρήση εικόνων αξονικής τομογραφίας θώρακος (CT).Μέθοδοι:
Η μελέτη περιλαμβάνει περίπου 1.000 ασθενείς με αξονικές τομογραφίες θώρακος από έξι ανεξάρτητα σύνολα δεδομένων. Οι περιοχές ενδιαφέροντος (ROIs) τμηματοποιήθηκαν αυτόματα με το εργαλείο TotalSegmentator. Από κάθε ασθενή εξήχθησαν περίπου 1.100 ραδιομικά χαρακτηριστικά με τη χρήση του PyRadiomics. Συνολικά, αξιολογήθηκαν έξι μέθοδοι επιλογής χαρακτηριστικών και εννέα αλγόριθμοι ταξινόμησης. Η εκπαίδευση των μοντέλων πραγματοποιήθηκε με 3-fold επικύρωση στο 90% των δεδομένων, ενώ το υπόλοιπο 10% χρησιμοποιήθηκε ως ανεξάρτητο σύνολο ελέγχου. Η απόδοση των μοντέλων αξιολογήθηκε με δείκτες accuracy και F1-score. Παράλληλα, εφαρμόστηκαν μέθοδοι ερμηνευσιμότητας (SHAP, LIME) για την ανάδειξη των σημαντικότερων χαρακτηριστικών και την αξιολόγηση της σταθερότητας του μοντέλου μεταξύ διαφορετικών συνόλων δεδομένων.Αποτελέσματα:
Η βέλτιστη απόδοση επιτεύχθηκε με συνδυασμό της μεθόδου Recursive Feature Elimination με Support Vector Machines (SVM-RFE) για την επιλογή χαρακτηριστικών και του ταξινομητή Light Gradient Boosting Machine (LightGBM), χρησιμοποιώντας 50 επιλεγμένα χαρακτηριστικά. Κατά την επικύρωση, το μοντέλο πέτυχε accuracy 0,845 και F1-score 0,746. Στο ανεξάρτητο σύνολο ελέγχου, οι αντίστοιχες τιμές ήταν 0,717 και 0,684. Τα σημαντικότερα χαρακτηριστικά προήλθαν κυρίως από wavelet μετασχηματισμούς και χαρακτηριστικά υφής.Συμπεράσματα:
Η αξιοποίηση ραδιομικών χαρακτηριστικών από αξονικές τομογραφίες σε συνδυασμό με μεθόδους μηχανικής μάθησης μπορεί να υποστηρίξει τη διάκριση των υποτύπων καρκίνου του πνεύμονα και τη διαφοροποίηση του NSCLC από τον SCLC. Ωστόσο, απαιτείται περαιτέρω αξιολόγηση σε μεγαλύτερα και ανεξάρτητα σύνολα δεδομένων, προκειμένου να επιβεβαιωθεί η σταθερότητα και η δυνατότητα κλινικής εφαρμογής του προτεινόμενου μοντέλου.
-
- Hellenic Open University
- Attribution-NoDerivatives 4.0 Διεθνές
Development of an explainable pipeline for NSCLC detection based on machine learning derived radiomics and CT scans
Ανάπτυξη μοντέλου μηχανικής μάθησης για την ανίχνευση του μη μικροκυτταρικού καρκίνου του πνεύμονα (NSCLC) μέσω αξιοποίησης ραδιομικών χαρακτηριστικών από αξονικές τομογραφίες. (Ελληνική)
Κύρια Αρχεία Διατριβής
Development of an explainable pipeline for NSCLC detection based on machine learning derived radiomics and CT scans.
Περιγραφή: Development of an explainable pipeline for NSCLC detection.pdf (pdf) Book Reader
Μέγεθος: 2.2 MB

