This bachelor thesis concerns the exploration, design, developement and
review of efficient parallel data clustering algorithms, implemented on High-level
performance cluster environment, with the scope of text retrieval and document clustering.
The main objective of this thesis, is a thorough investigation of the literature, the choice of
the most appropriate algorithms for cluster computing environments, the efficient
implementation of the chosen algorithms, and the detailed analysis of the results in a real
parallel environment, in order to achieve satisfactory performance measures (response time,
speed-ups, etc.)
Η πτυχιακή εργασία αφορά στη διερεύνηση, σχεδιασμό, ανάπτυξη και
αξιολόγηση αποδοτικών παράλληλων αλγορίθμων ομαδοποίησης δεδομένων (data
clustering) σε περιβάλλον πολλαπλών επεξεργαστών κατανεμημένης μνήμης (distributed
memory parallel environment), με πεδίο εφαρμογής την ανάκτηση κειμένων (text retrieval /
document clustering). Βασικός στόχος της πτυχιακής εργασίας είναι η επισταμένη
διερεύνηση της σχετικής βιβλιογραφίας, η επιλογή των πλέον κατάλληλων αλγορίθμων για
περιβάλλοντα συστοιχίας υπολογιστών, η αποδοτική υλοποίηση των αλγορίθμων που θα
επιλεγούν (ή παραλλαγών αυτών) και η εκτενής ανάλυση των αποτελεσμάτων εκτέλεσης
των αλγορίθμων αυτών στο ανωτέρω πραγματικό παράλληλο περιβάλλον, με σκοπό την
επίτευξη ικανοποιητικών μέτρων απόδοσης (response times, speed-up κλπ).
Hellenic Open University
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.