Ο στόχος της διπλωματικής εργασίας είναι η ανάπτυξη ενός συστήματος συστάσεων το οποίο θα
κατασκευάσει μία αυτόματη λίστα αναπαραγωγής τραγουδιών στο πλαίσιο του ανοικτού (χωρίς
ορίζοντα τερματισμού) διαγωνισμού Spotify Million Playlist Dataset Challenge με σκοπό να
αντιληφθεί τις μουσικές προτιμήσεις του χρήστη και να προβλέψει μουσικά κομμάτια τα οποία
αυτός επιθυμεί. Αποτελεί μία συνέχεια του προγενέστερου διαγωνισμού RecSys Challenge 2018
από τον Ιανουάριο έως τον Ιούλιο του 2018. Αυτό επιτυγχάνεται ως εξής: Δίνεται ένας τίτλος μιας
λίστας τραγουδιών ή ένα αρχικό σύνολο τραγουδιών σε μία λίστα αναπαραγωγής και στη συνέχεια
το σύστημα προβλέπει τα επόμενα τραγούδια τα οποία υπάρχουν σε αυτή τη λίστα. Το Spotify
Million Playlist Dataset Challenge αποτελείται από ένα σετ δεδομένων (training set) από το οποίο
αντλούμε τα δεδομένα για τις μουσικές προτιμήσεις των χρηστών και ένα challenge set (test set)
το οποίο περιέχει λίστες αναπαραγωγής τραγουδιών οι οποίες περιέχουν ελλιπή δεδομένα. Αυτό
το σετ δεδομένων αποτελείται από 1.000.000 λίστες αναπαραγωγής οι οποίες δημιουργήθηκαν
από χρήστες της πλατφόρμας Spotify μεταξύ Ιανουαρίου 2010 και Οκτωβρίου 2017. Έχει ως
σκοπό να χρησιμοποιηθεί ερευνητικά σε συστήματα συστάσεων (recommender systems)
μουσικής. Οι εταιρείες οι οποίες χρησιμοποιούν τα συστήματα συστάσεων στοχεύουν στην
αύξηση των πωλήσεών τους ως αποτέλεσμα των εξατομικευμένων προσφορών και της
βελτιωμένης εμπειρίας πελατών που προσφέρουν. Οι συστάσεις διευκολύνουν την πρόσβαση
του χρήστη στο περιεχόμενο που τον ενδιαφέρει και του προτείνουν τα κατάλληλα προϊόντα
με βάση τις προτιμήσεις του. Η υλοποίηση του προγραμματιστικού μέρους της εργασίας έγινε σε
γλώσσα Python και δόθηκε έμφαση στη μοντελοποίηση του προβλήματος δημιουργίας λίστας
αναπαραγωγής με τη δημιουργία συστάσεων οι οποίες αξιοποιούν με τον καλύτερο τρόπο τα
διαθέσιμα δεδομένα. Το σύστημα αυτό χρησιμοποιεί μεθόδους μηχανικής μάθησης και
συγκεκριμένα τεχνικές εφαρμοσμένες στα συστήματα συστάσεων (recommender systems). Τα
δεδομένα τα οποία χρησιμοποιήθηκαν, συλλέχθηκαν από την ιστοσελίδα www.aicrowd.com και
αφορούν λίστες αναπαραγωγής τραγουδιών (playlists) οι οποίες δημιουργήθηκαν από χρήστες της
υπηρεσίας μουσικής Spotify.
The aim of this dissertation is to develop a recommendation system which will create an
automatic playlist of songs in the open (without a set date of completion) competition Spotify
Million Playlist Dataset Challenge, in order to understand the musical tastes of the user and to
predict music tracks which he desires. It is a continuation of the previous RecSys Challenge
2018 which lasted from January to July 2018. This is achieved as follows: A title of a playlist
or an initial set of songs is inserted in a playlist and then the system predicts the next songs in
this playlist. The Spotify Million Playlist Dataset Challenge consists of a training set from
which data is extracted regarding the users' musical preferences and a challenge set (test set)
which contains playlists of songs that contain incomplete data. This data set consists of
1,000,000 playlists created by users of the Spotify platform between January 2010 and October
2017. It is intended for research use in music recommender systems. The companies that use
the recommender systems aim to increase their sales by taking advantage of the personalized
offers and the improved customer experience they offer. The recommendations facilitate the
user's access to the content he is interested in and suggest the appropriate products based on
their preferences. The implementation of the programming part of the dissertation was done in
Python programming language and emphasis was placed on modeling the problem of creating
a playlist by creating recommendations that make the best use of the available data. This system
uses machine learning methods and in particular techniques applied to recommender systems.
The data used was collected from the website www.aicrowd.com and relates to playlists created
by users of the Spotify music service.
Items in Apothesis are protected by copyright, with all rights reserved, unless otherwise indicated.