Όλα τα επιστημονικά άρθρα για τον κορωνοϊό σε μία βάση δεδομένων



Με πρωτοβουλία ερευνητών του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης και του Πανεπιστημίου Duke των ΗΠΑ  δημιουργήθηκε ο γράφος βιβλιογραφικών αναφορών, μία βάση δεδομένων με επιστημονικά άρθρα από όλον τον κόσμο, σχετικά με τη μελέτη του COVID-19. 


Η πρωτοτυπία αυτής της βάσης έγκειται στο ότι τα άρθρα δεν απαριθμούνται μεμονωμένα, αλλά συνδέονται άμεσα με το σύνολο των παραπομπών και των αναφορών τους.  

Περισσότερα από 100.000 άρθρα -από τα οποία πάνω από χίλια έχουν δημοσιευθεί από τον Ιανουάριο του 2020 μέχρι σήμερα- και περίπου 1.000.000 σύνδεσμοι περιέχονται στον γράφο. Σύμφωνα με τους ερευνητές, ο αριθμός συνδέσεων ανά κόμβο είναι πολύ υψηλότερος από ό,τι συνήθως παρατηρείται σε άλλους γράφους αναφορών.

Τα βιβλιογραφικά δεδομένα είναι διαθέσιμα στους ακόλουθους συνδέσμους:





Στον πρώτο σύνδεσμο προστίθενται καθημερινά νέα άρθρα, ενώ τα διαγράμματα ενημερώνονται εβδομαδιαία. Στους άλλους δύο συνδέσμους αποθηκεύονται τα βιβλιογραφικά δεδομένα, τα οποία ενημερώνονται σε εβδομαδιαία βάση.

Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι αναλύσεις που βασίζονται στον γράφο βιβλιογραφικών αναφορών, όπως  κατανομές και λίστες άρθρων με βάση τον αριθμό των ετεροαναφορών, καθώς και η οπτικοποιημένη απεικόνιση των άρθρων, μέσα από τη δημιουργία μίας «σφαίρας μελέτης».

Η «σφαίρα μελέτης» βασίζεται στην τεχνική αναπαράστασης στοχαστικού γράφου (stochastic graph embedding), η οποία παρουσιάζεται σε πρόσφατα δημοσιευμένο έργο των ερευνητών (http://t-sne-pi.cs.duke.edu). Οι ομαδοποιήσεις στη «σφαίρα» απεικονίζουν ισχυρές διασυνδέσεις μεταξύ των ερευνητικών δραστηριοτήτων γειτονικών άρθρων. Όπως σημειώνει ο Αν. Καθηγητής και Διευθυντής του Εργαστηρίου Αρχιτεκτονικής Υπολογιστικών Συστημάτων του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του ΑΠΘ, Νίκος Πιτσιάνης, «δύο άρθρα, δηλαδή δύο σημεία της “σφαίρας” απεικονίζονται σε αυτή σε κοντινή απόσταση, εάν οι αναφορές τους ή οι  αναφορές τρίτων άρθρων προς αυτά είναι αριθμητικά πολλές».

Στον πρώτο σύνδεσμο (https://lg-covid-19-hotp.cs.duke.edu) παρέχεται επιπρόσθετα μία διαδραστική έκδοση της «σφαίρας», που επιτρέπει στον χρήστη να βλέπει, να εντοπίζει και να εξερευνά τα άρθρα, σύμφωνα με τα ενδιαφέροντα και την τεχνογνωσία του. Έτσι ο χρήστης δεν περιορίζεται στους καταλόγους άρθρων που προσφέρει μια συμβατική μηχανή αναζήτησης.

Επόμενος στόχος των ερευνητών είναι η εκτεταμένη ανάλυση των δεδομένων με σκοπό την ανίχνευση κοινοτήτων και την ταξινόμηση των άρθρων σε θεματικές ενότητες, προκειμένου να διευκολυνθεί περαιτέρω η συνεχιζόμενη μελέτη του COVID-19.

Σχόλια