Μεθοδολογία

Ο Δείκτης Ανοικτών Δεδομένων συλλέγει και παρουσιάζει πληροφορίες σχετικά με την τρέχουσα κατάσταση των ανοικτών δεδομένων σε διάφορες περιοχές. Ο δείκτης διοργανώνεται από το Ίδρυμα Ανοικτής Γνώσης (Open Knowledge International) με τη βοήθεια του δικτύου του σε όλο τον κόσμο. Η απογραφή των ανοικτών δεδομένων πραγματοποιείται από το 2013. Για την διαδικασία συλλογής και ελέγχου των συνόλων δεδομένων για το 2021 θα πραγματοποιημθούν ημερίδες για το έργο “Non-profits & Media advocating for good!” από το Ίδρυμα Ανοικτής Γνώσης Ελλάδας σε συνεργασία με το HIGGS, το τμήμα Δημοσιογραφίας και ΜΜΕ του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης και την ΑΜΚΕ Πρωτοβουλία για τη Δημοσιογραφία, οι οποίες θα υλοποιηθούν στο πλαίσιο του προγράμματος Active citizens fund και θα είναι ανοικτές για όλους τους ενδιαφερόμενους. Στην απογραφή θα παρακολουθήσουμε την πρόοδο κάποιων δήμων της Ελλάδας σχετικά με τη δημόσια διάθεση και την ποιότητα των δεδομένων, κυρίως για τα δεδομένα που αντιπροσωπεύουν τις προτιμήσεις των πολιτών (περισσότερες λεπτομέρειες, δείτε την ενότητα των συνόλων δεδομένων παρακάτω).

Ο Δείκτης Ανοικτών Δεδομένων αποτελεί ένα εργαλείο το οποίο παίζει σημαντικό ρόλο στην ανοικτότητα των δεδομένων και το οποίο μπορεί να χρησιμοποιηθεί ως εργαλείο συγκριτικής αξιολόγησης των ανοικτών δεδομένων. Εάν, για παράδειγμα, μια δημόσια υπηρεσία δημοσιεύει ένα ανοικτό σύνολο δεδομένων, αλλά αυτό δεν είναι προσβάσιμο στο κοινό και δεν μπορεί να βρεθεί μέσω μιας απλής αναζήτησης, τότε τα δεδομένα δεν θεωρούνται ανοικτά. Το κράτος και οι επαγγελματίες ανοικτών δεδομένων μπορούν να εξετάσουν τα αποτελέσματα του δείκτη για να δουν πόσο προσιτά είναι τα ανοικτά δεδομένα στους πολίτες και παράλληλα να παρακολουθείται η πρόοδός τους κάθε χρόνο. Επίσης μπορούν να προτείνουν, όπου κρίνεται απαραίτητο, βελτιώσεις για να γίνουν τα δεδομένα πραγματικά ανοικτά και χρήσιμα.

Το ερευνητικό ερώτημα

Όπως κάθε εργαλείο αξιολόγησης, ο Δείκτης Ανοικτών Δεδομένων προσπαθεί να απαντήσει στο εξής ερώτημα:

«Ποια είναι η κατάσταση των ανοικτών δεδομένων στην Ελλάδα;»

Από αυτήν την ερώτηση, προκύπτουν και άλλα σημαντικά ερωτήματα, όπως:

Τα ανοικτά δεδομένα βασίζονται σε δύο βασικές πτυχές: τη νομική και την τεχνική. Ποια από αυτές τις δύο — και ποιες απαιτήσεις π.χ. ανοικτή άδεια χρήσης, μηχαναγνωσιμότητα, μαζική πρόσβαση/λήψη — είναι πιο σημαντική για τους παρόχους δεδομένων; Για παράδειγμα, μια δημόσια υπηρεσία μπορεί να θεωρεί εύκολη τη δημοσίευση μηχαναγνώσιμων δεδομένων και να δυσκολεύεται να εφαρμόσει μια ανοικτή άδεια.

Σύμφωνα με το κοινό πλαίσιο αξιολόγησης ανοικτών δεδομένων υπάρχουν τέσσερις διαφορετικοί τρόποι για την αξιολόγηση της ανοικτότητας των δεδομένων - το γενικό πλαίσιο, τα δεδομένα, η χρήση και ο αντίκτυπος. Ο Δείκτης Ανοικτών Δεδομένων περιορίζεται στην αξιολόγηση που αφορά την δημοσίευση δημόσιων συνόλων δεδομένων. Δεν εξετάζει το ευρύτερο πλαίσιο - για παράδειγμα το νομικό ή το πολιτικό πλαίσιο και επίσης δεν επιδιώκει να αξιολογήσει τη χρήση ή τον αντίκτυπο με συστηματικό τρόπο.

Επιπλέον, ο δείκτης επιδιώκει επίσης να συλλέξει πληροφορίες σχετικά με την διαφάνεια, δηλαδή την εύρεση δεδομένων και τη χρηστικότητά τους. Αυτές οι ερωτήσεις δεν έχουν βαθμολογούνται αυτήν τη στιγμή, αλλά αυτές οι πληροφορίες θα παρέχουν πολύτιμες πληροφορίες τόσο για τις κυβερνήσεις όσο και για τους χρήστες. Οι ερωτήσεις του δείκτη δεν βαθμολογούν την ποιότητα των δεδομένων. Ωστόσο, γνωρίζουμε ότι η ποιότητα των δεδομένων αποτελεί βασικό μέλημα της ανοικτής κοινότητας δεδομένων και αποτελεί σημαντικό εμπόδιο στην επαναχρησιμοποίησή τους.

Ερευνητικές παραδοχές

Παρακάτω ακολουθούν οι βασικές παραδοχές μας που λάβαμε υπόψη κατά τη συλλογή και την αξιολόγηση των δεδομένων.

Παραδοχή 1: Τα ανοιχτά δεδομένα ορίζονται από τον Ορισμό Ανοικτής Γνώσης (Open Definition), ο οποίος αποτελείται από ένα σύνολο αρχών σχετικά με τον τρόπο με τον οποίο θα πρέπει να δημοσιεύονται τα δεδομένα και το περιεχόμενό τους. Είναι ο χρυσός κανόνας για τα ανοικτά δεδομένα και είναι επίσης απλός και εύκολος. Επιπλέον, στον δείκτη παίζει ρόλο αν τα δεδομένα είναι σε μηχαναγνώσιμη μορφή, των οποίων ο πηγαίος κώδικας θα μπορεί να είναι κλειστός αλλά θα πρέπει να περιλαμβάνουν ανοικτή άδεια χρήσης για την επαναχρησιμοποίησή τους, γι αυτό και η αντίστοιχη ερώτηση βαθμολογείται.

Παραδοχή 2: Στο παρελθόν, υπήρξαν ερωτήσεις στην κοινότητα των ανοικτών δεδομένων σχετικά με το ρόλο της κυβέρνησης στην δημοσίευση ενός συνόλου δεδομένων. Σε πολλούς τομείς, ορισμένες από τις κρατικές υπηρεσίες ιδιωτικοποιούνται, πράγμα που σημαίνει ότι τα δεδομένα ανήκουν και παράγονται από μια εταιρεία και όχι από το κράτος. Η άποψή μας και η παραδοχή μας είναι ότι για τα βασικά σύνολα δεδομένων που ερευνούμε, η κυβέρνηση έχει την ευθύνη να διασφαλίσει τη διαθεσιμότητα αυτών των δεδομένων, ακόμη και αν διατηρούνται και διαχειρίζονται από τρίτους.

Παραδοχή 3: Οι χώρες έχουν διαφορετικές δομές διακυβέρνησης. Ορισμένες έχουν μια κύρια κυβέρνηση με δήμους, ενώ άλλες έχουν πολύ πιο περίπλοκες δομές. Η έρευνα πραγματοποιείται σε περιοχές/ δήμους αλλά τα αποτελέσματα αντιπροσωπεύουν το επίπεδο της χώρας στο ζήτημα των ανοικτών δεδομένων.

Κατηγορίες συνόλων δεδομένων

Ετήσιος προϋπολογισμός: Προϋπολογισμός σε υψηλό επίπεδο ανάλυσης (π.χ. έξοδα ανά τομέα, παράρτημα κλπ.). Αυτή η κατηγορία εξετάζει τους προϋπολογισμούς, δηλαδή τις προγραμματισμένες δαπάνες για το επόμενο έτος και όχι τις πραγματικές δαπάνες. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν:

Αναλυτικές δαπάνες: Λεπτομερής καταγραφή των πραγματικών δημοτικών δαπανών του παρελθόντος σε επίπεδο συναλλαγών, όπως για παράδειγμα των εξόδων που πραγματοποιούνται από μήνα σε μήνα σε συγκεκριμένα αντικείμενα (το οποίο συνήθως σημαίνει ξεχωριστές καταγραφές των ποσών που ξοδεύονται με λεπτομερή ανάλυση - π.χ. 5-50.000 αντί για 1.000.000+ €). Σημείωση: ένα σύνολο δεδομένων συμφωνιών και συμβάσεων ή κάτι αντίστοιχο το οποίο υπογράφεται δεν θεωρείται επαρκές. Αυτή η κατηγορία αναφέρεται στη λεπτομερή και συνεχή ροή δεδομένων σχετικά με τις πραγματικές δαπάνες. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν:

Αποτελέσματα εκλογών: Αποτελέσματα ανά εκλογική περιφέρεια όλων των βασικών υποψηφίων στις εκλογές της τοπικής αυτοδιοίκησης. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν στο επίπεδο του εκλογικού τμήματος:

Χάρτες Πόλεων: Γεωγραφικοί χάρτες της χώρας που να περιλαμβάνουν τις εθνικές οδούς κυκλοφορίας, θάλλασσες, λίμνες, βουνά κτλ. Οι χάρτες πρέπει να παρέχονται σε κλίμακα τουλάχιστον 1:250.000 (1 cm = 2.5km). Επομένως, τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν τουλάχιστον κάποιο από τα παρακάτω:

Δεδομένα Μεταφορών: Πληροφόρηση σε πραγματικό χρόνο σχετικά με βασικές υπηρεσίες μέσων μεταφοράς που παρέχονται από δημοτικούς ή άλλους φορείς (λεωφορεία, μετρό, τρένα, τραμ κλπ.). Οι πληροφορίες πραγματικού χρόνου αναφέρονται στο πού βρίσκεται η κάθε οντότητα (το κάθε λεωφορείο, το κάθε τρένο αντίστοιχα κλπ.). Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν τουλάχιστον κάποιο από τα παρακάτω:

Δεδομένα Εγκληματικότητας: Στατιστικά δεδομένα που αφορούν στον δείκτη εγκληματικότητας κάθε δήμου, κατά προτίμηση σε ένα επίπεδο λογικά διαχωρισμένο. Το καλύτερο θα ήταν να υπάρχουν ανά συγκεκριμένη ημερομηνία, τοποθεσία και είδος εγκλήματος, ωστόσο ανά ημέρα, οδό ή ταχυδρομικό κώδικα θα ήταν επίσης αποδεκτό.Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν τουλάχιστον κάποιο από τα παρακάτω:

Τροχαία Ατυχήματα: Στατιστικά στοιχεία τροχαίων ατυχημάτων συμπεριλαμβανομένης της ώρας και της τοποθεσίας. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν τουλάχιστον κάποιο από τα παρακάτω:

Αιτήματα Πολιτών: Αιτήματα του κοινού προς τις δημοτικές αρχές, όπως για παράδειγμα η αναφορά ύπαρξης κοιλωμάτων στην επιφάνεια των δρόμων ή πεζοδρομίων, γκράφιτι κτλ. Τα δεδομένα που θα πρέπει να υπάρχουν αναλυτικά (ανά αίτημα) είναι:

Πίνακες Δρομολογίων: Πίνακες (ή προγράμματα) δρομολογίων των μέσων μεταφοράς που παρέχονται από δημοτικούς ή άλλους φορείς (λεωφορεία, μετρό, τρένα, τραμ κλπ.). Η τοποθεσία των στάσεων θα ήταν επιθυμητή (σαν γεωγραφικό δεδομένο), ωστόσο δεν απαιτείται ώστε να δοθεί καταφατική απάντηση σε αυτή την ερώτηση. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν τουλάχιστον κάποιο από τα παρακάτω:

Ποιότητα αέρα: Δεδομένα σχετικά με την ποιότητα της ατμόσφαιρας (π.χ. τα επίπεδα των βασικών ρυπαντικών ουσιών) σε λεπτομερή ανάλυση - που καταγράφεται τουλάχιστον ανά μήνα (ή προτιμότερα ανά μέρα). Ο γεωγραφικός διαχωρισμός θα ήταν επιθυμητός, ωστόσο, δεν απαιτείται. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν:

Συμβάσεις- Αναθέσεις: Πληροφορίες σχετικά με τις δημόσιες συμβάσεις. Η παρακολούθηση των δημόσιων συμβάσεων προσφορών μπορεί να βοηθήσει νέες ομάδες να συμμετάσχουν σε προσφορές. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν:

Ποιότητα νερού: Τα δεδομένα σχετικά με την ποιότητα του νερού είναι απαραίτητα τόσο για την παροχή υπηρεσιών όσο και για την πρόληψη ασθενειών. Τα δεδομένα αυτής της κατηγορίας θα πρέπει να περιλαμβάνουν τουλάχιστον κάποιο από τα παρακάτω:

Περιοχές

Οι περιοχές που περιλαμβάνονται στην έρευνα του Δείκτη Ανοικτών Δεδομένων είναι οι εξής:

Βαθμολογία

Κάθε σύνολο δεδομένων για κάθε περιοχή αξιολογείται χρησιμοποιώντας ένα σύνολο ερωτήσεων που εξετάζουν τις βασικές πτυχές της ανοικτότητας των συνόλων δεδομένων που βασίζονται στον Ορισμό Ανοικτής Γνώσης (Open Definition).

Κάθε ερώτημα της έρευνάς μας μετρά ένα κρίσιμο χαρακτηριστικό του νομικού, του τεχνικού και του πρακτικού «ανοίγματος των δεδομένων». Η σημαντικότητα των ερωτήσεων αντικατοπτρίζεται βαθμολογώντας σταθμισμένα τις ερωτήσεις, δηλαδή κάποιες ερωτήσεις θα έχουν υψηλότερη βαρύτητα στο τελικό αποτέλεσμα ενώ υπάρχουν και κάποιες οι οποίες δεν είναι απαραίτητο να βαθμολογηθούν.

Η βαθμολογία δίνει συνολικά 40 πόντους για ανοικτές άδειες και για μηχαναγνώσιμες μορφές δεδομένων. Αυτές οι δύο πτυχές είναι ο πυρήνας της ανοικτότητας του Ορισμού Ανοικτής Γνώσης (Open Definition) και ο δείκτης δίνει ιδιαίτερη βαρύτητα σε αυτες. Ωστόσο, άλλες πτυχές όπως η έγκαιρη δημοσίευση, η διαθεσιμότητα δεδομένων και η προσβασιμότητα είναι εξίσου σημαντικές για τα ανοικτά δεδομένα. Οι ερωτήσεις σχετικά με την προσβασιμότητα των δεδομένων λαμβάνουν συνολικά 60 πόντους.

Ερωτήσεις & Βαθμολογία

Ενότητα Α: Υπόβαθρο Συμμετεχόντων (Δεν βαθμολογείται)

Ενότητα Β: Σχετικά με τα δεδομένα (Βαθμολογείται)

Ερώτηση Περιγραφή Βαθμολογία
Είναι τα δεδομένα διαθέσιμα στο διαδίκτυο χωρίς την ανάγκη εγγραφής ή αίτησης πρόσβασης; Απαντήστε "Ναι", εάν τα δεδομένα διατίθενται από την κυβέρνηση ανοικτά. Απαντήστε "Όχι" εάν τα δεδομένα ΔΕΝ είναι διαθέσιμα διαδικτυακά ή είναι διαθέσιμα ΜΟΝΟ μετά την εγγραφή, ή ζητώντας τα από την υπηρεσία μέσω email ή άλλης παρόμοιας διαδικασίας. 15
Είναι δωρεάν διαθέσιμα τα δεδομένα; Τα δεδομένα είναι δωρεάν εάν δεν χρειάζεται να πληρώσετε. 15
Είναι δυνατή η μαζική λήψη του συνόλου δεδομένων (available in bulk); Απαντήστε "Ναι", εάν μπορείτε να κατεβάσετε όλα τα δεδομένα από τη διεύθυνση URL στην οποία τα βρήκατε. Απαντήστε "Όχι" εάν πρέπει να κάνετε πολλά χειροκίνητα βήματα για τη λήψη των δεδομένων ή εάν πρέπει να τα ανακτήσετε τμηματικά. 15
Είναι ενημερωμένα τα δεδομένα; Επιλέξτε "ναι" εάν τα δεδομένα συμβαδίζουν με το έτος ή το χρονικό διάστημα που αντιπροσωπεύουν. Απαντήστε "Όχι" εάν δεν μπορείτε να προσδιορίσετε μια ημερομηνία ή εάν τα δεδομένα δεν έχουν ενημερωθεί. 15
Τα δεδομένα έχουν ανοιχτή άδεια χρήσης/κοινού κτήματος(public domain); Απαντήστε επίσης "Ναι" εάν υπάρχει ανοιχτή άδεια ή η ένδειξη κοινού κτήματος (public domain), η οποία επιτρέπει την επαναχρησιμοποίηση, την τροποποίηση και την αναδιανομή τους. 20
Σε ποιες μορφές αρχείων είναι τα δεδομένα διαθέσιμα; Θεωρούμε ότι τα αρχεία είναι «ανοιχτά» εάν μπορούν να υποβληθούν σε πλήρη επεξεργασία με τουλάχιστον ένα δωρεάν λογισμικό και λογισμικό ανοιχτού κώδικα. Ο πηγαίος κώδικας αυτής της μορφής δεν χρειάζεται να είναι ανοιχτός. 20

Δειγματοληψία

Στον Δείκτη Ανοικτών Δεδομένων χρησιμοποιείται η δειγματοληψία χιονοστοιβάδας (“snowball sample”). Ένα δείγμα χιονοστιβάδας είναι ένα δείγμα στο οποίο ο ερευνητής συλλέγει δεδομένα από λίγα άτομα του πληθυσμού που μπορεί να εντοπίσει και στη συνέχεια ζητά από αυτά τα άτομα να βοηθήσουν στον εντοπισμό άλλων ατόμων αυτού του πληθυσμού, για να μεγαλώσει το μέγεθος του δείγματος. Η μέθοδος αυτή είναι κατάλληλη για να εντοπίσει υποψήφιους συμμετέχοντες σε περιοχές που είναι δύσκολο να εντοπιστούν. Στην περίπτωσή μας οι συμμετέχοντες για να μπορέσουν να συνεισφέρουν θα πρέπει μέχρι ένα σημείο να ενδιαφέρονται για ζητήματα δεδομένων ανοικτής διακυβέρνησης και να είναι σε θέση να αναζητήσουν την διαθεσιμότητα και την ποιότητα των ανοικτών δεδομένων.