Πριν μερικούς μήνες ο οργανισμός Data For Democracy, σε συνεργασία με το Bloomberg και το BrightHive, ανακοίνωσε την πρωτοβουλία για την σκιαγράφηση ενός κώδικα δεοντολογίας για τους επιστήμονες δεδομένων (data scientists). Ο κώδικας φέρει τον τίτλο Community Principles on Ethical Data Sharing (CPEDS) και θα παρέχει ένα γενικό πλαίσιο για την υπεύθυνη χρήση και διαμοιρασμό δεδομένων σε μια προσπάθεια της κοινότητας να κερδίσει την εμπιστοσύνη της κοινωνίας.

Στόχος του κώδικα δεν είναι να δημιουργήσει συστηματικούς μηχανισμούς και κανονισμούς όσο ένα σύνολο γενικών κανόνων που θα ανταποκρίνεται σε διάφορα πεδία και φτιαγμένο έτσι ώστε οι επιστήμονες δεδομένων να λαμβάνουν πιο υπεύθυνες αποφάσεις και να γίνονται φορείς αλλαγής στα πλαίσια των κοινοτήτων τους.

Από την άλλη, το Bloomberg σε αντίστοιχη δημοσίευσή του κάνει λόγο για ένα κώδικα αντίστοιχο του όρκου του Ιπποκράτη για τους επιστήμονες δεδομένων, υπογραμμίζοντας την ανάγκη αντιμετώπισης δύο επίμαχων ζητημάτων: την προστασία προσωπικών δεδομένων και την αποφυγή προκαταλήψεων (bias).

Την ανάγκη δημιουργίας ενός ηθικού πλαισίου για τα δεδομένα τόνισε και ο διάσημος μαθηματικός DJ Patil. Όπως αναφέρει, ο καθένας μας παράγει τεράστιο όγκο δεδομένων που χρησιμοποιούνται στους τομείς της υγείας, τις δημόσιες υπηρεσίες και την ασφάλεια. Ωστόσο, δεν λείπουν οι περιπτώσεις με αρνητικό αντίκτυπο στην κοινωνία και στο άτομο όπως προγράμματα που διατηρούν παραδοσιακές διακρίσεις και στερεότυπα, παραβιάζουν τα δικαιώματα του ατόμου ή θέτουν σε κίνδυνο την ιδιωτικότητα. Ακριβώς γι’ αυτό πρέπει να διασφαλιστεί η ασφάλεια των δεδομένων προάγοντας μια κουλτούρα υπευθυνότητας όπου ο κάθε επιστήμονας θα είναι υπόλογος στον άλλον.

Η διαδικασία πραγματοποιείται ήδη με ανοιχτό διάλογο σε Slack, Twitter και Github αφού η πρωτοβουλία στοχεύει να ενεργοποιήσει το σύνολο της κοινότητας, από επιστήμονες δεδομένων για επιστήμονες δεδομένων. Η ομάδα ευελπιστεί να λάβει feedback από 100.000 επιστήμονες δεδομένων από όλον τον κόσμο και να έχει ένα προσχέδιο του κώδικα μέχρι τον Μάιο ή τον Ιούνιο του 2018. Πέρα από το κείμενο, θα δημιουργήσει μια πλατφόρμα με εργαλεία ώστε να δώσει τα κατάλληλα εφόδια στους επιστήμονες να εφαρμόσουν τις αρχές του κώδικα.

Όπως ανακοίνωσε το Data For Democracy, μέχρι στιγμής έχουν οριστεί πέντε σημεία στα οποία θα αναφέρεται ο κώδικας:

Τα δεδομένα: αφορά στην συλλογή, επεξεργασία και αποθήκευση δεδομένων καθώς και στην υιοθέτηση πρακτικών ώστε να περιορίζεται η αναπαραγωγή στερεοτύπων (intrinsic bias). Ερωτήσεις και προβλήματα: αναφέρεται στον εντοπισμό πραγματικών προβλημάτων και την εργασία για την εύρεση πραγματικών λύσεων σε συνεργασία με την κοινότητα και την κοινωνία. Αλγόριθμοι και μοντέλα: περιλαμβάνει την σε βάθος κατανόηση αλγορίθμων και μοντέλων ώστε να αποφεύγεται η προκατάληψη, ειδικά σε black box αλγορίθμους. Προϊόντα και εφαρμογές: προσοχή σε επιμέρους επιπτώσεις που μπορεί να έχουν τα αποτελέσματα μιας έρευνας ή η χρήση ενός εργαλείου από τρίτους, πρόβλεψη των κινδύνων κακόβουλης χρήσης Κοινότητα: αναφέρεται στην προώθηση ίσης συμμετοχής και αντιπροσώπευσης ατόμων από διαφορετικά περιβάλλοντα στην κοινότητα της επιστήμης δεδομένων καθώς και την εύρεση μηχανισμών ελέγχου

Στο ευρύτερο πνεύμα του κανονισμού προωθείται το αίσθημα υπευθυνότητας του επιστήμονα ως προς τα δεδομένα σε διάφορους άξονες και η επικοινωνία/επαφή με την κοινωνία. Ένας τρόπος να διασφαλιστεί είναι το κάθε σύνολο δεδομένων να περιλαμβάνει πληροφορίες για την ταυτότητα του, τον τρόπο συλλογής, περιγραφή του δείγματος, να αναφέρει τους περιορισμούς στα δεδομένα το ειδικό πλαίσιο της έρευνας και των αποτελεσμάτων της.

Επιμέρους ζητήματα που θίγουν οι μέχρι τώρα συζητήσεις περιλαμβάνουν θέματα όπως η αποφυγή μονοπωλίου στην αγορά δεδομένων, η πολυφωνία στις εργασίες με δεδομένα, η ενδελεχής εξέταση των ηθικών προεκτάσεων μιας απόφασης και η ενημέρωση/εκπαίδευση του κοινού με κάθε ευκαιρία. Τέλος, αναφέρεται η υποχρέωση του επιστήμονα δεδομένων να καταγγείλει την όποια κακή χρήση δεδομένων παρατηρήσει στο περιβάλλον του.

Ωστόσο, υπάρχουν φωνές που αναγνωρίζουν την δυσκολία του εγχειρήματος τόσο εξαιτίας της μεγάλης του κλίμακας όσο και της απουσίας ενιαίου στόχου της επιστήμης δεδομένων. Επίσης, μέχρι στιγμής δεν έχει γίνει σαφές αν ο κώδικας θα προβλέπει μηχανισμούς ελέγχου της εφαρμογής του, γεγονός που καταδεικνύει τον χαλαρό του χαρακτήρα.

Όπως αναφέρει το Data For Democracy, ακόμα κι αν ο κώδικας δεν εφαρμοστεί συλλογικά από την κοινότητα -αφού υπάρχουν τόσα διαφορετικά πεδία που είναι αδύνατο να καλυφθούν από ένα έγγραφο- τουλάχιστον θα έχει ξεκινήσει μία κουβέντα για την ηθική διάσταση της επιστήμης δεδομένων που μάλλον θα παραμείνει ζωντανή και θα απασχολήσει για πολύ καιρό ακόμα.

Αυτό που είναι ιδιαίτερα σημαντικό είναι οι επιστήμονες δεδομένων να συνομιλούν με άλλες ομάδες που ασχολούνται με κάποιο θέμα ενδιαφέροντος και να λαμβάνουν υπόψη τις πραγματικές ανάγκες των ανθρώπων που προσπαθούν να βοηθήσουν.

Εικόνα: Dan Mason, flickr, 2013