Το ευρετήριο
Πριν από μερικά χρόνια η Επιτροπή Ποντιακών Μελετών δημοσίευσε το "Ονομαστικόν ευρετήριον αγροτών προσφύγων" της Επιτροπής Αποκατάστασης Προσφύγων (ΕΑΠ).
Πρόκειται για ένα έγγραφο τον οποίο συνέταξε η ΕΑΠ και το Υπουργείο Γεωργίας το 1928 και περιέχει στοιχεία για όλους τους αρχηγούς οικογενειών, οι οποίοι ήρθαν πρόσφυγες από τον Εύξεινο Πόντο, τη Μικρά Ασία και την Ανατολική Θράκη με την ανταλλαγή των πληθυσμών και εγκαταστάθηκαν στην Ελλάδα μέχρι και τα τέλη της δεκαετίας του 20.
Αναλυτικότερα, το ευρετήριο περιλαμβάνει το ονοματεπώνυμο και τον τόπο καταγωγής του αρχηγού κάθε οικογένειας, καθώς και τον αριθμό της υπεύθυνης δήλωσης αγροτικής αποζημίωσης, ο οποίος παραπέμπει και στον Συνοικισμό όπου κατοικεί ο πρόσφυγας κατά τη στιγμή της δήλωσης, μέσω ενός ευρετηρίου γραφείων εποικισμού.
Το ευρετήριο έχει μεν ψηφιοποιηθεί, δεν έχει όμως καταχωριστεί.
Γιατί καταχώριση
Το ευρετήριο είναι, σε μεγάλο βαθμό, αλφαβητικά ταξινομημένο. Αυτό επιτρέπει σε κάποιον να αναζητήσει στοιχεία για κάποιον πρόγονό του, ανατρέχοντας στο σωστό pdf, αναζητώντας το ονοματεπώνυμο αλφαβητικά, εξάγοντας τον αριθμό δήλωσης και αναζητώντας, τέλος, τον αριθμό δήλωσης στο ευρετήριο γραφείων εποικισμού, όπου μπορεί να βρει τον συνοικισμό τελικής εγκατάστασης, επιβεβαιώνοντας έτσι ότι πρόκειται όντως για τον/την συγγενή του.
Η διαδικασία αυτή είναι επίπονη και χρονοβόρα, ακόμα και για απλά ερωτήματα όπως τα παρακάτω:
- Υπάρχουν οι συγγενείς μου στα αρχεία;
- Πόσες οικογένειες έχουν το επίθετο τάδε;
Επιπλέον, δεν μας επιτρέπει να αντλήσουμε άλλες, πιο περίπλοκες πληροφορίες. Για παράδειγμα:
- Ποιοι άλλοι ήρθαν από το ίδιο χωριό με τους συγγενείς μου;
- Ποιοι άλλοι εγκαταστάθηκαν στον ίδιο οικισμό με τους συγγενείς μου;
- Δεδομένου ότι ήταν πολύ συνηθισμένο συγγενικές οικογένειες να καταγράφονται μαζί, οπότε οι αριθμοί δηλώσεων να είναι συνεχόμενοι, ποιοι άλλοι έχουν κοντινούς αριθμούς δήλωσης με αυτούς των συγγενών μου;
- Πόσοι πρόσφυγες ήρθαν από την τάδε επαρχία;
Για να μπορούν να απαντηθούν τέτοια ερωτήματα με απλό και γρήγορο τρόπο και να μπορέσει έτσι να γίνει το ευρετήριο προσβάσιμο σε όλους, χρειάζεται τα περιεχόμενά του να καταχωριστούν. Να μετατραπούν δηλαδή από την τωρινή μορφή τους ως εικόνες, σε κείμενο, δηλαδή ονόματα, τόπους καταγωγής κτλ.
Ο τρόπος που επιλέξαμε για να γίνει αυτή η δουλειά είναι ο πληθοπορισμός (crowdsourcing).
Γιατί πληθοπορισμός
Στην ψηφιακή του μορφή, το ευρετήριο αποτελείται από:
Αρχεία pdf
Σελίδες με εγγραφές συνολικά
Εγγραφές ανά σελίδα κατά μέσο όρο
Εγγραφές συνολικά περίπου
Ο όγκος αυτός είναι απαγορευτικός για ένα άτομο ή μια μικρή ομάδα ατόμων.
Το πρώτο που έρχεται στο μυαλό κάποιου ως λύση, είναι ένα πρόγραμμα Οπτικής Αναγνώρισης Χαρακτήρων (OCR). Η λύση αυτή δοκιμάστηκε και τα αποτελέσματα ήταν πολύ κάτω του μετρίου.
Ο λόγος είναι ότι το ευρετήριο δεν είναι τυπωμένο παντού με τις ίδιες παραμέτρους φωτεινότητας, είναι συχνά τυπωμένο υπό γωνία, οι λέξεις σπάνε ή κόβονται όχι πάντα με αναμενόμενο τρόπο, οι στήλες του ευρετηρίου εμποδίζουν τη συσχέτιση, υπάρχουν σκιές, γραμμές, υδατογραφήματα, ομοιωματικά κτλ.
Συγκεκριμένα, πέρα από απλές λύσεις (Adobe, ABBYY FineReader) δοκιμάστηκε το λογισμικό Tesseract, το οποίο διατίθεται ως ελεύθερο λογισμικό σε διάφορα λειτουργικά συστήματα και αποτελεί ένα από τα πλέον ακριβή και ευρέως χρησιμοποιημένα συστήματα οπτικής αναγνώρισης.
Επιπλέον, ακόμη και αν η χρήση οπτικής αναγνώρισης είχε καλύτερα αποτελέσματα, η επιβεβαίωση των αποτελεσμάτων από ανθρώπινο μάτι θα ήταν και πάλι επιβεβλημένη.
Έτσι φτάνουμε στην ανάγκη ενός συστήματος καταχώρισης μέσω πληθοπορισμού (crowdsourcing). Το μεγάλο πρόβλημα "σπάει" σε μικρότερα και αυτά διαμοιράζονται σε πολλούς επιλυτές. Το έργο τους διευκολύνεται όσο το δυνατόν περισσότερο εργονομικά και τεχνολογικά. Το αποτέλεσμα της εργασίας τους επιστρέφει στο σύστημα και ενσωματώνεται. Οι πολλοί καταφέρνουν αυτό που είναι αδύνατο για τον έναν.
Η εφαρμογή
Το σύστημα που φτιάχτηκε γι'αυτό το σκοπό είναι το Say my name.
Το Say my name είναι ένα σύστημα επίλυσης μικροεργασιών, βασισμένο στον πληθοπορισμό. Στην παρούσα περίπτωση, σχεδιάστηκε ώστε να ελαχιστοποιήσει την προσπάθεια που χρειάζεται για την καταχώριση του ευρετηρίου.
Αποτελείται από πολλά υποσυστήματα, αυτό όμως που είναι ορατό για τον τελικό χρήστη είναι η εφαρμογή που τρέχει σε κινητά Android.
Το όλο έργο είναι μη κερδοσκοπικού χαρακτήρα. Τα αποτελέσματα της καταχώρισης θα δημοσιευτούν μετά το πέρας του έργου μέσω άλλης ανοιχτής εφαρμογής, επιτρέποντας σε όλους να εκτελούν αναζητήσεις στο ευρετήριο με απλό τρόπο.
Κανενός είδους προσωπικά δεδομένα δεν συλλέγονται, αποθηκεύονται ή επεξεργάζονται κατά τη διάρκεια της όλης προσπάθειας. Το μόνο αναγνωριστικό στοιχείο που ζητείται από τους συμμετέχοντες είναι ένα email, το οποίο δεν χρειάζεται καν να είναι αληθινό.
Οδηγίες χρήσης
Παρακάτω θα βρεις οδηγίες για την εγγραφή και τη λειτουργία της εφαρμογής.
Πρόοδος
Η καταχώριση του ευρετηρίου αποτελείται από τα εξής βήματα:
Πέρασμα ολόκληρου του ευρετηρίου 2 φορές, μέσω της εφαρμογής.
Διασταύρωση των δύο περασμάτων ώστε να εξαλειφθούν τυχόν λάθη, αστοχίες, κτλ.
Συνεργαζόμενοι φορείς
Την προσπάθεια αυτή στηρίζουν οι παρακάτω φορείς:
Επικοινωνία
Για τυχόν σχόλια, προτάσεις ή αναφορές προβλημάτων:
Δημιουργός:
immigres
Email:
eapp1928@hotmail.com