Στον 21ο αιώνα λίγοι είναι οι κλάδοι της πληροφορικής οι οποίοι έχουν απασχολήσει ιδιαιτέρως το πλήθος των πανεπιστημιακών και ανεξάρτητων ερευνητών στο κόσμο, όσο είναι ο κλάδος των τεχνητών νευρωνικών δικτύων. Μαζί με το cloud computing και την τεχνητή νοημοσύνη, τα νευρωνικά δίκτυα έχουν απογειώσει την επιστήμη των υπολογιστών και της πληροφορίας σε ένα εξωπραγματικό επίπεδο.

ImageForArticle_3215(1)

Τα νευρωνικά δίκτυα δεν αποτελούν μια εφεύρεση κάποιων ή κάποιου επιστήμονα αλλά εν αντιθέσει είναι μια αντιγραφή της φύσης. Τα μοντέλα των τεχνητών νευρωνικών δικτύων αποτελούν αναπαράσταση των φυσικών, αυτών που συναντάμε στο ανθρώπινο σώμα.

Προσπαθώντας να ορίσουμε τα τεχνητά νευρωνικά δίκτυα, θα λέγαμε πως επρόκειτο για δίκτυα νευρώνων τα οποία είναι αλγοριθμικά κατασκευασμένα και εστιάζουν στην επίλυση ενός υπολογιστικού προβλήματος ή προσπαθούν να μιμηθούν με το καλύτερο δυνατό τρόπο τα φυσικά νευρωνικά δίκτυα.

Ένα τεχνητό νευρωνικό δίκτυο αποτελείται από έναν Χ αριθμό κόμβων. Ο συγκεκριμένος αριθμός των τεχνητών αυτών κόμβων, ή νευρώνων, αυξάνεται και μειώνεται ανάλογα με τη πολυπλοκότητα του νευρωνικού δικτύου, δηλαδή με τον όγκο τον δεδομένων των οποίο θα κληθεί να επεξεργαστεί, τη φύση του προβλήματος αλλά και τα επεξεργασμένα δεδομένα τα οποία θα πρέπει να δώσει. Ο σκελετός ενός απλού νευρωνικού δικτύου είναι ιδαίτερα εύκολος στη σχεδίαση αλλά και στη σύλληψη: αποτελείται από έναν αριθμό κόμβων εισόδου που όπως προοϊκονομεί και η ονομασία τους επρόκειτο για τα σημεία εισόδου των δεδομένων, έναν αριθμό (συνήθως μεγαλύτερο) ενός στρώματος το οποίο ονομάζεται “κρυμμένο” και κύριος σκοπός του είναι η λήψη αποφάσεων (επεξεργασία) για τα δεδομένα και εν τέλει το τελευταίο στρώμα κόμβων που εξάγει ή δίνει το output από την προηγούμενη διαδικασία. Αυτό το απλό μοντέλο μπορεί να γίνει αρκετά πιο περίπλοκο, συνήθως με τη προσθήκη στρωμάτων επεξεργασίας ή λήψης αποφάσεων. Τα χαρακτηριστικά τα οποία παραμένουν ακλόνητα είναι η είσοδος και η έξοδος, όπου άλλωστε είναι και τα ζητούμενα.

neural-network

Η λειουργία ενός τέτοιου δικτύου εκτείνεται πάλι από την απλότητα στην απόλυτη πολύπλοκότητα ανάλογα με το είδος της επεξεργασίας που αναμένεται αλλά και από τον αριθμό των μεσαίων ή “υπολογιστικών” νευρώνων. Για παράδειγμα, ας υποθέσουμε πως το παραπάνω νευρωνικό δίκτυο έχει ως είσοδο διάφορες φωτογραφίες από τις οποίες οι υπολογιστικοί νευρώνες έχουν ως καθήκον να αναλύσουν και αποφασίσουν αν οι φωτογραφίες απεικονίζουν μια γάτα. Το σχήμα μιας γάτας είναι ένα αρκετά χαρακτηριστικό καλούπι καθώς περιέχει ιδαίτερες λεπτομέρειες, όπως τα αυτιά ή τα τέσσερα πόδια τα οποία πατούν στο έδαφος, την υφή (texture) της γούνας ή την ουρά. Οι υπολογιστικοί νευρώνες όμως δε γνωρίζουν όλα αυτά τα χαρακτηριστικά της γάτας. Έτσι, αφότου περάσουν μια περίοδο εκπαίδευσης με τη συνεχή τροφοδότησή τους με φωτογραφίες και υλικό από γάτες, αφομοιώνουν τα χαρακτηριστικά τους και είναι έτοιμες να αναγνωρίσουν πρότυπα και χαρακτηριστικά. Όταν λοιπόν, εισαχθεί στο νευρωνικό δίκτυο μια άγνωστη φωτογραφία γάτας, αυτό θα προσπαθήσει να εντοπίσει τα πρότυπα τα οποία έμαθε στην περίοδο εκπαίδευσης για να αποφασίσει για τον εάν επρόκειτο για γάτα ή κάτι άγνωστο σε αυτό.

Παρατηρώντας ας πούμε τις δύο παραπάνω φωτογραφίες, το δίκτυο θα εντοπίσει τα κοινά χαρακτηριστικά και θα αποφανθεί πως το περιεχόμενο των δύο είναι πανομοιότυπο, άρα κατά ένα μεγάλο ποσοστό, οι εικόνες πρέπει να απεικονίζουν γάτες. Αυτό το πρόβλημα είναι κάτι το οποίο τα τεχνητά δίκτυα εύκολα μπορούν να αντιμετωπίσουν σήμερα. Τί γίνεται όμως εάν το νευρωνικό δίκτυο κληθεί να αναγνωρίσει εικόνες από σπίτια;

Παρότι η διαδικασία μάθησης είναι παρόμοια, πρέπει να γίνει αντιληπτό πως θα πρέπει να υπάρξουν και άλλα δεδομένα ή το δίκτυο να υποβοηθεί από άλλες τεχνικές. Το λόγο μπορείτε να τον καταλάβετε από τις παρακάτω δύο φωτογραφίες:

Kαι οι δύο φωτογραφίες απεικονίζουν δύο σπίτια. Μόνο που το πρώτο από αριστερά είναι ένα παραδοσιακό σπίτι στα Ζαγοροχώρια Ηπείρου, ενώ το δεύτερο αποτελεί ένα φουτουριστικό μοντέλο που θα μπορούσε να βρίσκεται στο Malibu. Οι διαφορές ανάμεσα στα δύο οικήματα κάθε άλλο παρά αμελητέες είναι! Τί συμπέρασμα θα μπορούσε να βγάλει το απλό νευρωνικό μας δίκτυο εάν είχε ως “εκπαιδευτικό υλικό” μόνο παραδοσιακά ή μόνο μετα-μοντέρνα σπίτια;

Το παράδοξο αυτό, επιλύεται με διάφορους τρόπους. Μια λύση είναι η αύξηση των υπολογιστικών νευρώνων ή διαφοροποίηση των προτύπων.

Μια τέτοια υλοποίηση, βοηθά στη κατανόηση των βασικών αρχών των τεχνητών νευρωνικών δικτύων και σε καμία περίπτωση δεν αποτελεί το όριο των δυνατοτήτων ενός τέτοιου μηχανισμού. Προσπαθόντας να περιγράψουμε τη χρήση των τεχνητών νευρωνικών δικτύων λίγο πιο επιστημονικά, μπορούμε να θέσουμε το φαινόμενο των τεχνητών νευρωνικών δικτύων με ένα παράδειγμα το οποίο μοιάζει αρκετά μη προβλέψιμο, ακόμα και από έναν σκεπτόμενο άνθρωπο, πόσο μάλλον από μια μηχανή.

Το παράδειγμα μπορεί να ονομαστεί “Το μηχάνευμα του πλησιέστερου γείτονα”. Σε τούτη την υπόθεση, υπάρχει η θέληση να γίνει πρόβλεψη για το πιο πολιτικό κόμμα θα στήριζε οικονομικά ένα άτομο, με μόνο δεδομένο την διεύθυνση κατοικίας του. Ακούγεται ιδιαίτερα απίθανο και τραβηγμένο, αλλά μη ξεχνάτε πως το μηχάνευμα τούτο θα μας δώσει μια έξοδο με ένα υπολογίσιμο περιθώριο λάθους.

Όπως και στο απλούστερο παράδειγμα με τις φωτογραφίες των γατών, χρειαζόμαστε κάποια εκπαιδευτικά δεδομένα. Στη περίπτωσή μας, θα χρησιμοποιήσουμε έναν απλό χάρτη που δημιουργήσαμε στο οποίο υποθετικά απεικονίζουμε μια γειτονιά της Αθήνας και πάνω του θα σημειώνουμε με ένα Κ τους κατοίκους που έδωσαν οικονομική βοήθεια στο κόμμα Κ και με ένα Λ τους κατοίκους που έδωσαν οικονομική βοήθεια στο κόμμα Λ, προφανώς. Για να μην ξεφύγουμε από το πραγματικό νόημα του μηχανεύματος τούτου, θα υποθέσουμε πως τα μόνα κόμματα που ζητούν οικονομική στήριξη είναι το Κ και το Λ.

map

Από εδώ και πέρα θα αναφερόμαστε στα Κ, Λ ως δείγματα και τη κατηγορία του καθενός, δηλαδή αν επρόκειτο για υποστηρικτή του κόμματος Κ ή Λ, ως κλάσεις. Στο παραπάνω εκπαιδευτικό υλικό το δίκτυο μπορεί να αναλύσει τις θέσει των δειγμάτων και να βγάλει κάποια χρήσιμα συμπεράσματα για τις προτιμήσεις των ατόμων. Τί γίνεται όμως όταν δοθεί στο σύστημα πρόβλεψης ένας χάρτης που περιέχει και δύο ερωτηματικά ;

map2

Είναι απόλυτα λογικό ο εγκέφαλός σας να αρχίζει να βγάζει ορισμένα συμπεράσματα για τις θέσεις πάνω στο χάρτη τις οποίες καλύπτουν τα δύο ερωτηματικά. Ίσως έχει ήδη υπολογίσει σε κάποιο βαθμό τις αποστάσεις από έναν δειγματικό χώρο στα αριστερά του χάρτη και έχει αποφασίσει ποια είναι η μέση απόσταση μεταξύ των Κ και των Λ, διαμορφώνοντας έτσι μια αρχική άποψη για το που μπορεί να δώσουν τη ψήφο τους τα ερωτηματικά.

Αυτή η διαδικασία που μόλις το μυαλό σας ακολούθησε, ίσως και ασυνείδητα είναι μια από τις πιο ισχυρές τεχνικές ταξινόμησης οι οποίες υπάρχουν, ενώ φέρει το όνομα: ταξινομητής πλησιέστερου γείτονα.

Προχωρόντας το συλλογισμό του πλησιέστερου γείτονα σε ένα λιγότερο απτό παράδειγμα (καθώς δεν θα έχουμε πια στο μυαλό μας την έννοια της γεωγραφικής απόστασης που είμαστε αρκετά οικείοι μαζί της) μπορούμε να χρησιμοποιήσουμε τον ταξινομητή του πλησιέστερου γείτονα για να βρούμε το πόσο διαφέρουν μεταξύ τους (την “απόσταση” που έχουν) δύο χειρόγραφα ψηφία. 

Για να μπορέσουμε να καταλάβουμε το πραγματικό λόγο που οι επιστήμονες των υπολογιστών έφτασαν στο σημείο να αναπτύξουν τεχνητά νευρωνικά δίκτυα (πέρα από την έμφυτη περιέργεια) πρέπει να έχουμε ένα καλό υπόβαθρο για τα προβλήματα τα οποία αυτά τα δίκτυα καλούνται να λύσουν.

Όπως προείπαμε, το τέχνασμα του πλησιέστερου γείτονα εξυπηρετεί σε μια άκρως σημαντική διαδικασία, αυτή της αναγνώρισης χειρόγραφων χαρακτήρων.

roughhand

Παρατηρώντας τους παραπάνω χειρόγραφους χαρακτήρες μπορούμε να διακρίνουμε μια ομοιότητα ανάμεσά τους, καθώς έχουν έναν διάχυτο κυκλικό χαρακτήρα. Δίνοντας ένα ακόμη δείγμα της ίδιας γραμματοσειράς, πιθανότατα γραμμένο σε κάποια άλλη χρονική στιγμή από το ίδιο άτομο αλλά και μια εντελώς ασύνδετη γραμματοσειρά θα προσπαθήσουμε να εφαρμόσουμε το μηχάνευμα του πλησιέστερου γείτονα.

print-handwriting-chart-upper-lower-tog-cat

Η παραπάνω γραμματοσειρά, παρότι διαφορετική από τη προηγούμενη φέρει σε εξαιρετικό βαθμό παρόμοια χαρακτηριστικά με αυτά της πρώτης, όπως ο διάχυτος κυκλικός χαρακτήρας ή το μέγεθος.

images

Παρατηρώντας και την παραπάνω γραμματοσειρά (λυπούμαστε για την κακή ποιότητα της φωτογραφίας) μπορούμε να καταλάβουμε πως αυτός ο γραφικός χαρακτήρας πιθανότατα προέρχεται από κάποια μηχανή, ίσως έναν υπολογιστή ή μια γραφομηχανή. Ήρθε η ώρα όμως να αποσπάσουμε μέσω του τεχνάσματος του πλησιέστερου γείτονα και μια πιο επιστημονική άποψη για το αν οι δυο τελευταίες γραμματοσειρές ανήκουν στο ίδιο άτομο το οποίο “έκανε” την πρώτη.

Βέβαια, εδώ δεν έχουμε ακριβώς γείτονες για να μετρήσουμε την γεωγραφική απόσταση, τουναντίως, κάτι τέτοιο θα ήταν παντελώς άχρηστο. Αυτό το οποίο θα κάνουμε όπως προαναφέραμε είναι να μετρήσουμε τη διαφορετικότητα των γραμμάτων και να εντοπίσουμε ένα ποσοστό διαφορετικότητας. Αυτό, μπορεί να γίνει με τη τεχνική της αφαίρεσης.

subtr

Όπως βλέπετε, αφαιρώντας το ένα γράμμα από ένα άλλο, μπορούμε να βρούμε ένα ποσοστό διαφορετικότητας.

Όμως, φαντάζομαι πως μετά το εκτενές κομμάτι το οποίο αφορούσε το εκπαιδευτικό υλικό των νευρωνικών δικτύων, θα αναρωτιέστε ποιο είναι το εκπαιδευτικό αυτό υλικό και φυσικά δε σας αδικώ.

Το τέχνασμα του πλησιέστερου γείτονα είναι ένα από τα λίγα τα οποία δεν απαιτούν προεργασία, ή για να το θέσω καλύτερα, η προεργασία και το έργο γίνονται ταυτόχρονα! Το δίκτυο μαθαίνει για τη διαφορετικότητα των γραμμάτων ή το ποιο κόμμα θα ενισχύσει ο κάθε πολίτης την ίδια στιγμή που προβλέπει τη διαφορετικότα των πρώτων και εκτιμά την υποστήριξη των δεύτερων.

Έτσι, γίνεται σαφές πως τα τεχνητά νευρωνικά δίκτυα πλησιάζουν σε μεγάλο βαθμό τις ανθρώπινες λειτουργίες και είναι (ίσως) θέμα χρόνου να τις αγγίξουν.

Στο επόμενο μέρος, θα γνωρίσουμε ένα πιο εξειδικευμένο παράδειγμα νευρωνικών δικτύων αλλά και τεχνικών τα οποία χρησιμοποιούν, αυτό των δένδρων αποφάσεων και θα παίξουμε διάφορα παιχνίδια με ερωτήσεις ΝΑΙ/ΟΧΙ!

Μείνετε συγχρονισμένοι!

 

ΑΦΗΣΤΕ ΕΝΑ ΣΧΟΛΙΟ