Τι είναι η νευροσυμβολική τεχνητή νοημοσύνη που θα προκαλέσει «επανάσταση»
- 13/12/2024, 16:04
- SHARE
του David Meyer
Η σημερινή παραγωγική τεχνητή νοημοσύνη είναι ικανή για εκπληκτικά πράγματα. Μπορεί φαινομενικά να καταλάβει τι λέμε και να δίνει πολύ ανθρώπινες απαντήσεις στα ερωτήματά μας. Μπορεί να αναγνωρίσει πράγματα σε εικόνες και να δημιουργήσει νέες εικόνες κατόπιν εντολής.
Αλλά ακόμη και τα τελευταία μεγάλα γλωσσικά μοντέλα, όπως το o1 της OpenAI, δεν μπορούν εγγενώς να καταλάβουν αν κάτι είναι αλήθεια. Εξακολουθούν να κατασκευάζουν πράγματα —ένα φαινόμενο γνωστό ως «ψευδαίσθηση»— και ο τρόπος με τον οποίο καταλήγουν σε αποφάσεις παραμένει σε μεγάλο βαθμό αδιαφανής.
Η υπέρβαση αυτών των περιορισμών μπορεί να σημαίνει στροφή σε μια παλιά και φαινομενικά ξεπερασμένη ιδέα, για να δημιουργηθεί κάτι νέο. Αυτή η ξεπερασμένη ιδέα είναι η συμβολική τεχνητή νοημοσύνη. Και το νέο πράγμα ονομάζεται νευροσυμβολική τεχνητή νοημοσύνη, η οποία οι υποστηρικτές της λένε ότι συνδυάζει τα δυνατά σημεία των σημερινών μεγάλων γλωσσικών μοντέλων (LLM) με την επεξήγηση και την αξιοπιστία αυτής της παλαιότερης, συμβολικής προσέγγισης.
Η ιστορία της τεχνητής νοημοσύνης είναι μια σχεδόν σεχταριστική πάλη ανάμεσα σε αντίθετες προσεγγίσεις για την επίλυση της πρόκλησης της δημιουργίας μηχανών που θα μπορούσαν να μαθαίνουν και να «σκέφτονται» σαν άνθρωποι. Το πεδίο χωρίστηκε κατά μήκος δύο γραμμών κυρίως (αν και υπήρχαν και μερικές μικρότερες «φατρίες και επιμέρους παρατάξεις»).
Στη μία πλευρά, έχουμε τη συμβολική τεχνητή νοημοσύνη, γνωστή και ως «καλή παλιομοδίτικη τεχνητή νοημοσύνη». Αυτή η προσέγγιση, βασισμένη σε τυπική λογική και κανόνες και αναπαραστάσεις εννοιών αναγνώσιμες από τον άνθρωπο, άρχισε να απογειώνεται στη δεκαετία του 1950, αλλά βασίλεψε σε μεγάλο βαθμό από τη δεκαετία του 1960 έως ότου έφτασε σε αδιέξοδο τη δεκαετία του 1990. Η συμβολική τεχνητή νοημοσύνη βοήθησε στη δημιουργία των υπολογιστών που έπαιζαν σκάκι που κορυφώθηκαν με το Deep Blue, το σύστημα της IBM που νίκησε τον παγκόσμιο πρωταθλητή Garry Kasparov το 1997, και ήταν επίσης πίσω από τα πρώτα chatbots και τα «ειδικά συστήματα» που ήταν δημοφιλή τη δεκαετία του 1980. Η συμβολική τεχνητή νοημοσύνη είναι μια προσέγγιση από πάνω προς τα κάτω, όπου ο υπολογιστής λαμβάνει ένα σύνολο κανόνων – γραμμένοι από ανθρώπους – και στη συνέχεια πρέπει να μάθει πώς να εφαρμόζει αυτούς τους κανόνες σε συγκεκριμένα παραδείγματα ή περιστάσεις.
Στην άλλη πλευρά: τα νευρωνικά δίκτυα που μοιάζουν με τον εγκέφαλο και μπορούν να εκπαιδευτούν ώστε να αναγνωρίζουν μοτίβα στη γλώσσα και τις εικόνες και να χρησιμοποιούν στατιστικά στοιχεία για να προβλέψουν πράγματα. Ένα νευρωνικό δίκτυο μαθαίνει με τρόπο από κάτω προς τα πάνω: Λαμβάνει μεγάλο αριθμό παραδειγμάτων ενώ εκπαιδεύεται, και από τα μοτίβα σε αυτά τα παραδείγματα συνάγει έναν κανόνα που φαίνεται να εξηγεί καλύτερα τα μοτίβα που έχει διακρίνει στα δεδομένα. Αλλά αυτός ο κανόνας δεν είναι κάτι που μπορεί εύκολα να γραφτεί — ακόμα και ως μαθηματικός τύπος. Υπάρχει ως το άθροισμα των outputs όλων των κόμβων ολόκληρου του δικτύου· το ίδιο το δίκτυο είναι ουσιαστικά ο κανόνας.
Η νευρωνική προσέγγιση άφησε από νωρίς υποσχέσεις στη δεκαετία του 1950, είχε μια σύντομη αναζωπύρωση τη δεκαετία του 1980 και στη συνέχεια πέρασε έναν μακρύ «χειμώνα» μέχρι να απογειωθεί ξανά με μια σειρά από σημαντικές ανακαλύψεις τη δεκαετία του 2010. (Περίπου αυτή την εποχή, η προσέγγιση μετονομάστηκε σε «βαθιά μάθηση», μια αναφορά στο γεγονός ότι τα πολυεπίπεδα νευρωνικά δίκτυα που χρησιμοποιήθηκαν είχαν «βάθος», αλλά και ένα έξυπνο κόλπο μάρκετινγκ για να κάνει τη μέθοδο να φαίνεται κάπως πιο βαθιά από άλλες τεχνικές μηχανικής μάθησης).
Η βαθιά μάθηση χαίρει μεγάλης εκτίμησης τα τελευταία χρόνια, ειδικά λόγω της εφαρμογής της στα μεγάλα γλωσσικά μοντέλα (LLMs) που τροφοδοτούν τη σημερινή παραγωγική τεχνητή νοημοσύνη. Ωστόσο, τα LLM συχνά επινοούν τα πράγματα επειδή δεν είναι σε θέση να κατανοήσουν πραγματικά έννοιες ή να συλλογιστούν λογικά. Είναι επίσης «μαύρα κουτιά» – ακόμη και οι προγραμματιστές τους δεν καταλαβαίνουν πλήρως πώς καταλήγουν στα συμπεράσματά τους.
Αυτό καθιστά την παραγωγική τεχνητή νοημοσύνη πολύ αναξιόπιστη για πολλούς χρήστες, ιδιαίτερα τις επιχειρήσεις και τις κυβερνήσεις. Και εάν η τεχνητή νοημοσύνη πρόκειται να εξελιχθεί σε κάποιο είδος ανθρώπινης ή υπεράνθρωπης νοημοσύνης – νεφελώδεις έννοιες που συχνά αναφέρονται ως «τεχνητή γενική νοημοσύνη» (AGI) και «τεχνητή υπερνοημοσύνη» (ASI) – αυτή η έλλειψη αξιοπιστίας μπορεί να είναι ένα πρόβλημα.
«Υπάρχει χώρος για πρόοδο, αλλά εγγενώς αυτή η προσέγγιση [LLM] θα φτάσει σε αδιέξοδο αργά ή γρήγορα», δήλωσε ο Pieter den Hamer, ο οποίος ηγείται του κέντρου πόρων τεχνητής νοημοσύνης στην εταιρεία αναλύσεων Gartner.
Εδώ μπαίνει στο παιχνίδι η νευροσυμβολική τεχνητή νοημοσύνη, μια ολοένα και πιο δημοφιλής ιδέα που -όπως υποδηλώνει το όνομά της- συνδυάζει τις νευρωνικές και τις συμβολικές προσεγγίσεις με στόχο να πάρουμε το καλύτερο από την κάθε μία, με συμπληρωματικό τρόπο.
Πολλοί στο πεδίο την παρομοιάζουν με τη θέση του ψυχολόγου Daniel Kahneman ότι υπάρχουν δύο είδη σκέψης: η σκέψη του Συστήματος 1, η οποία είναι γρήγορη και ενστικτώδης και χρησιμοποιείται στην αντίληψη· και η σκέψη του Συστήματος 2, η οποία είναι η πιο αργή και συνειδητή σκέψη που κάνουμε όταν εξετάζουμε τα πράγματα και παίρνουμε αποφάσεις. Τα νευρωνικά δίκτυα όπως τα LLM είναι πολύ καλά στο πρώτο είδος, αλλά μπορεί να χρειάζεται συμβολική τεχνητή νοημοσύνη για σκέψη όπως το Σύστημα 2.
Ορισμένοι πρωτοπόροι της βαθιάς μάθησης περιφρονούν ανοιχτά τη νευροσυμβολική προσέγγιση. Ο επικεφαλής επιστήμονας της τεχνητής νοημοσύνης της Meta, Yann LeCun, δήλωσε τον Ιούνιο ότι είναι «ασύμβατη με τη βαθιά μάθηση» και ο Geoffrey Hinton -ο οποίος εγκατέλειψε την Google πέρυσι λόγω των φόβων του για τις αρνητικές επιπτώσεις της τεχνητής νοημοσύνης- επιμένει ότι η βαθιά μάθηση από μόνη της θα «μπορεί να κάνει τα πάντα».
Αλλά πάρα πολλοί πολύ αξιόπιστοι άνθρωποι και εταιρείες πιστεύουν ότι υπάρχει κάτι σε αυτήν.
Η IBM, η οποία λέει ότι βλέπει τη νευροσυμβολική τεχνητή νοημοσύνη ως «ένα μονοπάτι για την επίτευξη τεχνητής γενικής νοημοσύνης», έχει πειραματιστεί με τη χρήση της παρέχοντας αιτιολογημένες απαντήσεις σε ερωτήματα σχετικά με εικόνες. Όταν η Google έδειξε νωρίτερα φέτος ότι τα νέα της συστήματα AlphaProof και AlphaGeometry 2 μπορούσαν να αποδώσουν σε επίπεδο ασημένιου μεταλλίου όταν επίλυσαν προβλήματα της Διεθνούς Μαθηματικής Ολυμπιάδας, αυτά ήταν επιδείξεις μοντέλων νευρωνικής γλώσσας που συνεργάζονται χέρι-χέρι με συμβολικές μηχανές επαγωγής.
Τα νευρωνικά δίκτυα που εμπλέκονται στη νευροσυμβολική τεχνητή νοημοσύνη δεν χρειάζεται να είναι LLM όπως του ChatGPT, αλλά μερικές από τις πιο ενδιαφέρουσες νευροσυμβολικές εφαρμογές χρησιμοποιούν τα LLM ως συστατικό, με τρόπους που έχουν σχεδιαστεί για να ξεπερνούν τους περιορισμούς τους.
Υπάρχουν πολλές εκδοχές της νευροσυμβολικής τεχνητής νοημοσύνης, αλλά αυτές που αναπτύσσονται σήμερα περιλαμβάνουν κυρίως τη συνεργασία των νευρωνικών και των συμβολικών στοιχείων παράλληλα και την αλληλεπίδραση όταν χρειάζεται, αντί να ενσωματώνονται στενά σε ένα νέο είδος μοντέλου – ένα πιο θεωρητικό όραμα προς το παρόν.
Κάποιοι μάλιστα υποστηρίζουν ότι, μόλις δώσουμε σε ένα LLM πρόσβαση σε ένα εργαλείο όπως ένας διερμηνέας κώδικα ή μια μηχανή αναζήτησης, το αποτέλεσμα χαρακτηρίζεται ως νευροσυμβολική τεχνητή νοημοσύνη. «Ένα LLM από μόνο του δεν πρόκειται να είναι η πιο αξιόπιστη αριθμομηχανή ποτέ», δήλωσε ο Jaime Sevilla, διευθυντής του ερευνητικού ινστιτούτου Epoch AI. «Αλλά, ωστόσο, μπορεί να κάνει ό,τι κάνουν οι άνθρωποι – όπως, απλά να χρησιμοποιεί μια αριθμομηχανή».
Όμως ήδη εμφανίζονται πολύ πιο σύνθετες υλοποιήσεις.
Η νεοσύστατη εταιρεία Elemental Cognition έχει δημιουργήσει μια μηχανή συλλογιστικής που χρησιμοποιεί LLM για να χειρίζεται τα ερωτήματα που τίθενται με φωνητικές εντολές του χρήστη, ενώ βασίζεται σε ένα ξεχωριστό στοιχείο επίλυσης προβλημάτων (τον λεγόμενο αλγόριθμο επίλυσης δυναμικών περιορισμών) για να κάνει αξιόπιστα αυτό που θέλει ο χρήστης.
Αυτό είναι χρήσιμο για εργασίες όπως η βελτιστοποίηση και τα logistics· η παγκόσμια αεροπορική συμμαχία Oneworld, της οποίας τα μέλη περιλαμβάνουν την British Airways και την American Airlines, χρησιμοποιεί το σύστημα της Elemental Cognition για να τροφοδοτήσει τον νέο ταξιδιωτικό της πράκτορα τεχνητής νοημοσύνης.
Εντωμεταξύ, ο σειριακός επιχειρηματίας Wayne Chang, ο οποίος συν-ίδρυσε την υπηρεσία αναφοράς κρασαρισμάτων για κινητά Crashlytics μεταξύ πολλών άλλων εγχειρημάτων, μόλις ολοκλήρωσε μια startup που ονομάζεται Reasoner. Αυτή προσφέρει μια νευροσυμβολική συλλογιστική μηχανή που ήδη τροφοδοτεί την υπηρεσία Patented.ai για δικηγόρους που ασχολούνται με θέματα πνευματικής ιδιοκτησίας.
Τίποτα από τα παραπάνω βέβαια δεν σημαίνει ότι ο δρόμος προς τα εμπρός για τη νευροσυμβολική τεχνητή νοημοσύνη είναι εύκολος.
Τα συστήματα νευροσυμβολικής τεχνητής νοημοσύνης είναι σχετικά αργά σε σύγκριση με τα συστήματα όπως το ChatGPT και λιγότερο επιδέξια στην αντιμετώπιση της διφορούμενης γλώσσας και της άρρητης γνώσης. Είναι επίσης πιο δύσκολο να διευρύνουν το πεδίο εφαρμογής τους λόγω της εργασίας που απαιτείται για τη δημιουργία και τη διατήρηση των κανόνων και των σχέσεων στη συμβολική πλευρά.
Κάποιοι υποστηρίζουν ότι η νευροσυμβολική τεχνητή νοημοσύνη θα χρειαστεί νέο hardware για να αξιοποιήσει πλήρως τις δυνατότητές της.
Ο Zishen Wan, διδακτορικός φοιτητής στο Georgia Tech, ο οποίος πρόσφατα συνέγραψε μια εργασία σχετικά με την ανάγκη για νέες αρχιτεκτονικές και πρόκειται να κυκλοφορήσει μια άλλη εργασία προτείνοντας μια νέα αρχιτεκτονική, είπε ότι η νευροσυμβολική τεχνητή νοημοσύνη «συχνά λειτουργεί κάπως αργά» στα σημερινά τσιπ τεχνητής νοημοσύνης, τα οποία είναι πολύ πιο κατάλληλα για τα νευρωνικά δίκτυα. Εξήγησε ότι αυτό οφείλεται στο ότι η νευροσυμβολική τεχνητή νοημοσύνη χρησιμοποιεί διαφορετικούς υπολογιστικούς πυρήνες και επίσης επειδή είναι λιγότερο αποτελεσματική από τα νευρωνικά δίκτυα στην επαναχρησιμοποίηση δεδομένων – πράγμα που σημαίνει ότι χρειάζεται να «μετακινεί» τα δεδομένα πολύ περισσότερο.
Αυτό μπορεί να είναι ένα κυκλικό πρόβλημα. «Βλέπουμε πολλές υποσχόμενες εφαρμογές, αλλά είναι αυτό αρκετά καλό για τον κλάδο ώστε να δημιουργήσει εντελώς νέο νευροσυμβολικό hardware;» αναρωτήθηκε ο Wan. «Είναι λίγο δύσκολο να απαντήσω σε αυτό».
ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:
- Μητσοτάκης: Θα κριθούμε σε εθνικό, περιφερειακό και τοπικό επίπεδο στις εκλογές που θα γίνουν την άνοιξη του 2027
- Απελευθερώθηκε Αμερικανός πολίτης από συριακή φυλακή – Όσα είπε για τις συνθήκες κράτησης
Πηγή: Fortune.com