Πλέον είναι δυνατή η ανάγνωση της σκέψης και η μετατροπή της σε κείμενο μέσω τεχνητής νοημοσύνης
- 03/05/2023, 20:30
- SHARE
Στο Πανεπιστήμιο του Τέξας στο Ώστιν μια ομάδα επιστημόνων ανέπτυξε έναν αποκωδικοποιητή βασισμένο σε τεχνητή νοημοσύνη που μπορεί να μεταφράσει τη δραστηριότητα του εγκεφάλου σε κείμενο. Η σημαντική αυτή ανακάλυψη επιτρέπει για πρώτη φορά τη μη επεμβατική ανάγνωση των σκέψεων ενός ατόμου.
Ο αποκωδικοποιητής μπορεί να ανακατασκευάσει την ομιλία με ασυνήθιστη ακρίβεια χρησιμοποιώντας μόνο δεδομένα σάρωσης fMRI (Λειτουργικής Απεικόνισης Μαγνητικού Συντονισμού). Οι συμμετέχοντες στο πείραμα άκουγαν μια ιστορία – ή ακόμα και σιωπηλά φαντάζονταν μια ιστορία – και ο αποκωδικοποιητής τη μετέτρεπε σε κείμενο. Προηγούμενα συστήματα αποκωδικοποίησης γλώσσας απαιτούσαν χειρουργικά εμφυτεύματα. Η πιο πρόσφατη μέθοδος βελτιώνει την προοπτική νέων τρόπων αποκατάστασης της ομιλίας σε ασθενείς που δυσκολεύονται να επικοινωνήσουν λόγω εγκεφαλικού ή ασθένειας του κινητικού νευρώνα.
Το επίτευγμα ξεπερνά έναν θεμελιώδη περιορισμό του fMRI – δηλαδή το ότι ενώ η τεχνική μπορεί να χαρτογραφήσει την εγκεφαλική δραστηριότητα σε μια συγκεκριμένη τοποθεσία με απίστευτα υψηλή ανάλυση, υπάρχει μια εγγενής χρονική υστέρηση, η οποία καθιστά αδύνατη την παρακολούθηση της δραστηριότητας σε πραγματικό χρόνο.
Η υστέρηση υπάρχει επειδή οι σαρώσεις fMRI μετρούν την απόκριση της ροής του αίματος στην εγκεφαλική δραστηριότητα, η οποία κορυφώνεται και επιστρέφει στην αρχική τιμή σε περίπου 10 δευτερόλεπτα, πράγμα που σημαίνει ότι ακόμη και ο πιο ισχυρός σαρωτής δεν μπορεί να το βελτιώσει αυτό. Αυτός ο περιορισμός μέχρι πρότινος παρεμπόδιζε την ικανότητα ερμηνείας της εγκεφαλικής δραστηριότητας ως απόκριση στη φυσική ομιλία.
Ωστόσο, η εμφάνιση μεγάλων γλωσσικών μοντέλων – το είδος της τεχνητής νοημοσύνης που στηρίζει το ChatGPT της OpenAI – προσφέρει έναν νέο τρόπο προσέγγισης. Αυτά τα μοντέλα είναι σε θέση να εκφράζουν, σε αριθμούς, τη σημασιολογική διάσταση της ομιλίας, επιτρέποντας στους επιστήμονες να εξετάσουν ποιο πρότυπο νευρωνικής δραστηριότητας αντιστοιχεί σε σειρές λέξεων με συγκεκριμένο νόημα αντί να προσπαθούν να διαβάσουν λέξη προς λέξη.
Η διαδικασία εκμάθησης, όπως σημειώνει ο Guardian, ήταν εντατική: τρεις εθελοντές χρειάστηκε να ξαπλώσουν σε ένα σαρωτή για 16 ώρες έκαστος, ακούγοντας podcast. Ο αποκωδικοποιητής εκπαιδεύτηκε για να «ταιριάζει» τη δραστηριότητα του εγκεφάλου με το νόημα χρησιμοποιώντας ένα μεγάλο γλωσσικό μοντέλο, το GPT-1, έναν πρόδρομο του ChatGPT.
Η ομάδα ελπίζει τώρα να αξιολογήσει κατά πόσο η τεχνική θα μπορούσε να εφαρμοστεί σε άλλα, πιο φορητά συστήματα απεικόνισης εγκεφάλου, όπως η Λειτουργική Φασματοσκοπία Εγγύς Υπέρυθρου (fNIRS).