DeepMind: Δημιουργεί νέο πρόγραμμα τεχνητής νοημοσύνης «διαβάζει» τα χείλη

Το πρόγραμμα αποτελεί διεθνή πρωτοβουλία στην τεχνητή νοημοσύνη, και είχε ως επικεφαλής έναν ελληνικής καταγωγής ειδικό της πληροφορικής.

Πολλοί είναι αυτοί που θα βρουν χρήσιμο ένα νέο πρόγραμμα τεχνητής νοημοσύνης που «διαβάζει» τα χείλη των ανθρώπων εξ αποστάσεως με μεγαλύτερη ακρίβεια όχι μόνο από κάθε άλλο μέχρι σήμερα, αλλά και από τους ανθρώπους με τη σχετική εξειδίκευση.

Το πρόγραμμα αυτό ανέπτυξαν ερευνητές της Google και της βρετανικής θυγατρικής της DeepMind, η οποία πρωτοπορεί διεθνώς στην τεχνητή νοημοσύνη, με επικεφαλής ένα νεαρό ελληνικής καταγωγής ειδικό της πληροφορικής, τον Γιάννη Ασσαέλ.

Για τα εκατομμύρια των ανθρώπων που δεν μπορούν να ακούσουν, η ανάγνωση των χειλιών των άλλων αποτελεί ένα «παράθυρο» για την επικοινωνία, πέρα από τη νοηματική γλώσσα. Όμως το «διάβασμα» των χειλιών δεν είναι εύκολο και συχνά είναι ανακριβές.

Το νέο «έξυπνο» σύστημα εμφανίζει μέσο ποσοστό λαθών 41% στην ορθή κατανόηση των λέξεων που σχηματίζουν τα χείλη. Μπορεί να φαίνεται υψηλό αυτό το ποσοστό, αλλά η καλύτερη μέχρι σήμερα υπολογιστική μέθοδος είχε ποσοστό αποτυχίας 77%, συνεπώς το νέο πρόγραμμα έχει περιορίσει σχεδόν στο μισό τα λάθη.

Οι ερευνητές, με επικεφαλής τον Ασσαέλ και τον Μπρένταν Σίλινγκφορντ, οι οποίοι έκαναν τη σχετική προδημοσίευση στον επιστημονικό ιστότοπο arXiv, σύμφωνα με το επιστημονικό περιοδικό Science, δημιούργησαν αλγόριθμους καλύτερους από κάθε άλλους στο παρελθόν, που τα καταφέρνουν αποτελεσματικότερα και από επαγγελματίες αναγνώστες χειλιών. Αν το νέο σύστημα τελειοποιηθεί και ενσωματωθεί σε ηλεκτρονικές συσκευές, όπως τα «έξυπνα» κινητά τηλέφωνα, μπορεί μελλοντικά να προσφέρει τη δυνατότητα ανάγνωσης των χειλιών στον οποιονδήποτε.

Η δημιουργία αλγορίθμων που να μπορούν να διαβάσουν χείλη ήταν έως τώρα τρομερά δύσκολη. Οι ερευνητές τροφοδότησαν το σύστημά τους με 140.000 ώρες βίντεο από το YouTube που έδειχναν ανθρώπους να μιλάνε στα αγγλικά, μαζί με τα αντίστοιχα απομαγνητοφωνημένα κείμενα. Στη συνέχεια, άφησαν το σύστημα μηχανικής μάθησης μόνο του να μάθει να «παντρεύει» τις διαφορετικές κινήσεις των χειλιών με τα αντίστοιχα φωνήματα και τελικά με τις αντίστοιχες λέξεις.

Το σύστημα βασίζεται στα τεχνητά νευρωνικά δίκτυα, δηλαδή σε μια ομάδα αλγόριθμων που ο καθένας εκτελεί ένα διαφορετικό και απλούστερο έργο, ενώ ταυτόχρονα όλοι μαζί συνδέονται και συνεργάζονται για να επεξεργασθούν τις πληροφορίες, περίπου όπως κάνουν οι νευρώνες του ανθρώπινου εγκεφάλου.

Στη συνέχεια, το σύστημα δοκιμάστηκε από τους ερευνητές στην ανάγνωση των χειλιών των ανθρώπων με ένα 37λεπτο βίντεο, με το οποίο το σύστημα δεν είχε ξαναέρθει σε επαφή. Το πρόγραμμα έσφαλε στο 41% των λέξεων, αλλά οι άνθρωποι -ακόμη και οι ειδικοί στο διάβασμα του στόματος- που είδαν το ίδιο βίντεο, είχαν μέσο ποσοστό αποτυχίας 93%.

Σε κάθε περίπτωση, αν και συνιστά πραγματική πρόοδο, είναι σαφές ότι ένα ποσοστό αποτυχίας της τάξης του 40% στην αναγνώριση των λέξεων σημαίνει ότι το σύστημα χρειάζεται ακόμη ουσιαστική βελτίωση. Όταν αυτή υπάρξει, το σύστημα μπορεί να αξιοποιηθεί ευρύτερα και στην καθημερινότητα.

Όσον αφορά τον ελληνικής καταγωγής ερευνητή, ο Γιάννης Ασσαέλ υπήρξε μαθητής του Κολλεγίου Ανατόλια της Θεσσαλονίκης και σπούδασε εφαρμοσμένη πληροφορική στο Πανεπιστήμιο Μακεδονίας (2008-2013). Στη συνέχεια, έκανε μεταπτυχιακά στην επιστήμη των υπολογιστών στο Πανεπιστήμιο της Οξφόρδης, όπου σήμερα ολοκληρώνει το διδακτορικό του πάνω στη μηχανική μάθηση, ενώ παράλληλα εργάζεται για τη Deep Mind της Google.

DeepMind: Δημιουργεί νέο πρόγραμμα τεχνητής νοημοσύνης «διαβάζει» τα χείλη

ΕΠΙΚΑΙΡΟΤΗΤΑ

Fed κατά Τραμπ: «Αυξάνονται οι κίνδυνοι υψηλότερης ανεργίας και πληθωρισμού»

ΕΠΙΚΑΙΡΟΤΗΤΑ

Σκληρή απάντηση της Κίνας στον Τραμπ: Οριζόντιοι δασμοί 34% και περιορισμός εξαγωγών σπάνιων γαιών

ΕΠΙΚΑΙΡΟΤΗΤΑ

Τραμπ για Πεκίνο: «Πανικοβλήθηκαν και έκαναν λάθος – Δεν έχουν αυτό το περιθώριο»

ΕΠΙΚΑΙΡΟΤΗΤΑ

Μητσοτάκης στην Κ.Ο.: «Εκλογές στο τέλος της τετραετίας το 2027 με εμένα στην πρώτη γραμμή μάχης»

ΕΠΙΚΑΙΡΟΤΗΤΑ

Παγκόσμιος πανικός για τους δασμούς: Φόβοι για την οικονομία και τεράστιες ανατιμήσεις σε πασίγνωστα προϊόντα

ΕΠΙΧΕΙΡΗΣΕΙΣ

Premia Properties: Αύξηση 18% σε έσοδα και κερδοφορία για το 2024

ΕΠΙΧΕΙΡΗΣΕΙΣ

Fortune Talks: Ο Ευστάθιος Λιακόπουλος (CEO, BSS) και η δύναμη των «Μικρών Γιγάντων» στην επιχειρηματικότητα

ΕΠΙΚΑΙΡΟΤΗΤΑ

Η Ευρώπη «παλεύει» με τους δασμούς Τραμπ – Τη Δευτέρα η λίστα των «αντιποίνων»

ΕΠΙΧΕΙΡΗΣΕΙΣ

Τι περιλαμβάνει το πλάνο της νέας στρατηγικής επένδυσης της Κρι Κρι

ΕΠΙΧΕΙΡΗΣΕΙΣ

ΔΕΗ: Eνδιαφέρον από πολυεθνικές για το data center της Δυτικής Μακεδονίας

ΕΠΙΚΑΙΡΟΤΗΤΑ

Δασμοί Τραμπ: Οι πιθανότητες για παγκόσμια ύφεση αυξήθηκαν στο 60%, λέει η JP Morgan

ΕΠΙΚΑΙΡΟΤΗΤΑ

Η Τουρκία θέλει να ακυρώσει το 10% των αμερικανικών δασμών

ΕΠΙΚΑΙΡΟΤΗΤΑ

ΔΝΤ: «Σημαντικός κίνδυνος» για την παγκόσμια οικονομία οι νέοι δασμοί ΗΠΑ

COMMENTARY

Κρυπτοστοιχεία: Ο λόγος τώρα στους ρυθμιστές

COMMENTARY

Οι 4 κανόνες της οικονομικής ευφυΐας

STARTUPS

Νέος γύρος χρηματοδότησης 3,6 εκατ. ευρώ για τη Wealthyhood με επικεφαλής την Global Wealth Group

ΕΠΙΚΑΙΡΟΤΗΤΑ

«Χρυσή Κάρτα» του Τραμπ: Σε ποιους απευθύνεται, πόσο θα κοστίζει

ΕΠΙΚΑΙΡΟΤΗΤΑ

Αύξηση 6,9% στις παγκόσμιες τιμές τροφίμων για τον Μάρτιο