Mark Zuckerberg: Το Llama είναι το όπλο της Meta στη μάχη της Τεχνητής Νοημοσύνης
- 25/03/2025, 10:30
- SHARE

Από τη Sharon Goldman
Tο καλοκαίρι του 2023 το ερώτημα ήταν αν θα απελευθερωνόταν ένα Λάμα στην άγρια φύση. Βεβαίως, το εν λόγω Λάμα δεν ήταν ζώο: το Llama 2 ήταν η επόμενη κυκλοφορία του μοντέλου τεχνητής νοημοσύνης της Meta που θα μπορούσε να αμφισβητήσει το GPT-4 της OpenAI. Το πρώτο Llama είχε βγει λίγους μήνες νωρίτερα. Αρχικά προοριζόταν μόνο για ερευνητές, αλλά, αφότου διέρρευσε στο διαδίκτυο, προσείλκυσε τους προγραμματιστές, οι οποίοι λάτρευαν ό,τι δινόταν δωρεάν −σε αντίθεση με τα μεγάλα γλωσσικά μοντέλα (LLM) της OpenAI, της Google και της Anthropic− καθώς και ό,τι συνιστούσε την τελευταία λέξη της τεχνολογίας.
Επίσης, σε αντίθεση με αυτούς τους ανταγωνιστές, ήταν ανοιχτού κώδικα, πράγμα που σήμαινε ότι οι ερευνητές, οι προγραμματιστές και άλλοι χρήστες μπορούσαν να έχουν πρόσβαση στον υποκείμενο κώδικα και τα «βάρη» του, για να τον χρησιμοποιήσουν, να τον τροποποιήσουν ή να τον βελτιώσουν.
ΟΙ ΝΕΟΙ ΦΑΚΟΙ ΤΗΣ META: Ο Zuckerberg έχει ωθήσει τη Meta να εντάξει το Llama στα προϊόντα και τις υπηρεσίες της, συμπεριλαμβανομένων των γυαλιών επαυξημένης πραγματικότητας Orion (που βρίσκονται σε στάδιο πρωτοτύπου).
Ο Yann LeCun, επικεφαλής επιστήμονας Tεχνητής Nοημοσύνης της Meta, και η Joelle Pineau, αντιπρόεδρος έρευνας Tεχνητής Nοημοσύνης και επικεφαλής της ομάδας FAIR (Fundamental AI Research) της Meta, ήθελαν να δώσουν στο Llama 2 μια κυκλοφορία ανοιχτού κώδικα. Ένιωσαν ότι το να δοθεί χαρακτήρας ανοιχτού λογισμικού στο Llama 2 θα επέτρεπε στο μοντέλο να γίνει πιο ισχυρό πιο γρήγορα, με χαμηλότερο κόστος. Θα μπορούσε να βοηθήσει την εταιρεία να καλύψει τη διαφορά σε μια κούρσα παραγωγικής τεχνητής νοημοσύνης, στην οποία θεωρήθηκε ότι υστερούσε πολύ σε σχέση με τους αντιπάλους της. Αλλά υπήρχαν και σοβαροί λόγοι για να μην ακολουθηθεί αυτός ο δρόμος. Μόλις οι πελάτες συνηθίσουν σε ένα δωρεάν προϊόν, πώς μπορείς να δημιουργήσεις έσοδα από αυτό; Και όπως τόνισαν και άλλα στελέχη σε συζητήσεις για το θέμα, οι νομικές επιπτώσεις ήταν δυνητικά άσχημες: Τι θα γινόταν αν κάποιος αποσπούσε το μοντέλο για να κάνει χακάρισμα;
Θα έπεφτε στους ώμους του CEO Mark Zuckerberg, ιδρυτή και βασικού μετόχου της Meta, το βάρος να βγάλει την εταιρεία από το αδιέξοδο. Ο Zuckerberg διαφημίζει εδώ και καιρό την τεχνολογία ανοιχτού κώδικα, αλλά του αρέσει να ακούει όλες τις απόψεις. Ο ίδιος μίλησε σε «όλους που ήταν είτε υπέρ είτε κατά είτε στη μέση» σχετικά με το θέμα του ανοιχτού κώδικα, θυμάται ο Ahmad Al-Dahle, επικεφαλής παραγωγικής τεχνητής νοημοσύνης της Meta. Αλλά, τελικά, ήταν ο ίδιος, λέει ο LeCun, που πήρε την απόφαση να κυκλοφορήσει το Llama 2 ως μοντέλο ανοιχτού κώδικα: «Είπε “εντάξει, θα το κάνουμε”». Στις 18 Ιουλίου 2023, η Meta κυκλοφόρησε το Llama 2 «δωρεάν για έρευνα και εμπορική χρήση». Σε ανάρτησή του στην προσωπική του σελίδα στο Facebook, ο Zuckerberg επέμεινε στην απόφασή του. Τόνισε την πεποίθησή του ότι ο ανοιχτός κώδικας προωθεί την καινοτομία δίνοντας τη δυνατότητα σε περισσότερους προγραμματιστές να δημιουργήσουν με μια δεδομένη τεχνολογία. «Πιστεύω ότι θα ξεκλείδωνε περισσότερη πρόοδο αν το οικοσύστημα ήταν πιο ανοιχτό» έγραψε.
Photograph by DeSean McClinton holland
Το επεισόδιο θα μπορούσε απλώς να είναι άλλη μια υποσημείωση στην ταχέως εξελισσόμενη ιστορία της τεχνητής νοημοσύνης. Αλλά εκ των υστέρων, η κυκλοφορία του Llama 2 σηματοδότησε ένα κρίσιμο σταυροδρόμι για τη Meta και τον Zuckerberg, την αρχή μιας αξιοσημείωτης επιστροφής, όλα χάρη στην τεχνολογία που πήρε το όνομά της από ένα ζωάκι με γούνα που μοιάζει με καμήλα.
Μέχρι τη στιγμή που κυκλοφόρησαν τα μοντέλα Llama 3, τον Απρίλιο και τον Ιούλιο του 2024, η Llama είχε φτάσει τους ανταγωνιστές κλειστού κώδικα σε ταχύτητα και ακρίβεια. Σε πολλά σημεία αναφοράς, το μεγαλύτερο μοντέλο Llama 3 είχε φτάσει ή ξεπεράσει τα καλύτερα μοντέλα της OpenAI και της Anthropic. Ένα πλεονέκτημα υπέρ του Llama: Η Meta χρησιμοποιεί δημοσίως κοινοποιημένα δεδομένα από δισεκατομμύρια λογαριασμούς Facebook και Instagram για να εκπαιδεύσει τα μοντέλα της.
Η ιστορία του Llama θα μπορούσε να είναι ένα κομβικό κεφάλαιο στη συνεχιζόμενη συζήτηση μεταξύ μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα (γενικά πιο διαφανή, ευέλικτα και οικονομικά αποδοτικά, αλλά δυνητικά πιο εύκολα για κατάχρηση) και κλειστών μοντέλων (συχνά πιο αυστηρά ελεγχόμενα αλλά χωρίς διαφάνεια και πιο δαπανηρά στην ανάπτυξη). Εξίσου κρίσιμο είναι το γεγονός ότι το Llama βρίσκεται στον πυρήνα μιας πλήρους στρατηγικής μετατόπισης από την πλευρά της Meta για να τα παίξει όλα για όλα στην παραγωγική τεχνητή νοημοσύνη.
Αν και το ChatGPT παραμένει το κυρίαρχο εργαλείο παραγωγικής τεχνητής νοημοσύνης στη συνείδηση του κόσμου, τα μοντέλα Llama τροφοδοτούν τώρα πολλά, αν όχι τα περισσότερα, από τα προϊόντα της Meta που δισεκατομμύρια καταναλωτές συναντούν καθημερινά. Ο βοηθός τεχνητής νοημοσύνης της Meta, ο οποίος βρίσκεται στο Facebook, το Instagram, το WhatsApp και το Messenger, είναι κατασκευασμένος με το Llama, ενώ οι χρήστες μπορούν να δημιουργήσουν το δικό τους chatbot τεχνητής νοημοσύνης με το AI Studio. Τα εργαλεία δημιουργίας κειμένου για διαφημιστές είναι χτισμένα πάνω στο Llama. Το Llama τροφοδοτεί τον βοηθό συνομιλίας που αποτελεί μέρος των γυαλιών Ray-Ban της Meta και τη λειτουργία στα ακουστικά Quest που επιτρέπει στους χρήστες να κάνουν ερωτήσεις σχετικά με το περιβάλλον τους. Η εταιρεία λέγεται ότι αναπτύσσει τη δική της μηχανή αναζήτησης με τεχνητή νοημοσύνη. Και εκτός των τειχών, τα μοντέλα Llama έχουν ληφθεί πάνω από 600 εκατομμύρια φορές σε ιστότοπους όπως η κοινότητα τεχνητής νοημοσύνης ανοιχτού κώδικα Hugging Face.
«Λάβαμε αιτήματα από ανθρώπους που είπαν “Πρέπει να κάνετε ανοιχτού κώδικα αυτό το υλικό. Είναι τόσο πολύτιμο που θα μπορούσατε να δημιουργήσετε μια ολόκληρη βιομηχανία, όπως ένα νέο διαδίκτυο”». YANN LECUN, περιγράφοντας τις αντιδράσεις στη διαρροή του Llama το 2023
Ωστόσο, αυτή η μετατόπιση έχει μπερδέψει πολλούς παρατηρητές της Meta. Η εταιρεία έχει ξοδέψει δισεκατομμύρια για την κατασκευή των μοντέλων Llama: Στο πλαίσιο της πρόσκλησης για τα αποτελέσματα του τρίτου τριμήνου, η Meta προέβλεψε ότι οι κεφαλαιουχικές δαπάνες για το 2024 θα φτάσουν τα 40 δισεκατομμύρια δολάρια, με μια «σημαντική» αύξηση πιθανή το 2025.
Ορισμένοι επενδυτές δυσκολεύονται να καταλάβουν πού και πότε ακριβώς θα αρχίσουν τα έσοδα της Meta να δικαιολογούν τις εντυπωσιακές δαπάνες.
Το γιατί το ανοιχτού λογισμικού Llama είναι καλό για τη Meta είναι «το μεγάλο αίνιγμα» λέει ο Abhishek Nagaraj, αναπληρωτής καθηγητής στο Haas School of Business του Berkeley, προσθέτοντας ότι είναι «δύσκολο να δικαιολογηθεί» από καθαρά οικονομική άποψη.
Παρ’ όλα αυτά, η αναπάντεχη επιτυχία του Llama επέτρεψε στον Zuckerberg να απορρίψει τις επικρίσεις που στρέφονται στις φιλοδοξίες του ως προς το metaverse και το οδυνηρό «έτος αποτελεσματικότητας» της εταιρείας στα τέλη του 2022 και στις αρχές του 2023. Η άνοδος του Llama έδωσε επίσης στον Zuckerberg την ευκαιρία να αντιμετωπίσει μια σκιά στην καριέρα του: το γεγονός ότι το Facebook και η Meta βλέπουν συχνά τις υπηρεσίες και τα προϊόντα τους να περιορίζονται από κανόνες που επιβάλλονται από την Apple και τη Google, τους αντίπαλους γίγαντες των οποίων τα καταστήματα εφαρμογών είναι τα κύρια σημεία διανομής της Meta στην εποχή των φορητών συσκευών. Όπως έγραψε σε μια ανάρτηση ιστολογίου τον Ιούλιο, «πρέπει να διασφαλίσουμε ότι θα έχουμε πάντα πρόσβαση στην καλύτερη τεχνολογία και ότι δεν θα εγκλωβιζόμαστε στο κλειστό οικοσύστημα ενός ανταγωνιστή όπου μπορεί να περιορίσει αυτό που κατασκευάζουμε».
Με τον Llama, η Meta και ο Zuckerberg έχουν την ευκαιρία να θέσουν ένα νέο πρότυπο για τον κλάδο. «Πιστεύω ότι θα κοιτάζουμε πίσω στο Llama 3.1 ως ένα σημείο καμπής, στο οποίο η τεχνητή νοημοσύνη ανοιχτού κώδικα άρχισε να γίνεται το πρότυπο του κλάδου, όπως είναι το Linux» είπε σε τηλεσυνάντηση της Meta τον Ιούλιο, επικαλούμενος το έργο ανοιχτού κώδικα που διέκοψε την κυριαρχία των ιδιόκτητων λειτουργικών συστημάτων όπως τα Microsoft Windows.
Ίσως αυτή η πιθανότητα έκανε τον Zuckerberg ξανά ελκυστικό. Στα 40 του, δύο δεκαετίες αφότου συνίδρυσε το Facebook, φαίνεται να απολαμβάνει αυτό που πολλοί αποκαλούν «Zuckaissance», μια προσωπική και επαγγελματική αναγέννηση. Το κάποτε κοντό μαλλί του έχει δώσει τη θέση του σε πλούσιες μπούκλες, τα μονότονα hoodies έχουν αντικατασταθεί από χρυσές αλυσίδες και μεγάλα μαύρα μπλουζάκια, ενώ τις σκληρές εκφράσεις του έχουν πλέον διαδεχθεί τα χαλαρά χαμόγελα. Βρήκε ακόμη χρόνο τον Νοέμβριο για να συνεργαστεί με τους T-Pain σε ένα ριμέικ της χιπ-χοπ επιτυχίας Get Low, ένα δώρο επετείου στη σύζυγό του Priscilla Chan.
Η δουλειά της Meta για την τεχνητή νοημοσύνη ξεκίνησε στα σοβαρά το 2013, όταν ο Zuckerberg επέλεξε τον LeCun, έναν καθηγητή του NYU και πεφωτισμένο στοχαστή της τεχνητής νοημοσύνης για να διευθύνει το νέο εργαστήριο FAIR του Facebook. Ο LeCun θυμάται ότι, όταν άρχισε να «συζητά» τη θέση, η πρώτη του ερώτηση ήταν αν το Facebook θα μπορούσε να πάει σε ανοιχτό κώδικα.
«Κανείς δεν έχει το μονοπώλιο στις καλές ιδέες» είπε στον Zuckerberg, «και πρέπει να συνεργαστούμε όσο περισσότερο μπορούμε». Ο LeCun ενθουσιάστηκε με την απάντηση που πήρε: «Δεν χρειάζεται να ανησυχείς γιʼ αυτό. Έχουμε ήδη μετατρέψει σε ανοιχτού κώδικα το λογισμικό της πλατφόρμας μας και τα πάντα».
Ωστόσο, πριν από την έκρηξη του ΑΙ, η χρήση της τεχνητής νοημοσύνης από τη Meta γινόταν ως επί το πλείστον στα παρασκήνια: ενσωματωνόταν στην «κουκούλα» των αλγορίθμων εποπτείας περιεχομένου. Δεν υπήρχαν μεγάλα σχέδια για ένα προϊόν τεχνητής νοημοσύνης που να απευθύνεται στον καταναλωτή, όπως ένα chatbot − δεδομένου ότι η προσοχή του Zuckerberg ήταν στραμμένη στο metaverse.
Η παραγωγική τεχνητή νοημοσύνη άρχισε να απογειώνεται με την κυκλοφορία του ChatGPT από την OpenAI, με τη μετατόπιση της Meta να φαίνεται κάπως παράλογη. Με τις δαπάνες για το metaverse στα ύψη και τους καταναλωτές αδιάφορους, η μετοχή της έφτασε σε χαμηλό επταετίας εμπνέοντας πρωτοσέλιδα όπως «Σε πόσους μπελάδες έχει μπλέξει ο Mark Zuckerberg;». Η εταιρεία άρχισε να απολύει χιλιάδες υπαλλήλους.
Το πρώτο «μπάσιμο» της Meta στην παραγωγική τεχνητή νοημοσύνη δεν πήγε πολύ καλύτερα. Τον Νοέμβριο του 2022, το FAIR κυκλοφόρησε ένα chatbot LLM εκπαιδευμένο σε επιστημονικά κείμενα με την επωνυμία Galactica. Όπως και τα προηγούμενα μοντέλα FAIR, το Galactica κυκλοφόρησε ως ανοιχτού κώδικα, επιτρέποντας ελεύθερη πρόσβαση στους «εγκεφάλους» του μοντέλου. Αυτό το άνοιγμα είχε σκοπό να δώσει τη δυνατότητα στους ερευνητές να μελετήσουν πώς λειτουργούσε το Galactica.
Αλλά αυτές ήταν οι μέρες προτού το κοινό μάθει πλήρως την τάση των LLM να έχουν «ψευδαισθήσεις», δηλαδή να δίνουν απαντήσεις πειστικές, σίγουρες και λανθασμένες. Πολλοί επιστήμονες τρόμαξαν με το πολύ αντιεπιστημονικό αποτέλεσμα του chatbot Galactica, το οποίο περιελάμβανε ερευνητικές εργασίες που δεν υπήρχαν, σε θέματα όπως το πώς να φτιάξετε ναπάλμ σε μια μπανιέρα, τα οφέλη από την κατανάλωση θρυμματισμένου γυαλιού, και «γιατί οι ομοφυλόφιλοι είναι κακοί». Οι επικριτές χαρακτήρισαν το Galactica «ανήθικο» και «το πιο επικίνδυνο πράγμα που έχει φτιάξει η Meta μέχρι τώρα».
Έπειτα από τρεις ημέρες έντονης κριτικής, οι ερευνητές της Meta έβαλαν τίτλους τέλους στο Galactica. Δώδεκα ημέρες αργότερα, η OpenAI κυκλοφόρησε το ChatGPT, το οποίο γρήγορα έγινε viral σε όλο τον κόσμο, αξιοποιώντας το πνεύμα των καιρών (παρά τα δικά του σοβαρά προβλήματα ψευδαισθήσεων).
«Ο Zuckerberg δεν θέλει μία ή δύο εταιρείες να ελέγχουν πλήρως κάθε πρόσβαση στην τεχνητή νοημοσύνη. Ένας τρόπος με τον οποίο μπορείτε να το αποφύγετε είναι δίνοντας δωρεάν την κύρια πνευματική ιδιοκτησία, ώστε κανείς να μην αποκτήσει το μονοπώλιο». Patrick Wendell, συνιδρυτής και CTO, Databricks
«Χτυπημένοι» αλλά απτόητοι, οι ερευνητές στο FAIR πέρασαν τον χειμώνα προσαρμόζοντας μια νέα οικογένεια μοντέλων παραγωγικής τεχνητής νοημοσύνης με το όνομα LLaMA (συντομογραφία του Large Language Models Meta AI). Μετά την αντίδραση ως προς το Galactica, η Meta ήταν προσεκτική: Αντί να ανοίξει πλήρως τον κώδικα και τα μοντέλα σε όλους, ζήτησε από τους ερευνητές να υποβάλουν αίτηση για πρόσβαση και δεν προσφέρθηκε εμπορική άδεια. Όταν ρωτήθηκε γιατί, ο LeCun απάντησε στο X: «Επειδή την τελευταία φορά που κάναμε ένα LLM διαθέσιμο σε όλους, οι άνθρωποι πέταξαν βιτριόλι στο πρόσωπό μας και μας είπαν ότι αυτό επρόκειτο να καταστρέψει τον ιστό της κοινωνίας».
Παρά τους περιορισμούς, το πλήρες μοντέλο διέρρευσε στο διαδίκτυο μέσα σε λίγες εβδομάδες, καταλήγοντας στο 4chan και σε διάφορες άλλες κοινότητες τεχνητής νοημοσύνης. «Έμοιαζε κάπως σαν ελβετικό τυρί» λέει ο Nick Clegg, πρόεδρος Παγκόσμιων Υποθέσεων της Meta, για την αποτυχημένη προσπάθεια να κρατηθεί το Llama μυστικό. Η Meta υπέβαλε αιτήματα απόσυρσης σε ιστότοπους που δημοσίευσαν το μοντέλο στο διαδίκτυο, σε μια προσπάθεια να ελέγξει τη διάδοση. Ορισμένοι προειδοποίησαν για σοβαρές επιπτώσεις και αποδοκίμασαν τη Meta: «Ετοιμαστείτε για ένα σωρό εξατομικευμένα ανεπιθύμητα μηνύματα και επιθέσεις phishing» δημοσίευσε ο ερευνητής κυβερνοασφάλειας Jeffrey Ladish στο X. Η αναστάτωση έφτασε μέχρι το Καπιτώλιο. Τον Ιούνιο του 2023, δύο γερουσιαστές των ΗΠΑ έγραψαν μια επιστολή στον Zuckerberg, επικρίνοντας το λανσάρισμα του Llama και προειδοποιώντας για την πιθανή χρήση του για απάτη, κακόβουλο λογισμικό, παρενόχληση και παραβιάσεις ιδιωτικότητας. Η επιστολή ανέφερε ότι η προσέγγιση της Meta για τη διανομή προηγμένης τεχνητής νοημοσύνης «εγείρει σοβαρά ερωτήματα σχετικά με την πιθανότητα κακής χρήσης ή κατάχρησης».
Αλλά την ίδια στιγμή, λέει ο LeCun, ο ίδιος και άλλοι ηγέτες της Meta αιφνιδιάστηκαν από τη μεγάλη ζήτηση από ερευνητές και προγραμματιστές για το μοντέλο Llama που διέρρευσε. Αυτοί οι επίδοξοι χρήστες ήθελαν την ευελιξία και τον έλεγχο που συνοδεύει την ανοιχτή πρόσβαση σε ένα πολύ ισχυρό LLM. Μια δικηγορική εταιρεία, για παράδειγμα, θα μπορούσε να το χρησιμοποιήσει για να εκπαιδεύσει ένα εξειδικευμένο μοντέλο για νομική χρήση και να κατέχει την πνευματική ιδιοκτησία. Μια εταιρεία υγειονομικής περίθαλψης θα μπορούσε να ελέγξει και να διαχειριστεί τα δεδομένα πίσω από το μοντέλο, διασφαλίζοντας τη συμμόρφωση με το HIPAA. Οι ερευνητές θα μπορούσαν να πειραματιστούν και να εξετάσουν την εσωτερική λειτουργία του μοντέλου. «Λάβαμε αιτήματα από ανθρώπους που έλεγαν “πρέπει να κάνετε ανοιχτού κώδικα αυτό το υλικό. Είναι τόσο πολύτιμο που θα μπορούσατε να δημιουργήσετε έναν ολόκληρο κλάδο, όπως ένα νέο διαδίκτυο”» λέει ο LeCun.
Τα μηνύματα ήρθαν απευθείας στον Zuckerberg, στον CTO Andrew «Boz» Bosworth και στον LeCun, οδηγώντας σε εβδομαδιαίες τηλεσυναντήσεις στις οποίες οι ηγέτες συζητούσαν τι έπρεπε να κάνουν. Θα έπρεπε να κάνουν την επόμενη έκδοση ανοιχτού κώδικα; Τα οφέλη υπερτερούσαν των κινδύνων; Μέχρι τα μέσα του καλοκαιριού, ο Zuckerberg είχε αποφασίσει, με την υποστήριξη των Pineau και LeCun – γεγονός που οδήγησε στη μεγάλη αποκάλυψη του Ιουλίου του 2023.
Το Llama 2 δεν ήταν εντελώς ανοιχτό. Η Meta δεν αποκάλυψε τα σύνολα δεδομένων, συμπεριλαμβανομένου όλου του υλικού του Facebook και του Instagram, που χρησιμοποιήθηκαν για την εκπαίδευση του μοντέλου, τα οποία θεωρούνται ευρέως ως το βασικό ανταγωνιστικό του πλεονέκτημα. Περιόρισε επίσης τη χρήση από εταιρείες με περισσότερους από 700 εκατομμύρια μηνιαίους ενεργούς χρήστες, με κύριο στόχο να αποτρέψει τους ανταγωνιστές της Meta από το Big Tech. Αλλά ο πηγαίος κώδικας και τα βάρη του μοντέλου μπορούσαν να ληφθούν, και το Meta ενθάρρυνε τους χρήστες να συνεισφέρουν βελτιώσεις, διορθώσεις σφαλμάτων και εκλεπτύνσεις των αποτελεσμάτων σε μια συνεργατική κοινότητα. Ακόμη και πριν από την κυκλοφορία του Llama 2, ο Zuckerberg είχε θέσει τις βάσεις για να το αντιμετωπίσει σαν το next big thing της Meta. Μετά την κυκλοφορία του πρώτου μοντέλου Llama, τον Φεβρουάριο του 2023, ο Zuckerberg συγκέντρωσε γρήγορα μια ομάδα από όλη την εταιρεία, συμπεριλαμβανομένου του FAIR, για να επικεντρωθεί στην επιτάχυνση της έρευνας & ανάπτυξης της παραγωγικής τεχνητής νοημοσύνης, προκειμένου να την τοποθετήσει στις λειτουργίες και τα εργαλεία της εφαρμογής Meta. Επέλεξε τον Ahmad Al-Dahle, ένα πρώην στέλεχος της Apple που είχε ενταχθεί στη Meta το 2020 για να εργαστεί σε προϊόντα metaverse, για να ηγηθεί της νέας ομάδας.
Σε συνάντηση όλων των συναρμόδιων στελεχών τον Ιούνιο του 2023, ο Zuckerberg μοιράστηκε το όραμά του για το μέλλον της Meta που τροφοδοτείται από τεχνητή νοημοσύνη. Η Meta ενσωματώνει παραγωγική τεχνητή νοημοσύνη σε όλα της τα προϊόντα, είπε, και επιβεβαίωσε τη δέσμευση της εταιρείας σε μια «ανοιχτή επιστημονική προσέγγιση» στην έρευνα για την τεχνητή νοημοσύνη. «Είχα μια μεγάλη αποστολή» λέει ο Al-Dahle: «Να αναπτύξουμε μοντέλα τελευταίας τεχνολογίας και να τα τοποθετήσουμε στο προϊόν με ταχύτητα-ρεκόρ».
Με άλλα λόγια: το παιχνίδι παιζόταν ακόμα για το Llama.
Η στρατηγική της Meta μπορεί να φαίνεται αντιφατική, καθώς προέρχεται από μια εταιρεία με ετήσια έσοδα 135 δισεκατομμυρίων δολαρίων. Το λογισμικό ανοιχτού κώδικα έχει θεωρηθεί ένας τρόπος για τον εκδημοκρατισμό της τεχνολογίας προς όφελος νεοφυών επιχειρήσεων ή ομάδων με περιορισμένους πόρους, δηλαδή οντοτήτων που δυσκολεύονται να ανταγωνιστούν γίγαντες όπως η Meta.
Σε μια ανάρτηση ιστολογίου τον Ιούλιο του 2024 με τίτλο «Open Source Is the Path Forward», ο Zuckerberg κατέστησε σαφές ότι το να χαρίζεις το Llama δεν είναι μια αλτρουιστική κίνηση. Η χρήση ανοιχτού κώδικα, είπε, θα έδινε στη Meta ανταγωνιστικό πλεονέκτημα στην κούρσα της τεχνητής νοημοσύνης και θα μπορούσε τελικά να κάνει το Llama την πιο δημοφιλή πλατφόρμα για την παραγωγική τεχνητή νοημοσύνη.
Τώρα που το Llama είχε έναν χρόνο επιπλέον για να αποδείξει την αξία του, ορισμένοι βρίσκουν την επιχειρηματολογία του «Zuck» πειστική. Η Shweta Khajuria, αναλύτρια της Wolfe Research που καλύπτει τη Meta, αποκαλεί την κυκλοφορία του Llama ως ανοιχτού κώδικα εφαρμογή «ιδιοφυή απόφαση» που θα επιτρέψει στη Meta να προσελκύσει κορυφαία ταλέντα, να επιταχύνει την καινοτομία στη δική της πλατφόρμα, να αναπτύξει νέες πηγές εσόδων και να παρατείνει τη μακροζωία της. Ήδη, εξηγεί, η μετατροπή του Llama σε ανοιχτού κώδικα βασικά επέτρεψε στη Meta να προσεγγίσει γρήγορα τις OpenAI, Google και Anthropic, εν μέρει επειδή χιλιάδες προγραμματιστές βασίζονται στο Llama με τρομακτικό ρυθμό. «Αν δεν το είχαν κάνει ανοιχτού κώδικα, πιθανότατα θα χρειαζόταν πολύ περισσότερος χρόνος για να βρεθούν στο ίδιο επίπεδο με άλλα πρωτοποριακά μοντέλα» παρατηρεί η ίδια. Η Khajuria πιστεύει ότι θα υπάρξουν πολλές ευκαιρίες δημιουργίας εσόδων για τη Meta στη συνέχεια, όπως επιλογές συνδρομής και διαφήμισης για τρέχουσες λειτουργίες τεχνητής νοημοσύνης της Meta που βασίζονται στο Llama, καθώς και επαγγελματικά μηνύματα εντός εφαρμογής που υποστηρίζονται από τεχνητή νοημοσύνη. «Η Meta επωφελείται από το ότι έχει δισεκατομμύρια χρήστες, ενώ τα Perplexity, Claude και ChatGPT δεν έχουν απαραίτητα αυτήν τη βάση» λέει. «Μόλις αποκτήσουν μια κρίσιμη μάζα χρηστών και χρήση σε όλο τον κόσμο, θα μπορούν να δημιουργούν έσοδα».
Ο Zuckerberg έχει επίσης αναφερθεί στο γεγονός ότι το ίδιο το περιεχόμενο που δημιουργείται από την τεχνητή νοημοσύνη θα είναι πολύτιμο (αν και άλλοι έχουν επικρίνει ένα τέτοιο περιεχόμενο ως «αδιάφορο»). Σε πρόσφατη τηλεσυνάντηση, ο Zuckerberg είπε: «Πιστεύω ότι θα προσθέσουμε μια νέα κατηγορία περιεχομένου που είτε δημιουργείται είτε συνοψίζεται από τεχνητή νοημοσύνη, ή υπάρχον περιεχόμενο που συγκεντρώνεται με κάποιο τρόπο από την τεχνητή νοημοσύνη, και νομίζω ότι αυτό θα είναι πολύ συναρπαστικό για το Facebook και το Instagram και ίσως και το Threads ή άλλα είδη εμπειριών feed».
Ο Patrick Wendell είναι συνιδρυτής και αντιπρόεδρος μηχανικής στην εταιρεία δεδομένων και τεχνητής νοημοσύνης Databricks, η οποία κυκλοφόρησε τα μοντέλα Llama 3.1 της Meta στην πλατφόρμα της τον Ιούλιο. Και αντιλαμβάνεται την κίνηση της Meta ως πολύ πιο εκτεταμένη. Αν το διαδίκτυο ήταν το πρώτο μεγάλο κύμα τεχνολογίας που επέτρεψε τη δημιουργία του Facebook και το mobile ήταν το δεύτερο, με κυριαρχία της Apple και της Google, «νομίζω ότι ο υπολογισμός του Zuckerberg είναι ότι το τρίτο μεγάλο κύμα έρχεται και δεν θέλει μία ή δύο εταιρείες να ελέγχουν πλήρως όλη την πρόσβαση στην τεχνητή νοημοσύνη» λέει ο Wendell.
«Ένας τρόπος με τον οποίο μπορείτε να το αποφύγετε είναι βασικά δίνοντας δωρεάν τη βασική πνευματική ιδιοκτησία, ώστε να μην αποκτήσει κανείς το μονοπώλιο».
Ορισμένοι επικριτές υποστηρίζουν ότι η Meta δεν πρέπει να χρησιμοποιεί καθόλου τον όρο «ανοιχτού κώδικα». Οι τρέχουσες εκδόσεις του Llama εξακολουθούν να έχουν περιορισμούς που δεν έχει το παραδοσιακό λογισμικό ανοιχτού κώδικα (συμπεριλαμβανομένης της έλλειψης πρόσβασης σε σύνολα δεδομένων). Τον Οκτώβριο, το Open Source Initiative (Πρωτοβουλία Ανοικτού Κώδικα), η οποία επινόησε τον όρο, επέκρινε τη Meta για «σύγχυση» των χρηστών και «μόλυνση» της ορολογίας και σημείωσε ότι η Google και η Microsoft είχαν εγκαταλείψει τη χρήση του όρου (χρησιμοποιώντας τη φράση «ανοιχτά βάρη»). Ο Clegg, επικεφαλής Παγκόσμιων Υποθέσεων της Meta, είναι ωμός ως προς τα αντεπιχειρήματά του: Όπως λέει, η συζήτηση του θυμίζει «τους ανθρώπους που αναστατώνονται πολύ για το πώς το βινύλιο είναι το μόνο αληθινό είδος που ορίζει την καλή μουσική». Μόνο μια χούφτα επιστημονικών και χαμηλής απόδοσης μοντέλων θα ταίριαζαν στον ορισμό, συνεχίζει: «Κανείς δεν έχει την πνευματική ιδιοκτησία σε αυτές τις δύο αγγλικές λέξεις». Πέρα από την ονοματολογία, η Meta κερδίζει εκεί που έχει σημασία. Ο Nathan Lambert, ερευνητής στο μη κερδοσκοπικό Ινστιτούτο Allen για την τεχνητή νοημοσύνη, λέει ότι, ενώ οι ορισμοί μπορεί να αμφισβητούνται, περισσότερο από το 90% των μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα που χρησιμοποιούνται αυτήν τη στιγμή βασίζονται στο Llama. Οι προγραμματιστές ανοιχτού κώδικα αποδέχονται ότι ο Zuckerberg «έχει κάποιες εταιρικές πραγματικότητες που θα διαστρεβλώσουν τα μηνύματά του» λέει. «Στο τέλος της ημέρας, η κοινότητα χρειάζεται μοντέλα Llama».
Εσωτερικά στη Meta, το Llama και οι επιχειρηματικές δραστηριότητες που παράγουν έσοδα γίνονται ολοένα και πιο αδιαχώριστα.
Τον Ιανουάριο, ο Zuckerberg μετέφερε το FAIR, την ερευνητική ομάδα τεχνητής νοημοσύνης, στο ίδιο τμήμα της εταιρείας με την ομάδα που αναπτύσσει προϊόντα παραγωγικής τεχνητής νοημοσύνης στις εφαρμογές της Meta. Ο LeCun και η Pineau αναφέρονται τώρα απευθείας στον επικεφαλής προϊόντων Chris Cox, όπως και ο Al-Dahle. «Νομίζω ότι είναι πολύ λογικό να φέρουμε το FAIR κοντά στην οικογένεια των προϊόντων εφαρμογών» λέει η Pineau και επισημαίνει ότι, ακόμη και πριν από τον αναπροσανατολισμό, η έρευνα πάνω στην οποία εργαζόταν η ομάδα της κατέληγε συχνά σε προϊόντα Meta μόλις λίγους μήνες αργότερα.
Ο Zuckerberg ανέθεσε επίσης στο FAIR κάτι πολύ πιο φιλόδοξο: την ανάπτυξη τεχνητής γενικής νοημοσύνης (AGI), ενός τύπου AI που διαθέτει ανθρώπινη νοημοσύνη. Η εταιρεία προτιμά να χρησιμοποιεί τον όρο «προηγμένη μηχανική νοημοσύνη» (ΑΜΙ), αλλά, όπως και να λέγεται, παρατηρεί η Pineau, η Meta έχει τώρα έναν «πραγματικό οδικό χάρτη» για να τη δημιουργήσει − που βασίζεται, κατά πάσα πιθανότητα, σε ένα ακμάζον Llama. Εν τω μεταξύ, η εταιρεία εργάζεται σκληρά πάνω σε μοντέλα Llama 4 που εκπαιδεύονται επί του παρόντος σε ένα σύμπλεγμα με πάνω από 100.000 ακριβές GPU της Nvidia − ένα σύμπλεγμα που ο Zuckerberg είπε πρόσφατα ότι ήταν «μεγαλύτερο από οτιδήποτε έχω δει να αναφέρεται σε σχέση με ό,τι κάνουν οι άλλοι».
Δεν αρέσει σε όλους η ιδέα ενός Llama που είναι μεγαλύτερο από οτιδήποτε άλλο. Για χρόνια, ο Zuckerberg και η εταιρεία του έχουν βρεθεί αντιμέτωποι με τη δυσπιστία του κοινού σχετικά με τον τρόπο με τον οποίο χρησιμοποιούν άλλους τύπους τεχνητής νοημοσύνης για την εξατομίκευση των ειδήσεων, τον έλεγχο του περιεχομένου και τη στόχευση διαφημίσεων στο Facebook, το Instagram και το WhatsApp. Οι επικριτές κατηγόρησαν τους αλγορίθμους του ότι επιτείνουν την πόλωση, τις κρίσεις ψυχικής υγείας των εφήβων και την παραπληροφόρηση (κατηγορίες που η Meta έχει αρνηθεί ή αντικρούσει). Ήταν ίσως αναπόφευκτο ότι το Llama θα βρισκόταν αντιμέτωπο με επιπλέον έλεγχο.
Μερικοί φοβούνται ότι ένα μοντέλο ανοιχτού κώδικα όπως το Llama καθίσταται επικίνδυνο στα χέρια κακόβουλων δρώντων, ακριβώς επειδή είναι πολύ ανοιχτό. Αυτές οι ανησυχίες μπορεί να αυξηθούν στη σημερινή τεταμένη γεωπολιτική ατμόσφαιρα. Την 1η Νοεμβρίου 2024, το Reuters ανέφερε ότι ο στρατός της Κίνας είχε κατασκευάσει εφαρμογές τεχνητής νοημοσύνης για στρατιωτική χρήση με βάση μια πρώιμη έκδοση του Llama.
Μια κυβέρνηση Trump θα μπορούσε να κάνει ακόμα πιο περίπλοκη τη διατήρηση του Llama σε ανοιχτό κώδικα. Ο οικονομικός εθνικισμός του Trump υποδηλώνει ότι σίγουρα δεν θα ήθελε η Κίνα (ή οποιαδήποτε άλλη χώρα) να έχει πρόσβαση σε μοντέλα τεχνητής νοημοσύνης αιχμής στην Αμερική. Αλλά το μέλλον του Llama μπορεί να εξαρτάται από το ποιον ακούει ο Trump: ο αντιπρόεδρος JD Vance έχει μιλήσει υπέρ της τεχνητής νοημοσύνης ανοιχτού κώδικα στο παρελθόν, ενώ η xAI του Elon Musk έχει μετατρέψει σε ανοιχτού κώδικα το chatbot Grok (και ο Musk συνίδρυσε την OpenAI ως ένα εργαστήριο ανοιχτού κώδικα).
Ακόμη και μερικοί από τους παλαιότερους φίλους του Zuckerberg έχουν ανησυχίες για αυτή την κούρσα. Ο Dustin Moskovitz, συνιδρυτής του Facebook και τώρα διευθύνων σύμβουλος της Asana (και ιδρυτής του Open Philanthropy, ενός από τους μεγαλύτερους χρηματοδότες πρωτοβουλιών για την ασφάλεια της τεχνητής νοημοσύνης), λέει ότι, αν και δεν είναι εναντίον των LLM ανοιχτού κώδικα, «δεν νομίζω ότι είναι σκόπιμο να συνεχίσουμε να κυκλοφορούμε πιο ισχυρές εκδόσεις».
Αλλά ο Zuckerberg και οι σύμμαχοί του, τόσο εντός όσο και εκτός Meta, υποστηρίζουν ότι οι κίνδυνοι των μοντέλων ανοιχτού κώδικα είναι στην πραγματικότητα λιγότεροι από αυτούς που δημιουργούνται πίσω από ιδιόκτητες κλειστές πόρτες. Η προληπτική ρύθμιση των βλαβών της τεχνητής νοημοσύνης ανοιχτού κώδικα θα καταπνίξει την καινοτομία, λένε. Σε ένα κείμενό του τον Αύγουστο, ο συνιδρυτής του Zuckerberg και του Spotify, Daniel Ek, σημείωσε ότι η ανάπτυξη ανοιχτού κώδικα είναι «η καλύτερη ευκαιρία για την αξιοποίηση της τεχνητής νοημοσύνης για την προώθηση της προόδου και τη δημιουργία οικονομικών ευκαιριών και ασφάλειας για όλους».
Όποιο κι αν είναι το αποτέλεσμα του ολοένα και πιο ισχυρού ακτιβισμού της Meta για τον ανοιχτό κώδικα, πολλοί υποστηρίζουν ότι ο Zuckerberg είναι ακριβώς ο σωστός αγγελιαφόρος. Η προσωπική του συμμετοχή στην προώθηση του Llama και του ανοιχτού κώδικα, συμφωνούν οι μυημένοι, είναι ο βασικός λόγος που η Meta μπόρεσε να κινηθεί με τέτοια ταχύτητα και εστίαση. «Είναι ένας από τους λίγους ιδρυτές-ηγέτες που έχουν απομείνει σε αυτές τις μεγάλες εταιρείες τεχνολογίας» λέει ο Clegg. «Ένα από τα μεγάλα πλεονεκτήματα αυτού του πράγματος είναι ότι έχετε μια μικρή και ευέλικτη γραμμή διοίκησης».
Ο Zuckerberg ήταν επίσης ενεργός στη στρατολόγηση ταλέντων του AI, συχνά προσεγγίζοντάς τα προσωπικά. Ένα δημοσίευμα του Μαρτίου του 2024 ανέφερε ότι ο Zuckerberg προσείλκυε ερευνητές από την DeepMind της Google στέλνοντας email που τόνιζαν πόσο σημαντική ήταν η τεχνητή νοημοσύνη για την εταιρεία.
Ο Erik Meijer, ο οποίος πέρασε οκτώ χρόνια στη Meta ηγούμενος μιας ομάδας που επικεντρώθηκε στη μηχανική μάθηση πριν απολυθεί τον Νοέμβριο του 2022, πιστεύει ότι μια τέτοια συνολική αλλαγή είναι δυνατή μόνο με κάποιον σαν τον Zuckerberg στην κορυφή. «Είναι σαν να περιστρέφεις ένα γιγαντιαίο supertanker» λέει. «Είναι λίγο σαν ένας καλτ ήρωας μέσα στην εταιρεία, με την καλή έννοια, οπότε νομίζω ότι αυτό βοηθάει να ευθυγραμμιστούν όλοι προς την ίδια κατεύθυνση». Η αναμόρφωση του Zuckerberg, όπως παρατηρεί ο Meijer, είναι «ίσως ένα πολύ ορατό σημάδι ανανέωσης».
Η ανανέωσή του και ο μετασχηματισμός της Meta είναι βέβαιο ότι θα δοκιμάσουν την υπομονή των επενδυτών. Η Khajuria, η αναλύτρια της Wolfe, λέει ότι οι επενδυτές θα το ανεχτούν προς το παρόν, «επειδή η Meta έχει θέσει τις βάσεις για να πει στους ανθρώπους ποια είναι η ευκαιρία». Τούτου λεχθέντος, εάν τα έσοδα δεν αρχίσουν να επιταχύνονται πηγαίνοντας από το 2025 στο 2026, «νομίζω ότι οι επενδυτές θα αρχίσουν να χάνουν την υπομονή τους» προειδοποιεί. (Ο Zuckerberg είναι κάπως αποστασιοποιημένος από τη δυσαρέσκεια των επενδυτών· ελέγχει περίπου το 61% των μετοχών με δικαίωμα ψήφου στη Meta.)
Ένα πράγμα είναι ξεκάθαρο, λέει ο LeCun: Το είδος του τζόγου που κάνει η Meta, με την τεράστια επένδυσή της σε GPU και όλα τα πράγματα που σχετίζονται με την τεχνητή νοημοσύνη, απαιτεί έναν ηγέτη πρόθυμο να κάνει μεγάλες αλλαγές. Και η Meta δεν έχει μόνον αυτό τον ηγέτη, αλλά και μια τεράστια κερδοφόρα επιχειρηματική δραστηριότητα για να χρηματοδοτήσει το όραμα. Ως αποτέλεσμα, βρίσκεται και πάλι στο επίκεντρο της πιο σημαντικής συζήτησης στο σταυροδρόμι τεχνολογίας και επιχειρήσεων − και η συζήτηση δεν αφορά τα άβαταρ χωρίς πόδια του metaverse.
*Το άρθρο δημοσιεύεται στο νέο τεύχος του Fortune Greece κυκλοφορεί από την Παρασκευή 14/03 στα περίπτερα.
**Κεντρική Φωτογραφία: David Paul Morris—Bloomberg/Getty Images