Τεχνητή νοημοσύνη: Τι είναι και τι φέρνει το Gemini, το «μεγαλύτερο και ικανότερο» μοντέλο AI της Google

Τεχνητή νοημοσύνη: Τι είναι και τι φέρνει το Gemini, το «μεγαλύτερο και ικανότερο» μοντέλο AI της Google
ANKARA, TURKIYE - JUNE 21: In this photo illustration a mobile phone screen displays Google homepage with the Google Lens logo in back of it, in Ankara, Turkiye on June 21, 2023. Utku Uçrak / Anadolu Agency (Photo by Utku Uçrak / ANADOLU AGENCY / Anadolu Agency via AFP) Photo: AFP
Η Google δήλωσε επίσης ότι ενεργοποιεί άμεσα το Gemini στο Pixel 8 Pro, το τηλέφωνο-ναυαρχίδα της.

Με τον ανταγωνισμό των μεγάλων τεχνολογικών κολοσσών για την τεχνητή νοημοσύνη, η Google παρουσίασε την Τετάρτη το Gemini αυτό που η θυγατρικήτ ης Alphabet υποστηρίζει πως είναι «το μεγαλύτερο και ικανότερο μοντέλο AI» που έχει φτιάξει ποτέ η εταιρεία.

Στην παρουσίαση του μοντέλου η Google υπογράμμισε ότι το Gemini είναι το πιο ευέλικτο μοντέλο που έχει φτιάξει, επειδή κυκλοφορεί σε διάφορα μεγέθη, συμπεριλαμβανομένης μιας έκδοσης που μπορεί να τρέξει απευθείας σε smartphones. Αυτό διαφοροποιεί το πρόγραμμα από άλλους ανταγωνιστές.

Το μοντέλο τεχνητής νοημοσύνης, ένα σύστημα που χρησιμοποιείται για να στηρίξει όλα τα είδη εφαρμογών γεννητικής τεχνητής νοημοσύνης, θα έχει τρεις εκδόσεις. Αυτές είναι οι Gemini Ultra, Gemini Pro και Gemini Nano.

Ο Έλι Κόλινς, αντιπρόεδρος του τμήματος προϊόντων της Google DeepMind, δήλωσε ότι το Gemini είναι «ικανό να τρέξει σε όλα, από κινητές συσκευές έως κέντρα δεδομένων μεγάλης κλίμακας».

«Εδώ και πολύ καιρό, θέλαμε να δημιουργήσουμε μια νέα γενιά μοντέλων τεχνητής νοημοσύνης, εμπνευσμένη από τον τρόπο με τον οποίο οι άνθρωποι κατανοούν και αλληλεπιδρούν με τον κόσμο. Μια τεχνητή νοημοσύνη που να μοιάζει περισσότερο με έναν χρήσιμο συνεργάτη και λιγότερο με ένα έξυπνο λογισμικό. Το Gemini μας φέρνει ένα βήμα πιο κοντά σε αυτό το όραμα» είπε ο Κόλινς μιλώντας σε δημοσιογράφους, σύμφωνα με το Bloomberg.

Οι διαφορές με τον ChatGPT

Πριν από την κυκλοφορία του μοντέλου, η εταιρεία «έτρεξε» το Gemini σε μια σειρά από τυποποιημένα βιομηχανικά τεστ και δήλωσε ότι σε έξι από τις οκτώ από αυτές τις δοκιμές, το Gemini Pro ξεπέρασε το μοντέλο GPT-3.5 της OpenAI.

Η Google δήλωσε ότι το Gemini ξεπέρασε επίσης το GPT-4 σε επτά από τα οκτώ συγκριτικά κριτήρια που εξέτασε για τη γενική κατανόηση της γλώσσας, τη συλλογιστική, τα μαθηματικά και την κωδικοποίηση.

Εν τω μεταξύ, η Google εκτίμησε ότι το AlphaCode 2 -το πιο πρόσφατο προϊόν γεννητικής τεχνητής νοημοσύνης της εταιρείας που μπορεί να εξηγήσει και να δημιουργήσει κώδικα- ξεπέρασε το 85% των αντιπάλων στον τομέα του ανταγωνιστικού προγραμματισμού.Η εταιρεία δημοσίευσε μια τεχνική έκθεση που εξηγεί σε μεγαλύτερο βάθος την αρχιτεκτονική του μοντέλου Gemini, τη διαδικασία εκπαίδευσης και την αξιολόγηση.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Οι υπηρεσίες

Από την Τετάρτη, οι προγραμματιστές Android που θέλουν να δημιουργήσουν εφαρμογές με τη βοήθεια του Gemini για smartphones και tablets θα μπορούν να εγγραφούν για τη nano έκδοση του μοντέλου τεχνητής νοημοσύνης, η οποία μπορεί να τρέξει απευθείας σε τέτοιες συσκευές.

Η Google δήλωσε επίσης ότι ενεργοποιεί άμεσα το Gemini στο Pixel 8 Pro, το τηλέφωνο-ναυαρχίδα της, όπου θα τροφοδοτεί νέα χαρακτηριστικά generative AI, όπως η δυνατότητα σύνοψης σημείων από μια καταγεγραμμένη τηλεφωνική συνομιλία.

Την επόμενη εβδομάδα, η Google καθιστά το Gemini Pro διαθέσιμο για πελάτες cloud μέσω των πλατφορμών Vertex AI και AI Studio, σύμφωνα με την ανακοίνωση.

Το Gemini Ultra, η μεγαλύτερη έκδοση του μοντέλου AI της Google, θα είναι διαθέσιμο πρώτα σε ένα πρόγραμμα πρώιμης πρόσβασης για προγραμματιστές και εταιρίες επιχειρήσεων, ενώ λεπτομέρειες σχετικά με το πρόγραμμα θα ανακοινωθούν την επόμενη εβδομάδα.

Θα κυκλοφορήσει ευρύτερα στο κοινό στις αρχές του επόμενου έτους.

Το Gemini θα είναι επίσης σε θέση να ενσωματωθεί με την τεράστια «σουίτα» εφαρμογών και υπηρεσιών της Google μέσω του Bard, του βοηθού AI της εταιρείας και αντίπαλου του ChatGPT της OpenAI.

Προηγουμένως, το Bard χρησιμοποιούσε το μοντέλο PaLM 2 της Google, ένα μεγάλο γλωσσικό μοντέλο που η εταιρεία ανακοίνωσε στο ετήσιο συνέδριο προγραμματιστών της τον Μάιο.

Τον τελευταίο χρόνο, η Google δέχεται πιέσεις για να επανεφεύρει τον πυρήνα της επιχείρησης αναζήτησης της και να ανταποκριθεί στην άνοδο των προγραμμάτων τεχνητής νοημοσύνης που μπορούν να παράγουν περιεχόμενο.

Παρόλο που η εταιρεία θεωρείται εδώ και καιρό πρωτοπόρος στην έρευνα της τεχνητής νοημοσύνης, ορισμένοι έχουν επικρίνει τη διοίκησή της για την αργοπορία της στην αγορά όσον αφορά τα προϊόντα τεχνητής νοημοσύνης, ειδικά μετά τις ιογενείς επιτυχίες προϊόντων όπως το ChatGPT και η γεννήτρια εικόνων Dall-E.

Μετά την κυκλοφορία του GPT-4 της OpenAI τον Μάρτιο, η Google προσπαθεί να επαναβεβαιώσει την ηγετική της θέση στον τομέα, συμπεριλαμβανομένης της ένεσης της νέας τεχνολογίας στην επιχείρηση αναζήτησης που ωριμάζει.

Το Gemini είναι η απάντηση της εταιρείας σε αυτή την πίεση της αγοράς. Η Google δήλωσε ότι το μοντέλο τεχνητής νοημοσύνης είναι «εγγενώς πολυτροπικό», πράγμα που σημαίνει ότι είχε προ-εκπαιδευτεί από την αρχή για να χειρίζεται τόσο προτροπές κειμένου όσο και προτροπές εικόνας από τους χρήστες. Για παράδειγμα, σε ένα βίντεο επίδειξης, η Google έδειξε πώς ένας γονέας μπορεί να βοηθήσει με την εργασία του παιδιού του ανεβάζοντας μια εικόνα ενός μαθηματικού προβλήματος μαζί με μια φωτογραφία από τις προσπάθειες επίλυσής του σε ένα worksheet.

«Το Gemini όχι μόνο μπορεί να λύσει αυτά τα προβλήματα, αλλά μπορεί να διαβάσει τις απαντήσεις και να καταλάβει τι ήταν σωστό και τι λάθος και να εξηγήσει τις έννοιες που χρειάζονται περισσότερες διευκρινίσεις» δήλωσε ο Τέιλορ Άπλμπαουμ, μηχανικός λογισμικού της Google, στην επίδειξη.

Η εταιρεία δήλωσε επίσης ότι η «γεννητική εμπειρία αναζήτησης» – μια πειραματική έκδοση της μηχανής αναζήτησης της Google που χρησιμοποιεί τη γεννητική τεχνολογία τεχνητής νοημοσύνης της- θα ενσωματώσει τις νέες δυνάμεις του Gemini μέχρι το επόμενο έτος.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: Bloomberg.com