Μετά από το «μπαμ» της DeepSeek, οι Αμερικανοί «ξεψαχνίζουν» τα μοντέλα AI της κινεζικής εταιρείας

deepseek
The DeepSeek AI application is seen on a mobile phone in this photo illustration taken in Warsaw, Poland on 27 January, 2025. (Photo by Jaap Arriens/NurPhoto) (Photo by Jaap Arriens / NurPhoto / NurPhoto via AFP) Photo: AFP
Οι ανησυχίες για τον ανταγωνισμό ήχησαν σε όλη την αμερικανική χρηματιστηριακή αγορά.

Σε μια προσπάθεια να βρουν «κενά» στη λειτουργία των μοντέλων τεχνητής νοημοσύνης της DeepSeek επιδίδονται προγραμματιστές σε κορυφαίες αμερικανικές εταιρείες τεχνητής νοημοσύνης, στον απόηχο του παγκόσμιου ενδιαφέροντος που έχει προκαλέσει στο χώρο της AI η κινεζική εταιρεία, σύμφωνα με το Reuters.

Σημειώνεται πως η DeepSeek προκάλεσε τη Δευτέρα ένα ξεπούλημα μετοχών και ο δωρεάν βοηθός τεχνητής νοημοσύνης της ξεπέρασε το ChatGPT της OpenAI στην κορυφή του App Store της στις ΗΠΑ, αξιοποιώντας ένα μοντέλο που είπε ότι εκπαιδεύτηκε σε τσιπ επεξεργαστή H800 της Nvidia χαμηλότερης ικανότητας χρησιμοποιώντας λιγότερα από 6 εκατομμύρια δολάρια.

Καθώς οι ανησυχίες για τον ανταγωνισμό αντηχούσαν σε όλη την αμερικανική χρηματιστηριακή αγορά, ορισμένοι ειδικοί της AI επικρότησαν την ισχυρή ομάδα και την ενημερωμένη έρευνα της DeepSeek, αλλά παρέμειναν ατάραχοι από την εξέλιξη, δήλωσαν άνθρωποι που γνωρίζουν τις σκέψεις σε τέσσερα από τα κορυφαία εργαστήρια AI.

Ο διευθύνων σύμβουλος της OpenAI, Σαμ Άλτμαν, έγραψε στο X ότι το R1, ένα από τα διάφορα μοντέλα που κυκλοφόρησε η DeepSeek τις τελευταίες εβδομάδες, «είναι ένα εντυπωσιακό μοντέλο, ιδιαίτερα σε σχέση με το τι είναι σε θέση να προσφέρει για την τιμή». Η Nvidia ανέφερε σε ανακοίνωσή της ότι το επίτευγμα της DeepSeek απέδειξε την ανάγκη για περισσότερα από τα τσιπ της.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Η εταιρεία κατασκευής λογισμικού Snowflake αποφάσισε τη Δευτέρα να προσθέσει τα μοντέλα DeepSeek στην αγορά μοντέλων τεχνητής νοημοσύνης της, αφού έλαβε έναν καταιγισμό ερωτημάτων από πελάτες.

Με τους υπαλλήλους να αποκαλούν επίσης τα μοντέλα της DeepSeek «καταπληκτικά», ο αμερικανικός πωλητής λογισμικού στάθμισε τους πιθανούς κινδύνους της φιλοξενίας τεχνολογίας AI που αναπτύχθηκε στην Κίνα προτού τελικά αποφασίσει να την προσφέρει στους πελάτες, δήλωσε ο Κριστιάν Κλάινερμαν, εκτελεστικός αντιπρόεδρος προϊόντων της Snowflake.

«Αποφασίσαμε ότι εφόσον είμαστε ξεκάθαροι στους πελάτες, δεν βλέπουμε κανένα πρόβλημα με την υποστήριξή της», δήλωσε.

Εν τω μεταξύ, οι Αμερικανοί προγραμματιστές τεχνητής νοημοσύνης σπεύδουν να αναλύσουν το μοντέλο V3 της DeepSeek.

Η DeepSeek δημοσίευσε τον Δεκέμβριο ένα ερευνητικό έγγραφο που συνοδεύει το μοντέλο, τη βάση της δημοφιλούς εφαρμογής της, αλλά πολλά ερωτήματα, όπως το συνολικό κόστος ανάπτυξης, δεν απαντώνται στο έγγραφο.Η Κίνα έχει πλέον κάνει άλμα από 18 μήνες σε έξι μήνες σε σχέση με τα σύγχρονα μοντέλα τεχνητής νοημοσύνης που αναπτύσσονται στις ΗΠΑ, δήλωσε ένα άτομο.

Ωστόσο, με τη στρατηγική δωρεάν απελευθέρωσης της DeepSeek να προκαλεί τόσο ενθουσιασμό, η εταιρεία μπορεί σύντομα να βρεθεί χωρίς αρκετά τσιπ για να καλύψει τη ζήτηση, προέβλεψε το άτομο αυτό.

Τα βήματα της DeepSeek δεν προήλθαν μόνο από έναν προϋπολογισμό 6 εκατομμυρίων δολαρίων, ένα μικρό ποσό σε σύγκριση με τα 250 δισεκατομμύρια δολάρια που εκτιμούν οι αναλυτές ότι οι μεγάλες αμερικανικές εταιρείες cloud θα δαπανήσουν φέτος σε υποδομές AI. Το ερευνητικό έγγραφο σημείωσε ότι το κόστος αυτό αναφερόταν συγκεκριμένα στη χρήση των τσιπ στην τελική εκτέλεση της εκπαίδευσης και όχι στο συνολικό κόστος της ανάπτυξης.

Το training run είναι η κορυφή του παγόβουνου όσον αφορά το συνολικό κόστος, δήλωσαν στο Reuters στελέχη δύο κορυφαίων εργαστηρίων. Το κόστος για τον προσδιορισμό του τρόπου σχεδιασμού αυτής της εκπαιδευτικής διαδρομής μπορεί να κοστίσει πολλαπλάσια χρήματα, είπαν.

Η εκπαίδευση για το V3 διεξήχθη με τη χρήση 2.048 τσιπ H800 της Nvidia, τα οποία σχεδιάστηκαν για να συμμορφώνονται με τους ελέγχους εξαγωγών των ΗΠΑ που κυκλοφόρησαν το 2022, κανόνες που, όπως δήλωσαν στο Reuters ειδικοί, θα επιβραδύνουν ελάχιστα την πρόοδο της κινεζικής τεχνητής νοημοσύνης.

Πηγές σε δύο εργαστήρια τεχνητής νοημοσύνης δήλωσαν ότι ανέμεναν ότι τα προηγούμενα στάδια της ανάπτυξης θα βασίζονταν σε πολύ μεγαλύτερη ποσότητα τσιπ. Ένας από τους ανθρώπους είπε ότι μια τέτοια επένδυση θα μπορούσε να έχει κοστίσει βόρεια του 1 δισεκατομμυρίου δολαρίων.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Ορισμένοι Αμερικανοί ηγέτες της AI επαίνεσαν την απόφαση της DeepSeek να λανσάρει τα μοντέλα της ως ανοιχτού κώδικα, πράγμα που σημαίνει ότι άλλες εταιρείες ή άτομα είναι ελεύθερα να τα χρησιμοποιήσουν ή να τα αλλάξουν.«Το DeepSeek R1 είναι μια από τις πιο εκπληκτικές και εντυπωσιακές ανακαλύψεις που έχω δει ποτέ – και ως ανοιχτός κώδικας, ένα βαθύτατο δώρο στον κόσμο» ανέφερεο venture capitalist Μαρκ Άντερσεν σε ανάρτησή του στο X την Κυριακή.

Η αναγνώριση που συγκέντρωσαν τα μοντέλα της DeepSeek υπογραμμίζει τη βιωσιμότητα της τεχνολογίας τεχνητής νοημοσύνης ανοικτού κώδικα ως εναλλακτική λύση στην δαπανηρή και αυστηρά ελεγχόμενη τεχνολογία, όπως το ChatGPT της OpenAI, δήλωσαν παρατηρητές του κλάδου.

Οι πιο πολύτιμες εταιρείες της Wall Street έχουν εκτιναχθεί τα τελευταία χρόνια λόγω των προσδοκιών ότι μόνο αυτές είχαν πρόσβαση στα τεράστια κεφάλαια και την υπολογιστική ισχύ που απαιτούνται για την ανάπτυξη και την κλιμάκωση της αναδυόμενης τεχνολογίας AI.

Αυτές οι υποθέσεις θα τεθούν υπό περαιτέρω έλεγχο αυτή την εβδομάδα και την επόμενη, όταν πολλοί αμερικανικοί τεχνολογικοί γίγαντες θα αναφέρουν τριμηνιαία κέρδη.

Πηγή: reuters.com