Τεχνητή νοημοσύνη: H DeepSeek δίνει στη δημοσιότητα τον κώδικα των μοντέλων της

Τεχνητή νοημοσύνη: H DeepSeek δίνει στη δημοσιότητα τον κώδικα των μοντέλων της
The Deepseek logo appears on a smartphone screen and as a background on a computer screen in Athens, Greece, on January 27, 2025. (Photo by Nikolas Kokovlis/NurPhoto) (Photo by Nikolas Kokovlis / NurPhoto / NurPhoto via AFP) Photo: AFP
Θα ανοίξει τα αποθετήρια κώδικα 5 την επόμενη εβδομάδα.

Η κινεζική νεοσύστατη εταιρεία DeepSeek θα δημοσιοποιήσει τον κώδικα των μοντέλων της, όπως ανακοίνωσε την Παρασκευή, «πατώντας» στη δέσμευσή της για τεχνητή νοημοσύνη ανοικτού κώδικα.

Η εταιρεία ανέφερε σε μια ανάρτηση στο X ότι θα ανοίξει τα αποθετήρια κώδικα 5 την επόμενη εβδομάδα, περιγράφοντας την κίνηση ως «μικρή αλλά ειλικρινή πρόοδο» που θα μοιραστεί «με πλήρη διαφάνεια».

«Αυτά τα ταπεινά δομικά στοιχεία της διαδικτυακής μας υπηρεσίας έχουν τεκμηριωθεί, αναπτυχθεί και δοκιμαστεί στη μάχη της παραγωγής», αναφέρεται στην ανάρτηση.

Η DeepSeek αναστάτωσε την παγκόσμια βιομηχανία τεχνητής νοημοσύνης τον περασμένο μήνα, όταν κυκλοφόρησε το μοντέλο συλλογιστικής R1 ανοιχτού κώδικα, το οποίο ανταγωνιζόταν τα δυτικά συστήματα σε απόδοση, ενώ αναπτύχθηκε με χαμηλότερο κόστος.

Η δέσμευση της εταιρείας στον ανοιχτό κώδικα τη διέκρινε από τις περισσότερες εταιρείες AI στην Κίνα, οι οποίες, όπως και οι αμερικανικές ανταγωνίστριές τους, κλίνουν προς τα μοντέλα κλειστού κώδικα.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

Ο χαμηλών τόνων ιδρυτής της DeepSeek, Λιάνγκ Γουενφένγκ, δήλωσε σε μια σπάνια συνέντευξη σε κινεζικό μέσο ενημέρωσης τον περασμένο Ιούλιο ότι η εταιρεία δεν έθεσε ως προτεραιότητα την εμπορική εκμετάλλευση των μοντέλων τεχνητής νοημοσύνης της και ότι υπάρχει ήπια δύναμη που μπορεί να κερδηθεί από τον ανοιχτό κώδικα.

«Το να ακολουθούν άλλοι την καινοτομία σου δίνει μια μεγάλη αίσθηση επιτυχίας», δήλωσε ο Λιάνγκ τον Ιούλιο.

«Στην πραγματικότητα, ο ανοιχτός κώδικας είναι περισσότερο μια πολιτιστική συμπεριφορά παρά μια εμπορική, και η συνεισφορά σε αυτόν μας κερδίζει σεβασμό» πρόσθεσε.

Ο πρόσφατα δημοσιευμένος κώδικας ανοικτού κώδικα θα παρέχει υποδομές για την υποστήριξη των μοντέλων τεχνητής νοημοσύνης που η DeepSeek έχει ήδη κοινοποιήσει δημόσια, βασιζόμενη σε αυτά τα υπάρχοντα πλαίσια μοντέλων ανοικτού κώδικα.

Η ανακοίνωση ήρθε μετά τη δημοσίευση από την DeepSeek την Τρίτη ενός νέου αλγορίθμου που ονομάζεται Native Sparse Attention (NSA), ο οποίος έχει σχεδιαστεί για να κάνει πιο αποτελεσματική την εκπαίδευση και την εξαγωγή συμπερασμάτων σε μακρά πλαίσια.

Η βάση χρηστών της DeepSeek έχει εκραγεί από τον περασμένο μήνα.

Στην Κίνα, είναι η πιο δημοφιλής υπηρεσία chatbot με 22,2 εκατομμύρια καθημερινά ενεργούς χρήστες από τις 11 Ιανουαρίου, ξεπερνώντας τα 16,95 εκατομμύρια χρήστες του Douban, σύμφωνα με την Aicpb.com, έναν κινεζικό ιστότοπο που παρακολουθεί προϊόντα τεχνητής νοημοσύνης.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: reuters.com