Τεχνητή νοημοσύνη: Πρεμιέρα για το Qwen3 της Alibaba – Τι προσφέρει σε σχέση με την DeepSeek

Τεχνητή νοημοσύνη: Πρεμιέρα για το Qwen3 της Alibaba – Τι προσφέρει σε σχέση με την DeepSeek
artificial intelligence Photo: pixabay.com
Ένα ακόμα σημαντικό βήμα στον αναπτυσσόμενο χώρο της τεχνητής νοημοσύνης ανοικτού κώδικα στην Κίνα.

Η Alibaba κυκλοφόρησε την Τρίτη την επόμενη γενιά των μεγάλων γλωσσικών μοντέλων ανοικτού κώδικα, Qwen3, και οι ειδικοί κάνουν λόγο για ένα ακόμα σημαντικό βήμα στον αναπτυσσόμενο χώρο της τεχνητής νοημοσύνης ανοικτού κώδικα στην Κίνα.

Ο τεχνολογικός κολοσσός δήλωσε ότι το Qwen3 υπόσχεται βελτιώσεις στη συλλογιστική, την παρακολούθηση οδηγιών, τη χρήση εργαλείων και τις πολύγλωσσες εργασίες, ανταγωνιζόμενο άλλα κορυφαία μοντέλα, όπως το R1 της DeepSeek.

Η σειρά LLM περιλαμβάνει οκτώ παραλλαγές που καλύπτουν ένα εύρος αρχιτεκτονικών και μεγεθών, προσφέροντας στους προγραμματιστές ευελιξία κατά τη χρήση του Qwen για τη δημιουργία εφαρμογών τεχνητής νοημοσύνης για συσκευές όπως τα κινητά τηλέφωνα.

Το Qwen3 είναι επίσης το ντεμπούτο της Alibaba στα λεγόμενα «υβριδικά μοντέλα συλλογιστικής», τα οποία, όπως λέει, συνδυάζουν τις παραδοσιακές δυνατότητες LLM με «προηγμένη, δυναμική συλλογιστική».

Σύμφωνα με την Alibaba, τα μοντέλα αυτά μπορούν να μεταβαίνουν απρόσκοπτα μεταξύ μιας «σκέψης» για σύνθετες εργασίες όπως η κωδικοποίηση και μιας «μη σκέψης» για ταχύτερες απαντήσεις γενικού σκοπού.

«Ειδικότερα, το μοντέλο Qwen3-235B-A22B MoE μειώνει σημαντικά το κόστος ανάπτυξης σε σύγκριση με άλλα μοντέλα τελευταίας τεχνολογίας, ενισχύοντας τη δέσμευση της Alibaba για προσιτή, υψηλής απόδοσης AI», ανέφερε η εταιρεία.

Τα νέα μοντέλα είναι ήδη ελεύθερα διαθέσιμα για μεμονωμένους χρήστες σε πλατφόρμες όπως το Hugging Face και το GitHub, καθώς και στη διαδικτυακή διεπαφή του Alibaba Cloud. Το Qwen3 χρησιμοποιείται επίσης για την τροφοδοσία του βοηθού AI της Alibaba , Quark.

ΔΙΑΒΑΣΤΕ ΑΚΟΜΑ

«Φουντώνει» η μάχη

Αναλυτές AI δήλωσαν στο CNBC ότι το Qwen3 αποτελεί σοβαρή πρόκληση για τους ομολόγους της Alibaba στην Κίνα, καθώς και για τους ηγέτες του κλάδου στις ΗΠΑ.

Σε δήλωσή του στο CNBC, ο Γουέι Σουν, κύριος αναλυτής τεχνητής νοημοσύνης στην Counterpoint Research, δήλωσε ότι η σειρά Qwen3 αποτελεί «σημαντική ανακάλυψη – όχι μόνο για τις καλύτερες στην κατηγορία της επιδόσεις της», αλλά και για διάφορα χαρακτηριστικά που υποδεικνύουν τις «δυνατότητες εφαρμογής των μοντέλων».

Αυτά τα χαρακτηριστικά περιλαμβάνουν την υβριδική λειτουργία σκέψης του Qwen3, την πολύγλωσση υποστήριξη που καλύπτει 119 γλώσσες και διαλέκτους και τη διαθεσιμότητα ανοικτού κώδικα.

Το λογισμικό ανοικτού κώδικα αναφέρεται γενικά σε λογισμικό στο οποίο ο πηγαίος κώδικας διατίθεται ελεύθερα στο διαδίκτυο για πιθανή τροποποίηση και αναδιανομή.

Στις αρχές του 2025, το μοντέλο R1 της DeepSeek με ανοιχτό κώδικα συγκλόνισε τον κόσμο της τεχνητής νοημοσύνης και έγινε γρήγορα καταλύτης για τον χώρο της τεχνητής νοημοσύνης της Κίνας και την υιοθέτηση μοντέλων ανοιχτού κώδικα.

«Η απελευθέρωση της σειράς Qwen 3 από την Alibaba υπογραμμίζει περαιτέρω τις ισχυρές δυνατότητες των κινεζικών εργαστηρίων να αναπτύσσουν εξαιρετικά ανταγωνιστικά, καινοτόμα και ανοιχτού κώδικα μοντέλα, παρά την αυξανόμενη πίεση από τους αυστηρότερους ελέγχους εξαγωγών των ΗΠΑ», δήλωσε ο Ρέι Γουάνγκ, αναλυτής με έδρα την Ουάσινγκτον που επικεντρώνεται στον οικονομικό και τεχνολογικό ανταγωνισμό ΗΠΑ-Κίνας.

Σύμφωνα με την Alibaba, το Qwen έχει ήδη γίνει μια από τις πιο ευρέως υιοθετημένες σειρές μοντέλων AI ανοιχτού κώδικα στον κόσμο , προσελκύοντας πάνω από 300 εκατομμύρια λήψεις παγκοσμίως και περισσότερα από 100.000 παράγωγα μοντέλα στο Hugging Face.

Ο Γουάνγκ δήλωσε ότι αυτή η υιοθέτηση θα μπορούσε να συνεχιστεί με το Qwen3, προσθέτοντας ότι οι ισχυρισμοί για τις επιδόσεις του μπορεί να το καταστήσουν το καλύτερο μοντέλο ανοιχτού κώδικα παγκοσμίως – αν και εξακολουθεί να βρίσκεται πίσω από τα πιο πρωτοποριακά μοντέλα στον κόσμο, όπως τα o3 και o4-mini της OpenAI.

Κινέζοι ανταγωνιστές, όπως η Baidu, έσπευσαν επίσης να κυκλοφορήσουν νέα μοντέλα AI μετά την εμφάνιση της DeepSeek, κάνοντας μεταξύ άλλων σχέδια για στροφή προς ένα επιχειρηματικό μοντέλο πιο ανοιχτού κώδικα.

Εν τω μεταξύ, το Reuters ανέφερε τον Φεβρουάριο ότι η DeepSeek επιταχύνει το λανσάρισμα του διαδόχου της R1, επικαλούμενο ανώνυμες πηγές.

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:

Πηγή: cnbc.com