Alibaba: Το μοντέλο τεχνητής νοημοσύνης της υπερτερεί του DeepSeek-V3

δημοσιεύτηκε:

11:33 , 29 Ιανουαρίου 2025

Διεθνή

Τη νέα εκδοχή του μοντέλου τεχνητής νοημοσύνης της Qwen 2.5 παρουσίασε σήμερα η κινεζική τεχνολογική εταιρεία Alibaba η οποία υποστηρίζει πως υπερτερεί του περίφημου DeepSeek-V3.

Μάλιστα την πρώτη ημέρα του Σεληνιακού Νέου Έτους κυκλοφόρησε το Qwen 2.5-Max. Η ημέρα αυτή θεωρείται αργία για τους περισσότερους Κινέζους και βρίσκονται με τις οικογένειές τους.

Αυτό δείχνει την πίεση που ασκεί η μετεωρική άνοδος τις τρεις τελευταίες εβδομάδες της κινεζικής εταιρείας τεχνητής νοημοσύνης DeepSeek όχι μόνο στους ανταγωνιστές της στο εξωτερικό αλλά και στον εγχώριο ανταγωνισμό.

Η δήλωση της Alibaba

«Το Qwen 2.5-Max υπερτερεί σχεδόν στα πάντα σε σχέση με τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B» όπως επισημαίνει σε ανακοίνωσή της η μονάδα cloud της Alibaba αναφερόμενη στα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης ανοικτού κώδικα.

Η ανακοίνωση αυτή αναρτήθηκε στον επίσημο λογαριασμό της εταιρείας στο WeChat.

Η παρουσίαση του βοηθού τεχνητής νοημοσύνης της DeepSeek έγινε στις 10 Ιανουαρίου με βάση το μοντέλο DeepSeek-V3, ενώ η παρουσίαση του μοντέλου της R1 που έγινε στις 20 Ιανουαρίου και αυτό προκάλεσε σοκ στην Silicon Valley καθώς η εξέλιξη αυτή έριξε τις μετοχές των τεχνολογικών εταιρειών αλλά και τα χαμηλά κόστη ανάπτυξης και χρήσης της κινεζικής startup έκαναν τους επενδυτές να αμφισβητήσουν τα σχέδια για τεράστιες δαπάνες από τις κορυφαίες εταιρείες τεχνητής νοημοσύνης στις ΗΠΑ.

Ωστόσο η επιτυχία της DeepSeek έκανε τους εγχώριους ανταγωνιστές της να αναβαθμίσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης.

Δύο ημέρες μετά την παρουσίαση του DeepSeek-R1, η ιδιοκτήτρια του TikTok, η ByteDance, παρουσίασε μια επικαιροποίηση του δικού της βασικού μοντέλου τεχνητής νοημοσύνης για το οποίο ισχυρίστηκε πως έχει καλύτερες επιδόσεις από το υποστηριζόμενο από τη Microsoft o1 της OpenAI στο AIME, ένα τεστ που μετράει πόσο καλά τα μοντέλα τεχνητής νοημοσύνης κατανοούν περίπλοκες οδηγίες και ανταποκρίνονται σ’ αυτές.

Αυτό απηχεί τον ισχυρισμό της DeepSeek ότι το μοντέλο της R1 υπερτερεί σε αρκετά κριτήρια απόδοσης του o1 της OpenAI.