Η κινεζική νεοφυής επιχείρηση τεχνητής νοημοσύνης DeepSeek αποκάλυψε το Σάββατο ορισμένα δεδομένα κόστους και εσόδων της που σχετίζονται με τα μοντέλα V3 και R1, υποστηρίζοντας ότι η θεωρητική αναλογία κόστους-κέρδους φτάνει το 545% ανά ημέρα, αλλά είναι μόνο θεωρητική καθώς τα πραγματικά έσοδά της θα είναι σημαντικά χαμηλότερα.
Είναι η πρώτη φορά που η εταιρεία με έδρα τη Χανγκζού αποκαλύπτει πληροφορίες σχετικά με τα περιθώρια κέρδους της από εργασίες με λιγότερη υπολογιστική ένταση, οι οποίες λέγονται εργασίες “συμπερασμού”. Είναι το στάδιο μετά την εκπαίδευση κατά το οποίο τα εκπαιδευμένα μοντέλα τεχνητής νοημοσύνης κάνουν προβλέψεις ή εκτελούν εργασίες, όπως μέσω chatbots.
Η αποκάλυψη αυτή ενδέχεται να εντείνει την αστάθεια στις μετοχές των εκτός Κίνας εταιρειών τεχνολογίας, οι τιμές των οποίων κατέρρευσαν τον Ιανουάριο, μετά την εκρηκτική δημοτικότητα που γνώρισαν τα chatbots της DeepSeek.
Η πτώση των μετοχών των αμερικανικών εταιριών προκλήθηκε εν μέρει από τους ισχυρισμούς της DeepSeek ότι ξόδεψε λιγότερα από 6 εκατομμύρια δολάρια για την εκπαίδευση του μοντέλου της – ένα ποσό σημαντικά χαμηλότερο από όσα ξοδεύουν εταιρείες όπως η OpenAI.
Επιπλέον, τα τσιπ που χρησιμοποίησε η DeepSeek, τα Nvidia H800, είναι πολύ λιγότερο ισχυρά από αυτά στα οποία έχουν πρόσβαση εταιρείες όπως η OpenAI και άλλες αμερικανικές επιχειρήσεις στον τομέα της Τεχνητής Νοημοσύνης. Αυτό έχει εντείνει τις αμφιβολίες σχετικά με το αν είναι απαραίτητες οι δαπάνες δισεκατομμυρίων δολαρίων που υπόσχονται να πραγματοποιήσουν οι αμερικανικές AI εταιρείες για την προμήθεια υψηλής τεχνολογίας επεξεργαστών.