Η κινέζικη εταιρεία τεχνητής νοημοσύνης DeepSeek έφερε πανικό στις ΗΠΑ, ανακοινώνοντας το πρώτο της μοντέλο, το R1. Αμέσως ανέβηκε στην κατάταξη των κορυφαίων LLMs, αφού ανταγωνιζόταν τα αντίστοιχα μοντέλα από την OpenAI και την Anthropic. Το εντυπωσιακό ήταν πως κατασκευάστηκε με ένα μικρό κλάσμα του κόστους, απαιτούσε πολύ λιγότερα chips της NVIDIA για να τρέξει αποδοτικά και το βασικότερο, κυκλοφόρησε δωρεάν! Τώρα, δύο εβδομάδες μετά την ανακοίνωση του GTP-5 της OpenAI, η DeepSeek επιστρέφει και ανακοινώνει αθόρυβα το νέο μοντέλο DeepSeek V3.1, που σύμφωνα με τους ειδικούς, ανταγωνίζεται το GPT-5 και έχει αρκετά χαμηλότερη τιμή.
Η εταιρεία έστειλε απλά ένα μήνυμα για την κυκλοφορία του νέου μοντέλου σε μια από τις ομάδες WeChat που είχε, ενημερώνοντας ορισμένους χρήστες. Το DeepSeek αποτελεί μια από τις βασικότερες κινήσεις της Κίνας στη τεχνητή νοημοσύνη, που αναπτύσσει την τεχνολογία της χωρίς να βασίζεται σε ξένη τεχνολογία. Μάλιστα, το DeepSeek V3.1 είναι σχεδιασμένο για να αποδίδει άριστα σε κινεζικά chips, όπως αυτά της Huawei.
Αν και στις ΗΠΑ οι εταιρείες έχουν τρομοκρατηθεί από την κυβέρνησή τους, για την χρήση του DeepSeek, στην Κίνα έχει υιοθετηθεί ευρέως, όπως επίσης και σε πάρα πολλά ακόμα μέρη του κόσμου. Ακόμα και μερικές εταιρείες των ΗΠΑ έχουν πάρει τον κώδικα του DeepSeek για να δημιουργήσουν τις δικές τους εφαρμογές συλλογισμού, που βασίζονται στο R1 της DeepSeek. Το εντυπωσιακό με το DeepSeek είναι πως είναι Open Source και μπορεί ο καθένας να παραμετροποιήσει τον κώδικα για τις δικές του ανάγκες, όπως επίσης και να ελέγξει για το αν τα δεδομένα του πηγαίνουν στην κυβέρνηση των ΗΠΑ. Δεν έχουν βρεθεί ενδείξεις για κάτι τέτοιο μέχρι και σήμερα.
Η ώθηση της Κίνας στην τεχνητή νοημοσύνη ξεπερνά το DeepSeek: Η βιομηχανία της περιλαμβάνει επίσης μοντέλα όπως το Qwen της Alibaba, το Kimi της Moonshot AI και το Ernie της Baidu. Η νέα κυκλοφορία του DeepSeek, ωστόσο, έρχεται αμέσως μετά το GPT-5 της OpenAI – μια κυκλοφορία που δεν ανταποκρίθηκε στις υψηλές προσδοκίες των παρατηρητών του κλάδου – υπογραμμίζει την αποφασιστικότητα του Πεκίνου να συμβαδίσει ή ακόμα και να ξεπεράσει τα κορυφαία αμερικανικά εργαστήρια.
Η OpenAI φοβάται την Κίνα και το DeepSeek
Η OpenAI έχει δείξει πως έχει πανικοβληθεί από την DeepSeek. Αφού απέτυχε να αποδείξει πως η κινεζική εταιρεία έκλεψε τα μοντέλα της, τώρα δηλώνει δια στόματος Sam Altman, πως ο αυξανόμενος ανταγωνισμός από κινεζικά μοντέλα ανοιχτού κώδικα, συμπεριλαμβανομένου του DeepSeek, επηρέασε την απόφαση της εταιρείας του να κυκλοφορήσει τα δικά της μοντέλα ανοιχτού βάρους πριν από δύο εβδομάδες. Βέβαια, αυτό δεν βοήθησε την OpenAI, αφού το GPT-5 κυκλοφόρησε με πολλά προβλήματα.
«Ήταν σαφές ότι αν δεν το κάναμε, ο κόσμος θα βασιζόταν κυρίως σε κινεζικά μοντέλα ανοιχτού κώδικα», είπε ο Altman. «Αυτός ήταν σίγουρα ένας παράγοντας στην απόφασή μας. Δεν ήταν ο μόνος, αλλά είχε μεγάλη σημασία».
Την περασμένη εβδομάδα η NVIDIA και η AMD πήραν άδειες εξαγωγής chips τεχνητής νοημοσύνης ειδικά για την Κίνα, συμπεριλαμβανομένου και του Η20, με την προϋπόθεση πως θα παραχωρήσουν το 15% των εσόδων στην κυβέρνηση.
Το Πεκίνο αντέδρασε γρήγορα, περιορίζοντας τις αγορές τσιπ της Nvidia, αφού ο Υπουργός Εμπορίου Χάουαρντ Λούτνικ δήλωσε στο CNBC στις 15 Ιουλίου: «Δεν τους πουλάμε τα καλύτερα προϊόντα μας, ούτε τα δεύτερα καλύτερα, ούτε καν τα τρίτα καλύτερα».
Εδώ και καιρό η Κίνα προσπαθεί να απομακρυνθεί ακόμα περισσότερο από το αμερικανικό hardware και πλέον το DeepSeek έχει σχεδιαστεί για να τρέχει σε AI Chips της Huawei. Μάλιστα, στο μήνυμα που έστειλε η DeepSeek στους χρήστες της, αναφέρει πως το νέο μοντέλο είναι σχεδιασμένο να τρέχει στα εγχώρια chips επομένης γενιάς που θα κυκλοφορήσουν σύντομα.
Ο Altman δήλωσε πως οι ΗΠΑ υποτιμούν την πολυπλοκότητα και τη σοβαρότητα της προόδου της Κίνας στην Τεχνητή Νοημοσύνη — και είπε ότι οι έλεγχοι των εξαγωγών από μόνοι τους πιθανότατα δεν αποτελούν αξιόπιστη λύση. Είπε ξεκάθαρα «Ανησυχώ για την Κίνα».
Τεχνικά, αυτό που κάνει το νέο μοντέλο DeepSeek αξιοσημείωτο είναι ο τρόπος κατασκευής του, με μερικές βελτιώσεις που θα ήταν αόρατες στους καταναλωτές. Αλλά για τους προγραμματιστές, αυτές οι καινοτομίες καθιστούν το V3.1 φθηνότερο στη λειτουργία και πιο ευέλικτο από πολλά κλειστά και πιο ακριβά ανταγωνιστικά μοντέλα.
Απροσδόκητη μελέτη διαπιστώνει ότι το κρέας μπορεί να προστατεύει από τον καρκίνο
Αυτές οι μικρές αλλαγές όμως, επιτρέπουν στο DeepSeek V3.1 να έχει συνδυαστική λογική, που σημαίνει ότι μόνο ένα κλάσμα του μοντέλου ενεργοποιείται όταν απαντά σε οποιοδήποτε ερώτημα. Το μεγαλύτερο μέρος του κόστους υπολογισμού διατίθεται στους προγραμματιστές. Σε αντίθεση με τα προηγούμενα μοντέλα DeepSeek που διαχώριζαν εργασίες που μπορούσαν να απαντηθούν άμεσα με βάση την προεκπαίδευση του μοντέλου από εκείνες που απαιτούσαν βήμα προς βήμα συλλογισμό, το V3.1 συνδυάζει γρήγορες απαντήσεις και συλλογισμό σε ένα σύστημα.
Αυτό είναι που έφερε και το GPT-5 πρόσφατα, όπως και άλλα μοντέλα όπως η Anthropic. Η υβριδική αρχιτεκτονική του V3.1 είναι «το μεγαλύτερο χαρακτηριστικό μέχρι στιγμής», δήλωσε στο Fortune ο Ben Dickson, αναλυτής τεχνολογίας και ιδρυτής του ιστολογίου TechTalks.
Το εντυπωσιακό είναι πως η Κίνα καταφέρνει να αναπτύξει δικά της εργαλεία, το ίδιο καλά με αυτά των ΗΠΑ και με ένα κλάσμα του κόστους, τόσο για τους χρήστες, όσο και για την ίδια την εταιρεία. Παράλληλα, η Κίνα στοχεύει σε πιο αποδοτικό προγραμματισμό των μοντέλων της, ώστε να μην απαιτούν τεράστια data centers και άρα απίστευτα ποσά ενέργειας. Αυτή είναι και η βέλτιστη πρακτική και σαφώς πολύ ανώτερη από έναν πιο άτσαλο κώδικα που απαιτεί απίστευτα πολλούς πόρους για να τρέξει.
Από τη στιγμή που η υλοποίηση μπορεί να παραμετροποιηθεί για να τρέξει σε οποιοδήποτε υπολογιστή, σαν Open Source, κάθε εταιρεία θα μπορεί να χρησιμοποιήσει τα μοντέλα της DeepSeek, με πολύ χαμηλότερο κόστος τόσο για το software, όσο και για το απαιτούμενο hardware.
Ακολουθήστε το Techmaniacs.gr στο Google News για να διαβάζετε πρώτοι όλα τα τεχνολογικά νέα. Ένας ακόμα τρόπος να μαθαίνετε τα πάντα πρώτοι είναι να προσθέσετε το Techmaniacs.gr στον RSS feeder σας χρησιμοποιώντας τον σύνδεσμο: https://techmaniacs.gr/feed/.