Η κινεζική Moonshot ανακοίνωσε το νέο μεγάλο γλωσσικό μοντέλο, Kimi K2, που έρχεται με διαφορετική υλοποίηση από τον ανταγωνισμό. Η Moonshot έχει από πίσω της δυνατούς χρηματοδότες, όπως η Alibaba. Για αυτό έχει τραβήξει τα βλέμματα τις τελευταίες ημέρες, με την ανακοίνωση του μοντέλου της.

Τι είναι αυτό που την κάνει να ξεχωρίζει όμως; Η AI της Moonshot είναι ένα μοντέλο MoE (Mixture of Experts). Σε αντίθεση με τα άλλα μοντέλα που είναι ένα ενιαίο νευρωνικό δίκτυο, το MoE είναι μια προσέγγιση μηχανικής μάθησης που διαιρεί ένα μοντέλο τεχνητής νοημοσύνης σε ξεχωριστά υποδίκτυα ή ειδικούς – καθένας από τους οποίους επικεντρώνεται σε ένα υποσύνολο των δεδομένων εισόδου – για την από κοινού εκτέλεση μιας εργασίας. Αυτό λέγεται ότι μειώνει σημαντικά το κόστος υπολογισμού κατά την προ-εκπαίδευση και επιτυγχάνει ταχύτερη απόδοση κατά τον χρόνο εξαγωγής συμπερασμάτων.

Η Moonshot αναφέρει πως διέθεσε ήδη δύο εκδόσεις του Kimi K2 σε ανοιχτό κώδικα. Το βασικό μοντέλο, Kimi-K2-Base, βελτιστοποιήθηκε για ερευνητές και κατασκευαστές που επιθυμούν πλήρη έλεγχο για βελτιστοποίηση και προσαρμοσμένες λύσεις. Αντίθετα, το Kimi-K2-Instruct εκπαιδεύτηκε εκ των υστέρων για drop-in, συνομιλία γενικής χρήσης και για άλλες λειτουργίες τεχνητής νοημοσύνης.

Το Kimi K2 είναι πλέον ελεύθερα διαθέσιμο μέσω των εφαρμογών του στο διαδίκτυο και για κινητά.

Σε αντίθεση με τα μοντέλα τεχνητής νοημοσύνης των ΗΠΑ που είναι κλειστού κώδικα, η Moonshot ακολουθεί την τάση των κινέζικων μοντέλων, προσφέροντας των κώδικα για όποιον θέλει να τον χρησιμοποιήσει για τις δικές του υλοποιήσεις. Αυτό μπορεί να δώσει σε τρίτους προγραμματιστές τον απόλυτο έλεγχο, ενώ το μοντέλο λειτουργεί με πλήρη διαφάνεια.

Kimi K2

Η προσέγγιση ανοιχτού κώδικα παρέχει δημόσια πρόσβαση στον πηγαίο κώδικα ενός προγράμματος, επιτρέποντας σε τρίτους προγραμματιστές λογισμικού να τροποποιήσουν ή να κοινοποιήσουν τον σχεδιασμό του, να διορθώσουν κατεστραμμένους συνδέσμους ή να αναβαθμίσουν τις δυνατότητές του.

Με το Kimi K2, το Moonshot – στο οποίο η Alibaba είναι σημαντικός υποστηρικτής – αναμένεται να κερδίσει νέα προσοχή στην παγκόσμια αγορά τεχνητής νοημοσύνης μετά την πρωτοποριακή κυκλοφορία του μοντέλου ανοιχτού κώδικα V3 από την DeepSeek τον Δεκέμβριο και του R1 τον Ιανουάριο , τα οποία και τα δύο κατασκευάστηκαν με ένα κλάσμα του κόστους και της υπολογιστικής ισχύος που συνήθως απαιτούν οι μεγάλες εταιρείες τεχνολογίας για έργα LLM.

Η αποδοτικότητα του μοντέλου δεν είναι απλώς τεχνικό κατόρθωμα, αλλά έχει και πολύ μεγάλο οικονομικό αντίκτυπο. Η τιμολογιακή πολιτική του Kimi K2 είναι εξαιρετικά ανταγωνιστική: 0,14 ευρώ ανά εκατομμύριο tokens εισόδου και 2,30 ευρώ ανά εκατομμύριο tokens εξόδου. Σε σύγκριση, το GPT-4.1 της OpenAI κοστίζει 1,80 ευρώ και 7,30 ευρώ αντίστοιχα, ενώ το Claude Opus 4 της Anthropic είναι ακόμα ακριβότερο, με τιμές που αγγίζουν τα 13,70 και 68,50 ευρώ αντίστοιχα. Για εταιρείες και οργανισμούς που επεξεργάζονται εκατομμύρια tokens ημερησίως, η διαφορά κόστους μεταφράζεται σε τεράστια εξοικονόμηση.

Η Xiaomi φέρνει μια λειτουργία Turbo για overclocking στο τηλέφωνο!

ο Kimi K2 δεν είναι η μόνη πρόσφατη κυκλοφορία της εταιρείας. Η Moonshot λάνσαρε ένα ερευνητικό μοντέλο Kimi τον περασμένο μήνα και ισχυρίστηκε ότι ισοδυναμούσε με βαθμολογία 26,9 του Gemini Deep Research της Google και ξεπέρασε την έκδοση του OpenAI σε ένα benchmark που ονομάζεται «Humanity’s Last Exam».

Το ερευνητικό μοντέλο της Kimi αναφέρθηκε μάλιστα την περασμένη εβδομάδα κατά την κυκλοφορία του Grok 4 στο xAI από τον Elon Musk — το οποίο σημείωσε 25,4 μόνο του στο benchmark “Humanity’s Last Exam”, αλλά πέτυχε βαθμολογία 44,4 όταν του επιτράπηκε να χρησιμοποιήσει μια ποικιλία εργαλείων τεχνητής νοημοσύνης και αναζήτησης στο διαδίκτυο.

Βέβαια, το Kimi K2 είναι ακόμα υπό βαριά ανάπτυξη και φυσικά έχει της αδυναμίες του, σε εργασίες που απαιτούν πολύπλοκο λογικό συλλογισμό, ενώ η απόδοση πέφτει όταν ενεργοποιείται η χρήση εργαλείων. Η εταιρεία ήδη δουλεύει για να διορθώσει αυτές τις αδυναμίες και δίνοντάς το μοντέλο της σαν ανοιχτού κώδικα, προσκαλεί την κοινότητα προγραμματιστών να συμβάλουν στην ανάπτυξη του μοντέλου.

Η Κίνα, λόγω των περιορισμών των ΗΠΑ για την απόκτηση GPU, έχει επικεντρωθεί περισσότερο στο λογισμικό. Με αυτό τον τρόπο έχει καταφέρει να φτιάξει μοντέλα που έχουν πολύ καλύτερη απόδοση από τις υλοποιήσεις των ΗΠΑ, με πολύ χαμηλότερες ενεργειακές απαιτήσεις.

Ακολουθήστε το Techmaniacs.gr στο Google News για να διαβάζετε πρώτοι όλα τα τεχνολογικά νέα. Ένας ακόμα τρόπος να μαθαίνετε τα πάντα πρώτοι είναι να προσθέσετε το Techmaniacs.gr στον RSS feeder σας χρησιμοποιώντας τον σύνδεσμο: https://techmaniacs.gr/feed/.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

This site uses Akismet to reduce spam. Learn how your comment data is processed.