Πιστή στην υπόσχεσή της, η xAI του Elon Musk παρουσίασε και επίσημα το νέο της προηγμένο μοντέλο τεχνητής νοημοσύνης Grok 3, το οποίο είναι πράγματι το ισχυρότερο στον κόσμο σύμφωνα με τα επίσημα benchmarks και τις πρώτες δοκιμές πραγματικών χρηστών.
Περνώντας σε λεπτομέρειες, μια αρχική έκδοση του Grok 3 κατάφερε να κατακτήσει το θρόνο στην ‘Αρένα’ των AI μοντέλων, όντας η πρώτη AI στην ιστορία που ξεπερνά το όριο των 1400 πόντων. Το μοντέλο της xAΙ κατάφερε να κατακτήσει την πρώτη θέση σε όλες τις κατηγορίες, όντας δραματικά καλύτερο στην συγγραφή κώδικα, σημαντικά ανώτερο στα μαθηματικά, καλύτερο στο να ακολουθεί οδηγίες, στο να γράφει δημιουργικά, στο να διαχειρίζεται μεγάλα μηνύματα, κ.α. Αυτό σημαίνει ότι ξεπέρασε κάθε άλλο μοντέλο που υπάρχει στην αγορά, όπως το GPT-4o, το o1 και το o3 της OpenAI, το Gemini 2.0 της Google, τα R1 και V3 της DeepSeek και το Sonnet 3.5 της Claude.
Here you can see @xai Grok-3’s performance across all the top categories:
🔹 Overall w/ Style Control
🔹 Hard Prompts & Hard Prompt w/ Style Control
🔹 Coding
🔹 Math
🔹 Creative Writing
🔹 Instruction Following
🔹 Longer Query
🔹 Multi-Turn pic.twitter.com/yOu3nx6VET
— lmarena.ai (formerly lmsys.org) (@lmarena_ai) February 18, 2025
Πέρα από τα εντυπωσιακά benchmarks, κατά τη διάρκεια της παρουσίασης έγινε γνωστό ότι το Grok 3 θα φέρει στο προσκήνιο και δύο νέες λειτουργείες, το ‘DeepSearch’ και το ‘Think’. Το DeepSearch θα επιτρέπει στο μοντέλο να ψάχνει σε όλες τις δημοσιεύσεις στο κοινωνικό δίκτυο X και στο internet γενικότερα, για οτιδήποτε του ζητάει ο χρήστης, προσφέροντας άμεσα έγκυρες και επικαιροποιημένες απαντήσεις. Το Think, όπως προδίδει και το όνομά του, θα επιτρέπει στο Grok 3 να λειτουργεί ως reasoning μοντέλο. Αυτό σημαίνει δηλαδή πως θα έχει έναν εσωτερικό διάλογο για να σκέφτεται πριν απαντήσει σε πιο σύνθετα ερωτήματα, κάτι που θα βελτιώνει ακόμη περισσότερο τις επιδόσεις του.
Το Grok 3 είναι διαθέσιμο για τους συνδρομητές του Premium+ στο X και σύντομα θα καταφθάσει για όλα τα Premium μέλη της πλατφόρμα. Η ομάδα υποσχέθηκε πως σκοπεύει να κυκλοφορεί ενημερώσεις σχεδόν σε καθημερινή βάση, με το Voice mode για παράδειγμα να καταφθάνει την επόμενη εβδομάδα. Καθοδόν είναι και άλλες προσθήκες, όπως οι προσωπικότητες και τα bookmarks.
Στο άμεσο μέλλον η xAI θα δώσει στη δημοσιότητα και όλο τον πηγαίο κώδικα και τα weights του Grok 2, μιας και το μοντέλο προηγούμενης γενιάς θα γίνει open source, όπως είχε υποσχεθεί η εταιρεία.
Grok-3 is the first model *ever* to score over 1400 on Chatbot Arena and outperforms the best publicly available reasoning models from OpenAI and Google.
xAI was founded 13 years after Deepmind and 8 years after OpenAI and is now ahead of both. The “SR-71 Blackbird” of AI labs. pic.twitter.com/ExcdENPu4U
— Gavin Baker (@GavinSBaker) February 18, 2025
Grok 3 appears to be a state-of-the-art frontier model. This is a huge accomplishment, especially considering how late in the game they started.
Congrats @ibab, @elonmusk, and the rest of the @xai team. Can’t wait to start building on it. pic.twitter.com/fYMkwKYmDD
— Amjad Masad (@amasad) February 18, 2025
xAI: GROK 3 WAS ABLE TO COMBINE TETRIS AND BEJEWELED
“The Bejeweled mechanic is, if you get three jewels in a row, they disappear, and gravity activates.
What Grok did in this version is, once you connect at least three blocks of the same color in a row, gravity activates,… https://t.co/y21TK2rMAV pic.twitter.com/k98v6UKppg
— Mario Nawfal (@MarioNawfal) February 18, 2025
All you need to know to understand which company will win a technology competition is look at the first and second derivatives of the rate of innovation https://t.co/rImcrpzfeY
— Elon Musk (@elonmusk) February 18, 2025
Για περισσότερα μπορείτε να δείτε ολόκληρη την εντυπωσιακή παρουσίαση μέσα από τον player που ακολουθεί:
xAI’s Mind Blowing Grok 3 Demo (FULL REPLAY)
✅ Silences removed to save you time
✅ Louder sound for easier listening
Spoiler: Grok 3 is NUTS!!
Timestamps:
0:00 xAI’s Mind Blowing Grok 3 DEMO
32:13 Grok 3 Q&A
42:01 Grok 3 Voice Mode Preview pic.twitter.com/A2bsvthwG4
— stevenmarkryan (@stevenmarkryan) February 18, 2025
Πηγή: unboxholics.com