Τεχνολογία

GPT-4.5: Ανακοινώθηκε το νέας γενιάς μοντέλο της OpenAI

Η OpenAI ανακοίνωσε την κυκλοφορία του GPT-4.5, του πιο προηγμένου μεγάλου γλωσσικού μοντέλου που έχει δημιουργήσει μέχρι τώρα.

Το μοντέλο αυτό, που αποτελεί ένα σημαντικό βήμα στην εξέλιξη της σειράς GPT, είναι διαθέσιμο μόνο για τους συνδρομητές του ChatGPT Pro, οι οποίοι πληρώνουν 200 δολάρια το μήνα, καθώς και για τους προγραμματιστές που χρησιμοποιούν τις πληρωμένες βαθμίδες του API. Η εταιρεία σχεδιάζει να επεκτείνει την πρόσβαση στους χρήστες του ChatGPT Plus και Team μέσα στην επόμενη εβδομάδα, ενώ θα ακολουθούν οι συνδρομητές των κατηγοριών Enterprise και Education λίγο αργότερα.

Το GPT-4.5 αναπτύχθηκε με τη χρήση αυξημένης υπολογιστικής δύναμης και δεδομένων, τα οποία επεξεργάστηκαν σε υπερυπολογιστές της Microsoft στο Azure δίκτυο. Βασίζεται στην προσέγγιση της μη επιβλεπόμενης μάθησης που ακολουθούσαν τα προηγούμενα GPT μοντέλα, με επιπλέον βελτιώσεις μέσω ανθρώπινης ανατροφοδότησης για μεγαλύτερη ακρίβεια. Ξεχωρίζει για την ικανότητά του να αναγνωρίζει μοτίβα, να συνδέει ιδέες και να δίνει πιο αξιόπιστες απαντήσεις με λιγότερα λάθη σε σχέση με το GPT-4o. Αν και η OpenAI δεν έχει αποκαλύψει ακριβή στοιχεία για το μέγεθός του, υπάρχουν εκτιμήσεις ότι μπορεί να φτάνει τα 1,8 τρισεκατομμύρια parameters, καθιστώντας το το μεγαλύτερο της σειράς.

Το νέο μοντέλο διαπρέπει στις συνομιλητικές εργασίες, δείχνοντας καλύτερη κατανόηση των προθέσεων των χρηστών και των λεπτών σημάτων στην επικοινωνία. Στα τεστ απόδοσης, όπως το SimpleQA, πέτυχε ποσοστό ακρίβειας 62,5% έναντι 38,2% του GPT-4o, μειώνοντας σημαντικά τις λανθασμένες απαντήσεις. Επίσης, αποδίδει καλά σε τομείς όπως η επιστήμη, οι πολυγλωσσικές εργασίες και η συγγραφή κώδικα, με βαθμολογίες όπως 71,4% στο GPQA για την επιστήμη και 38% στο SWE-Bench για την επαλήθευση κώδικα. Ωστόσο, δεν υποστηρίζει λειτουργίες όπως η αμφίδρομη φωνητική αλληλεπίδραση που υπάρχει στο GPT-4o.

Για τους προγραμματιστές, το GPT-4.5 είναι διαθέσιμο μέσω διαφόρων APIs, με υποστήριξη για λειτουργίες όπως η εισαγωγή εικόνων και η δομημένη έξοδος. Ωστόσο, το κόστος του είναι το υψηλότερο της αγοράς, δηλαδή 75 δολάρια ανά εκατομμύριο input tokens και 150 δολάρια ανά εκατομμύριο output tokens!

Στις συγκρίσεις με τα άλλα μοντέλα, τα reasoning μοντέλα της OpenAI, όπως το o1 και το o3-mini-high, αλλά και ανταγωνιστών, όπως το Grok 3, το Deepseek R1 και το Sonnet 3.7 παραμένουν καλύτερα στη συγγραφή κώδικα. Ομοίως, το Grok 3 παραμένει το ανώτερο βασικό μοντέλο στα μαθηματικά και τις επιστήμες. Ωστόσο, το GPT-4.5 διαπρέπει όσον αφορά τα hallucinations, που είναι ένα από τα σημαντικότερα προβλήματα στην ΑΙ, αφού το ποσοστό των φορών που σκαρφίστηκε πληροφορίες που δεν υπάρχουν έπεσε από 61% σε 37%. Παράλληλα, εντυπωσιάζει με το επίπεδο γνώσεων του για τον κόσμο, ενώ και το άλμα στη συγγραφή κώδικα είναι εντυπωσιακό για μη-reasoning μοντέλο.

btw, why is no one talking about gpt-4.5 hallucination rate?

everyone is debating benchmarks but missing the real breakthrough.

it’s dropping from 61% to 37% means 40% fewer hallucinations

a model that hallucinates less is more reliable, requires less fact-checking, and is… pic.twitter.com/Caxwp6DdPY

— Haider. (@slow_developer) February 27, 2025

the grok-3 benchmark is pretty useful in comparing base models, so I added GPT-4.5 pic.twitter.com/p78zhWs32O

— bycloud (@bycloudai) February 27, 2025

gpt-4.5 has incredible world knowledge. on simpleqa (a not so simple factuality benchmark), it’s more accurate than any other model:

>gpt-4.5 — 62.5%
>grok-3 — 43.6%
>gpt-4o — 38%
>o3-mini — 15% pic.twitter.com/2wZZcIXwKj

— Aidan McLaughlin (@aidan_mclau) February 27, 2025

GPT-4.5 has been awesome to work with. On our agentic coding benchmarks it already shows massive improvements over o1 and 4o. Excited to see the models’ continued trajectory on code!

One interesting data point: though GPT-4.5 and Claude 3.7 Sonnet score similarly on our overall… https://t.co/nk40dFPU85 pic.twitter.com/T7CkcrWvck

— Scott Wu (@ScottWu46) February 27, 2025

Πηγή: unboxholics.com

Related posts

Η MediaTek κοιτάει πλέον στα μάτια την Qualcomm στις επιδόσεις

TEO

Το YouTube μπλοκάρει χρήστες που χρησιμοποιούν ad blockers

TEO

Το νέο Oppo A16e έχει μεγάλη μπαταρία και 6,5 ίντσες LCD οθόνη

TEO

Αυτός ο ιστότοπος χρησιμοποιεί cookies για να βελτιώσει την εμπειρία σας. Θα υποθέσουμε ότι είστε εντάξει με αυτό, αλλά μπορείτε να εξαιρεθείτε εάν το επιθυμείτε. Αποδέχομαι Διαβάστε περισσότερα

Πολιτική Απορρήτου & Cookies