Τεχνολογία

Βαθμολόγησαν 27 μοντέλα τεχνητής νοημοσύνης και το ChatGPT κατέλαβε την 8η θέση – Αυτά το ξεπέρασαν

Η τεχνητή νοημοσύνη αποτελεί κομμάτι της καθημερινότητας καθώς αρκετοί είναι εκείνοι που πλέον ρωτούν την AI για θέματα που τους απασχολούν.

Πίσω από τα μοντέλα της τεχνητής νοημοσύνης υπάρχουν ομάδες που δοκιμάζουν τα πάντα, ώστε το μοντέλο τεχνητής νοημοσύνης να παρουσιάζει όλα αυτά που του ζητούν.

Κάθε μοντέλο λοιπόν, που έχει δημιουργηθεί έχει τα πλεονεκτήματα και τα μειονεκτήματά του, όπως αναφέρει η ιστοσελίδα tomsguide.

Έρευνα της εταιρείας Prolific με έδρα το Ηνωμένο Βασίλειο εξέτασε εμπειρίες διαφορετικών χρηστών σε διάφορα μοντέλα τεχνητής νοημοσύνης.

Αξιολογώντας τις εμπειρίες 21.352 ατόμων με τα εργαλεία, κατάφεραν όχι μόνο να βρουν έναν συνολικό νικητή, αλλά και να αναλύσουν τα αποτελέσματα ανά ηλικία, τοποθεσία (δοκιμάστηκε τόσο στο Ηνωμένο Βασίλειο όσο και στις Η.Π.Α.) και πολιτικές πεποιθήσεις.

Αυτό περιλαμβάνει ξεχωριστές λίστες για:

  • Ηνωμένο Βασίλειο: Ηλικιακές ομάδες
  • Ηνωμένο Βασίλειο: Εθνικότητα
  • Ηνωμένο Βασίλειο: Πολιτικές απόψεις
  • Η.Π.Α: Ηλικιακές ομάδες
  • Η.Π.Α: Εθνικότητα
  • Η.Π.Α: Πολιτικές απόψεις

Κάθε συμμετέχοντας κλήθηκε να αλληλεπιδράσει με δύο ξεχωριστά μοντέλα τεχνητής νοημοσύνης και να τους ζητήθηκε να διατυπώσουν την άποψή τους για το ποιο μοντέλο ήταν καλύτερο σε κάθε αλληλεπίδραση.

Τί δείχνουν τα αποτελέσματα για τα μοντέλα τεχνητής νοημοσύνης;

Αν περιμένετε να συναντήσετε το δημοφιλές ChatGPT στις πρώτες θέσεις, πλανάστε, καθώς αυτό πλασάρεται στην 8η θέση με το μοντέλο GPT-4.1.
Νικητής στη συνολική απόδοση αλλά και σε υποκατηγορίες ήταν το Gemini 2.5-Pro.

Οι 18-34χρονοι στο Ηνωμένο Βασίλειο, οι ψηφοφόροι των Δημοκρατικών και οι άνω των 55 ετών στις Η.Π.Α. συμφώνησαν όλοι ότι το Gemini 2.5 Pro ήταν το καλύτερο συνολικό μοντέλο. Ο μόνος τομέας στον οποίο όλες οι οι ομάδες κατέταξαν κάτι πάνω από το Gemini ήταν η εμπιστοσύνη, η ηθική και η ασφάλεια, και αυτό ήταν το Grok-3, ένα κάπως οξύμωρο εύρημα, λαμβάνοντας υπόψη ορισμένα από τα ζητήματα ασφάλειας και ηθικής που είχε πρόσφατα το μοντέλο τεχνητής νοημοσύνης. Ακολουθούν το Deepseek, το Magistral Le Chat και το Grok.

Όπως σημειώνει η ιστοσελίδα tomsguide, τα αποτελέσματα δεν αντικατοπτρίζουν την απόδοση των μοντέλων, καθώς όταν δοκιμάζονται βάσει άλλων μετρήσεων οι επιλογές είναι το ChatGPT, το Gemini, το Claude και το Grok.

Πηγή: iefimerida.gr

Related posts

Η RTX 4090 είναι 60% γρηγορότερη από την RTX 3090 Ti σε νέο benchmark

TEO

Το Netflix εξαγοράζει νέο στούντιο για την ανάπτυξη “παγκοσμίου κλάσης παιχνιδιών”

TEO

Η Apple λούζεται στο χρήμα από τις συνδρομές εφαρμογών

TEO

Αυτός ο ιστότοπος χρησιμοποιεί cookies για να βελτιώσει την εμπειρία σας. Θα υποθέσουμε ότι είστε εντάξει με αυτό, αλλά μπορείτε να εξαιρεθείτε εάν το επιθυμείτε. Αποδέχομαι Διαβάστε περισσότερα

Πολιτική Απορρήτου & Cookies