Μπορεί τα εργαλεία τεχνητής νοημοσύνης να γράφουν κώδικα με ταχύτητα και να κάνουν εντύπωση, αλλά τα bugs τους πέφτουν κάπως βαριά. Σύμφωνα με νέα μελέτη της Microsoft Research, γνωστά εργαλεία όπως το GitHub Copilot δεν τα καταφέρνουν καθόλου καλά στο debugging, δηλαδή στο να εντοπίζουν και να διορθώνουν σφάλματα στον κώδικα.
Η Microsoft δημιούργησε μια πλατφόρμα που ονομάζεται debug-gym, η οποία εξομοιώνει πραγματικές συνθήκες debugging και επιτρέπει στα AI μοντέλα να “σκέφτονται” σαν προγραμματιστές. Παρόλο που είχαν στη διάθεσή τους εργαλεία debugging, τα μοντέλα δεν κατάφεραν να λύσουν πάνω από τις μισές δοκιμασίες. Στην πράξη, η απόδοση τους ήταν απογοητευτική.
Οι ερευνητές εξηγούν πως τα μοντέλα δεν έχουν εκπαιδευτεί αρκετά σε πραγματικά σενάρια debugging και δεν ξέρουν πώς να αξιοποιούν σωστά τα εργαλεία.
Έτσι, προτείνουν την εκπαίδευση σε διαδρομές επίλυσης προβλημάτων, ώστε να μάθουν να αναζητούν τις σωστές πληροφορίες και να τις περνούν σε πιο ισχυρά μοντέλα παραγωγής κώδικα.
Η έρευνα επιβεβαιώνει πως, μέχρι στιγμής, το AI είναι απλώς βοηθητικό εργαλείο. Αν το πρόγραμμα κρασάρει, η λύση θα έρθει ακόμα από έναν άνθρωπο.
Πηγή: unboxholics.com