Αρχική






AI





Ανάπτυξη αλγορίθμου ανίχνευσης παραισθήσεων στην τεχνητή νοημοσύνη

Ανάπτυξη αλγορίθμου ανίχνευσης παραισθήσεων στην τεχνητή νοημοσύνη





Παρά το πόσο εντυπωσιακή μπορεί να είναι η τεχνητή νοημοσύνη όπως το ChatGPT, ο Claude, ακόμα και ο

, αυτά τα μεγάλα γλωσσικά μοντέλα έχουν όλα ένα μεγάλο κοινό πρόβλημα: έχουν πολλές παραισθήσεις. Αυτό είναι ένα μεγάλο πρόβλημα στον κόσμο της τεχνητής νοημοσύνης, και ακόμη και η Apple ανησυχεί για το πώς θα χειριστεί τις παραισθήσεις στο μέλλον με την Apple Intelligence. Ευτυχώς, μια ομάδα ερευνητών δημιούργησε τώρα έναν ανιχνευτή παραισθήσεων τεχνητής νοημοσύνης, ο οποίος μπορεί να πει αν ένα AI έχει φτιάξει κάτι.

Αυτές οι παραισθήσεις οδήγησαν σε μια σειρά από ενοχλητικά και συναρπαστικά ολισθήματα – και συνεχίζουν να είναι ένας από τους κύριους λόγους που η τεχνητή νοημοσύνη όπως το ChatGPT

πιο χρήσιμη. Είδαμε την Google να αναγκάζεται να κάνει αλλαγές στις επισκοπήσεις αναζήτησης τεχνητής νοημοσύνης αφού η τεχνητή νοημοσύνη άρχισε να λέει στους ανθρώπους ότι ήταν ασφαλές να τρώνε πέτρες και να βάζουν κόλλα στην πίτσα. Έχουμε δει κιόλας

δικηγόροι που χρησιμοποίησαν το ChatGPT

για να βοηθήσει στη σύνταξη μιας δικαστικής κατάθεσης που επιβλήθηκε πρόστιμο επειδή το chatbot είχε παραισθήσεις για αναφορές για το

.


Ίσως αυτά τα ζητήματα θα μπορούσαν να είχαν αποφευχθεί εάν είχαν τον ανιχνευτή παραισθήσεων AI που περιγράφεται στο α

νέο χαρτί

δημοσιεύεται στο περιοδικό

Φύση

. Σύμφωνα με το έγγραφο, ένας νέος αλγόριθμος που αναπτύχθηκε από ερευνητές μπορεί να βοηθήσει να διακρίνουμε εάν οι απαντήσεις που δημιουργούνται από την τεχνητή νοημοσύνη είναι πραγματικές περίπου στο 79 τοις εκατό του χρόνου. Αυτό δεν είναι ένα τέλειο ρεκόρ, φυσικά, αλλά είναι 10 τοις εκατό υψηλότερο από τις άλλες κορυφαίες μεθόδους εκεί έξω αυτή τη στιγμή.

Τα chatbots όπως το Gemini και το ChatGPT μπορεί να είναι χρήσιμα, αλλά μπορούν επίσης να έχουν παραισθήσεις απαντήσεις πολύ εύκολα.

Η έρευνα πραγματοποιήθηκε από μέλη του Τμήματος Επιστήμης Υπολογιστών του Πανεπιστημίου της Οξφόρδης. Η μέθοδος που χρησιμοποιείται είναι σχετικά απλή, εξηγούν οι ερευνητές στην εργασία. Πρώτον, ζητούν από το chatbot να απαντήσει στην ίδια προτροπή πολλές φορές, συνήθως πέντε έως δέκα. Στη συνέχεια, υπολογίζουν έναν αριθμό για αυτό που ονομάζουμε σημασιολογική εντροπία — το οποίο είναι το μέτρο του πόσο παρόμοια ή διαφορετική είναι η σημασία μιας απάντησης.

Εάν το μοντέλο απαντά διαφορετικά για καθεμία από τις καταχωρήσεις προτροπής, τότε η βαθμολογία σημασιολογικής εντροπίας είναι υψηλότερη, υποδεικνύοντας ότι η τεχνητή νοημοσύνη μπορεί να έχει παραισθήσεις για την απάντηση. Εάν οι απαντήσεις είναι όλες πανομοιότυπες ή έχουν παρόμοια σημασία, ωστόσο, η βαθμολογία σημασιολογικής εντροπίας θα είναι χαμηλότερη, υποδεικνύοντας ότι δίνει μια πιο συνεπή και πιθανή πραγματική απάντηση. Όπως είπα, δεν είναι ένας αλάνθαστος ανιχνευτής παραισθήσεων τεχνητής νοημοσύνης, αλλά είναι ένας ενδιαφέρον τρόπος να το χειριστείς.

Άλλες μέθοδοι βασίζονται σε αυτό που ονομάζουμε αφελής εντροπία, η οποία συνήθως ελέγχει για να δει εάν η διατύπωση μιας απάντησης και όχι το νόημά της είναι διαφορετική. Ως εκ τούτου, δεν είναι τόσο πιθανό να καταλάβει τις παραισθήσεις με την ίδια ακρίβεια, επειδή δεν εξετάζει το νόημα πίσω από τις λέξεις της πρότασης.

Οι ερευνητές λένε ότι ο αλγόριθμος θα μπορούσε να προστεθεί σε chatbots όπως το ChatGPT μέσω ενός κουμπιού, επιτρέποντας στους χρήστες να λαμβάνουν «βαθμολογία βεβαιότητας» για τις απαντήσεις που δίνονται στις προτροπές τους.

να έχεις έναν ανιχνευτή παραισθήσεων AI ενσωματωμένο απευθείας στο chatbot είναι δελεαστικό, επομένως μπορώ να δω τη χρησιμότητα της προσθήκης ενός τέτοιου

υ στα διάφορα chatbot εκεί έξω.

VIA:

bgr.com








Marizas Dimitris


Marizas Dimitris

TechWar.GR — Ειδήσεις Τεχνολογίας, Gadgets, Ψυχαγωγία


Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ


Ακύρωση απάντησης



εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ