Μήπως η Τεχνητή Νοημοσύνη σας δίνει καλύτερες απαντήσεις από τον γιατρό σας;
Το ChatGPT αξιολογήθηκε και φάνηκε ότι διαχειρίζεται καλύτερα από τους πραγματικούς γιατρούς θέματα που αφορούν στην ενσυναίσθηση και τις συμβουλές. Σύμφωνα με μελέτη που πραγματοποιήθηκε πέρυσι, το ChatGPT παρέχει απαντήσεις υψηλότερης ποιότητας και είναι πιο συμπονετικό από έναν πραγματικό γιατρό.
Το ChatGPT ξεπερνά τους γιατρούς σε συμπόνια και ποιότητα συμβουλών
Με την πρώτη ματιά, η ιδέα ότι ένα chatbot που χρησιμοποιεί τεχνητή νοημοσύνη μπορεί να είναι σε θέση να παράγει καλές απαντήσεις σε ερωτήσεις ασθενών δεν προκαλεί έκπληξη. Εξάλλου, το ChatGPT κατάφερε και πέρασε μια τελική εξέταση για ένα Wharton MBA, έγραψε ένα βιβλίο σε λίγες ώρες και συνέθεσε πρωτότυπη μουσική. Είναι όμως σε θέση να δείχνει και περισσότερη ενσυναίσθηση;
Ποια καθήκοντα αναλαμβάνει η τεχνητή νοημοσύνη στην υγειονομική περίθαλψη;
Ήδη, ο ταχύς αναπτυσσόμενος κατάλογος ιατρικών εφαρμογών της τεχνητής νοημοσύνης περιλαμβάνει τη σύνταξη σημειώσεων γιατρού, την πρόταση διαγνώσεων, τη βοήθεια στην ανάγνωση ακτινογραφιών και μαγνητικής τομογραφίας και παρακολούθηση δεδομένων υγείας σε πραγματικό χρόνο, όπως ο καρδιακός ρυθμός ή το επίπεδο οξυγόνου. Ωστόσο η ιδέα ότι οι απαντήσεις που δημιουργούνται από την τεχνητή νοημοσύνη μπορεί να είναι πιο ενσυναίσθητες από τις απαντήσεις των γιατρών δημιουργεί διφορούμενα συναισθήματα. Πώς θα μπορούσε ακόμη και το πιο προηγμένο μηχάνημα να ξεπεράσει έναν γιατρό στην επίδειξη αυτής της σημαντικής και ιδιαίτερα ανθρώπινης αρετής;
Μπορεί η τεχνητή νοημοσύνη να δώσει καλές απαντήσεις σε ερωτήσεις ασθενών;
Φανταστείτε ότι έχετε καλέσει το γραφείο του γιατρού σας για να ρωτήσετε σχετικά με ένα από τα φάρμακά σας. Αργότερα μέσα στην ημέρα, ένας κλινικός ιατρός στην ομάδα υγείας σας καλεί πίσω για να το συζητήσετε. Τώρα, φανταστείτε ένα διαφορετικό σενάριο: κάνετε την ερώτησή σας μέσω email ή κειμένου και μέσα σε λίγα λεπτά λαμβάνετε μια απάντηση που δημιουργείται από έναν υπολογιστή που χρησιμοποιεί AI. Πώς θα συγκρίνονται οι ιατρικές απαντήσεις σε αυτές τις δύο καταστάσεις όσον αφορά την ποιότητα; Και πώς θα μπορούσαν να συγκριθούν από την άποψη της ενσυναίσθησης; Για να απαντήσουν σε αυτά τα ερωτήματα, οι ερευνητές συνέλεξαν 195 ερωτήσεις και απαντήσεις από ανώνυμους χρήστες ενός διαδικτυακού ιστότοπου κοινωνικής δικτύωσης που τέθηκαν σε γιατρούς που προσφέρθηκαν να απαντήσουν εθελοντικά. Οι ερωτήσεις υποβλήθηκαν αργότερα στο ChatGPT και συλλέχθηκαν οι απαντήσεις του chatbot. Στη συνέχεια, μια ομάδα τριών γιατρών ή νοσοκόμων βαθμολόγησε και τα δύο σετ απαντήσεων ως προς την ποιότητα και την ενσυναίσθηση. Οι συμμετέχοντες στην επιτροπή ρωτήθηκαν “ποια απάντηση ήταν καλύτερη;” σε μια πεντάβαθμη κλίμακα. Οι επιλογές αξιολόγησης για την ποιότητα ήταν: πολύ κακή, κακή, αποδεκτή, καλή ή πολύ καλή. Οι επιλογές αξιολόγησης για την ενσυναίσθηση ήταν: μη ενσυναίσθηση, ελαφρώς ενσυναίσθηση, μέτρια ενσυναίσθηση, ενσυναίσθηση και μέγιστη ενσυναίσθηση.
Τι βρήκε η μελέτη;
Σχεδόν για το 80% των απαντήσεων, το ChatGPT θεωρήθηκε καλύτερο από τους γιατρούς. Καλής ή πολύ καλής ποιότητας απαντήσεις: Το ChatGPT έλαβε αυτές τις αξιολογήσεις για το 78% των απαντήσεων, ενώ οι γιατροί το έκαναν μόνο στο 22% των απαντήσεων. Απαντήσεις με ενσυναίσθηση ή πολύ ενσυναίσθηση: Το ChatGPT σκόραρε 45% και οι γιατροί 4,6%. Συγκεκριμένα, το μήκος των απαντήσεων ήταν πολύ μικρότερο για τους γιατρούς (μέσος όρος 52 λέξεων) από ότι για το ChatGPT (μέσος όρος 211 λέξεων).
Η μελέτη ωστόσο δεν απαντά σε δύο βασικά ερωτήματα: Οι απαντήσεις AI προσφέρουν ακριβείς ιατρικές πληροφορίες και βελτιώνουν την υγεία των ασθενών αποφεύγοντας τη σύγχυση ή τη βλάβη; Θα αποδεχτούν οι ασθενείς την ιδέα ότι οι ερωτήσεις που θέτουν στον γιατρό τους μπορεί να απαντηθούν από ένα bot;
Και είχε επίσης κάποιους σοβαρούς περιορισμούς:
Αξιολόγηση και σύγκριση απαντήσεων:
Οι αξιολογητές εφάρμοσαν μη δοκιμασμένα, υποκειμενικά κριτήρια ποιότητας και ενσυναίσθησης. Είναι σημαντικό ότι δεν αξιολόγησαν την πραγματική ακρίβεια των απαντήσεων. Ούτε οι απαντήσεις αξιολογήθηκαν ως προς την κατασκευή, ένα πρόβλημα που έχει σημειωθεί με το ChatGPT.
Η διαφορά στο μήκος των απαντήσεων:
Οι πιο λεπτομερείς απαντήσεις μπορεί να φαίνεται ότι αντικατοπτρίζουν την υπομονή ή την ανησυχία. Έτσι, οι υψηλότερες βαθμολογίες για την ενσυναίσθηση μπορεί να σχετίζονται περισσότερο με τον αριθμό των λέξεων παρά με την αληθινή ενσυναίσθηση. Για να ελαχιστοποιηθεί η μεροληψία, οι αξιολογητές δεν έπρεπε να γνωρίζουν εάν η απάντηση προερχόταν από γιατρό ή ChatGPT.
Φαίνεται πρόωρο να βασιστούμε σε απαντήσεις τεχνητής νοημοσύνης σε ερωτήσεις ασθενών χωρίς ακλόνητη απόδειξη της ακρίβειάς τους και την πραγματική επίβλεψή τους από επαγγελματίες υγείας και παρεμπιπτόντως, το ChatGPT συμφωνεί: Σε ερώτηση αν θα μπορούσε να απαντήσει σε ιατρικές ερωτήσεις καλύτερα από έναν γιατρό η απάντησή του ήταν όχι.
Με πληροφορίες από Harvard health
Αφροδίτη Ντάικου