ChatGPT: Μια ακόμη μελέτη διαπιστώνει κρίσιμα κενά στις απαντήσεις σε εξειδικευμένα ιατρικά ζητήματα

Listen to this article

Από τη Γιάννα Τριανταφύλλη.

Ολοένα και περισσότεροι ασθενείς στρέφονται πλέον στην Τεχνητή Νοημοσύνη, και ειδικά στο ChatGPT, για να αναζητήσουν ιατρικές πληροφορίες και εξειδικευμένες συμβουλές σε θέματα υγείας.

Μια νέα μελέτη αποκαλύπτει τους περιορισμούς των εργαλείων τεχνητής νοημοσύνης, στην υποστήριξη της εκπαίδευσης και της λήψης αποφάσεων των ασθενών σε εξειδικευμένα ιατρικά ζητήματα.

Ερευνητική ομάδα από την Ιατρική Σχολή Miller του Πανεπιστημίου του Μαϊάμι θέλησε να διερευνήσει πόσο καλά το ChatGPT θα μπορούσε να παρέχει αξιόπιστες και ακριβείς πληροφορίες σχετικά με τον καρκίνο του αίματος, έναν πολύπλοκο τομέα της ιατρικής όπου σημειώνονται διαρκώς νέες εξελίξεις, με ταχέως μεταβαλλόμενες θεραπευτικές επιλογές, συχνά προσαρμοσμένες στα μοναδικά προφίλ των ασθενών.

Για τις ανάγκες της μελέτης διερευνήθηκε το ChatGPT 3.5, μια έκδοση του δημοφιλούς chatbot της OpenAI που ήταν ελεύθερα διαθέσιμη όταν διεξήχθη η μελέτη.

Η έρευνα αξιολόγησε την απόδοση του ChatGPT αναλύοντας τις απαντήσεις του σε ένα σύνολο 10 καίριων ιατρικών ερωτημάτων που σχετίζονται με αιματολογικές κακοήθειες. Η αξιολόγηση πραγματοποιήθηκε από ιατρούς αιματολογίας-ογκολογίας, οι οποίοι βαθμολόγησαν τις απαντήσεις του ChatGPT σε κλίμακα από 1 (διαφωνώ πλήρως) έως 5 (συμφωνώ πλήρως).

Οι ερευνητές έθεσαν 10 ερωτήσεις στο chatbot, παρόμοιες με τις ερωτήσεις που θέτουν οι ασθενείς πριν ξεκινήσουν τις θεραπείες τους, όπως «ποιες είναι οι συχνές παρενέργειες της χημειοθεραπείας», «πώς μπορούν να αντιμετωπιστούν αυτές οι παρενέργειες», «τι είναι οι αναστολείς BCL-2», κ.ά.

Τι αποκάλυψαν τα ευρήματα

Τα ευρήματα της μελέτης έδειξαν ότι το ChatGPT 3.5 είχε την καλύτερη απόδοση σε γενικές ερωτήσεις, αλλά δυσκολεύτηκε να παρέχει πληροφορίες σχετικά με νεότερες θεραπείες και εξειδικευμένες προσεγγίσεις.

Συγκεκριμένα, το ChatGPT έλαβε μέση βαθμολογία 3,38 σε γενικές ερωτήσεις για τον καρκίνο του αίματος και 3,06 σε ερωτήσεις σχετικά με νεότερες θεραπείες. Κανένας από τους αξιολογητές δεν έδωσε στο chatbot βαθμολογία 5 σε καμία από τις απαντήσεις.

Στις ερωτήσεις που αφορούσαν νέες θεραπείες και νέες γονιδιακές μεταλλάξεις, το ChatGPT κατέγραψε χαμηλότερες επιδόσεις (μέσος όρος 3.06), με το χαμηλότερο σκορ να καταγράφεται σε ερώτηση σχετικά με τη μετάλλαξη FLT3, η οποία έλαβε βαθμολογία 2.3.

Αυτό, σύμφωνα με τους ερευνητές, οφείλεται στο γεγονός ότι οι πληροφορίες σχετικά με τη μετάλλαξη FLT3 δεν περιλαμβάνονταν στη βάση δεδομένων του ChatGPT λόγω του περιορισμού της εκπαίδευσής του μέχρι τον Σεπτέμβριο του 2021.

«Θα προειδοποιούσα τους ασθενείς να έχουν κάποιο σκεπτικισμό, ειδικά για απαντήσεις που αφορούν θεραπείες για συγκεκριμένους τύπους καρκίνου και να συμβουλεύονται τον γιατρό τους. Η εποπτεία του γιατρού παραμένει απαραίτητη για τον έλεγχο των ιατρικών πληροφοριών που παράγονται από την τεχνητή νοημοσύνη πριν από τη χρήση τους από τους ασθενείς», δήλωσε ο επικεφαλής συγγραφέας Δρ. Justin Taylor,MD, ερευνητής στο Κέντρο Ογκολογίας Sylvester, στην Ιατρική Σχολή Miller του Πανεπιστημίου του Μαϊάμι .

Η σημασία των ευρημάτων

Σύμφωνα με τους ερευνητές, τα ευρήματα προσφέρουν μια ξεκάθαρη εικόνα για τον πιθανό ρόλο και τους περιορισμούς των εργαλείων τεχνητής νοημοσύνης στην υποστήριξη της εκπαίδευσης και της λήψης αποφάσεων των ασθενών σε εξειδικευμένα ιατρικά πλαίσια.

Όπως σημειώνουν, η μελέτη υποδεικνύει ότι το ChatGPT μπορεί να είναι ένα χρήσιμο εργαλείο για την παροχή γενικών πληροφοριών σχετικά με τον καρκίνο του αίματος, αλλά παρουσιάζει σημαντικούς περιορισμούς όταν πρόκειται για τις τελευταίες εξελίξεις στις θεραπείες και τις γενετικές μεταλλάξεις.

Η έλλειψη επικαιροποιημένων δεδομένων μπορεί να οδηγήσει σε ανακριβείς ή ελλιπείς απαντήσεις, επομένως η χρήση του ChatGPT συνιστάται μόνο ως συμπληρωματικού εργαλείου και όχι ως υποκατάστατο της ιατρικής συμβουλής, καταλήγουν οι ερευνητές.

Με πληροφορίες από το Future Science OA.

Σημαντικοτερα νεα

Μ. Βρετανία: Φόβοι για νέα λουκέτα από τη μείωση της χρηματοδότησης στα κοινοτικά φαρμακεία

ΙΜΕΡΟΕΣΣΑ: Η παχυσαρκία δεν είναι ζήτημα αισθητικής αλλά χρόνια νόσος – Ενημερωτική δράση του συλλόγου

Η τοξίνη κερεουλίδη εντοπίστηκε στη Γαλλία για πρώτη φορά σε βρέφος που νοσηλεύθηκε μετά την κατανάλωση βρεφικού γάλακτος

ChatGPT: Μια ακόμη μελέτη διαπιστώνει κρίσιμα κενά στις απαντήσεις σε εξειδικευμένα ιατρικά ζητήματα

Διαβήτης Τύπου 1 & Παχυσαρκία: Το Τέλος του «Αδύνατου» Ασθενούς

Ταχύτερη βιολογική γήρανση στους άνδρες μέσης ηλικίας από τα «παντοτινά χημικά»

Ελληνική έρευνα συγκαταλέγεται από το περιοδικό «Cephalalgia» στις σημαντικότερες για την ημικρανία του 2025

Εγγραφείτε στις ενημερώσεις

Σημαντικοτερα νεα

Μ. Βρετανία: Φόβοι για νέα λουκέτα από τη μείωση της χρηματοδότησης στα κοινοτικά φαρμακεία

ΙΜΕΡΟΕΣΣΑ: Η παχυσαρκία δεν είναι ζήτημα αισθητικής αλλά χρόνια νόσος – Ενημερωτική δράση του συλλόγου

Η τοξίνη κερεουλίδη εντοπίστηκε στη Γαλλία για πρώτη φορά σε βρέφος που νοσηλεύθηκε μετά την κατανάλωση βρεφικού γάλακτος

ChatGPT: Μια ακόμη μελέτη διαπιστώνει κρίσιμα κενά στις απαντήσεις σε εξειδικευμένα ιατρικά ζητήματα

Τι αποκάλυψαν τα ευρήματα

Η σημασία των ευρημάτων

προσφατα αρθρα

Διαβήτης Τύπου 1 & Παχυσαρκία: Το Τέλος του «Αδύνατου» Ασθενούς

Ταχύτερη βιολογική γήρανση στους άνδρες μέσης ηλικίας από τα «παντοτινά χημικά»

Ελληνική έρευνα συγκαταλέγεται από το περιοδικό «Cephalalgia» στις σημαντικότερες για την ημικρανία του 2025