הערכה של שיטת סיכום קליני המבוססת על GPT-4 מרמזת שמודלים כאלה עשויים להפחית את נטל התיעוד על רופאים/ות.
מודלים גדולים של שפה (large language models), הלומדים באופן לא מפוקח על כמויות עצומות של טקסט, הציגו יכולות מרשימות של יצירת טקסט לפי דרישה. כעת, צוות מחקרי מאוניברסיטת סטנפורד העריך לראשונה את השימוש במודל GPT-4 לסיכום קליני כאמצעי להפחתת העומס התיעודי על קלינאים.
במחקר הצוות יצר מסכי חולה שהוכנו במיוחד מתוך רשומות אמת ממרכזי בריאות קהילתיים, ובחן היכן GPT-4 יכול לסייע בסיכומים רפואיים טיפוסיים. העבודה התמקדה בארבעה סוגי תיעוד קליני: סיכומי ביקור רפואי, תוכניות טיפול תרופתי, הנחיות שחרור לאחר אשפוז ותוכניות בדיקות עתידיות.
עבור כל אחד מסוגי התיעוד הללו, הצוות ניסח הוראות ייחודיות למודל לסכם את המידע החיוני מתוך המסכים של החולה. GPT-4 הצליח ליצור סיכומים קליניים מלאים בכ-90% מהמקרים.
רופאים שהשתתפו במחקר דירגו את הסיכומים כמהימנים וברורים ברוב המקרים, עם רמה גבוהה של הבנה קלינית.
למרות התוצאות המבטיחות, פרופסור רוברטס הזהיר שהערכה נוספת והתאמות נוספות דרושות לפני שמערכות מסוג זה יכולות להיות משולבות בתהליכי עבודה קליניים לצורך שימוש שגרתי. "עלינו לבחון את השימוש במודלים אלה במשימות עם עדיפות קלינית גבוהה שדורשות דיוק מלא ואי-הטיה, כמו תמלילים רפואיים וסיכומי מחלה קריטיים", הוא הוסיף. "בסופו של דבר, מטרתנו היא להשתמש בבינה מלאכותית כדי להפחית את הנטל הבלתי נסבל שמוטל על קלינאים ולשפר את חוויית המטופלים, אך למודלים חייבות להיות בקרות וגבולות ברורים כדי לא לפגוע בטיפול הרפואי ובבטיחות המטופלים".