Comparing Predictive Accuracy of Bleeding in Total Abdominal Hysterectomy Among Anesthesiologists, Gynecologists and AI: A Clinical Observational StudyAli Selçuk Yeniocak1, Can Tercan1, Emrah Dağdeviren1, Emrullah Akay1, Osman Murat Güler1, Alperen İnce1, Necmiye Ay2, Havva Betül Bacak3, Enes Serhat Coşkun41Department of Obstetrics and Gynecology, Basaksehir Cam and Sakura City Hospital, İstanbul, Türkiye 2Department of Anesthesiology, Basaksehir Cam and Sakura City Hospital, İstanbul, Türkiye 3c. Department of Obstetrics and Gynecology, Gaziosmanpaşa Taksim Education and Research Hospital, İstanbul, Türkiye 4Department of Obstetrics and Gynecology, Simav Doç. Dr. İsmail Karakuyu City Hospital, Kutahya, Türkiye
Aim: Accurate prediction of perioperative blood loss is critical for optimizing outcomes in total abdominal hysterectomy (TAH). Traditional estimation methods by clinicians are subjective and prone to variability, while artificial intelligence (AI) offers a potential data-driven alternative. This study compares the predictive accuracy of anesthesiologists, gynecologists, and the AI algorithm ChatGPT4.0 for blood loss during TAH. Material and Methods: This single-center, prospective observational study evaluated 50 patients who underwent TAH for benign conditions in 2023. Clinical data, including uterine size, surgical duration, and surgeon experience, were retrospectively collected. Participating gynecologists and anesthesiologists predicted intraoperative blood loss based on anonymized patient data. Predictions were compared to ChatGPT4.0’s outputs and actual recorded blood loss, categorized into mild, moderate, and severe bleeding levels. Sensitivity, positive predictive value, and overall accuracy were analyzed using statistical tests appropriate for data distribution. Results: Anesthesiologists achieved the highest overall accuracy (40%), excelling in moderate bleeding predictions. Gynecologists demonstrated moderate performance across all categories, with 38% accuracy. ChatGPT4.0 showed the lowest overall accuracy (34%) but outperformed clinicians in predicting severe bleeding (37.5% positive predictive value). Variability in clinician predictions highlighted the challenges of subjective estimation, while AI predictions demonstrated consistency but limited precision. Conclusions: AI offers promise in enhancing objective blood loss prediction, particularly for severe cases. However, its performance remains inferior to clinician estimates in most scenarios, underscoring the need for further algorithm refinement and integration into clinical workflows. Future research should focus on long-term validation and addressing ethical challenges in AI adoption. Keywords: AI, anesthesiology, artificial intelligence, blood loss prediction; ChatGPT; gynecology; total abdominal hysterectomy
Total Abdominal Histerektomide Kanama Tahmini: Anesteziyologlar, Jinekologlar ve Yapay Zekâ Üzerine Klinik Gözlemsel ÇalışmaAli Selçuk Yeniocak1, Can Tercan1, Emrah Dağdeviren1, Emrullah Akay1, Osman Murat Güler1, Alperen İnce1, Necmiye Ay2, Havva Betül Bacak3, Enes Serhat Coşkun41Başakşehir Çam ve Sakura Şehir Hastanesi, Kadın Hastalıkları ve Doğum Kliniği, İstanbul, Türkiye 2Başakşehir Çam ve Sakura Şehir Hastanesi, Anesteziyoloji Kliniği, İstanbul, Türkiye 3Gaziosmanpaşa Eğitim ve Araştırma Hastanesi, Kadın Hastalıkları ve Doğum Kliniği, İstanbul, Türkiye 4Simav Doç.Dr. İsmail Karakuyu Devlet Hastanesi, Kadın Hastalıkları ve Doğum Kliniği, Kütahya, Türkiye
Amaç: Perioperatif kan kaybının doğru tahmini, total abdominal histerektomi (TAH) sonuçlarını optimize etmek için kritik öneme sahiptir. Klinik uzmanlar tarafından yapılan geleneksel tahmin yöntemleri öznel olup değişkenliğe yatkınken, yapay zekâ (YZ) veri odaklı bir alternatif sunma potansiyeline sahiptir. Bu çalışma, TAH sırasında anestezistlerin, jinekologların ve ChatGPT4.0 adlı YZ algoritmasının kan kaybı tahmin doğruluğunu karşılaştırmayı amaçlamaktadır. Gereç ve Yöntem: Bu tek merkezli, prospektif gözlemsel çalışmada, 2023 yılında benign durumlar için TAH geçiren 50 hasta değerlendirildi. Uterus boyutu, cerrahi süresi ve cerrahın deneyimi gibi klinik veriler retrospektif olarak toplandı. Katılımcı jinekologlar ve anestezistler, anonimleştirilmiş hasta verilerine dayanarak intraoperatif kan kaybını tahmin etti. Tahminler, ChatGPT4.0’ın sonuçları ve gerçek kaydedilmiş kan kaybı ile karşılaştırılarak hafif, orta ve şiddetli kanama seviyelerine göre kategorize edildi. Verilerin dağılımına uygun istatistiksel testler kullanılarak duyarlılık, pozitif prediktif değer ve genel doğruluk analiz edildi. Bulgular: Anestezistler, orta şiddetli kanama tahminlerinde üstünlük sağlayarak en yüksek genel doğruluğu (%40) elde etti. Jinekologlar tüm kategorilerde orta düzey performans sergileyerek %38 doğruluk sağladı. ChatGPT4.0, genel doğruluk açısından en düşük performansı (%34) gösterdi ancak şiddetli kanama tahminlerinde (%37.5 pozitif prediktif değer) klinisyenlerden daha iyi sonuç verdi. Klinisyen tahminlerindeki değişkenlik, öznel tahminin zorluklarını ortaya koyarken, YZ tahminleri tutarlılık sergilemiş ancak sınırlı bir kesinlik göstermiştir. Sonuç: Yapay zekâ, özellikle şiddetli vakalar için objektif kan kaybı tahmini sağlamada vaat sunmaktadır. Bununla birlikte, mevcut performansı çoğu senaryoda klinisyen tahminlerinin gerisinde kalmakta olup, algoritmanın daha fazla iyileştirilmesi ve klinik iş akışlarına entegrasyonu gerekmektedir. Gelecek araştırmalar, uzun vadeli doğrulama ve YZ’nin benimsenmesindeki etik zorlukların ele alınmasına odaklanmalıdır. Anahtar Kelimeler: yapay zekâ, anesteziyoloji, kan kaybı tahmini, ChatGPT; jinekoloji; total abdominal histerektomi
Ali Selçuk Yeniocak, Can Tercan, Emrah Dağdeviren, Emrullah Akay, Osman Murat Güler, Alperen İnce, Necmiye Ay, Havva Betül Bacak, Enes Serhat Coşkun. Comparing Predictive Accuracy of Bleeding in Total Abdominal Hysterectomy Among Anesthesiologists, Gynecologists and AI: A Clinical Observational Study. Kafkas J Med Sci. 2025; 15(1): 96-103
Corresponding Author: Ali Selçuk Yeniocak, Türkiye |
|