Comparing Predictive Accuracy of Bleeding in Total Abdominal Hysterectomy Among Anesthesiologists, Gynecologists and AI: A Clinical Observational Study

Comparing Predictive Accuracy of Bleeding in Total Abdominal Hysterectomy Among Anesthesiologists, Gynecologists and AI: A Clinical Observational Study [Kafkas J Med Sci]

Kafkas J Med Sci. 2025; 15(1): 96-103 | DOI: 10.5505/kjms.2025.45452

Comparing Predictive Accuracy of Bleeding in Total Abdominal Hysterectomy Among Anesthesiologists, Gynecologists and AI: A Clinical Observational Study

Ali Selçuk Yeniocak¹, Can Tercan¹, Emrah Dağdeviren¹, Emrullah Akay¹, Osman Murat Güler¹, Alperen İnce¹, Necmiye Ay², Havva Betül Bacak³, Enes Serhat Coşkun⁴
¹Department of Obstetrics and Gynecology, Basaksehir Cam and Sakura City Hospital, İstanbul, Türkiye
²Department of Anesthesiology, Basaksehir Cam and Sakura City Hospital, İstanbul, Türkiye
³c. Department of Obstetrics and Gynecology, Gaziosmanpaşa Taksim Education and Research Hospital, İstanbul, Türkiye
⁴Department of Obstetrics and Gynecology, Simav Doç. Dr. İsmail Karakuyu City Hospital, Kutahya, Türkiye

Aim: Accurate prediction of perioperative blood loss is critical for optimizing outcomes in total abdominal hysterectomy (TAH). Traditional estimation methods by clinicians are subjective and prone to variability, while artificial intelligence (AI) offers a potential data-driven alternative. This study compares the predictive accuracy of anesthesiologists, gynecologists, and the AI algorithm ChatGPT4.0 for blood loss during TAH.
Material and Methods: This single-center, prospective observational study evaluated 50 patients who underwent TAH for benign conditions in 2023. Clinical data, including uterine size, surgical duration, and surgeon experience, were retrospectively collected. Participating gynecologists and anesthesiologists predicted intraoperative blood loss based on anonymized patient data. Predictions were compared to ChatGPT4.0’s outputs and actual recorded blood loss, categorized into mild, moderate, and severe bleeding levels. Sensitivity, positive predictive value, and overall accuracy were analyzed using statistical tests appropriate for data distribution.
Results: Anesthesiologists achieved the highest overall accuracy (40%), excelling in moderate bleeding predictions. Gynecologists demonstrated moderate performance across all categories, with 38% accuracy. ChatGPT4.0 showed the lowest overall accuracy (34%) but outperformed clinicians in predicting severe bleeding (37.5% positive predictive value). Variability in clinician predictions highlighted the challenges of subjective estimation, while AI predictions demonstrated consistency but limited precision.
Conclusions: AI offers promise in enhancing objective blood loss prediction, particularly for severe cases. However, its performance remains inferior to clinician estimates in most scenarios, underscoring the need for further algorithm refinement and integration into clinical workflows. Future research should focus on long-term validation and addressing ethical challenges in AI adoption.

Keywords: AI, anesthesiology, artificial intelligence, blood loss prediction; ChatGPT; gynecology; total abdominal hysterectomy

Total Abdominal Histerektomide Kanama Tahmini: Anesteziyologlar, Jinekologlar ve Yapay Zekâ Üzerine Klinik Gözlemsel Çalışma

Ali Selçuk Yeniocak¹, Can Tercan¹, Emrah Dağdeviren¹, Emrullah Akay¹, Osman Murat Güler¹, Alperen İnce¹, Necmiye Ay², Havva Betül Bacak³, Enes Serhat Coşkun⁴
¹Başakşehir Çam ve Sakura Şehir Hastanesi, Kadın Hastalıkları ve Doğum Kliniği, İstanbul, Türkiye
²Başakşehir Çam ve Sakura Şehir Hastanesi, Anesteziyoloji Kliniği, İstanbul, Türkiye
³Gaziosmanpaşa Eğitim ve Araştırma Hastanesi, Kadın Hastalıkları ve Doğum Kliniği, İstanbul, Türkiye
⁴Simav Doç.Dr. İsmail Karakuyu Devlet Hastanesi, Kadın Hastalıkları ve Doğum Kliniği, Kütahya, Türkiye

Amaç: Perioperatif kan kaybının doğru tahmini, total abdominal histerektomi (TAH) sonuçlarını optimize etmek için kritik öneme sahiptir. Klinik uzmanlar tarafından yapılan geleneksel tahmin yöntemleri öznel olup değişkenliğe yatkınken, yapay zekâ (YZ) veri odaklı bir alternatif sunma potansiyeline sahiptir. Bu çalışma, TAH sırasında anestezistlerin, jinekologların ve ChatGPT4.0 adlı YZ algoritmasının kan kaybı tahmin doğruluğunu karşılaştırmayı amaçlamaktadır.
Gereç ve Yöntem: Bu tek merkezli, prospektif gözlemsel çalışmada, 2023 yılında benign durumlar için TAH geçiren 50 hasta değerlendirildi. Uterus boyutu, cerrahi süresi ve cerrahın deneyimi gibi klinik veriler retrospektif olarak toplandı. Katılımcı jinekologlar ve anestezistler, anonimleştirilmiş hasta verilerine dayanarak intraoperatif kan kaybını tahmin etti. Tahminler, ChatGPT4.0’ın sonuçları ve gerçek kaydedilmiş kan kaybı ile karşılaştırılarak hafif, orta ve şiddetli kanama seviyelerine göre kategorize edildi. Verilerin dağılımına uygun istatistiksel testler kullanılarak duyarlılık, pozitif prediktif değer ve genel doğruluk analiz edildi.
Bulgular: Anestezistler, orta şiddetli kanama tahminlerinde üstünlük sağlayarak en yüksek genel doğruluğu (%40) elde etti. Jinekologlar tüm kategorilerde orta düzey performans sergileyerek %38 doğruluk sağladı. ChatGPT4.0, genel doğruluk açısından en düşük performansı (%34) gösterdi ancak şiddetli kanama tahminlerinde (%37.5 pozitif prediktif değer) klinisyenlerden daha iyi sonuç verdi. Klinisyen tahminlerindeki değişkenlik, öznel tahminin zorluklarını ortaya koyarken, YZ tahminleri tutarlılık sergilemiş ancak sınırlı bir kesinlik göstermiştir.
Sonuç: Yapay zekâ, özellikle şiddetli vakalar için objektif kan kaybı tahmini sağlamada vaat sunmaktadır. Bununla birlikte, mevcut performansı çoğu senaryoda klinisyen tahminlerinin gerisinde kalmakta olup, algoritmanın daha fazla iyileştirilmesi ve klinik iş akışlarına entegrasyonu gerekmektedir. Gelecek araştırmalar, uzun vadeli doğrulama ve YZ’nin benimsenmesindeki etik zorlukların ele alınmasına odaklanmalıdır.

Anahtar Kelimeler: yapay zekâ, anesteziyoloji, kan kaybı tahmini, ChatGPT; jinekoloji; total abdominal histerektomi

Ali Selçuk Yeniocak, Can Tercan, Emrah Dağdeviren, Emrullah Akay, Osman Murat Güler, Alperen İnce, Necmiye Ay, Havva Betül Bacak, Enes Serhat Coşkun. Comparing Predictive Accuracy of Bleeding in Total Abdominal Hysterectomy Among Anesthesiologists, Gynecologists and AI: A Clinical Observational Study. Kafkas J Med Sci. 2025; 15(1): 96-103

Corresponding Author: Ali Selçuk Yeniocak, Türkiye

TOOLS