Minden ami képalkotás

2026. január 09. 14:59 - Bágyi Péter

Az AI-alapú orvostechnikai eszközök forgalomba hozatal utáni felügyeletére vonatkozó szabályozás

Az Európai Radiológiai Társaság konszenzusos ajánlásai

13244.jpgTeljes cikk:

Cuocolo, R., Bernardini, D., Pinto dos Santos, D. et al. 
AI medical device post-market surveillance regulations: consensus recommendations by the European Society of Radiology. 
Insights Imaging 16, 275 (2025).
https://doi.org/10.1186/s13244-025-02146-8

 

ESR ajánlások:

 

  1. Az orvosi képalkotás szakemberei nem ismerik kellőképpen a PMS-t (forgalomba hozatal utáni felügyelet) és a klinikai gyakorlatban az AI-alapú orvostechnikai eszközökre vonatkozó klinikai nyomonkövetési követelményeket és előírásokat, ideértve az ilyen rendszerek üzemeltetőjeként betöltött feladataikat is.
    Megjegyzés: Az ESR és az Európai Orvosi Képalkotási Informatikai Társaság (European Society of Medical Imaging Informatics) közelmúltbeli felmérése rávilágított arra, hogy a radiológusok nem ismerik az AI-re vonatkozó előírásokat és különösen a PMS-t, függetlenül attól, hogy jelenleg AI-alapú orvostechnikai eszközöket üzemeltetnek-e vagy sem [1].

  2. A PMS-nek (forgalomba hozatal utáni felügyeletnek) tartalmaznia kell egy platformot, amely biztosítja a folyamatosan gyűjtött teljesítményadatok hozzáférhetőségét a bevezetők számára, lehetővé téve mind az orvosi képalkotó szakemberek általi figyelemmel kísérést, mind a PMCF által előírt, releváns eseményekről szóló ad hoc jelentéstételt.
    Megjegyzés: Az adatgyűjtés önmagában nem elegendő ahhoz, hogy az orvosi képalkotó szakemberek teljes mértékben tisztában legyenek az intézményi szinten bevezetett AI-alapú orvostechnikai eszközök folyamatos teljesítményével (és esetleges romlásával). Ez az információ egyértelműen elengedhetetlen a bevezetők egyes kötelezettségeinek, például a PMCF-nek (piaci forgalomba hozatal utáni klinikai visszajelzésnek) a teljesítéséhez.

  3. Az adatgyűjtést, amelyet az AI-alapú orvostechnikai eszközök üzemeltetői végezhetnek, intézményi szinten kell megvalósítani (pl. egy osztályon/kórházban dolgozó, erre a feladatra kijelölt személyzet által kezelt, félig automatizált rendszer segítségével), ahelyett, hogy egyetlen orvosok önkéntes tevékenységére támaszkodnának.

    Megjegyzés: Jelenleg egyes mesterséges intelligencia alapú orvostechnikai eszközök szolgáltatói az alkalmazók önkéntes alapú, időszakos jelentéseire támaszkodnak a mesterséges intelligencia klinikai gyakorlatban való teljesítményével kapcsolatos adatok tekintetében. Ezeket a gyakorlatokat fel kell váltani az intézményi erőforrások (pl. informatikai infrastruktúra) kihasználásával történő szisztematikus adatgyűjtéssel, hogy biztosítható legyen a megbízhatóság és a bizonyítékok megbízhatóbb gyűjtése.

  4. Egy adott AI-alapú orvostechnikai eszköz összes üzemeltetőjének képesnek kell lennie arra, hogy a jelenlegi adatvédelmi előírásoknak megfelelő formában hozzáférést kérjen a PMS-re és a rendszer teljesítményére vonatkozó összesített adatokhoz.
    Megjegyzés: Az AI-alapú orvostechnikai eszközök teljesítményére vonatkozó adatok hozzáférhetősége jelentősen segítheti az orvosokat a rendszer megbízhatóságának értékelésében és a betegellátást negatívan befolyásoló problémák időben történő felismerésében.

  5. Új AI-alapú orvostechnikai eszköz bevezetésekor a PMS-rendszert is egyidejűleg rendelkezésre kell bocsátani. Ha egy már meglévő eszközhöz új funkciót adnak hozzá, a PMS-t a kontextusnak megfelelően frissíteni kell, hogy az tartalmazza az új információkat.
    Megjegyzés: A PMS kritikus jellegére tekintettel nem elfogadható semmiféle késedelem a klinikai használatban lévő összes AI-alapú orvostechnikai eszközhöz tartozó adatgyűjtő és teljesítményfigyelő eszközök bevezetésében.

  6. A folyamatos figyelemmel kísérésen túlmenően a szolgáltatóknak időszakos (pl. 6–12 havonta) felülvizsgálatokat kell végezniük a PMS-adatokon, és azokat be kell mutatniuk a telepítőknek, hogy a gyógyászati eszközök használata tájékozottan, folyamatosan történjen, és a teljesítmény romlása időben felismerhető legyen.
    Megjegyzés: A rendszeres összefoglaló jelentés, amelynek időzítése a betegellátás szempontjából az orvostechnikai eszköz fontosságától függ, szükséges eszköz a bevezetők által végzett teljesítményértékelés megvalósíthatóságának biztosításához, még mélyreható műszaki ismeretek nélkül is.

  7. Bizonyos felhasználási esetekben (pl. képalkotás) további adatok (pl. nem AI-vel rekonstruált képek) gyűjtése lehet szükséges az AI-alapú orvostechnikai eszköz rendszeres teljesítményértékeléséhez.
    Megjegyzés: Tekintettel az AI-alapú orvostechnikai eszközök széles körű alkalmazási területeire, nem mindig áll rendelkezésre a teljesítmény és a minőség értékeléséhez szükséges alapadatok. Ha lehetséges, a szükséges adatokat rendszeresen össze kell gyűjteni, hogy ilyen értékelések elvégezhetők legyenek. Az AI-val támogatott kép-rekonstrukció tipikus példája egy ilyen helyzetnek, mivel a nem AI-val rekonstruált képeket nem szerzik be a klinikai rutinban referenciastandardként.

  8. A hatékony PMS érdekében a szolgáltatóknak meg kell adniuk az AI-alapú orvostechnikai eszköz alapvető pontossági mutatóit, beleértve a bizonytalansági mérőszámokat (pl. 95%-os konfidencia-intervallumok). Ezeknek a PMS-platformon jól láthatónak kell lenniük a felhasználók számára, hogy megkönnyítsék a gyenge teljesítmény vagy egyéb problémák észlelését.
    Megjegyzés: Mivel az AI-alapú orvostechnikai eszközök tanúsításához alapszintű teljesítményt kell meghatározni, ezeket az adatokat a bevezetők rendelkezésére kell bocsátani, hogy megkönnyítsék a PMS és PMCF célú teljesítményfigyelés feladatát, elkerülve a klinikai bevezetés utáni teljesítményromlás felismerésének felesleges késedelmét.

  9. Az AI-alapú orvostechnikai eszközök üzemeltetői fontolóra kell vegyék, hogy tájékoztassák a beutaló orvost és/vagy a betegeket az AI-vel kapcsolatos problémákról és azok megoldásáról, ha az esemény súlyossága és/vagy klinikai relevanciája ezt indokolja (pl. a PMCF-előírások szerint jelentéstételi kötelezettség alá eső esemény).
    Megjegyzés: Tekintettel az AI-alapú orvostechnikai eszközök újdonságára és arra, hogy azok használatával kapcsolatban az orvosi szakmák és a betegek különböző mértékben vannak tisztában, az AI-alapú orvostechnikai eszközök teljesítményével kapcsolatos problémák kezelésének és azok betegellátásra gyakorolt hatásának korlátozásának legjobb gyakorlatát eseti alapon kell értékelni. A negatív következmények kockázatának csökkentése érdekében elengedhetetlen a betegellátásban részt vevő többi érdekelt féllel való kommunikáció.

  10. A PMCF-kötelezettségek betartásának megkönnyítése érdekében célszerű, hogy a PMS-hez használt platform lehetővé tegye a felhasználói visszajelzések rögzítését is. Ezeknek az információknak ugyanazon platformon keresztül más, ugyanazon intézményben dolgozó orvosok számára is hozzáférhetőnek kell lenniük, hogy megkönnyítsék a mesterséges intelligenciával működő orvostechnikai eszközökkel kapcsolatos kritikus problémák helyi szintű felismerését.
    Megjegyzés: Mivel a PMCF a PMS-től eltérő feladatot jelent, a nemkívánatos események jelentését a lehető legnagyobb mértékben egyszerűsíteni kell, kihasználva a PMS célokra már rendelkezésre álló technológiákat. Az ilyen adatok más felhasználók számára való hozzáférhetősége (az adatvédelmi törvényekkel összhangban) szintén elengedhetetlen az AIaMD-vel (mesterséges intelligencia mint orvostechnikai eszköz) kapcsolatos problémák gyors orvoslásához.

  11. Az ESR az interoperábilis PMS-szabványok mellett áll ki, amelyek megkönnyítik a több szolgáltatótól származó AI-orvostechnikai eszközök közös platformjainak használatát. Ez a gyakorlat jelentősen növelné a PMS hozzáférhetőségét és kezelhetőségét mind a szolgáltatók, mind a felhasználók számára, mivel az AI-orvostechnikai eszközök száma és azok klinikai gyakorlatban való alkalmazása várhatóan növekedni fog az elkövetkező években.
    Megjegyzés: Az AI-alapú orvostechnikai eszközök használata és a PMS közötti súrlódások csökkentése érdekében a közös szabványok nagyban elősegítenék az interoperabilitást és a szükséges információkhoz való hozzáférés megkönnyítését, csökkentve ezzel a bevezetők terheit, amikor rendszeresen több eszközzel kell együttműködniük.

  12. A szolgáltatók közös szoftverplatformokat alkalmazhatnak a többféle AI-alapú orvostechnikai eszközhöz való hozzáférés optimalizálása érdekében. Ebben az esetben az összes AI-alapú orvostechnikai eszköz adatainak összesítésének megkönnyítése érdekében ajánlott az interoperábilis PMS-szabványok használata. Például előnyösebb lenne a szoftverplatform szintjén egységes felhasználói felületen keresztül hozzáférni az adott platformon keresztül szállított összes eszköz monitorozásához, mint az egyes orvostechnikai eszközök dedikált felületén belül elszigetelt PMS-rendszereket használni.
    Megjegyzés: Ha közös orvostechnikai eszköz-szolgáltatási platformot alkalmaznak, a PMS egyetlen platformon való központosítása jelentős előnyt jelenthet a telepítők számára a kritikus PMS-adatokhoz való hozzáférés akadályainak eltávolításában, amikor a közös szoftverplatformon keresztül szállított AI-orvostechnikai eszközök teljesítményét figyelik.

Következtetés

Az AI technológiát alkalmazó orvostechnikai eszközök egyre gyakoribbak a klinikai gyakorlatban. A radiológia más területein elérhető legjobb gyakorlatokhoz képest még mindig hiányosságok tapasztalhatók az orvosok tudatosságában. Ez a helyzet különösen nyilvánvaló a PMS és a PMCF esetében, ahol ezeket az aktív hatályos szabályozások elvileg egyértelműen meghatározzák, de a jelenlegi tisztázatlan szabványosítás és követelmények miatt nem alkalmazzák őket. Az ESR e tekintetben megfogalmazott ajánlásai remélhetőleg az első lépést jelentik a szükséges iránymutatások és tudatosság kialakítása felé közösségünkben, hogy javuljon az AI orvostechnikai eszközökként való bevezetésének és nyomon követésének következetessége, ugyanakkor az orvosok egyértelmű referencia-szabványhoz juthatnak, amikor ezekkel az új technológiákkal foglalkoznak, amelyek a korábbi gyakorlathoz képest egyedülálló kihívásokat jelentenek.

Rövidítések
AIaMDs: mesterséges intelligencia mint orvostechnikai eszközök
ESR: Európai Radiológus Társaság
MDR: orvostechnikai eszközökre vonatkozó rendelet
PMCF: forgalomba hozatal utáni klinikai visszajelzés
PMS: forgalomba hozatal utáni felügyelet

Teljes cikk:
Cuocolo, R., Bernardini, D., Pinto dos Santos, D. et al. 
AI medical device post-market surveillance regulations: consensus recommendations by the European Society of Radiology. 
Insights Imaging 16, 275 (2025).
https://doi.org/10.1186/s13244-025-02146-8

kepernyokep_2026-01-09_145853.png

Szólj hozzá!
2026. január 06. 21:57 - Bágyi Péter

A mesterséges intelligencia eszközök költséghatékonysága a radiológiában: szisztematikus áttekintés

kepernyokep_2025-03-02_170707.pngBrin, D., Tau, N.
Cost-effectiveness of artificial intelligence tools in radiology: a systematic review. 
Eur Radiol (2025).
DOI: 10.1007/s00330-025-12242-4

Bevezetés

A radiológia az elsők között alkalmazta a klinikai mesterséges intelligenciát (AI), egyre több eszközt vetve be a diagnosztikai pontosság javítása és a munkafolyamatok racionalizálása érdekében. 2025-re több mint 270 CE-jelöléssel ellátott radiológiai AI-termék lesz elérhető Európában [1], és több mint 950 FDA-engedélyezett AI-kompatibilis orvostechnikai eszköz tartalmaz radiológiai alkalmazásokat az Egyesült Államokban (USA) [2]. A jelentett felhasználás főként felmérési adatokon alapul, amelyek szerint az Egyesült Államok radiológiai osztályainak körülbelül kétharmada valamilyen formában használja az AI-t [3], míg Európában az alkalmazás aránya alacsonyabbnak tűnik, de fokozatosan növekszik [4,5,6,7].

A gazdasági életképesség kritikus fontosságú a fenntartható bevezetéshez, különösen az erőforrás-igényes egészségügyi rendszerekben, ahol a döntéshozatal a többletköltségektől és -haszonoktól függ [8, 9].

A gazdasági életképesség arra utal, hogy az AI-eszközök bevezetésének egészségügyi előnyei meghaladják-e a szükséges további pénzügyi beruházásokat. Ezek a beruházások általában magukban foglalják a szoftver kezdeti beszerzésével és a folyamatos éves előfizetési költségekkel, a számítástechnikai infrastruktúrával, a karbantartással, a klinikai munkafolyamatba való integrációval és a személyzet képzésével kapcsolatos költségeket [10]. Az AI bevezetésének költségei ritkán nyilvánosak, gyártónként és egészségügyi rendszerenként eltérőek, és gyakran alulbecsült tételeket tartalmaznak (pl. gyártói árképzési modellek, munkafolyamat-integrációs költségek, teljesítményfigyelés, modellfrissítések). Évente több tízezer vagy akár több százezer dollárba is kerülhetnek. A közzétett gazdasági modellek általában a költségeket több tízezer dollárra becsülik a beállítási költségek és az alacsony egy- vagy két számjegyű dollárösszegű tanulmányonkénti díjak alapján, néhány esetben pedig néhány száz dollárra becsülik a betegek számát [7, 11,12,13]. A gazdasági életképességet különböző típusú egészségügyi gazdasági elemzésekkel lehet értékelni, például költségminimalizálási elemzéssel (CMA) vagy költséghatékonysági elemzéssel (CEA).

Míg az AI-alkalmazások fejlesztői a hatékonyság növelését és a radiológiai munkaidő és költségek csökkentését állítják, kevés empirikus, valós bizonyíték van, amely nagymértékű, tartós időmegtakarítást igazolna [14,15,16,17,18,19]. Tudomásunk szerint eddig még nem készült olyan szisztematikus áttekintés, amely összefoglalná az AI radiológiai alkalmazásának költséghatékonyságára vonatkozó bizonyítékokat.

E szisztematikus áttekintés célja az volt, hogy értékelje a radiológiában alkalmazott AI-alapú eszközök költséghatékonyságára vonatkozó meglévő bizonyítékokat, betekintést nyújtson azok gazdasági életképességébe, és meghatározza a további vizsgálatra szoruló területeket.

Anyagok és módszerek

A PRISMA 2020 irányelveknek [20] megfelelően szisztematikus irodalomáttekintést végeztünk. A keresést a PubMed, a Cochrane Library, a Scopus, a Web of Science és az Embase adatbázisokban végeztük. A 2025. január 23-ig megjelent angol nyelvű cikkeket vettük figyelembe. A keresési stratégia magában foglalta a Medical Subject Headings (MeSH) és a „mesterséges intelligencia”, „radiológia” és „költséghatékonyság” kifejezésekkel kapcsolatos cím/absztrakt kifejezéseket. Az összes adatbázis teljes keresési szintaxisa a függelékben található.

A felvétel kritériumai a következőket értékelő tanulmányok voltak:

  1. radiológiai alapú mesterséges intelligencia beavatkozás képdiagnosztikában és -értelmezésben, valamint
  2. formális költségelemzés.

A szűrés során nem korlátoztuk az értékelés típusát vagy az egészségügyi eredmények mérőszámát. A megfelelő keretek között szerepelt a CMA, a CEA, a költség-haszon (CUA), a költség-haszon (CBA) és a költségvetési hatások elemzése (BIA). Kizártuk az eredeti költség- vagy eredményadatokkal nem rendelkező kéziratokat, a gazdasági elemzéssel nem rendelkező áttekintéseket, a nem angol nyelvű cikkeket, a kutatási protokollokat, a konferencia-összefoglalókat és a nem publikált (nem lektorált) tanulmányokat, a kizárólag fogászati képalkotásra összpontosító tanulmányokat (mivel azok inkább a fogászati gyakorlatra vonatkoznak, mint az általános diagnosztikai radiológiára), a képalkotó diagnosztikával vagy AI-képértelmezéssel közvetlenül nem kapcsolatos költségek értékelését, valamint a radiológiával nem kapcsolatos vagy AI-t nem tartalmazó kéziratokat.

Két bíráló (N.T. és D.B.) függetlenül vizsgálta a címeket és az absztraktokat a megfelelőség szempontjából. A teljes szövegek átvizsgálását is mindkét bíráló elvégezte, és az eltéréseket megbeszélés útján oldották meg, amíg konszenzusra nem jutottak. Az adatok kinyerését egy bíráló (D.B.) végezte egy szabványosított sablon segítségével, a második bíráló (N.T.) felügyelete alatt. A kinyert adatok között szerepeltek a tanulmány jellemzői (első szerző, folyóirat, év, ország, képalkotási módszer, radiológiai terület, AI szoftver), módszertani jellemzők (fizető perspektíva, modelltípus, kohort populáció, AI felhasználási eset és referencia beavatkozás), a tanulmány legfontosabb gazdasági eredményei és főbb korlátai.

A bevont tanulmányok módszertani minőségét szisztematikusan értékelték a mesterséges intelligencián alapuló beavatkozásokra vonatkozó egységes egészségügyi gazdasági értékelési jelentési szabványok (CHEERS-AI) ellenőrzőlistájának segítségével, amely az eredeti CHEERS 2022 38 tételből álló kiegészítése, és amelynek célja a mesterséges intelligencia beavatkozások gazdasági értékelésének átlátható jelentésének egységesítése [21].

Eredmények

A keresés 360 publikációt talált, amelyek közül tíz [12, 13, 22,23,24,25,26,27,28,29] felelt meg a beválasztási kritériumoknak és tartalmazott formális gazdasági értékeléseket a radiológiában alkalmazott AI eszközökről (1. ábra). Bár a kritériumok bármilyen formális gazdasági értékelést megengedtek, a felvett szakirodalom kilenc, minőségi életévekkel (QALY) és egy, fogyatékossággal korrigált életévekkel (DALY) alapuló CEA-t tartalmazott. CMA, CBA vagy BIA tanulmányokat nem azonosítottak.

kepernyokep_2026-01-06_214917.png

Az 1. táblázat összefoglalja a tanulmányok jellemzőit, a 2. táblázat pedig bemutatja a legfontosabb gazdasági eredményeket és a jelentett korlátokat az egyes tanulmányok esetében. A tanulmányok tervezésének, a minta méretének és a modellezési feltételezéseknek a nagyfokú változatossága miatt nem volt lehetséges formális metaanalízis elvégzése. A CHEERS-AI alapú módszertani minőségértékelést a 3. táblázat foglalja össze. A 38 tételre vonatkozó általános megfelelés mérsékelt volt (medián megfelelési arány 0,68, tartomány 0,58–0,79). Az eredeti CHEERS alapvető tételeinek jelentése általában erős volt. Valamennyi tanulmány egyértelműen leírta modelljének indokait és felépítését, az analitikai módszereket és feltételezéseket, a bizonytalanság kezelését, az aktuális és árfolyamadatokat, valamint megfelelő részleteket szolgáltatott a tanulmány populációjáról, környezetéről, perspektívájáról, összehasonlító tényezőiről, eredményeiről, erőforrás-felhasználásáról és költségeiről, valamint főbb megállapításairól. Az egészségügyi gazdasági elemzési tervek és az időhorizont legalább részben minden tanulmányban szerepelt. Ezzel szemben az AI-specifikus jelentések változatosabbak voltak. A felhasználói autonómia, az AI hatásának mérése, a képzési adatok jellemzői, a validációs stratégia, az időbeli tanulás vagy frissítés, a végrehajtási követelmények és a populációs eredmények részletei gyakran csak részben szerepeltek a jelentésekben, vagy teljesen hiányoztak. Az AI teljesítményével kapcsolatos bizonytalanságokat következetesebben kezelték, mint más AI-specifikus területeket.

A tíz cikk mindegyike modellekkel (Markov-modellek, döntési fák vagy hibrid szimulációk) dolgozott, amelyeket gyakran megfigyelési kohorszokból vagy publikált tanulmányokból származó adatokkal paramétereztek. Azonban egyik tanulmány sem értékelte előre a költséghatékonysági eredményeket. A fizetők perspektívái között szerepelt az egészségügyi fizető (7/10), a társadalmi (2/10) és az egészségügyi szolgáltató (1/10).

A tíz tanulmány közül négy a rákszűrésében, többek között a mell- és tüdőrák szűrésében alkalmazott mesterséges intelligenciát értékelte. A többi tanulmány az akut stroke felismerésére, a fertőzések (COVID-19 és tuberkulózis) ellenőrzésére, valamint a véletlenszerűen felfedezett rendellenességek, például vesemasszák és csigolyatörések felismerésére összpontosított. Öt tanulmány kereskedelmi forgalomban kapható AI-szoftvereket értékelte, míg a többi helyi intézmények által fejlesztett eszközöket vagy elméleti modelleket használt. A tanulmányok többsége az Egyesült Államokból (5/10) vagy az Egyesült Királyságból (3/10) származó egészségügyi adatokat használt, egy-egy tanulmány pedig belga és pakisztáni adatokat.

A mellrák szűrés volt a leggyakrabban értékelt klinikai alkalmazás. Ezek az elemzések [12, 22, 24] az AI-t kockázatrétegző eszközként vagy másodlagos olvasóként értékelték, és eredményeiket következetesen a megfelelő egészségügyi rendszerek elfogadott fizetési hajlandóság (WTP) küszöbértékeinek határain belül vagy azok közelében jelentették. Egyes modellekben az AI-alapú szűrési stratégiák jelentős költségmegtakarításokkal jártak, a QALY-k (a várható élettartamot és az életminőséget ötvöző standard mérőszám) növekedése mellett.

Gazdasági besorolás szerint hét tanulmány jelentette, hogy az AI domináns (a modell feltételezései szerint hatékonyabb és olcsóbb) [13, 22, 23, 25,26,27,28]. Három tanulmány költséghatékony volt, de nem domináns [12, 24, 29]. Egyetlen tanulmány sem találta az AI-t egyértelműen „nem költséghatékonynak” az elsődleges eredményében.

Megbeszélés

Szisztematikus áttekintésünk során csak tíz olyan tanulmányt találtunk, amely az AI-eszközök költséghatékonyságát értékelte a diagnosztikai radiológiában. Ehhez képest az AI-nek a radiológiában betöltött szerepe gyorsan növekedett. Egy bibliometriai elemzés több mint 11 000 AI-vel és gépi tanulással kapcsolatos publikációt azonosított a radiológiával kapcsolatos területeken 2000 és 2021 között [30], és a konferencia-tevékenység is hasonlóan bővült: 2019 és 2024 között közel 300 AI-vel kapcsolatos ülésszakot tartottak a főbb nemzetközi találkozókon, köztük 110-et az RSNA 2024-en [31]. Ez a kontraszt aláhúzza a tanulmányunkban tárgyalt bizonyítékhiányt.

A radiológiában alkalmazott AI költséghatékonyságáról rendelkezésre álló tanulmányok túlnyomórészt elméleti modellezésen alapulnak, nem pedig a valós világból származó prospektív költségadatokon, és sokan nem kereskedelmi forgalomban kapható vagy prototípus AI-rendszereket értékelnek a széles körben alkalmazott klinikai szoftverek helyett.

Érdemes megjegyezni, hogy a legtöbb modell nyilvánosan elérhető amerikai és brit adatforrásokból merített adatokat, ami korlátozza az általánosíthatóságot a különböző egészségügyi rendszerekre. Bár a tanulmányok hatóköre, keretei és módszertana eltérő volt, a legtöbbjük arra a következtetésre jutott, hogy az AI-beavatkozások költséghatékonyak lehetnek, ha azokat a megfelelő egészségügyi rendszerek WTP-küszöbértékeivel mérik össze. Az amerikai elemzések a domináns stratégiáktól (alacsonyabb költségek és nagyobb hatékonyság a modell feltételezései alapján) a költséghatékony stratégiákig terjedtek, amelyek jóval alacsonyabbak voltak az általánosan elfogadott amerikai WTP küszöbértéknél (100 000–150 000 USD/QALY [32]). Hasonlóképpen, az egyesült királyságbeli tanulmányok eredményei a National Institute for Health and Care Excellence (NICE) küszöbértékeken belül vagy azok közelében voltak (20 000–30 000 font/QALY [33]).

Bár nem korlátoztuk az értékelés típusát, a rendelkezésre álló bizonyítékok kilenc QALY-alapú CUA-t és egy DALY-alapú CEA-t tartalmaztak, CMA, CBA vagy BIA nélkül, ami korlátozta a keretek közötti összehasonlításokat. A CUA-k részben azért dominálnak, mert ezek a preferált keretek a visszatérítés és a nemzeti egészségügyi technológiaértékelés (HTA) döntéseihez. Ugyanakkor az alternatív elemzési formák hiánya inkább az AI gazdasági értékeléseinek elvégzésében és jelentésében jelenleg fennálló hiányosságokat tükrözi, mintsem a mi áttekintésünk módszertani választását. Bár a legtöbb tanulmány QALY-alapú CUA-kat alkalmazott, ez a mutató nem feltétlenül tükrözi teljes mértékben az AI hatását a radiológiában, különösen a munkafolyamat hatékonyságának javítására tervezett eszközök esetében, amelyek közvetett hatással lehetnek az egészségügyi eredményekre, ahelyett, hogy azokat közvetlenül mérnék. Ilyen esetekben alternatív megközelítések, például CMA vagy időhatékonysági elemzések nyújthatnak relevánsabb betekintést.

Az bizonyítékok alapja korlátozott, mivel kizárólag elméleti modellezésre támaszkodik, nem pedig valós gazdasági adatokra. Az ilyen tanulmányok gyakran ideális feltételeket feltételeztek, például az AI-ajánlások 100%-os betartását, további munkafolyamat-késedelmek hiányát és rögzített algoritmus-teljesítményt, amelyek a mindennapi klinikai gyakorlatban nem feltétlenül állnak fenn. Ezek a feltételezések a költséghatékonyság túlbecsléséhez vagy alulbecsléséhez vezethetnek, és korlátozhatják a megállapítások külső érvényességét, különösen azokban a tanulmányokban, amelyek csak marginális költséghatékonyságról számolnak be, ahol a valós körülmények kis változásai megváltoztathatják a következtetéseket.

Az AI gazdasági hatásának értékelése a radiológiai gyakorlatban bonyolult feladat, mivel a megvalósítási modellek sokfélék (pl. használatonkénti vagy vállalati licencelés), a bevált munkafolyamatokba való integrálás kihívásokkal jár, a globális egészségügyi rendszerek (állami, félig állami vagy teljesen magán) között különbségek vannak, és az AI-hez alkalmazott standard gazdasági módszerek is eltérőek. Annak érdekében, hogy a döntéshozók beléphessenek a radiológiában az AI használatának erőforrás-igényes világába, a jövőbeli kutatásoknak olyan prospektív és pragmatikus tanulmányokra kell összpontosítaniuk, amelyek a klinikai gyakorlatban már AI-t alkalmazó egészségügyi rendszerek valós költség-, felhasználási és eredményadatait használják fel. Bár a központi gazdasági értékelési módszerek és jelentési szabványok jól megalapozottak (pl. QALY-k, inkrementális költséghatékonysági arány (ICER-ek), CHEERS), az AI-értékelések legfőbb kihívása az, hogy a diagnosztikai pontosságot és a munkafolyamatok változásait következetesen mérhető, betegszintű eredményekké és döntéshozatal szempontjából releváns költségekké alakítsák át, valamint az AI-specifikus költségelemek (licencelés, integráció és karbantartás, teljesítményfigyelés és modellfrissítések) átlátható jelentése. Áttekintésünkben gyakran hiányzott az AI-specifikus jelentés. Ennek egyik magyarázata lehet, hogy a legtöbb vizsgált tanulmány a CHEERS-AI 2024-es megjelenése előtt készült. A jelentési szabványok fejlődésével a CHEERS-AI kiterjesztés hasznos, domain-specifikus keretrendszert kínálhat az AI gazdasági értékeléseinek konzisztenciájának és átláthatóságának javítására, ahol ez alkalmazható.

A jövőbeli elemzéseknek a tervezett bevezetési környezetre vonatkozóan ország- vagy rendszerspecifikus költségadatokat is fel kell használniuk, mivel a rendszerek közötti átvihetőség korlátozott, és fontolóra kell venniük a költségek bemutatását az emberi erőforrás alternatíváival (pl. radiológusok fizetése) összefüggésben, hogy kontextusba helyezzék, valóban költségmegtakarítást jelent-e az AI.

A szolgáltatói szempontból végzett értékelések, amelyek tartalmazzák a tényleges beszerzési, integrációs és karbantartási költségeket, tovább javíthatják a döntések relevanciáját az intézményi vezetés számára.

A működési hatásokra vonatkozó adatok, például a munkafolyamatok változásai, a radiológusok termelékenysége és a downstream ellátás igénybevétele integrálása elengedhetetlen lesz az AI radiológiai gazdasági értékének átfogó megértéséhez. Eközben a gyártók termékeik költséghatékonyságára vonatkozó állításait óvatosan kell értelmezni, mivel nincsenek prospektív, valós költségelemzések.

Összegzésként elmondható, hogy a radiológiában alkalmazott mesterséges intelligencia költséghatékonyságára vonatkozó jelenlegi bizonyítékok korlátozottak, mivel az összes rendelkezésre álló tanulmány modellezett feltételezéseken alapul, nem pedig prospektív implementációs adatokon. Bár ezek az elemzések arra utalnak, hogy a mesterséges intelligencia bizonyos feltételek mellett számos diagnosztikai alkalmazásban költséghatékony lehet, eredményeiket korlátozza a módszertani heterogenitás és az idealizált feltételezések.

A jövőbeli kutatásoknak elsőbbséget kell adniuk a prospektív, standardizált gazdasági értékeléseknek, amelyek figyelembe veszik a valós teljesítményt, a költségeket és a munkafolyamatra gyakorolt hatást, hogy pontosabban meg lehessen határozni az AI értékét a klinikai radiológiai gyakorlatban.

Szólj hozzá!
2026. január 06. 21:29 - Bágyi Péter

A mesterséges intelligencia gazdasági értéke a radiológiában: szisztematikus áttekintés

cover.jpgEconomic Value of AI in Radiology: A Systematic Review
Isabel M, Inka R, Jennifer E, Tugba Ai, Ali S. T, Michail E. K, Merel H, Gerhard A, Stephan N, Lisa A.
Radiology: Artificial Intelligence 2026; 8(1):e250090
DOI: 10.1148/ryai.250090
 
 
 
 
 
 
 

Bevezetés

A képalkotó diagnosztika volumenének növekedése (1,2) és a munkaerőhiány együttesen jelentős munkafolyamatbeli kihívásokat teremtett a radiológiában.
A mesterséges intelligencia (AI) ígéretes eszközként jelent meg ezeknek a kihívásoknak a megoldásában. Az AI számos előnnyel jár a radiológiai munkafolyamatban, többek között javítja a diagnosztikai pontosságot (3,4), csökkenti a vizsgálati és kiértékelési időt (5), alacsonyabb sugárterhelést eredményez (6), optimalizálja a kontrasztanyagok használatát (7) és javítja az ütemezést (8–11).
Az AI bevezetése technikai, működési és gazdasági akadályok leküzdését igényli – ideértve a képarchívum és kommunikációs rendszer integrációját, az adatbiztonságot és a szabályozási előírások betartását –, miközben egyensúlyt kell teremteni a költségek és az erőforrások között.
Ez motiválja az AI-eszközök gazdasági értékének értékelését. A gazdasági érték a fogyasztó által érzékelt, az árazást befolyásoló haszonként definiálható. A gazdasági érték pénzügyi mutatókkal becsülhető meg, például a fizetési hajlandósággal (WTP), amely az orvostudományban az egészségügyi eredmények javulásától függ. Ezért egy kulcsfontosságú mutató, az inkrementális költséghatékonysági arány (ICER) általában a költségeket a minőségi életévekhez (QALY) viszonyítja. A gazdasági érték értékelhető a szolgáltató (pl. kórházi költségek) vagy a társadalom (pl. termelékenységi veszteség) szempontjából. A gazdasági érték értékeléséhez széles körben alkalmazzák a költséghatékonysági elemzéseket (12).
Annak ellenére, hogy számos tanulmány vizsgálta az AI technikai képességeit a radiológiában, a gazdasági értékelések továbbra is ritkák. Ez a hiányosság különösen szembetűnő, tekintve, hogy 2015 óta 3,5 milliárd amerikai dollárt (USD) fektettek be az orvosi képalkotó AI-ba (13). Az AI valódi költséghatékonyságának megértése elengedhetetlen a bevezetésével, megtérülésével és a klinikai gyakorlatban betöltött szerepével kapcsolatos, bizonyítékokon alapuló döntések meghozatalához. A szabályozói jóváhagyás azonban gyakran megelőzi a megbízható klinikai vagy gazdasági validálást.
Ezeknek a kérdéseknek a megoldása érdekében elemeztük az AI-eszközök radiológiai gazdasági értékére vonatkozó bizonyítékokat, beleértve minden olyan típusú tanulmányt, amely számszerűsíthető gazdasági eredményeket, például költségeket vagy ICER-t nyújt, függetlenül a perspektívától (egészségügyi szolgáltató/társadalom).
Ez a szisztematikus áttekintés a következőket célozza:
  • összefoglalni a jelenlegi bizonyítékokat az AI gazdasági értékéről a teljes radiológiai munkafolyamatban, a tervezéstől a diagnózisig, a kezelés tervezéséig és a számlázásig;
  • értékelni a meglévő gazdasági elemzések minőségét a kialakult keretek felhasználásával; és
  • azonosítani a kritikus ismerethiányokat a jövőbeli kutatási és befektetési döntések irányítása érdekében.

Anyagok és módszerek

Ez a szisztematikus irodalomáttekintés előzetesen regisztrálásra került a SPROSPERO-ban (CRD42024588552 [14]). Az eredeti protokoll a PROSPERO platformon elérhető, az esetleges változtatások a S1. mellékletben vannak leírva. A helyi etikai bizottság (Ärztekammer Hamburg, Németország) szerint a publikált adatok irodalomáttekintéséhez nem volt szükség jóváhagyásra. A jelentés a szisztematikus áttekintések és metaanalízisek preferált jelentési elemeinek (azaz PRISMA) 2020 irányelveit követi (lásd a S2. mellékletet). Ez a tanulmány nem kapott finanszírozást, és a szerzők kijelentik, hogy nincsenek összeférhetetlenségi érdekeik. A megállapításokat alátámasztó adatok a szerzőtől kérhetők. Az egészségügyi gazdasági kifejezések szótára az 1. táblázatban található:

Rövidítés Teljes név Leírás
CHEQUE Egészségügyi gazdasági minőségértékelés kritériumai

Egészségügyi gazdasági minőségértékelés kritériumai    A költséghatékonysági elemzések minőségének értékelésére szolgáló keretrendszer, amelyet 2023-ban fejlesztettek ki. Más keretrendszerekkel ellentétben megkülönbözteti a módszer minőségét és a jelentés minőségét, és lehetővé teszi a különböző minőségi tulajdonságok relatív fontosságának számszerűsítését.

CHEERS Egységesített egészségügyi gazdasági értékelési jelentési szabványok

Az egészségügyi gazdasági értékelések minőségének értékelésére szolgáló, bevált keretrendszer, amely a kézirat minden részének (pl. cím, összefoglaló, módszerek, eredmények) jelentésminőségére összpontosít.

CEA Költséghatékonysági elemzés

Gazdasági értékelési módszer, amely összehasonlítja a beavatkozások relatív költségeit és eredményeit (hatásait); így lehetővé teszi egy adott eredmény (hatás) elérésének leghatékonyabb módjának meghatározását azáltal, hogy értékeli a beavatkozás értékét a költségéhez viszonyítva.

ICER Inkrementális költséghatékonysági arány

A CEA-kban használt kulcsfontosságú mutató, amelyet úgy számolnak ki, hogy két beavatkozás (vagy beavatkozás és kontroll) közötti költségkülönbséget elosztják a hatásuk közötti különbséggel; így az egy további hatásegység (pl. QALY-nkénti egészségügyi haszon) eléréséhez szükséges többletköltséget jelenti.

QALY Minőségi életév

Az élet mennyiségét és minőségét ötvöző mérőszám. Egy QALY egy év tökéletes egészségnek felel meg; nulla QALY a halálnak felel meg. Egy rossz egészségi állapotban eltöltött év ezért kevesebbet ér, mint egy tökéletes egészségben eltöltött év. A QALY tehát nemcsak azt veszi figyelembe, hogy a beteg mennyi ideig él, hanem azt is, hogy milyen minőségű életet él. A QALY-t általában eredménymérőként használják az egészségügyi gazdasági értékelésekben.

WTP Fizetési hajlandóság

Az a maximális összeg, amelyet egy egyén vagy a társadalom hajlandó fizetni egy tárgyért vagy szolgáltatásért. Az egészségügyi rendszerben a WTP általában az egészség javulására (például egy QALY) vagy egy negatív eredmény elkerülésére utal. Ha egy beavatkozás ICER-en alapuló költségei alacsonyabbak, mint például egy egészségügyi rendszer WTP-küszöbértéke, akkor azt költséghatékonynak tekintik az adott egészségügyi rendszer számára.

 

A felülvizsgálat három fő célját módszertanilag a következőképpen kezelték:

  • az AI gazdasági értékére vonatkozó bizonyítékok összefoglalása és a tanulmányok munkafolyamat-fókuszuk szerint történő kategorizálása;
  • a meglévő gazdasági elemzések minőségének értékelése a CHEQUE (Criteria for Health Economic Quality Evaluation) eszköz felhasználásával; és
  • a szakirodalomban és a szakértői elemzésekben fellelhető hiányosságok azonosítása.

Szisztematikus irodalomkutatás

A PubMed-et, mint a biomedicinális irodalom globális standardját (15), valamint az EconLit-et és a Business Source Ultimate-ot, mint a gazdasági irodalom kiterjedt forrásait kerestük. A keresés 2010 januárjától 2024 novemberéig terjedő cikkeket tartalmazott, tükrözve az AI-kutatás gyors növekedését: 2010-ben évi 3891 cikkről 2024-re évi 49 739 cikkre. A keresési stratégiák a Medical Subject Headings (azaz MeSH) és az AI-t, a radiológiát és a gazdasági eredményeket lefedő kulcsszavakat (pl. „mesterséges intelligencia”, „költséghatékonyság”) kombinálták. Az EconLit és a Business Source Ultimate adatbázisokban hasonló módon kerestünk, a „radiológia” szót a teljes szövegben kerestük, mivel a címekben és az absztraktokban korlátozott eredményeket kaptunk. A részletes keresési stratégiák a S3. mellékletben találhatók.

Kiválasztási folyamat

A kiválasztás kritériumai közé tartoznak azok az eredeti kutatási cikkek, amelyek a radiológiában alkalmazott mesterséges intelligenciát értékelik, és kifejezetten számszerűsítik a gazdasági eredményeket (költségek, költségmegtakarítások, költséghatékonyság, ICER, bevételek, nettó pénzügyi előnyök vagy befektetési megtérülés). A kizárási kritériumok között szerepeltek a preprintek, a nem angol nyelvű teljes szövegek, a puha gazdasági eredményekkel rendelkező tanulmányok (pl. időmegtakarítás költségek számszerűsítése nélkül), a nem klinikai kontextusok, valamint azok, amelyek nem radiológiai AI-eszközöket hasonlítottak össze radiológiai alkalmazásokkal (pl. AI-alapú elektrokardiogram-elemzések összehasonlítása nem AI-alapú kardiális MRI-vel [16]).
Egy bíráló (I.M., 6 éves tapasztalattal rendelkező radiológus, egészségügyi közgazdaságtanból szerzett MBA) átnézte az összes cím/összefoglaló és a potenciálisan alkalmas cikkek teljes szövegét. Egy második bíráló (L.A., 8 éves tapasztalattal rendelkező radiológus, >2 éves közgazdasági képzéssel) újraértékelte a felvett tanulmányokat és a nem egyértelműen alkalmas tanulmányokat (példákért lásd az 1. ábrát és a legenda); az eltéréseket konszenzussal oldották meg.
images_ryai_250090_fig1.jpg

Adatkinyerés

Az első bíráló (I.M.) kivonta a tanulmány jellemzőit (szerzőség, év, AI típus, képalkotási módszer, összehasonlítási szabványok) és a gazdasági paramétereket, beleértve a költségforrásokat, az alapeset-forgatókönyveket, az AI-költségeket, a perspektívákat, az időhorizontot, a diszkontálást, a hasznosság súlyozását és a gazdasági eredményeket (pl. teljes költségek, ICER-ek, QALY-hez kapcsolódó mutatók). A hiányzó adatokat „nem meghatározott” jelöléssel látták el. A második bíráló (L.A.) ezután ellenőrizte az összes kivont információ pontosságát és teljességét. Bármely eltérést, például a költségdefiníciók eltérő értelmezését vagy a potenciálisan hiányos eredményadatokat, mindkét bíráló megvitatta, amíg konszenzusra nem jutottak.

A torzítás kockázatának értékelése

A meglévő eszközök, mint például a Consolidated Health Economic Evaluation Reporting Standards (CHEERS) (17) és a Quality of Health Economic Studies (18) a jelentések minőségét vagy a dichotóm ítéleteket hangsúlyozzák. Ezért a CHEQUE eszközt (19) használtuk, amely 24 tételt értékel mind a módszer, mind a jelentés minősége tekintetében, és lehetővé teszi a „valamennyire” minősítést a részleges teljesítés esetén. Értékeli a módszertani robusztusságot (pl. a tanulmány tervezése, statisztikák) és a jelentés átláthatóságát. A területek közé tartoznak például a döntés hatálya, az eredmények mérése, az időhorizont, a diszkontálás és a költségek/erőforrások felhasználása. Az elemeket „igen”, „kissé”, „nem” vagy „nem alkalmazható” kategóriákba soroltuk, ahol a „nem alkalmazható” kategória fontos volt azoknak a tanulmányoknak a figyelembevétele szempontjából, amelyek nem kapcsolták össze a költségeket az egészségügyi eredményekkel. Két bíráló (I.M., L.A.) függetlenül értékelte az összes elemet; az eltérő véleményeket konszenzussal oldottuk meg.

Szintézis módszerek

Mivel a tanulmányok tervezése (valós világ vs. modellezett), a statisztikai módszerek és az eredmények mérése (pl. ICER vs. teljes költségek) heterogén volt, meta-elemzés nem volt lehetséges (20). Az összes alkalmas tanulmányt kvalitatív módon szintetizálták. Adatátalakításra vagy -konverzióra nem volt szükség. A tanulmányok módszereinek és eredményeinek részleteit táblázatos formában, a célokat, a tervezést és az eredményeket pedig narratív formában összegeztek. Az összehasonlítás érdekében a tanulmányokat AI-típus szerint csoportosították.
Ebben a felülvizsgálatban a mélytanulási eszközök olyan AI-alkalmazásokat jelentenek, amelyek többrétegű neurális hálózatokat (pl. konvolúciós neurális hálózatok, ResNets) használnak, amelyek közvetlenül feldolgozzák a nyers képalkotási adatokat olyan feladatokhoz, mint a szegmentálás, a léziók észlelése vagy a jellemzők kivonása. A gépi tanulási tanulmányok egy szélesebb kategóriát ölelnek fel, beleértve a hagyományos algoritmusokat és az egyszerűbb neurális hálózatokat, amelyek általában strukturált, előfeldolgozott adatokra és manuálisan megtervezett jellemzőkre támaszkodnak a prediktív modellezés, osztályozás vagy munkaterhelés-becslés céljából.
A felülvizsgálat harmadik célja érdekében a szerzők (I.M., L.A.), akik radiológiai és egészségügyi közgazdasági háttérrel rendelkeznek, szisztematikus felülvizsgálat és szakértői összefoglalás alapján azonosították a radiológiában alkalmazott AI gazdasági értékével kapcsolatos ismerethiányokat.

Eredmények

A tanulmányok kiválasztása

A szisztematikus keresés 1795 találatot azonosított a PubMed-ben, 73-at a Business Source Ultimate-ban és 11-et az EconLit-ben (1. ábra). A PubMed legtöbb találata a címében vagy az összefoglalójában hivatkozott a költségmegtakarításra vagy a költséghatékonyságra, de nem tartalmazott konkrét adatokat vagy számszerűsítést. Az első szűrés után 16 duplikátumot kizártunk. A 31 áttekintésből 11 cikk származott, de kettő közülük korábban már azonosított tanulmányok duplikátuma volt. Összesen 88 teljes szöveget értékeltünk. A legtöbb kizárt tanulmány számszerűsítés nélkül feltételezte a költségmegtakarítást, nem tartalmazott radiológiai kontextust, vagy nem volt elégséges a módszertani részletesség (48–57,78,80) (S1. táblázat). Az 1879 átvizsgált PubMed-publikációból végül 21 (1%) került be a tanulmányba. A Business Source Ultimate és az EconLit adatbázisokból egyik sem volt alkalmas (részletek a S3. függelékben).

A kiválasztott tanulmányok jellemzői

A felülvizsgálat eredményeinek összefoglalását a 2. ábra tartalmazza. A 21 tanulmány közül 81% (17/21) 2020 után jelent meg, ami tükrözi a radiológiai AI-kutatások gyors növekedését; 48% (21-ből 10) a gépi tanulásra összpontosított, amelyek közül 10-ből 9 mélytanulást alkalmazott; egyéb AI-típusok között szerepelt a számítógépes diagnosztika (CAD) (21-ből 7, 33%), a természetes nyelvfeldolgozás (NLP) (21-ből 2, 10%) és hipotetikus AI-eszközök (21-ből 2, 10%). A képalkotó módszerek között szerepelt a CT (21-ből 6, 29%), a radiográfia (21-ből 5, 24%), a mammográfia (21-ből 4, 19%) és az MRI (21-ből 3, 14%), a mellkas, az emlő és az agy voltak a leggyakrabban vizsgált anatómiai régiók.
images_ryai_250090_fig2_1.jpg
A tanulmányok az Egyesült Királyság, az Egyesült Államok, Japán, Brazília, Malawi és más országok állami és magán egészségügyi rendszereit vizsgálják. Az egészségügyi rendszerek közötti különbségek jelentősen befolyásolják a költséghatékonyságot. A politikai döntéshozóknak figyelembe kell venniük ezt a heterogenitást, amikor az eredmények általánosíthatóságát értelmezik.
A klinikai alkalmazás tekintetében a legtöbb tanulmány az emlőrák szűrésére (21–24), vagy a tuberkulózis szűrésére (25–28) összpontosított, majd a tüdőrák szűrésére (29,30), az opportunisztikus szűrésre (31,32), a stroke diagnosztikájára (33,34) és a trombolízis döntéshozatalára (35), a differenciáldiagnosztikára (pl. májbetegségek [36], vesetumorok [37], COVID diagnosztika [38]). Egyedi tanulmányok foglalkoztak a tumorok szegmentálásával és osztályozásával (39), az MRI képalkotás gyorsításával (40) vagy a követési ajánlások betartásának javításával (8) (S2. táblázat). A tanulmányok eloszlását a radiológiai munkafolyamat és a szubszpecialitások között a 3. ábra mutatja.
images_ryai_250090_fig3.jpg

A tanulmányok minőségének értékelése

A 4. ábra és az S3 táblázat összefoglalja a tanulmányok minőségét. Összességében a jelentések minősége meghaladta a módszertani minőséget. A gépi tanulásról szóló tanulmányok kapták a legmagasabb pontszámot (70% módszertan, 73% jelentés). A hipotetikus AI-eszközök jól teljesítettek (77%), de a módszertani pontszámok kissé alacsonyabbak voltak (66%). A CAD-tanulmányok átlagosan 60% (módszer) és 75% (jelentés) pontszámot értek el. Az NLP-tanulmányok kapták a legalacsonyabb pontszámot (40% módszertani minőség, 59% jelentésminőség), de ezek voltak a legkisebb alcsoport (21-ből 2), ami korlátozta a megbízható következtetések levonásának lehetőségét.
images_ryai_250090_fig4.jpg

A tanulmány eredményei

A CAD, a gépi tanulás, az NLP és a hipotetikus AI eszközök módszereit és eredményeit a 2–4. táblázat és az S4 táblázat foglalja össze.

CAD-re vonatkozó tanulmányok

Hét tanulmány értékelte a CAD-eszközöket a tuberkulózis kimutatására és az emlőrák szűrésére. A tuberkulózis kimutatását illetően Bashir és munkatársai (25) megállapították, hogy a CAD költséghatékony megoldás a tünetmentes populációk nagyszabású szűrésére, 5%-os távoli radiológus felügyelettel. Philipsen és munkatársai (28) a tuberkulózis kimutatásának megnövekedett költségeiről számoltak be, amikor a CAD emberi szintű diagnosztikai küszöbértékekkel működött. MacPherson és munkatársai (26) egy nagyon érzékeny küszöbértékkel értékelték a CAD-alapú tuberkulózis-szűrést Malawiban, és arra a következtetésre jutottak, hogy az nem költséghatékony a standard ellátáshoz képest. Hasonlóképpen, Santos és munkatársai (27) egy specifikusabb küszöbértéket alkalmaztak ugyanazon CAD-eszközre brazil börtönökben, ami csökkentette az érzékenységet a standard ellátáshoz képest, és magasabb költségeket eredményezett (27).
Az emlőrák esetében Sato és munkatársai (22) megállapították, hogy a CAD-támogatott, egyetlen olvasó által végzett munkafolyamatok drágábbak voltak, mint a hagyományos kettős olvasás, de nagy szűrési volumenek (≥2000 eset) és 87% feletti CAD-specifikusság esetén költséghatékonnyá váltak. Guerreiro és munkatársai (24) arra a következtetésre jutottak, hogy a CAD növelte a költségeket olyan környezetben, ahol a radiológusok rövid olvasási idővel rendelkeztek (<0,5 perc betegenként), de költségmegtakarítást eredményezett, amikor az emberi olvasási idő meghaladta az 1,5 percet. Killelea és munkatársai (23) a CAD 2001 és 2008 közötti valós bevezetését vizsgálták, és megállapították, hogy az emelte az egyes további rákos megbetegedések felismerésének költségeit; a tanulmány azonban részben elavult mammográfiai technológián alapult. Összességében a CAD költséghatékonysága nagyban függött a szűrési mennyiségtől, az engedélyezési modellektől és a diagnosztikai teljesítménytől.

Gép tanulással kapcsolatos tanulmányok

Ezek a tanulmányok számos klinikai alkalmazást vizsgáltak, többek között az opportunista szűrést, a tüdőrák szűrést, az emlőrák szűrést, a COVID-19 diagnosztikát, a veseelváltozások kimutatását, a neuroradiológiai diagnosztikát és a gyorsított képalkotást.
Curl és munkatársai (31) megállapították, hogy az AI költséghatékony az opportunisztikus osteoporosis szűrésben, ha a WTP küszöbérték 50 000–100 000 USD/QALY. Azonban a röntgendiagnosztika alacsony térítési aránya korlátozhatja annak pénzügyi életképességét. Hasonlóképpen, Pickardt és munkatársai (32) értékelték az AI-t az opportunista CT szűrésben a kardiovaszkuláris kockázat és a szarkopénia kezelésének irányítására. Bár az AI a legtöbb kor- és nem-specifikus forgatókönyvben költséghatékonyabb volt, mint az összes vagy egyáltalán nem kezelés, a tanulmány nem tartalmazott összehasonlítást a hagyományos kockázatértékelési módszerekkel.
A tüdőrák szűrésében Ziegelmayer és munkatársai (30) kimutatták, hogy egy magas diagnosztikai pontosságú (érzékenység: 97,7%; specifitás: 98,4%) AI-eszköz költséghatékonyabb. 100 000 USD/QALY WTP küszöbértéknél az AI költségei 1240 USD-ig elfogadhatónak maradtak. Adams és munkatársai (29) szintén beszámoltak az AI-al kapcsolatos költségmegtakarításokról a tüdőrák szűrésében, bár a tanulmány nem tartalmazott szigorú statisztikai elemzést.
Vargas-Palacios és munkatársai (21) voltak az egyetlen kutatócsoport, amely mélytanulást nem alkalmazó gépi tanulási tanulmányt végzett. A gépi tanulást az emlőrák szűrésére alkalmazták. 20 000 font/QALY WTP küszöbérték mellett az AI-támogatott modell egyetlen emberi olvasással kombinálva hasonlóan költséghatékony volt, mint a kettős emberi olvasás, ha az érzékenység és a specifitás megegyezett az emberi olvasáséval. Különösen figyelemre méltó, hogy a magasabb specifitás indokolta az AI-vel kapcsolatos magasabb költségeket.
Esposito és munkatársai (38) az AI alkalmazásait vizsgálták a COVID-19 kezelésében, de gyenge módszerekre és feltételezésekre támaszkodtak, ami korlátozta a tanulmány megbízhatóságát.
A vese diagnosztikában Marka és munkatársai (37) arról számoltak be, hogy az AI költséghatékony a veseléziók kezelésében; azonban alapesetükben irreálisan alacsony emberi specifitást (<38%) feltételeztek (38).
A neuroradiológiai alkalmazások tekintetében Ruffle és munkatársai (39) az AI használatával a glióma pontozásában költségcsökkenést jelentettek, de nem vették figyelembe a szoftverköltségeket, és nem végeztek formális költséghatékonysági elemzéseket. Mansour és munkatársai (35) azt állították, hogy az AI a stroke értékelésében felülmúlta a hagyományos távközlési módszereket (pl. mobiltelefonon és WhatsAppon keresztül küldött képek), de a tanulmányt jelentős módszertani korlátok gyengítették.
Végül Brix és munkatársai (40) értékelték az AI-t az MRI-felvételek gyorsításában, ami potenciális kapacitásnövekedést és költségmegtakarítást eredményezhet. A tanulmány azonban nem hasonlította össze a standard gyakorlatot, és nem értékelte a befektetés megtérülését sem.

NLP-el és hipotetikus AI-modellekkel kapcsolatos tanulmányok

Guo és munkatársai (36) értékelték a ChatGPT-4 és a GPT-4o alkalmazásokat a májbetegségek diagnosztizálásának előrejelzésében. Megállapították, hogy az AI diagnosztikai pontossága megegyezett az emberi diagnosztikai pontossággal (60–80%), és feltételezve, hogy az AI költsége nulla, olcsóbb volt. A tanulmány módszertani minősége azonban a legrosszabb volt a vizsgált tanulmányok közül. Roth és munkatársai (8) mesterséges intelligenciát alkalmaztak a radiológiai leletekben szereplő, még nem teljesített utánkövetési ajánlások azonosítására, majd ezt követően ápolók vezették a vizsgálatok ütemezését. Bár a tanulmány pozitív nettó pénzügyi hasznot jelentett, a mesterséges intelligencia szoftverének és bevezetésének költségeit nem közölték, ami korlátozta a tanulmány gazdasági átláthatóságát.
Bharadwaj és munkatársai (33) pozitív befektetési megtérülést jósoltak egy hipotetikus AI-platformra, amely ötvözi a betegkezelést és a képi diagnosztikát. Hasonlóképpen, van Leeuwen és munkatársai (34) modelleztek egy hipotetikus AI-eszközt a stroke felismerésére, amelynek gazdasági és klinikai előnyeit jósolták a jobb eredmények és a csökkent társadalmi költségek miatt. Ezek az eredmények azonban nagymértékben támaszkodtak az AI érzékenységének feltételezett, az embernél jobb teljesítményére

Azonosított ismerethiányok

Annak ellenére, hogy egyre növekszik az érdeklődés az AI radiológiai alkalmazása iránt, a formális gazdasági értékelések továbbra is korlátozottak: az 1879 átvizsgált publikációból csak 21 tanulmányt azonosítottak. A legtöbb tanulmány szűken a diagnosztikai alkalmazásokra összpontosít, míg a radiológiai munkafolyamat egyéb szakaszait – például a képalkotást, a triázst vagy a nyomon követést – ritkán értékelik (3. ábra).
A klinikai gyakorlatban már bevezetett AI-eszközök gazdasági értékelései ritkák. A legtöbb tanulmány inkább feltételezéseken, mint valós adatokon alapul, ami korlátozza gyakorlati relevanciájukat és hasznosságukat a tájékozott befektetési vagy politikai döntések meghozatalában.
Jelentős módszertani hiányosságok is fennállnak. A jelenlegi minőségértékelő eszközök szilárd határok között működnek, általában vagy a gazdasági értékeléssel (pl. CHEERS), vagy az AI-tanulmányok tervezésével és a jelentések minőségével (pl. a frissített Checklist for Artificial Intelligence in Medical Imaging [CLAIM] [41]) foglalkoznak, vagy az AI-képalkotó eszközök széles körű értékelését végzik (42). Nem találtunk azonban olyan átfogó pontozási rendszert, amely egyszerre venné figyelembe az AI-eszközök műszaki teljesítményét, klinikai relevanciáját és gazdasági hatását. Ez a hiányosság oda vezethet, hogy a robusztus gazdasági modellezéssel, de klinikailag marginális AI-eszközökkel rendelkező tanulmányok túlzottan magas értékelést kapnak. Ennek orvoslására olyan integrált értékelési keretrendszerre van szükség, mint amilyen az 1. ábrán látható, amely együttesen értékeli az AI-eszközök műszaki érvényességét, klinikai hasznosságát és gazdasági hatását. Az összes bevont tanulmány és azok eredményeinek áttekintése a 2. ábrán is látható.

Megbeszélés

Ez a szisztematikus áttekintés összefoglalja a radiológiában alkalmazott mesterséges intelligencia gazdasági értékére vonatkozó jelenlegi bizonyítékokat, értékeli a meglévő gazdasági elemzések minőségét, és azonosítja a legfontosabb ismerethiányokat.
A feladat komplexitása és az árképzési modellek a költséghatékonyság központi meghatározó tényezőiként jelentek meg. Az 1879 átvizsgált publikáció közül csak 21 felelt meg a felvételi kritériumoknak, és a legtöbb tanulmány módszertani szigorúságát (CHEQUE kritériumok) közepesnek vagy gyengének értékelték, ami rávilágít arra a kihívásra, hogy a mesterséges intelligencia potenciálját hogyan lehet átültetni a valós klinikai gyakorlatba.
Négy fő megállapítás született:
  1. az orvosi képalkotásban alkalmazott AI gazdasági értéke nagy volumenű vagy erőforrás-korlátozott környezetben jelentkezik;
  2. a költséghatékonyság erősen függ a licencmodellektől;
  3. a valós adatok magasabb költségeket mutatnak, mint a hipotetikus AI-eszközökre vonatkozó modellezési tanulmányok feltételezései;
  4. sok értékelés nem elég módszertanilag szigorú, vagy nem veszi figyelembe az egészségügyi eredményeket vagy a különböző egészségügyi rendszereket.

---

  1. az AI főként nagy volumenű, erőforrás-igényes feladatokban mutat gazdasági értéket, ahol pontossága megegyezik vagy meghaladja az emberi teljesítményt, vagy ahol radiológushiány van (22,25,28). Erőforrás-gazdag környezetben (pl. tüdőrák szűrés) az AI csökkenti a munkaterhelést, miközben megőrzi a pontosságot (29). Az alacsonyabb komplexitású feladatok, például a mellkasröntgenek esetében az AI csak korlátozott előnyt kínál, kivéve az emberi erőforrások szűkösségével jellemzett környezeteket, például a tuberkulózis szűrést Pakisztánban (25).
  2. a költséghatékonyság nagyon érzékeny a fizetési struktúrákra. A fix árú licencelés általában jobban teljesít, mint a használat alapú fizetési modellek, különösen a nagy volumenű környezetben. Például Killelea és munkatársai (23) megállapították, hogy a mellrák szűrés használatonkénti fizetés esetén költséges, míg Bashir és munkatársai (25) kimutatták, hogy a fix árú licencelés hatékony a tuberkulózis szűrésében.
  3.  a valós világban végzett tanulmányok gyakran emelkedett költségekről számolnak be (23,24), míg a hipotetikus AI-eszközökre vonatkozó modellezési tanulmányok inkább megtakarításokat jósolnak (33,34). Killelea és társai (23) arról számoltak be, hogy a mammográfiás szűrés egy főre jutó költségei 2001 és 2008 között 44 dollárról 63 dollárra emelkedtek a digitalizálás és a CAD használata miatt, a Medicare kiadásai pedig 666 millió dollárról 962 millió dollárra nőttek. Guerriero és társai (24) hasonló költségnövekedést tulajdonítottak a licencdíjaknak és a csökkent specifitásból eredő magasabb visszahívási arányoknak.
  4. sok gazdasági értékelés nem volt módszertanilag szigorú és interdiszciplináris. A tanulmányok közel fele csak a költségekkel foglalkozott (23,25,28,29,36,39,40), kihagyva a gazdasági értékértékeléshez szükséges alapvető egészségügyi eredményeket. Az AI-vel kapcsolatos kiadásokat gyakran nem jelentették megfelelően (8,35,36), és az egészségügyi rendszer különbségei jelentősen befolyásolták a gazdasági eredményeket. Például a WTP küszöbértékek 400 USD/QALY-tól Malawiban (26) 100 000 USD-ig terjedtek az Egyesült Államokban és Európában (30,32,37), vagy az afrikai környezetben hatékonyan alkalmazott megoldások, mint például a WhatsApp (pl. Mansour et al [35]), nem felelnének meg a magas jövedelmű országok adatvédelmi törvényeinek. Ezért az árstruktúrák és a klinikai munkafolyamatok alapvetően meghatározzák az AI költséghatékonyságát a különböző egészségügyi környezetben. Egy másik figyelmen kívül hagyott tényező a „teljesítményeltérés” volt, amelynek során a frissítések vagy az adatok változása megváltoztatja az AI teljesítményét, ami hatással van a hosszú távú költséghatékonyságra.
A jövőben a radiológia számára előnyös lenne egy olyan egységes keretrendszer, amely ötvözi a CLAIM (41) mesterséges intelligencia technikai minőségi kritériumait a CHEQUE (19) gazdasági szigorúságával. Az egységes keretrendszer kiterjesztheti a CLAIM ellenőrzőlistát, hogy az együttesen tartalmazzon technikai érvényességet, klinikai hasznosságot és gazdasági hatást, ideális esetben a mesterséges intelligencia fejlesztői, klinikusok és egészségügyi közgazdászok közötti interdiszciplináris együttműködés révén kidolgozva.
A jövőbeli kutatásoknak az elszigetelt diagnosztikai feladatok helyett az egész munkafolyamatot (toborzás, ütemezés, megfelelés, képalkotás, kezelés, számlázás) optimalizáló integrált AI-platformokra kell összpontosítaniuk.
A szoftverfrissítések, a teljesítményeltérések és a változó klinikai populációk figyelembevétele érdekében elengedhetetlen a rendszeres újraértékelés. Bár az NLP-alkalmazások ígéretesek a jelentések és az adatok kinyerésének automatizálása szempontjából, még mindig hiányoznak a megbízható gazdasági értékelések.
Sürgősen szükség van olyan, a valós világban végzett implementációs tanulmányokra, amelyek összehasonlítják a mesterséges intelligenciával támogatott és a hagyományos ellátást különböző egészségügyi környezetben, és amelyekre egyértelmű jogi keretek támaszkodnak a felelősségre vonhatóság és a kártérítési kötelezettség tekintetében.
A klinikailag nem validált mesterséges intelligencia eszközök korai bevezetése veszélyeztetheti a klinikai irányítást és a betegbiztonságot, ami jelentős szabályozási és etikai aggályokat vet fel. Ezért elengedhetetlen a mesterséges intelligencia eszközök átfogó klinikai és gazdasági validálása.
Ezen áttekintés eredményei alapján az alábbiakat javasoljuk az AI bevezetését fontolgató érdekelt felek és radiológiai adminisztrátorok számára:
Az AI bevezetése előtt strukturált elemzések, például erősségek, gyengeségek, lehetőségek és veszélyek (azaz SWOT) segítségével azonosítsák a munkafolyamat egyértelmű szűk keresztmetszeteit kezelő klinikai alkalmazásokat. A létesítmény méretének és a képalkotási volumennek megfelelő árképzési modelleket alkudjanak ki. Vezessenek be monitoring rendszereket a valós gazdasági és klinikai eredmények nyomon követésére.
A radiológiai osztályok csak akkor szerezzenek be AI-t, ha az egyértelmű munkafolyamat-hiányosságokat pótol, és a fizetési modell szerint bizonyított egészségügyi gazdasági előnyökkel jár. A politikai döntéshozóknak elő kell írniuk az AI-költségtérítésre vonatkozó szabványosított gazdasági értékeléseket, és egyértelmű orvosi-jogi kereteket kell létrehozniuk.
Az egészségügyi politika tekintetében az eredmények arra utalnak, hogy a központosított szűrőprogramok nagyobb valószínűséggel eredményeznek méretgazdaságosságot és költségmegtakarítást.
Az AI-fejlesztőknek prioritásként kell kezelniük az integrált platformmegoldásokat, az átlátható teljesítménymutatókat, a kockázatmegosztásos fizetési struktúrákat és a klinikai felhasználókkal való közvetlen együttműködést.
Döntő fontosságú, hogy minden AI-bevezetési stratégia figyelembe vegye a helyi egészségügyi rendszer struktúráját, beleértve a WTP küszöbértékeket, a személyzeti kapacitást és a szabályozási követelményeket.
A terület fejlődése ezért megköveteli az AI-eszközök szisztematikus értékelését a különböző egészségügyi rendszerekben, a QALY- és ICER-alapú módszerek következetes alkalmazását, valamint az átlátható visszatérítést, a biztonságos bevezetést és a mérhető klinikai hatást biztosító politikákat.
Ennek a vizsgálatnak számos korlátja volt. A Google Scholar-t kizártuk a túlzott mennyisége és korlátozott specifikussága miatt, és a teljesség és a megvalósíthatóság egyensúlyának érdekében a PubMed-et és a főbb gazdasági adatbázisokat részesítettük előnyben. Bár az első szűrést egyetlen olvasó végezte, az összes bevont és kétértelmű tanulmányt függetlenül újraértékeltek. A CHEQUE-hez hasonló szabványosított pontozási rendszerek nem feltétlenül veszik figyelembe az egészségügyi gazdaságtan vagy az AI bevezetésének regionális különbségeit, ami potenciálisan befolyásolhatja az általánosíthatóságot. Például Mansour és munkatársai (35) bizonytalan kép-megosztó platformok használata ellenére magas CHEQUE-pontszámot értek el, ami jól illusztrálja, hogy a magas módszertani pontszámok nem mindig egyenlőek az optimális valós klinikai implementációs minőséggel. Mivel a CHEQUE a költséghatékonysági elemzéseket hangsúlyozza, az egészségügyi eredményeket kizáró tanulmányok alacsonyabb pontszámot kaptak, ami szerintünk megfelelő korlátozás, mivel az egészségügyi eredményekhez való kapcsolódás elengedhetetlen az orvosi gazdasági értékek értékeléséhez.
Összegzésként elmondható, hogy a mesterséges intelligencia radiológiában való sikeres alkalmazása szabványosított, magas színvonalú, interdiszciplináris gazdasági elemzéseken és egy többdimenziós stratégián múlik, amely figyelembe veszi a klinikai relevanciát, az alkalmazás mértékét és a helyi egészségügyi környezetet.
Szólj hozzá!
2026. január 04. 19:06 - Bágyi Péter

A radiológiai leletek újragondolása: felmérés a beutaló orvosok véleményéről

cover_tif_2.jpgRethinking radiology reports: A survey of referring physicians’ perspectives
Reschke, Philipp et al.
European Journal of Radiology, Volume 187, 112068, June 2025
DOI: 10.1016/j.ejrad.2025.112068

 


A radiológiai leletek kulcsfontosságúak a diagnosztikai képalkotás és a klinikai döntéshozatal összekapcsolásában, kritikus kommunikációs eszközként szolgálnak a radiológusok és a beutaló orvosok között [1]. Bár egyes beutaló orvosok maguk is elemezhetik a képalkotó vizsgálatokat, a radiológus lelete jelentős hozzáadott értéket jelent, mivel részletesebb és pontosabb értékelést nyújt [2–4].
A radiológiai leletek hagyományosan diktálószoftver segítségével készült szabad szöveges beviteli módra támaszkodnak, amelyek rugalmasságot nyújtanak, de formátumuk, teljességük és pontosságuk tekintetében eltérőek. A leletek stílusa gyakran tükrözi a radiológusok egyéni preferenciáit. Míg egyesek részletes és terjedelmes leleteket írnak, mások a tömör, kérdésorientált leletekre koncentrálnak. Az olyan tulajdonságok, mint az egyértelműség, a teljesség, a szerkezet és a relevancia határozzák meg a magas színvonalú leleteket. A szabványosítás hiánya azonban hatással lehet azok konzisztenciájára és értelmezhetőségére [5,6].
A szabad szöveges leletekkel ellentétben a strukturált leletek alternatív megközelítést kínálnak. A leleteket előre meghatározott kérdésekkel és válaszlehetőségekkel rendelkező, előre definiált sablonok segítségével szisztematikusan állítják össze. A strukturált leletek kidolgozására irányuló erőfeszítéseket radiológiai társaságok kezdeményezték. Az Európai Radiológiai Társaság (ESR) és más szakmai szervezetek jelentős támogatásának ellenére ez a módszer Európában nem terjedt el széles körben, mivel hiányoznak a szabványosított leletsablonok és nem elégségesek a bevezetés ösztönzői [7,8].
A radiológiai leletek minősége attól függ, hogy mennyire felelnek meg a beutaló orvosok igényeinek. Azonban a beutaló orvosok és a radiológusok közötti közvetlen kommunikáció és visszajelzés hiánya gyakran hiányosságokat eredményez a leletek klinikai hasznosságának megértésében. A beutaló orvosok habozhatnak kifejezni zavarukat, ami oda vezet, hogy a radiológusok túlbecsülik leleteik minőségét. A radiológusok, különösen a radiológus rezidensek, gyakran passzívan fejlesztik leletkészítési készségeiket, mások leleteit olvasva és azok megközelítését utánozva, ami tovább erősíti a radiológiai leletek strukturális problémáit [9]. Az esetkonferenciák az interdiszciplináris kommunikáció kérdését kezelik azzal, hogy szakembereket hoznak össze komplex esetek megvitatására.
Ez a tanulmány elsősorban a beutaló orvosok radiológiai leletekkel kapcsolatos preferenciáit vizsgálta, azzal a céllal, hogy azonosítsa a klinikai hasznosságukat növelő kulcsfontosságú tényezőket.

2. Módszerek

Etikai jóváhagyásra nem volt szükség, mivel a felmérés csak orvosok véleményét gyűjtötte össze. A tanulmány betartotta az etikai irányelveket, és minden elemzést a helyi adatvédelmi előírásoknak megfelelően végeztek.

2.1 Beválasztási és kizárási kritériumok

A 2023. júniusától 2025. márciusáig végzett prospektív felmérésben olyan sebészek, belgyógyászok és háziorvosok vettek részt, akik rendszeresen igénybe veszik radiológiai szolgáltatásokat Németország vidéki és városi területein, kivéve a nem praktizáló orvosokat. A résztvevőket véletlenszerűen választották ki az összes hierarchikus szintről. A kizárási kritériumok a következők voltak: nyugdíjazás, radiológiai szolgáltatások igénybevételének hiánya, valamint a demográfiai adatok vagy legalább egy felmérési kérdés kitöltésének elmulasztása (1. ábra).

gr1_lrg.jpg

2.2 A felmérés kialakítása

A felmérési eszköz finomítására 10 orvos részvételével kísérleti tesztet végeztek és az orvosok visszajelzései alapján módosították a kérdéseket. A kísérleti fázis után véletlenszerűen kiválasztott orvosokat kerestek meg e-mailben. Négy hét elteltével emlékeztető üzenetet küldtek. A sorrend hatásának minimalizálása érdekében a kérdések sorrendjét véletlenszerűen állapították meg. Az anonimitás fenntartásával csökkentették a válaszok torzítását.
A felmérés kitöltési idejét a résztvevő felmérésének kezdete és befejezése közötti időtartamként mérték. Az interkvartilis tartományt (IQR) jelentősen meghaladó vagy alulmúló, illetve a tipikus tartományon kívül eső kitöltési időket kiugró értéknek tekintették, és kizárták az elemzésből.

2.3 Kérdésformátumok

Csúszkás skála kérdések
A csúszkás skála kérdés azt mérte, hogy a radiológiai leletek milyen gyakran adtak teljes választ a beutalási kérdésre, −100 (soha) és +100 (mindig) közötti elégedettségi pontszámmal, 10 pontos intervallumokra osztva. Egy másik csúszka (−50 és +50 között) a tömör (−50 és −20 között), közepes (−10 és +10 között) vagy részletes (+20 és +50 között) leletek preferenciáit értékelte. Egy harmadik csúszka (-100 és +100 között) értékelte a leletek stílusának preferenciáit, az értékek szabad szöveget (-100 és -50 között), vegyes leleteket (-50 és +50 között) vagy strukturált leleteket (+50 és +100 között) jelöltek (a vegyes jelentés a szabad szöveget strukturált jelentéssel kombinálja az egyértelműség érdekében).
Egyszeri választású kérdések
A válaszadók kiválasztották a fő okot, amiért a radiológusok nem tudnak teljes mértékben foglalkozni a klinikai kérdéssel. Meghatározták a radiológiai leletek olvashatóságát és használhatóságát javító módszereket, valamint a jelentésekben gyakran hiányzó információk típusát. Egy 7 pontos Likert-skála segítségével értékelték, hogy a beutaló orvosok milyen gyakran küzdenek a radiológiai leletekben szereplő releváns részletek megtalálásával (1 = soha, 7 = mindig). A beutaló orvosok egy 7 pontos Likert-skála segítségével értékelték a multidiszciplináris megbeszélések (pl. tumorboardok) hasznosságát a radiológiai leletek megértésében, ahol 1 = nem hasznos és 7 = nagyon hasznos.

2.4 Statisztikai elemzés

A minta összefoglalásához leíró statisztikákat, köztük átlagot, mediánt, modust és szórást alkalmaztunk. A statisztikai elemzések egyirányú ANOVA-t, kategóriás változókra vonatkozó chi-négyzet próbákat, egy mintára vonatkozó z-próbákat és egy mintára vonatkozó t-próbákat tartalmaztak, a szignifikancia küszöbértékét p < 0,05-re állítva.

3 Eredmények

3.1 A résztvevők jellemzői

A tanulmányban eredetileg figyelembe vett 300 orvos közül 42-t kizártak: 20 orvos nem vett igénybe radiológiai szolgáltatásokat, 12 csak a kérdőív demográfiai részét töltötte ki, a központi kérdésekre nem válaszolt, 10 pedig nyugdíjas volt. Végül 258 résztvevő került be a tanulmányba: 93 belgyógyász, 90 sebész és 75 háziorvos (1. ábra - fent).

Az összes 75 háziorvos magánpraxisban dolgozott, míg a belgyógyászok és sebészek kórházakban voltak alkalmazásban. A 180 kórházi orvos közül 110 beosztott orvos, 79 vezető orvos és egy főorvos volt.
A kérdőív kitöltésének átlagos ideje, a kiugró értékek kiszűrése után, 6:53 perc volt. A belgyógyászok átlagos tapasztalata 9 év (medián/módusz: 9 év), a sebészeké 10,5 év (medián: 11, módusz: 10 év), a háziorvosoké pedig 19,2 év (medián: 18,5, módusz: 10 év) volt (1. táblázat).

3.2 Elégedettség a radiológiai lelet teljességével

A beutaló orvosok elégedettségi pontszáma (38,4 ± 24,3) mérsékelt elégedettséget jelezte, és szignifikánsan meghaladta a semleges értéket (p < 0,0001). (2. ábra) Az általános orvosok mérsékelt elégedettséget fejeztek ki (átlag 47,7 ± 21,3). A belgyógyászok hasonló elégedettségi szintet jeleztek (belgyógyászok: átlag 42,8 ± 22,9). A sebészek jelentették a legmagasabb fokú elégedetlenséget (átlag 15,3 ± 26), p < 0,0001.

gr2_lrg.jpg

3.3 A radiológiai leletek hosszával kapcsolatos preferenciák

A beutaló orvosok 55 %-a a rövid, tömör leleteket részesítette előnyben (−50 és −20 közötti tartomány). Egy kisebb csoport (21,7 %) a közepes hosszúságú leleteket részesítette előnyben (−10 és +10 közötti tartomány). Ezzel szemben a beutaló orvosok csak 23,3 %-a preferálta a hosszú, részletes leleteket (+10 és +50 közötti tartomány). A beutaló orvosok szignifikánsan preferálták a tömör leleteket (p < 0,001). A sebészek szignifikánsan erőteljesebb preferenciát mutattak a tömör leleteket iránt (átlag: –23,9 ± 22,0) a belgyógyászokhoz (−12,37 ± 36,8, p < 0,01) és az általános orvosokhoz (−14,6 ± 36,1, p < 0,05) képest. (3. ábra).

gr3_lrg.jpg

3.4 A szabad szöveges és a strukturált leletek közötti preferenciák

A beutaló orvosok 25,7 %-a preferálta a szabad szöveges vagy strukturálatlan leleteket (−100 és −50 között), míg 74,3 %-uk a félig strukturált leleteket (−50 és +50 között) vagy a teljesen strukturált leleteket (+50 és +100 között) részesítette előnyben. (4. ábra) A beutaló orvosok szignifikánsan preferálták a strukturált leleteket (p < 0,001).
A belgyógyászok és a sebészek szignifikánsan erőteljesebb preferenciát mutattak a strukturált leletek iránt (belgyógyászok: átlag 34,4 ± 56,9, sebészek: átlag 41,8 ± 56,3) az általános orvosokhoz (átlag −25,2 ± 56,9).

gr4_lrg.jpg

3.5 A radiológiai leletek javításának kihívásai

A beutaló orvosok szerint a hiányos leletek fő okai a következők voltak: „a radiológusok nem értik a klinikai kontextust” (36,1%), „hiányoznak az előzetes vizsgálati képek” (16%), „nem megfelelő képalkotási technikák” (10,3%) és „nem egyértelmű vagy kétértelmű kérdés a beutaló formanyomtatványon” (12,6%). További tényezőként említették a „korlátozott képminőséget” (9,2%) és a „kommunikáció hiányát” (9,2%), valamint az „időnyomást” (6,2%). A „radiológusok klinikai kontextus iránti megértésének hiánya” jelentősen gyakrabban került kiválasztásra, mint az összes szakterületen a normális eloszlás alapján statisztikailag várható lett volna (p < 0,001). A sebészek szignifikánsan gyakrabban említették a „nem egyértelmű vagy kétértelmű kérdéseket a beutaló formanyomtatványon”, mint az általános orvosok és a belgyógyászok (p < 0,05). Ezzel szemben a belgyógyászok szignifikánsan gyakrabban jelentették a „korlátozott képminőséget”, mint a sebészek és az általános orvosok (p < 0,05). (5. ábra).

gr5_lrg.jpg

3.6 A radiológiai leletek olvashatósága

A beutaló orvosok kevés vagy közepes nehézséget jelentettek a radiológiai leletekben szereplő orvosi információk megtalálásában. A többség közepes nehézséget (63,2 %, 3–5 csillag) tapasztalt az orvosi információk megtalálásában, míg 32,5 % alacsony nehézséget (1–2 csillag) és 4,3 % magas nehézséget (6–7 csillag) tapasztalt. A közepes nehézséget (3–5 csillag) szignifikánsan gyakrabban választották, mint amit a normális eloszlás alapján statisztikailag várható lett volna az összes szakterületen (p < 0,01).

3.7 Az olvashatóság javítására irányuló megközelítések

A beutaló orvosok 43,8 %-a a jobb olvashatóság és használhatóság érdekében a „strukturált leletet” részesítette előnyben, míg 26,5 % a „tömör rész” mellett döntött. (2. táblázat)

A „tömör” szignifikánsan gyakrabban szerepelt az általános orvosok válaszai között, mint a belgyógyászoké és a sebészeké. Ezzel szemben a „strukturált lelet” szignifikánsan gyakrabban szerepelt a sebészek és a belgyógyászok válaszai között, mint az általános orvosoknál (p < 0,05). (6. ábra).

gr6_lrg.jpg

3.8 Hiányzó információk a radiológiai leletekben

A beutaló orvosok a „diagnózis megállapítása” opciót választották a leggyakrabban (39 %), ezt követte a „további diagnosztikai intézkedésekre vagy utánkövető vizsgálatokra vonatkozó ajánlások” (23 %). A „diagnózis megállapítása” opciót szignifikánsan gyakrabban jelölték meg, mint amit a normális eloszlás alapján statisztikailag várható lett volna az összes szakterületen (p < 0,001). (3. táblázat).

3.9 A multidiszciplináris megbeszélések fontossága

A beutaló orvosok 33,6 %-a értékelte a multidiszciplináris megbeszéléseket nagyon hasznosnak a radiológiai leletek megértése szempontjából (7 csillag), további 51,3 % pedig 5 vagy 6 csillaggal értékelte azokat pozitívan. Csak 1,4 %-uk találta azokat egyáltalán nem hasznosnak (1 csillag). Az átlagos értékelés 5,7 ± 1,4 csillag volt. Minden szakterület jelentősen a semleges felett (4 csillag) értékelte a multidiszciplináris megbeszélések jelentőségét a leletek megértése szempontjából (p < 0,001). A belgyógyászok a multidiszciplináris megbeszélések hasznosságát a radiológiai leletek megértése szempontjából jelentősen pozitívabban értékelték, mint a sebészek és az általános orvosok (p < 0,05). (7. ábra).

gr7_lrg.jpg

4 Megbeszélés

Elemzésünk több fő megállapítást is feltár, amelyek rávilágítanak a radiológiai leletek minőségének javítására irányuló lehetőségekre a beutaló orvosok szempontjából.

Először is, a sebészek és a belgyógyászok a tömör és strukturált leleteket részesítik előnyben, míg az általános orvosok a szabad szöveges jelentéseket preferálják.

Másodszor, a felmérésben részt vevő beutaló orvosok a „diagnózis megállapítását” és a „további diagnosztikai vagy utánkövető vizsgálatokra vonatkozó ajánlásokat” jelölték meg a radiológiai leletekben leggyakrabban hiányzó elemekként.

Harmadszor, a felmérésben részt vevő beutaló orvosok leggyakrabban a „radiológusok klinikai kontextus iránti megértésének hiányát” jelölték meg a hiányos radiológiai leletek fő okaként.

Végül, a beutaló orvosok határozottan támogatják a multidiszciplináris megbeszéléseket a radiológiai leletek megértésének javítása érdekében.

A szabad szöveges leletek és a strukturált leletek iránti preferenciák a tanulmányunkban eltérőek voltak. Ennek oka az lehet, hogy ezek az orvosi szakterületek eltérő módon viszonyulnak a radiológia leleteihez. Az általános orvosok előnyben részesíthetik a szabad szöveges leleteket, mert azok rugalmasan kezelik a legkülönbözőbb állapotokat. A belgyógyászok és a sebészek előnyben részesíthetik a strukturált leleteket, mert azok pontos, szabványosított válaszokat adnak konkrét klinikai kérdésekre. A strukturált elemeket opcionális szabad szöveges szakaszokkal kombináló hibrid formátumok mindkét szakma igényeit kielégíthetik.

A strukturált leletek iránti preferenciáról szóló eredményeink a sebészek és a belgyógyászok körében megegyeznek Stanzione és munkatársai (2021) eredményeivel, akik kimutatták, hogy a COVID-19-es betegek mellkas-CT-jének strukturált leletei javítják a beutaló orvosok elégedettségét. [10] Ezenkívül Stanzione áttekintése kimutatta, hogy ez javítja a hasi MRI konzisztenciáját [11]. Továbbá Hawkins és munkatársainak tanulmánya kimutatta, hogy a strukturált lelet sablonok bevezetése csökkentette a beszédfelismerő szoftverek által okozott hibákat, beleértve a zavaros kifejezéseket vagy a kifejezések félreértelmezését [12].

Az Amerikai Radiológiai Kollégium (ACR) úttörő szerepet játszott az olyan szabványosított leletezési rendszerek bevezetésében, mint a BI-RADS és a LI-RADS az Amerikai Egyesült Államokban, amelyeket azóta országszerte alkalmaznak. Ezek a rendszerek szabványosítják a mell- és máj képalkotás leleteit, javítva a kommunikációt és a leleteket [13–16].

Európában a strukturált leletek széles körű elterjedése lassabb volt. A dos Santos és munkatársai által azonosított, az európai országok közötti elterjedési arányok közötti különbségek kulturális és szervezeti tényezőknek, például a különböző egészségügyi rendszereknek, erőforrásoknak és szakmai gyakorlatoknak tulajdoníthatók [8]. Ezenkívül a strukturált leletek megkövetelik a radiológusoktól, hogy a képek és a leletek sablonja között váltsanak, ami megzavarja a munkafolyamatot [8,17]. A komplex esetek kezelése gyakran időigényesebbé válik a sablon alapú formátumok használatával. Az ilyen esetekben felmerülő véletlen leletek nem illeszkednek a strukturált lelet sablonokba, mivel ezeket a sablonokat általában konkrét klinikai kérdések és feltételezett diagnózisok kezelésére tervezték [18]. Tágabb összefüggésben a beutaló orvosok – akik a radiológiai leletek elsődleges célközönsége – eltérő preferenciái kihívást jelenthetnek a strukturált lelet rendszerek széles körű elterjedése szempontjából.

Bebizonyítottuk, hogy a legtöbb beutaló orvos a tömör leleteket részesíti előnyben. A kutatások azt mutatják, hogy a beutaló orvosok gyakran figyelmen kívül hagyják a leletek egy részét, hangsúlyozva a vélemény rész fontosságát [19]. Úgy véljük, hogy a tömör leletek számának növekedése csökkentheti annak valószínűségét, hogy a beutaló orvosok kihagyják a leletek leíró részét. A radiológusoknak egyensúlyt kell teremteniük a tömörség és a teljes dokumentáció szükségessége között, hogy minimalizálják az orvosi-jogi kockázatokat, például a releváns eltérések kihagyását [20,21].

Felmérésünkben a legtöbb beutaló orvos jelezte, hogy a radiológiai leletekben gyakran hiányoznak a további diagnosztikai intézkedésekre vagy utánkövető vizsgálatokra vonatkozó ajánlások, valamint a végleges diagnózisok. A rendellenes eredmények utánkövető képalkotási ajánlásai a radiológiai leletek 2–5 %-ában szerepelnek [22]. Például a jóindulatú elváltozásokat kifejezetten osztályozni kell, és egyértelműen jelezni kell, hogy azok nem igényelnek további diagnosztikai eljárásokat. A leletben szereplő „Ez a jóindulatú elváltozás nem indokol további vizsgálatot” megjegyzés segíthet minimalizálni a felesleges vizsgálatokat. Ha ez az értékelés vagy ajánlás hiányzik, a beutaló orvosnak vagy saját osztályozást kell készítenie, vagy kapcsolatba kell lépnie a radiológussal [23].

A kontroll képalkotó vizsgálat ajánlása klinikailag összetett kérdés. Egyes radiológusok haboznak ajánlásokat tenni, mivel nem rendelkeznek a teljes klinikai képpel. Például, ha a beteg antibiotikumos kezelés alatt már javul, akkor felesleges lehet követő CT-t ajánlani tüdőgyulladás esetén, mivel ez a képalkotáson nem látható. Ezenkívül a radiológiai leletekben szereplő végleges diagnózis megadása egyértelmű útmutatást és bizonyosságot nyújt a beutaló orvosoknak a klinikai döntéshozatalban. Ez kihívást jelent a radiológusok számára, mivel a képalkotási eredményeket gyakran nehéz véglegesen osztályozni. A klinikai gyakorlatban a végleges diagnózisok kivételesek, és a radiológusok általában olyan kifejezéseket használnak, mint „összhangban van” vagy „utal”, hogy jelezzék a diagnózis bizonyosságát. Az „összhangban van” kifejezés nagyobb bizalmat jelez a diagnózisban, míg az „utal” kifejezés a diagnózis alátámasztását jelenti, de nem elég konkrét.
Khorasani és munkatársai jelentős eltéréseket találtak a radiológusok és a nem radiológusok között a radiológiai leletekben gyakran használt kifejezések diagnosztikai bizonyosságának értelmezésében. Ez aláhúzza a diagnosztikai bizonyosság kifejezéseinek egységesítésének fontosságát a világos és következetes kommunikáció biztosítása érdekében [24]. A radiológusok számára célzott képzés ösztönözheti a pontosabb nyelvhasználatot, lehetővé téve számukra, hogy eredményeiket nagyobb bizonyossággal és egyértelműségével közöljék, miközben csökken a túlzott óvatosságra utaló megfogalmazások száma [25].
Ebben a tanulmányban minden szakterület a radiológusok klinikai kontextusának hiányos megértését jelölte meg a hiányos leletek fő okaként.

Elegendő háttérinformáció nélkül a radiológusok nehezen tudnak megfelelő kontextust biztosítani leleteikben. Korábbi tanulmányok kimutatták, hogy a radiológiai leletekbe klinikai információk felvétele javítja az értelmezés pontosságát [26,27].
Általánosabban elmondható, hogy a beutaló orvosok és a radiológusok közötti korlátozott konzultáció a képalkotás előtt, a radiológusok kizárása a képalkotás megfelelőségének értékeléséből a képalkotás megrendelésének időpontjában, valamint a képalkotásnak a képalkotási vizsgálat napján végleges tényként való felfogása mind hozzájárulnak a leletek hiányosságaihoz az összes résztvevő tekintetében [28–30].

Az interdiszciplináris együttműködés minden szempontból történő erősítése ezért elengedhetetlen a radiológiai leletek klinikai relevanciájának, pontosságának és hatásának javításához. Eredményeink megerősítik a multidiszciplináris megbeszélések értékét a beutaló orvosok számára a radiológiai leletek megértésében. Dendl és munkatársainak kutatása kimutatta, hogy az ilyen megbeszélések az esetek 37%-ában diagnosztikai vagy terápiás változásokhoz vezettek, ami kiemeli jelentőségüket a betegellátás javításában [31]. Ezek a megbeszélések javítják a radiológusok és a beutaló orvosok közötti kommunikációt, csökkentik az orvosi hibákat és a felesleges képalkotást, ami viszont csökkenti a kapcsolódó kezelési költségeket. Például kimutatták, hogy a radiológusok és az intenzív osztály orvosai közötti strukturált kétoldalú visszajelzés megakadályozza a képalkotással kapcsolatos orvosi hibákat azáltal, hogy újraértékeli a legutóbbi vizsgálatokat, lehetővé téve a korai felismerést és korrekciót. Ez a proaktív megközelítés növeli a betegbiztonságot és optimalizálja az erőforrások kihasználtságát [32]. Azonban ezeknek a megbeszéléseknek jelentős alternatív költségei vannak. A Midwest Academic Medical Center egyik tanulmánya megállapította, hogy a radiológusok évente 3,358 órát töltenek ezeken a találkozókon – ami két teljes munkaidős állásnak felel meg –, ami 1,2 millió dollár megtérítetlen költséget jelent [33]. Ezen pénzügyi szempontok ellenére a klinikai előnyök meghaladják a hátrányokat. A klinikai előnyök és a gazdasági fenntarthatóság közötti egyensúly megteremtése érdekében az intézményeknek célzott esettanulmányokat és strukturált találkozóformátumokat kell vizsgálniuk.

Számos korlátozást kell megvitatni.
Először is, ez a tanulmány önbevalláson alapuló adatokra támaszkodott, ami válasz torzítást okozhat, mivel a résztvevők társadalmilag kívánatos válaszokat vagy hiányos információkat adhatnak. Tanulmányunkban stratégiákat alkalmaztunk a válasz torzítás enyhítésére, például a válaszok anonimizálását és véletlenszerű mintavételt.
Másodszor, a felmérés formátuma előre meghatározott válaszlehetőségeket kínált, ami korlátozhatta a válaszokat.
Harmadszor, a tanulmányban nagy arányban vettek részt asszisztens orvosok, akiknek eltérő tapasztalataik vagy elvárásaik lehetnek a vezető orvosokhoz képest.
Negyedszer, a strukturált leletekkel kapcsolatos kérdések nem voltak kontextusalapúak, mivel nem vették figyelembe a konkrét klinikai helyzeteket vagy állapotokat. Ötödször, bár a tanulmány a radiológiai leletek különböző aspektusait vizsgálta, például a leletek hosszát, szerkezetét és teljességét, nem elemezte konkrétan, hogy ezek a tényezők hogyan befolyásolják a beutaló orvosok döntéseit vagy a klinikai eredményeket.
Végül, a tanulmány a belgyógyászokra, sebészekre és háziorvosokra összpontosított, és ezzel potenciálisan figyelmen kívül hagyta más szakterületek perspektíváit. A további tanulmányoknak alcsoport-elemzést is tartalmazniuk kell, hogy értékeljék a strukturált leletek hatását bizonyos típusú leletekre, például az onkológiai vagy mozgásszervi állapotokra vonatkozóakra, és értékeljék, hogy a strukturált formátumok egyértelmű előnyöket kínálnak-e ezekben a kontextusokban.

Összegzésként ez a tanulmány hangsúlyozza annak fontosságát, hogy a radiológusok a leleteiket a beutaló orvosok igényeihez igazítsák, és javítsák az interdiszciplináris kommunikációt a pontosabb és érthetőbb radiológiai leletek biztosítása érdekében.

 

Szólj hozzá!
2025. október 07. 22:41 - Bágyi Péter

ESR Essentials: diffúziós súlyozott MRI – gyakorlati ajánlások

PáciensInfó+

Az ESR (Európai Radiológus Társaság) Páciensekkel foglalkozó tanácsadó csoportja (PAG) rendszeresen ülésezik, hozzájárul az oktatási törekvésekhez, a betegek álláspontját képviseli a protokollokkal és a minőséggel kapcsolatos valamennyi ESR tevékenységben.
Az ESR valamennyi irányelve és közzétett tudományos cikkei, protokolljai (pl,: ESR Essentials) ma már tartalmaznak a betegek számára készült összefoglalókat (Patient summary), amelyek a laikus olvasók számára közérthető nyelven összefoglalják a dokumentumok fő üzeneteit. 
Ezekből szemlézve folyamatosan a legfontosabbak:

A DWI (diffúzió-súlyozott képalkotás) egy nem invazív MRI-technika, amely egyedülálló betekintést nyújt a különböző szervek szöveti szerkezetébe és tartalmába sejt szinten.

Széles körben használják az agyban és a testben, neurológiai rendellenességek (pl. stroke felismerése és értékelése) esetén, valamint rákdiagnosztikában és -monitorozásban.

Ez a cikk összefoglalja azokat az ajánlásokat és irányelveket, amelyek biztosítják a DWI eredményeinek konzisztenciáját és pontosságát a különböző kórházakban és gépeken.

Mivel a DWI eredményeinek értelmezéséhez szakértelemre van szükség, irányelveket adunk a variabilitás csökkentésére és a diagnosztikai biztonság javítására. Ezek az irányelvek hozzájárulnak a DWI megfelelő használatához is, maximalizálva annak előnyeit a betegek számára.

Cikk:
Palombo, M., Bodini, B., Grussu, F. et al. 
ESR Essentials: diffusion-weighted MRI—practice recommendations by the European Society for Magnetic Resonance in Medicine and Biology. 
Eur Radiol (2025).
https://doi.org/10.1007/s00330-025-12033-x

 

Szólj hozzá!
Minden ami képalkotás
süti beállítások módosítása