2025. 08. 13. - 08:20
Hang alapján azonosíthat gégerákot a mesterséges intelligencia

A mesterséges intelligencia a közeljövőben a hang alapján is képes lesz kimutatni a gégefalon kialakult rákot. Korai stádiumú, figyelmeztető jelekre mutat rá hangfelvételekből.
Kutatók fejlesztésének köszönhetően a mesterséges intelligencia hamarosan a hang alapján is kimutathatja a gégerákot.
A gégefalrák szerte a világon jelentős közegészségügyi terhet jelent. 2021-ben a becslések szerint világszerte 1,1 millió gégefalrákos eset fordult elő és nagyjából 100 ezer ember halt meg a betegségben.
A gégerák kockázati tényezők közé tartozik a dohányzás, az alkoholfogyasztás és a humán papillomavírus-fertőzés. A gégefalrák prognózisa 5 éven át tartó kezelés esetén 35- és 78 százalék között mozog, a daganat stádiumától és a gégefalon belüli elhelyezkedésétől függően.
A rák korai felismerése kulcsfontosságú a beteg kilátásai szempontjából. Jelenleg a gégefalrákot videó-nazális endoszkópiával és biopsziával diagnosztizálják – ezek a beavatkozások megterhelő, invazív eljárások. Ráadásul időbe telhet eljutni olyan szakemberhez, aki ezeket az eljárásokat elvégezheti - ami késleltetheti a diagnózis felállítását. Olvasd el: Gégerák és életminőség - Hangpatológiák szűrését oldja meg a mesterséges intelligencia

Hang alapján azonosíthat gégerákot a mesterséges intelligencia
Most azonban a kutatók rájöttek, hogy a hangszalagok rendellenességei kimutathatók a hang jellegzetességeiből. Az ilyen „hangszalag-elváltozások” lehetnek jóindulatúak, mint például a csomók vagy a polipok, azonban a gégerák korai stádiumát is jelenthetik.
Felfedezésükről a kutatók a Frontiers in Digital Health című folyóiratban írtak.
Gégerák korai felismerése mesterséges intelligenciával
A fenti eredmények megnyitják az utat a mesterséges intelligencia egy új alkalmazási módja előtt: a gégeszalag-rák korai figyelmeztető stádiumainak felismeréséhez, hangfelvételek alapján.
„Bemutatjuk, hogy ezen adathalmazzal, vokális biomarkerek segítségével megkülönböztethetjük a hangszalag-elváltozásokkal rendelkező betegek hangját azokétól, akiknél nincsenek ilyen elváltozások” – mondta dr. Phillip Jenkins, az Oregon Health & Science University klinikai informatikai posztdoktori munkatársa, a tanulmány egyik szerzője.
Jenkins és kollégái a Bridge2AI-Voice projekt tagjai az Egyesült Államok Nemzeti Egészségügyi Intézetének Híd a mesterséges intelligenciához (Bridge2AI) konzorciumán belül – ez egy országos törekvés a mesterséges intelligencia alkalmazására komplex biomedicinális kihívások esetén.
A szakemberek itt elemezték a hangszín, a hangmagasság, a hangerő és a tisztaság változásait a nyilvános Bridge2AI-Voice adatkészlet első verziójában, amely 306 résztvevő 12.523 hangfelvételét tartalmazta Észak-Amerikából.
A résztvevők kisebb részét ismert gégerákban szenvedők, jóindulatú hangszalag-elváltozással vagy a hangfej két egyéb állapotával küzdő páciensek alkották: ilyen a görcsös diszfónia és egyoldali hangszalagbénulás.
A kutatók a hang számos akusztikai jellemzőjének különbségeire összpontosítottak: ezek például az átlagos alapfrekvencia (hangmagasság); a jitter, a hangmagasság változása a beszéden belül; a csillogás, az amplitúdó változása, valamint a harmonikus-zaj arány, amely a beszéd harmonikus és zajkomponensei közötti kapcsolat mértéke.
A kutatók jelentős különbségeket találtak a harmonikus-zaj arány és az alapfrekvencia terén a hang-zavarral nem küzdő, a jóindulatú hangszalag-elváltozásokkal rendelkező és a gégerákban szenvedő férfiak között.
A nők körében nem találtak informatív akusztikai jellemzőket, de lehetséges, hogy egy nagyobb adatkészlet feltárná ezeket a különbségeket.
A szerzők arra a következtetésre jutottak, hogy különösen a harmonikus-zaj arány változása lehet hasznos a hangszalag-elváltozások klinikai alakulásának monitorozásában, valamint a gégerák korai stádiumában történő felismerésében - legalábbis férfiaknál.
„Eredményeink arra utalnak, hogy az etikus forrásból származó, nagyméretű, több intézményt felölelő adatkészletek, mint például a Bridge2AI-Voice, hamarosan segíthetnek abban, hogy hangunk a klinikai ellátásban a rákkockázat gyakorlati biomarkerévé váljon” – mondta Jenkins.
Építkezés a mesterséges intelligencia irányába
Az elvi bizonyítás után a következő lépés, hogy ezeket az algoritmusokat a kutatók több adaton alkalmazzák és klinikai környezetben teszteljék azokat a betegek hangján.
„Ahhoz, hogy a tanulmányból mesterséges intelligencia eszköz legyen, amely felismeri a hangszalag-elváltozásokat, a modelleket egy még nagyobb, szakemberek által címkézett hangfelvétel-adatkészlettel képeznénk ki. Ezután tesztelnünk kell a rendszert, megbizonyosodván arról, hogy egyformán jól működik nők és férfiak esetében” – mondta Jenkins.
Hozzátette: a hangalapú egészségügyi eszközöket már tesztelik. Eredményeikre építve úgy becsülik, nagyobb adathalmazokkal és klinikai validációval a hangszalag-elváltozások kimutatására szolgáló hasonló eszközök a következő néhány évben tesztelési fázisba kerülhetnek.
B.A.