Les darreres investigacions sobre intel·ligència artificial presenten xarxes neuronals adversàries generatives capaces de generar radiografies d’artrosi de genoll profunds amb diferents graus d’osteoartritis

Els avenços recents en l’aprenentatge profund han tocat el camp de la ciència mèdica. Tanmateix, les preocupacions recents sobre la privadesa i els marcs legislatius han dificultat l’intercanvi i l’adquisició de dades mèdiques. Aquestes restriccions legislatives restringeixen el potencial d’avenços futurs en l’aprenentatge profund, que és una tècnica i una associació especialment intensives en dades. Tanmateix, produir dades sintètiques que siguin precises per a finalitats mèdiques pot reduir els problemes de privadesa i millorar els canals d’aprenentatge profund. Aquest article presenta xarxes neuronals adversàries generatives que poden tenir imatges precises de raigs X de les articulacions del genoll amb diferents graus d’osteoartritis. Els investigadors proporcionen 5.556 fotos genuïnes juntament amb 320.000 imatges de raigs X artificials (DeepFake) per a l’entrenament.

Amb l’ajuda de 15 professionals mèdics, van avaluar els nostres models per a la precisió mèdica i van analitzar els efectes de l’augment en una tasca que classificava la gravetat de l’artrosi. Per als professionals mèdics, van crear una enquesta amb 30 fotos reals i 30 DeepFake. Com a resultat, sovint es prenen més DeepFakes que el contrari per a la realitat. El resultat va indicar que el realisme de DeepFake era suficient per enganyar els professionals mèdics. Finalment, utilitzant dades reals limitades i transferència d’aprenentatge, el nostre DeepFakes va augmentar la precisió de la classificació en un repte per classificar la gravetat de l’artrosi. A més, van substituir totes les dades d’entrenament genuïnes en el mateix treball de classificació amb DeepFakes, i la precisió de categoritzar els raigs X de l’artrosi real només va patir una pèrdua del 3,79% respecte a la línia de base.

La detecció precoç pot retardar el curs clínic i millorar potencialment la mobilitat i la qualitat de vida del pacient. Els professionals mèdics, així com les xarxes neuronals artificials, tenen dificultats substancials en el diagnòstic precoç. Amb l’ajuda de dues xarxes neuronals adversàries generatives, van poder crear un nombre infinit de raigs X d’artrosi de genoll en diferents estadis de Kellgren i Lawrence per a aquesta investigació. Els investigadors van demostrar primer l’anonimat i els efectes d’augment en l’aprenentatge profund, i després els investigadors van validar el seu sistema amb 15 professionals mèdics. Les imatges de raigs X de DeepFake generades es poden compartir lliurement entre investigadors i membres del públic.

Les fotos de KL01 WGAN i KL234 WGAN van des de l’entrenament primerenc fins als models millor seleccionats.

En imatges de raigs X de l’anatomia humana, es van entrenar xarxes neuronals per a KL01 WGAN i KL234 WGAN. A mesura que avançava la formació, es van adonar que els canvis estructurals significatius van començar a disminuir mentre milloraven les modificacions de la textura. Els mòduls de sobremostreig i convolució 2D amb activacions d’unitats exponencials i normalització per lots van ser els principals blocs de construcció utilitzats per construir el bloc generador. Les capes d’abandonament per evitar l’ajustament excessiu van fer que el bloqueig discriminador fos una anàlisi única de 30 fotos DeepFake autèntiques i 30 falses de les classes KL01 i KL234. Els experts van valorar el grau d’OA tant per a imatges genuïnes com artificials. Els resultats van mostrar que es van confondre més fotos falses que les reals. Es van predir les severitats d’OA entre KL01 i KL234 mitjançant la tasca de classificació binària.

Font: https://www.nature.com/articles/s41598-022-23081-4

Per al conjunt d’augment de DeepFake, els investigadors van veure que es reduïen les pèrdues i, com a resultat, augmentava la precisió de la validació. L’efecte d’augment amb la puntuació de prova més alta, +200% de falsificacions, va ser el més efectiu. En general, tant els efectes d’amplificació com d’anonimització suggereixen la possibilitat de conseqüències aigües avall beneficioses en la classificació de l’artrosi de genoll. Les xarxes neuronals profundes poden produir raigs X de l’artrosi del genoll que siguin mèdicament precisos. Els efectes d’amplificació vinculats i l’anonimat per substitució es van obtenir per primera vegada en aquest estudi.

Per tal d’augmentar la precisió de la classificació en l’aprenentatge de transferència amb dades limitades, es van afegir imatges DeepFake a les dades d’entrenament reals. Aquestes estratègies d’aprenentatge de transferència s’utilitzen àmpliament en l’àmbit mèdic, on sovint les dades escassegen i són difícils de recopilar. Per evitar el desbordament de la memòria de la GPU, es va utilitzar una mida d’imatge de 210 x 210. Per augmentar el nombre de fotos disponibles per a dos models de gravetat de l’artrosi, van combinar les classes KL (KL01 i KL234). Els primers graus KL van experimentar menys soroll de l’etiqueta com a resultat de la combinació de graus KL.

El filtratge d’enfocament es va utilitzar per evitar que les textures enfocades i no enfocades es combinessin en una imatge, ja que grans buits en l’enfocament de raigs X i la claredat de la textura confondrien el generador. Per distingir les imatges DeepFake de les fotos reals, els experts necessitaven ajuda. Les desviacions estàndard substancials observades a la tasca de l’acord de qualificació de KL també reflecteixen la presència d’aquest efecte. Les valoracions dels professionals mèdics van ser esbiaixades, ja que algunes fotos mostraven atributs clínics superiors que altres. La producció i la detecció de punts de referència poden beneficiar-se d’una major integració de les etiquetes de referència.

Els 4130 raigs X que incloïen les dues articulacions del genoll es van utilitzar per crear les imatges, que després es van classificar mitjançant el sistema Kellgren i Lawrence. Hi havia 3253 fotos per al grau zero, 1495 per al primer grau, 2175 per al segon grau, 1086 per al tercer grau i 251 per al quart grau al KL. L’objectiu de l’estudi era comprovar com de realistes són les fotos DeepFake. Van generar 15 fotos KL01 i 15 KL234 a l’atzar i després van demanar als professionals mèdics que les jutgessin en funció de les seves puntuacions de KL.

Les imatges es van redimensionar a 315 315 píxels i es van incloure a l’enquesta en una seqüència aleatòria. Van utilitzar la mètrica de precisió equilibrada79 per tractar respostes desequilibrades. L’equip d’estudi va emprar una variació senzilla de l’arquitectura VGG1664 prèviament entrenada amb ImageNet que es va entrenar durant 22 èpoques, amb només els tres blocs finals del disseny que es poden entrenar i la resta es va congelar. Per generar cada conjunt de dades, van començar amb dades reals i van afegir gradualment més dades de DeepFake. Utilitzant el paquet “atzar” del llenguatge Python, es van triar fotos reals a l’atzar.


Fes una ullada al paper i Conjunt de dades. Tot el crèdit d’aquesta investigació es destina als investigadors d’aquest projecte. A més, no oblidis unir-te la nostra pàgina de Reddit i canal de discòrdiaon compartim les últimes notícies de recerca d’IA, projectes interessants d’IA i molt més.

Prezja, F., Palonova, J., Pölönen, I. et al. Les radiografies d’artrosi de genoll de DeepFake de xarxes neuronals adversàries generatives enganyen els experts mèdics i ofereixen un potencial d’augment per a la classificació automàtica. Ciència-Rep 12, 18573 (2022). https://doi.org/10.1038/s41598-022-23081-4


Ashish Kumar és consultor en pràctiques a MarktechPost. Actualment està cursant el seu Btech a l’Institut Indi de Tecnologia (IIT), Kanpur. Li apassiona explorar els nous avenços en tecnologies i la seva aplicació a la vida real.


Leave a Comment

Your email address will not be published. Required fields are marked *