Investigadores de IA en Mayo Clinic presentan un método basado en aprendizaje automático para aprovechar los modelos de difusión y construir un algoritmo de relleno de tumores cerebrales multitarea.

Investigadores de IA de Mayo Clinic desarrollan un algoritmo de relleno de tumores cerebrales basado en aprendizaje automático.

El número de publicaciones sobre inteligencia artificial (IA) y, en particular, aprendizaje automático (ML) relacionadas con imágenes médicas ha aumentado drásticamente en los últimos años. Una búsqueda actual en PubMed utilizando las palabras clave “inteligencia artificial” y “radiología” arrojó 5.369 artículos en 2021, más de cinco veces los resultados encontrados en 2011. Los modelos de ML se están desarrollando constantemente para mejorar la eficiencia y los resultados de la atención médica, desde la clasificación hasta la segmentación semántica, detección de objetos y generación de imágenes. Numerosos informes publicados en radiología diagnóstica, por ejemplo, indican que los modelos de ML tienen la capacidad de desempeñarse tan bien o incluso mejor que los expertos médicos en tareas específicas, como la detección de anomalías y el cribado de patologías.

Por lo tanto, es innegable que, cuando se utiliza correctamente, la IA puede ayudar a los radiólogos y reducir drásticamente su carga de trabajo. A pesar del creciente interés en desarrollar modelos de ML para imágenes médicas, existen desafíos significativos que pueden limitar las aplicaciones prácticas de dichos modelos o incluso predisponerlos a un sesgo sustancial. La escasez de datos y el desequilibrio de datos son dos de estos desafíos. Por un lado, los conjuntos de datos de imágenes médicas suelen ser mucho más pequeños que los conjuntos de datos de fotografías naturales, como ImageNet, y combinar conjuntos de datos institucionales o hacerlos públicos puede ser imposible debido a problemas de privacidad del paciente. Por otro lado, incluso los conjuntos de datos de imágenes médicas a los que los científicos de datos tienen acceso podrían estar más desequilibrados.

En otras palabras, el volumen de datos de imágenes médicas para pacientes con patologías específicas es significativamente menor que para pacientes con patologías comunes o personas sanas. Utilizar conjuntos de datos insuficientemente grandes o desequilibrados para entrenar o evaluar un modelo de aprendizaje automático puede resultar en sesgos sistémicos en el rendimiento del modelo. La generación de imágenes sintéticas es una de las estrategias principales para combatir la escasez de datos y el desequilibrio de datos, además de la liberación pública de conjuntos de datos de imágenes médicas desidentificados y la promoción de estrategias como el aprendizaje federado, que permite el desarrollo de modelos de aprendizaje automático (ML) en conjuntos de datos multiinstitucionales sin compartir datos.

Los modelos generativos de ML pueden aprender a generar datos de imágenes médicas realistas que no pertenecen a un paciente real y, por lo tanto, pueden compartirse públicamente sin comprometer la privacidad del paciente. Se han introducido varios modelos generadores capaces de sintetizar datos sintéticos de alta calidad desde que surgieron las redes generativas adversarias (GAN). La mayoría de estos modelos producen datos de imágenes no etiquetadas, que pueden ser útiles en aplicaciones específicas, como modelos de autoaprendizaje o semisupervisados. Además, algunos otros modelos son capaces de generación condicional, lo que permite generar una imagen en función de variables clínicas, textuales o de imágenes predeterminadas.

Los modelos de difusión de modelos probabilísticos de denoising (DDPM), también conocidos como modelos de difusión, son una nueva clase de modelos de generación de imágenes que superan a las GAN en cuanto a la calidad y diversidad de las imágenes sintéticas. Esta última clase de modelos generativos permite la generación de datos sintéticos etiquetados, lo que impulsa la investigación de aprendizaje automático, la calidad de las imágenes médicas y la atención al paciente. A pesar de su enorme éxito en la generación de datos médicos de imágenes sintéticas, las GAN son frecuentemente criticadas por su falta de diversidad en las salidas y su entrenamiento inestable. Los modelos de aprendizaje profundo de autoencoder son una alternativa más tradicional a las GAN porque son más fáciles de entrenar y producen resultados más diversos. Sin embargo, sus resultados sintéticos carecen de la calidad de imagen de las GAN.

Los modelos de difusión basados en la teoría de la cadena de Markov aprenden a generar sus salidas sintéticas mediante un proceso de denoising gradual de una imagen inicial llena de ruido gaussiano aleatorio. Este proceso de denoising iterativo hace que las ejecuciones de inferencia de los modelos de difusión sean significativamente más lentas que las de otros modelos generativos. Sin embargo, les permite extraer características más representativas de sus datos de entrada, lo que les permite superar a otros modelos. En este artículo metodológico se presenta un modelo de difusión de prueba de concepto que se puede utilizar para la reconstrucción de tumores cerebrales multitarea en estudios de resonancia magnética (MRI) cerebrales multisecuenciales.

Crearon un modelo de difusión que puede recibir una sección axial bidimensional (2D) de una secuencia ponderada en T1 (T1), con realce de contraste ponderada en T1 (T1CE), ponderada en T2 (T2) o FLAIR de una resonancia magnética cerebral e inpaint un área recortada definida por el usuario de esa sección con una imagen realista y controlable de un glioma de alto grado y sus componentes correspondientes (por ejemplo, el edema circundante) o tejidos cerebrales sin tumor (aparentemente normales).

En los Estados Unidos, la incidencia de glioma de alto grado es de 3,56 por cada 100.000 personas, y solo hay algunos conjuntos de datos de resonancia magnética disponibles públicamente para tumores cerebrales. Su modelo permitirá a los investigadores de ML editar (inducir o eliminar) tejidos tumorales o sin tumor sintéticos con características configurables en secciones de resonancia magnética cerebral en estos datos limitados. La herramienta se ha implementado en línea para que las personas la utilicen. El modelo se ha publicado como software de código abierto junto con su documentación en GitHub.

Este artículo está escrito como un resumen de investigación por el personal de Marktechpost basado en el artículo de investigación 'MULTITASK BRAIN TUMOR INPAINTING WITH DIFFUSION MODELS: A METHODOLOGICAL REPORT'. Todo el crédito de esta investigación va para los investigadores de este proyecto. Echa un vistazo al artículo, código y herramienta.
Por favor, no olvides unirte a nuestro subreddit de ML

La publicación Los investigadores de IA en Mayo Clinic presentan un método basado en el aprendizaje automático para aprovechar los modelos de difusión para construir un algoritmo de relleno multitarea de tumores cerebrales apareció primero en MarkTechPost.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Más allá de los límites humanos El surgimiento de la SuperInteligencia

De ANI a AGI y más allá Descifrando el camino evolutivo de la IA.

Investigación

Investigadores de Princeton presentan Infinigen un generador procedural de escenas tridimensionales fotorrealistas del mundo natural.

El equipo de investigación de la Universidad de Princeton ha presentado Infinigen, un innovador generador procedural ...

Inteligencia Artificial

Utilizando Psicología para Fortalecer la Ciberseguridad

Entrando en la mente de los atacantes para proteger la empresa.

Inteligencia Artificial

La IA y los implantes cerebrales restauran el movimiento y la sensación para un hombre paralizado

En un logro médico innovador, médicos en Estados Unidos han aprovechado el poder de la Inteligencia Artificial (IA) y...

Investigación

Una forma más efectiva de entrenar máquinas para situaciones inciertas del mundo real.

Los investigadores desarrollaron un algoritmo que decide cuándo una máquina estudiante debe seguir a su profesor y cu...