Conoce a TxGNN un nuevo modelo que utiliza el aprendizaje profundo geométrico y la inteligencia artificial centrada en el ser humano para hacer predicciones sin entrenamiento sobre el uso terapéutico en una amplia gama de 17,080 enfermedades.

Conoce a TxGNN, un modelo nuevo que utiliza el aprendizaje profundo geométrico y la IA centrada en el ser humano para hacer predicciones sin entrenamiento sobre el uso terapéutico en 17,080 enfermedades diferentes.

Existe una necesidad urgente de crear terapéuticos para satisfacer las necesidades de atención médica de miles de millones de personas en todo el mundo. Sin embargo, solo una pequeña fracción de las enfermedades clínicamente reconocidas actualmente tienen tratamientos autorizados. Las alteraciones en la función génica y las moléculas que producen son causas comunes de enfermedades. Los medicamentos que pueden restaurar las actividades moleculares normales son una defensa potencial contra estas enfermedades. Desafortunadamente, los enfoques terapéuticos para restaurar las actividades biológicas de los genes dañados aún son difíciles de lograr para muchos trastornos. Además, la mayoría de las enfermedades son causadas por cambios en muchos genes, y las personas pueden tener patrones de mutación muy variables incluso dentro de un solo gen. Los interactomas, o redes de genes que participan en procesos y actividades asociados a enfermedades, son una excelente herramienta para explicar estos eventos genéticos. Para descifrar la arquitectura genética interrumpida en enfermedades y ayudar en la creación de medicamentos para objetivos específicos, se ha utilizado el aprendizaje automático para analizar interactomas moleculares de alto rendimiento y datos de historias clínicas electrónicas.

El desarrollo de nuevos medicamentos es un desafío, especialmente para enfermedades con pocas opciones de tratamiento, pero puede reemplazar medicamentos ineficientes por otros más seguros y efectivos. La FDA autoriza tratamientos para solo 500 de las cientos de enfermedades humanas. Solo 1,363 de los 17,080 trastornos clínicamente reconocidos incluidos en el análisis tenían medicamentos recetados específicamente para ellos; de estos, 435 tenían solo una prescripción, 182 tenían dos y 128 tenían tres. Encontrar medicamentos nuevos es terapéuticamente significativo, incluso para enfermedades con terapias. Proporciona más opciones de tratamiento con menos efectos adversos y reemplaza medicamentos no exitosos en ciertas poblaciones de pacientes.

TXGNN, una técnica de aprendizaje profundo geométrico para la predicción del uso terapéutico, es presentada por investigadores interesados en enfermedades para las cuales se necesita más conocimiento sobre sus causas moleculares y tratamientos potenciales. TXGNN se enseña utilizando un grafo centrado en terapéuticos que se superpone con redes perturbadas por enfermedades que actualmente están siendo tratadas. Este grafo de conocimiento integra y compila décadas de estudios biológicos sobre 17,080 enfermedades comunes y poco comunes. Está optimizado para reflejar la geometría del grafo centrado en terapéuticos de TXGNN. Un modelo de red neuronal gráfica integra candidatos terapéuticos y enfermedades en un espacio de representación latente. TXGNN utiliza un módulo de aprendizaje métrico que funciona en el espacio de representación latente y puede transferir el modelo de TXGNN de enfermedades vistas durante el entrenamiento a enfermedades descuidadas para evitar la limitación del aprendizaje profundo supervisado en la predicción del uso terapéutico para enfermedades descuidadas.

TxGNN es una red neuronal gráfica preentrenada en un grafo de conocimiento que incluye 17,080 trastornos clínicamente reconocidos y 7,957 candidatos a tratamiento. Puede realizar diferentes tareas terapéuticas en una formulación unificada. La inferencia de cero disparo en enfermedades no entrenadas es posible con TxGNN, ya que no necesita ajustar las etiquetas de la verdad del terreno ni parámetros adicionales después del entrenamiento. En comparación con los enfoques de vanguardia, TxGNN supera significativamente a la competencia, con un aumento en la precisión de hasta un 49.2 por ciento para tareas de indicación y un 35.1 por ciento para tareas de contraindicación.

Diseño experimental y metodología – División de conjuntos de datos para una evaluación de rendimiento integral

  • Divisiones de áreas de enfermedades:

Muchas enfermedades tienen potencial terapéutico pero no tienen tratamientos efectivos y poco o ningún conocimiento biológico. El potencial de TXGNN para predecir conexiones medicamento-enfermedad en estos casos se prueba simulando enfermedades bien estudiadas como si no estuvieran caracterizadas molecularmente utilizando divisiones de datos desarrolladas por el equipo de estudio.

Primero, las enfermedades del grupo y los bordes de medicamento-enfermedad asociados se copian al conjunto de pruebas. Esto significa que durante el entrenamiento, TXGNN desconoce la existencia de bordes que representan indicaciones y contraindicaciones actuales para la categoría de enfermedad seleccionada. Esto imita la dificultad de tratar trastornos con mecanismos biológicos subyacentes desconocidos.

  • Divisiones sistemáticas de conjuntos de datos:

Predecir enfermedades no tratables debería adaptarse perfectamente al modelo de aprendizaje automático que se está implementando. Es mucho más fácil prever terapias potenciales para enfermedades que ya tienen tratamientos en comparación con aquellas que no los tienen. Los investigadores desarrollaron esta división para investigar rigurosamente la capacidad del modelo para predecir enfermedades previamente no descubiertas. Los investigadores comenzaron dividiendo todas las enfermedades al azar. Cuando no se reconocen terapias durante el entrenamiento y el conjunto de pruebas comprende enfermedades únicas, los investigadores transfieren todas las relaciones medicamento-enfermedad asociadas con el conjunto de pruebas al conjunto de pruebas. En cada iteración del conjunto de pruebas se incluyen más de cien enfermedades únicas.

  • Divisiones centradas en enfermedades de conjuntos de datos:

Los investigadores utilizan una evaluación centrada en enfermedades para modelar cómo se podrían usar los candidatos a medicamentos en la clínica. Primero, los investigadores vinculan todos los medicamentos en el KG con todas las enfermedades en el conjunto de pruebas, excluyendo las asociaciones medicamento-enfermedad en el conjunto de entrenamiento. Luego, los investigadores califican todas las posibles combinaciones según la probabilidad de que interactúen entre sí. Los investigadores luego calculan la recuperación al recuperar los primeros K medicamentos (es decir, cuántos medicamentos y enfermedades del conjunto de pruebas se encuentran en el conjunto completo K). El último paso es establecer un punto de partida de cribado aleatorio, en el que se muestrean aleatoriamente los primeros K medicamentos en el conjunto de medicamentos y se calcula la recuperación.

Resultados

  • Predicción de aplicaciones terapéuticas utilizando prioridades biológicas geométricas en TXGNN. TXGNN se basa en la hipótesis de que los medicamentos que se dirigen a redes alteradas por enfermedades en el interactoma de proteínas tendrán la mayor probabilidad de éxito. Optimizado para capturar la geometría del grafo de conocimiento de TXGNN, TXGNN es un GNN fundamentado en el conocimiento que mapea candidatos de tratamiento y trastornos (conceptos de enfermedades) en el espacio de representación latente.
  • Uso de un TXGNN de referencia para la predicción de aplicaciones terapéuticas sin necesidad de entrenamiento previo. Los investigadores prueban la capacidad de TXGNN para predecir indicaciones y contraindicaciones. Dado que TXGNN está destinado a tratar enfermedades como la enfermedad de Stargardt16 y la hiperoxaluria, para las cuales actualmente no hay tratamientos disponibles, su rendimiento se mide utilizando una métrica llamada rendimiento sin entrenamiento, en la cual se le pide al modelo que prediga el uso terapéutico para enfermedades en un conjunto de datos separado conocido como el conjunto de pruebas (hold-out) que no se observó durante el entrenamiento del modelo.
  • Exactitud del 100% en la predicción del uso terapéutico para cinco tipos de enfermedades. Terapias similares podrían ser utilizadas para trastornos que tienen bases biológicas similares.
  • Falla en predecir el uso terapéutico en pacientes que rutinariamente rechazan el tratamiento.
  • Precisión del 100% con respecto a 1,363 trastornos para los cuales hay indicaciones y 1,195 condiciones para las cuales hay contraindicaciones.
  • Dar una cuidadosa consideración a qué tratamientos se recomiendan y cuáles están contraindicados.
  • Comparar las predicciones de TXGNN con las opciones de tratamiento actuales. Los investigadores consideraron 10 medicamentos recién lanzados autorizados después de que se completara el conjunto de datos y el desarrollo del modelo de TXGNN para demostrar que TXGNN no está impulsado por sesgos de confirmación. En el conjunto de datos de TXGNN, no hay nodos de medicamento-enfermedad conectados directamente. Luego se le pidió a TXGNN que proporcionara predicciones a los investigadores.

Características

  • En relación a trastornos para los cuales no existen medicamentos y nuestro conocimiento molecular es limitado, TXGNN tiene una capacidad predictiva “sin entrenamiento” para el uso terapéutico.
  • A pesar de la limitación práctica de no conocer medicamentos para una condición específica y tener que extrapolar a un área de enfermedad nueva no observada durante el entrenamiento, TXGNN puede mejorar en gran medida la predicción del uso terapéutico en diversos trastornos.
  • Además, las terapias predichas por TXGNN muestran un alto grado de correlación con datos de registros electrónicos de salud reales, y se puede utilizar para probar simultáneamente un gran número de hipótesis terapéuticas mediante la búsqueda de cohortes de enfermedades a las que se les ha recetado o no se les ha recetado un medicamento en particular utilizando poblaciones de pacientes seguidos durante varios años.
  • Las predicciones de TXGNN se presentaron a un grupo de médicos y la audiencia pudo aprender más sobre el modelo autoexplicativo utilizado por TXGNN para tratar enfermedades. La importancia del diseño centrado en el clínico para pasar de la fase de desarrollo al uso biomédico del aprendizaje automático se destaca por los resultados de un estudio de usabilidad que muestra que los investigadores que utilizan el explorador interactivo de TXGNN pueden reproducir modelos de aprendizaje automático y identificar y depurar puntos de fallo de manera más fácil.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Investigadores de Microsoft presentan Hydra-RLHF Una solución eficiente en memoria para el aprendizaje por refuerzo con retroalimentación humana

Desde que se hicieron conocidos, los modelos familiares ChatGPT, GPT-4 y Llama-2 han conquistado a los usuarios con s...

Inteligencia Artificial

10 millones se registran en la aplicación rival de Twitter de Meta, Threads.

La experiencia de microblogging similar a Twitter sugiere que Meta Platforms se ha estado preparando para desafiar di...

Inteligencia Artificial

¿Qué tan fácil es engañar a las herramientas de detección de inteligencia artificial?

Los detectores ignoran todas las pistas de contexto, por lo que no procesan la existencia de un autómata realista en ...