Conoce a Meditron una suite de modelos de lenguaje médicos de código abierto basados en LLaMA-2 (Large Language Models para Medicina)

Descubre a Meditron una suite de modelos de lenguaje médicos de código abierto basados en LLaMA-2 (Large Language Models para Medicina)

Una de las aplicaciones más emocionantes de los Modelos de Lenguaje Amplio (LLMs, por sus siglas en inglés) es en medicina, con algunos de sus casos de uso incluyendo la investigación médica, planes de salud personalizados, diagnóstico clínico y muchos más. Sin embargo, dado lo crítico que es el campo de seguridad, es necesario probar estos modelos en varios casos de uso para garantizar que sean seguros de usar. Además, estos modelos deben ser públicos para permitir su escrutinio.

Un grupo de investigadores ha lanzado un conjunto de LLMs llamado MediTron que están adaptados al dominio y se basan en LLaMA-2. El modelo tiene dos variantes, una con 7 mil millones de parámetros y otra con 70 mil millones. MediTron es un modelo fundamental que se puede utilizar para tareas específicas posteriores mediante RLHF o ajuste de instrucciones, y algunos de sus casos de uso incluyen respuestas a preguntas de exámenes médicos, consultas generales de salud, consultas de información sobre enfermedades y apoyo a diagnósticos diferenciales.

El conjunto de datos de entrenamiento de MediTron es bastante completo y consta de pautas de práctica clínica, documentos médicos junto con sus resúmenes y datos de preentrenamiento en dominios generales. La biblioteca de entrenamiento distribuido Megatron-LLM se ha utilizado para optimizar la eficiencia del entrenamiento, y el esquema de paralelización utiliza la paralelismo de datos, de canalización y de tensores para acelerar el proceso.

Los investigadores realizaron una evaluación inicial de la veracidad de los modelos en comparación con los modelos de referencia. Para ello, utilizaron el conjunto de datos TruthfulQA como referencia y realizaron evaluaciones de solo una vez para el modelo de 7 mil millones y evaluaciones de cero veces para el modelo de 70 mil millones. Ambos modelos pudieron rendir mejor que los demás, con una puntuación promedio de 71,2 para MediTron-70B en comparación con 54,8 para LLaMA-2-70B, y 28,3 para MediTron-7B en comparación con 12,6 para LLaMA-2-7B.

Para la evaluación posterior, los investigadores utilizaron varias pruebas de referencia como MedQA, PubMedQA, etc., y calcularon la precisión de las tareas de preguntas y respuestas de opción múltiple. Para comparar los resultados, también se utilizaron diferentes LLMs, como LLaMA-7B, LLaMA-70B, Mistral-7B-instruct, etc. Los resultados muestran que tanto MediTron-7B como MediTron-70B superaron a sus competidores en casi todos los conjuntos de datos, demostrando sus capacidades superiores.

Aunque el modelo ha sido entrenado con una gran cantidad de datos médicos y tiene un buen rendimiento en múltiples pruebas de referencia, los usuarios deben ser conscientes de sus limitaciones y no deben implementarlo en aplicaciones médicas sin realizar pruebas adicionales. Los investigadores apenas han comenzado a comprender las capacidades y limitaciones del modelo y, por lo tanto, han advertido contra su uso en sistemas médicos en este momento.

En conclusión, MediTron es un conjunto de LLMs específicos del dominio que han sido entrenados en una amplia variedad de conjuntos de datos médicos. Tiene dos variantes, una con 7 mil millones de parámetros y otra con 70 mil millones, y ambos pudieron rendir mejor que los otros modelos considerados para la evaluación. Los investigadores también han mencionado que el modelo no debe implementarse sin entrenamiento adicional, dado lo crítico que es el campo. En general, el modelo es un avance emocionante en medicina y tiene el potencial de resolver una variedad de tareas médicas y ayudar a los profesionales médicos.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Inteligencia Artificial vs. Inteligencia Humana Top 7 Diferencias

Introducción La inteligencia artificial ha recorrido un largo camino desde el personaje ficticio de IA JARVIS hasta e...

Inteligencia Artificial

Stability AI lanza el primer modelo japonés de visión y lenguaje

La creación y formulación de un modelo único y completo capaz de manejar una variedad de tareas definidas por el usua...

Inteligencia Artificial

Rishi Sunak presenta la visión de nuevos organismos internacionales de seguridad de la IA

El Primer Ministro británico defendió la búsqueda de respaldo chino para una serie de nuevas iniciativas de gobernanz...

Inteligencia Artificial

Esta Investigación de IA presenta DreamCraft3D Un enfoque jerárquico para crear material en 3D que genera modelos en 3D cohesivos y de alta fidelidad.

La increíble popularidad de la modelización generativa 2D ha tenido un impacto significativo en cómo se produce mater...

Inteligencia Artificial

Robo-Dog establece el récord mundial de los 100 metros en la categoría sprint según el Guinness World Records

Guinness World records etiquetó a un robot parecido a un perro creado por un equipo del Instituto Avanzado de Ciencia...