Google AI presenta SimPer un marco contrastivo auto-supervisado para aprender información periódica en los datos

Google AI presenta SimPer, un marco auto-supervisado para aprender información periódica en los datos.

En los últimos años, el reconocimiento y la comprensión de los datos periódicos se han vuelto vitales para una amplia gama de aplicaciones del mundo real, desde el monitoreo de patrones climáticos hasta la detección de signos vitales críticos en entornos de atención médica. El aprendizaje periódico se ha vuelto indispensable en campos como la teledetección ambiental, permitiendo una predicción precisa de los cambios climáticos y las fluctuaciones de la temperatura de la superficie terrestre. De manera similar, en el campo de la salud, el aprendizaje periódico a partir de mediciones de video ha mostrado resultados prometedores en la identificación de condiciones médicas cruciales como la fibrilación auricular y los episodios de apnea del sueño.

Los esfuerzos para aprovechar el poder del aprendizaje periódico han llevado al desarrollo de enfoques supervisados como RepNet, que pueden identificar actividades repetitivas dentro de un solo video. Sin embargo, estos métodos requieren una cantidad significativa de datos etiquetados, lo cual suele ser intensivo en recursos y desafiante. Esta limitación ha llevado a los investigadores a explorar métodos de aprendizaje auto-supervisados (SSL, por sus siglas en inglés), como SimCLR y MoCo v2, que aprovechan grandes cantidades de datos no etiquetados para capturar dinámicas temporales periódicas o cuasi-periódicas. A pesar de su éxito en la resolución de tareas de clasificación, los métodos SSL tienen dificultades para comprender completamente la periodicidad intrínseca presente en los datos y crear representaciones robustas para atributos periódicos o de frecuencia.

Para abordar estos desafíos, los investigadores de Google presentan SimPer, que presenta un novedoso marco de aprendizaje contrastivo auto-supervisado diseñado específicamente para aprender información periódica en los datos. El marco aprovecha las propiedades temporales de los objetivos periódicos a través del aprendizaje contrastivo temporal auto-supervisado, donde se derivan muestras positivas y negativas de las mismas instancias de entrada mediante aumentaciones invariantes y variantes de la periodicidad.

Para definir explícitamente la medida de similitud en el contexto del aprendizaje periódico, SimPer propone una construcción única de similitud de características periódicas. Esta formulación permite el entrenamiento de un modelo sin ningún dato etiquetado y permite el ajuste fino para asignar características aprendidas a valores de frecuencia específicos. Los investigadores diseñaron etiquetas de velocidad pseudo- o frecuencia para la entrada no etiquetada, incluso cuando la frecuencia original es desconocida, lo que hace que SimPer sea altamente versátil en aplicaciones del mundo real.

Las medidas de similitud convencionales, como la similitud del coseno, enfatizan la proximidad estricta entre vectores de características, lo que lleva a una sensibilidad a características desplazadas en el índice, características invertidas y características con frecuencias cambiadas. Sin embargo, la similitud de características periódicas se centra en mantener una alta similitud para muestras con cambios temporales menores o índices invertidos, al tiempo que captura cambios continuos de similitud cuando la frecuencia de la característica varía. Esto se logra mediante una métrica de similitud en el dominio de la frecuencia, como la distancia entre dos transformadas de Fourier.

Para mejorar aún más el rendimiento del marco, los investigadores diseñaron una pérdida contrastiva generalizada que extiende la pérdida clásica de InfoNCE a una variante de regresión suave. Esto permite el contraste sobre etiquetas continuas (frecuencia) y hace que SimPer sea adecuado para tareas de regresión, donde el objetivo es recuperar una señal continua, como los latidos del corazón.

La evaluación de SimPer demostró su rendimiento superior en comparación con los esquemas SSL de vanguardia, incluidos SimCLR, MoCo v2, BYOL y CVRL, en seis conjuntos de datos diversos de aprendizaje periódico. Los conjuntos de datos abarcaban diversas tareas del mundo real en el análisis del comportamiento humano, la teledetección ambiental y la atención médica. SimPer superó a los métodos existentes y demostró una notable eficiencia de datos, robustez a correlaciones espurias y capacidad para generalizar a objetivos no vistos.

Con su enfoque intuitivo y flexible para aprender representaciones de características sólidas para señales periódicas, SimPer presenta aplicaciones prometedoras en numerosos campos, que van desde la teledetección ambiental hasta la atención médica. La capacidad del marco para capturar con precisión patrones periódicos sin una gran cantidad de datos etiquetados lo convierte en una solución atractiva para abordar desafíos complejos en diversos dominios.

En conclusión, el marco de aprendizaje contrastivo auto-supervisado de SimPer presenta una solución innovadora para la tarea crítica del aprendizaje periódico. SimPer allana el camino para aplicaciones de aprendizaje periódico más eficientes, precisas y robustas en el mundo real al aprovechar el aprendizaje contrastivo temporal auto-supervisado e introducir una nueva similitud de características periódicas y una pérdida contrastiva generalizada. A medida que el repositorio de código de SimPer esté disponible para la comunidad de investigadores, esperamos nuevos avances y una gama más amplia de aplicaciones en diversos dominios.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Utilizando el lenguaje para dar a los robots una mejor comprensión del mundo abierto

El método de Campos de Características para la Manipulación Robótica ayuda a los robots a identificar objetos cercano...

Inteligencia Artificial

Este artículo sobre IA revela Cómo los modelos de lenguaje grandes se comparan con los motores de búsqueda en eficiencia de verificación de hechos

Investigadores de diferentes universidades comparan la eficacia de los modelos de lenguaje (LLMs) y los motores de bú...

Aprendizaje Automático

SiMa.ai traerá el chip de inteligencia artificial más poderoso del mundo a la India.

En un emocionante avance, SiMa.ai, una startup estadounidense de chips de inteligencia artificial, ha anunciado la pr...

Inteligencia Artificial

Cómo ayudar a los estudiantes de secundaria a prepararse para el auge de la inteligencia artificial

Un programa de verano de una semana tiene como objetivo fomentar una comprensión más profunda de los enfoques de apre...