Este artículo de IA de China propone HQTrack un marco de IA para rastrear cualquier cosa de alta calidad en videos

AI article from China proposes HQTrack, an AI framework to track high-quality content in videos.

El seguimiento visual de objetos es la base de numerosos subcampos dentro de la visión por computadora, incluyendo la visión de robots y la conducción autónoma. Este trabajo tiene como objetivo identificar de manera confiable el objeto objetivo en una secuencia de video. Muchos algoritmos de vanguardia compiten en el desafío de Seguimiento Visual de Objetos (VOT) ya que es una de las competencias más importantes en el campo del seguimiento.

La competencia de Seguimiento y Segmentación Visual de Objetos (VOTS2023) elimina algunas de las restricciones impuestas por los desafíos anteriores de VOT para que los participantes puedan pensar en el seguimiento de objetos de manera más amplia. Como resultado, VOTS2023 combina el monitoreo a corto y largo plazo de un solo objetivo y el seguimiento de muchos objetivos, utilizando la segmentación del objetivo como única especificación de posición. Esto introduce nuevas dificultades, como la estimación precisa de las máscaras, el seguimiento de trayectorias de múltiples objetivos y el reconocimiento de las relaciones entre objetos.

Un nuevo estudio realizado por la Universidad de Tecnología de Dalian, China, y la Academia DAMO, Grupo Alibaba, presenta un sistema llamado HQTrack, que significa Seguimiento de Alta Calidad. Está compuesto principalmente por un segmentador de video multiobjetivo (VMOS) y un refinador de máscaras (MR). Para percibir objetos pequeños en configuraciones complicadas, los investigadores utilizan VMOS, una variación mejorada de DeAOT, y aplican en cascada un módulo de propagación controlada (GPM) a escala 1/8. Además, utilizan Intern-T como extractor de características para mejorar la capacidad de distinguir entre diferentes tipos de objetos. En VMOS, los investigadores solo conservan el fotograma más recientemente utilizado en la memoria a largo plazo, descartando los anteriores para liberar espacio. Sin embargo, aplicar un modelo de segmentación grande para mejorar las máscaras de seguimiento podría ser útil. Los objetos con estructuras complicadas son especialmente desafiantes para predecir con SAM, y aparecen con frecuencia en el desafío VOTS.

Utilizando un modelo HQ-SAM que ya ha sido preentrenado, el equipo puede mejorar aún más la calidad de las máscaras de seguimiento. Los resultados finales de seguimiento se eligen entre VMOS y MR, y se utilizan las cajas de contorno externas de las máscaras predichas como indicaciones de caja para alimentar a HQ-SAM junto con las imágenes originales para obtener las máscaras refinadas. HQTrack ocupa el segundo lugar en la competencia VOTS2023 con una puntuación de calidad de 0.615 en el conjunto de pruebas.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Las imágenes de la cámara del salpicadero revelan dónde está desplegada la policía.

Los científicos encontraron indicios de cómo la policía en la ciudad de Nueva York puede desplegarse en los vecindari...

Inteligencia Artificial

Prediciendo Touchdowns de Futbol Americano con Aprendizaje Automático

Fútbol. Un pasatiempo estadounidense que une a los fans en toda la nación. Con un promedio de 16.7 millones de espect...

Inteligencia Artificial

La investigación liderada por UMD impulsa el Panel de datos sobre el enjuiciamiento del condado de Montgomery.

Investigadores de la Universidad de Maryland ayudaron a la Oficina del Fiscal del Estado del Condado de Montgomery a ...

Inteligencia Artificial

Los modelos de IA son poderosos, pero ¿son biológicamente plausibles?

Un nuevo estudio que une la neurociencia y el aprendizaje automático ofrece información sobre el posible papel de los...

Inteligencia Artificial

¿Qué es la innatismo y importa para la inteligencia artificial? (Parte 2)

La cuestión de la innatitud, tanto en biología como en inteligencia artificial, es crucial para el futuro de la IA si...