Visión Probabilística del Análisis de Componentes Principales

Visión Probabilística del Análisis de Componentes Principales' - Probabilistic Perspective of Principal Component Analysis

Variables Latentes, Expectation-Maximization & Inferencia Variacional

Buscando Variables Ocultas (Crédito de la imagen: Autor)

Una de las técnicas de reducción de dimensiones más utilizadas en ciencia de datos y aprendizaje automático es el Análisis de Componentes Principales (PCA). Anteriormente, ya hemos discutido algunos ejemplos de aplicación de PCA en un pipeline con Máquina de Vectores de Soporte y aquí veremos una perspectiva probabilística de PCA para proporcionar una comprensión más sólida y completa de la estructura subyacente de los datos. Una de las mayores ventajas de PCA Probabilístico (PPCA) es que puede manejar valores faltantes en un conjunto de datos, lo cual no es posible con PCA clásico. Dado que discutiremos el Modelo de Variables Latentes y el algoritmo Expectation-Maximization, también puedes consultar esta publicación detallada.

¿Qué puedes esperar aprender de esta publicación?

Introducción breve a PCA.
Elementos matemáticos fundamentales para PPCA.
¿Algoritmo Expectation Maximization (EM) o Inferencia Variacional? ¿Qué usar para la estimación de parámetros?
Implementación de PPCA con TensorFlow Probability para un conjunto de datos de juguete.

¡Vamos a sumergirnos en esto!

1. Descomposición en Valores Singulares (SVD) y PCA:

Uno de los conceptos más importantes en Álgebra Lineal es el SVD y es una técnica de factorización para matrices reales o complejas donde, por ejemplo, una matriz (digamos A) puede factorizarse como:

donde U,Vᵀ son matrices ortogonales (la transpuesta es igual a la inversa) y Σ sería una matriz diagonal. A no necesita ser una matriz cuadrada, supongamos que es una matriz N×D, por lo que ya podemos pensar en esto como nuestra matriz de datos con N instancias y D características. U,V son matrices cuadradas (N×N) y (D×D) respectivamente, y Σ será entonces una matriz N×D donde el subconjunto D×D será diagonal y las entradas restantes serán cero.

También conocemos la descomposición de valores propios. Dada una matriz cuadrada (B) que es diagonalizable, se puede factorizar como:

donde Q es la matriz cuadrada N×N cuya columna i-ésima es el vector propio q_i de B, y Λ es la matriz diagonal cuyos elementos diagonales son los valores propios correspondientes.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Was this article helpful?

93 out of 132 found this helpful

Visión Probabilística del Análisis de Componentes Principales

Variables Latentes, Expectation-Maximization & Inferencia Variacional

1. Descomposición en Valores Singulares (SVD) y PCA:

Was this article helpful?

Aprendizaje por Refuerzo sin Modelo para el Desarrollo de Procesos Químicos

Composición de imágenes con modelos de difusión pre-entrenados

Inteligencia Artificial

Stability AI presenta StableChat una vista previa de investigación de un asistente de IA conversacional similar a ChatGPT o Claude.

Grupo de noticias dice que los chatbots de inteligencia artificial dependen en gran medida del contenido de noticias

Mejorando los Modelos de Lenguaje con Indicaciones Analógicas para Mejorar el Razonamiento

Luma AI lanza Genie un nuevo modelo de IA generativa en 3D que te permite crear objetos en 3D a partir de texto.

Conoce AUDIT Un modelo de edición de audio guiado por instrucciones basado en modelos de difusión latente

Esta investigación sobre IA de China presenta 4K4D una representación en la nube de puntos 4D que admite rasterización de hardware y permite una velocidad de renderizado sin precedentes.