Resumen del artículo Un enfoque híbrido con GAN y DP para la preservación de la privacidad de los datos de IIoT.

Enfoque híbrido GAN-DP para preservar privacidad datos IIoT.

Anonimización es un problema significativo al manejar datos del Internet Industrial de las Cosas (IIoT, por sus siglas en inglés). Las aplicaciones de Aprendizaje Automático (ML, por sus siglas en inglés) requieren datos desencriptados para realizar tareas eficientemente, lo cual significa que terceros involucrados en el procesamiento de datos pueden tener acceso a información sensible. Esto plantea un riesgo de filtración de privacidad y divulgación de información para las empresas que generan los datos. En consecuencia, debido a estas preocupaciones, las empresas dudan en compartir sus datos de IIoT con terceros.

El estado del arte en la resolución del problema de anonimización involucra varios enfoques como la encriptación, encriptación homomórfica, técnicas criptográficas y aprendizaje distribuido/federado. Sin embargo, estos métodos tienen limitaciones en términos de costos computacionales, explicabilidad de los modelos de ML y vulnerabilidades a ciberataques. Además, las técnicas existentes de preservación de privacidad a menudo resultan en un compromiso entre privacidad y precisión, donde lograr una alta protección de privacidad conduce a una pérdida significativa en la precisión del modelo de ML. Estos desafíos dificultan la preservación efectiva y eficiente de la privacidad de los datos de IIoT.

En este contexto, un equipo de investigación de la Universidad Kadir Has en Turquía propuso un método novedoso que combina Redes Generativas Adversarias (GAN) y Privacidad Diferencial (DP) para preservar datos sensibles en operaciones de IIoT. El enfoque híbrido tiene como objetivo lograr la preservación de privacidad con una pérdida mínima de precisión y bajos costos computacionales adicionales. Se utiliza GAN para generar copias sintéticas de datos sensibles, mientras que DP introduce ruido y parámetros aleatorios para mantener la privacidad. El método propuesto se prueba utilizando conjuntos de datos disponibles públicamente y un conjunto de datos de IIoT realista recopilado de un proceso de producción de confitería.

Los autores proponen un enfoque híbrido de preservación de privacidad para entornos de IIoT. Su método involucra dos componentes principales: GAN y DP.

  1. GAN: Utilizan GAN, específicamente el enfoque GAN Tabular Condicional (CTGAN), para crear una copia sintética (XG) del conjunto de datos original (XO). GAN aprende la distribución de los datos y genera datos sintéticos con estadísticas similares a las del original.
  2. DP: Para mejorar la privacidad, agregan ruido aleatorio de una distribución Laplaciana a características sensibles en los datos. Esta técnica preserva la privacidad al tiempo que mantiene la distribución de probabilidad general de los datos.

El enfoque propuesto implica lo siguiente:

  • Crear un conjunto de datos sintético con GAN.
  • Reemplazar características sensibles.
  • Aplicar privacidad diferencial mediante la adición de ruido aleatorio.

El conjunto de datos resultante preserva la privacidad y se puede utilizar para análisis de aprendizaje automático sin comprometer información sensible. La complejidad del algoritmo depende del número de características sensibles y el tamaño del conjunto de datos. Los autores enfatizan que su método garantiza la protección de privacidad general de los datos de IIoT.

La evaluación realizada en este artículo involucró la realización de experimentos para probar el enfoque híbrido propuesto para la síntesis y predicción de datos preservando la privacidad. Los experimentos se realizaron en cuatro conjuntos de datos SCADA: turbina eólica, producción de vapor, eficiencia energética y motores síncronos. Los experimentos utilizaron la generación de datos sintéticos CTGAN y técnicas de privacidad diferencial (DP). Los criterios de evaluación incluyeron la medición de la precisión utilizando la métrica R-cuadrado y la preservación de privacidad utilizando seis métricas de privacidad. Los resultados mostraron que el enfoque híbrido propuesto logró una mayor precisión y preservación de privacidad que otros métodos, como CTGAN y DP. Los experimentos también probaron el rendimiento del método propuesto en conjuntos de datos con características sensibles ocultas y demostraron su capacidad para proteger dichos datos sensibles.

En conclusión, el artículo propuso un enfoque híbrido novedoso que combina GAN y DP para abordar el problema de anonimización en los datos del Internet Industrial de las Cosas (IIoT). El método propuesto implica la creación de un conjunto de datos sintético utilizando GAN y la aplicación de DP mediante la adición de ruido aleatorio a características sensibles. Los resultados de la evaluación demostraron que el enfoque híbrido propuesto logró una mayor precisión y preservación de privacidad que otros métodos. Este enfoque ofrece una solución prometedora para preservar datos sensibles en entornos de IIoT mientras se minimiza la pérdida de precisión y los costos computacionales.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

OpenAI revela ChatGPT Enterprise con el poder de GPT-4

OpenAI, la organización pionera en investigación de IA, acaba de presentar un nuevo capítulo emocionante en el mundo ...

Inteligencia Artificial

Desenmascarando Deepfakes Aprovechando los patrones de estimación de la posición de la cabeza para mejorar la precisión de detección

La aparición de la capacidad de producir videos “falsos” ha generado preocupaciones significativas con re...

Noticias de Inteligencia Artificial

Utilice AWS CDK para implementar configuraciones del ciclo de vida de Amazon SageMaker Studio.

Amazon SageMaker Studio es el primer entorno de desarrollo integrado (IDE) completamente para machine learning (ML). ...

Inteligencia Artificial

El poder de los codificadores y decodificadores avanzados en la IA generativa

Introducción En el dinámico mundo de la Inteligencia Artificial, la fusión de la tecnología y la creatividad ha dado ...

Inteligencia Artificial

IA en la computación en el borde Implementación de algoritmos para mejorar en tiempo real

La computación en el borde es un enfoque transformador que coloca la computación cerca de fuentes de datos como dispo...