El papel proactivo de la IA en el combate a la corrupción en el gobierno

El papel proactivo de la Inteligencia Artificial en la lucha contra la corrupción en el gobierno

Imagen por el autor, creada con la ayuda de DALL.E 3

Revolucionando Esfuerzos con Redes Generativas Antagonistas y Datos Sintéticos

Introducción

La reciente explosión de modelos de Inteligencia Artificial (IA) generativa ha centrado la atención del mundo en la ética, los riesgos y las preocupaciones de seguridad, y la conferencia de Bletchley Park a principios de este mes culminó en un compromiso de colaboración internacional sobre la seguridad de los emergentes sistemas de IA. Sin embargo, esos mismos sistemas pueden ayudar a abordar desafíos similares al compromiso ético en otros campos.

La corrupción gubernamental y los sesgos sistémicos son barreras formidables para sociedades prósperas pero difíciles de abordar. Los datos sintéticos y la IA generativa en forma de Redes Generativas Antagonistas (GANs) ofrecen la posibilidad no solo de buscar prácticas corruptas, sino también de anticipar innovaciones en la forma en que ocurre la corrupción.

La Prevalencia y el costo de la Corrupción en el Gobierno

El Índice de Percepción de la Corrupción de Transparencia Internacional ilustra consistentemente la omnipresencia de este problema en los gobiernos. Sus diversas formas pueden incluir clientelismo, sobornos, nepotismo, manipulación de pruebas, comisiones y comportamientos similares diseñados para obtener ventajas a través del abuso de funciones. Existe un costo financiero significativo, y el Banco Mundial ha proyectado una cifra de 2.6 billones de dólares estadounidenses cada año, con aproximadamente un billón de dólares estadounidenses pagados en sobornos anualmente en todo el mundo. Esto ya es importante, pero el efecto de la corrupción se extiende mucho más allá. La corrupción daña la confianza en las instituciones públicas, socava el respeto por las leyes, amenaza servicios básicos como la educación y la salud, y retira fondos vitales necesarios para abordar el cambio climático. Las ganancias para quienes están involucrados (o hacen la vista gorda), y el potencial de riesgo para la seguridad personal, actúan como un fuerte disuasivo para que los testigos denuncien. La IA ofrece una herramienta importante para empoderar a las unidades anticorrupción.

Uso de la IA en la lucha contra la corrupción

La IA muestra su verdadero potencial al tratar de comprender datos complejos que tienen una intrincada red de interconexiones. Si bien no es generalizado, existen ejemplos de IA que identifican comportamientos delictivos y corruptos.

En 2017, los investigadores españoles Félix López-Iturriaga e Iván Pastor Sanz utilizaron redes neuronales para construir un modelo predictivo de corrupción en las provincias españolas. Utilizaron datos de la vida real de una base de datos de casos de corrupción creada por el periódico El Mundo, analizando los años previos a cualquier condena para identificar posibles señales de alerta temprana. Esto permitió que el modelo de IA descubriera relaciones y conexiones invisibles, como el aumento de los precios de las propiedades y los casos de corrupción.

El uso de IA para detectar comportamientos sospechosos y prevenir actividades fraudulentas ya es ampliamente utilizado en el sector bancario.

El sistema de Ucrania para identificar riesgos en la contratación (PROZORRO) utiliza un programa llamado DOZORRO diseñado para identificar posibles irregularidades en la contratación pública. Los datos para entrenar la IA provienen de evaluaciones de riesgo realizadas por expertos en alrededor de 3,500 licitaciones. El sistema puede evaluar de forma independiente los riesgos de corrupción en las licitaciones y compartir los hallazgos con los grupos de vigilancia de la sociedad civil. Los hallazgos iniciales sugieren que se han ahorrado miles de millones de dólares, que el gobierno es más legítimo y que, en el contexto actual, las empresas extranjeras son más propensas a invertir.

El Banco Mundial lanzó en 2021 la plataforma de Anti-Corrupción y Transparencia en Adquisiciones basada en IA (ProACT). Utilizando datos de fuentes abiertas de más de 100 países, permite a cualquier persona buscar y revisar contratos de adquisiciones públicas, su clasificación de transparencia y los posibles riesgos de integridad.

Los sistemas de IA, sin embargo, dependen de datos y la escasez de datos confiables en los estudios sobre corrupción es un desafío bien documentado. Puede ser difícil obtener datos precisos debido a la naturaleza oculta de las actividades corruptas, registros que no contienen los datos correctos o contienen errores, o falta de conocimiento sobre nuevos enfoques y sistemas para defraudar.

Datos Sintéticos

Una posible solución para muchos de estos problemas es el uso de datos sintéticos, que son datos generados artificialmente mediante algoritmos, en lugar de ser recopilados de eventos o procesos del mundo real. Imita datos auténticos, por lo que es útil para entrenar modelos de aprendizaje automático cuando los datos reales no están disponibles, no son suficientes o son sensibles. Los modelos pueden aprender y adaptarse en entornos que imitan escenarios de corrupción del mundo real, sin arriesgar violaciones de privacidad o comprometer datos sensibles.

Dada la complejidad de las redes de corrupción y la escasez de datos, los datos sintéticos ofrecen un nivel de detalle esencial para entrenar a la IA para detectar patrones sutiles de corrupción que no se evidencian en conjuntos de datos más simples. Al construir conjuntos de datos realistas, los sistemas de IA están equipados con herramientas para explorar, comprender y predecir.

Estos conjuntos de datos de alta calidad y ficticios pueden entrenar sistemas de IA en escenarios diversos e intrincados. Este enfoque aumenta la seguridad y el anonimato de las personas involucradas en investigaciones confidenciales y proporciona la complejidad necesaria para que la IA reconozca y prediga patrones de corrupción.

Además, la investigación sugiere que los sistemas de IA entrenados con datos sintéticos pueden alcanzar niveles de precisión comparables a los entrenados con datos del mundo real, pero en una fracción del tiempo y sin las complicaciones éticas y legales asociadas a menudo con el uso de datos reales. Esto significa que entrenar a la IA con datos sintéticos es eficiente y es más probable que se mantenga al ritmo del cambio por parte de los delincuentes (que también utilizan IA para fortalecer sus enfoques).

Redes Generativas Adversarias (GANs): La Tecnología Central

Las GANs son un tipo de tecnología de IA utilizada para generar datos sintéticos que emplean dos redes neuronales: el Generador y el Discriminador, en un proceso dinámico donde cada red aprende tratando de superar a la otra.

Después de haber sido entrenado con datos reales limitados, el Generador crea escenarios detallados de corrupción sintética, mientras que el Discriminador intenta determinar si lo que está examinando es real o falso (inicialmente basándose en su propio entrenamiento con datos reales limitados). Las creaciones iniciales probablemente sean rudimentarias, y el Discriminador identifica fácilmente la respuesta correcta. Sin embargo, el Generador aprende de esto y mejora sus producciones. A medida que los datos del Generador se vuelven cada vez más realistas, la capacidad del Discriminador para diferenciar también se agudiza. Este proceso iterativo continúa hasta que los datos sintéticos finales son réplicas cercanas de escenarios reales y potenciales del mundo real, y patrones sutiles de corrupción.

Los datos que surgen de esto evitan los problemas asociados con los datos de la vida real mencionados anteriormente, especialmente en cuanto a limitaciones de disponibilidad y privacidad/secretividad de los datos. Esta base de datos sintéticos se utiliza como base para entrenar sistemas de IA específicos para llevar a cabo la predicción, detección o análisis de la corrupción.

La diferencia con los datos sintéticos generados por GANs

El aumento en la cantidad y complejidad de los datos sintéticos generados por GANs permite a los gobiernos y organismos reguladores mejorar sus capacidades de detección, volviéndose más hábiles para identificar formas sutiles y complejas de corrupción que de otra manera pasarían desapercibidas.

Al simular una amplia gama de escenarios de corrupción, las GANs ayudan a crear herramientas de IA que son tanto reactivas (detectando incidentes de corrupción) como proactivas (identificando escenarios de la vida real en desarrollo que tienen una probabilidad creciente de llevar a la corrupción). Los sistemas de AI entrenados con datos sintéticos pueden aprender de una amplia variedad de escenarios de corrupción potenciales, incluidos aquellos que pueden no estar bien representados o disponibles en datos del mundo real. Esto significa que el sistema de AI aumenta su comprensión de los patrones de corrupción y desarrolla sistemas más sólidos e inteligentes para combatirla.

El Banco Mundial ha identificado varias formas en las que el comportamiento corrupto puede evolucionar, incluyendo la introducción de patrones de datos complejos y plataformas digitales para ocultar actividades corruptas, el uso de profesionales (bancarios, abogados, y contadores) como facilitadores en redes sofisticadas, y métodos más intrincados de corrupción para eludir los nuevos estándares internacionales.

A medida que la capacidad de llevar a cabo actividades corruptas aumenta, los esfuerzos anticorrupción también deben volverse más sofisticados. La velocidad con la que la inteligencia artificial puede generar, probar y volver a generar escenarios, y la variedad de configuraciones que puede crear, abre la posibilidad de mantenerse al día —o incluso superar— el ritmo de este cambio.

Dimensiones éticas y preocupaciones de privacidad

Aunque el uso de datos sintéticos mitiga los riesgos de privacidad, la fase inicial de entrenamiento para desarrollarlos requiere datos reales de registros gubernamentales, informes de auditoría, datos de cumplimiento, bases de datos del sector público, documentos legales y regulatorios, y denuncias y quejas de informantes. Esto plantea comprensiblemente varios riesgos:

1. Información sensible: Los datos procesados dentro de un contexto gubernamental a menudo incluyen detalles personales, archivos gubernamentales confidenciales o registros financieros confidenciales. La información en las licitaciones de adquisiciones es invariablemente comercial en confidencialidad.

2. Incorporación de sesgos: Cualquier sesgo o discriminación (explícita o implícita) contenida en los datos iniciales puede influir en el sistema posterior. Por ejemplo, la discriminación de género o racial previa en la toma de decisiones, nombramientos o roles —por sutiles que sean— se tomará como parte de la “verdad” de referencia sobre la cual la máquina construye su conocimiento.

3. Riesgo de mal uso o violaciones de datos: Los sistemas de inteligencia artificial gubernamentales podrían ser objeto de ataques maliciosos debido a su acceso a conjuntos de datos grandes y potencialmente confidenciales, lo que puede llevar a violaciones de datos o uso indebido de información.

4. Desarrollo ético de la inteligencia artificial: A medida que los sistemas de inteligencia artificial se entrenan para detectar patrones de corrupción, deben hacerlo sin infringir los derechos individuales ni crear nuevos dilemas éticos.

5. Cumplimiento legal: Cada vez más, leyes estrictas de protección de datos regulan el manejo de datos personales (por ejemplo, GDPR).

6. Mantener la confianza pública: La confianza en las instituciones públicas puede erosionarse si se percibe que las herramientas de inteligencia artificial violan la privacidad o son poco éticas.

Acciones concretas para mitigar los riesgos mencionados anteriormente incluyen cumplir con marcos legales aplicables, implementar salvaguardias sólidas de privacidad, revisiones expertas de los datos de aprendizaje para detectar sesgos, salvaguardias para el uso de datos personales, y transparencia pública en cómo se cumplen las normas éticas. Un enfoque proactivo aumentará la legitimidad y confiabilidad de la inteligencia artificial en desarrollo y reducirá el riesgo de que cualquier enjuiciamiento posterior por corrupción se vea socavado por desafíos a los sistemas utilizados.

Introducción de GAN y datos sintéticos en los sistemas gubernamentales de lucha contra la corrupción

El siguiente diagrama proporciona un ejemplo de dónde se introducirían los GAN y los datos sintéticos generados en un sistema de detección de corrupción basado en inteligencia artificial.

Diagrama creado por el autor
  1. Datos para el entrenamiento inicial: Esto implica identificar sectores gubernamentales propensos a la corrupción, potencialmente recurriendo a organizaciones de la sociedad civil contra la corrupción externas para obtener experiencia. Los datos históricos del mundo real sobre situaciones corruptas y no corruptas en estas áreas se verifican en función de las salvaguardias éticas.
  2. Creación, entrenamiento y operación de GAN: El modelo GAN recibe un entrenamiento inicial basado en datos del mundo real y luego se le permite ejecutar las interacciones entre sus dos redes para producir datos sintéticos.
  3. Entrenar y refinar modelos de detección de IA: Los datos sintéticos producidos por el GAN se utilizan para entrenar un nuevo modelo de IA en la detección de patrones indicativos de actividades corruptas.
  4. Monitoreo continuo de ética y sesgos: Aunque los datos sintéticos reducen en gran medida el riesgo de sesgos y preocupaciones de privacidad, aún existe la posibilidad de que surjan problemas residuales.
  5. Prueba piloto: Las pruebas iniciales pueden llevarse a cabo utilizando modelos de IA implementados en entornos controlados para evaluar su efectividad en la identificación de prácticas corruptas (con comentarios proporcionados al GAN para ajustes).
  6. Escalamiento: Los modelos se integran en sistemas gubernamentales más amplios (manteniendo una supervisión continua y realizando ajustes según sea necesario).
  7. Aprendizaje y adaptación continuos: Los hallazgos del sistema de detección de corrupción basado en IA pueden retroalimentarse en el GAN, pasando primero por el mismo proceso utilizado anteriormente para verificar sesgos y eliminar cualquier preocupación de privacidad o seguridad, para garantizar que el sistema siga siendo flexible y se adapte a nuevas tácticas de corrupción y cambios en los datos.

Conclusión

El uso de datos sintéticos creados utilizando Redes Generativas Adversarias (GAN) es un enfoque metódico para combatir la corrupción que va más allá de la detección de prácticas actuales para predecir y adaptarse a las tendencias emergentes. Mediante un proceso de aprendizaje continuo e iterativo, el sistema puede potencialmente identificar y adaptarse a futuros métodos de corrupción. La escasez de datos sobre corrupción, en particular el nivel de detalle que permite a los sistemas de detección identificar indicadores cada vez más sutiles, potencialmente dispersos en múltiples jurisdicciones, se mitiga mediante la capacidad de las GAN para desarrollar nuevos datos para una variedad de escenarios.

Aunque persisten las preocupaciones éticas, aunque sustancialmente reducidas, los salvaguardias y la supervisión siguen siendo primordiales. Como piedra angular de una buena gobernanza, los gobiernos y los organismos reguladores deben mantener la transparencia y la rendición de cuentas como una prioridad fundamental.

A pesar de su infancia, el potencial de la inteligencia artificial en la lucha contra la corrupción es significativo. El ritmo de innovación en prácticas corruptas está acelerando, con la inteligencia artificial desplegada para crear redes cada vez más opacas y enredadas diseñadas para evitar las herramientas clásicas de detección. Las agencias gubernamentales de lucha contra la corrupción deben mantener, como mínimo, una trayectoria similar de invención e invertir en datos sintéticos generados por GAN ofrece la oportunidad de predecir y mitigar. Además, con billones de dólares perdidos cada año debido a la corrupción, desarrollar la inteligencia artificial en un área donde el éxito puede llevar a un aumento directo en los presupuestos del gasto público, perseguir dicha inversión permite a los gobiernos cumplir con el objetivo de brindar para su pueblo.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Apple entra en la competencia de la IA generativa con el chatbot 'AppleGPT

El gigante tecnológico Apple sigue adelante con su esperado chatbot impulsado por IA, tentativamente llamado “A...

Inteligencia Artificial

Este artículo de IA hace público HyperDreamer un avance en la creación de contenido 3D con texturizado avanzado, modelado de 360 grados y edición interactiva

No es fácil generar modelos en 3D detallados y realistas a partir de una sola imagen RGB. Investigadores del Laborato...

Ciencias de la Computación

Alphabet apuesta por los láseres para llevar Internet a áreas remotas

El proyecto Taara utiliza láseres para llevar acceso a Internet a zonas remotas y rurales.

Aprendizaje Automático

Acelerando el Acelerador Científico Acelera la Computación de Alto Rendimiento de CERN con GPUs y IA.

Nota del editor: Esto es parte de una serie que perfila a investigadores que avanzan en la ciencia con cómputo de alt...

Inteligencia Artificial

Revolucionando la tecnología portátil el algoritmo de frecuencia cardíaca ultrarrápido de Edge Impulse y la ampliación de la suite de atención médica

El aprendizaje automático se utiliza en casi todos los aspectos de nuestra vida y en diversos campos. Es una tecnolog...