¿Cómo funcionan los detectores de contenido de IA?

¿Cómo operan los detectores de contenido de IA?

El contenido de IA está en todas partes. La explosión de popularidad de ChatGPT ha generado un aumento en los blogs, artículos, correos electrónicos, currículums y trabajos académicos generados por IA. Naturalmente, los detectores de contenido de IA también han crecido en respuesta.

Muchas escuelas y publicaciones han utilizado detectores de plagio impulsados por IA durante años. Ahora que es más fácil para las personas intentar pasar contenido creado por IA como propio, estas herramientas también se han mejorado para detectar textos generados por IA. Si aún no has encontrado estos detectores tú mismo, es probable que hayas oído hablar de ellos, pero ¿cómo funcionan exactamente?

Cómo funcionan los detectores de contenido de IA

Los expertos humanos a veces pueden distinguir entre el contenido escrito por IA y el contenido escrito por humanos, pero no de manera consistente. Una encuesta encontró que más del 63% de las personas no pueden identificar con precisión el texto escrito por ChatGPT. ¿La solución? Luchar contra el fuego con fuego, o más específicamente, IA con IA.

Los detectores de contenido de IA utilizan modelos de aprendizaje automático para buscar patrones comunes en el texto generado por IA. Para hacer eso, los científicos de datos los entrenan con contenido escrito por humanos y contenido creado por IA. Al analizar cada categoría, estos modelos pueden aprender las diferencias comunes entre ellas. Luego, pueden detectar estas sutiles diferencias en la práctica para determinar si algo es original.

Las diferencias entre el contenido generado por IA y el contenido escrito por humanos se dividen en dos categorías principales: perplejidad e impulsividad. Los detectores de contenido de IA se centran en estas características para tomar sus decisiones.

Perplejidad

La perplejidad es la previsibilidad de un texto. Los modelos de IA son incapaces de tener pensamiento original porque funcionan repitiendo patrones y tendencias en sus datos de entrada. Como resultado, su elección de palabras suele ser más predecible que la de un humano.

El procesamiento del lenguaje natural (PLN), la técnica de IA para comprender el lenguaje, determina qué palabras son más propensas a aparecer en qué orden. Esto ayuda a crear frases legibles y gramaticalmente correctas, pero también significa que su elección de palabras no varía mucho.

Si un detector de contenido de IA puede predecir con precisión la elección y el orden de las palabras de un texto, el texto tiene una baja perplejidad, lo que sugiere que es generado por IA. Si no puede hacerlo, tiene una alta perplejidad y es más probable que sea escrito por un humano.

Impulsividad

Mientras que la perplejidad se centra en la elección de palabras, la impulsividad se centra en la estructura de las oraciones. Debido a que el PLN se basa en patrones y previsibilidad, la IA generativa favorece estructuras de oraciones simples y longitudes promedio. La escritura humana, en cambio, tiene una mayor impulsividad, es decir, más variación en la longitud y estructura de las oraciones.

Si los detectores de contenido de IA encuentran poca impulsividad y baja perplejidad, marcarán el texto como generado por IA con confianza. Poca impulsividad pero alta perplejidad, o viceversa, pueden activar una advertencia de IA, dependiendo de su extensión y del detector en cuestión.

¿Qué tan precisos son los detectores de contenido de IA?

Aunque el funcionamiento de los detectores de contenido de IA parece ser altamente preciso, no son tan precisos como podrías esperar. La empresa matriz de ChatGPT, OpenAI, ha señalado que los detectores de IA producen falsos positivos, especialmente cuando alguien está escribiendo en su segundo idioma.

La repetición de estructuras de oraciones y la elección predecible de palabras pueden ser comunes en el texto generado por IA, pero los humanos también cometen los mismos errores. Los escritores de primer nivel pueden tener oraciones más variadas y elecciones de palabras más floridas, pero muchas personas no. Además, los modelos de detección tienden a errar por precaución, lo que hace que estos falsos positivos sean aún más probables.

La perplejidad y la impulsividad no siempre capturan el contenido de IA. A medida que la IA generativa mejora, está superando estas limitaciones, y los usuarios pueden ajustar el contenido de IA para que suene más natural. Incluso los mejores detectores de IA no superan el 80% de precisión, y la mayoría no alcanza el 70%.

¿Por qué es importante la detección de contenido AI?

A pesar de estas limitaciones, cada vez es más importante detectar el contenido generado por AI. El problema va más allá de que las personas hagan trampas en la escuela o tomen atajos en el trabajo. Los ciberdelincuentes utilizan ChatGPT para crear correos electrónicos de phishing, por lo que mejores herramientas de detección podrían detener más delitos cibernéticos que los humanos no pueden detectar.

El contenido generado por AI también tiene implicancias significativas de plagio. Debido a que el aprendizaje automático solo puede parafrasear y resumir contenido existente, la originalidad de su producción es cuestionable en el mejor de los casos. En muchos casos, también se entrena con el trabajo de los creadores sin su conocimiento ni permiso. En consecuencia, el uso de AI generativa en ámbitos académicos o profesionales podría llevar a una violación masiva de derechos de autor.

Afortunadamente, las herramientas de detección de AI están mejorando. Muchos desarrolladores están trabajando en “marcas de agua” para modelos AI generativos que los humanos no pueden ver, pero otros sistemas de AI pueden detectar. Los investigadores encontraron que esta práctica puede revelar contenido AI con casi total certeza en pruebas iniciales. Si esta tecnología se vuelve estándar, facilitará mucho más la detección y la hará más confiable.

A medida que AI crece, también lo harán los detectores de contenido AI

La detección de contenido AI puede que no sea tan precisa como desearías hoy en día, pero sigue siendo impresionante. Además, seguirá mejorando a medida que avance la tecnología y surjan nuevas mejores prácticas. Hasta entonces, es importante tener en cuenta sus limitaciones.

El contenido generado por AI seguirá creciendo a partir de aquí, y la detección de AI crecerá junto con él. Si bien no son perfectas, estas herramientas son una parte fundamental para proteger la seguridad y la propiedad intelectual de las personas.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Meet LLMWare Un marco de Inteligencia Artificial todo en uno para agilizar el desarrollo de aplicaciones basadas en LLM para aplicaciones de IA generativa

A pesar del gran interés en los Modelos de Lenguaje Grande LLM (por sus siglas en inglés) durante el último año, much...

Inteligencia Artificial

Los adolescentes se esfuerzan por ampliar la alfabetización en IA

Algunos adolescentes están pidiendo a sus escuelas que brinden experiencias de aprendizaje de IA más amplias.

Inteligencia Artificial

Más allá de Photoshop Cómo Inst-Inpaint está revolucionando la eliminación de objetos con modelos de difusión

El inpainting de imágenes es un arte antiguo. Es el proceso de eliminar objetos no deseados y rellenar píxeles faltan...

Inteligencia Artificial

AI Surge El CEO de Stability AI predice pérdidas de empleo para los desarrolladores indios en un plazo de 2 años

A medida que la revolución de la IA se desarrolla, el mundo presencia tanto los posibles beneficios como las preocupa...

Inteligencia Artificial

Conoce a CityDreamer Un modelo generativo compositivo para ciudades 3D ilimitadas

La creación de entornos naturales en 3D ha sido objeto de mucha investigación en los últimos años. Se han realizado a...

Inteligencia Artificial

Optimiza el costo de implementación de los modelos base de Amazon SageMaker JumpStart con los puntos finales asincrónicos de Amazon SageMaker

En esta publicación, nos enfocamos en estas situaciones y resolvemos el problema de arriesgar altos costos al impleme...