¿Cómo funcionan los detectores de contenido de IA?
¿Cómo operan los detectores de contenido de IA?
El contenido de IA está en todas partes. La explosión de popularidad de ChatGPT ha generado un aumento en los blogs, artículos, correos electrónicos, currículums y trabajos académicos generados por IA. Naturalmente, los detectores de contenido de IA también han crecido en respuesta.
Muchas escuelas y publicaciones han utilizado detectores de plagio impulsados por IA durante años. Ahora que es más fácil para las personas intentar pasar contenido creado por IA como propio, estas herramientas también se han mejorado para detectar textos generados por IA. Si aún no has encontrado estos detectores tú mismo, es probable que hayas oído hablar de ellos, pero ¿cómo funcionan exactamente?
Cómo funcionan los detectores de contenido de IA
Los expertos humanos a veces pueden distinguir entre el contenido escrito por IA y el contenido escrito por humanos, pero no de manera consistente. Una encuesta encontró que más del 63% de las personas no pueden identificar con precisión el texto escrito por ChatGPT. ¿La solución? Luchar contra el fuego con fuego, o más específicamente, IA con IA.
- Convertir CSV a PDF Solicitando a GPT-4 para la creación automática de informes de visualización de datos
- Investigadores de la Universidad de Stanford presentan FlashFFTConv un nuevo sistema de inteligencia artificial para optimizar convoluciones FFT en secuencias largas.
- Utilice Amazon SageMaker Studio para construir una solución de respuesta a preguntas RAG con Llama 2, LangChain y Pinecone para experimentación rápida.
Los detectores de contenido de IA utilizan modelos de aprendizaje automático para buscar patrones comunes en el texto generado por IA. Para hacer eso, los científicos de datos los entrenan con contenido escrito por humanos y contenido creado por IA. Al analizar cada categoría, estos modelos pueden aprender las diferencias comunes entre ellas. Luego, pueden detectar estas sutiles diferencias en la práctica para determinar si algo es original.
Las diferencias entre el contenido generado por IA y el contenido escrito por humanos se dividen en dos categorías principales: perplejidad e impulsividad. Los detectores de contenido de IA se centran en estas características para tomar sus decisiones.
Perplejidad
La perplejidad es la previsibilidad de un texto. Los modelos de IA son incapaces de tener pensamiento original porque funcionan repitiendo patrones y tendencias en sus datos de entrada. Como resultado, su elección de palabras suele ser más predecible que la de un humano.
El procesamiento del lenguaje natural (PLN), la técnica de IA para comprender el lenguaje, determina qué palabras son más propensas a aparecer en qué orden. Esto ayuda a crear frases legibles y gramaticalmente correctas, pero también significa que su elección de palabras no varía mucho.
Si un detector de contenido de IA puede predecir con precisión la elección y el orden de las palabras de un texto, el texto tiene una baja perplejidad, lo que sugiere que es generado por IA. Si no puede hacerlo, tiene una alta perplejidad y es más probable que sea escrito por un humano.
Impulsividad
Mientras que la perplejidad se centra en la elección de palabras, la impulsividad se centra en la estructura de las oraciones. Debido a que el PLN se basa en patrones y previsibilidad, la IA generativa favorece estructuras de oraciones simples y longitudes promedio. La escritura humana, en cambio, tiene una mayor impulsividad, es decir, más variación en la longitud y estructura de las oraciones.
Si los detectores de contenido de IA encuentran poca impulsividad y baja perplejidad, marcarán el texto como generado por IA con confianza. Poca impulsividad pero alta perplejidad, o viceversa, pueden activar una advertencia de IA, dependiendo de su extensión y del detector en cuestión.
¿Qué tan precisos son los detectores de contenido de IA?
Aunque el funcionamiento de los detectores de contenido de IA parece ser altamente preciso, no son tan precisos como podrías esperar. La empresa matriz de ChatGPT, OpenAI, ha señalado que los detectores de IA producen falsos positivos, especialmente cuando alguien está escribiendo en su segundo idioma.
La repetición de estructuras de oraciones y la elección predecible de palabras pueden ser comunes en el texto generado por IA, pero los humanos también cometen los mismos errores. Los escritores de primer nivel pueden tener oraciones más variadas y elecciones de palabras más floridas, pero muchas personas no. Además, los modelos de detección tienden a errar por precaución, lo que hace que estos falsos positivos sean aún más probables.
La perplejidad y la impulsividad no siempre capturan el contenido de IA. A medida que la IA generativa mejora, está superando estas limitaciones, y los usuarios pueden ajustar el contenido de IA para que suene más natural. Incluso los mejores detectores de IA no superan el 80% de precisión, y la mayoría no alcanza el 70%.
¿Por qué es importante la detección de contenido AI?
A pesar de estas limitaciones, cada vez es más importante detectar el contenido generado por AI. El problema va más allá de que las personas hagan trampas en la escuela o tomen atajos en el trabajo. Los ciberdelincuentes utilizan ChatGPT para crear correos electrónicos de phishing, por lo que mejores herramientas de detección podrían detener más delitos cibernéticos que los humanos no pueden detectar.
El contenido generado por AI también tiene implicancias significativas de plagio. Debido a que el aprendizaje automático solo puede parafrasear y resumir contenido existente, la originalidad de su producción es cuestionable en el mejor de los casos. En muchos casos, también se entrena con el trabajo de los creadores sin su conocimiento ni permiso. En consecuencia, el uso de AI generativa en ámbitos académicos o profesionales podría llevar a una violación masiva de derechos de autor.
Afortunadamente, las herramientas de detección de AI están mejorando. Muchos desarrolladores están trabajando en “marcas de agua” para modelos AI generativos que los humanos no pueden ver, pero otros sistemas de AI pueden detectar. Los investigadores encontraron que esta práctica puede revelar contenido AI con casi total certeza en pruebas iniciales. Si esta tecnología se vuelve estándar, facilitará mucho más la detección y la hará más confiable.
A medida que AI crece, también lo harán los detectores de contenido AI
La detección de contenido AI puede que no sea tan precisa como desearías hoy en día, pero sigue siendo impresionante. Además, seguirá mejorando a medida que avance la tecnología y surjan nuevas mejores prácticas. Hasta entonces, es importante tener en cuenta sus limitaciones.
El contenido generado por AI seguirá creciendo a partir de aquí, y la detección de AI crecerá junto con él. Si bien no son perfectas, estas herramientas son una parte fundamental para proteger la seguridad y la propiedad intelectual de las personas.
We will continue to update Zepes; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Científicos imprimen en 3D folículos pilosos en piel cultivada en laboratorio
- Pagaste $1,000 por un iPhone, pero Apple todavía lo controla
- Nueva herramienta para construir y reparar carreteras y puentes Inteligencia Artificial
- Por qué tu negocio debería utilizar IA generativa
- Ciencia de Datos El Pilar Moderno de la Economía
- ¿Quién rompió al constructor de OpenAI GPT y cómo?
- OpenAI GPTs Construyendo tu propia IA Conversacional impulsada por ChatGPT