Entrevista del 30 aniversario de VoAGI con el fundador Gregory Piatetsky-Shapiro

¡Feliz aniversario VoAGI!

Este sitio web, el mismo que estás leyendo en este momento, comenzó hace 30 años como un modesto boletín informativo y desde entonces se ha convertido en uno de los recursos de ciencia de datos más antiguos y duraderos disponibles en la actualidad. Estamos celebrando este logro durante todo el mes, comenzando de manera bastante apropiada compartiendo nuestra reciente entrevista con el fundador de VoAGI, Gregory Piatetsky-Shapiro.

Gregory es el cerebro detrás de VoAGI y dirigió el sitio durante más de 28 años, hasta hace muy poco. Conocido por acuñar el término “descubrimiento de conocimiento en bases de datos” y por fundar la serie de conferencias KDD, Gregory comenzó el boletín Knowledge Discovery Nuggets (VoAGI) en 1993 para conectar a los investigadores en los campos de la minería de datos y el descubrimiento de conocimiento. Hasta su jubilación en 2022, VoAGI se convirtió en una publicación influyente en ciencia de datos, aprendizaje automático, inteligencia artificial y análisis bajo el liderazgo de Gregory.

Aunque está disfrutando de su merecido retiro, logramos persuadirlo para que regresara a la refriega y tuviera una discusión amplia sobre la historia de VoAGI, su estado actual, el futuro e incluso algunos recuerdos.

Las preguntas para esta entrevista fueron formuladas por los editores de VoAGI Matthew Mayo, Abid Ali Awan y Nisha Arya. El editor que formula cada pregunta se indica en el camino.

VoAGI: ¡Feliz 30 aniversario, Gregory! Para las pocas personas que no te conocen, ¿puedes darnos una versión resumida de 30,000 pies? (preguntado por Matthew)

Gregory: ¡Matt, gracias y un placer trabajar contigo y escribir para VoAGI de nuevo!

Probablemente soy más conocido como el fundador de VoAGI, esta publicación, y como co-fundador de las conferencias KDD, una conferencia líder en ciencia de datos y minería de datos. Comencé mi carrera científica como investigador en IA y bases de datos; mi tesis de doctorado en 1984 fue sobre el tema de los sistemas de bases de datos autoorganizadores. Luego trabajé durante una docena de años en los Laboratorios GTE en el área de Boston, haciendo investigación y construyendo sistemas aplicados en la intersección de la IA y las bases de datos. En 1989 comencé el primer proyecto en el mundo llamado “Descubrimiento de Conocimiento en Bases de Datos”. Nuestro proyecto produjo aplicaciones interesantes para la atención médica (sistema KEFIR), detección de fraudes, predicción de la rotación de clientes y otras áreas.

En 1997, la burbuja de las punto com estaba en sus etapas iniciales y dejé GTE para unirme a una startup que estaba aplicando la minería de datos al ámbito financiero. Trabajamos con algunos de los bancos e compañías de seguros más grandes del mundo, desarrollando modelos para la segmentación de clientes, la rotación, la venta cruzada, y demás. En 2000, la primera startup fue comprada por una startup más grande por $50 millones, pero antes de que cualquiera de nosotros pudiera hacer efectivas nuestras opciones de acciones, la burbuja punto com estalló y la segunda startup quebró. El valor de todas las opciones de acciones ganadas con tanto esfuerzo fue cero.

Gregory Piatetsky-Shapiro acuñó el término “descubrimiento de conocimiento en bases de datos” para el primer taller sobre el mismo tema (KDD-1989) y este término se volvió más popular en las comunidades de IA y aprendizaje automático. Sin embargo, el término minería de datos se hizo más popular en las comunidades empresariales y periodísticas. Actualmente, los términos minería de datos y descubrimiento de conocimiento se utilizan indistintamente. – Entrada de Wikipedia sobre “Minería de datos”

Así que, en 2001 decidí emprender mi propio camino, publicando VoAGI y dedicándome a la consultoría.

He realizado una gran variedad de proyectos de consultoría interesantes, desde la búsqueda de biomarcadores para el Alzheimer hasta la detección de joyas falsificadas en eBay y el análisis del uso de software. Pero a medida que VoAGI se volvió más popular, demandó más tiempo, así que dejé de hacer consultorías y me enfoqué en VoAGI a tiempo completo.

Con la ciencia de datos y el aprendizaje automático convirtiéndose en campos populares alrededor de 2012 (como lo demuestra el artículo, entre muchos, titulado “Científico de datos: el trabajo más sexy del siglo XXI”), VoAGI creció significativamente y obtuvo un amplio reconocimiento en la industria. VoAGI fue nombrado frecuentemente entre las principales publicaciones en IA, big data, ciencia de datos y aprendizaje automático (ver aquí para más detalles).

Fue un gran honor ser nombrado la voz principal de LinkedIn en ciencia de datos y análisis en 2018.

Por supuesto, cualquier éxito que haya logrado con VoAGI es compartido con muchas otras personas que me ayudaron y trabajaron conmigo en el camino. No puedo nombrar a todos, pero quiero mencionar especialmente a Chris Matheus y Michael Beddows, quienes trabajaron conmigo en los primeros días del sitio web de VoAGI en GTE; Usama Fayyad, Sam Uthurusamy y Won Kim, con quienes trabajé en las conferencias y organización de KDD; y Anmol Rajpurohit por ayudar con VoAGI en 2013-15.

Finalmente, y lo más importante, Matthew Mayo se unió al equipo de VoAGI en 2016 y ayudó a VoAGI a alcanzar su éxito actual, y ha asumido el liderazgo desde mi retiro en 2022.

¿Puedes hablarnos sobre la inspiración detrás de empezar tu publicación? (Nisha)

En 1989 organicé el primer taller sobre Descubrimiento de Conocimiento en Bases de Datos en IJCAI-89. Ese taller se repitió en 1991 y 1993, y en julio de 1993, para conectar a los investigadores que trabajaban en esta área, comencé un boletín que entonces llamé “Knowledge Discovery Nuggets” (“Nuggets de Descubrimiento de Conocimiento”). Utilicé el término “descubrimiento de conocimiento” porque el término “minería de datos” utilizado en ese momento parecía impreciso, no estaba claro para qué estábamos haciendo minería. “Nuggets” porque publicamos principalmente artículos cortos pero relevantes e interesantes. Piensa en “pepitas de oro” encontradas en el mineral de los datos.

El taller se convirtió en una conferencia KDD-95 en 1995 (organizada hábilmente por Usama Fayyad y Sam Ramaswamy) y las conferencias KDD han estado en marcha desde entonces como la conferencia principal de ciencia de datos en el mundo. Fui presidente de la organización ACM KDD desde 2005 hasta 2009 y formé parte del comité ejecutivo de KDD hasta 2013.

El primer número de VoAGI se envió a aproximadamente 50 investigadores que asistieron al taller KDD-93. La cantidad de información en esta área estaba creciendo, y como organizador del taller estaba en una buena posición para recopilarla y organizarla. En 1994, poco después de la aparición de la World Wide Web, comenzamos lo que entonces era el segundo sitio en el mundo sobre minería de datos y descubrimiento de conocimiento. Se llamaba “Knowledge Discovery Mine” pero residía en el dominio de GTE Labs y ya no está disponible.

Cuando dejé GTE Labs en 1997, copié la información a un nuevo sitio web llamado VoAGI, abreviatura de “Knowledge Discovery Nuggets”. ¡Este sitio web todavía existe hoy… y tú lo estás leyendo!

¿Sientes que has logrado tu objetivo con VoAGI? (Nisha)

¡El objetivo es el viaje!

Pero el éxito y la longevidad de VoAGI han superado con creces mis expectativas.

Mi objetivo inicial al crear el boletín VoAGI era conectar a los investigadores que trabajan en esta área con más frecuencia que en un taller anual. Mi objetivo para el primer sitio web conectado a VoAGI, creado en 1994 en GTE Labs y llamado “Knowledge Discovery Mine”, era principalmente organizar la información existente sobre minería de datos, principalmente software y conjuntos de datos, y ponerla a disposición de todos. Esas dos secciones, “Software” y “Datasets”, fueron las secciones más populares durante muchos años.

En la década de 1990, VoAGI tenía un directorio muy completo de software, conjuntos de datos, reuniones y otra información relevante disponible en ese momento, por lo que era un recurso muy útil.

A medida que el campo creció, se volvió imposible mantener un directorio seleccionado a mano de cosas relacionadas con la minería de datos y la ciencia de datos, y VoAGI se enfocó en contenido práctico y educativo, y más en lo que era útil para los profesionales. También tuvimos la suerte de estar en el momento adecuado, ya que el interés en la minería de datos y la ciencia de datos creció de manera espectacular en los años 2010 y 2020. Como resultado, el número de suscriptores y visitantes del sitio web aumentó significativamente.

¿Sientes que VoAGI tuvo un impacto positivo en el campo de los datos en el camino? (Abid)

¡Espero que sí! En los primeros días, el boletín y el sitio web de VoAGI fueron recursos útiles para conectar a la comunidad de investigación, y más tarde fue un recurso educativo útil para los profesionales y científicos de datos en las primeras etapas de su carrera.

A algunos de nuestros lectores realmente les gustó VoAGI, como se muestra en esta caricatura:

¿Cuál crees que es el avance más importante en la ciencia de datos que ha surgido durante tu carrera en la publicación? (Matt)

Claramente, el aprendizaje profundo. Aunque la investigación en redes neuronales se había llevado a cabo desde la década de 1960, el gran avance fue el enfoque de aprendizaje profundo, desarrollado principalmente por Geoff Hinton, Yann LeCun y Yoshua Bengio a principios de la década de 2000. El primer éxito notable del aprendizaje profundo generalmente se remonta a octubre de 2012, cuando AlexNet, creado por Geoff Hinton y sus estudiantes, ganó la competencia ImageNet con una ventaja sin precedentes.

Posteriormente, muchos investigadores y profesionales comenzaron a utilizar el aprendizaje profundo y VoAGI comenzó a cubrirlo. El aprendizaje profundo ya era el tema principal de noticias de VoAGI en diciembre de 2012.

El aprendizaje profundo y todas las tecnologías derivadas posteriores, como ChatGPT, siguen siendo uno de los temas más populares en la actualidad.

¿Qué fue lo más importante para ti mientras trabajabas en VoAGI (por ejemplo: dinero, experiencia o difusión del conocimiento)? (Abid)

Por supuesto, el dinero era importante, ya que era autónomo desde 2001 y tenía que mantener a mi familia y pagar la hipoteca, pero no era lo más importante. Probablemente, la motivación principal para mí cuando comencé VoAGI fue construir una comunidad e interactuar con personas inteligentes. Desde 1993 hasta 2000, dirigí el boletín y el sitio web de VoAGI sin obtener ningún ingreso o anuncios, como un servicio voluntario para la comunidad. Dirigir VoAGI era un complemento natural de ayudar a organizar talleres y conferencias de KDD, una actividad voluntaria no remunerada pero muy gratificante.

Creo que VoAGI desempeñó un papel positivo en la difusión del conocimiento de la minería de datos y la ciencia de datos, como lo demuestran el gran número de visitantes y suscriptores.

¿Cómo te aseguraste de que VoAGI se destacara en el competitivo panorama de los medios de comunicación? (Nisha)

No hay una fórmula mágica. Esto requería, ante todo, mucho trabajo duro. Pero si tuviera que encontrar algunos “nuggets” del éxito duradero de VoAGI, eso sería contenido de calidad, sinergia y atención.

En primer lugar, nos esforzamos por encontrar o escribir contenido de buena calidad. En segundo lugar, confiamos en la sinergia positiva entre diferentes canales: los correos electrónicos ayudaban a atraer visitantes al sitio y el sitio ayudaba a obtener más suscriptores de correo electrónico. La exitosa presencia de VoAGI en Twitter (ahora X), LinkedIn y Facebook también se reforzaban mutuamente.

Por último, la atención. Prestaba mucha atención tanto al comportamiento interno del sitio, modificándolo periódicamente para mejorar las métricas importantes, como a las tendencias externas, adaptando nuestro contenido a lo que era interesante y relevante en el campo.

¿Puedes compartir una historia especialmente impactante o memorable que VoAGI haya cubierto desde el principio y el efecto que tuvo? (Nisha)

Una historia temprana de la década de 1990 fue sobre los niños en adopción. Una de las cosas útiles que hizo VoAGI fue publicar consultas de investigadores, y alrededor de 1995, una persona publicó una consulta sobre su problema al trabajar en una base de datos de pagos para niños en adopción. Había muchos nombres que estaban escritos ligeramente diferentes y para hacer los pagos a la persona correcta, era necesario unificar las diferentes formas de escribirlos. Otro investigador vio esa consulta en VoAGI y pudo aplicar su algoritmo de coincidencia de nombres para resolver el problema de los niños en adopción. Esto ayudó a que más niños recibieran pagos y mejoró sus vidas.

Aunque te has alejado, ¿dónde te gustaría ver a VoAGI en los próximos 10 años? (Nisha)

¡Espero que todavía tenga contenido escrito por humanos y lectores humanos!

¿Cómo te sientes acerca de que la IA eventualmente se haga cargo de la creación de contenido? (Abid)

Por un lado, me siento muy emocionado de que las historias de ciencia ficción sobre IA y robots que leía de niño estén cerca de hacerse realidad, y en algunos casos, la realidad ya supera la ciencia ficción. Por otro lado, me entristece por los creadores de contenido humanos.

Las redes sociales ya han mostrado los peligros de optimizar para la atención, y la IA es extremadamente buena en la optimización. Puedo imaginar que en unos años (o incluso meses), la IA será excelente en la creación de contenido adictivo que muchas personas querrían ver sin parar.

Tal vez la IA ya esté generando mucho contenido en TikTok.

Pero, ¿es bueno para la sociedad que tantas personas se vuelvan adictas a una droga digital?

La promesa y la amenaza de la IA son, por supuesto, mucho más amplias que la creación de contenido: la IA puede potencialmente hacerse cargo de la mayoría de los empleos.

A corto plazo, creo que habrá un período de colaboración, cuando humanos + IA puedan hacerlo mejor en muchas tareas que los humanos o la IA solos. Tomando el ajedrez como ejemplo, después de que Deep Blue derrotara al campeón mundial Garry Kasparov en 1997, hubo torneos en los que los equipos formados por humanos + computadoras obtuvieron mejores resultados que las computadoras o los humanos. Sin embargo, ese período fue corto y ahora los mejores programas de ajedrez son mucho, mucho mejores que incluso el campeón mundial.

A largo plazo, estoy muy preocupado por las pérdidas de empleo causadas por la IA y el aumento de la desigualdad de ingresos, lo que puede desestabilizar las sociedades y destruir las democracias. Esto no ocurrirá este año, pero las tendencias tecnológicas actuales apuntan hacia estos escenarios. Una posible solución a largo plazo para el desempleo causado por la IA podría ser alguna forma de ingreso básico universal y centrarse en desarrollar la creatividad humana.

Adoptar una solución como esta será difícil y requerirá activismo político y participación cívica, así que si tú, el lector, estás preocupado/a por los riesgos de la IA, ¡entonces aprende sobre ello, involúcrate y vota!

¡Gracias, Gregory! Apreciamos tu participación en esto, y celebrar un hito tan importante para VoAGI no sería lo mismo sin ella.

Matthew Mayo (@mattmayo13) tiene una maestría en ciencias de la computación y un diploma de posgrado en minería de datos. Como Editor en Jefe de VoAGI, Matthew tiene como objetivo hacer que los conceptos complejos de ciencia de datos sean accesibles. Sus intereses profesionales incluyen procesamiento de lenguaje natural, algoritmos de aprendizaje automático y explorar la IA emergente. Su motivación es democratizar el conocimiento en la comunidad de ciencia de datos. Matthew ha estado programando desde los 6 años de edad.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

news

Was this article helpful?

93 out of 132 found this helpful

Entrevista del 30 aniversario de VoAGI con el fundador Gregory Piatetsky-Shapiro

Was this article helpful?

¡Feliz 30º Aniversario VoAGI!

¿Quién necesita editores de fotos?! – Tutorial masivo de manipulación de imágenes en Python

Inteligencia Artificial

Conoce Jupyter AI Desatando el poder de la inteligencia artificial en los cuadernos de Jupyter

Encontrar respuestas (sobre la mejor manera de encontrar respuestas)

Acelerando la llegada de la energía de fusión con IA y accesibilidad

Las gafas transcriben el habla en tiempo real

Después de Amazon, una ambición por acelerar la fabricación estadounidense.

AI Modelos de Lenguaje y Visión de Gran Escala