Arrastrar, soltar, analizar El surgimiento de la ciencia de datos sin código

Arrastrar, soltar, analizar El auge de la ciencia de datos sin programación

Uno de los desafíos que enfrentan los profesionales de datos es tener que codificar todo desde cero para cada nuevo caso de uso. Este proceso puede ser lento e ineficiente. Las soluciones sin código o con bajo código ayudan a los científicos de datos a crear soluciones reutilizables que se pueden aplicar a una amplia gama de casos de uso. Esto puede ahorrar tiempo y esfuerzo y mejorar la calidad de los proyectos de ciencia de datos.

Puedes hacer casi todo en ciencia de datos sin escribir una sola línea de código. “Las soluciones sin código o con bajo código son el futuro de la ciencia de datos”, comentó Ingo Mierswa, VP principal de Desarrollo de Productos en Altair y fundador de RapidMiner, una plataforma de ciencia de datos. Como inventor establecido en el campo de la ciencia de datos sin código, su experiencia y contribuciones han influido en la adopción e implementación de estas funcionalidades en la industria. “Estas funcionalidades”, Mierswa declaró durante nuestra entrevista, “hacen posible que personas sin mucha experiencia en programación puedan construir e implementar modelos de ciencia de datos. Esto puede ayudar a democratizar la ciencia de datos y hacerla más accesible para todos.”

“Cuando me encontré siendo un científico de la computación, no había una plataforma sin código o con bajo código disponible, así que recreé soluciones muy similares para cada nuevo caso de uso. Fue un proceso ineficiente que parecía una enorme pérdida de tiempo”, compartió Miesrwa. Siguiendo con lo básico, afirmó: “Si resuelves un problema por segunda vez y sigues codificando, significa que no lo resolviste correctamente la primera vez. Deberías haber creado una solución que se pueda reutilizar para resolver los mismos o similares problemas una y otra vez.” Según Miesrwa, “a menudo las personas no se dan cuenta de que sus problemas son similares, y como resultado, acaban codificando lo mismo repetidamente. Deberían preguntarse: ‘¿Por qué sigo codificando?’ Tal vez no deberían hacerlo para ahorrar tiempo y esfuerzo.”

Aceleración Diversa

Las soluciones de ciencia de datos sin código o con bajo código pueden ser muy gratificantes. “El primer y más importante beneficio es que pueden llevar a formas mejores de colaboración”, enfatiza Miesrwa. “Todos pueden entender flujos de trabajo o modelos visuales si se explican, sin embargo, no todos son científicos de la computación o programadores, y no todos pueden entender código”. Entonces, para colaborar eficazmente, debes comprender qué activos está produciendo el equipo de manera colectiva. “La ciencia de datos es, al fin y al cabo, un deporte en equipo. Necesitas personas que entiendan los problemas comerciales, independientemente de si pueden programar o no, ya que la programación puede no ser su actividad diaria.”

Luego tienes a otras personas que tienen acceso a los datos, que están saturadas de pensamiento computacional, que piensan así: “Bueno, si quiero construir, por ejemplo, un modelo de aprendizaje automático, necesito transformar mis datos de una manera específica”. Esa es una gran habilidad, y también necesitan colaborar, pero nuevamente, para habilidades como esa, sabemos que los productos de ETL han estado disponibles desde hace mucho tiempo. “Sí, en casos raros, en situaciones especiales y muy personalizadas, todavía necesitas codificar. Incluso en esas situaciones, es la excepción del uno por ciento”, señaló Miesrwa. “No debería ser lo normal, pero la verdadera magia sucede cuando se unen todas las habilidades diferentes, los datos, las personas y la experiencia.”

“Nunca verás eso con un enfoque puramente basado en código. Nunca obtendrás la aceptación de los interesados. Eso a menudo conduce a lo que yo llamo proyectos muertos. Deberíamos tratar la ciencia de datos como una solución para problemas. No deberíamos tratarla como un enfoque científico, donde no importa si realmente creamos una solución o no”, razonó Miesrwa. “Importa. Estamos resolviendo problemas comerciales de millones de dólares aquí. Deberíamos trabajar hacia la solución funcional, obtener la aceptación, implementarla y realmente mejorar nuestra situación aquí. No decir: ‘Sí, sé que si falla, no me importa’. Así que la colaboración es un gran beneficio”, afirmó.

Otro beneficio es la aceleración, explica Miesrwa. Cuando realizas tareas repetitivas codificando, no estás trabajando de la manera más rápida posible. Si creo, por ejemplo, un flujo de trabajo en RapidMiner que consiste en cinco o diez operadores, eso a menudo equivale a miles de líneas de código. Copiar y pegar código puede ralentizarte, pero las plataformas de bajo código pueden ayudarte a crear soluciones personalizadas más rápidamente.

La responsabilidad, a menudo pasada por alto fácilmente, es el beneficio más importante. Cuando creas una solución basada en código, puede ser difícil rastrear quién hizo cambios y por qué. “Esto puede causar problemas cuando alguien más necesita encargarse del proyecto o cuando hay un error en el código. Por otro lado, las plataformas de bajo código se auto-documentan. Esto significa que los flujos de trabajo visuales que creas también están acompañados de documentación que explica lo que hace el flujo de trabajo.” Esto hace que sea más fácil entender y mantener el código, y también ayuda a asegurar la responsabilidad “, dijo Miesrwa. “Las personas lo comprenden. Se adhieren a esto, pero también pueden apropiarse de esos resultados. Colectivamente, como equipo.”

Ecosistema abierto

La avalancha de avances en IA está transformando el panorama de ciencia de datos, y las empresas que desean mantenerse a la vanguardia son abiertas, utilizando software de código abierto y estándares abiertos, y no ocultan nada que sea muy importante en el mercado de la ciencia de datos.

Las empresas que se han mantenido abiertas han tenido una posición ganadora porque el mercado se mueve rápidamente y requiere una iteración constante. “Esto es cierto para el mercado general de la ciencia de datos en los últimos 10 o 20 años”, reflexionó Miesrwa, “la naturaleza acelerada del mercado requiere una iteración constante, por lo que es extremadamente imprudente cerrar el ecosistema. Esto es parte de por qué algunas empresas que tradicionalmente han estado cerradas se han abierto e incluso han adoptado un enfoque neutral en cuanto a proveedores para admitir más lenguajes de programación e integraciones”.

Aunque el enfoque opcional de código permite a los investigadores realizar tareas complejas de análisis de datos sin escribir una sola línea de código, existen situaciones en las que la codificación puede ser necesaria. En tales casos, la mayoría de las plataformas de bajo código se integran con lenguajes de programación, bibliotecas de aprendizaje automático e entornos de aprendizaje profundo. También ofrecen a los usuarios la capacidad de explorar el mercado para soluciones de terceros, especificó Miesrwa. “RapidMiner incluso proporciona un marco de operadores que permite a los usuarios crear sus propios flujos de trabajo visuales. Este marco operativo facilita la ampliación y reutilización de flujos de trabajo, brindando un enfoque flexible y personalizado para el análisis de datos.”

El camino por delante

Altair, un líder en ciencia computacional e IA, realizó una encuesta que reveló la adopción generalizada de estrategias de datos e IA en organizaciones de todo el mundo.

La investigación, que involucró a más de 2,000 profesionales de diversas industrias y 10 países diferentes, reveló una tasa significativa de fracaso (que oscila entre el 36% y el 56%) en proyectos de IA y análisis de datos cuando hay fricción entre diferentes departamentos dentro de una organización.

El estudio identificó tres fuentes principales de fricción que dificultan el éxito de los proyectos de datos e IA: fricción organizacional, tecnológica y financiera.

La fricción organizacional surge de los desafíos para encontrar personas calificadas que ocupen roles de ciencia de datos y de la falta de conocimiento en IA entre la fuerza laboral.
La fricción tecnológica proviene de las limitaciones en la velocidad de procesamiento de datos y problemas con la calidad de los datos.
La fricción financiera es causada por restricciones de financiamiento, el enfoque en los costos iniciales por parte de la dirección y la percepción de altos costos de implementación.

James R. Scapa, fundador y CEO de Altair, en el comunicado de prensa resaltó la importancia de que las organizaciones aprovechen sus datos como un activo estratégico para obtener una ventaja competitiva.

La fricción paraliza proyectos críticos para la misión. Para superar estos desafíos y lograr lo que Altair denomina ‘IA sin fricciones’, las empresas deben adoptar herramientas de análisis de datos de autoservicio. Estas herramientas», enfatiza Scapa, “permiten a los usuarios no técnicos navegar fácilmente y de manera rentable por sistemas tecnológicos complejos, eliminando la fricción que obstaculiza el progreso”.

También reconoció que existen obstáculos en forma de personas, tecnología e inversión, que impiden que las organizaciones aprovechen de manera efectiva los conocimientos basados en datos. Y al cerrar las brechas de habilidades, las organizaciones pueden ayudar a construir un conocimiento sólido entre los equipos multidisciplinarios para superar la fricción.

[Saqib Jan](https://www.linkedin.com/in/s-jan/) es un escritor y analista de tecnología con pasión por la ciencia de datos, la automatización y la computación en la nube.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Data Science

Was this article helpful?

93 out of 132 found this helpful

Arrastrar, soltar, analizar El surgimiento de la ciencia de datos sin código

Aceleración Diversa

Ecosistema abierto

El camino por delante

Was this article helpful?

7 Pasos para Utilizar el Análisis Predictivo para Identificar Proyectos Prometedores en la Financiación de Subvenciones

El CEO de Boomi esboza la visión para la plataforma de integración y automatización

Inteligencia Artificial

Esta investigación de IA de China presenta a Character-LLM que enseña a los LLM a actuar como personas específicas como Beethoven, la reina Cleopatra, Julio César, etc.

Deci presenta DeciCoder un modelo de lenguaje grande de código abierto con 1 billón de parámetros para generación de código.

Mejorando el razonamiento en modelos de lenguaje grandes Descubre el marco de Hypotheses-to-Theories (HtT) para un aprendizaje preciso y transferible basado en reglas.

Procyon Photonics La startup dirigida por estudiantes de secundaria que podría revolucionar la informática

Comprendiendo el Lado Oscuro de los Modelos de Lenguaje Grandes Una Guía Completa sobre Amenazas de Seguridad y Vulnerabilidades

Apple y Google pasan por alto ChatGPT como la aplicación del año