Search Results unsplash

Creando visualizaciones dinámicas de coropletas utilizando Plotly

La visualización de datos es un paso que los científicos de datos a menudo pasan por alto. Nos ayuda a contar historias analizando y…

¡Vamos a explorar el aprendizaje por transferencia…

Hay muchas definiciones que describen el aprendizaje por transferencia. Básicamente, implica utilizar el conocimiento de modelos pre-entrenados para resolver nuevos problemas. Hay numerosos beneficios…

¿Cuántos datos necesitamos? Equilibrando el aprendizaje automático con consideraciones de seguridad

Para un científico de datos, no existe tal cosa como demasiados datos. Pero cuando miramos de manera más amplia el contexto organizacional, tenemos que…

El Embudo de Datos No Estructurados

Los datos no estructurados adoptan formas diversas. Por lo general, están llenos de texto, pero también pueden contener datos como fechas, números y diccionarios.…

Construyendo un Resumidor de Texto TFIDF de Plataforma Cruzada en Rust

Las herramientas y utilidades de NLP han crecido en gran medida en el ecosistema de Python, permitiendo a los desarrolladores de todos los niveles…

Modelos de Lenguaje Grandes y Bases de Datos Vectoriales para Recomendaciones de Noticias

Los modelos de lenguaje grandes (LLMs) generaron un gran revuelo a nivel mundial en la comunidad de aprendizaje automático con los recientes lanzamientos de…

Lo mejor de TDS en 2023 sobre ChatGPT y LLMs

Podrías decir que 2023 fue un año lleno de acontecimientos para los científicos de datos y los profesionales de aprendizaje automático, pero eso no…

Cómo mejorar tus resultados de ChatGPT utilizando parámetros de configuración

Recientemente he estado leyendo un libro muy interesante de David Clinton, titulado La Guía Completa Obsoleta para la Inteligencia Artificial Generativa, publicado por Manning…

Búsqueda de Haz el algoritmo más utilizado en modelos de secuencia

Imagina que eres un modelo de lenguaje de IA, como ChatGPT, completando una frase. ¿Cómo eliges la siguiente palabra para que no solo sea…

¿Ayuda el ensacado a prevenir el sobreajuste en los árboles de decisión?

Los árboles de decisión son una clase de algoritmos de aprendizaje automático bien conocidos por su capacidad para resolver tanto problemas de clasificación como…

3 operaciones de Python para resolver eficientemente tareas específicas de procesamiento de datos

Los datos en bruto que te llegan casi siempre son diferentes al formato preferido o requerido. Tu flujo de trabajo comienza al obtener los…

¡No cometas el mismo error que cometí en un proyecto de aprendizaje automático!

Mi viaje comenzó cuando empecé a aprender los fundamentos del aprendizaje automático en la universidad, solía hacer muchos proyectos para tener una comprensión profunda…

Mejores funciones de manipulación de datos en PySpark

Trabajo con PySpark en Databricks a diario. Mi trabajo como científico de datos requiere que maneje grandes cantidades de datos en muchas tablas diferentes.…

Streaming en Ingeniería de Datos

El streaming es uno de los patrones de diseño de canalización de datos más populares. Utilizar un evento como un único punto de datos…

Rastreando la memoria de la sesión de Python usando Tracemem

Tracemem es una herramienta ligera de perfilado en Python que te permite medir el uso completo de la memoria de una sesión de Python…

Valentía para aprender ML Desmitificando la regularización L1 y L2 (parte 4)

Bienvenidos de nuevo a 'Courage to Learn ML Desentrañando la Regularización L1 y L2', en su cuarta publicación. La última vez, nuestra pareja de…

Altruismo de Datos El Combustible Digital para los Motores Corporativos

La economía digital se ha construido sobre la maravillosa promesa de acceso igualitario, rápido y gratuito al conocimiento y la información. Ha pasado mucho…

Conoce a Gemini el modelo de IA más grande y poderoso de Google

Cuando OpenAI lanzó ChatGPT en noviembre pasado, había una pregunta apremiante en la mente de todos ¿qué están haciendo los gigantes tecnológicos? Según el…

¡La Bendición de la Dimensionalidad?! (Parte 1)

Creemos que se puede lograr un gran avance en uno o más de estos problemas si un grupo cuidadosamente seleccionado de científicos trabaja en…

Referencia de Benchmark temporal

En los últimos años, se han realizado avances significativos en el aprendizaje automático en grafos estáticos, acelerados por la disponibilidad de conjuntos de datos…

Ciencia de datos del entretenimiento Streaming vs. Cine

En mi próximo artículo sobre data science en el campo del entretenimiento en Toward Data Science, me refiero a cómo se puede aplicar la…

Optimización de la simulación Ayudando a mi amigo a modelar y optimizar el servicio de atención al cliente de su empresa.

Comenzó como una solicitud bastante simple. Mi amigo, que ayuda a dirigir y operar un centro de soporte, estaba teniendo algunos problemas. En cualquier…

Learn more about Search Results unsplash