Primeros 50 sesiones anunciadas para ODSC West 2023

50 primeras sesiones anunciadas para ODSC West 2023

¡ODSC West está a solo unos meses de distancia y no podríamos estar más emocionados de anunciar nuestras primeras 50 sesiones! No hay suficiente espacio en este blog para hablar de todas ellas, pero hemos destacado algunas a continuación. Puedes encontrar una lista completa de las primeras 50 sesiones aquí.

Un Sistema de Detección de Anomalías Semi-Supervisado a través del Algoritmo de Apilamiento de Conjuntos

Chuying Ma | Científico de Datos Senior | Walmart

Para abordar el complejo problema de la detección de anomalías en las actividades de los clientes para prevenir pérdidas y reducciones de inventario, este trabajo propone una arquitectura sistemática, flexible, extensible e integral de detección de anomalías para aumentar las etiquetas existentes y detectar anomalías con un bajo costo.

Esta sesión explorará cómo este nuevo sistema puede incorporar de manera flexible modelos de detección de anomalías basados en aprendizaje profundo o cualquier otro modelo de aprendizaje automático tradicional, y generar una puntuación de anomalía unificada mediante el algoritmo de apilamiento de conjuntos para abordar diferentes tipos de anomalías simultáneamente.

Personalización de los LLM con un Almacén de Características

Jim Dowling | CEO | Hopsworks

En esta sesión aprenderás cómo personalizar los LLM utilizando un almacén de características y la ingeniería de indicaciones. Recorrerás cómo construir una aplicación de LLM personalizada sin servidor de ejemplo utilizando Hopsworks, un almacén de características de código abierto con una base de datos vectorial integrada, y verás cómo construir plantillas para indicaciones, cómo completar las plantillas de indicaciones con datos de contexto en tiempo real, y cómo podemos incorporar documentos de bases de datos vectoriales en indicaciones utilizando una combinación de entrada del usuario y datos históricos del usuario provenientes del almacén de características.

¿Qué es una Base de Datos de Series Temporales y por qué la necesito?

Jeff Tao | Fundador y CEO | TDengine

Con la llegada de IoT y la nube, el volumen de datos de series temporales ha comenzado a crecer de manera exponencial de una manera sin precedentes, lo que representa un desafío importante para los sistemas de gestión de bases de datos generales como las bases de datos relacionales y NoSQL. Por otro lado, las bases de datos de series temporales diseñadas específicamente están optimizadas para manejar las características especiales de los datos de series temporales, lo que las hace más eficientes en términos de velocidad de ingestión, latencia de consulta y compresión de datos.

Técnicas de Evaluación para Modelos de Lenguaje Grandes

Rajiv Shah, PhD | Ingeniero de Aprendizaje Automático | Hugging Face

Seleccionar el LLM adecuado para tus necesidades se ha vuelto cada vez más complejo. Durante este tutorial, aprenderás sobre las herramientas prácticas y las mejores prácticas para evaluar y elegir LLMs.

Explorarás la investigación existente sobre las capacidades de los LLMs en comparación con los modelos pequeños tradicionales de aprendizaje automático, así como varias técnicas, incluyendo suites de evaluación como EleutherAI Harness, enfoques de competencia directa y el uso de LLMs para evaluar otros LLMs. Finalmente, abordarás factores sutiles que afectan la evaluación, incluyendo el papel de las indicaciones, la tokenización, los requisitos de precisión factual y los sesgos y la ética del modelo.

Comprendiendo el Paisaje de los Modelos Grandes

Lukas Biewald | CEO y Cofundador | Weights & Biases

Únete a esta sesión para explorar el paisaje actual de los modelos grandes desde GPT-3 hasta Stable Diffusion. También discutirás cómo los equipos detrás de algunos de los proyectos de código abierto están utilizando W&B para acelerar su trabajo.

Escalar tus Flujos de Trabajo de Ciencia de Datos Cambiando una Sola Línea de Código

Doris Lee | CEO y Cofundadora | Ponder

Herramientas como pandas y NumPy han permitido a los practicantes de todos los niveles trabajar eficientemente con datos, sin embargo, a medida que los practicantes buscan escalar sus flujos de trabajo a producción, estas herramientas presentan algunos desafíos. Esta sesión explorará las limitaciones de estas herramientas y los puntos problemáticos que encuentran los científicos de datos al trabajar con datos a escala. También cubrirás cómo el proyecto de código abierto Modin (10M+ descargas) aborda este problema al escalar sin problemas tu código de pandas con solo un cambio de una sola línea de código.

Solución de Problemas y Medición de la Deriva de la Incrustación/Vector para Implementaciones en Producción de Modelos de Lenguaje

Amber Roberts | Científica de Datos, Líder de Crecimiento | Arize AI

En esta presentación, Amber Roberts, Ingeniera de Aprendizaje Automático en Arize AI, presentará hallazgos de investigaciones sobre formas de medir la deriva de vectores/incrustaciones para modelos de imágenes y lenguaje. Con lecciones aprendidas de la prueba de diferentes enfoques (incluyendo la distancia euclidiana y coseno) en miles de millones de flujos y casos de uso, Roberts profundizará en cómo detectar si dos conjuntos de datos de lenguaje no estructurados son diferentes, y si es así, cómo entender esa diferencia utilizando técnicas como UMAP.

Democratizando el ajuste fino de modelos grandes de código abierto con optimización conjunta de sistemas

Kabir Nagrecha | Estudiante de doctorado | UC San Diego

Esta sesión proporcionará una visión general de las ideas principales detrás de Saturno, cómo funciona a nivel técnico para reducir los tiempos de ejecución y los costos, y el proceso de uso de Saturno para el ajuste fino de modelos grandes. Explorarás cómo Saturno puede acelerar y optimizar las cargas de trabajo de modelos grandes en solo unas pocas líneas de código, y describirás algunos casos de uso del mundo real de alto valor de la industria y la academia.

El aprendizaje automático se ha convertido en nigromancia

Mark Saroufim | Ingeniero en PyTorch | Meta

Se ha dicho mucho sobre cómo se logran los avances, pero no tanto sobre cómo se pierden. Esta charla explora la evolución y destrucción de la nigromancia y establece paralelismos con las regulaciones propuestas recientes en el aprendizaje automático.

Inscríbete aquí

Únete a nosotros en ODSC West del 30 de octubre al 2 de noviembre para tener la oportunidad de asistir a estas y muchas más sesiones de capacitación práctica, talleres y charlas. Además, al registrarte ahora, ahorrarás un 50% en cualquier pase presencial o virtual.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

West 2023

Was this article helpful?

93 out of 132 found this helpful

Primeros 50 sesiones anunciadas para ODSC West 2023

Was this article helpful?

Aprendizaje automático con datos de entrenamiento descentralizados utilizando aprendizaje federado en Amazon SageMaker

Los 6 principales casos de uso de GPT-4

Inteligencia Artificial

Este artículo de IA propone un método novedoso basado en gradientes llamado Cones para analizar e identificar las neuronas conceptuales en modelos de difusión

¿Estás utilizando la Generación Aumentada con Recuperación (RAG) para Biomedicina? Conoce a MedCPT Un Modelo Transformador Pre-entrenado Contrastivo para la Recuperación de Información Biomédica sin Necesidad de Datos de Entrenamiento

Principales bibliotecas de procesamiento de imágenes en Python

Biden emite orden ejecutiva de inteligencia artificial, requiriendo evaluaciones de seguridad, orientación de derechos civiles, investigación sobre el impacto en el mercado laboral

Una nueva investigación de aprendizaje profundo identifica un medicamento antipalúdico como posible tratamiento para la osteoporosis

Inteligencia Artificial y Cambio Climático