Día de Desarrollo de OpenAI 2023 ¡Cuatro importantes anuncios de la presentación principal del fundador Sam Altman que no puedes perderte!

Día de Desarrollo de OpenAI 2023 ¡Cuatro anuncios clave de la presentación principal del fundador Sam Altman que no te puedes perder!

Desde las actualizaciones hasta ChatGPT, la introducción de GPT-4 Turbo, GPTs personalizados y GPT store, API de Asistentes, precios revisados para los modelos, mejoras en la llamada de funciones, recuperación incorporada y más.

La primera conferencia para desarrolladores de OpenAI estuvo repleta de impresionantes anuncios de productos. ¿Y sabes qué es aún más interesante?

Estos anuncios harán que un montón de startups de IA sean obsoletas por completo. En cricket, lo llamamos “lanzamiento limpio”.

Eliminar tantas startups de IA y su propuesta de valor en una presentación de una hora. ¿No es eso un sueño? ¡O un sueño pesadilla, me atrevería a decir!

Sumérgete para conocer más sobre los anuncios de productos y mis opiniones picantes!!!

1. GPT-4 Turbo

Ventana de contexto ampliada

  • Con una ventana de contexto ampliada de 128k, conocimiento actualizado hasta abril de 2023 y la capacidad de navegar por la web, puede adaptar 300 páginas de un libro de texto estándar en una sola solicitud. Para una rápida comparación, GPT-4 admitía una ventana de contexto de 8k. ¡De 8k a 128k, esto es enorme!

Modo JSON en las respuestas del modelo

  • Puedes habilitar el modo JSON para solicitar que el modelo devuelva una respuesta en formato JSON e invocar fácilmente la API de aplicaciones externas. No más intentos de ingeniería para que el modelo responda con fragmentos JSON y ninguna otra palabra.
  • Puedes invocar múltiples funciones desde una sola solicitud.
  • Accede a las salidas del modelo reproducibles configurando un parámetro de semilla.
  • También puedes ver las probabilidades de registro de todos los tokens en una respuesta desde la API.

Capacidades multimodales

  • DALL-E 3 puede generar imágenes de forma programática
  • GPT-4 Turbo con Visión puede aceptar imágenes como entradas a través de la API
  • TTS Audio API que proporciona un punto final de conversión de texto a voz con 6 voces incorporadas. Y suena muy natural
  • Se anunció Whisper V3, el modelo de reconocimiento automático de voz de código abierto. Estará disponible próximamente en la API, dijo Altman.

Ajuste fino del modelo

  • El ajuste fino del modelo de base es tanto un arte como una ciencia. ¿O debería decir que es brujería?
  • El equipo de OpenAI trabajará con empresas para ayudarles a ajustar finamente los modelos GPT para dominios y conjuntos de datos específicos.
  • El acceso experimental al ajuste fino de GPT-4 también está disponible. Regístrate si estás interesado en probarlo.
  • OpenAI duplicó los tokens por minuto para todos los usuarios de GPT-4
  • El escudo de derechos de autor protege a los clientes de GPT-4 en el aspecto legal si se encuentran con problemas de derechos de autor debido al uso de los modelos GPT. Si bien las libertades creativas de los artistas y las leyes de derechos de autor necesitan una revisión gracias a la IA, esta es una toma interesante y veremos cómo evoluciona a medida que el campo madura

Precios

  • Aparentemente, GPT-4 Turbo será, en promedio, un 2.75 veces más barato, lo que anima a los usuarios a utilizar este modelo en lugar de los anteriores.

2. Actualizaciones en chatGPT

  • chatGPT ahora utiliza GPT-4 Turbo
  • Puede navegar por la web a través de Bing.
  • Cuando estés chateando, no necesitas seleccionar el modelo utilizando el menú desplegable. Basado en la entrada de la solicitud, chatGPT sabe qué modelo invocar y cuándo.

3. GPTs y la tienda GPT

  • Los GPTs son versiones personalizadas de chatGPT para diferentes dominios y casos de uso.
  • Estos son la evolución de los complementos de chatGPT. Puedes construir una versión personalizada de chatGPT con instrucciones, recuperación de conocimiento expandida y acciones.
  • El equipo de OpenAI se despertó y eligió la violencia. Quiero decir, no en el sentido literal. ¿O tal vez sí? ¿Cuántas startups cerraron hoy? ¿Deberíamos llevar la cuenta?
  • La ingeniería de solicitudes, la generación con ampliación de recuperación y la construcción de aplicaciones de IA mediante la concatenación de diferentes llamadas de API utilizando LangChain u bibliotecas similares fueron los enfoques más populares para construir aplicaciones de IA.

Con la recuperación de conocimiento expandida, una función de llamada mejorada y la API de Asistentes de OpenAI, una serie de herramientas en la llamada “pila LLM” han perdido por completo su propuesta de valor. ¡La velocidad a la que se mueve la industria, inimaginable! ¡¡¡Da bastante miedo y a la vez es emocionante!!

  • GPT Builder te permite escribir solicitudes en lenguaje natural para generar GPTs personalizados para ti. No más ingeniería de solicitudes, tratar con incrustaciones y bases de datos vectoriales, escribir código para crear una experiencia similar a la de un chatbot.
  • Un agente de IA crea múltiples agentes de IA. Al parecer, estamos en camino de construir una fábrica de IA jaja.
  • TutorGPT, WriterGPT, ResumeGPT, ThisGPT, ThatGPT y todas las demás herramientas que eran envoltorios de GPT ahora se pueden crear con lenguaje natural. ¡Increíble, ¿verdad?!

Tienda GPT

  • Después de construir los GPTs personalizados, puedes publicarlos para que las personas los utilicen en la tienda GPT. Es un mercado en línea para diferentes aplicaciones y sería un gran recurso para las empresas que no tienen expertos en IA para crear soluciones personalizadas para ellas.
  • Esto facilitará enormemente la adopción de IA hasta el último paso. Incluso las empresas de nicho que se encuentran en desventaja debido a la falta de expertos en IA internos pueden beneficiarse de manera extraordinaria.
  • El compartir los ingresos con los creadores de GPT significará que puede haber una avalancha de compañías de IA unipersonales ganando mucho dinero. ¿Los unicornios tecnológicos de IA unipersonales serán una tendencia ahora? ¿O tal vez estoy confiando demasiado en el plan de repartición de ingresos de OpenAI? ¡Vamos a esperar y ver!
  • ¡Oh espera! ¿Qué pasa con la seguridad de los GPTs que se publican en la tienda? Altman dice que habrá un riguroso proceso de selección para publicar estos GPTs en la tienda.
  • ¿Pero qué pasa con las versiones existentes de GPT, como ChaosGPT?

4. API de Asistentes

  • La API de Asistentes facilita la construcción de chatbots y experiencias similares a las de agentes. Ya no hay que lidiar con incrustaciones, bases de datos vectoriales, concatenar diferentes llamadas de API utilizando una herramienta separada, depender de la arquitectura RAG (Generación Ampliada de Recuperación), etc.
  • Uno de los casos de uso más importantes de los modelos LLM es construir chatbots para diferentes dominios.
  • La API de Asistentes admite hilos persistentes, lo que implica una mayor gestión de estados, molestias de solicitud y gestión de contexto.

Viene con recuperación incorporada para ampliar el modelo con un repositorio de conocimiento externo. No necesitas calcular las incrustaciones para los documentos de la base de conocimiento, ya no es necesario almacenarlos en una base de datos vectorial o implementar un algoritmo de división inteligente. ¿No es fabuloso eso? Ya no necesitas RAG.

  • En los últimos meses, todas las compañías de tecnología que conoces han lanzado su propio asistente LLM y les llaman todo tipo de nombres elegantes en inglés de dos sílabas. A menos que seas Microsoft y chatGPT ya sabe cómo se llamará ese chatbot 😂😂😂

Intérprete de Python

  • Recuerden en los primeros días de la locura de chatGPT, algunos de nosotros pensamos que chatGPT debía tener una máquina virtual de Linux en su interior. Porque cuando ejecutamos unos pocos comandos de Linux en el prompt de entrada, generó resultados increíblemente correctos para esos comandos. La única explicación posible era que chatGPT ejecutó nuestros comandos en la máquina virtual y devolvió los resultados. ¿Cómo más va a devolver un modelo de lenguaje grande resultados perfectos en comandos de Linux?!!!

Bueno, el equipo de OpenAI se puso al día con nuestras fantasías y decidió incluir un intérprete de código que puede ejecutar código Python en un entorno de ejecución aislado. Puede trazar gráficos, realizar análisis de datos, generar código Python para resolver problemas matemáticos y de razonamiento y mucho más.

  • Esto es genial, pero también alimentará más preguntas/investigación en la dirección de “¡Oh, chatGPT realmente puede razonar ahora!”.
  • La demostración principal muestra cómo chatGPT pudo hacer cálculos simples para dividir los gastos entre amigos, convertir tasas de cambio y calcular los gastos totales para un viaje a París. Pero, ¿puede resolver el mundo de los bloques? Bueno, no es un problema mío, ¡es un problema tuyo (¡mirando a los investigadores de IA simbólica!!😅)

Resumen

La API de Asistentes es un cambio de juego para las organizaciones y la tienda GPT es un cambio de juego para los constructores. ¡Vamos a construir!

También puedes ver el discurso completo.

¡Gracias por leer!

Si te gusta mi trabajo y quieres apoyarme…

  1. La MEJOR forma de apoyarme es siguiéndome en VoAGI.
  2. Para las mejores prácticas de ingeniería de datos y consejos de Python para principiantes, sígueme en LinkedIn.
  3. No dudes en aplaudir para que sepa lo útil que fue esta publicación para ti.

Stackademic

Gracias por leer hasta el final. Antes de irte:

  • ¡Considera aplaudir y seguir al escritor! 👏
  • Síguenos en Twitter(X), LinkedIn y YouTube.
  • Visita Stackademic.com para obtener más información sobre cómo estamos democratizando la educación gratuita en programación en todo el mundo.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Ciencia de Datos

Motivando la Autoatención

¿Por qué necesitamos consultas, claves y valores? Desentrañando el mecanismo de auto-atención de una manera menos abr...

Inteligencia Artificial

Investigadores descubren miles de nudos transformables

Investigadores descubrieron miles de nuevos nudos transformables a través de un proceso computacional que combina mue...

Aprendizaje Automático

Implemente un punto final de inferencia de ML sin servidor para modelos de lenguaje grandes utilizando FastAPI, AWS Lambda y AWS CDK.

Para los científicos de datos, trasladar los modelos de aprendizaje automático (ML) desde la prueba de concepto a la ...

Inteligencia Artificial

Un nuevo estudio de investigación de IA de DeepMind propone dos codificaciones posicionales direccionales y estructurales para grafos dirigidos

Los modelos Transformer han ganado mucha popularidad recientemente. Estos modelos de redes neuronales siguen las rela...

Inteligencia Artificial

Conoce a GPS-Gaussian Un nuevo enfoque de inteligencia artificial para sintetizar nuevas perspectivas de un personaje de forma en tiempo real.

Una función esencial de los sistemas de cámaras de múltiples vistas es la síntesis de vistas novedosas (NVS), que int...

Inteligencia Artificial

¿Qué tan fácil es engañar a las herramientas de detección de inteligencia artificial?

Los detectores ignoran todas las pistas de contexto, por lo que no procesan la existencia de un autómata realista en ...