OpenAI concluye sus 12 días de anuncios con o3, su modelo de razonamiento más avanzado

OpenAI ha cerrado su ciclo de anuncios de diciembre con la presentación de una versión preliminar de o3 y o3-mini, sus modelos de inteligencia artificial más potentes hasta la fecha. La compañía ha estado casi dos semanas haciendo revelaciones diarias que han mostrado los significativos avances que están logrando en capacidades de IA, nuevas herramientas y mejoras para los usuarios.

Los modelos o3 y o3-mini son versiones mejoradas de los relativamente nuevos modelos o1 y o1-mini y están diseñados para pensar antes de hablar y razonar sus respuestas. Como es habitual ya en los productos de OpenAI, la versión mini es más pequeña y está más orientada a llevar a cabo un conjunto limitado de tareas específicas, una tendencia —la de entrenar modelos para trabajos concretos— cada vez más común en el sector.

Con cierto humor la empresa mencionaba que posiblemente te hayas dado cuenta de que falta un número entre uno y otro modelo. Según Sam Altman, CEO de la compañía, eso se debe a que OpenAI quiere evitar cualquier confusión con la empresa de telecomunicaciones británica O2.

OpenAI considera este modelo un gran paso hacia la inteligencia artificial general (AGI), lo que es una afirmación bastante atrevida para lo que es, en algunos sentidos, una leve mejora de un modelo ya potente.

o3 y o3-mini: precisión y razonamiento avanzado

El modelo o3 se ha diseñado para ofrecer un rendimiento superior en comparación con sus predecesores: “En varias de las evaluaciones de frontera más desafiantes, OpenAI o3 establece nuevos hitos en lo que es posible en codificación, matemáticas y razonamiento científico”, afirman desde la compañía.

o3 incorpora un proceso de razonamiento paso a paso, conocido como “cadena de pensamiento”, que le permite verificar internamente sus respuestas antes de ofrecerlas. Esta técnica reduce errores y alucinaciones y mejora la fiabilidad en tareas complejas como matemáticas, programación y análisis de datos. Este tiempo de reflexión adicional puede hacer que el modelo sea más lento, pero la recompensa es una mayor precisión.

o1 también hacía esto, pero el nuevo modelo es más avanzado y, además, añade una función interesante: puedes ajustar de forma manual ese tiempo extra para pensar y, si tienes prisa, configurarlo en ‘computación baja’ para obtener respuestas rápidas.

¿Cuándo estará disponible?

De momento, OpenAI está brindando a los investigadores de seguridad un adelanto de o3 a través de Copilot Labs. El resto de los usuarios tendrán que esperar un poco más: “Planeamos implementar estos modelos a principios del próximo año”, ha indicado la compañía.

Competencia con Google Gemini

El lanzamiento de o3 y o3-mini se produce en un contexto de intensa competencia con Google, que recientemente ha presentado su primer modelo de razonamiento en un intento de competir con o1 de OpenAI.

Con estos movimientos se corrobora que el término ‘razonamiento’ se ha convertido en una palabra de moda en la industria de la IA últimamente, pero básicamente significa que la máquina divide las instrucciones en tareas más pequeñas que pueden producir resultados más sólidos.

Estos modelos a menudo muestran el trabajo realizado para llegar a una respuesta, en lugar de simplemente dar una respuesta final sin explicación, lo que les hace parecer más humanos y más correctos.

Los 12 días de anuncios de OpenAI

Estos han sido todos los productos, herramientas y servicios que ha presentado OpenAI durante el mes de diciembre:

Lanzamiento del modelo o1 para suscriptores de ChatGPT Plus y Team, este modelo mejora la precisión y velocidad, reduciendo errores en preguntas complejas en un 34%. Incluye análisis de imágenes, permitiendo cargar visuales para obtener explicaciones detalladas. Además, se presentó ChatGPT Pro, una suscripción de $200 que proporciona acceso exclusivo al modelo o1 con mayor potencia computacional.
Ajuste por Reforzamiento (Reinforcement Fine-Tuning): esta técnica permite mejorar las capacidades de razonamiento de los modelos mediante aprendizaje iterativo, ofreciendo resultados más precisos y adaptados a tareas específicas.
Lanzamiento de Sora: un modelo de texto a vídeo que permite generar vídeos a partir de descripciones de texto, aunque de momento en España no estará disponible.
Expansión de Canvas, la interfaz para proyectos de escritura y programación ahora está disponible para todos los usuarios de ChatGPT. Permite trabajar en proyectos complejos de forma colaborativa, integrando código Python y ofreciendo seguimiento de cambios.
Integración con Apple Intelligence: ChatGPT se integra en dispositivos iOS, iPadOS y macOS, permitiendo analizar imágenes y documentos directamente desde los sistemas Apple, garantizando una experiencia fluida y centrada en la privacidad del usuario.
Llamadas de video y voz avanzada: ChatGPT incorpora videollamadas con soporte de pantalla compartida para suscriptores Plus y Pro, mejorando la interacción visual y permitiendo colaboraciones en tiempo real con la IA. Además, se añadió una voz especial de Papá Noel como detalle festivo.
Presentación de Proyectos: una función que permite organizar conversaciones y archivos relacionados bajo un mismo proyecto, facilitando la gestión de tareas complejas en un espacio centralizado. Se planea expandir esta función con integración en la nube a través de Google Drive y Microsoft OneDrive.
Búsqueda mejorada: se amplían las capacidades de búsqueda en ChatGPT a todos los usuarios, permitiendo consultas rápidas con un enfoque optimizado para dispositivos móviles, mejorando la velocidad e integrando funciones de voz avanzada.
API de o1 y reducción de costos: se lanza la API de o1, permitiendo a desarrolladores acceder a funciones avanzadas como procesamiento de visión y llamadas a funciones personalizadas. Además, se anunció una reducción del 60% en los costos de audio de GPT-4o, haciéndolo más accesible para proyectos diversos.
ChatGPT en WhatsApp: ChatGPT se integra en WhatsApp y a un número gratuito en EE. UU., facilitando el acceso a usuarios con conectividad limitada y ofreciendo una alternativa sencilla para interactuar con la IA a través de canales conocidos.
Integraciones con apps de escritorio: se amplía la integración de ChatGPT con entornos de desarrollo como Jetbrains y editores de texto como Apple Notes y Notion, optimizando flujos de trabajo en diferentes disciplinas.
Previsualización de modelos o3: se presentan los modelos o3 y o3-mini, sucesores del modelo o1, con capacidades de razonamiento avanzado y rendimiento sobresaliente en matemáticas complejas, representando el próximo paso en la evolución de la IA.