DeepSeek está siendo el foco de atención en las últimas 24 horas, ya sea por su llegada oficial o su reciente ciberataque. Sin embargo, pese a la amenaza de seguridad, dicha startup china está aprovechando su auge para lanzar nuevas herramientas.
La última ha sido Janus Pro, una familia de modelos para crear imágenes que promete superar a DALL-E 3 y Stable Difussion. Esta tecnología está disponible en versiones de 1.000 millones a 7.000 millones de parámetros, por lo tanto, aspira a ganarse un hueco entre los generadores más famosos del mundo. Pero, sin duda, Janus Pro 7B es el modelo de IA más destacable de toda la familia, ya que puede crear imágenes a partir de texto y entender otras imágenes que se le introduzcan.
Dicha herramienta es de código abierto bajo licencia MIT, se trata de un modelo multimodal, unifica la comprensión y generación en una única arquitectura, introduce un sistema de doble vía para el procesamiento visual, puede crear imágenes con una resolución de 384 x 384 píxeles, está construido sobre DeepSeek-LLM-7b-base, puede separar por un lado la codificación para la generación de imágenes y por otro la identificación de la imagen para su recreación, emplea Usa SigLIP-L como codificador visual y utiliza un tamaño compacto de 7.000 millones de parámetros.
Por otro lado, el diario Investing indica que este modelo "supera el rendimiento de DALL-E 3 y Stable Diffusion de OpenAI en pruebas de referencia establecidas como GenEval y DPG-Bench".
Asimismo, agrega que, "mientras la industria tecnológica lidia con la introducción de Janus-Pro-7B y sus implicaciones, la atención se centra ahora en cómo responderán otras empresas a los avances de DeepSeek. Con el panorama de la IA cambiando rápidamente, es probable que la competencia se intensifique, lo que dará lugar a más innovaciones y posiblemente a más fluctuaciones del mercado a medida que surjan nuevos modelos".
Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.