El agente Operator de OpenAI ya está disponible en Europa. Dicha innovación es un agente que puede acceder a Internet para realizar tareas por los usuarios de forma independiente, además, con su propio navegador, puede ver una página web e interactuar con ella escribiendo, haciendo clic y desplazándose.
Dicha innovación salió a la luz por primera vez a finales de enero, aunque solo estaba disponible en Estados Unidos. No obstante, tras superar las barreras que impedían su llegada a la Unión Europea, los suscriptores del plan ChatGPT Pro ya pueden usar Operator. Pero, ¿cómo funciona?
Por poner un ejemplo, OpenAI explica en su blog oficial que "se puede pedir a Operator que gestione una amplia variedad de tareas repetitivas del navegador, como completar formularios, hacer pedidos de comestibles e incluso crear memes. La capacidad de usar las mismas interfaces y herramientas con las que los humanos interactúan a diario amplía la utilidad de la IA, ayudando a las personas a ahorrar tiempo en las tareas cotidianas y abriendo nuevas oportunidades de interacción para las empresas".
Así funciona Operator
Operator se basa en nuevo modelo llamado 'Computer-Using Agent' (CUA, por sus siglas en inglés).
Al combinar las capacidades de visión de GPT-4o con el razonamiento avanzado a través del aprendizaje de refuerzo, CUA está capacitado para interactuar con las interfaces gráficas de usuario (GUI, por sus siglas en inglés) —es decir, los botones, menús y campos de texto que las personas ven en una pantalla—. Por ende, este agente puede 'ver' a través de capturas de pantalla e 'interactuar' con un navegador, lo que le permite realizar acciones en Internet sin necesidad de integrar API personalizadas.
Para qué sirve Operator
Los usuarios pueden describir la tarea que deseen realizar para que Operator se encargue del resto, además, pueden tomar el control del navegador remoto en cualquier momento, ya que Operador está capacitado para solicitarles proactivamente que se hagan cargo de las tareas que requieren inicio de sesión, datos de pago o resolución de CAPTCHA.
Por otro lado, los interesados son capaces de personalizar sus flujos de trabajo al añadir instrucciones personalizadas, ya sea para todos los sitios web o sitios específicos. Asimismo, Operator permite guardar indicaciones para acceder rápidamente a ellas en la página de inicio y ejecutar varias tareas de forma simultánea.
Qué datos recopila Operator
Respecto a la seguridad y prioridad, OpenAI afirma en su blog que "Operator está capacitado para garantizar que la persona que lo utiliza siempre tenga el control y solicite información en los puntos críticos", agregando que "no recopila ni captura la información ingresada por el usuario".
Asimismo, "los internautas pueden eliminar todos los datos de navegación y cerrar sesión en todos los sitios con un solo clic en la sección 'Privacidad' de la configuración de Operator".
Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.