Operai lanzó hoy una investigación profunda en ChatGPT, un nuevo agente que tarda un poco más en realizar una inmersión más profunda en la web para obtener una respuesta a una consulta.

Según OpenAiEl nuevo agente «encontrará, analizará y sintetizará cientos de fuentes en línea para crear un informe integral a nivel de un analista de investigación». Utiliza una versión del próximo modelo O3 de la compañía para rastrear Internet para obtener información, girando según sea necesario en reacción a lo que encuentra.

Puede tomar entre cinco y 30 minutos para completar su trabajo. Openai afirmó: «Logra en decenas de minutos lo que le tomaría a un humano muchas horas».

Operai publicó una gran cantidad de estadísticas para respaldar sus reclamos. En el El último examen de la humanidad Evaluación, un conjunto de datos de 3.000 preguntas en cien sujetos diseñados para comparar LLMS, Operai Deep Research logró una precisión del 26.6 por ciento. A modo de comparación, GPT-4O obtuvo un 3,3 por ciento, y Grok-2 logró 3.8 por ciento.

Los usuarios serán perdonados por experimentar una sacudida de déjà vu. Google lanzó una investigación profunda Para los suscriptores avanzados de Gemini el 11 de diciembre de 2024, y afirmó que la tecnología ahorraría a los usuarios «horas de tiempo».

La investigación profunda de Google funciona creando un plan de investigación de varios pasos para que un usuario revise o apruebe. Una vez que se le da el visto bueno, el BOT arrastra por Internet en nombre del usuario.

La investigación profunda de Openai está más orientada a hacer una pregunta a Chatgpt, tal vez agregar recursos adicionales como hojas de cálculo para el contexto, y luego dejarlo funcionar. El resultado incluye citas y un resumen de cómo se le ocurrió al agente su respuesta. Sin embargo, la responsabilidad permanece en el usuario para hacer referencia y verificar la información devuelta por el software.

Y la verificación continúa siendo necesaria: Openai declaró que las inexactitudes y las alucinaciones ocurrieron a una tasa más baja que los modelos ChatGPT existentes, según las evaluaciones internas de la compañía. «Puede tener dificultades para distinguir la información autorizada de los rumores, y actualmente muestra debilidad en la calibración de confianza, a menudo no transmitir la incertidumbre con precisión».

El agente de investigación profunda solo está disponible para usuarios profesionales, que Pague a la compañía $ 200 por mes. A continuación se agregarán los usuarios de equipo y el equipo, seguido de Enterprise. Se permiten cien consultas por mes, aunque OpenAi dijo que los clientes pagos pronto obtendrían «límites de tarifas significativamente más altos», ya que la compañía publica versiones más rápidas impulsadas por un modelo pequeño.

El momento después de la llegada de los modelos de IA de Startup china Deepseek es interesante. Deepseek ha hecho afirmaciones sobre las mayores eficiencias y rendimiento de los modelos. ¿En cuanto a OpenAi? «La investigación profunda en ChatGPT actualmente es muy intensiva», dijo hoy la empresa de EE. UU.

El agente de investigación profunda de OpenAI es actualmente solo en la web, aunque hay planes de lanzarlo a aplicaciones móviles y de escritorio dentro de un mes. También existe la intención de permitir a los clientes extender el alcance del agente conectándolo a fuentes de datos más especializadas.

A largo plazo, OpenAI prevé una combinación de investigación profunda y operador, que puede tomar medidas del mundo real, para «permitir que ChatGPT realice tareas cada vez más sofisticadas». ®

Source link