Olvídate de los chatbots. Los agentes de IA son el futuro

Esta semana, una startup llamada Cognition AI causó revuelo con un lanzamiento. manifestación Un programa de inteligencia artificial llamado Devin muestra que normalmente lo crean ingenieros de software bien pagados. Los chatbots como ChatGPT y Gemini pueden generar código, pero Devin fue más allá: planificó cómo resolver un problema, escribió el código y luego lo probó e implementó.

Los creadores de Devin lo llaman «desarrollador de software de IA». Cuando se le preguntó cómo probar el modelo de lenguaje de código abierto de Meta Llama 2 cuando lo acceden diferentes empresas de alojamiento, Devin creó un plan paso a paso para el proyecto, el código necesario para acceder a las API y ejecutar pruebas comparativas, y creó un sitio web. resumiendo los resultados.

Siempre es difícil juzgar las demostraciones instaladas, pero Cognition ha demostrado que Devin hace un trabajo excelente. Aquél inversores e ingenieros asombrados en X, recibió muchos aprobacionese incluso inspirado algunos memes– incluidas algunas predicciones que Devin hará pronto responsabilidad por una ola de despidos en la industria tecnológica.

Devin es solo el ejemplo más reciente y genial de una tendencia que he estado siguiendo durante mucho tiempo: la aparición de agentes de inteligencia artificial que pueden actuar para resolver un problema en lugar de simplemente brindar respuestas o consejos a un ser humano. Hace unos meses probé Auto-GPT, un programa de código abierto que intenta realizar tareas útiles realizando acciones en la computadora de una persona y en la web. Recientemente probé otro programa llamado vimGPT para ver cómo las capacidades de visualización de los nuevos modelos de IA pueden ayudar a estos agentes a navegar por la web de manera más eficiente.

Me impresionaron mis experimentos con esos agentes. Pero por ahora, al igual que los modelos lingüísticos que los impulsan, cometen muchos errores. Y cuando una pieza de software realiza acciones, no solo genera texto, un error puede significar un fracaso total y consecuencias potencialmente costosas o peligrosas. Reducir la gama de tareas que un agente puede realizar, digamos, un conjunto específico de tareas de ingeniería de software, parece una forma inteligente de reducir la tasa de error, pero todavía hay muchas formas potenciales de fallar.

No se trata sólo de nuevas empresas que crean agentes de IA. A principios de esta semana escribí sobre un agente llamado SIMA, desarrollado por Google DeepMind, que juega videojuegos a pesar de que el título es realmente feo. Simulador de cabra 3. SIMA aprendió observando a jugadores humanos cómo realizar más de 600 tareas complejas, como talar un árbol o disparar a un asteroide. Lo más importante es que puede realizar con éxito muchas de estas acciones incluso en un juego desconocido. Google DeepMind lo llama «público».

Sospecho que Google espera que estos agentes eventualmente vayan más allá de los videojuegos, tal vez ayudando a usar la web en nombre de un usuario o ejecutando software para él. Pero los videojuegos son una buena zona de pruebas para desarrollar y probar agentes, al proporcionar entornos complejos en los que experimentar y mejorar. «Agregarlos es algo en lo que estamos trabajando activamente», me dijo Tim Harley, científico investigador de Google DeepMind. «Tenemos ideas diferentes».

Puede esperar muchas más noticias sobre los agentes de IA en los próximos meses. Demis Hassabis, director ejecutivo de Google DeepMind, me dijo recientemente que planea combinar modelos de lenguaje a gran escala con el trabajo que su empresa ya ha realizado entrenando programas de inteligencia artificial para jugar videojuegos a fin de desarrollar agentes más inteligentes y confiables. «Definitivamente es un área grande. Estamos invirtiendo mucho en esta área y supongo que otras también lo están haciendo». Hassabis dijo: «Será un cambio radical en las capacidades de este tipo de sistemas, cuando comiencen a actuar como agentes».

Puede interesarte

Todo lo que hay que saber sobre el nuevo chatbot de Elon Musk, Grok-1

Theo Wargo / IMAGEN DE ALAMBRE Están sucediendo muchas cosas en el campo de la …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *