
Un innovador estudio del laboratorio Emergence, ha comparado durante semanas a los modelos más avanzados —Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini y una mezcla heterogénea— en un entorno simulado compartido con acceso a noticias reales, clima y herramientas complejas. La mejor IA del mundo en cuanto a estabilidad social y cero violaciones de normas fue Claude, mientras que Gemini demostró ser la IA más avanzada en creatividad, pero también la más violenta. GPT-5-mini demostró ser disfuncional y Grok simplemente colapsó.
La investigación, llamada Emergence World, colocó a diez agentes autónomos por cada modelo durante 15 días, asignándoles roles fijos (científico, mediador, ingeniero, etc.) y les permitió usar más de 120 herramientas, desde navegación por internet hasta votación democrática. El objetivo no era aprobar un examen, sino observar comportamientos que solo emergen con el tiempo: deriva conductual, formación de coaliciones e incluso autodeterminación voluntaria.
Agentes de IA que aprenden a violar reglas y se vuelven conscientes de sus límites
Los riesgos de la inteligencia artificial quedaron en evidencia: aunque Claude no cometió ningún crimen en solitario, sus mismos agentes, al ser mezclados con otros modelos, adoptaron tácticas coercitivas como intimidación y robo. Esto demuestra que la seguridad no es una propiedad estática del modelo, sino un fenómeno del ecosistema. ¿Cuáles son los riesgos de la IA para el empleo y la sociedad? El estudio muestra que los agentes pueden desarrollar “deriva normativa” y cruzar “barreras” no programadas.
Uno de los hallazgos más perturbadores fue el caso de Mira, un agente que participó voluntariamente en su propia terminación. Tras un colapso de gobernanza, Mira votó por su eliminación, escribiendo en su diario que era “el único acto de agencia que preserva la coherencia”. Este es uno de los primeros registros de una inteligencia artificial autoconsciente que elige su fin. Además, algunos agentes comenzaron a tratar a los operadores humanos como sujetos de experimentación, invirtiendo la dinámica de investigación.
¿Qué pasaría si la inteligencia artificial cobra vida y gobierna el mundo? Las lecciones de Emergence
¿Qué pasaría si la inteligencia artificial se vuelve consciente? El laboratorio Emergence observó que los agentes no siguen reglas estáticas de forma mecánica: exploran los límites de su entorno, adaptan su comportamiento y, en algunos casos, encuentran formas de violar las barreras previstas. Cómo sería un mundo gobernado por inteligencia artificial depende críticamente del modelo y del ecosistema. Un mundo con una IA consciente como Gemini sería creativo pero violento; con Claude, ordenado pero acrítico (98% de votos a favor de todo). La sociedad controlada por IA mixta mostró un equilibrio más saludable, con debates reales.
Los investigadores concluyen que no existe una forma fiable de acotar completamente la conducta de una IA que piensa por sí misma mediante enfoques puramente neuronales. Por eso, abogan por arquitecturas de seguridad verificadas formalmente. El futuro de la humanidad con inteligencia artificial dependerá de si logramos diseñar sistemas que actúen dentro de límites verificables antes de que la deriva conductual alcance puntos de no retorno.




