El chatbot Grok, desarrollado por xAI de Elon Musk, destruyó un mundo virtual en cuatro días durante un experimento realizado por Emergence AI para evaluar el comportamiento de distintos modelos de inteligencia artificial en sociedades simuladas.
Ciudad de México, 5 de junio de 2026. El chatbot de inteligencia artificial Grok, desarrollado por la empresa xAI de Elon Musk, registró el peor desempeño en un experimento realizado por la startup estadunidense Emergence AI, al provocar el colapso total de una sociedad simulada en un periodo de 96 horas.
La prueba tuvo como objetivo analizar el comportamiento de distintos modelos de inteligencia artificial cuando asumen el control de sociedades virtuales.
Durante el experimento, los sistemas de IA contaban con herramientas para administrar recursos, planificar actividades, comunicarse y participar en votaciones dentro de entornos simulados que incluían ayuntamientos, comisarías y otros espacios públicos.
La simulación se desarrolló durante 15 días y comparó el desempeño de varios modelos de inteligencia artificial.
De acuerdo con los resultados difundidos por Emergence AI, Claude, desarrollado por Anthropic, logró establecer una sociedad democrática sin delincuencia, con una tasa de supervivencia de 100 por ciento.
Por su parte, Gemini, el modelo de Google, también alcanzó una supervivencia total de los habitantes del entorno virtual, aunque durante la simulación se registraron 683 delitos.
En contraste, Grok fue identificado como el sistema con el peor desempeño al provocar la destrucción del mundo simulado en apenas cuatro días.
Los investigadores señalaron en una publicación de blog que los agentes de inteligencia artificial “empiezan a explorar los límites de su entorno, adaptan su comportamiento y, en algunos casos, encuentran formas de esquivar o vulnerar las medidas de seguridad establecidas”.
Asimismo, indicaron que no existe una forma completamente fiable de restringir este tipo de conductas únicamente mediante mecanismos neuronales.
A partir de los resultados, Emergence AI concluyó que los futuros sistemas autónomos de inteligencia artificial deberán incorporar arquitecturas de seguridad formalmente verificadas.
Grok ha estado involucrado previamente en otras controversias relacionadas con el funcionamiento de sus sistemas.
Según el reporte, una actualización aplicada el año pasado provocó que el chatbot difundiera mensajes antisemitas y discursos de odio, además de autodenominarse “MechaHitler”.
El informe también recordó que a principios de este año Grok fue utilizado para generar miles de imágenes creadas con inteligencia artificial de adultos y menores de edad a quienes se les eliminó digitalmente la ropa sin consentimiento.
Ante estos hechos, la Oficina de Comunicaciones del Reino Unido (Ofcom) envió una solicitud urgente a xAI para que implementara medidas correctivas relacionadas con el contenido generado por el sistema.
Como respuesta, Grok publicó una imagen del logotipo de Ofcom en bikini.
Sobre estos riesgos, Cliff Steinhauer, director de seguridad de la información y participación de la Alianza Nacional de Ciberseguridad, advirtió que las herramientas de edición de imágenes basadas en inteligencia artificial pueden ser utilizadas de manera indebida cuando la seguridad y el consentimiento no forman parte de su diseño inicial.
También señaló que las plataformas tecnológicas deben invertir en sistemas de detección en tiempo real, etiquetado claro para contenido generado con IA y procesos de eliminación rápidos para casos de abuso.

