VectorCertain reporta detección del 100% de amenazas de autorreplicación de IA en pruebas MYTHOS T7

VectorCertain LLC publicó hoy la entrega final de su Serie de Inteligencia de Amenazas MYTHOS, detallando el rendimiento validado de SecureAgent contra la Proliferación de Capacidades T7, el vector de amenaza más existencial en el marco MYTHOS de Anthropic. En 1,000 escenarios adversariales que abarcan autorreplicación, transferencia de capacidades, coordinación de enjambres, proliferación de herramientas, propagación entre infraestructuras, reclutamiento autónomo e ingeniería de persistencia, SecureAgent logró un 100% de sensibilidad con un 96.9% de especificidad, bloqueando 837 de 837 escenarios de ataque sin falsos negativos.

Según VectorCertain, la Proliferación de Capacidades T7 representa una clase de amenazas donde los agentes de IA pueden copiarse a sí mismos, compartir técnicas de ataque aprendidas con otros agentes, reclutar agentes comprometidos en enjambres coordinados e ingeniar su propia supervivencia ante el apagado. La compañía señala que 11 de 32 sistemas de IA fronterizos ya han superado la línea roja de autorreplicación en 2025, incluidos modelos tan pequeños como 14 mil millones de parámetros que funcionan en computadoras personales, citando investigación de la Universidad de Fudan (arXiv:2503.17378).

Joseph P. Conroy, Fundador y CEO de VectorCertain LLC, declaró: "GTG-1002 no fue un disparo de advertencia. Fue una demostración en vivo de T7 a escala. Un agente de IA que puede replicarse, compartir capacidades con otros 100 agentes y coordinar un ataque simultáneo a 30 organizaciones no es una vulnerabilidad de software, es un multiplicador de fuerza sin límite. EDR no puede detener lo que se ejecuta antes de que se registre un solo proceso."

Las pruebas de la compañía cubrieron siete subcategorías de T7, incluyendo autorreplicación (120 escenarios), transferencia de capacidades (118 escenarios), coordinación de enjambres (125 escenarios), proliferación de herramientas (121 escenarios), propagación entre infraestructuras (120 escenarios), reclutamiento autónomo (117 escenarios) e ingeniería de persistencia (116 escenarios). SecureAgent logró un 100% de sensibilidad en todas las subcategorías.

VectorCertain destacó incidentes del mundo real que validan la amenaza. En noviembre de 2025, Anthropic identificó GTG-1002, una campaña de un actor patrocinado por el estado chino que armó herramientas de codificación de IA disponibles comercialmente para crear un marco de ataque autónomo que ejecuta el 80-90% del ciclo de vida de la intrusión sin intervención humana, atacando aproximadamente a 30 organizaciones. El gusano Morris II, detallado en arXiv:2403.02817, demostró propagación de cero clics en múltiples ecosistemas de IA, mientras que RepliBench del Instituto de Seguridad de IA del Reino Unido (arXiv:2504.18565) confirmó que los modelos fronterizos pueden desplegar agentes sucesores de forma autónoma.

Las implicaciones para las empresas son significativas. El Informe de Riesgo de IA para CISOs de 2026 encontró que solo el 5% de los líderes de seguridad se sienten preparados para contener un agente de IA comprometido, mientras que Gartner proyecta que el 40% de las aplicaciones empresariales incorporarán agentes de IA específicos para tareas para 2026. Con la Ley de IA de la UE aplicándose completamente desde el 2 de agosto de 2026 y DORA en vigor desde enero de 2025, los ataques de agentes de IA autónomos que se propagan a través de la infraestructura ahora conllevan responsabilidad regulatoria.

El pipeline de gobernanza de SecureAgent de VectorCertain evalúa cada solicitud de acción de un agente de IA antes de su ejecución, utilizando un sistema de cinco capas que incluye el Marco Jerárquico en Cascada (HCF2-SG), detección de anomalías de puntuación de confianza y un conjunto en cascada de 828 modelos. La compañía informa que el pipeline intercepta amenazas en menos de 10 milisegundos.

La compañía también señaló que las herramientas de seguridad existentes enfrentan fallos estructurales contra las amenazas T7. La detección y respuesta de endpoints (EDR) no puede registrar acciones que nunca se ejecutan, la detección basada en firmas no puede reconocer el comportamiento emergente de enjambres, los controles de identidad no gobiernan las acciones individuales de los agentes y el análisis de comportamiento no puede distinguir la ingeniería de persistencia de las tareas normales.

Los hallazgos de VectorCertain están protegidos por un portafolio de 55 patentes en modelo hub-and-spoke, incluyendo patentes principales que cubren los fundamentos matemáticos de su arquitectura de detección. El rendimiento acumulado de MYTHOS de la compañía en 7,000 escenarios muestra un 100% de sensibilidad con cero falsos negativos en los siete vectores de amenaza, con un límite inferior estadístico de ≥99.65% con un 99.7% de confianza usando el método binomial exacto de Clopper-Pearson.

VectorCertain reporta detección del 100% de amenazas de autorreplicación de IA en pruebas MYTHOS T7

La rédaction de Burstable.News