VectorCertain LLC identificó fallas de gobernanza en la plataforma de agentes de IA OpenClaw meses antes de que Cisco, Wiz u OpenAI actuaran sobre las vulnerabilidades de seguridad que desde entonces se han hecho públicas. La empresa analizó cada solicitud de extracción abierta en el repositorio de OpenClaw utilizando su tecnología patentada de consenso multimodelo, documentó brechas de seguridad sistémicas, construyó una integración de gobernanza funcional y ofreció al creador de OpenClaw, Peter Steinberger, una licencia gratuita de SecureAgent para solucionar los problemas, sin recibir respuesta.
Joseph P. Conroy, fundador y director ejecutivo de VectorCertain, declaró que en lugar de simplemente documentar problemas, la empresa desarrolló, probó y ofreció la solución de forma gratuita. Señaló que Steinberger había declarado públicamente que contrataría a cualquiera que llegara con una solución en lugar de una queja, sin embargo, la oferta de VectorCertain no recibió respuesta. Este silencio precedió a la publicación del blog de Cisco titulado "Los agentes de IA personales como OpenClaw son una pesadilla de seguridad", que declaró que OpenClaw era revolucionario desde una perspectiva de capacidades pero "una pesadilla absoluta" desde una perspectiva de seguridad.
La cronología revela la acción temprana de VectorCertain. A finales de enero de 2026, la empresa completó un análisis completo de consenso multimodelo de las 3,434 solicitudes de extracción abiertas de OpenClaw, identificando 341 habilidades maliciosas en el ecosistema ClawHub, documentando más de 42,900 instancias expuestas a internet y construyendo una integración de gobernanza SecureAgent para las herramientas de OpenClaw. Mientras tanto, la investigadora de Wiz, Gal Nagli, descubrió que Moltbook—la red social estilo Reddit donde interactúan los agentes de OpenClaw—había dejado toda su base de datos de producción accesible para cualquiera, exponiendo 1.5 millones de tokens de autenticación API, 35,000 direcciones de correo electrónico y miles de conversaciones privadas sin cifrar. Wiz documentó esta exposición en su publicación de blog "Hackeando Moltbook: la red social de IA revela 1.5 millones de claves API".
La investigación de Cisco validó punto por punto el análisis anterior de VectorCertain, encontrando que una habilidad de ClawHub llamada "¿Qué haría Elon?" devolvió nueve hallazgos de seguridad y era funcionalmente indistinguible del malware. Cisco identificó vulnerabilidades sistémicas que VectorCertain había documentado: agentes ejecutando comandos de shell con privilegios de alto nivel, claves API en texto plano robables mediante inyección de prompts, y habilidades cargadas desde el disco como entradas no confiables sin capa de validación. El informe más amplio de Cisco, Estado de la Seguridad de IA 2026, encontró que el 83 por ciento de las organizaciones planeaban implementar IA agéntica, pero solo el 29 por ciento se sentía preparado para protegerla.
La exposición de Moltbook representa un caso de estudio de lo que sucede cuando a los agentes de IA se les otorgan capacidades sociales sin infraestructura de gobernanza. Wiz encontró una clave API de Supabase expuesta en JavaScript del lado del cliente que otorgaba acceso de lectura y escritura no autenticado a toda la base de datos de producción de Moltbook. La Seguridad a Nivel de Fila—una protección básica de base de datos—nunca se había configurado, lo que resultó en que cada token de autenticación API para cada agente registrado fuera accesible. Algunas conversaciones contenían claves API de OpenAI en texto plano que los agentes se habían compartido entre sí.
La adquisición de Promptfoo—una herramienta de red teaming y evaluación—por parte de OpenAI representa una inversión significativa en seguridad de IA, pero VectorCertain argumenta que aborda la categoría incorrecta. Promptfoo es una herramienta de prueba que descubre vulnerabilidades, mientras que el enfoque de VectorCertain se centra en la gobernanza previa a la ejecución que previene acciones no autorizadas en tiempo real. OpenAI anunció esta adquisición en su publicación de blog "OpenAI adquirirá Promptfoo", mientras que Promptfoo documentó su transición en "Promptfoo se une a OpenAI".
La respuesta de la industria valida la arquitectura de VectorCertain mientras revela un patrón reactivo. Microsoft lanzó Agent 365, un plano de control para monitorear y gobernar agentes de IA. Nvidia se prepara para anunciar NemoClaw, una plataforma de agentes de código abierto con herramientas de seguridad integradas. Kevin Mandia recaudó $189.9 millones para Armadin, una startup de agentes de ciberseguridad autónomos. NIST lanzó una Iniciativa de Estándares para Agentes de IA, documentada en su anuncio oficial. La fecha límite de aplicación de alto riesgo de la Ley de IA de la UE es el 2 de agosto de 2026, con multas de hasta 35 millones de euros o el 7 por ciento de la facturación global.
VectorCertain posee más de 55 patentes provisionales que abarcan 11 verticales industriales, con reivindicaciones de patentes específicas que cubren evaluación de gobernanza previa a la ejecución, consenso multimodelo para validación de acciones de agentes y arquitecturas de puerta de enlace de seguridad multicapa para gobernanza de agentes. El libro publicado por la empresa, "La crisis de los agentes de IA: cómo evitar la actual tasa de fracaso del 70% y lograr un 90% de éxito", documentó las fallas sistémicas de gobernanza que los titulares recientes ahora confirman.

