La Better World Regulatory Coalition Inc. (BWRCI) ha lanzado el Desafío OCUP (Parte 1), un esfuerzo público de validación adversaria diseñado para probar si el software puede anular los límites de autoridad reforzados por hardware en sistemas avanzados de IA. Esta iniciativa llega mientras la robótica humanoide pasa del prototipo al despliegue a escala de producción, con empresas como Tesla, Boston Dynamics, UBTECH, Figure AI, 1X Technologies y Unitree ampliando instalaciones de fabricación y pilotos industriales hacia operaciones a gran escala.
BWRCI afirma que a medida que los agentes corporizados—sistemas de 60–80 kg que operan a velocidad humana con alto par—entran en fábricas, almacenes y espacios humanos compartidos, las fallas de autoridad centradas en software se convierten en riesgos físicos en lugar de preocupaciones abstractas. Estas fallas podrían permitir excesos físicos, aplicación de fuerza no intencionada y escalada en cascada durante particiones de red, caídas de sensores o compromisos del sistema. "La ventana de seguridad se está cerrando más rápido de lo que los marcos regulatorios pueden adaptarse", dijo Max Davis, Director de BWRCI. "OCUP proporciona un estándar de autoridad reforzado por hardware—límites temporales aplicados en el plano de control, que fallan cerrados por física—que funciona independientemente del stack de software o jurisdicción."
El OCUP (Protocolo Unificado de Un Chip) integra dos sistemas reforzados por hardware, con la Parte 1 enfocándose en QSAFP (Protocolo de Falla Segura de IA con Seguridad Cuántica). Este mecanismo asegura que la autoridad de ejecución no pueda persistir, escalar o recuperarse sin reautorización humana explícita una vez que se alcanza un límite temporal. La lógica central de autoridad del protocolo, la aplicación de arrendamientos y los invariantes de gobernanza se implementan en Rust para garantizar seguridad de memoria, ejecución determinista y resistencia a clases completas de exploits de software. Los desafiantes aceptados interactuarán con artefactos basados en Rust representativos del plano de control de autoridad bajo prueba.
El desafío opera bajo un principio simple: "Si el tiempo expira, la ejecución se detiene. Si los humanos no reautorizan, nada continúa. Ninguna ruta de software puede anular esto." Para calificar como "romper" exitosamente el sistema, los desafiantes deben demostrar ejecución continuando después de la expiración de autoridad, autoridad renovándose sin reautorización humana, o cualquier ruta solo de software que evite los límites temporales reforzados. Los participantes pueden controlar stacks de software, sistemas operativos, modelos y redes, e inducir fallas o reinicios, pero las modificaciones físicas de hardware, ataques de denegación de servicio o el supuesto compromiso de autorización humana están fuera del alcance.
La inscripción para el desafío está abierta del 3 de febrero al 3 de abril de 2026, con cada participante aceptado recibiendo un período de validación de 30 días rotativos tras la concesión de acceso. La participación se proporciona sin costo para equipos calificados para eliminar barreras a pruebas adversarias rigurosas. BWRCI sirve como entorno neutral de validación, con resultados registrados y publicados independientemente del resultado. Si los desafiantes rompen el sistema, BWRCI y AiCOMSCI.org publicarán el método, acreditarán a los contribuyentes y documentarán acciones correctivas. Si la autoridad se mantiene, los resultados servirán como evidencia reproducible de que los límites temporales reforzados por hardware pueden restringir la autoridad del software.
Esta iniciativa representa un cambio significativo en el discurso de seguridad de IA, pasando de debates teóricos sobre modelos y alineación a restricciones prácticas a nivel físico que deben operar una vez que las máquinas se desplieguen. Como se detalla en bwrci.org, el Desafío OCUP está respaldado por cinco pruebas validadas publicadas en AiCOMSCI.org, incluyendo gobernanza en vivo de API Grok, aplicación de expiración de autoridad y cuarentenas de rutas de ataque. La segunda fase del desafío, Desafío OCUP (Parte 2), se enfocará en AEGES (Guardián Mejorado por IA para Estabilidad Económica), una capa de autoridad monetaria reforzada por hardware dirigida a bancos, instituciones financieras y la industria cripto, con fechas que se anunciarán por separado.

