El Departamento de Seguridad Nacional de EE. UU. solicita soluciones para datos sintéticos de entrenamiento de IA/ML.

La Dirección de Ciencia y Tecnología del Departamento de Seguridad Nacional de los Estados Unidos (DHS) ha anunciado hoy que está solicitando ideas al público para encontrar soluciones que permitan generar datos sintéticos para entrenar modelos de inteligencia artificial y aprendizaje automático. Las propuestas aceptadas podrán recibir hasta 1,7 millones de dólares estadounidenses en financiación para desarrollar y adaptar tecnologías comerciales para su uso por parte del DHS.
La solicitud reconoce los posibles riesgos para la privacidad y la ciberseguridad asociados al uso de datos «en tiempo real» para entrenar estos modelos, al tiempo que reconoce los importantes retos que plantea la creación de datos sintéticos que modelen con precisión los datos del mundo real sin sesgos (aunque los retos que plantean los sesgos en los datos en tiempo real siguen siendo importantes). El DHS ha declarado explícitamente que una de las capacidades que deben proporcionar las soluciones propuestas es «eliminar y/o mitigar el sesgo en los datos sintéticos» y reconoce que las soluciones también deben incluir capacidades de preservación de la privacidad que satisfagan las necesidades de la misión del DHS y sus diversas agencias, como la Agencia de Ciberseguridad y Seguridad de las Infraestructuras (CISA) y la Oficina de Privacidad del DHS.
Las solicitudes deben presentarse antes del 10 de abril de 2024 y se celebrará una «jornada del sector» híbrida en Durham, Carolina del Norte, para debatir la convocatoria y responder a preguntas.
La Dirección de Ciencia y Tecnología (S&T) del Departamento de Seguridad Nacional (DHS) anunció una nueva convocatoria en busca de soluciones para generar datos sintéticos que modelen y repliquen la forma y los patrones de los datos reales, al tiempo que se proteja la privacidad y se mitiguen los riesgos para la seguridad. Los datos sintéticos son importantes para el DHS porque permiten al Departamento entrenar modelos de aprendizaje automático utilizando datos sintéticos cuando no se dispone de datos del mundo real o cuando su uso supondría riesgos para la privacidad y la seguridad, especialmente si los datos del mundo real incluyen información sensible, como información de identificación personal (PII).
Ver artículo de referencia