Un novedoso método de encriptación ideado por investigadores del MIT asegura los datos utilizados en las redes neuronales en línea, sin ralentizar drásticamente sus tiempos de ejecución. Este enfoque es prometedor para usar redes neuronales basadas en la nube para el análisis de imágenes médicas y otras aplicaciones que usan datos confidenciales.
Outsourcing machine learning es una tendencia creciente en la industria. Las principales empresas tecnológicas han lanzado plataformas en la nube que realizan tareas pesadas de computación, como, por ejemplo, ejecutar datos a través de una red neuronal convolucional CNN para la clasificación de imágenes. Pequeñas empresas con recursos limitadosy otros usuarios pueden cargar datos a esos servicios por una tarifa y obtener resultados en varias horas.
¿Pero qué pasa si hay filtraciones de datos privados? En los últimos años, los investigadores han explorado varias técnicas de computación segura para proteger dichos datos confidenciales. Pero esos métodos tienen inconvenientes en el rendimiento que hacen que la evaluación de la red neuronal prueba y validación sea lenta, a veceshasta un millón de veces más lento, lo que limita su adopción más amplia.
En un documento presentado en la Conferencia de Seguridad USENIX de esta semana, los investigadores del MIT describen un sistema que combina dos técnicas convencionales: cifrado homomórfico y circuitos confusos, de una manera que ayuda a las redes a ejecutar órdenes de magnitud más rápido que con los enfoques convencionales.
Los investigadores probaron el sistema, llamado GAZELLE, en tareas de clasificación de imágenes de dos partes. Un usuario envía datos de imágenes cifradas a un servidor en línea que evalúa una CNN que se ejecuta en GAZELLE. Después de esto, ambas partes comparten información cifrada de un lado a otro en ordenpara clasificar la imagen del usuario. A lo largo del proceso, el sistema garantiza que el servidor nunca aprenda ningún dato cargado, mientras que el usuario nunca aprende nada sobre los parámetros de red. Sin embargo, en comparación con los sistemas tradicionales, GAZELLE funcionó de 20 a 30 veces más rápido que el estadomodelos de última generación, al tiempo que reduce el ancho de banda de red requerido en un orden de magnitud.
Una aplicación prometedora para el sistema es entrenar a las CNN para diagnosticar enfermedades. Los hospitales podrían, por ejemplo, entrenar a una CNN para aprender características de ciertas afecciones médicas a partir de imágenes de resonancia magnética MRI e identificar esas características en las MRI cargadas. El hospital podría hacerel modelo disponible en la nube para otros hospitales. Pero el modelo está entrenado y se basa más en datos privados de pacientes. Debido a que no hay modelos de cifrado eficientes, esta aplicación no está lista para el horario estelar.
"En este trabajo, mostramos cómo hacer eficientemente este tipo de comunicación segura de dos partes combinando estas dos técnicas de una manera inteligente", dice el primer autor Chiraag Juvekar, estudiante de doctorado en el Departamento de Ingeniería Eléctrica y Ciencias de la ComputaciónEECS. "El siguiente paso es tomar datos médicos reales y demostrar que, incluso cuando los escalamos para las aplicaciones que les interesan a los usuarios reales, aún proporcionan un rendimiento aceptable".
Los coautores del artículo son Vinod Vaikuntanathan, profesor asociado en EECS y miembro del Laboratorio de Ciencias de la Computación e Inteligencia Artificial, y Anantha Chandrakasan, decana de la Escuela de Ingeniería y el Profesor Vannevar Bush de Ingeniería Eléctrica y Ciencias de la Computación.
Maximizando el rendimiento
Los CNN procesan datos de imagen a través de múltiples capas de cálculo lineales y no lineales. Las capas lineales hacen los cálculos matemáticos complejos, llamados álgebra lineal, y asignan algunos valores a los datos. En un cierto umbral, los datos se envían a capas no lineales que hacen algo más simplecómputo, tomar decisiones como identificar características de imagen y enviar los datos a la siguiente capa lineal. El resultado final es una imagen con una clase asignada, como vehículo, animal, persona o característica anatómica.
Los enfoques recientes para proteger las CNN han implicado la aplicación de cifrado homomórfico o circuitos confusos para procesar datos en toda una red. Estas técnicas son efectivas para asegurar los datos. "En el papel, parece que resuelve el problema", dice Juvekar. Pero rindenredes neuronales complejas ineficientes, "por lo que no las usaría para ninguna aplicación del mundo real".
El cifrado homomórfico, utilizado en la computación en la nube, recibe y ejecuta el cómputo todo en datos cifrados, llamado texto cifrado, y genera un resultado cifrado que luego puede ser descifrado por un usuario. Cuando se aplica a redes neuronales, esta técnica es particularmente rápida y eficiente encálculo de álgebra lineal. Sin embargo, debe introducir un poco de ruido en los datos en cada capa. En múltiples capas, el ruido se acumula y el cálculo necesario para filtrar ese ruido se vuelve cada vez más complejo, disminuyendo las velocidades de cálculo.
Los circuitos confusos son una forma de cómputo seguro de dos partes. La técnica toma una entrada de ambas partes, hace algunos cálculos y envía dos entradas separadas a cada parte. De esa manera, las partes se envían datos entre sí, peronunca ve los datos de la otra parte, solo la salida relevante de su lado. Sin embargo, el ancho de banda necesario para comunicar datos entre las partes se escala con la complejidad del cálculo, no con el tamaño de la entrada. En una red neuronal en línea, esta técnica funciona bien enlas capas no lineales, donde el cálculo es mínimo, pero el ancho de banda se vuelve difícil de manejar en capas lineales pesadas en matemáticas.
Los investigadores del MIT, en cambio, combinaron las dos técnicas de una manera que soluciona sus ineficiencias.
En su sistema, un usuario cargará texto cifrado a una CNN basada en la nube. El usuario debe tener una técnica de circuitos confusos que se ejecute en su propia computadora. La CNN realiza todos los cálculos en la capa lineal y luego envía los datos a la capa no linealEn ese punto, la CNN y el usuario comparten los datos. El usuario realiza algunos cálculos en circuitos confusos y envía los datos de vuelta a la CNN. Al dividir y compartir la carga de trabajo, el sistema restringe el cifrado homomórfico para hacer una capa matemática complejaa la vez, para que los datos no se vuelvan demasiado ruidosos. También limita la comunicación de los circuitos confusos a solo las capas no lineales, donde funciona de manera óptima.
"Solo estamos usando las técnicas para donde son más eficientes", dice Juvekar.
Compartir secreto
El paso final fue asegurar que las capas de circuito homomórficas y confusas mantuvieran un esquema de aleatorización común, llamado "intercambio secreto". En este esquema, los datos se dividen en partes separadas que se dan a partes separadas. Todas las partes sincronizan sus partes para reconstruir eldatos completos
En GAZELLE, cuando un usuario envía datos cifrados al servicio basado en la nube, se divide entre ambas partes. A cada recurso compartido se le agrega una clave secreta números aleatorios que solo la parte propietaria conoce. Durante el cómputo, cada parte siempretener una parte de los datos, más números aleatorios, por lo que parece completamente aleatorio. Al final del cómputo, las dos partes sincronizan sus datos. Solo entonces el usuario solicita su clave secreta al servicio basado en la nube.reste la clave secreta de todos los datos para obtener el resultado.
"Al final del cálculo, queremos que la primera parte obtenga los resultados de clasificación y la segunda parte no obtenga absolutamente nada", dice Juvekar. Además, "la primera parte no aprende nada sobre los parámetros del modelo".
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.
Cita esta página :