Noticias de ciencia

de organizaciones de investigación

Seguridad más eficiente para el aprendizaje automático basado en la nube

La combinación novedosa de dos técnicas de encriptación protege los datos privados, mientras mantiene las redes neuronales funcionando rápidamente

Fecha :: 17 de agosto de 2018
Fuente :: Instituto de Tecnología de Massachusetts
Resumen :: Un novedoso método de cifrado asegura los datos utilizados en las redes neuronales en línea, sin ralentizar drásticamente sus tiempos de ejecución. Este enfoque es prometedor para usar redes neuronales basadas en la nube para el análisis de imágenes médicas y otras aplicaciones que usan datos confidenciales.
Compartir :

HISTORIA COMPLETA

Un novedoso método de encriptación ideado por investigadores del MIT asegura los datos utilizados en las redes neuronales en línea, sin ralentizar drásticamente sus tiempos de ejecución. Este enfoque es prometedor para usar redes neuronales basadas en la nube para el análisis de imágenes médicas y otras aplicaciones que usan datos confidenciales.

anuncio

Outsourcing machine learning es una tendencia creciente en la industria. Las principales empresas tecnológicas han lanzado plataformas en la nube que realizan tareas pesadas de computación, como, por ejemplo, ejecutar datos a través de una red neuronal convolucional CNN para la clasificación de imágenes. Pequeñas empresas con recursos limitadosy otros usuarios pueden cargar datos a esos servicios por una tarifa y obtener resultados en varias horas.

¿Pero qué pasa si hay filtraciones de datos privados? En los últimos años, los investigadores han explorado varias técnicas de computación segura para proteger dichos datos confidenciales. Pero esos métodos tienen inconvenientes en el rendimiento que hacen que la evaluación de la red neuronal prueba y validación sea lenta, a veceshasta un millón de veces más lento, lo que limita su adopción más amplia.

En un documento presentado en la Conferencia de Seguridad USENIX de esta semana, los investigadores del MIT describen un sistema que combina dos técnicas convencionales: cifrado homomórfico y circuitos confusos, de una manera que ayuda a las redes a ejecutar órdenes de magnitud más rápido que con los enfoques convencionales.

Los investigadores probaron el sistema, llamado GAZELLE, en tareas de clasificación de imágenes de dos partes. Un usuario envía datos de imágenes cifradas a un servidor en línea que evalúa una CNN que se ejecuta en GAZELLE. Después de esto, ambas partes comparten información cifrada de un lado a otro en ordenpara clasificar la imagen del usuario. A lo largo del proceso, el sistema garantiza que el servidor nunca aprenda ningún dato cargado, mientras que el usuario nunca aprende nada sobre los parámetros de red. Sin embargo, en comparación con los sistemas tradicionales, GAZELLE funcionó de 20 a 30 veces más rápido que el estadomodelos de última generación, al tiempo que reduce el ancho de banda de red requerido en un orden de magnitud.

Una aplicación prometedora para el sistema es entrenar a las CNN para diagnosticar enfermedades. Los hospitales podrían, por ejemplo, entrenar a una CNN para aprender características de ciertas afecciones médicas a partir de imágenes de resonancia magnética MRI e identificar esas características en las MRI cargadas. El hospital podría hacerel modelo disponible en la nube para otros hospitales. Pero el modelo está entrenado y se basa más en datos privados de pacientes. Debido a que no hay modelos de cifrado eficientes, esta aplicación no está lista para el horario estelar.

anuncio

"En este trabajo, mostramos cómo hacer eficientemente este tipo de comunicación segura de dos partes combinando estas dos técnicas de una manera inteligente", dice el primer autor Chiraag Juvekar, estudiante de doctorado en el Departamento de Ingeniería Eléctrica y Ciencias de la ComputaciónEECS. "El siguiente paso es tomar datos médicos reales y demostrar que, incluso cuando los escalamos para las aplicaciones que les interesan a los usuarios reales, aún proporcionan un rendimiento aceptable".

Los coautores del artículo son Vinod Vaikuntanathan, profesor asociado en EECS y miembro del Laboratorio de Ciencias de la Computación e Inteligencia Artificial, y Anantha Chandrakasan, decana de la Escuela de Ingeniería y el Profesor Vannevar Bush de Ingeniería Eléctrica y Ciencias de la Computación.

Maximizando el rendimiento

Los CNN procesan datos de imagen a través de múltiples capas de cálculo lineales y no lineales. Las capas lineales hacen los cálculos matemáticos complejos, llamados álgebra lineal, y asignan algunos valores a los datos. En un cierto umbral, los datos se envían a capas no lineales que hacen algo más simplecómputo, tomar decisiones como identificar características de imagen y enviar los datos a la siguiente capa lineal. El resultado final es una imagen con una clase asignada, como vehículo, animal, persona o característica anatómica.

Los enfoques recientes para proteger las CNN han implicado la aplicación de cifrado homomórfico o circuitos confusos para procesar datos en toda una red. Estas técnicas son efectivas para asegurar los datos. "En el papel, parece que resuelve el problema", dice Juvekar. Pero rindenredes neuronales complejas ineficientes, "por lo que no las usaría para ninguna aplicación del mundo real".

El cifrado homomórfico, utilizado en la computación en la nube, recibe y ejecuta el cómputo todo en datos cifrados, llamado texto cifrado, y genera un resultado cifrado que luego puede ser descifrado por un usuario. Cuando se aplica a redes neuronales, esta técnica es particularmente rápida y eficiente encálculo de álgebra lineal. Sin embargo, debe introducir un poco de ruido en los datos en cada capa. En múltiples capas, el ruido se acumula y el cálculo necesario para filtrar ese ruido se vuelve cada vez más complejo, disminuyendo las velocidades de cálculo.

anuncio

Los circuitos confusos son una forma de cómputo seguro de dos partes. La técnica toma una entrada de ambas partes, hace algunos cálculos y envía dos entradas separadas a cada parte. De esa manera, las partes se envían datos entre sí, peronunca ve los datos de la otra parte, solo la salida relevante de su lado. Sin embargo, el ancho de banda necesario para comunicar datos entre las partes se escala con la complejidad del cálculo, no con el tamaño de la entrada. En una red neuronal en línea, esta técnica funciona bien enlas capas no lineales, donde el cálculo es mínimo, pero el ancho de banda se vuelve difícil de manejar en capas lineales pesadas en matemáticas.

Los investigadores del MIT, en cambio, combinaron las dos técnicas de una manera que soluciona sus ineficiencias.

En su sistema, un usuario cargará texto cifrado a una CNN basada en la nube. El usuario debe tener una técnica de circuitos confusos que se ejecute en su propia computadora. La CNN realiza todos los cálculos en la capa lineal y luego envía los datos a la capa no linealEn ese punto, la CNN y el usuario comparten los datos. El usuario realiza algunos cálculos en circuitos confusos y envía los datos de vuelta a la CNN. Al dividir y compartir la carga de trabajo, el sistema restringe el cifrado homomórfico para hacer una capa matemática complejaa la vez, para que los datos no se vuelvan demasiado ruidosos. También limita la comunicación de los circuitos confusos a solo las capas no lineales, donde funciona de manera óptima.

"Solo estamos usando las técnicas para donde son más eficientes", dice Juvekar.

Compartir secreto

El paso final fue asegurar que las capas de circuito homomórficas y confusas mantuvieran un esquema de aleatorización común, llamado "intercambio secreto". En este esquema, los datos se dividen en partes separadas que se dan a partes separadas. Todas las partes sincronizan sus partes para reconstruir eldatos completos

En GAZELLE, cuando un usuario envía datos cifrados al servicio basado en la nube, se divide entre ambas partes. A cada recurso compartido se le agrega una clave secreta números aleatorios que solo la parte propietaria conoce. Durante el cómputo, cada parte siempretener una parte de los datos, más números aleatorios, por lo que parece completamente aleatorio. Al final del cómputo, las dos partes sincronizan sus datos. Solo entonces el usuario solicita su clave secreta al servicio basado en la nube.reste la clave secreta de todos los datos para obtener el resultado.

"Al final del cálculo, queremos que la primera parte obtenga los resultados de clasificación y la segunda parte no obtenga absolutamente nada", dice Juvekar. Además, "la primera parte no aprende nada sobre los parámetros del modelo".

marque la diferencia: oportunidad patrocinada

Fuente de la historia :

Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Rob Matheson. Nota: El contenido puede ser editado por estilo y longitud.

Cita esta página :

Instituto de Tecnología de Massachusetts. "Seguridad más eficiente para el aprendizaje automático basado en la nube: la combinación novedosa de dos técnicas de cifrado protege los datos privados, mientras mantiene las redes neuronales funcionando rápidamente". ScienceDaily. ScienceDaily, 17 de agosto de 2018. .

Massachusetts Institute of Technology. 2018, 17 de agosto. Seguridad más eficiente para el aprendizaje automático basado en la nube: la combinación novedosa de dos técnicas de cifrado protege los datos privados, mientras mantiene las redes neuronales funcionando rápidamente. ScienceDaily . Recuperado el 18 de julio de 2020 de www.science-things.com/releases/2018/08/180817125349.htm

Instituto de Tecnología de Massachusetts. "Seguridad más eficiente para el aprendizaje automático basado en la nube: la combinación novedosa de dos técnicas de encriptación protege los datos privados y mantiene las redes neuronales funcionando rápidamente". ScienceDaily. Www.science-things.com/releases/2018/08 / 180817125349.htm consultado el 18 de julio de 2020.

TEMAS RELACIONADOS
- Computadoras y matemáticas

anuncio

TÉRMINOS RELACIONADOS

HISTORIAS RELACIONADAS

DE ALREDEDOR DE LA WEB

A continuación hay artículos relevantes que pueden interesarle. ScienceDaily comparte enlaces con publicaciones académicas en el red TrendMD y gana ingresos de terceros anunciantes, donde se indique.

1

2

Seguridad más eficiente para el aprendizaje automático basado en la nube

La combinación novedosa de dos técnicas de encriptación protege los datos privados, mientras mantiene las redes neuronales funcionando rápidamente

1

2

3

4

5

1

2

3

4

5

Los científicos proponen un plan para determinar si el Planeta Nueve es un agujero negro primordial

Nueva investigación de la luz más antigua confirma la edad del universo

Las primeras imágenes del Orbitador Solar revelan 'fogatas' en el sol

Los mejores y peores materiales para máscaras

El mejor material para las mascarillas caseras puede ser una combinación de dos telas

matar el coronavirus con un dispositivo portátil de luz ultravioleta puede ser factible

El primer lenguaje de programación intuitivo para computadoras cuánticas

Creado 'neurotransistor artificial'

Robot Jaws muestra que el chicle medicado podría ser el futuro

Separando ráfagas de rayos gamma: los estudiantes hacen un avance crítico

Cómo mueren las galaxias: nuevas ideas sobre el enfriamiento de la formación estelar

En un primer momento, los astrónomos ven desaparecer la corona de un agujero negro y luego reaparecen

Evidencia de décadas de teoría antigua para explicar los comportamientos extraños del agua

Los cristales 'parpadeantes' pueden convertir CO2 en combustibles

Bacterias con una dieta de metal descubiertas en cristalería sucia

Una GoPro para escarabajos: los investigadores crean una mochila con cámara robótica para insectos

Dando a los robots una percepción humana de sus entornos físicos

Los investigadores dan a los robots habilidades de detección inteligente para llevar a cabo tareas complejas