No sorprende que los datos de los consumidores sean recopilados continuamente por varias organizaciones, incluidos los gobiernos locales, agencias de marketing y compañías de redes sociales. Estas organizaciones aseguran el anonimato y la confidencialidad al recopilar estos datos, sin embargo, las leyes de privacidad de datos existentes no garantizanque las violaciones de datos no ocurrirán. Según un informe reciente, más de 2,000 violaciones de datos confirmadas ocurrieron solo en 2019, con el 34% de las ejecutadas por actores internos como los empleados. Además, las agencias municipales y estatales recopilan datos confidencialesque están obligados por ley a compartir con el público, cortesía de los movimientos de Datos Abiertos y la Ley de Libertad de Información.
Las leyes de privacidad de datos requieren cifrado y, en algunos casos, transformar los datos originales en "datos protegidos" antes de que se divulguen a terceros. Pero para investigadores como Matthew Schneider, PhD, profesor asistente de Ciencias de la Decisión y Sistemas de Información de Gestión en DrexelLeBow College of Business de la Universidad, esto no es adecuado.
"El cifrado definitivamente ayuda, pero no evita una violación de datos", dijo. "Es similar a proteger su contraseña de correo electrónico. Un actor interno con acceso a la clave de cifrado podría causar fácilmente una violación de datos. Es más conservador de unperspectiva de riesgo para asumir que todos los datos eventualmente saldrán y deberían transformarse antes de compartirlos en cualquier lugar dentro de la organización ".
En un artículo reciente publicado en el Diario de Marketing Analytics , Schneider y Dawn Iacobucci, PhD, de la Universidad de Vanderbilt, propusieron una nueva metodología que altera permanentemente los conjuntos de datos de encuestas para proteger la privacidad de los consumidores, cuando los datos se comparten, al tiempo que conserva un nivel de precisión razonable para estos conjuntos de datos.
Según los autores, los datos de la encuesta a menudo se almacenan dentro de las organizaciones y se utilizan para fines más allá de la razón original para recopilar los datos. "Las bases de datos y la información del cliente se han convertido en un activo contemporáneo que hace que un negocio sea atractivo para otro al forjar alianzas", Schneider"Incluso las empresas con altos estándares de seguridad de datos pueden encontrar un desafío para proteger la privacidad de los datos del consumidor".
Según los autores, otra amenaza menos común, pero demasiado real, son los casos en que los empleados han llevado ilegalmente datos de sus antiguas compañías a un puesto con un nuevo empleador, por razones que van desde obtener una impresión favorable conla nueva empresa, perjudicar a la antigua empresa, incluso tener que proporcionar los datos como condición de la oferta de trabajo.
Para Schneider, la solución para cumplir las promesas de privacidad de datos resulta ser tecnológica.
"Los datos de la encuesta se utilizan cada vez más para el análisis a nivel del encuestado, como el enlace a otros conjuntos de datos propietarios, y las promesas de privacidad pueden no estar garantizadas en la miríada de usos posteriores de los datos", dijo Schneider. "La confidencialidad no garantizaanonimato. Se necesitan alrededor de tres o cuatro preguntas cuidadosamente formuladas en una encuesta para identificar de manera única a cualquiera ".
En el documento, los autores analizaron un conjunto de datos de la encuesta que fue recolectado en 2015 por la ciudad de Austin, Texas y publicado al público luego de un movimiento de Datos Abiertos. Otras ciudades tienen movimientos similares, incluyendo Nueva York y Filadelfia.
"Hay muchos riesgos de privacidad en los datos abiertos, ya que no lo hacen tan bien como el gobierno federal que tiene el gran presupuesto y los recursos para contratar estadísticos, economistas o informáticos para abordar este problema tecnológico", dijo Schneider."La protección a menudo depende de cómo se usen los datos".
La ciudad de Austin administró una encuesta a 2.614 asiáticos estadounidenses que viven en la ciudad para explorar las necesidades de salud y servicios de una de las poblaciones de más rápido crecimiento de la ciudad con el objetivo de crear niveles más altos de participación comunitaria, políticas e identificar recursos para abordar las necesidadesde la comunidad asiático-americana.Los funcionarios en Austin publicaron sus conjuntos de datos, según sea necesario, para que estén disponibles para los usuarios.
En un conjunto de datos de la encuesta, a cada encuestado se le preguntó su origen étnico, que tenía 32 categorías; edad, que tenía 77 categorías; código postal, que tenía 61 categorías; y género.
"Casi todos son identificables con estas cuatro variables, algunas más que otras", dijo Schneider. "Una vez que las identifica, esta encuesta reveló otras respuestas sensibles como el estado laboral, la afiliación religiosa, los ingresos del hogar, la asequibilidad de la vivienda y muchaspreguntas de actitud "
Del mismo modo, la ciudad de Nueva York experimentó un problema de datos abiertos con la Comisión de taxis y limusinas de la ciudad de Nueva York, donde se podían rastrear 124 millones de rutas de conducción hasta la dirección de la casa del conductor.
Un desafío importante cuando se consideran metodologías para alterar los datos de los participantes de manera efectiva es hacerlo de una manera que no cambie en gran medida la precisión de los resultados de la encuesta. La metodología propuesta por los autores se basó en una técnica que se encuentra en las aplicaciones de secuenciación genómicaque pudo disfrazar la identidad de los consumidores al tiempo que mantuvo la precisión de las ideas dentro del 5%.
"Nuestro método esencialmente 'barajaría' los datos demográficos en un conjunto de datos de encuestas", dijo Schneider. "Pero, a diferencia de los métodos anteriores, el nuestro solo baraja los datos cuando mantiene las correlaciones entre variables importantes que son esenciales para los analistas. Los datos protegidosse simula a nivel del consumidor, pero sigue siendo valioso para el usuario final. Si este conjunto de datos se publicara, solo se conocerían las ideas de la organización ".
Fuente de la historia :
Materiales proporcionado por Universidad de Drexel . Original escrito por Niki Gianakaris. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :