Después de que la Oficina del Censo de EE. UU. Anunciara que estaba cambiando la forma en que protege las identidades de las personas para el Censo 2020, un equipo de investigación dirigido por Penn State comenzó a evaluar cómo estos cambios pueden afectar la integridad de los datos del censo.
La Oficina del Censo propone utilizar la privacidad diferencial, un nuevo método que intenta proteger las identidades de las personas cuando publican datos públicos. Los datos del censo se utilizan para distribuir fondos federales que afectan a las comunidades y también determinan la representación en el Congreso.
Alexis Santos, profesor asistente de desarrollo humano y estudios familiares en Penn State, junto con los investigadores Jeffrey Howard, profesor asistente en la Universidad de Texas en San Antonio, y Ashton Verdery, profesor asistente de sociología, demografía y análisis de datos sociales enPenn State, examinó las tasas de mortalidad en 2010. Los investigadores compararon ambos métodos de protección de la privacidad y la implicación de este cambio para comprender mejor las disparidades de salud en los Estados Unidos. El trabajo fue publicado recientemente en Actas de la Academia Nacional de Ciencias .
El equipo de investigación descubrió que cuando se usaba el método de privacidad diferencial en los datos del Censo, producía cambios dramáticos en los recuentos de población para minorías raciales y étnicas en comparación con los métodos tradicionales.
"Nos centramos en las estimaciones de la tasa de mortalidad porque son una métrica esencial a nivel de población para la cual se recopilan y difunden datos a nivel nacional y porque las tasas de mortalidad son un indicador crítico de la salud de la población", dijo Santos.
El equipo de investigación luego exploró los cambios en las tasas de mortalidad resultantes de los dos sistemas para evitar revelaciones por clasificaciones metropolitanas.
"Descubrimos que mediante el uso de privacidad diferencial, hubo casos de sub y sobre conteo de la población. En las zonas rurales, hubo un recuento de minorías raciales y étnicas, mientras que en las zonas urbanas hubo un conteo excesivo de estas poblaciones", Dijo Santos.
Los investigadores encontraron que algunas discrepancias entre los dos métodos de análisis de datos excedían una diferencia del 10%.
"Esto es muy preocupante porque podría afectar la cantidad de fondos que reciben los programas para un área geográfica específica", dijo Santos. "Estas discrepancias podrían dar lugar a riesgos de salud subestimados en algunas áreas y exagerar en otras donde no haygran necesidad."
Según Santos, los hallazgos destacan las consecuencias de implementar una privacidad diferencial y demuestran los desafíos en el uso de los productos de datos derivados de este método.
"La Oficina del Censo ha sido muy receptiva a nuestra investigación, y demostró preocupación por la exactitud de los datos", dijo Santos. "Planeamos avanzar con investigaciones adicionales para determinar cómo la privacidad diferencial puede afectar las estimaciones de crecimiento de la población y los cambios en las poblaciones"de año censal a año censal. Todavía tenemos tiempo para ajustar el algoritmo de privacidad diferencial, y nuestra investigación ayudará a identificar áreas de mejora ".
Santos, quien también es miembro cofundador del Instituto de Investigación de Ciencias Sociales, y el equipo de investigación fueron apoyados por el Instituto de Investigación de Población y el Acelerador de Datos Administrativos en Penn State. El trabajo también es apoyado por el Centro para la Comunidad yInvestigación de Salud Aplicada en la Universidad de Texas en San Antonio.
Fuente de la historia :
Materiales proporcionado por Estado Penn . Original escrito por Kristie Auman-Bauer y Melissa Krug. Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cita esta página :