En un esfuerzo por mejorar la calidad de los registros de biodiversidad, el Atlas of Living Australia ALA y el Global Biodiversity Information Facility GBIF utilizan el procesamiento de datos automatizado para verificar elementos de datos individuales. Los registros son proporcionados al ALA y GBIF pormuseos, herbarios y otras fuentes de datos de biodiversidad.
Sin embargo, un análisis independiente de dichos registros informa que el procesamiento de datos ALA y GBIF también conduce a la pérdida de datos y cambios injustificados en los nombres científicos.
El estudio fue realizado por el Dr. Robert Mesibov, un especialista en milpiés australiano que también trabaja como auditor de datos. El Dr. Mesibov revisó alrededor de 800,000 registros recuperados del Museo Australiano, los Museos Victoria y la Colección de Artrópodos de Nueva Zelanda. Sus resultados se publican enel diario de acceso abierto ZooKeys y también archivado en un repositorio de datos público.
"Estaba interesado principalmente en los cambios realizados por los agregadores en los nombres de género y especie en los registros", dijo el Dr. Mesibov.
"Encontré que se cambiaron los nombres de hasta 1 de cada 5 registros, a menudo porque el agregador no pudo encontrar el nombre en la tabla de búsqueda que utilizó"
Otro resultado preocupante se refería a los especímenes tipo: los especímenes de referencia en los que se basan los nombres científicos. En varias ocasiones, se encontró que los agregadores habían reemplazado el nombre de un espécimen tipo con un nombre vinculado a un espécimen tipo completamente diferente.
La mayor sorpresa, según el Dr. Mesibov, fue el gran desacuerdo sobre los nombres entre los agregadores.
"Hubo muy poco acuerdo", explicó. "Un agregador cambiaría un nombre y el otro no, o lo cambiaría de una manera diferente".
Además, las fechas, los nombres y la información de la localidad a veces se perdieron de los registros, principalmente debido a errores de programación en el software utilizado por los agregadores para verificar los elementos de datos. En algunos campos de datos la pérdida alcanzó el 100%, sin elementos de datos originales sobreviviendo al procesamiento.
"La lección de esta auditoría es que la agregación de datos de biodiversidad no es inofensiva", dijo el Dr. Mesibov. "Puede perder y confundir datos perfectamente buenos".
"Los usuarios de datos agregados siempre deben descargar elementos de datos originales y procesados, y deben verificar la pérdida o modificación de datos, y el reemplazo de nombres", concluyó.
Fuente de la historia :
Materiales proporcionado por Editores Pensoft . Nota: El contenido puede ser editado por estilo y longitud.
Referencia del diario :
Cite esta página :