Incertidumbre en modelado arqueológico predictivo

Modelado conceptual y bases de datos arqueológicas: incorporando incertidumbre al modelado predictivo

Mi investigación doctoral se ha centrado, hasta ahora, en el desarrollo de modelos arqueológicos predictivos para varias regiones suizas. Estos modelos toman datos ambientales (como la calidad del suelo o las características del terreno) y lo localización de sitios arqueológicos conocidos como entrada, y producen una estimación cuantitativa de la probabilidad de que existan sitios arqueológicos relevantes en un lugar determinado, usando algoritmos de aprendizaje automático (random forests). Un problema de los datos de entrada es que a menudo proceden de fuentes diversas y vienen en formatos distintos, de modo que su interoperabilidad es muy baja. Además, suelen contener indicadores de vaguedad que son difíciles de interpretar y procesar. Por estos motivos, decidí invertir algún tiempo en mejorar la interoperabilidad de los datos y desarrollar una estructura común para los datos de diferentes fuentes. Además, decidí investigar en cómo los indicadores de vaguedad podrían ser estandarizados o mejorados para que fuesen más fáciles de reusar.

Tuve la suerte de obtener una ayuda SEADDA (Saving European Archaeology from the Digital Dark Age, www.seadda.eu) para realizar una estancia en el Incipit CSIC entre enero y abril de 2020. Esto me permitió trabajar en dos áreas distintas. En primer lugar, estudié el enfoque del Incipit para la gestión de la incertidumbre en datos arqueológicos a través del modelado conceptual usando ConML (www.conml.org). ConML proporciona una descripción cualitativa de la incertidumbre, de modo que, en colaboración con investigadores del Incipit y del Departamento de Filosofía de la Universidad de Santiago de Compostela, desarrollé un protocolo de cuantificación que permite (a mí o a cualquiera) asignar valores cuantitativos de incertidumbre a etiquetas lingüísticas (como “no seguro” o “desconocido”) de modo sistemático. Estos valores cuantitativos pueden ser procesados algorítmicamente como parte del modelo predictivo. En segundo lugar, exploré distintas técnicas estadísticas capaces de usar rangos de datos continuos como los de incertidumbre (que caen en el intervalo [0,1]). Para hacer esto, trabajé con especialistas en procesado de datos del Centro Singular de Investigación en Tecnoloxías Intelixentes (CITIUS) de la misma universidad, y estamos trabajando en la actualidad hacia una solución mejor.

Gracias a esta estancia, he desarrollado un enfoque claro para la cuantificación de la incertidumbre en datos arqueológicos, y he explorado distintos algoritmos para validar mejor los resultados de mis modelos predictivos. Al incorporar valores de incertidumbre cuantitativos, los conjuntos de datos arqueológicos se hacen más fácilmente reusables por terceras partes. Además, la aplicación de modelos predictivos descubrirá patrones en los datos existentes, y sugerirá posibles localizaciones de sitios hasta ahora desconocidos, generando así nuevo conocimiento y estableciendo bases para nuevas preguntas de investigación y oportunidades para nuevos proyectos. Finalmente, esta estancia me ha permitido hacer contactos con investigadores en áreas distintas (filosofía, informática), y me ha animado a escribir nuevas propuestas de proyectos.

Incertidumbre en modelado arqueológico predictivo

Modelado conceptual y bases de datos arqueológicas: incorporando incertidumbre al modelado predictivo

Mi investigación doctoral se ha centrado, hasta ahora, en el desarrollo de modelos arqueológicos predictivos para varias regiones suizas. Estos modelos toman datos ambientales (como la calidad del suelo o las características del terreno) y lo localización de sitios arqueológicos conocidos como entrada, y producen una estimación cuantitativa de la probabilidad de que existan sitios arqueológicos relevantes en un lugar determinado, usando algoritmos de aprendizaje automático (random forests). Un problema de los datos de entrada es que a menudo proceden de fuentes diversas y vienen en formatos distintos, de modo que su interoperabilidad es muy baja. Además, suelen contener indicadores de vaguedad que son difíciles de interpretar y procesar. Por estos motivos, decidí invertir algún tiempo en mejorar la interoperabilidad de los datos y desarrollar una estructura común para los datos de diferentes fuentes. Además, decidí investigar en cómo los indicadores de vaguedad podrían ser estandarizados o mejorados para que fuesen más fáciles de reusar.

Tuve la suerte de obtener una ayuda SEADDA (Saving European Archaeology from the Digital Dark Age, www.seadda.eu) para realizar una estancia en el Incipit CSIC entre enero y abril de 2020. Esto me permitió trabajar en dos áreas distintas. En primer lugar, estudié el enfoque del Incipit para la gestión de la incertidumbre en datos arqueológicos a través del modelado conceptual usando ConML (www.conml.org). ConML proporciona una descripción cualitativa de la incertidumbre, de modo que, en colaboración con investigadores del Incipit y del Departamento de Filosofía de la Universidad de Santiago de Compostela, desarrollé un protocolo de cuantificación que permite (a mí o a cualquiera) asignar valores cuantitativos de incertidumbre a etiquetas lingüísticas (como “no seguro” o “desconocido”) de modo sistemático. Estos valores cuantitativos pueden ser procesados algorítmicamente como parte del modelo predictivo. En segundo lugar, exploré distintas técnicas estadísticas capaces de usar rangos de datos continuos como los de incertidumbre (que caen en el intervalo [0,1]). Para hacer esto, trabajé con especialistas en procesado de datos del Centro Singular de Investigación en Tecnoloxías Intelixentes (CITIUS) de la misma universidad, y estamos trabajando en la actualidad hacia una solución mejor.

Gracias a esta estancia, he desarrollado un enfoque claro para la cuantificación de la incertidumbre en datos arqueológicos, y he explorado distintos algoritmos para validar mejor los resultados de mis modelos predictivos. Al incorporar valores de incertidumbre cuantitativos, los conjuntos de datos arqueológicos se hacen más fácilmente reusables por terceras partes. Además, la aplicación de modelos predictivos descubrirá patrones en los datos existentes, y sugerirá posibles localizaciones de sitios hasta ahora desconocidos, generando así nuevo conocimiento y estableciendo bases para nuevas preguntas de investigación y oportunidades para nuevos proyectos. Finalmente, esta estancia me ha permitido hacer contactos con investigadores en áreas distintas (filosofía, informática), y me ha animado a escribir nuevas propuestas de proyectos.