Modelado bayesiano geoespacial aplicado en la era de los grandes datos: desafíos y soluciones
Autores: Byers, Jason S.; Gill, Jeff
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Dos tendencias importantes en estadísticas aplicadas son un aumento en el uso de modelos geoespaciales y un aumento en el uso de big data. Naturalmente, ha habido superposición a medida que los analistas utilizan las técnicas asociadas con cada una. Con métodos geoespaciales como el kriging, el cálculo requerido se vuelve intensivo rápidamente, incluso con conjuntos de datos que no se considerarían enormes en otros contextos. En este trabajo describimos una solución al problema computacional de estimar modelos de kriging bayesiano con big data, Muestreo Espacial Aleatorio Bootstrap (BRSS), y primero proporcionamos un argumento analítico de que BRSS produce estimaciones consistentes del modelo espacial bayesiano. En segundo lugar, con un conjunto de datos de tamaño mediano sobre fracking en Virginia Occidental, mostramos que los efectos de las muestras de bootstrap de un modelo bayesiano de información completa se reducen con más muestras de bootstrap y más observaciones por muestra como en el bootstrap estándar. En tercer lugar, ofrecemos una ilustración realista del método analizando donantes de campañas en California con un gran conjunto de datos geocodificados. Con esta solución, los académicos no se verán limitados en su capacidad para aplicar modelos bayesianos geoespaciales teóricamente relevantes cuando el tamaño de los datos produzca problemas computacionales.
Descripción
Dos tendencias importantes en estadísticas aplicadas son un aumento en el uso de modelos geoespaciales y un aumento en el uso de big data. Naturalmente, ha habido superposición a medida que los analistas utilizan las técnicas asociadas con cada una. Con métodos geoespaciales como el kriging, el cálculo requerido se vuelve intensivo rápidamente, incluso con conjuntos de datos que no se considerarían enormes en otros contextos. En este trabajo describimos una solución al problema computacional de estimar modelos de kriging bayesiano con big data, Muestreo Espacial Aleatorio Bootstrap (BRSS), y primero proporcionamos un argumento analítico de que BRSS produce estimaciones consistentes del modelo espacial bayesiano. En segundo lugar, con un conjunto de datos de tamaño mediano sobre fracking en Virginia Occidental, mostramos que los efectos de las muestras de bootstrap de un modelo bayesiano de información completa se reducen con más muestras de bootstrap y más observaciones por muestra como en el bootstrap estándar. En tercer lugar, ofrecemos una ilustración realista del método analizando donantes de campañas en California con un gran conjunto de datos geocodificados. Con esta solución, los académicos no se verán limitados en su capacidad para aplicar modelos bayesianos geoespaciales teóricamente relevantes cuando el tamaño de los datos produzca problemas computacionales.