Trabajar con modelos computacionales es trabajar en un mundo de incógnitas: los modelos que simulan procesos físicos complejos, desde el clima cambiante de la Tierra hasta el desempeño de motores de combustión hipersónicos, son asombrosamente complejos, a veces incorporan cientos de parámetros, cada uno de los cualesdescribe una parte del proceso más amplio.
Los parámetros son a menudo signos de interrogación dentro de sus modelos, y sus contribuciones al conjunto en gran parte se desconocen. Para estimar el valor de cada parámetro desconocido se requiere ingresar cientos, si no miles, de valores y ejecutar el modelo cada vez para reducir unvalor exacto: un cálculo que puede llevar días y, a veces, semanas.
Ahora, los investigadores del MIT han desarrollado un nuevo algoritmo que reduce enormemente el cálculo de prácticamente cualquier modelo computacional. El algoritmo se puede considerar como una diana que se encoge que, en varias ejecuciones de un modelo, y en combinación con algunos puntos de datos relevantes, se reduce incrementalmente en su objetivo: una distribución de probabilidad de valores para cada parámetro desconocido.
Con este método, los investigadores pudieron llegar a la misma respuesta que los enfoques computacionales clásicos, pero 200 veces más rápido.
Youssef Marzouk, profesor asociado de aeronáutica y astronáutica, dice que el algoritmo es lo suficientemente versátil como para aplicarse a una amplia gama de problemas computacionalmente intensivos.
"Somos algo flexibles sobre la aplicación particular", dice Marzouk. "Estos modelos existen en una amplia gama de campos, desde la ingeniería y la geofísica hasta el modelado del subsuelo, muy a menudo con parámetros desconocidos. Queremos tratar el modelo como uncaja negra y decir: '¿Podemos acelerar este proceso de alguna manera?' Eso es lo que hace nuestro algoritmo ".
Marzouk y sus colegas, el reciente doctorado Patrick Conrad, Natesh Pillai de la Universidad de Harvard y Aaron Smith de la Universidad de Ottawa, han publicado sus hallazgos esta semana en el Revista de la Asociación Estadounidense de Estadística .
Modelado 'Monopolio'
Al trabajar con modelos complicados que involucran múltiples parámetros desconocidos, los informáticos suelen emplear una técnica llamada análisis de cadena de Markov Monte Carlo MCMC, un método de muestreo estadístico que a menudo se explica en el contexto del juego de mesa 'Monopoly'.
Para planificar un monopolio, desea saber en qué propiedades aterrizan los jugadores con más frecuencia; esencialmente, un parámetro desconocido. Cada espacio en el tablero tiene una probabilidad de aterrizar, determinada por las reglas del juego, las posicionesde cada jugador, y el lanzamiento de dos dados. Para determinar la distribución de probabilidad en el tablero el rango de posibilidades que tiene cada espacio de aterrizar, puede lanzar el dado cientos de veces.
Si tira el dado suficientes veces, puede tener una idea bastante clara de dónde es más probable que caigan los jugadores. Así es, esencialmente, cómo funciona un análisis MCMC: ejecutando un modelo una y otra vez, con diferentes entradas, para determinaruna distribución de probabilidad para un parámetro desconocido. Para modelos más complicados que involucran múltiples incógnitas, el mismo método puede tomar días o semanas para calcular una respuesta.
Reducción de la diana
Con su nuevo algoritmo, Marzouk y sus colegas pretenden acelerar significativamente el proceso de muestreo convencional.
"Lo que hace nuestro algoritmo es cortocircuitar este modelo y lo pone en un modelo aproximado", explica Marzouk. "Puede ser varios órdenes de magnitud más baratos de evaluar".
El algoritmo se puede aplicar a cualquier modelo complejo para determinar rápidamente la distribución de probabilidad, o los valores más probables, para un parámetro desconocido. Al igual que el análisis MCMC, el algoritmo ejecuta un modelo dado con varias entradas, aunque con moderación, ya que estoEl proceso puede llevar bastante tiempo. Para acelerar el proceso, el algoritmo también utiliza datos relevantes para ayudar a reducir los valores aproximados de los parámetros desconocidos.
En el contexto de 'Monopoly', imagina que el tablero es esencialmente un terreno tridimensional, con cada espacio representado como un pico o valle. Cuanto más alto es el pico de un espacio, mayor es la probabilidad de que el espacio sea un lugar de aterrizaje popular.Para averiguar los contornos exactos del tablero, la distribución de probabilidad, el algoritmo lanza el dado en cada turno y alterna entre el uso del modelo computacionalmente costoso y la aproximación. Con cada lanzamiento del dado, el algoritmo vuelve a referirse a ladatos y cualquier evaluación previa del modelo que se haya recopilado.
Al comienzo del análisis, el algoritmo básicamente dibuja grandes y vagas diana sobre todo el terreno de la tabla. Después de sucesivas ejecuciones con el modelo o los datos, las diana del algoritmo se reducen progresivamente, enfocándose en los picos enel terreno: los espacios o valores que tienen más probabilidades de representar el parámetro desconocido.
'Fuera de lo normal'
El grupo probó el algoritmo en dos modelos relativamente complejos, cada uno con un puñado de parámetros desconocidos. En promedio, el algoritmo llegó a la misma respuesta que cada modelo, pero 200 veces más rápido.
"Lo que esto significa a largo plazo es que las cosas que pensaba que no eran manejables ahora pueden volverse factibles", dice Marzouk. "Para un problema insoluble, si tuviera dos meses y una computadora enorme, podría obtener alguna respuesta,pero no necesariamente sabrá qué tan precisa fue. Ahora, por primera vez, podemos decir que si ejecuta nuestro algoritmo, puede garantizar que encontrará la respuesta correcta y que podría hacerlo en un día. Anteriormente esa garantía estaba ausente. "
Marzouk y sus colegas han aplicado el algoritmo a un modelo complejo para simular el movimiento del hielo marino en la Antártida, que involucra 24 parámetros desconocidos, y encontraron que el algoritmo es 60 veces más rápido para llegar a una estimación que los métodos actuales. Él planea probar elalgoritmo siguiente en modelos de sistemas de combustión para jets supersónicos.
"Este es un modelo súper caro para una tecnología muy futurista", dice Marzouk. "Puede haber cientos de parámetros desconocidos, porque está operando fuera del régimen normal. Eso es emocionante para nosotros".
Esta investigación fue apoyada, en parte, por el Departamento de Energía.
Fuente de la historia :
Materiales proporcionado por Instituto de Tecnología de Massachusetts . Original escrito por Jennifer Chu. Nota: el contenido se puede editar por estilo y longitud.
Referencia de la revista :
cite esta página :