Model-based data worth analysis for groundwater systems with the use of surrogate models

Autor: Gosses, Moritz
Jazyk: angličtina
Rok vydání: 2020
Předmět:
Druh dokumentu: Text<br />Doctoral Thesis
Popis: The aim of this work is the improvement of model-based data worth analysis for groundwater systems with the use of surrogate models. Physically-based groundwater models are wide-spread tools used to make diverse predictions for research and management problems. They allow incorporation of system knowledge and a multitude of data. Often, this complexity is accompanied with high model run times. This is especially problematic for applications such as uncertainty analysis or data worth analysis, which necessitate many model runs. Surrogate models aim to address these challenges with run time reduction through simplification of the model, usually through techniques of the following three major categories: projection-based methods, data-driven methods and structural reduction methods. The run time reduction through the use of surrogate models is associated with impairments regarding their applicability, accuracy of system representation, predictive uncertainty quantification and integration of system knowledge. In light of these potential limitations, this thesis compares the ability of three different surrogate models in reproducing diverse model predictions and data worth estimates of a complex, real-world benchmark model. The surrogates used are a spatially and parametrically simplified physically-based model, a set of artificial neural networks (ANNs) and a projection-based 'proper orthogonal decomposition' (POD) model. In the first part of this dissertation, the potentials and shortcomings of the popular POD method in regard to boundary representation are detailed and an extension of the method for accurate boundary depiction is proposed. The explicit treatment of boundary conditions is shown to eliminate reduction-induced errors at Dirichlet and Neumann boundaries (and reduce errors at Cauchy boundaries) for a small trade-off in general groundwater head accuracy. Ease of implementation and the potential for purposeful application of the extension allow modelers a target-oriented refinement of POD models. The second part of this dissertation addresses the challenge of quantifying the model simplification error of a surrogate model in light of erroneousness of their model predictions. An existing method for predictive uncertainty quantification is extended to estimate the simplification error and bias of different model predictions of all three surrogate models compared to the complex benchmark model predictions. Results show that the magnitude and structure of model simplification error is highly dependent on both the type of model prediction and surrogate model. In the final part of the thesis, two of the surrogate models are compared with the complex model in their application for analysis of worth of different data types. First-order second-moment data worth analysis methods are extended to account for the non-uniqueness of calibrated model parameters in a robust method. It is then used in collaboration with the surrogate models to analyze the worth of existing, 'future' and 'parametric' data for varying model predictions. The comparison of changes in predictive uncertainty variance between complex model and the surrogates shows that the simplified, physically-based model is only able to identify data worth in the existing calibration data set. The POD model is a suitable surrogate for data worth analysis in regards to all differing predictions and worth of existing, 'future' and 'parametric' data when combined with the strengths of the proposed robust data worth analysis method.:1 Introduction 2 State of the art 2.1 Surrogate modeling for groundwater systems 2.1.1 Introduction 2.1.2 Projection-based methods 2.1.3 Data-driven methods 2.1.4 Structural simplification methods 2.1.5 Open research questions 2.2 Uncertainty and data worth analysis 2.2.1 Introduction 2.2.2 Sources of uncertainty in groundwater modeling 2.2.3 Types of uncertainty analysis 2.2.4 Data worth analysis 2.2.5 Open research questions 3 Objectives and contributions 3.1 Explicit boundary treatment in POD 3.2 Analysis of model simplification error 3.3 Robust data worth analysis using surrogate models 3.4 Expected impact 4 Methods 4.1 The Wairau Plain aquifer, the complex model and its surrogates 4.1.1 The Wairau Plain aquifer 4.1.2 Complex MODFLOW model of the Wairau Plain aquifer (CM) 4.1.3 Surrogate 1: simplified MODFLOW model (SM1,sMm) 4.1.4 Surrogate 2: linearized POD model (SM2,POD) 4.1.5 Surrogate 3: artificial neural networks (SM3,ANN) 4.2 POD extension for explicit boundary treatment 4.2.1 Groundwater models and basic POD 4.2.2 Theory of explicit treatment of boundary conditions in POD 4.2.3 Different boundary conditions in eb-POD 4.2.4 Cost of eb-POD compared to basic POD 4.3 Model simplification error analysis - theory 4.3.1 A linear model, solution space and null-space 4.3.2 Surrogate model: definition and calibration 4.3.3 Parameter simplification - relationship between complex model and surrogate model parameters 4.3.4 Simplification error of surrogate model predictions 4.4 Model simplification error analysis - scatter plot analysis 4.4.1 Methodology 4.4.2 General features of the scatter plots 4.4.3 Contributions of error terms 4.4.4 Prediction pairs 4.4.5 Summary 4.5 Robust data worth analysis 4.5.1 First-order second-moment uncertainty estimation 4.5.2 Worth of data 4.5.3 Generating calibrated parameter sets - null-space parameter perturbation 4.5.4 Robust data worth analysis 5 Results and discussion 5.1 Explicit treatment of boundary conditions in POD 5.1.1 (Variable) Dirichlet boundaries 5.1.2 Neumann boundaries 5.1.3 Cauchy boundaries 5.1.4 Applying eb-POD: summary 5.2 Quantifying model simplification error 5.2.1 Simplified MODFLOW model: SM1,sMm 5.2.2 POD surrogate model: SM2,POD 5.2.3 ANN surrogate model: SM3,ANN 5.2.4 Surrogate comparison: simplification errors in model predictions 5.3 Robust data worth analysis using surrogate models 5.3.1 Worth of existing data 5.3.2 Worth of 'future' data 5.3.3 Worth of 'parametric' data 5.3.4 Data worth with surrogate models: summary 5.4 Discussion 6 Conclusions and outlook A Appendix: Publications
Das Ziel dieser Arbeit ist die Verbesserung modellbasierter Datenwertanalyse in Grundwassersystemen mittels Ersatzmodellen. Vielfältige Fragestellungen im Fachgebiet Grundwasser werden in Wissenschaft und Praxis mithilfe von physikalisch basierten Modellen beantwortet. Solche Modelle können hierbei vorhandene Kenntnisse über das System sowie eine Vielzahl gemessener Daten einbinden. Jedoch führt die zugrundeliegende Komplexität häufig zu langen Modelllaufzeiten, was insbesondere für Anwendungen mit vielen Modellläufen, wie Unsicherheits- oder Datenwertanalyse, problematisch ist. Hier greifen Ersatzmodelle an: eine Vereinfachung des Modells reduziert die zugehörigen Laufzeiten. Solche Ersatzmodelle lassen sich in drei Kategorien einteilen: projektionsbasierte Methoden, datengetriebene Methoden und strukturreduzierende Methoden. Ersatzmodelle haben jedoch auch verschiedene Nachteile: eingeschränkte Anwendbarkeit, geringere Genauigkeit der Systemabbildung, verringerte Qualität ihrer Vorhersage- und Unsicherheitsschätzung, sowie Restriktionen bei der Integrierung vorhandener Systemkenntnisse. Zur Abschätzung dieser möglichen Einschränkungen vergleicht diese Arbeit drei verschiedene Ersatzmodelle mit einem realen, komplexen Benchmarkmodell in Bezug auf ihre Fähigkeit, verschiedene Modellvorhersagen und Datenwertabschätzungen glaubhaft zu reproduzieren. Die drei Ersatzmodelle sind: ein räumlich und parametrisch vereinfachtes, physikalisch basiertes Modell, ein Verbund künstlicher neuronaler Netze und ein projektionsbasiertes 'proper orthogonal decomposition' (POD) Modell. Der erste Teil der Arbeit widmet sich den Ungenauigkeiten der weitverbreiteten POD Methode bei der Abbildung von Randbedingungen und zeigt eine Erweiterung der Methode zur präziseren Darstellung der Randbedingungen in POD auf. Es wird nachgewiesen, dass diese explizite Behandlung der Randbedingungen in POD reduktionsbasierte Fehler in den Dirichlet- und Neumann-Randbedingungen eliminiert sowie Fehler in den Cauchy-Randbedingungen reduziert. Die Methode führt jedoch zu einer leicht verringerten Genauigkeit bei der allgemeinen Abbildung der Grundwasserstände im Vergleich zu herkömmlichen POD. Dennoch ist die Methode ein nützliches Werkzeug, da sie eine zielgerichtete Anpassung von POD-Ersatzmodellen erlaubt. Der zweite Teil der Arbeit stellt sich der Aufgabe, den durch die Modellvereinfachung eingebrachten Fehler der Ersatzmodelle bezogen auf ihre Modellvorhersagen zu beurteilen. Hierzu wird eine vorhandene Methode zur Berechnung von Vorhersageunsicherheiten angepasst und erweitert, um Fehler und Bias durch Modellvereinfachung zwischen den drei Ersatzmodellen und dem Benchmarkmodell für verschiedene Modellvorhersagen abzuschätzen. Die Ergebnisse zeigen, dass Größe und Struktur des Fehlers durch Modellvereinfachung stark von der Art der Modellvorhersage und des jeweiligen Ersatzmodells abhängen. Im letzten Teil der Arbeit werden zwei der Ersatzmodelle mit dem Benchmarkmodell bezüglich ihrer Nutzbarkeit zur Datenwertanalyse verglichen. Die verwendete, lokale Methode zur Datenwertanalyse wird auf mehrere plausible Parameterfelder angewandt, um die Nichteindeutigkeit kalibrierter Modellparameter mit einzubeziehen. Mittels dieser erweiterten, robusten Methode werden vorhandene, 'zukünftige' und 'parametrische' Datenwerte in Bezug auf verschiedene Modellvorhersagen für die Ersatzmodelle sowie das Benchmarkmodell evaluiert. Der Vergleich der auf Vorhersageunsicherheiten bezogenen Datenwerte zwischen Benchmarkmodell und dem vereinfachten, physikalisch basierten Modell zeigt, dass dieses Ersatzmodell nur die Ergebnisse für vorhandene Daten korrekt wiedergibt. Das POD Modell dagegen ist ein geeignetes Ersatzmodell hinsichtlich seiner Fähigkeit, Datenwerte des Benchmarkmodells mittels der vorgestellten robusten Methode zu reproduzieren. Dies ist unabhängig von der gewählten Vorhersage und davon, ob vorhandene, 'zukünftige' oder 'parametrische' Daten betrachtet werden.:1 Introduction 2 State of the art 2.1 Surrogate modeling for groundwater systems 2.1.1 Introduction 2.1.2 Projection-based methods 2.1.3 Data-driven methods 2.1.4 Structural simplification methods 2.1.5 Open research questions 2.2 Uncertainty and data worth analysis 2.2.1 Introduction 2.2.2 Sources of uncertainty in groundwater modeling 2.2.3 Types of uncertainty analysis 2.2.4 Data worth analysis 2.2.5 Open research questions 3 Objectives and contributions 3.1 Explicit boundary treatment in POD 3.2 Analysis of model simplification error 3.3 Robust data worth analysis using surrogate models 3.4 Expected impact 4 Methods 4.1 The Wairau Plain aquifer, the complex model and its surrogates 4.1.1 The Wairau Plain aquifer 4.1.2 Complex MODFLOW model of the Wairau Plain aquifer (CM) 4.1.3 Surrogate 1: simplified MODFLOW model (SM1,sMm) 4.1.4 Surrogate 2: linearized POD model (SM2,POD) 4.1.5 Surrogate 3: artificial neural networks (SM3,ANN) 4.2 POD extension for explicit boundary treatment 4.2.1 Groundwater models and basic POD 4.2.2 Theory of explicit treatment of boundary conditions in POD 4.2.3 Different boundary conditions in eb-POD 4.2.4 Cost of eb-POD compared to basic POD 4.3 Model simplification error analysis - theory 4.3.1 A linear model, solution space and null-space 4.3.2 Surrogate model: definition and calibration 4.3.3 Parameter simplification - relationship between complex model and surrogate model parameters 4.3.4 Simplification error of surrogate model predictions 4.4 Model simplification error analysis - scatter plot analysis 4.4.1 Methodology 4.4.2 General features of the scatter plots 4.4.3 Contributions of error terms 4.4.4 Prediction pairs 4.4.5 Summary 4.5 Robust data worth analysis 4.5.1 First-order second-moment uncertainty estimation 4.5.2 Worth of data 4.5.3 Generating calibrated parameter sets - null-space parameter perturbation 4.5.4 Robust data worth analysis 5 Results and discussion 5.1 Explicit treatment of boundary conditions in POD 5.1.1 (Variable) Dirichlet boundaries 5.1.2 Neumann boundaries 5.1.3 Cauchy boundaries 5.1.4 Applying eb-POD: summary 5.2 Quantifying model simplification error 5.2.1 Simplified MODFLOW model: SM1,sMm 5.2.2 POD surrogate model: SM2,POD 5.2.3 ANN surrogate model: SM3,ANN 5.2.4 Surrogate comparison: simplification errors in model predictions 5.3 Robust data worth analysis using surrogate models 5.3.1 Worth of existing data 5.3.2 Worth of 'future' data 5.3.3 Worth of 'parametric' data 5.3.4 Data worth with surrogate models: summary 5.4 Discussion 6 Conclusions and outlook A Appendix: Publications
Databáze: Networked Digital Library of Theses & Dissertations