|
Titel: |
Modellselektion bei Prognosen: Ein Vergleich von Kreuzvalidierungsverfahren im Rahmen von Zeitreihenprognosen |
|
AutorIn: |
Patricia Kovács |
|
Typ: |
Masterarbeit
|
|
ÖFOS 2012 Code: |
|
|
Institution: |
Ferdinand Porsche FernFH, Wiener Neustadt, WIMA |
|
Betreuung: |
Christoph Krall |
|
Datum: |
2023 |
|
Abstract (de): |
Das Kreuzvalidierungsverfahren wird verwendet, um den Prognosefehler eines Modells abzuschätzen. Das Verfahren wird sowohl zur Modellvalidierung, als auch zur Modellselektion bei Prognosen eingesetzt. Diese Arbeit befasst sich mit der Anwendung der Kreuzvalidierung bei stationären Zeitreihendaten. Der Einsatz der Kreuzvalidierung bei Zeitreihen wirft aufgrund der bestehenden Autokorrelation theoretische Probleme auf. Infolgedessen wurden mehrere Kreuzvalidierungstechniken speziell für den Fall entwickelt, dass die Daten abhängig sind. Doch welches dieser Kreuzvalidierungsverfahren die robustesten Prognosefehlerabschätzungen in stationären Zeitreihendaten bietet, konnte bislang in der Literatur nicht beantwortet werden. Für die Beantwortung der Forschungsfrage wurde ein empirisches Experiment verwendet. Es wurden vier Arten der Kreuzvalidierung in drei Anwendungsszenarien anhand von synthetischen und realen Daten untersucht. Die Ergebnisse zeigen, dass die geblockte und die hv-geblockte Kreuzvalidierung die robustesten Prognosefehlerschätzungen liefern, wenn synthetische Daten verwendet werden und das Prognosemodell geeignet oder nicht ganz optimal ist. Diese Erkenntnis ist unabhängig von der Länge der Zeitreihe. |
|
Abstract (en): |
Cross-validation is used to estimate the forecast error of a given model. The method is used both for model validation and for model selection for predictions. This thesis deals with the application of cross-validation for stationary time series data. The use of cross-validation for time series raises theoretical caveats due to the existing autocorrelation. Following, several cross-validation techniques have been developed for the case that the underlying data is dependent. However, the existing literature cannot answer the question, which of these cross-validation methods offers the most robust forecast error estimates in stationary time series data. An empirical experiment was used to answer this research question. Therefore, four types of cross-validation have been examined in three application scenarios using synthetic and real-world data. The received results show that blocked and hv-blocked cross-validation provide the most robust forecast error estimates when synthetic data are used and the forecast model is appropriate or sub-optimal. This finding is independent of the length of the time series. |
|
Keywords (de): |
Kreuzvalidierung, Modellselektion, Modellvalidierung, Prognose, Zeitreihen, stationär, Holdout |
|
Keywords (en): |
Cross-validation, Model Selection, Model Validation, forecast, time series, stationary, Holdout |
|
|
Master_Thesis_WIMA_23_Kovacs_Patricia.pdf |
|
|