Vorhersagemodell

Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Angaben ohne ausreichenden Beleg könnten demnächst entfernt werden. Bitte hilf Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst.

In der Statistik bezeichnet man als Prognosemodell oder Vorhersagemodell ein Modell, das eine Prognose der abhängigen Variablen y liefert und dazu einen funktionalen Zusammenhang verwendet, der durch ein Regressionsverfahren ermittelt wurde. Wenn zusätzliche x-Werte ohne zugehörigen y-Wert vorliegen, kann das angepasste Modell zur Vorhersage des Wertes von y verwendet werden.

Andere Vorhersagemodelle gibt es für Zeitreihen, siehe dazu z. B. unter Lineare Vorhersage.

Prognosemodell

In der multiplen linearen Regression ergibt sich das Prognosemodell durch

y 0 = X 0 β + ε 0 {\displaystyle \mathbf {y} _{0}=\mathbf {X} _{0}{\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }}_{0}} ,

wobei

  • y 0 {\displaystyle \mathbf {y} _{0}} den Vektor zukünftiger abhängiger Variablen darstellt und
  • X 0 {\displaystyle \mathbf {X} _{0}} die Matrix der erklärenden Variablen zum Zeitpunkt T 0 {\displaystyle T_{0}} .

Die Prognose wird dargestellt als y ^ 0 = X 0 b {\displaystyle {\hat {\mathbf {y} }}_{0}=\mathbf {X} _{0}\mathbf {b} } .

Prognosefehler

Aus o. g. Darstellung ergibt sich der Prognosefehler oder Vorhersagefehler y ^ 0 y 0 = X 0 ( b β ) ε 0 {\displaystyle {\hat {\mathbf {y} }}_{0}-\mathbf {y} _{0}=\mathbf {X} _{0}(\mathbf {b} -{\boldsymbol {\beta }})-{\boldsymbol {\varepsilon }}_{0}} mit folgenden Eigenschaften:

  • der Erwartungswert des Prognosefehlers ist im Mittel null: E ( y ^ 0 y 0 ) = E ( X 0 ( b β ) ε 0 ) = 0 {\displaystyle \operatorname {E} ({\hat {\mathbf {y} }}_{0}-\mathbf {y} _{0})=\operatorname {E} (\mathbf {X} _{0}(\mathbf {b} -{\boldsymbol {\beta }})-{\boldsymbol {\varepsilon }}_{0})=\mathbf {0} }
  • die Varianz-Kovarianzmatrix des Prognosefehlers lautet: E [ ( y ^ 0 y 0 E ( y ^ 0 y 0 ) ) ( ( y ^ 0 y 0 E ( y ^ 0 y 0 ) ) ] = σ 2 [ X 0 ( X X ) 1 X 0 + I ] {\displaystyle \operatorname {E} [({\hat {\mathbf {y} }}_{0}-\mathbf {y} _{0}-\operatorname {E} ({\hat {\mathbf {y} }}_{0}-\mathbf {y} _{0}))(({\hat {\mathbf {y} }}_{0}-\mathbf {y} _{0}-\operatorname {E} ({\hat {\mathbf {y} }}_{0}-\mathbf {y} _{0}))^{\top }]=\sigma ^{2}[\mathbf {X} _{0}(\mathbf {X} ^{\top }\mathbf {X} )^{-1}\mathbf {X} _{0}^{\top }+\mathbf {I} ]} .

Oft ist man daran interessiert, für einen neuen Wert x 0 {\displaystyle x_{0}} die Realisierung der endogenen (= abhängigen) Variablen y 0 {\displaystyle y_{0}} zu schätzen. Beispielsweise könnte x 0 {\displaystyle x_{0}} der geplante Preis eines Produktes und y 0 {\displaystyle y_{0}} der Absatz sein. In diesem Fall nimmt man ein einfaches Regressionsmodell an. Der prognostizierte Funktionswert y ^ 0 {\displaystyle {\hat {y}}_{0}} der exogenen (= unabhängigen) Variablen x 0 {\displaystyle x_{0}} ist dann gegeben durch

y ^ 0 = b 0 + b 1 x 0 {\displaystyle {\hat {y}}_{0}=b_{0}+b_{1}x_{0}}

Da man den Wert der endogenen Variablen nie genau vorhersehen kann, ergibt sich immer ein Schätzfehler. Dieser Fehler wird als Prognosefehler bezeichnet und ergibt sich aus

e p := y 0 ^ y 0 {\displaystyle e_{p}:={\hat {y_{0}}}-y_{0}}

Ist die wahre Prognosegleichung unbekannt, so ist auch der Prognosefehler unbekannt. Trotzdem ist es möglich, eine Aussage über die Präzision des Prognosefehlers zu machen. Die Prognose gilt theoretisch als präzise, da der Fehler im Mittel 0 ist:

E ( y ^ 0 y 0 ) = E ( x t 1 β ^ 1 + x t 2 β ^ 2 + + x t K β ^ K ( x t 1 β 1 + x t 2 β 2 + + x t K β K + ε t ) ) = 0 {\displaystyle \operatorname {E} ({\hat {y}}_{0}-y_{0})=\operatorname {E} (x_{t1}{\hat {\beta }}_{1}+x_{t2}{\hat {\beta }}_{2}+\ldots +x_{tK}{\hat {\beta }}_{K}-(x_{t1}\beta _{1}+x_{t2}\beta _{2}+\ldots +x_{tK}\beta _{K}+\varepsilon _{t}))=0} .

Die gemittelte Summe der Prognosefehler ergibt den mittleren absoluten Fehler.

Prognoseintervall

Hauptartikel: Prognoseintervall

In der Inferenzstatistik ist ein Prognoseintervall (Vorhersageintervall), ein Bereich, in dem der zu prognostizierende Wert y 0 {\displaystyle \mathbf {y} _{0}} mit einer bestimmten (hohen) Wahrscheinlichkeit ex ante zu vermuten ist.