Torschusseffizienz und Exponentialfunktionen

Ein weiterer Beitrag aus der Reihe „auch der Fussball folgt statistischen Gesetzen“, nach dem Einstieg mit der Gauß-Verteilung folgt nun die Exponentialfunktion.
Allgemein kann man jede Funktion der Form
\mathsf{y(x) = a^x}
als Exponentialfunktion bezeichnen, die spannendste und gebräuchlichste ist aber eine Funktion
\mathsf{y(x) = A \cdot e^{b \cdot x}}

Damit zum Fussball. Mit einem Spieltag mehr, d.h. jetzt den Spieltagen 1,2,3,4,5 und 13 der laufenden 2.Liga-Saison gucke ich mir jetzt das Verhältnis der geschossenen Tore zur Anzahl der Torschüsse (die Torschusseffizienz) jeder Mannschaft an jedem dieser Spieltage an – diese Daten sind mit einem roten Punkt im Plot gekennzeichnet, der Fehler ergibt sich als Wurzel aus der Anzahl der Einträge pro Bin (Bins sind die Abschnitte, in die die x-Achse unterteilt ist).

torfractionb.jpg

Grundsätzlich sieht man, guckt man nur auf die roten Punkte, schonmal, dass jede Mannschaft mindestens zwei Torschüsse braucht um ein Tor zu schiessen, denn sonst hätten wir auf der x-Achse Einträge jenseits von 0.5. Insgesamt bedeutet z.B. ein Wert von 0.1 auf der x-Achse, dass diese Mannschaft pro Torschuss 0.1 Tore geschossen hat, d.h. also 10 Versuche für ein Tor gebraucht hat.
Auch der große Anteil der Einträge bei 0 lässt sich erklären – schiesst eine Mannschaft keine Tore, ist natürlich auch das Verhältnis der geschossenen Tore zu den Torschüssen 0.

Insgesamt sieht man daran schon, dass die meisten Torschüsse „vergeblich“ sind, nur die wenigsten Mannschaften haben eine hohe Torschusseffizienz. Trotzdem kann aber natürlich auch eine Mannschaft A mit einer Effizienz von 0.1 gegen eine Mannschaft B mit einer Effizienz von 0.2 (jeweils für ein einziges Spiel) gewinnen – die Mannschaft A muss nur mehr als doppelt so oft aufs Tor schiessen wie Mannschaft B.

Zurück zum Plot:
Um den Abfall der Einträge zu höheren Werten zu beschreiben bietet sich eben eine e-Funktion an, deren Fit, d.h. die bestmögliche Anpassung einer Funktion an die Daten, durch die schwarze Kurve dargestellt ist. Die zugehörige Formel (ohne Fehler auf die Fitparameter) ist ebenfalls angegeben.

Vergleicht man die schwarze Kurve mit den Datenpunkten, sieht man eine gute Übereinstimmung innerhalb der Fehler – ein Maß dafür ist das „Chi-Quadrat per Freiheitsgrad“, in der Box rechts als \mathsf{\chi^2 / ndof}. Liegt das Resultat im Bereich von 1, ist der Fit gelungen.

Zusätzlich kann man noch die Skala der y-Achse ändern, denn die Umkehrfunktion einer e-Funktion ist der logarithmus naturalis, in dieser Darstellung sollte der Zusammenhang also linear sein – und siehe da, logarithmiert man die y-Achse, sieht man deutlich, dass die Datenpunkte in etwa auf einer Linie liegen:

torfractionlog.jpg

Explore posts in the same categories: Statistik & Fussball

2 Comments on “Torschusseffizienz und Exponentialfunktionen”

  1. jan Says:

    hmm, klingt interessant! kannst du auch erklären, warum es zu der exponentialfunktion kommt? spontan würde ich ja sagen, sowohl die zahl der torschüsse als auch die zahl der tore folgen einer poisson-verteilung – sowas haben wir ja so ungefähr schon letztes mal gesehen – wobei die zahl der tore eine untermenge der zahl der torchancen ist. kann man jetzt zeigen, dass dann die exponentialfunktion rauskommt, oder ist das zufall?

  2. Gisbert Says:

    Interessant (sogar für Fußball-Laien)!
    Anzumerken ist, dass \chi^2/ndof als Goodness-of-Fit-Aussage zwar eine verbreitete, aber nicht immer richtige Größe ist. Eigentlich muß man den p-Wert bestimmen. p ist die Wahrscheinlichkeit unter der Annahme einer Hypothese H (in diesem Fall die Exponentialverteilung) Daten mit gleicher oder weniger Kompatibilität relativ zu H zu bekommen, als die Daten, die man nun hat. Der p-Wert berechnet sich zu
    p = \int_{\chi^2}^{\infty} f_{\chi^2}(z;N) dz ,
    also dem Integral des resultierenden \chi^2-Wertes bis unendlich über die \chi^2-Wahrscheinlichkeitsdichtefunktion, die von der Anzahl der Freiheitsgrade N abhängt.


Comment: