13. Juni 2023
Teilen über

Teil I: Datenwissenschaft für Fußballspiele

Fußball scheint ein einfaches Spiel zu sein: Zwei Mannschaften versuchen, den Ball im gegnerischen Tor unterzubringen. Der Ball kann nicht mit den Armen kontrolliert werden und muss innerhalb der Grenzen des Spielfelds bleiben. Gewalt wird durch ein System von Sanktionen wie Freistöße/Strafstöße sowie gelbe und rote Karten unterbunden. Wer mehr Tore schießt als der Gegner, hat das Spiel gewonnen. Hinter diesem einfachen Erscheinungsbild verbirgt sich jedoch eine komplexe Situation. Sicher, ein Spieler, der viele Tore schießt, ist wertvoll. Aber auch ein Spieler, der kein Tor schießt, kann wertvoll sein, indem er die andere Mannschaft an einem Tor hindert oder seinen Mitspielern hilft, ein Tor zu erzielen. 

Ein Spieler, der den Ball zurückerobert, beraubt die andere Mannschaft einer Torchance. Am Ende eines Spiels werden jedoch nur die Torschützen notiert, und die meisten Menschen können den Beitrag der übrigen Mannschaft nur aufgrund ihrer Spielkenntnisse und ihrer Wahrnehmung beurteilen. Ist es möglich, die Leistung einer Mannschaft strenger zu bewerten? 

Heutzutage gibt es für alles Daten, und insbesondere in amerikanischen Mannschaftssportarten hat die Analytik die Bewertung von Spielern formalisiert und bisher unbekanntes Potenzial freigesetzt, indem sie gängige Vorstellungen in Frage stellt und letztlich das Spiel modernisiert. Während sich Profifußballmannschaften bei der Beurteilung ihrer Spieler auf Daten stützen, bewertet die Öffentlichkeit Spieler und Mannschaften immer noch auf der Grundlage ihrer Wahrnehmung. Die Analytik fehlt in der allgemeinen Fußballdiskussion.

Dieser Artikel versucht, einen Schritt in eine moderne Richtung zu machen, indem er Daten analysiert, um festzustellen, was siegreiche Mannschaften im Laufe einer Saison tun. Das Ziel ist es, die Schlüssel für einen konstanten Sieg zu finden, indem wir einige Kennzahlen sammeln, die es uns ermöglichen, den Beitrag eines einzelnen Spielers zu messen und letztendlich eine strenge Spielerbewertung vorzunehmen.

Die vorgelegte Analyse basiert auf Daten aus den Spielzeiten 2017/2018 und 2018/2019 der Premier League (den letzten beiden Spielzeiten vor der Covid-Pandemie), die von https://fbref.com/en/ stammen .

Stufe 0-Statistiken

Um ein Spiel zu gewinnen, muss man mehr Tore schießen als der Gegner. Im regulären Ligabetrieb erhält eine Mannschaft 3 Punkte für einen Sieg, 1 Punkt für ein Unentschieden und 0 Punkte für eine Niederlage. Am Ende einer Saison gewinnt die Mannschaft mit den meisten Punkten den Titel.

Das Erzielen von Toren und das Vermeiden von Gegentoren sind wichtige Aspekte für das Gewinnen von Spielen, so dass in einer regulären Ligatabelle Punkte, erzielte Tore und Gegentore als wichtige Leistungsindikatoren aufgeführt werden. Beim Betrachten eines Spiels wird der durchschnittliche Fußballfan jedoch neben dem Ergebnis gelegentlich auch den Anteil des Ballbesitzes, der Schüsse und der Torschüsse sehen. Dies sind die Level-0-Statistiken, die zur Beurteilung der Leistung herangezogen werden.

Um die Bedeutung dieser Level-0-Statistiken zu bewerten, können wir uns ansehen, wie sie mit der endgültigen Platzierung einer Mannschaft korrelieren. Es ist jedoch sinnvoll, diese Kennzahlen um den Ballbesitz zu bereinigen: Eine Mannschaft kann nur dann schießen und noch viel weniger ein Tor erzielen, wenn sie den Ball zu diesem Zeitpunkt kontrolliert (Eigentore sind selten). Darstellung des prozentualen Anteils des Ballbesitzes im Vergleich zum Mannschaftsrang über 2 Spielzeiten:

Dies zeigt eindeutig einen Trend, bei dem die 6 besten Teams mehr als die Hälfte der Spielzeit den Ball kontrollieren.

Die folgenden Anpassungen werden dann an den Werten der Stufe 0 vorgenommen:

				
					adjusted min < ACTION > = minutes played * possession * . 9 / < ACTION COUNT >
				
			

Und so weiter:

StatistikBeschreibungAbgeleitet
SchüsseAnzahl der Schüsse einer Mannschaft auf das gegnerische TorAngepasste Drehzeit in Minuten
Schüsse auf das ZielAnzahl der Schüsse, die tatsächlich auf das Tor abgegeben wurden (unabhängig davon, ob sie zu einem Tor wurden oder nicht)Angepasste Minuten zum Schießen auf das Ziel
Tore pro SchussVerhältnis von Toren zu Schüssen-
Tore pro Schuss aufs TorVerhältnis zwischen Toren und Torschüssen-
Ziele Angepasste Minuten bis zum Torerfolg
Gegentore Angepasste Minuten für Gegentreffer

Zunächst einmal kann man die (Spearman-)Korrelation zwischen diesen Statistiken und der endgültigen Rangliste untersuchen:

{‘possession’: -0.84,
‘minutes to shoot’: 0.50,
‘minutes to shoot on target’: 0.82,
‘minutes to score’: 0.88,
‘minutes to concede’: -0.67,
‘minutes to score-minutes to concede’: 0.89
}

Die Schusseffizienz(Minuten für einen Torschuss) und die für ein Tor benötigten Minuten sind viel enger mit der Endplatzierung verknüpft. Außerdem scheint es wichtiger zu sein, mehr Tore zu schießen als zu verhindern, obwohl der Unterschied zwischen der Zeit, in der man ein Tor schießt, und der Zeit, in der man ein Tor kassiert, der wichtigste Aspekt ist.

Es ist interessant festzustellen, dass die Schussminuten wahrscheinlich nicht monoton mit der Position der letzten Mannschaft zusammenhängen. Die Variable ist eigentlich ziemlich flach:

Mindestdauer der Aufnahmen3'12"
Maximale Drehzeit in Minuten3'59"

Das bedeutet, dass alle Mannschaften alle 3-4 Minuten schießen, mit einer maximalen Streuung von 47 Sekunden während einer Saison. Im Vergleich dazu, die Streuung auf das Ziel zu schießen:

Mindestminuten für das Schießen auf das Ziel9'4"
Maximale Minuten für einen Schuss auf das Ziel13'40"

Es gibt einen Unterschied von 4'36", eine viel breitere Verteilung.

Angesichts dieser ersten Erkenntnisse können wir versuchen, einige Teams direkt zu vergleichen. Um den Vergleich zu vereinfachen, werden die Statistiken standardisiert, indem der Durchschnitt subtrahiert und durch die Standardabweichung jedes Merkmals geteilt wird, so dass jedes Merkmal einen Durchschnitt von 0 und eine Standardabweichung von 1 hat. Um Verwirrung zu vermeiden, werden die Vorzeichen von Größen, die besser sind, wenn sie klein sind (z. B. die Spielminuten), umgekehrt, so dass alle Größen besser sind, wenn sie positiv sind, und schlechter, wenn sie negativ sind (ein Team mit einer höheren Spielminutenabweichung erzielt häufiger ein Tor als ein Team mit einem niedrigeren Wert). Betrachten wir die 3 besten Mannschaften der Saison 2018/2019 (1 - Manchester City, 2 - Liverpool, 3 - Chelsea):

Fußball und Datenwissenschaft

Liverpool hatte die beste Verteidigung und brauchte am längsten, um ein Tor zu kassieren. Im Vergleich zu Manchester City brauchte Liverpool jedoch im Durchschnitt etwa gleich lange, um ein Tor zu erzielen, und sie waren deutlich effizienter, wenn sie einen Torschuss hatten. Allerdings schoss Liverpool nicht so oft aufs Tor wie Manchester City und, was vielleicht noch wichtiger ist, kontrollierte den Ball noch weniger als der Drittplatzierte Chelsea. Es scheint also, dass Liverpool den Ball nicht so sehr kontrollierte und schließlich dank einer hervorragenden Verteidigung und einer starken Offensive auf dem zweiten Platz landete.

Chelsea hingegen schnitt in fast jeder Kategorie schlechter ab als die beiden Topteams und lag sogar unter dem Ligadurchschnitt bei den Minuten, in denen man ein Gegentor kassierte, und bei den Toren pro Torschuss, hatte aber offenbar eine überdurchschnittlich hohe Ballbesitzquote, kontrollierte den Ball mehr und profitierte daher von mehr eigenen und weniger gegnerischen Torchancen.

Mit einer ähnlichen Visualisierung ist es möglich zu sehen, wie Manchester City in den 2 Jahren, die in den Daten enthalten sind, abgeschnitten hat (beide Male der Saisonsieger):

Es scheint, dass die Mannschaft in diesen beiden Jahren sehr unterschiedlich war: 2018 kontrollierte Manchester City den Ball viel besser als der Ligadurchschnitt und erzielte häufiger und effizienter Tore. Im Jahr 2019 kontrollierte die Mannschaft den Ball weniger als der Ligadurchschnitt, obwohl sie ihre Verteidigung stark verbessert hat, um die geringere Toreffizienz zu kompensieren.

Statistiken der Stufe 1 - Besitz

Durch den Ballbesitz können Teams mehr Torchancen kreieren und gleichzeitig dem Gegner die Chancen nehmen. So konnte Chelsea die Saison 2019 trotz unterdurchschnittlicher Leistungen in anderen Bereichen auf Platz 3 abschließen. Wenn man den Ballbesitz etwas genauer betrachtet, ist es interessant zu sehen, wie viele Ballkontakte ein Team in einer Saison hatte:

Die besten Mannschaften berühren den Ball häufiger, was mit dem oben gezeigten Ballbesitzdiagramm übereinstimmt. Interessant ist nun zu sehen, wo diese Berührungen stattfinden. Eine aufschlussreiche Strategie ist in diesem Fall die Betrachtung der Abweichungen vom Ligadurchschnitt (d. h. die Differenz zwischen den Ballberührungen in einem bestimmten Drittel des Spielfelds und den durchschnittlichen Ballberührungen der Liga in diesem bestimmten Drittel):

Die Spitzenteams verbringen weniger Zeit mit Verteidigen und mehr Zeit mit Angreifen als der Ligadurchschnitt. Diese Zeit wird hauptsächlich im Mittelfeld und im Angriffsdrittel des Spielfelds verbracht. In der unteren Tabellenhälfte kehrt sich diese Tendenz um, da die schlechteren Mannschaften einen größeren Teil des Spiels in der eigenen Hälfte verbringen. Dies würde eine Mannschaft, die den Ball kaum kontrolliert, dazu zwingen, längere Aktionen aufzubauen, um ein Tor zu erzielen, als eine Mannschaft, die den Ball meist näher am gegnerischen Tor kontrolliert.

Es ist jedoch interessant zu sehen, dass die Statistik in allen Bereichen gleichbleibend ist:

Durchschnittliche Mindesttragweite (yds)4.82
Maximale durchschnittliche Tragweite (yds)5.47

Obwohl die meisten Teams den Ball im Durchschnitt über eine ziemlich konstante Distanz tragen, scheinen die besseren Teams im Durchschnitt etwas weniger pro Balltransport voranzukommen, dafür aber häufiger:

Fußball und Datenwissenschaft

Dies scheint darauf hinzudeuten, dass bessere Mannschaften den Ball lieber früher abgeben und das Risiko vermeiden, den Ball durch ein gegnerisches Tackling zu verlieren - eine Strategie, die sich auszuzahlen scheint, wenn man die durchschnittliche Erfolgsquote bei der Annahme von Pässen gegenüber Dribblings betrachtet:

Fußball und Datenwissenschaft

Die besten Mannschaften sind effizienter bei der erfolgreichen Annahme von Pässen. Der wichtigste Punkt ist jedoch, dass Mannschaften in allen Bereichen erfolgreicher einen Pass empfangen als einen Gegner zu dribbeln. Dribblings sehen eher riskant aus, wenn man bedenkt, dass die durchschnittliche Erfolgsquote bei 58 % liegt.

Statistiken der Stufe 1 - Bestanden

Das Passspiel scheint die erfolgreichste Methode zu sein, um den Ball zu halten. Allerdings kommen auch strategische Komponenten ins Spiel: Es ist schwierig, den Ball abzugeben, wenn niemand für einen sauberen Pass zur Verfügung steht. In diesem Fall kann ein Spieler gezwungen sein, zu dribbeln oder einen längeren oder höheren Pass zu spielen, um den Gegenspielern auszuweichen. Ein Blick darauf, wie viele Pässe die Mannschaften versuchen, bestätigt jedoch, dass die besten Mannschaften mehr auf Pässe setzen als ihre mittelmäßigen Kollegen:

Es sei auf die strategische Komponente dieser Parzellen hingewiesen: Die besten Mannschaften decken das Spielfeld eher so ab, dass sich häufiger eine Passmöglichkeit ergibt.

Betrachtet man die Länge der Pässe und die durchschnittliche Passdistanz, so sieht es so aus, als ob die besten Mannschaften tatsächlich in der Lage sind, den Ball häufiger über kürzere Distanzen zu spielen. Insgesamt werden jedoch kurze Pässe (unter 15 Yards - zweite Grafik) in mehr als 80 % der Fälle abgeschlossen. Bei Pässen zwischen 15 und 30 Yards nimmt der Prozentsatz leicht ab, liegt aber immer noch bei 80 %. Bei langen Pässen (über 30 m) sinkt der Prozentsatz jedoch deutlich auf etwa 60 %, so dass das Dribbling nicht mehr so riskant erscheint. Während das Passspiel also relativ sicher erscheint, ist eine solide Strategie erforderlich, die dem Ballträger Passoptionen bietet, um die Notwendigkeit von Hail-Mary-Pässen zu vermeiden, die technisch schwieriger und insgesamt weniger erfolgreich sind.

Vertiefung der Arten des Passierens:

Alle Mannschaften verwenden sehr wenig tote Pässe, aber es ist interessant zu sehen (erste Grafik), dass die schlechteren Mannschaften Pässe aus toten Bällen etwa 3 % häufiger verwenden als die Top-6-Mannschaften. In ähnlicher Weise (zweite Grafik) werden die Top-6-Mannschaften rund 4 % seltener zum Passspiel gezwungen. Schließlich bleiben die meisten Pässe auf dem Boden, aber die schlechteren Mannschaften verlassen sich zunehmend auf niedrige (vom Boden, aber unterhalb der Schulterhöhe) und hohe Pässe, möglicherweise aufgrund der Nichtverfügbarkeit von potenziellen Passempfängern. Um zu verdeutlichen, warum das Heben des Balls eine riskante Strategie ist:

Die Kontrolle über einen Ball in der Luft zu erlangen, ist ein Glücksspiel, wobei der Ligadurchschnitt eher flach bei 50 % liegt, so dass tiefe und bodennahe Pässe für eine Mannschaft, die sich diese durch eine überlegene Taktik leisten kann, definitiv die sicherere Variante sind.

Level-1-Statistiken - Verteidigung

Auch die Verteidigung ist ein Faktor, um Spiele zu gewinnen. Vor allem für Mannschaften wie 2019 Liverpool, wo die Verteidigung im Vergleich zum Rest der Liga so außergewöhnlich war, dass sie andere Aspekte des Spiels kompensieren konnte. Dem Gegner die Torchancen zu nehmen ist genauso wichtig wie das Toreschießen.

In der Verteidigung geht es vor allem darum, den Ballbesitz zurückzuerobern. Daher müssen wir uns zunächst ansehen, wie viele Tackles und Pressures von den Spitzenteams im Vergleich zu den übrigen Teams versucht wurden und wie erfolgreich die Aktionen waren:

Interessanterweise haben die besten 6 Teams der Liga die Gegner nicht so oft angegriffen wie die anderen, waren dabei aber etwas effizienter. Interessant ist auch, dass das Tackling und vor allem das Pressing der Gegner nicht so effizient sind, wenn es darum geht, die Kontrolle über den Ball zurückzugewinnen. Verglichen mit der Pass-Effizienz von über 80 % scheint es eine schwierige Aufgabe zu sein, den Ball zurückzuerobern, wenn er einmal verloren gegangen ist, und es scheint eine gute Strategie zu sein, den Ball noch einmal herumzureichen, um die Kontrolle zu behalten.

Wenn man noch ein wenig tiefer gräbt, sieht man sich an, wo die meisten Tackles und Pressures stattfinden:

Die besten Mannschaften versuchen, den Gegner weniger in ihrem defensiven 3. und etwas mehr in ihrem offensiven und mittleren 3. zu attackieren, verglichen mit schlechter platzierten Mannschaften. Ebenso üben die besten Mannschaften einen hohen Druck aus (mehr im offensiven Drittel) und weniger im defensiven Drittel als mittelmäßige Mannschaften. Im Mittelfeld ist der Druck eher ausgeglichen, was möglicherweise daran liegt, dass sich der Großteil des Spiels im Durchschnitt im Mitteldrittel abspielt. Dieser Mangel an Ausgewogenheit spiegelt sich auch in der Leistung der Torhüter wider:

Es scheint, als würden die Torhüter der besten Mannschaften nicht so viele Schüsse abgeben wie die Mannschaften am unteren Ende der Tabelle, weshalb sie auch nicht so viele Bälle abwehren. Wenn sie jedoch arbeiten müssen, sind sie eindeutig effizienter bei der Abwehr von Torschüssen. Dies spiegelt sich in der Anzahl der Gegentreffer wider, die zwar nicht notwendig sind, um ein Spiel zu gewinnen, aber sie zeigen, dass es im Allgemeinen schwieriger ist, gegen ein Spitzenteam ein Tor zu erzielen.

Level-1-Statistiken - Tor- und Schusserstellung

Um Spiele zu gewinnen, muss eine Mannschaft Tore schießen. Untersuchung von Daten über schuss- und torgefährliche Aktionen (die letzten 2 Pässe, die zu einem Schuss oder einem Tor führen):

Lebendige Pässe sind die absolut bevorzugte Methode, um Schüsse und Tore zu generieren. Die Top-6-Teams tendieren jedoch dazu, sich viel mehr auf direkte Pässe zu verlassen als der Rest der Liga. Tote Pässe sind dagegen eher selten, aber es scheint, dass die Top-6-Teams weniger darauf angewiesen sind als der Rest der Liga, um Tore zu erzielen.

Andererseits scheinen sich Einzelaktionen nicht allzu oft auszuzahlen, denn die Quote der Schüsse und der aus Dribblings erzielten Tore liegt bei 6,0 bzw. 6,6 %, wobei die Werte in allen Bereichen zufällig schwanken. Dies unterstreicht einmal mehr die Bedeutung eines soliden Passnetzes auf dem Spielfeld.

Schlussfolgerung

Siegreiche Mannschaften kontrollieren das Spiel. Da sie mehr Zeit in der gegnerischen Spielfeldhälfte verbringen, sind sie in der Lage, den Ball zu halten und ihn effizienter weiterzugeben. Sie bevorzugen kürzere, flache Pässe und Ballübertragungen, da diese weniger wahrscheinlich abgefangen, geblockt oder schlecht kontrolliert werden. Dies führt dazu, dass sie mehr Schüsse und folglich auch mehr Torchancen kreieren können. Unabhängig von der Anzahl der kreierten Chancen sind einige Mannschaften einfach effizienter beim Schießen, treffen das Ziel und erzielen häufiger ein Tor. Sie tun dies mit einer höheren Gesamthäufigkeit und benötigen oft weniger Versuche, um den Ball im Tor unterzubringen.

Da die besten Mannschaften meist auf den vorderen Positionen spielen, muss ihre Verteidigung nicht so hart arbeiten wie die einer Mannschaft, die mehr Spiele verliert. Wenn die Verteidigung der besten Mannschaften arbeiten muss, ist sie auch effizienter bei der Rückeroberung des Balls.

Diese Erkenntnisse sollten es uns ermöglichen, einzelne Spieler auf der Grundlage dessen zu bewerten, was einer Mannschaft den größten Nutzen bringt und wie viel effizienter ein Spieler im Vergleich zum Ligadurchschnitt ist.

Datenwissenschaft & Fußball

Dieser Artikel ist Teil einer dreiteiligen Serie, die sich mit Datenwissenschaft im Zusammenhang mit Fußball beschäftigt.

Um mehr über Datenwissenschaft im Fußball zu erfahren, können Sie auch diese Artikel lesen:

Teil II: Bewertung von Fußballspielern

Teil III: Schlechte Leistung durch Pech? Wie sich die Qualität von Offensive und Defensive und die Unsicherheit auf die Ergebnisse im Fußball auswirken

Einzelheiten

Titel: Die Dekonstruktion einer erfolgreichen Saison
Autor:
DAIN StudiosDaten & KI Strategieberatung
Veröffentlicht in ,
Aktualisiert am 16. Januar 2024