19. Juni 2023
Teilen über

Teil II: Datenwissenschaft für Fußballspiele

Es ist einfach zu sagen, welche Mannschaft am Ende einer Saison die beste ist: diejenige, die die Meisterschaft gewinnt. In den Kneipen wird jedoch häufig und gelegentlich heftig darüber diskutiert, wer der beste Spieler ist. Im Ernst: Fußballorganisationen versuchen immer, ihre Reihen mit guten Spielern zu verstärken und zu entscheiden, welche Spieler nicht gut genug sind, um in der Mannschaft zu bleiben.

Während Front Offices im heutigen digitalen Zeitalter wahrscheinlich einige objektive Kriterien für die Bewertung von Spielern haben, scheint die Öffentlichkeit die Sprache der Analytik nicht so sehr zu sprechen wie amerikanische Sportfans. Daher müssen sie sich bei der Frage, wer der beste Spieler für ihr Fantasy-Team ist, auf ihr Bauchgefühl verlassen.

In diesem Artikel wird versucht, einige objektivere, aber dennoch verständliche Leistungskennzahlen zu erstellen, die einen Vergleich der Spieler in der englischen Premier League ermöglichen, obwohl die Analyse genauso gut auf andere Ligen ausgeweitet werden könnte.

Leitende Prinzipien

Wie hier zu sehen ist, gibt es viele Dinge, die die besten Mannschaften besser machen als die anderen. Ballbesitz und Toreffizienz sind jedoch die wichtigsten Parameter für eine Mannschaft, die in der Tabelle weiter oben steht. Obwohl Fußball ein komplexer Sport ist, macht dieser einfache Ansatz durchaus Sinn: Wer den Ball kontrolliert, kann mehr Torchancen kreieren und gleichzeitig dem Gegner die Chancen nehmen. Und wenn man eine gewisse Grundfertigkeit voraussetzt, um in einer bestimmten Liga spielen zu können, führt mehr Ballbesitz zwangsläufig zu mehr Toren, wenn auch mit unterschiedlicher Effizienz. Wir können also argumentieren, dass eine erfolgreiche Ballkontrolle ebenfalls sehr wichtig ist, da sie dem Gegner aktiv Chancen entzieht.

Mit diesen Überlegungen im Hinterkopf sind dies die Elemente, die für die Erstellung einer Spielerbewertung erforderlich sind:

  • Ballkontrolle erlangen
  • Beibehaltung der Ballkontrolle
  • Schießen und Tore schießen

Die folgende Auswertung basiert auf Daten, die von fbref.com stammen. Obwohl viele Statistiken zur Verfügung stehen, werden einige Kerngrößen ausgewählt, die diese drei Spielphasen abbilden.

Es ist wichtig zu erwähnen, dass verschiedene Positionen auf dem Spielfeld unterschiedliche Phasen stärker abdecken (z. B. wird von einem Stürmer erwartet, dass er mehr Tore schießt als von einem Verteidiger, von dem wiederum erwartet wird, dass er mehr Kontrolle über den Ball erlangt und ihn weiterleitet). Daher wird bei der Bewertung von Spielern die Position zur Anpassung der Statistiken herangezogen, um Gleiches mit Gleichem zu vergleichen.

Schließlich ermöglichen Statistiken mit einer bestimmten Anzahl von Tackles bessere Vergleiche zwischen Spielern, z. B. ist ein Spieler mit einer 100%igen Tackling-Effizienz über 2 Spiele in einer Saison nicht unbedingt besser als ein Spieler mit einer 80%igen Effizienz über 25 Spiele, daher werden einige Grenzwerte verwendet, um einen fairen Vergleich zu gewährleisten.

Ballkontrolle erlangen

Am Anfang jeder Aktion steht die Übernahme der Kontrolle. Dies kann auf viele Arten geschehen: ein Fehlpass des Gegners, der von einem Spieler abgefangen wird, ein Einwurf, ein Freistoß, ein Zweikampf, ein Abfangen oder Druck.

Einwürfe, abgefangene Bälle und Freistöße werden jedoch weniger durch einen Spieler als vielmehr durch einen Fehler des Gegners verursacht. Außerdem gibt es bei dem Versuch, Quotenstatistiken zu erstellen, keine Vergleichsdaten für diese Größen, z. B. wie viele Einwürfe versucht und wie viele abgefangen wurden, weshalb sie bei der Auswertung nicht berücksichtigt werden. Es gibt jedoch Daten über den Prozentsatz der Passannahme, die im Abschnitt über den Ballbesitz berücksichtigt werden, da bei der Annahme eines Passes keine Veränderung des Ballbesitzes stattfindet.

Tackling, Pressing und Luftzweikämpfe eignen sich gut für die Bewertung der Leistung eines Spielers, da fbref Daten darüber liefert, wie viele dieser Aktionen versucht wurden und wie viele erfolgreich waren, sodass wir Folgendes definieren können:

Ballbesitz

Die Aufrechterhaltung der Ballkontrolle ist von entscheidender Bedeutung, um mehr Torschüsse und schließlich auch Torchancen zu kreieren. Fbref liefert Daten zu Berührungen (definiert als Ballbesitz, bei dem das Stoppen des Balls, das Tragen und das Passen als eine Berührung zählen), Tragen, Dribbeln, Pässen und empfangenen Pässen. Es gibt zwar Daten über die Länge des Passes, den Ort der Berührung, die Entfernung des Ballträgers und den progressiven Ballträger, doch werden diese Daten zu diesem Zeitpunkt nicht verwendet, da sie eher dazu dienen, den Stil und die Positionierung eines Spielers zu definieren, was wiederum nicht unbedingt eine direkte Folge der Fähigkeiten eines Spielers ist, sondern eher die Strategie des Teams und die Fähigkeiten des Gegners widerspiegelt.

Die Fähigkeit eines Spielers, die Kontrolle zu behalten, wird daher anhand der folgenden Größen bewertet:

Schießen und Tore schießen

Das Toreschießen ist das Ziel jeder Mannschaft. Je mehr Tore, desto größer die Gewinnchancen.
In diesem Fall gibt es Daten zu abgegebenen Schüssen, Torschüssen, Toren pro Torschuss (Toreffizienz), schussauslösenden Aktionen (die letzten 2 Offensivaktionen, die zu einem Schuss führten) und torauslösenden Aktionen (die letzten 2 Offensivaktionen, die zu einem Tor führten). All diese Daten sind nützlich, wenn man bedenkt, dass ein Spieler, der selbst kein Tor schießt, dennoch einen Beitrag in Form eines Assists leisten kann, der ebenso wichtig ist wie ein Tor.

Die Kombination von Schuss- und Torvorbereitungsaktionen in einer einzigen Kennzahl kann einen besseren Eindruck von der Torvorbereitungseffizienz eines Spielers vermitteln:

Torhüter

Obwohl er nicht zu den 3 Säulen der Spielerleistung gehört, würde niemand behaupten, dass der Torhüter keine entscheidende Rolle auf dem Spielfeld spielt. Statistiken für Torhüter sind einfach zu spezifisch, um sie auf den Rest der Mannschaft anzuwenden.

Während ein Torhüter immaterielle Werte wie das Bewegen der Abwehr oder das Vorwärtsbringen der Mannschaft nach einem missglückten Schuss beisteuert, könnte man sagen, dass die wichtigste, messbare Leistung darin besteht, dass er die auf ihn zukommenden Schüsse abwehrt. Dies wird durch die prozentuale Anzahl der abgewehrten Schüsse gemessen:

Abschneiden der Tabellenführer

Wie bereits erwähnt, werden für den Vergleich von Spielern Statistiken mit Quoten bevorzugt. Ein Vergleich zwischen Spielern, die in jedem Spiel auf dem Platz standen, und Spielern, die nur ein paar Spiele bestritten haben, könnte jedoch aufgrund der geringen Schwankungen in der Stichprobe äußerst unfair sein. Um dies abzumildern, gibt es einen doppelten Grenzwert für die Berücksichtigung der Tabellenführer in jeder Kennzahl.

Zunächst einmal wird eine Schwelle von 40 % der Spiele eingeführt. Das heißt, bei der Suche nach den besten Spielern in einer Kategorie muss ein Spieler mindestens 40 % der von der Mannschaft insgesamt gespielten Minuten auf dem Platz gestanden haben, um sich zu qualifizieren, andernfalls wird er bei der Berechnung des Mittelwerts nicht berücksichtigt. Dieser Schwellenwert ist etwas willkürlich, basiert aber auf der Vorstellung, dass die besten Spieler so oft wie möglich auf dem Platz stehen, sofern sie nicht verletzt sind.

Zweitens können wir mit Hilfe von Statistiken, die auf der Rate basieren, einen Grenzwert festlegen, indem wir die durchschnittliche Anzahl einer bestimmten Aktion betrachten, die ein Spieler in einer bestimmten Rolle ausführt. Ein Verteidiger führt zum Beispiel nicht so viele Dribblings aus, so dass zwei Dribblings pro Saison ausreichen, um sich zu qualifizieren. Ein Mittelfeldspieler oder ein Stürmer hingegen kann im Durchschnitt mehr versuchen. Diese Überlegungen lassen sich auf alle in diesem Beitrag genannten Kennzahlen anwenden.

Bei der Berechnung dieses Grenzwerts können wir berücksichtigen, dass Torhüter in der Regel häufiger auf dem Spielfeld sind als Positionsspieler. Daher sollten sich so viele Torhüter wie Mannschaften für die Liste der Torhüter qualifizieren. Dies ist der Fall, wenn der Cutoff bei

In einer ersten Annäherung war dies der Grenzwert, der für jede Menge verwendet wurde: ein Spieler muss die Hälfte der durchschnittlichen Anzahl von Aktionen für seine Position versucht haben, um sich für die Berücksichtigung als Ligaspitze in dieser Kategorie zu qualifizieren.

Nichtdimensionaler Vergleich

Die zum Vergleich herangezogenen Statistiken sind zwar vom Typ Rate und recht einfach zu vergleichen, aber es wäre nicht sofort ersichtlich, wie gut ein Spieler ist, der in 70 % der Fälle erfolgreich an den Gegenspielern vorbeidribbelt. Um dies leichter erkennbar zu machen, ist eine 100er-Skalierung sinnvoll. Das bedeutet, dass man jede Größe, die zur Bewertung der Spielerleistung herangezogen wird, durch ihren Durchschnitt über die Liga, die Saison und die Spielerposition dividiert und mit 100 multipliziert, so dass 100 der Ligadurchschnitt für jede Position und jede betrachtete zeitliche Stichprobe ist. Je höher über 100 ein Spieler liegt, desto besser war er im Vergleich zum Ligadurchschnitt auf dieser Position in dieser Saison.

Da jede der wichtigsten Spielphasen aus verschiedenen Werten besteht, können wir einen globalen Phasen-Score berechnen. Da alles dimensionslos ist, können wir den Durchschnitt der Komponenten nehmen, z. B:

Die Punktzahl wird weiterhin auf 100 skaliert und gibt die Gesamtbewertung eines Spielers in der Phase des Kontrollgewinns an.

Tabellenführer

Nun, da alles definiert ist, kann der beste Spieler für jede Rolle in jeder Phase ermittelt werden. In Form einer Tabelle können wir die Spitzenreiter bei der Balleroberung, dem Ballbesitz und dem Torerfolg betrachten.

Premier League 2018/2019 Kontrolle gewinnen Führer:

Bewertung von Fußballspielern

Tabellenführer der Premier League 2018/2019 in Sachen Ballkontrolle:

Bewertung von Fußballspielern

Torschützenkönige der Premier League 2018/2019:

Bewertung von Fußballspielern

Um Spieler direkt vergleichen zu können, bietet eine Radargrafik aller zur Berechnung solcher Werte verwendeten Metriken einen effizienteren Überblick über die Stärken und Schwächen der einzelnen Spieler. Ein Beispiel: Der für Liverpool spielende Virgil Van Dijk gehörte zu den 5 besten Verteidigern in Sachen Balleroberung und Torerfolg. Wie würde er im Vergleich zu einem Verteidiger wie Harry Maguire abschneiden, der in Bezug auf das Halten von Ballbesitz der Beste war?

Es sieht so aus, als ob Maguire in Sachen Dribbling überdurchschnittlich gut war, deutlich besser als Van Dijk, aber die beiden waren sich sehr ähnlich, was die Annahme und die Ausführung von Pässen angeht. Während Maguire also bei Ballbesitz und Torschüssen (Schusspräzision) im Vorteil war, war Liverpools Van Dijk auf der Torschussseite weitaus effizienter: Er erzielte im Durchschnitt mehr Tore pro Schuss (Toreffizienz) und kreierte relativ mehr Torschussaktionen als der durchschnittliche Verteidiger - Kategorien, in denen Maguire eigentlich unterdurchschnittlich war.

Nicht zuletzt war Van Dijk besser darin, den Ball vom Gegner zurückzuerobern (nur geringfügig beim Pressing, um einiges beim Tackling).

Das Radarbild zeigt die Stärken und Schwächen der beiden Spieler. Betrachtet man den abgedeckten Bereich, so war Van Dijk insgesamt eindeutig der effizientere Spieler für sein Team.

Eine ähnliche Übung kann auch für andere Rollen durchgeführt werden. Zum Beispiel taucht Sergio Agueros Name in den Top 5 der Torschützen und Ballgewinner auf, während Leroy Sané, der für dieselbe Mannschaft spielt, in den Top 5 der Ballgewinner und Kontrolleure auftaucht:

In diesem Fall liegt der Vergleich viel näher. Die beiden sind praktisch gleichwertig, wenn es darum geht, am Gegner vorbei zu dribbeln, aber Sané war besser darin, an ihn gerichtete Pässe zu kontrollieren, aufs Tor zu schießen und den Gegner unter Druck zu setzen. Auf der anderen Seite war Aguero viel besser im Luftkampf, im Zweikampfverhalten, beim Torschuss und bei der Entstehung von Toraktionen im Allgemeinen sowie als etwas effizienterer Passgeber.

Schlussfolgerung

In diesem Artikel wird versucht, die Bewertung von Spielern auf der Grundlage von ereignisbasierten Daten zu formalisieren. Es gibt einige Einschränkungen bei diesem Ansatz.

Zunächst einmal kann es sein, dass ein Spieler bestimmte Aktionen aufgrund der Strategie des Trainers nicht ausführen will. Dies wäre der Fall bei einem Verteidiger, der den Ball zurückerobern soll, im Gegensatz zu einem, der das Spiel von hinten aufbauen soll, oder bei einem spielmachenden Stürmer im Gegensatz zu einer typischen Nummer 9, von der erwartet wird, dass sie der Haupttorschütze ist.

Darüber hinaus unterscheiden die Daten in fbref nicht zwischen den verschiedenen Rollen in derselben Reihe, z. B. wird von einem Außenverteidiger wahrscheinlich erwartet, dass er den Ball viel mehr bewegt als ein Innenverteidiger, dessen Aufgabe es wahrscheinlich ist, den Gegner daran zu hindern, sich dem Strafraum zu nähern.

Schließlich könnte ein Spieler, der in einem guten Team spielt, besser dastehen, weil der Rest des Teams bessere Bälle aufschlägt (was die Punkteffizienz verbessert) oder weniger Bälle verliert (weniger Ballrückholaktionen).
Dies sind berechtigte Argumente, die angesichts fortgeschrittener Daten in einem separaten Beitrag behandelt werden könnten. Das Ziel dieses Beitrags ist es jedoch, eine Basislinie zu schaffen, die in verschiedenen Ligen umgesetzt werden kann. Während der Schwerpunkt hier auf der englischen Premier League liegt, könnte dieselbe Analyse auch für Spieler in der zweiten oder dritten Liga durchgeführt werden, da die hier verwendeten Statistiken auf jeder Ebene kostengünstig erhoben werden können (so wie die Spielberichtsbögen im Baseball in jeder Liga überall auf der Welt erhoben werden können). Daten über die Bewegung und die Interaktion eines Spielers erfordern wahrscheinlich eine teurere Technologie für die automatische Erfassung und wären für ein Zweitliga- oder Halbprofiteam unerschwinglich.

Schließlich sollten die hier entwickelten erweiterten Statistiken auch für den Laien verständlich sein, so dass selbst die am wenigsten datenkundigen Fans das analytische Urteil darüber, wer der beste Spieler für eine bestimmte Aufgabe auf dem Spielfeld ist, nachvollziehen können.

Datenwissenschaft & Fußball

Dieser Artikel ist Teil einer dreiteiligen Serie, die sich mit Datenwissenschaft im Zusammenhang mit Fußball beschäftigt.

Um mehr über Datenwissenschaft im Fußball zu erfahren, können Sie auch diese Artikel lesen:

Teil I: Die Dekonstruktion einer erfolgreichen Saison

Teil III: Schlechte Leistung oder Pech? Wie sich die Qualität von Angriff und Verteidigung und die Ungewissheit auf die Ergebnisse im Fußball auswirken

Einzelheiten

Titel: Bewertung von Fußballspielern
Autor:
DAIN StudiosDaten & KI Strategieberatung
Veröffentlicht in ,
Aktualisiert am 16. Januar 2024