Voetbalstatistieken Analyseren: Welke Data Echt Belangrijk Zijn

Laden...

Analist bestudeert voetbalwedstrijdbeelden op meerdere schermen in een werkruimte

Het internet barst van de voetbalstatistieken. Elke wedstrijd genereert honderden datapunten: balbezit, passpercentages, verwachte doelpunten, pressingsintensiteit, sprintafstanden, duels gewonnen, hoekschoppen, overtredingen, schoten geblokkeerd. De vraag voor een wedder is niet of er genoeg data is — die is er ruimschoots — maar welke data je werkelijk helpt om betere voorspellingen te doen en welke data ruis is die je op het verkeerde been zet.

Het onderscheid tussen nuttige en misleidende statistieken is niet altijd intuïtief. Sommige van de populairste metrieken in voetbalanalyse zijn verrassend arm aan voorspellende waarde, terwijl minder bekende datapunten consistent betere indicatoren zijn. Dit artikel scheidt het signaal van de ruis.

Balbezit: de meest overschatte metriek

Balbezit is de statistiek die iedereen kent en bijna iedereen verkeerd interpreteert. Het percentage balbezit vertelt je wie de bal het langst had, niet wie de betere kansen creëerde. Een team met zeventig procent balbezit dat de bal voornamelijk in het middenveld rondtikt zonder het strafschopgebied te bereiken, is niet dominant — het is inefficiënt.

Het verband tussen balbezit en wedstrijdresultaat is zwakker dan de meeste mensen denken. Onderzoek naar tienduizenden wedstrijden in de topcompetities toont dat balbezit slechts een bescheiden correlatie heeft met het winnen van wedstrijden. Teams als Atlético Madrid onder Diego Simeone en Leicester City in hun kampioensseizoen 2015-2016 bewezen dat je structureel kunt winnen met minder dan vijftig procent balbezit. Hun model — compact verdedigen en dodelijk counteren — maakte balbezit irrelevant.

Voor wedders is de les helder: negeer balbezit als primaire indicator. Het is verleidelijk om een team dat regelmatig zestig procent balbezit noteert als favoriet te beschouwen, maar zonder kansencreatie is dat bezit een lege metriek. Kijk in plaats daarvan naar wat er met dat bezit wordt gedaan — en daar komen schoten en schotkwaliteit om de hoek kijken.

Schoten en schotkwaliteit: dichter bij de waarheid

Het aantal schoten per wedstrijd is een stap dichter bij wat ertoe doet, maar ook hier zit een addertje. Niet elk schot is gelijk. Een afstandsschot van dertig meter met drie verdedigers in de lijn telt als één schot, net als een vrije kopbal van zes meter. De ruwe schotstatistiek maakt geen onderscheid en is daarom als zelfstandige metriek beperkt bruikbaar.

Waar het interessant wordt, is bij de verhouding tussen schoten en schotkwaliteit. Schoten in het strafschopgebied hebben een aanzienlijk hogere conversieratio dan schoten van buiten de zestien. Een team dat vijftien schoten per wedstrijd produceert waarvan tien binnen het strafschopgebied, is gevaarlijker dan een team met twintig schoten waarvan er veertien van buiten de zestien komen. Die nuance mist je als je alleen naar het totale aantal kijkt.

De metriek die dit het best vangt, is de expected goals per schot — xG/shot. Een hoge xG/shot betekent dat een team kwalitatief goede kansen creëert. Een lage xG/shot bij een hoog aantal schoten wijst op speculatief afstandsschieten dat er indrukwekkend uitziet in de statistieken maar zelden tot doelpunten leidt. Voor de Over/Under-markt is xG/shot een scherpere indicator dan het ruwe schotaantal.

Defensieve metrieken: de onderkant van het verhaal

Aanvallende statistieken krijgen de meeste aandacht, maar voor een compleet beeld moet je ook naar de defensieve kant kijken. Tegendoelpunten zijn het eindresultaat, maar ze vertellen je niet hoe een team verdedigt. Een team dat vijf tegendoelpunten incasseerde in vijf wedstrijden kan een solide defensie hebben met één rampzalige avond, of het kan structureel kwetsbaar zijn maar gered worden door een uitblinkende keeper.

De xG-against — de verwachte doelpunten die een team toestaat — is hier de meest informatieve metriek. Een laag xG-against wijst op een defensie die weinig kansen van hoge kwaliteit weggeeft. Dat is duurzamer dan een laag aantal tegendoelpunten dat steunt op buitengewone reddingen. Keepers die structureel boven hun expected goals against presteren, keren vroeg of laat terug naar het gemiddelde — en dan stijgt het aantal tegendoelpunten.

Een aanvullende metriek is PPDA — passes allowed per defensive action. Dit getal meet hoe hoog en intensief een team perst. Een laag PPDA-getal wijst op agressieve pressing: het team onderschept de bal hoog op het veld en geeft de tegenstander weinig ruimte om op te bouwen. Een hoog PPDA wijst op een team dat dieper verdedigt en de tegenstander het initiatief gunt. Geen van beide is inherent beter, maar het vertelt je veel over de speelstijl en hoe die interacteert met de speelstijl van de tegenstander.

Context boven cijfers

De grootste fout die je met voetbalstatistieken kunt maken, is ze geïsoleerd bekijken. Een team dat een xG van 0,8 produceerde tegen de nummer twee van de competitie, presteerde misschien uitstekend — terwijl dezelfde xG tegen de hekkensluiter alarmerend zou zijn. Context bepaalt de betekenis van elk getal.

Wedstrijdcontext omvat de kwaliteit van de tegenstander, de omstandigheden van de wedstrijd en de tactische keuzes van beide trainers. Een ploeg die met 1-0 voorstaat na vijfendertig minuten, schakelt vaak bewust over op een conservatievere speelwijze. De statistieken van de tweede helft weerspiegelen dan niet de kwaliteit van het team maar de tactische keuze om het resultaat te beschermen. Wie dat niet herkent, interpreteert een laag balbezit en weinig schoten in de tweede helft als zwakte terwijl het controle is.

Seizoenscontext speelt eveneens mee. De statistieken van de eerste vijf speelrondes zijn anders dan die van speelronde vijfentwintig tot dertig. In de openingsweken zijn er meer verrassingen, meer variatie en meer uitschieters. Nieuwe spelers moeten wennen, tactische systemen worden bijgeschaafd en de fitnessniveaus zijn nog niet optimaal. Naarmate het seizoen vordert, stabiliseren de patronen en worden de data betrouwbaarder. Een wedder die zijn analyses baseert op vroege seizoensdata zonder die context, bouwt op een wankel fundament.

Tot slot is er de menselijke context. Degradatiestrijd, titelstrijd, bekerwedstrijden halverwege de week en interlandperiodes beïnvloeden allemaal hoe teams presteren. Een club die dinsdag in de Champions League speelde en zondag weer in competitieverband moet aantreden, heeft een ander energieniveau dan de tegenstander die een volle week rust had. Die factor zit in geen enkele standaardstatistiek, maar hij beïnvloedt de uitkomst meetbaar.

Bronnen en tools voor statistiekanalyse

De kwaliteit van je analyse hangt samen met de kwaliteit van je bronnen. Gratis platforms bieden al een solide basis. FBref — beheerd door Sports Reference — biedt xG-data, schotstatistieken en geavanceerde metrieken voor vrijwel alle grote Europese competities. Understat richt zich specifiek op xG en heeft een gebruiksvriendelijke interface voor het vergelijken van teams en spelers. WhoScored biedt gedetailleerde wedstrijdstatistieken met een eigen beoordelingssysteem.

Voor diepgaandere analyse bestaan betaalde diensten. StatsBomb levert de meest gedetailleerde data ter wereld, inclusief een xG-model dat rekening houdt met de positie van verdedigers en keepers. Opta — onderdeel van Stats Perform — is de dataleverancier achter de meeste grote sportmedia. Toegang tot deze bronnen is niet goedkoop, maar voor serieuze wedders die hun analyse naar een hoger niveau willen tillen, biedt het een meetbaar informatievoorsprong.

Een praktische tip: beperk je tot drie tot vier bronnen en leer die grondig kennen in plaats van tien platforms oppervlakkig te gebruiken. Elke bron hanteert eigen definities en modellen. FBref’s xG-model is niet identiek aan dat van Understat, en die kleine verschillen kunnen leiden tot tegenstrijdige conclusies als je ze door elkaar gebruikt. Kies een primaire bron, gebruik een tweede als controle en houd je daar consequent aan.

De statistiek die niet bestaat

Na al die getallen, modellen en metrieken is het paradoxaal maar essentieel om te erkennen dat de belangrijkste statistiek in voetbal niet bestaat. Er is geen getal dat het volledige verhaal van een wedstrijd vertelt. Geen metriek die de spanning van een halve kans in de negentigste minuut vangt, het effect van een schreeuwend thuispubliek kwantificeert of het onverklaarbare zelfvertrouwen van een team in vorm meet.

Statistieken zijn gereedschap. Ze zijn bijlen en hamers, geen architecten. Ze helpen je om sneller en preciezer te werken, maar ze ontwerpen het huis niet. Het ontwerp — de analyse, de synthese, het oordeel — blijft mensenwerk. De wedder die blind op xG vaart zonder wedstrijden te kijken, mist het verhaal achter de cijfers. De wedder die alleen op gevoel speelt zonder data te raadplegen, mist de structuur die zijn gevoel zou kunnen bevestigen of corrigeren.

De beste analisten opereren in de ruimte daartussenin. Ze kijken wedstrijden en laten de data hun waarneming toetsen. Ze zien een dominant team dat verliest en checken of de xG die dominantie bevestigt. Ze vermoeden een defensieve kwetsbaarheid en zoeken in de data naar het bewijs. Die wisselwerking — kijken, meten, vergelijken, oordelen — is geen wetenschap en geen kunst. Het is een ambacht dat je ontwikkelt door het te doen, seizoen na seizoen, wedstrijd na wedstrijd.