“Geavanceerde statistieken” is een soort modewoord geworden in de ijshockeywereld. Het is in opkomst in de NHL, net als jaren geleden bij de MLB. Hockey teams hebben hele afdelingen voor analyse, en het is uitgegroeid tot een oorlog (woordspeling bedoeld) van soorten tussen twee kanten: De Data Nerds vs. Old School Hockey. Wat ik van plan ben te doen, is een aantal veelgebruikte statistieken uit te splitsen om mensen wegwijs te maken in de wereld van NHL analytics.
Understanding NHL Analytics
Toen ik me voor het eerst wilde verdiepen in NHL analytics, was het moeilijkste om een bron te vinden die me niet alleen hielp te begrijpen wat de statistieken betekenden, maar ook wat een “goede” versie van de statistiek was. Het is vrij algemeen bekend dat het scoren van 30 doelpunten in een seizoen een goed seizoen is, maar wat is goed in termen van Corsi of verwachte doelpunten?
“Geavanceerde statistieken” is vaak een misleidende term. Dit komt omdat, in de basis, veel van de gemeenschappelijke statistieken waarover gesproken wordt, zeer eenvoudig van aard zijn. Er zijn een aantal complexe manieren van kijken naar de context op keer, of een aantal grote berekeningen betrokken, maar de basis statistieken zijn niet zo “geavanceerde”.
Een laatste voorloper voordat we in de inhoud: de meerderheid van deze nummers zijn om te meten 5v5 in de NHL. Als we het hebben over powerplays en penalty kills, wordt het een ander beestje.
Corsi
Wat is Corsi? Dit is waarschijnlijk de meest voorkomende statistiek die men hoort als men het heeft over NHL geavanceerde statistieken. Om het in de meest eenvoudige termen samen te vatten: het meet het aantal kansen. Corsi meet schoten op doel, schoten naast en geblokkeerde schoten. Het heeft de neiging om een groter beeld te schetsen van het hele spel dan alleen de traditionele telling van “schoten op doel”.
Er is zowel Corsi voor (CF) als Corsi tegen (CA). Daarom kan Corsi worden weergegeven als een differentieel (C± of C+/-), of als een percentage (CF%). De meest gebruikelijke manier om Corsi uit te drukken is door middel van CF%. Het is het eenvoudigst te begrijpen en het plaatst het in een context die het kijken naar ruwe Corsi voor of tegen niet doet. Individueel Corsi (iCF) is ook een berekenbare statistiek. Het kan je vertellen hoeveel schotpogingen een enkele speler heeft ondernomen. Corsi wordt in deze context echter zelden gebruikt.
Nu, waar moet je op letten als je naar deze statistiek kijkt? Traditioneel, alles boven 50% wordt gezien als goed. Neem dit echter met een korreltje zout. Dit is de drempel waar je naar moet kijken over een groot deel van het werk. In één enkele wedstrijd mag het verschil tussen 47% en 51% niet worden gebruikt om te zeggen “deze speler had een goede wedstrijd en deze speler had een slechte wedstrijd”. In de context van slechts één wedstrijd kunnen deze beide spelers worden gezien als de middenmoot van het peloton. Naarmate de steekproef groter wordt, zoals over een seizoen van 82 wedstrijden, worden de verschillen tussen 51% en 47% veel significanter.
Fenwick
Fenwick is in principe hetzelfde idee als Corsi, maar het telt de geblokkeerde schoten niet mee in de statistiek. Door alleen schoten op doel en schoten naast mee te tellen, wordt het idee versterkt dat geblokkeerde schoten opzettelijk zijn en deel kunnen uitmaken van het systeem van een coach. Veel van de ideeën van Corsi zijn van toepassing op Fenwick. Fenwick voor percentage (FF%), Fenwick plus-minus (F± of F+/-).
Relative to Team
Zowel Corsi als Fenwick kunnen worden afgebeeld als relatief ten opzichte van de rest van hun team. Het is een vrij eenvoudige manier om te zien hoe de speler het spel drijft in vergelijking met teamgenoten. Het wordt gemeten door het on-ice Corsi voor percentage van een speler te nemen en het Corsi voor percentage van het team af te trekken zonder die speler op het ijs.
We kunnen bijvoorbeeld kijken naar Natural Stat Trick line tool en zien dat de Carolina Hurricanes een CF% van 53,48% hadden zonder Jordan Staal op het ijs. Met Staal op het ijs, hadden de Hurricanes een CF% van 56.35%. Dit zou Staal een relatief CF% geven van 2.87. Deze waarde kan ook negatief worden uitgedrukt als het CF% van een speler lager is dan dat van zijn team. Dezelfde formule kan worden toegepast op Fenwick.
PDO
*Note, PDO is geen acroniem voor iets. Het is gewoon PDO.*
PDO is een vreemde statistiek, en wordt eigenlijk niet zo vaak gebruikt, maar het doel ervan is om “geluk” in ijshockey te meten. Die berekening is gewoon om het geluk van een team of een speler te meten. Het is gewoon het reddingspercentage van het team plus hun schietpercentage. In termen van individuele spelers PDO, kijken we naar de on-ice shooting percentage en save percentage.
Het idee achter PDO is dat een team of speler zal meestal gemiddeld een totaal van 100.0 over een volledig seizoen zodra hot streaks en cold streaks zijn afgevlakt is dit waar de meerderheid van de spelers zal staan.
Het probleem met PDO is echter dat teams en spelers die boven het gemiddelde uitsteken, zoals Auston Matthews in 2017-18 die eindigde met 104,8, naar verwachting hoger zullen zijn dan de verwachte 100,0. Betere teams, en spelers, worden verwacht hogere schietpercentages en reddingspercentages te hebben als gevolg van het feit dat ze gewoon hoger geschoolde spelers hebben, en dit is waar de stat tekort schiet.
Zone Starts
Zone starts evalueren hoeveel verschuivingen een speler begint in de offensieve zone versus de defensieve zone. Dit kan worden gebruikt om te kijken naar de context van het gebruik en hoe het een speler beïnvloedt. Bijvoorbeeld, van spelers die vaker in de offensieve zone beginnen kan verwacht worden dat ze hogere cijfers hebben in statistieken zoals Corsi. Het omgekeerde is ook waar. Veel van deze metingen geven niet het volledige beeld, maar Evolving Hockey is begonnen met het bijhouden van deze metingen samen met het gebruik van de aanvallende zone. Dit geeft een completer beeld dan voorheen.
De volgende keer in Understanding NHL Analytics: A Beginners Guide zullen we kijken naar verwachte doelpunten. Als u vragen hebt, voel je vrij om te bereiken op Twitter.
Main photo:
Embed from Getty Images