xG (expected goals) pro sázkové analýzy: co měří a jak ho číst

xG expected goals - metrika pro sázkovou analýzu fotbalu

Načítání...

V sezóně 2021/22 jsem sázel proti Brentfordu pokaždé, když hráli venku. Jejich výsledky vypadaly nadprůměrně, ale xG ukazoval něco jiného – stříleli z pozic s nízkou pravděpodobností gólu a měli štěstí. Do konce sezóny se regrese k průměru dostavila a moje sázky proti nim skončily v plusu. Bez xG bych tuhle příležitost nikdy neviděl.

Expected goals je metrika, která kvantifikuje kvalitu šancí v zápase. Místo toho, aby počítala góly – výsledek, který ovlivňuje štěstí, schopnost brankáře i náhoda – měří, kolik gólů by průměrný hráč z daných pozic vstřelil. Fotbal drží 35,27 % tržního podílu online sportovních sázek a xG se stalo jedním z hlavních nástrojů, jak v tomto trhu najít výhodu.

Jak se xG počítá a co vstupuje do modelu

Každá střela ve fotbale má určitou pravděpodobnost, že skončí gólem. Penalta má xG kolem 0.76 – tři ze čtyř penalt padnou. Střela z hranice šestnáctky pod úhlem má xG třeba 0.04 – jeden gól ze dvaceti pěti pokusů. xG model přiřadí každé střele v zápase tuto pravděpodobnost a součet všech střel jednoho týmu dá jeho celkové xG.

Co vstupuje do výpočtu? Základní modely pracují s pozicí střely (vzdálenost od branky a úhel), typem střely (nohou, hlavou), a situací (otevřená hra, standardní situace, penalta). Pokročilejší modely přidávají rychlost protiútoku, počet obránců mezi střelcem a brankou, pozici brankáře a typ přihrávky, ze které střela vznikla.

V Evropě fotbal představuje téměř 80 % trhu sportovních sázek a právě na evropských ligách jsou xG modely nejpřesnější. Důvod je jednoduchý – víc dat. Premier League, Bundesliga nebo La Liga mají detailní tracking dat za každý zápas, zatímco menší ligy často nemají ani základní pozice střel. Kvalita xG přímo závisí na kvalitě vstupních dat.

Důležité je rozumět, co xG neměří. Neměří kvalitu zakončení konkrétního hráče. Lionel Messi z pozice s xG 0.08 skóruje výrazně častěji než průměrný hráč – to ale neznamená, že model je špatný. Znamená to, že Messi je nadprůměrný střelec a jeho skutečné góly budou systematicky převyšovat jeho xG. Pro sázkovou analýzu je tohle klíčová informace: tým s nadprůměrným střelcem bude mít vyšší skutečné góly než xG, a naopak.

xG vs. skutečné góly: kdy rozdíl signalizuje příležitost

Tady se xG stává skutečně užitečným pro sázkaře. Matthew Wein, expert na integritu sportu, jednou poznamenal, že v sázení je to vždycky hra kočky s myší – jedni hledají výhodu a druzí ji dohánějí. xG nabízí výhodu, kterou většina rekreačních sázkařů ignoruje.

Když tým dlouhodobě skóruje výrazně víc, než odpovídá jeho xG, pravděpodobně má štěstí nebo nadprůměrné zakončovatele. Štěstí se vyrovná, nadprůměrné zakončení přetrvá – ale v obou případech je důležité rozlišit, co je co. Pokud tým bez hvězdného útočníka překonává své xG o 30 % za deset zápasů, je vysoká pravděpodobnost, že příští zápasy přinesou gólový pokles.

Naopak tým, který inkasuje méně gólů, než odpovídá xGA (expected goals against), má buď výjimečného brankáře, nebo štěstí. Když takový tým hraje bez svého prvního brankáře, jeho defenzivní výkon se pravděpodobně vrátí k hodnotám xGA – a to je příležitost pro sázku na Over nebo BTTS Ano.

Konkrétní postup, který používám: vezmu průměrné xG a xGA obou týmů za posledních osm ligových zápasů, zvlášť domácí a venkovní. Porovnám je se skutečnými góly. Pokud je rozdíl větší než 0.4 xG na zápas v jednom směru, dávám tomuto zápasu prioritu v analýze. Takový rozdíl se přes delší období téměř vždy vyrovná.

Kde najít xG data zdarma – přehled zdrojů

Před pěti lety bylo xG dostupné jen pro profesionální analytiky a velké sázkové syndikáty. Dnes existuje několik kvalitních bezplatných zdrojů, které zvládne použít každý sázkař s internetovým připojením.

FBref.com nabízí xG data pro top ligy s několikadenním zpožděním. Výhodou je rozsáhlá databáze zahrnující i nižší soutěže a historická data. Nevýhodou je, že pracuje s modelem StatsBomb, který se může lišit od modelů jiných poskytovatelů – ale pro sázkovou analýzu je dostatečně přesný.

Understat.com se zaměřuje na top pět evropských lig a nabízí přehledné vizualizace xG pro jednotlivé zápasy i celé sezóny. Můžete vidět xG mapu každého zápasu – kde přesně střely padly a jakou měly hodnotu. Pro vizuální typ analytika je to nejlepší dostupný nástroj.

FootyStats a WhoScored nabízejí xG jako součást širší statistické nabídky. Nejsou tak detailní jako specializované xG zdroje, ale dávají rychlý přehled spolu s dalšími metrikami, které pro komplexní analýzu zápasů stejně potřebujete.

Co žádný bezplatný zdroj nenabídne, jsou pre-match xG predikce – odhady, kolik xG by měl každý tým v nadcházejícím zápase vytvořit. Ty vyžadují vlastní model nebo placenou službu. Pro většinu sázkařů ale stačí historická data a zdravý rozum: pokud tým konzistentně vytváří 1.8 xG na zápas doma a soupeř konzistentně povoluje 1.5 xGA venku, máte solidní základ pro odhad.

Limity xG a kdy metriku nepoužívat

xG není křišťálová koule a znát jeho limity je stejně důležité jako znát jeho použití. Za prvé: malé vzorky. xG jednoho zápasu je statisticky bezcenné. Tým může mít 3.0 xG a prohrát 0:1, nebo mít 0.5 xG a vyhrát 2:0. Jednotlivé zápasy jsou příliš ovlivněné náhodou. Minimální smysluplný vzorek je šest až osm zápasů, ideálně deset a víc.

Za druhé: xG nezohledňuje taktické změny. Pokud tým změnil trenéra, přestoupil na jiný systém nebo ztratil klíčového hráče, historické xG neodráží současnou realitu. Vždy kontrolujte, jestli v období, za které xG počítáte, nedošlo k zásadní změně.

Za třetí: xG modely se liší. StatsBomb, Opta a další poskytovatelé používají různé vstupy a různé metodologie. Absolutní hodnota xG se mezi modely může lišit o 0.2 až 0.3 na zápas. Proto je důležitější sledovat trendy a rozdíly než absolutní čísla – a pracovat konzistentně s jedním zdrojem.

Za čtvrté: xG nepočítá s absencí střel. Tým, který dominuje v držení míče, ale nevystřelí, má xG nula – přestože kontroloval zápas. Pro sázkovou analýzu to znamená, že xG samo o sobě nestačí. Musíte ho kombinovat s dalšími metrikami: počtem vstupů do pokutového území, počtem klíčových přihrávek a celkovým obrazem hry. xG je nejlepší single metric ve fotbalové analýze, ale žádná single metric nenahradí komplexní pohled.

Jedna osobní zkušenost na závěr: xG mi nejvíc pomáhá ne při hledání jednotlivých sázek, ale při identifikaci trendů, které trh ještě nezachytil. Když tým postupně zlepšuje své xG za pět, šest, sedm zápasů, ale jeho výsledky se zatím nezlepšily, je to signál, že výsledky brzy budou následovat. A kurzy to ještě neodrážejí, protože většina sázkařů se dívá na výsledky, ne na proces.

Má xG smysl i pro nižší ligy, kde je méně dat?

Omezeně. V nižších ligách chybí detailní tracking dat a xG modely pracují s méně přesnými vstupy. Pro českou první ligu jsou xG data dostupná a použitelná, ale pro druhou ligu a níže je kvalita dat výrazně nižší. V těchto soutěžích doporučuji spoléhat spíše na tradiční statistiky – střely na bránu, rohové kopy, držení míče – a xG používat jen jako doplňkový ukazatel.

Jak se liší xG modely různých poskytovatelů?

Hlavní rozdíly jsou ve vstupních datech a metodologii. Základní modely počítají jen s pozicí střely, pokročilé přidávají kontext jako rychlost útoku, pozice obránců nebo typ přihrávky. V praxi se absolutní hodnoty xG liší o 0.2 až 0.3 na zápas mezi různými poskytovateli. Pro sázkovou analýzu je důležitější konzistentně používat jeden zdroj a sledovat relativní trendy než porovnávat absolutní čísla z různých modelů.