Analýza

Analýza fotbalových zápasů pro sázky - metriky a systematický postup

Načítání...

Vzpomínám si na zápas, kde jsem vsadil na domácí výhru, protože „měli formu“. Čtyři výhry v řadě, skvělá obrana, doma neprohráli půl roku. Prohrál jsem. Po zápase jsem se podíval na data a zjistil, že ty čtyři výhry přišly proti čtyřem nejslabším týmům tabulky, domácí xG bylo po celou sérii pod 1.0 na zápas a hostující tým měl třetí nejlepší venkovní bilanci v lize. Forma existovala – ale jen na povrchu. Pod daty vypadala úplně jinak.

Fotbal drží v Evropě téměř 80 % trhu sportovních sázek. To znamená, že na každý zápas v top ligách sází tisíce lidí – a většina z nich se rozhoduje na základě pocitu, posledního výsledku nebo oblíbenosti týmu. Systematická analýza vám nedá jistotu, ale dá vám výhodu nad těmi, kdo analyzovat nechtějí. A na trhu, kde marže bookmakera sežere profit každého průměrného sázkaře, je právě tahle výhoda to, co rozhoduje.

V tomhle článku projdu metriky a postupy, které používám před každou sázkou. Od xG přes formu a domácí bilanci až po kontextové faktory, které žádná tabulka nezachytí. Na konci najdete kompletní checklist, který si můžete vzít jako šablonu pro vlastní analýzy.

Důležité upozornění hned na úvod: analýza není totéž co tipování. Tipér vám řekne „sázejte na domácí“. Analytik vám řekne „domácí mají xG diferenciál +0.4, ale hosté rotovali sestavu o víkendu a dnes nastoupí v plné síle – implikovaná pravděpodobnost domácí výhry z kurzu 1.75 je 57 %, můj odhad je 52 %, takže sázka nemá value“. Ten druhý přístup je pracnější. Ale je to jediný přístup, který dlouhodobě funguje.

Expected goals (xG) – co měří a co ne

Když jsem poprvé viděl, že tým vyhrál 3:0 a přitom měl xG jen 0.8, říkal jsem si, že ta statistika je k ničemu. Jak může tým s xG 0.8 dát tři góly? Právě proto je xG tak užitečná – protože odhaluje rozpor mezi tím, co se stalo, a tím, co se „mělo“ stát na základě kvality šancí. Tým s xG 0.8 a třemi góly měl obrovské štěstí. A štěstí se neopakuje.

Expected goals měří kvalitu střeleckých příležitostí na základě historických dat. Každý pokus o střelu dostane hodnotu od 0 do 1 podle toho, jak pravděpodobné je, že z dané pozice a situace padne gól. Penalta má xG kolem 0.76, střela z hranice šestnáctky pod úhlem má xG třeba 0.04. Součet xG všech střel týmu v zápase udává, kolik gólů „měl“ vstřelit při průměrném zakončení.

Rozšířené modely zahrnují i kontext střely – jestli šla hlavou nebo nohou, jestli předcházela přihrávka z křídla nebo průniková, jestli brankář byl v pozici nebo mimo ní. Čím víc faktorů model zahrnuje, tím přesnější je odhad. Ale základní princip zůstává: xG převádí subjektivní dojem „měli hodně šancí“ na měřitelné číslo, se kterým se dá pracovat analyticky.

Pro sázkovou analýzu je xG klíčová ze dvou důvodů. Za prvé, odhaluje týmy, které mají lepší výsledky, než by odpovídalo kvalitě jejich hry – tedy týmy, jejichž forma je neudržitelná. Tým s pěti výhrami a xG pod 1.0 na zápas pravděpodobně brzy začne ztrácet body. Za druhé, xG identifikuje podceněné týmy – ty, které prohrávají navzdory kvalitním šancím. Takový tým má reálnou výkonnost lepší, než ukazuje tabulka, a kurzy na jeho výhru bývají nafouklé.

Co xG neměří? Kvalitu brankáře, individuální schopnost zakončovatelů a taktické změny během zápasu. Hvězdný útočník promění šanci s xG 0.06, kde průměrný hráč selže. Proto xG používám jako jeden z několika vstupů, nikdy jako jediný rozhodovací faktor. Kombinace xG s formou, sestavou a kontextem dává mnohem přesnější obraz než jakákoliv jednotlivá metrika.

Praktický příklad: sledujete zápas, kde domácí tým vyhrál 1:0 z penalty. Celkové xG domácích: 0.92 (z čehož 0.76 penalta). xG hostů: 1.45. Hosté měli lepší šance, ale prohráli. Tabulka říká „domácí vyhráli“. xG říká „hosté byli lepší tým“. Příští týden hrají hosté doma a kurz na jejich výhru je 2.20 – protože „minule prohráli“. Vidíte ten prostor? xG vám umožňuje vidět pod povrch výsledků a identifikovat situace, kde trh reaguje na výsledek, ne na výkon.

Fotbal drží přes 35 % podílu na globálním online sázkovém trhu, a na tak obrovském trhu i malá analytická výhoda generuje měřitelný profit. xG je nástroj, který tu výhodu poskytuje – pokud ho používáte správně a v kombinaci s dalšími metrikami.

Forma týmu a momentum: kolik zápasů zpětně má smysl hodnotit

Pět zápasů. To je magické číslo, které najdete v každém sázkovém přehledu – „forma za posledních 5 zápasů“. Problém je, že pět zápasů je statisticky bezvýznamný vzorek. Tři výhry a dvě remízy za posledních pět kol vypadají skvěle, ale neřeknou vám skoro nic o skutečné síle týmu. Dva z těch tří zápasů mohly být proti sestupovým celkům a ta remíza mohla být šťastná.

V praxi pracuji s dvěma časovými okny. Krátkodobá forma – posledních 6-8 zápasů – slouží k zachycení aktuálního trendu. Jsou tam zranění, taktické změny, psychologické momentum. Dlouhodobá forma – celá sezóna nebo posledních 20-25 zápasů – odstraňuje šum a ukazuje reálnou výkonnost. Pokud krátkodobá forma výrazně odchyluje od dlouhodobé, ptám se proč. Změnil se trenér? Vrátil se klíčový hráč? Nebo je to prostě regrese k průměru po šťastné sérii?

Momentum je pojem, který sázkový svět miluje a statistika nenávidí. Výzkumy opakovaně ukazují, že „momentum“ v týmových sportech je z velké části iluze – sérii výher lépe vysvětluje kalendář (slabí soupeři), domácí zápasy a zdravotní stav kádru než nějaká mystická síla. Když vidím, že tým „má momentum“, podívám se nejdřív, proti komu hrál. Čtyři výhry proti čtyřem nejhorším týmům nejsou momentum. Jsou to čtyři snadné zápasy.

57 % evropských fotbalových fanoušků sází primárně na pre-match výsledky, a většina z nich se rozhoduje právě na základě formy. To vytváří příležitost: pokud dokážete formu analyzovat líp než průměrný sázkař – tedy s kontextem, s xG, s rozlišením soupeřů – máte edge právě tam, kde je největší objem peněz.

Jeden konkrétní způsob, jak formu kvantifikovat lépe než konkurence: místo výsledků (výhra/remíza/prohra) sledujte xG diferenciál za posledních 8 zápasů. Tým s diferenciálem +0.6 xG na zápas je výrazně silnější než tým s diferenciálem +0.1, i kdyby oba měli čtyři výhry z pěti. xG diferenciál odfiltruje štěstí a ukáže, jak kvalitní šance tým vytváří a kolik jich pouští. Tohle číslo má mnohem vyšší prediktivní hodnotu než prostá forma ve formě písmenek V-R-P.

A ještě jedna poznámka k formě: začátek a konec sezóny jsou specifické. Na začátku sezóny máte málo dat a forma z přípravných zápasů je bezcenná. Na konci sezóny vstupuje do hry motivace – a tým bez motivace může ztratit „formu“ ze dne na den. V obou případech váha formy v mé analýze klesá a roste váha dlouhodobých metrik a kontextu.

Domácí vs. venkovní bilance – jak moc záleží na hřišti

Jeden z prvních „aha momentů“ v mé sázkové kariéře: tým, který doma prohrál jen jednou za sezónu, venku vyhrál čtyři z dvaceti zápasů. Stejný tým, stejní hráči, úplně jiné výsledky. Domácí výhoda je jedním z nejstarších a nejstabilnějších fenoménů ve fotbale – ale její velikost se liší mezi ligami, stadiony a dokonce i částmi sezóny.

V top evropských ligách domácí týmy historicky vyhrávají přibližně 45-47 % zápasů. Po covidu, kdy se hrálo bez diváků, tento podíl dočasně klesl na zhruba 42 %, což potvrdilo, že fanoušci skutečně ovlivňují výsledky – ať už přes tlak na rozhodčí, nebo přes energii, kterou dodávají hráčům. Po návratu diváků se domácí výhoda vrátila na předcovidové hodnoty.

Zajímavý detail: domácí výhoda není konstantní v průběhu sezóny. Na začátku ročníku bývá silnější, protože týmy hrají v novém složení a domácí prostředí jim dává jistotu. Ke konci sezóny, kdy motivace vstupuje do hry víc než zázemí, domácí výhoda slábne – zvlášť u týmů v klidném středu tabulky, kde fanoušci přestávají chodit na zápasy.

Pro sázkovou analýzu je důležité pracovat s oddělenými domácími a venkovními statistikami. Celková tabulka lže – tým na osmém místě může být doma třetí a venku čtrnáctý. Když takový tým hraje doma proti celku, který je v celkové tabulce výš, ale venku hraje mizerně, kurzy často neodráží reálnou situaci. Bookmakeři samozřejmě domácí faktor modelují, ale rekreační sázkaři se řídí celkovou tabulkou – a to vytváří prostor.

Specifika českého prostředí: domácí výhoda je tu obvykle výraznější než v top pěti ligách, protože rozdíly v kvalitě zázemí jsou větší. Tým hrající na malém stadionu s umělou trávou má doma výhodu, na kterou se host nedokáže připravit. Tyto mikrodetaily nejsou v datech, ale znalost ligy je odhalí.

Jak domácí výhodu začlenit do analýzy? Nepoužívejte jednu univerzální hodnotu pro celou ligu. Spočítejte si domácí win rate pro konkrétní tým za posledních 20-25 domácích zápasů a porovnejte s ligovým průměrem. Pokud tým vyhrává doma 65 % zápasů při ligovém průměru 46 %, má nadprůměrnou domácí výhodu – a kurzy to ne vždy reflektují. Naopak, tým s domácím win rate 38 % je doma slabší, než naznačuje jeho pozice v tabulce, a kurz na jeho domácí výhru může být příliš nízký.

Sestava, zranění a rotace – kde hledat informace

Půl hodiny před zápasem vypadne ze sestavy klíčový stoper a kurz se nepohne. Jak je to možné? Protože bookmaker už o tom věděl – ale vy ne. Informační výhoda je v sázení drahocenná a sestava je oblast, kde se projevuje nejvíc. Kdo sleduje tiskové konference, tréninkové zprávy a sociální sítě klubů, má náskok před tím, kdo se podívá na sestavu až hodinu před výkopem.

Zranění klíčového hráče nemá vždy stejný dopad. Ztráta střelce s 15 góly za sezónu je jiná než ztráta defenzivního záložníka. Ale pozor – někdy je ztráta neviditelného hráče horší. Defenzivní záložník, který organizuje presinink a pokrývá prostory, může být pro fungování celého týmu důležitější než hvězdný útočník. Tyto nuance pochopíte jen sledováním zápasů, ne čtením statistik.

Rotace je další faktor, který řada sázkařů ignoruje. Týmy hrající evropské poháry pravidelně rotují sestavu v ligových zápasech mezi pohárovou středou a víkendovým kolem. Trenér pošetří klíčové hráče pro důležitější zápas – a ligový soupeř najednou čelí výrazně slabšímu protivníkovi, než naznačuje jméno na dresu. V Lize mistrů nebo Evropské lize je tohle fenomén, na který sázím pravidelně a který konzistentně generuje value.

Kde informace hledat? Klubové weby a sociální sítě jsou primární zdroj. Tiskové konference trenérů před zápasem – většina top lig je streamuje. Specializované weby s přehledem zranění. A konečně: sledování samotných zápasů. Žádný datový zdroj nenahradí vlastní oči. Když vidíte, že hráč dohrává s bolestivou grimasou, máte informaci, která se v oficiální statistice objeví až za dva dny.

Ještě jeden aspekt, který přehlíží i zkušení sázkaři: nově příchozí hráči. Zimní přestupové okno v lednu a letní v červenci přinášejí změny, které se v datech projeví až po několika kolech. Tým, který přivedl kvalitního útočníka, může mít výrazně vyšší xG za dva měsíce – ale kurzy se přizpůsobí pomaleji, protože bookmaker modeluje na základě historických dat. Podobně tým, který ztratil klíčového tvůrce hry, může vypadat na papíře stejně silný, ale jeho reálný výkon klesne. Kdo sleduje přestupy a rozumí jejich dopadu na herní systém, má informační předstih.

H2H a kontextové faktory: motivace, derby, termínová tíseň

Třicet vzájemných zápasů, z toho dvacet domácích výher. Jasný signál? Ne tak úplně. H2H statistika je jedna z nejpřeceňovanějších metrik v sázkové analýze. Výsledky zápasů z roku 2018 nemají žádnou prediktivní hodnotu pro zápas v roce 2026 – oba týmy mají jiné hráče, jiné trenéry, jinou formu. H2H dává smysl jen v krátkém horizontu a jen pokud oba týmy prošly minimálními personálními změnami.

Co má mnohem větší váhu než historické H2H, jsou kontextové faktory. Motivace je první z nich. Tým, který bojuje o titul, hraje jinak než tým, který je v bezpečném středu tabulky. Tým, který potřebuje vyhrát, aby se vyhnul sestupu, podává výkony, které jeho celosezonní data nenaznačují. A naopak – tým, který už má jistotu postupu, nasadí béčko a výsledek ho nezajímá.

UEFA v boji za integritu sportu opakovaně zdůrazňuje, že jednou z největších hrozeb je právě moment, kdy jeden tým nemá motivaci hrát na plný výkon. Ne kvůli korupci, ale kvůli logice turnajového formátu. Poslední kolo skupiny Ligy mistrů, kde jeden tým už je zajištěný a druhý bojuje o postup, je klasický příklad situace, kde kontext překonává statistiku.

Derby je specifický kontext, který nelze modelovat čísly. Lokální rivalita zvyšuje intenzitu, přináší vyloučení a nečekané výsledky. Outsider v derby vyhrává výrazně častěji než mimo derby – a to je měřitelný fenomén, ne folklór. Termínová tíseň – středa-sobota-úterý rytmus evropských pohárů – je další kontext, který přímo ovlivňuje fyzický stav hráčů a skrze něj výkon i výsledek.

V mé analýze mají kontextové faktory právo veta. Pokud data říkají „domácí favorit“ a kontext říká „domácí hráli ve středu v Lize mistrů, klíčový stoper má žlutou kartu navíc a na lavičce nemají adekvátní náhradu“, nesázím na domácí, i kdyby xG a forma vypadaly skvěle. Data popisují minulost. Kontext popisuje přítomnost. A sázíte na budoucnost, kterou kontext ovlivní víc než historické statistiky.

Poslední kontextový faktor, který pravidelně přehlížím i já: počasí. Silný vítr mění trajektorie dlouhých přihrávek a standardních situací. Déšť zrychluje hru a zvýhodňuje přímočaré týmy. Extrémní horko v letních kvalifikacích snižuje intenzitu a produkuje méně gólů. Tyto faktory nejsou v žádném modelu, ale ovlivňují výsledek – a tedy i to, jestli vaše sázka vyhraje.

Systematický postup analýzy: checklist před sázkou

Po letech pokus-omyl jsem si vytvořil postup, který dodržuji před každou sázkou. Není to nic revolučního – je to prostě seznam otázek, na které si odpovím, než otevřu sázkový účet. Trvá to 15-20 minut na zápas. A je to nejlepší investice času, jakou v sázení můžete udělat.

Začínám od konce: jaký kurz bookmaker nabízí a jakou pravděpodobnost implikuje? Tohle mi dá referenční bod. Pak jdu k datům: xG za posledních 8-10 zápasů, odděleně domácí a venkovní. Gólové trendy – Over/Under profil obou týmů. Porovnání očekávaných a skutečných gólů – identifikace týmů v „šťastné“ nebo „nešťastné“ sérii.

Další krok je sestava a kontext. Jsou klíčoví hráči k dispozici? Hraje tým v evropském poháru uprostřed týdne? Jaká je motivace – boj o titul, záchrana, nic? Je to derby nebo prestižní zápas? Poslední krok je syntéza: na základě všech vstupů odhadnu pravděpodobnost a porovnám s kurzem. Pokud je sázka value, zapíšu ji do deníku s odhadem, kurzem a důvody. Pokud ne, sázku nezadám – a tohle je ta nejtěžší část.

Live sázky představují přes 62 % podílu na trhu online sportovních sázek, ale před live sázkou tento checklist nestíhám projít celý. Proto live sázím jen na zápasy, které jsem analyzoval předem – nikdy na zápasy, které jsem otevřel náhodně během sledování přenosu. Pre-match analýza je základ. Live je jen rozšíření, ne náhrada.

Na závěr: analýza bez evidence je ztráta času. Zapisujte si každou sázku – kurz, váš odhad pravděpodobnosti, důvody, výsledek. Po stovkách sázek uvidíte vzorce: kde systematicky přeceňujete domácí výhodu, kde podceňujete vliv rotace, kde vás klame forma. Tahle zpětná vazba je to, co z dobrého analytika dělá excelentního.

A jedno poslední varování: neanalyzujte zápasy, na které nechcete sázet, jen proto, že je to zajímavé. Analýza zabírá čas a mentální energii. Pokud věnujete hodinu rozboru zápasu a pak zjistíte, že kurz nenabízí value, ta hodina je pryč. Lepší je nejdřív profiltrovat zápasy podle kurzů a základních dat a teprve ty, které projdou prvním filtrem, analyzovat do hloubky. Efektivita je součást strategie.

Kde analytici nejčastěji tápou

Kde najdu spolehlivá data o xG zdarma?

Několik webů nabízí xG data bezplatně – hledejte platformy zaměřené na fotbalovou analytiku s pokrytím top evropských lig. Většina z nich zobrazuje xG na úrovni zápasu i celé sezóny. Pro českou ligu je dostupnost horší, ale základní data o střelách a jejich kvalitě najdete i tam. Klíčové je používat jeden zdroj konzistentně, protože xG modely se mezi poskytovateli liší.

Kolik času zabere důkladná analýza jednoho zápasu?

Pokud máte zavedený postup a víte, kde hledat data, kvalitní analýza jednoho zápasu zabere 15-20 minut. Prvních pár měsíců to bude trvat déle, protože se teprve učíte pracovat se zdroji. Nepouštějte se do analýzy víc než 3-5 zápasů denně – kvalita klesá s únavou. Radši analyzujte méně zápasů důkladně než deset povrchně.

Jak odlišit relevantní statistiku od šumu?

Základní pravidlo: čím menší vzorek, tím větší šum. Forma za posledních 5 zápasů je převážně šum. xG za celou sezónu je převážně signál. Pokud statistika odporuje vašemu očekávání, ověřte ji na větším vzorku. A pokud dva datové zdroje ukazují protichůdné závěry, důvěřujte tomu s větším vzorkem a známější metodologií.