Pasirinkite laiko juostą: Pasirinkti

Kiek vertas vienas krepšinio taškas?


Tarkime lažybų bendrovė siūlo -3.5 liniją krepšinio varžyboms - jos akimis yra 50/50 šansai, kad:


(i) namai laimės 4 taškais ir daugiau,


(ii) namai nelaimės daugiau nei 3 taškais.


Lošėjo akimis, namų komanda stipresnė daugiau nei 3.5 taško, jam atrodo, kad namai laimės bent 6 taškais. Tuomet kyla klausimas, kiek vertas toks statymas? Man pačiam pasistojo šis klausimas, tad nusprendžiau pasidalinti savo ieškojimais.


Iškart noriu prevenciškai akcentuoti - forume yra ekspertų, kurie savo prognozėse nurodo, kiek bendrovių siūlomos linijos neteisingos. Jie savo rezultatais parodo, kiek vertos yra jų įžvalgos. Pateikti skaičiavimai negali būti naudojami kritikuoti/komentuoti jų prognozėms! 


Dėl viso ko, pirma norėčiau naujokams priminti, kaip skaičiuojami azijietiški pranašumai (asian handicap), toliau rašysiu AH. Vardan nuoseklumo AH geriau visuomet rašau namų komandos atžvilgiu, tad pasibaigus varžyboms:


Namų komandos taškai + AH gali būti >, < arba = svečių komandos taškams.


Kai turime > laimi namai, kai < svečiai, o = reiškia, kad statymas atšauktas (void)- pinigai grąžinami į sąskaitą. Statymai gali būti atšaukti tik tuo atveju, jei AH linija buvo sveikas skaičius, -2, 5, 7 ir t.t., pavyzdžiui, prieš varžybas prie -3 AH pastatėme už namus, o galutinis rezultatas buvo 87:84, tad statymas bus atšauktas (87 - 3 = 84). Lažybų bendrovės tokių situacijų nori išvengti, tad daug dažniau jos siūlo nesveikas -2.5, 5.5, 7.5 AH linijas, tokiu atveju lygiosios niekuomet negalės įvykti. Paprastumo dėlei toliau tekste jas vadinsiu lyginėm (3, 4, 5 ir t.t.) ir nelyginėm (3.5, 4.5, 5.5 ir t.t.), mat sveika ir nesveika AH kažkaip labai nekaip skamba. 


Detaliau apie AH linijas galima pasiskaityti https://en.wikipedia.org/wiki/Asian_handicap arba forume.


Dabar pažvelkime į du skirtingus būdus įvertinti, kiek vertas krepšinio taškas.


Istoriniai rezultatai


Aš visuomet pradedu problemą spręsti nuo istorinių rezultatų apžvalgos. Taip, 2016 metų varžybų rezultatai neturi jokios reikšmės 2020 įvykiams. Plius, sportas nėra statiškas, laikui bėgant vidutinis sumestų taškų skaičius ar įvarčių kiekis kinta nes keičiasi taisyklės, strategijos ir t.t. Istorinių rezultatų analizė leidžia gauti pirminį spėjimą, nuo kurio galima pradėti daryti detalesnius skaičiavimus.


Panagrinėkime europietiško krepšinio duombazę (2015-2019 metų sezonai), kurioje surinktos priešvaržybinės Pinnacle AH linijos (closing lines). Pavyzdžiui, atrinkau visus krepšinio įvykius, kurių AH prieš varžybas buvo -6.5 taško ir pateikiu histogramą galutinio taškų skirtumo: svečių taškai minus namų taškai. X ašyje -10 reiškia, kad namai laimėjo 10 taškų skirtumu, o  13 kad namai pralaimėjo 13 taškų (svečiai laimėjo 13 taškų). Visur rezultatus skaičiuosiu su pratęsimu.




Namai šią liniją kirto 48.7% (469 iš 963 įvykių)- visi įvykiai į kainę nuo juodos horizontalios linijos. Kaip rašiau seniau, lažybose nebūna tikslių tikimybių, tad net ir po beveik 1000 varžybų yra naivu tikėtis pamatyti tikslias 50/50 tikimybes. Yra labai pavojinga rašyti apsoliutines tikimybes, tad geriau analizuojant sporto įvykius ieškoti tendencijų!


Iš pirmo žvilgsnio gali pasirodyti, kad duomenys panašūs į gausinį skirstinį (gaussian distribution), todėl specialiai su raudona linija vizualizavau, kaip jis teoriškai turėtų atrodyti (data fitted with gauss function). Iš akies matosi, kad intervale [-8, -4], baigėsi daugiau įvykių nei planuota pagal teorinį gausinį modelį. Atkreipkite dėmesį, net 20.4% visų įvykių yra nutolę +/- 2 taškais nuo pagrindinės -6.5 AH linijos! Tad situacijos, kai per tašką ar du nuneša Jūsų statymą būna dažnesnės nei norėtųsi…


Komentaras: daug kam toks žymėjimas pasirodys keistas, kodėl kai namai laimi dideliu pranašumu rašau minusą? Kadangi AH žymimas namų komandos atžvilgiu, didesnė minusinė AH rodo didesnį namų komandos pranašumą prieš svečius. Tad matematiškai būtų nuoseklu laikytis tos pačios krypties - didelis minusinis galutinis taškų skirtumas rodo, kad namai buvo smarkiai stipresni už svečius. Bet čia tik mano pasirinkimas, jo tikrai nebūtina naudoti.


Dabar panagrinėkime alternatyvias AH linijas, kiek % varžybų laimėjo namai ir svečiai.




Pateiktame pavyzdyje, x ašyje -4 reiškia, kad alternatyvi AH buvo -10.5 (-6.5 - 4), o namai padengė ją 35.3% varžybų- laimėjo 11 taškų ir daugiau skirtumu. Iš pirmo žvilgsnio gali pasirodyti, kad turime tiesines priklausomybes. Kadangi namų ir svečių pusės tikimybės yra tiesiogiai proporcingos:


* Namų pusės duomenys yra interpoliuoti (interpolation) - parašiau kiek procentų vertas kiekvienas taško segmentas,


* Svečių pusės rezultatams pritaikiau tiesinę lygtį (fit data y=kx+c), tad vienas taškas yra vidutiniškai vertas 4.42%. 


Toliau aš atlikau metą analizę visoms AH alternatyvioms nelyginėms linijoms (-5.5, -6.5 ir t.t.), kurių buvo rasta bent 300 įvykių:


(i) paskaičiavau paprastą regresijos (linear regression) koeficientą - juoda punktyrinė linija žemiau,


(ii) paskaičiavau kiek vidutiniškai taškų segmentas yra vertas - % tarp segmentų.



Tie kas gaudosi matematikoje (namų pusei):


* tiesinė lygtis, y = k p + c, kur k = 3.48, p- taškų skirtumas nuo AH, c = 50.10 (konstanta),


Visiems kitiems išverčiu į žmonių kalbą- vienas taškas nuo AH yra vidutiniškai vertas 3.48% tikimybės naudojant (i) analizę. Turėdami dviem būdais apskaičiuotas tikimybes galima atlikti pirmus statymo įvertinimus. Situacija: 


* lažybų bendrovė siūlo AH liniją -3.5 su koeficientu 1.9 tiek namams tiek svečiams,


* lošėjas paskaičiavo, kad tikslesnė linija šioms varžyboms turėtų būti ties -5.5,


* apskaičiavus taškų skirtumą, AH minus prognozė (-3.5 - -5.5 = 2), jis ima namų minusinę,


* pagal (i) analizę tokiam statymui prognozuosime 56.96% tikimybę (50 + 2 * 3.48) ir jis turės 8.2% vertės (1.9 x 56.96 - 100),


* pagal (ii) analizę tokiam statymui prognozuosime 57.16% tikimybę (50 + 3.7 + 3.46) ir jis turės 8.6% vertės (1.9 x 57.16 - 100).


Noriu priminti, čia buvo tik pirminis mūsų spėjimas! Iš taškų išsibarstymo matyti, kad abu modeliai per daug aproksimuoja tikimybes. Tarp panašaus pajėgumo komandų, kur priešvaržybinė AH buvo tarkime -3.5, galime tikėtis atkalesnių varžybų, nei tarp AH -10.5. Tai turėtų atsispindėti ir alternatyvių AH poslinkiuose. Tad pabandykime patobulinti šiuos du modelius pridėdami papildomą dimenciją- priešvaržybinę AH.


Kaip ir pirmajame pavyzdyje -6.5 AH linijai, kiekvienai iš atrinktų AH linijų apskaičiavau (i) kiek vidutiniškai vertas taškas.



Juodi taškai rodo skaičiavimų rezultatus, o spalvotos linijos iliustruoja skirtingo segmento trajektoriją (legendoje parašiau kaip greitai ir į kurią pusę tas pokytis yra). Šie rezultatai patvirtina, kad kuo komandos lygesnės, AH arčiau nulio, tarp jų virs aršesnė kova- rečiau būna dideli nuokrypiai nuo pagrindinės linijos. Tad dabar grįžkime prie prieš tai nupasakotos situacijos:


* šiam įvykiui lošėjas paskaičiavo liniją AH=-5.5, tad pasiriks raudonos linijos segmentą,


* pagal raudono segmento koeficientus, vienas taškas yra vertas 3.95% (y = k x AH + c = -0.3 x -5.5 + 2.3 = 3.95),


* pagal patobulintą (i) analizę toks statymas turės 57.9% tikimybę (50 + 2 * 3.95) bei 10% vertės (1.9 x 57.9 - 100).


Pamačius 10% vertės statymą, nereikėtų pradėti trinti rankomis! Kaip tik tai turėtų būti ženklas vidiniam skeptikui dar kartą įvertinti statymo analizę, galbūt lošėjas per optimistiškai žiūri į namų komandos formą.


Dabar pabandykime patobulinti (ii) analizę. Paskaičiavau kiek % vertas kiekvienas taškų intervalas nuo pagrindinės AH linijos, visoms priešvaržybinėms AH.





Tad dabar atnaujinkime (ii) modelio spėjimą:


* lentelėje susirandame -5.5 AH (geltonai pažymėta) ir dviejų taškų intervalą nuo pagrindinės linijos (raudonai),


* tada pasirenkame sekciją iš kurios norime apskaičiuoti kiek vidutiniškai vertas vienas taškas- aš pasirinkau mėlyną, tad šio intervalo (3.8, 3.4, 3.3 ir 3.3) vidurkis yra 3.45%,


* pagal patobulintą (ii) analizę toks statymas turės 56.9% tikimybę (50 + 2 * 3.45) bei 8.1% vertės (1.9 x 56.9 - 100).


Noriu atkreipti dėmesį, kad tokie istorinių rezultatų analizavimai duoda mums tik pirmines tikimybes. Akivaizdu, kad yra daugiau faktų, kurie apsprendžia alternatyvių AH linijų poslinkius, pvz. atsakomosiose tarpusavio varžybose, kai svarbus bendras dviejų rungtynių taškų skaičius. 


Pabaigai, įsivaizduokite, Jums reikia atspėti naujagimio ūgį- “koks jo ūgis bus po 30 metų?”:


* pirminis spėjimas tikriausiai paiimti jo tėvų ūgių vidurkį,


* tuomet modelį galima tobulinti atsižvelgiant į naujagimio lyti. Jei tai mergaitė, tuomet mamos ūgis lems 70% vidurkio, o tėvo 30%. Jei berniukas, tuomet atvirkščiai,


* norime įvertinti variaciją, tad pasižiūrime į senelių ūgius.


* ir t.t.


Kažką panašaus ir aš atlikau su krepšinio taškų įvertinimu iš istorinių rezultatų. Pradėkite nuo paprastų spėjimų, o po to keliaukite iki objektyvių skaičių ir tikimybių!


Lažybų bendrovių modeliai


Yra geras posakis “neišradinėk rato”. Tad prieš sukant galvą, kaip apskaičiuoti tikimybes, galima tiesiog pabandyti atgaminti (reverse-engineering) lažybų bendrovių modelius. Tai, kad tu suprasi, kaip bendrovė sudelioja koeficientus, dar nereiškia, kad rasi vertės turinčius statymus. Tiesiog tu bent galėsi objektyviai palyginti savo sistemą prieš jų. 


Iš esmės tik Pinnacle turi vertą dėmesio modelį, kitų lažybų bendrovių modelius galima ant pirštų suskaičiuoti.  Betsafe, Topsport, bet365 bei dauguma kitų bendrovių (soft books) tiesiog stebi pagrindinę Pinnacle AH liniją ir naudoja lygtis paremtas konstantomis. Jos labai panašios, tad pateiksiu tik Topsport skaičiavimus (pasiėmiau atsitiktinę bendrovę ir atsitiktinį įvykį, Topas savo modeliu nėra geresnis ar prastesnis už kitas jo svorio kategorijos bendroves).


1) pirma nustatome, ar Topas siūlo lyginę arba nelyginę liniją:


* lyginė, jei yra linija, kur namams ir svečiams būtų duotas po 1.9 koeficientas,


* nelyginė, jei yra dvi linijos, kurios yra 1.85/1.95 ir 1.95/1.85 namams ir svečiams.


Pateikiu nelyginės linijos pavyzdį, tuo metu Topsport automatinė sistema Bayern - Efes varžyboms davė +4 liniją ir iš jos paskaičiavo alternatyvias linijas.



2) priklausomai, kaip toli alternatyvi linija nutolusi nuo pagrindinės, mes pridedame skirtingą konstantą: -0.1, 0, 0.1, 0.15, 0.2 arba 0.25 prie svečių pagrindinio 1.85 arba 1.9 koeficiento (priklausomai linija lyginė ar ne). Tą patį ir namų pusei daro, tik su šiek tiek skirtingom konstantom. Skirtingų verčių konstantos pavaizduotos skirtingų spalvų punktyrinėmis linijomis aukščiau pateiktame pavyzdyje. 


Kadangi AH topsporte yra skaičiuojamos be pratęsimo, priklausomybė nėra simetriška- per 1.5 taško nutolusi rausva punktyrinė linija turi didesnį koeficientą nei priešingoje pusėje esantis intervalas. Ši sistema duoda gražius koeficientus, tačiau, kai mes pradedame skaičiuoti tikimybes, vaizdas šiek tiek pakinta.


Iš Topo koeficientų paskaičiavau tikimybes trimis skirtingais būdais: margin proportional to odds, odd’s ratio ir logarithmic function, mat jos ilgalaikėje perspektyvoje tikslesnės nei tikimybės apskaičiuotos naudojant lygią maržą [1]. Apie jas reiks kada nors detaliau parašyti, tad kol kas tebūnie čia iš juodos dėžės ištraukti skaičiai.




Topo modelis (mėlyna linija) rodo kokios turėtų būti tikrosios tikimybės išskaičiuotos iš koeficientų, procentai baltuose rėmuose rodo, kiek % vertas pokytis tarp alternatyvių AH linijų. Topo EV=0% (raudona linija), rodo kokia minimalią tikimybę, kad statymas turėtų 0% vertės. Su koeficientu 1.85 reikia laimėti 54% įvykių, kad išeiti į nulį (1.85 x 54 - 100) ilguoju laikotarpiu. Tad raudona linija mums rodo zoną, kurią peržengus su savo prognoze, galime tikėtis vertės turinčio statymo. Galiausiai nubrėžiau EV=8% (geltona linija), taip pat apskaičiuota, kaip EV=0%.


Skirtumas y-ašyje tarp mėlynos ir kitų linijų rodo, kiek tiksliau už Topo modelį mes turime atspėti įvykio baigties tikimybę, o skirtumas x-ašyje parodo keliais taškais tikslesni turime būti. Jei norite uždirbti 8% statydami Bayern 5.5 namų pliusinę AH su 1.75 koeficientu, lošėjo prognozė varžyboms turi būti geresnė 2.5 taško namų atžvilgiu.


Šiaip labai detaliai nenoriu paprastų bendrovių (soft books) modelių nagrinėti. Pradedančiam lošėjui reikėtų atsiminti, kad norint turėti 5-6% ROI AH krepšinio strategiją, jis turi bent dviem taškais tiksliau spėlioti AH linijas už šias bendroves. Savo spėjimą, jis visuomet turi kalibruoti su pagrindine AH linija.


Dabar palyginkime, kaip sukurti modeliai iš istorinių rezultatų, lyginasi Pinnacle krepšinio AH modeliu. Pateiksiu du atsitiktinius įvykius, viena aštri linija (-6.5) or kita artima (2).




Mėlynais ir raudonais taškais aš pažymėjau tikimybes išskaičiuotas iš Pinnacle koeficientų (taip pat kaip Topui skaičiuota), geltona linija rodo, kokia įvykio tikimybė turėtų būti, jei naudosi (i) modifikuotą analizę. Procentai stačiakampiuose parodo, kiek Pinnacle akimis yra vertas pokytis, kas puse taško. Keletas pastebėjimų:


* Pinnacle linija nustato 0.1 taško tikslumu (ten kur susikerta pilkos punktyrinės linijos),


* modifikuota analizė visai neblogai sutampa su Pinnacle modeliu (geltona linija ir raudoni taškai),


* į kairę nuo pagrindinės AH turime nuosekliai mažėjančius procentus, tuo tarpu į dešinę nesimato aiškios tendencijos procentuose.




Pinnacle akimis, linija yra ties 2.1 taško. Čia specialiai palikau tik Pinnacle tikimybes ir segmentų pokyčius be papildomų modelių.


* Į akis krenta didelis asimetriškumas: į dešinę nuo AH vienas taškas vertas apie 3.3%, labai panašus į analizėmis iš istorinių duomenų apskaičiuotą. Tačiau į kairę, ties AH 0 nuolydis smarkiai sumažėja.


* ties 0 AH Pinnacle akimis Lyon turi dvigubai didesnius šansus atkaklioje kovoje 1 tašku laimėti nei Žalgiris ¯\_(ツ)_/¯ (1.95% ir 0.94% nuokrypiai) [2]. Tai parodo, kad nors Pinnacle ir naudoja istorinius rezultatus, visgi kiekvienas rungtynes (kalbu apie didesnes lygas), vis tiek vertina ir žmogiškąjį faktorių.


Rašinį pradėjau nuo klausimo, kiek vertas statymas už namų minusinę -3.5, jei lošėjas mano jog tikslesnė AH linija turėtų būti ties -5.5. Įvertinus istorinių rezultatų analizę bei lažybų bendrovių modelius:


1) prognozuojant 1 tašku tiksliau nei bendrovės lošėjas gali tikėtis išeiti ant 0.


2) kuo AH linija yra arčiau 0, tuo vienas taškas yra vertas mažiau, daugiau vertės galima rasti analizuojant varžybas, kuriose yra išreikštas favoritas.


3) minimali kartelė statymui turėtų būti 2 taškai, tad jei lošėjo akimis įvertinta AH inija nesiskiria nuo lažybų bendrovės linijos bent 2 taškais, geriau nestatyti.


[1] lygia marža tikimybės skaičiuojamos,  pvz. kofai yra 2.15 ir 1.77 už skirtingas baigtis:


  1. Apskaičiuoji įvykio maržą (vig), 1/2.15 -1/1.77 = 1.03


  2. Norimos baigtis koeficientą padaugini iš maržos ir paskaičiuoji atvirkštinę vertę, pvz. 1 / (2.15 x 1.03) = 0.45 arba pirma baigtis turi 45% tikimybę, o antra 55%.


[2] Žalgiris turės didesnius šansus už Lyoną tiek laimėti vienu tašku, tiek pralaimėti vienu tašku, 55% ir 58% atitinkamai. Aš kalbu kiek santykinai yra vertas vienas taškas šalia 0 namams ir svečiams.


Autorius: Tomas (Tigfiend)