Ne znam pišem li ovo na pravom mjestu, ali moram podijeliti s vama plod moje popodnevne radoznalosti.
Dakle, često koristim svakakve statističke testove za dokaz nekih tvrdnji. To me inspiriralo da promotrim neprirodan odnos Lokomotive i Dinama i na taj način.
E sad, ukratko o metodologiji i korištenim testovima.
U obzir sam uzeo rezultate međusobne utakmice Dinama, Hajduka, Lokomotive, Rijeke i Osijeka od sezone 09/10 do 18. kola tekuće sezone (2 utakmice u sezonama 09/10, 10/11 i 11/12, 3 utakmice u sezoni 12/13 i 2 utakmice do sada u ovoj sezoni). Namjerno nisam uzeo utakmice nakon 18. kola ove sezone jer bi tako imao različiti broj utakmica što bi mi predstavljalo mali problem. Nakon što svi odigraju ovogodišnju treću utakmicu dodat ću i to. Zašto utakmice ovih 5 klubova? Četiri su konstanta HNL-a, a peti je proizvod mutnih radnji jednog od njih. Metodološki nije možda potpuno ispravno, ali za ovu priliku će poslužiti. Ovdje se radi o brojevima, tako da moje osobno mišljenje nema nikakvog utjecaja.
Što se tiče testova koje sam koristio, radi se o ANOVA: Two-Factor Without Replication za početnu analizu, te za utvrđivanje korelacije Tukey's hsd test. Neću vas daviti zašto baš ta dva testa, ovo pišem samo ako nekoga zaista zanima ili se razumije pa želi provjeriti.
Da ukratko objasnim kako se donose zaključci iz dobivenih rezultata na laganom primjeru. Momčad A je igrala protiv momčadi B i C 5 utakmica. Protiv momčadi B je osvojila 10 bodova, protiv momčadi C 12 bodova. Tukey's test nam govori o tome možemo li, i s kojom sigurnošću, reći da je momčad A signifikantno više bodova osvojila protiv jedne od momčadi. Ajmo reći da je izračunata Tukey's hsd vrijednost za 95% sigurnost 1, a za 99% sigurnost 3. (To su pragovi koji se uobičajeno uzimaju za dokazivanje signifikantnosti) Kako je razlika osvojenih bodova protiv momčadi B i C 2, što je veće od 1 (prag za 95% signifikantnost u ovom slučaju) možemo donijeti zaključak kako je s 95% značanošću momčad B uspješnija protiv momčadi C. To ukazuje na korelaciju i postojanje nekakvog pravila. Da je razlika osvojenih bodova veća od 3 (u ovom slučaju) mogli bi govoriti da je zaključak 99% signifikantan. Signifikantan čitaj značajan, bitan.
tl;dr Objasnio sam kako se radi test.
Ok, dosta dosadne teorije. Što sam dobio s analizom i zašto sam to uopće radio kada je svima prosto kao pasulj da Lokomotiva nije osvojila niti jedan bod protiv Dinama?
Stvar je zapravo vrlo jednostavna. Podatak da je Lokomotiva osvojila ravno 0 bodova protiv Dinama nije statistički nimalo bitan dok nije stavljen u kontekst. Kakav kontekst pitate? Broj osvojenih bodova Lokomotive protiv Dinama ne predstavlja ništa dok se statistički ne usporedi s brojem bodova koje su protiv Dinama osvojili ostali klubovi. U našem slučaju Hajduk, Osijek i Rijeka. Zašto? Zato što se bez uzajamne analize može reći da je to produkt veće kvalitete jednog kluba od drugog. Ovakva analiza to
eliminira. Dakle, nije uopće pitanje koliko je Dinamo bolji od Lokomotive, Hajduka, Rijeke ili Osijeka, već koliko oni, međusobno gledano, pariraju Dinamu.
Zaključci su vrlo jasni. Analizirao sam apsolutno sve moguće kombinacije ovih klubova i svi dobiveni rezultati su daleko ispod praga značajnosti osim jednog koji ga probija i to debelo.
Naravno, to je taj da Lokomotiva osvaja
značajno manje bodova protiv Dinama od trojca Hajduk, Osijek, Rijeka. Reći ćete mi
no shit Sherlock. No, da vas preduhitrim sa time, ovo je, koliko je meni poznato, prvi ovakav znanstveno izveden zaključak. Pod znanstveni mislim matematički, potpuno oslobođen bilo kakve pristranosti i prostora za špekulaciju.
Dakle, ponavljam, statistika je dokazala da je Hajduk, Osijek i Rijeka međusobno igraju poprilično izjednačeno, bez ikakvih iskakanja iz normalnog.
Jedini koji to narušavaju su Dinamo i Lokomotiva.
Za optimistične, evo linka na matematiku.
http://www.sendspace.com/file/5wqbrvPuse i pozdravi!
[uredio Kupusar - 28. veljače 2014. u 00:03]