Pred pár dňami som videl takýto nadpis: „Vlaky na Slovenskú meškajú v priemere 4 minúty.“ To možno rozčarovalo nejedného cestujúceho či študenta štatistiky. Aký priemer mysleli?
Keď máte tabuľku čísiel, priemer sa robí ľahko. Spočítate dokopy a predelíte počtom. Otázka však je, ako tabuľka vznikla?
Napríklad sa mohli železničiari pozrieť, aké je priemerné meškanie jedného vlaku, z toho spraviť tabuľku a z nej spraviť priemer. To je však problém. Čo ak jeden vlak mešká veľa a jazdí každý deň, druhý mešká málo, no jazdí len cez víkendy. Do tabuľky sa oba dostanú raz, v prvom však ľudia cestujú oveľa častejšie.
Iná možnosť, pozrieme sa na meškanie vlakov, ako ich hlásia tabule na stanici. Nie všetky vlaky však stoja na všetkých staniciach. Načas idúci osobný vlak sa objaví na oveľa viac tabuliach, než meškajúce IC-čko.
Čo tak demokraticky? Opýtame sa ľudí vystupujúcich z vlaku, koľko meškal ich vlak a ich odpoveď zaznačíme do tabuľky. Takýto postup zas dáva väčšiu váhu vyťaženým linkám. Aj keď práve toto asi dobre reflektuje pocity ľudí.
Ktorá z týchto možností je správna? Neviem. Príde mi to však ako pekný príklad toho, že ako veľmi vie hodnota „priemeru“ závisieť od toho, ako tento priemer vlastne vznikol. A aký rozdiel spraví, ak jeden myslí iný priemer, ako druhý.
Sú aj iné praktické príklady. Chcete zistiť, koľko vecí priemerne kupujú ľudia u vašej konkurencie. Pošlete brigádnika, nech chodí po predajni a náhodne pozerá ľuďom do košíka. Predstavte si, že polovica ľudí kupuje jednu vec a polovica kupuje vecí sto. Brigádnik vám však zahlási, že v obchode majú všetci plné košíky. Ako je to možné? Človek, ktorý kupuje len jednu vec, cez obchod preletí a tak je oveľa menšia šanca, že ho stihne váš brigádnik odchytiť.
Takže, keď sa niekedy dozviete o nejakej priemernej hodnote, tak sa nezabudnite opýtať, ako tento priemer vznikol – z akej vzorky a akým postupom. Inak vás môže výsledok rozčarovať.
[Samuel]PS: Netvrdím, že časový údaj spomínaný v úvode je nesprávny, neviem ako vznikol. Text berte skôr ako príležitosť na matematické okienko než kritiku železníc.
PS2: Priemer je v skutočnosti vážený, to znamená, že rôzne priemerované elementy majú rôzne váhy – napríklad prázdne vlaky majú v dotazníkovej forme nízku váhu. Priemer s rovnakou váhou pre všetky prvky je len špeciálny prípad.