Digitálne sérum pravdy
Skúmať, čo si ľudia myslia, je zložité. Ak sa respondentom venujete dôkladne a dávate si na každom záležať, máte iba malú štatistickú vzorku – nikto nemôže osobne vyspovedať milióny ľudí. Ak sa zas spoľahnete na formuláre, problém začne byť hodnovernosť. Niekde by mohol spraviť výskum týkajúci sa kvality dát z: „Ahojte, prosím vyplňte mi tento dotazník do diplomovky, je to maximálne na 20 minút.“
Aby nestačilo, ľudia jednoducho nie sú úprimní. Vedia, čo od nich spoločnosť očakáva a tomuto obrazu prispôsobujú svoje odpovede. V jednom americkom prieskume sa pýtali mužov a žien, že koľko (heterosexuálneho) pohlavného styku majú za rok a ako často pri tom používajú kondóm. Podľa ich odpovedí spočítali, že muži použijú 1.6 miliardy kondómov ročne (dokopy, nie každý z nich). Z odpovedí žien však dostali iba číslo 1.1 miliardy! Asi si poviete, že muži si jednoducho vymysleli pol miliardy chránených pohlavných stykov ročne. Chyba. Vymysleli si ich celú miliardu – spoločnosť skúmajúca správanie zákazníkov totiž predaj kondómov odhadla na 600 miliónov. Preháňali ženy aj muži, muži akurát viac.
Ako sa dostať z ľudí úprimné odpovede? Setha Stephens-Davidowitza píše vo svojej knihe „Každý klame“, že odpoveďou sú veľké dáta (big data), čiže obrovské množstva dát, ktoré dobrovoľne odovzdávame veľkým internetovým službám – napríklad Googlu. Čo píšeme do vyhľadávača považujeme za anonymné (a do istej miery to anonymné aj je) a tak to podlieha predsudkom v oveľa menšej miere. Do Google vyhľadávania píšeme aj veci, ktoré by sme sa pred ostatnými hanbili priznať.
Jednou z najbežnejších otázok mužov o vlastnom tele sa týka veľkosti ich penisu. Z pohľadu mnohých mužov ide o kľúčovú vlastnosť, tak to diktuje „machovská kultúra“, ktorá zároveň nereálne nafukuje očakávania. Záleží na tom však aj ženám? Na jedno ženské vyhľadávanie tejto témy pripadá až stosedemdesiat mužských! Muži stigmatizovaní rečami zo šatne, môžete si vydýchnuť, ženám je to viac-menej fuk.
Ešte jeden zaujímavý príklad. Sú štáty, kde sa homosexualitu berie za bežnú vec. A sú krajiny ako Irán či mestá ako ruské Soči, ktorých predstavitelia tvrdia, že u nich homosexuáli jednoducho nežijú. V liberálnych oblastiach sa k homosexualite hlási viac ľudí, v konzervatívnych zas menej, špeciálne ak za ňu hrozí trest smrti. Podľa oficiálnych prieskumov sú zhruba 2-3% mužov gayovia. Čo však vravia veľké dáta?
Autor spomínanej knihy sa rozhodol pre jednoduchý test. Pozrel sa, koľko z vyhľadávaného porna je gay porno. Výsledok: okolo 5%. Medzi konzervatívnymi a liberálnymi krajinami je len veľmi malý rozdiel. To znamená, že v konzervatívnych krajinách nie je výrazne menej gayov, no výrazne mužov, ktorí taja svoju sexuálnu orientáciu.
Kniha otvára rôznorodé témy. Ako pomocou dát poraziť rasové predsudky? Ktorý kôň vyhrá ďalší závod? Aký je rozdiel vo výchove dievčat a chlapcov? Ktorý kandidát bude zvolený za prezidenta? Čo trápi tehotné ženy?
Nie je to však len kniha zaujímavých príkladov, aj keď tých je v nej požehnane. Kniha ponúkne dobrý prehľad toho, čo sa môžeme o našej spoločnosti dozvedieť na základe veľkých dáta a zároveň kde majú tieto dáta limit. Musím sa priznať, už som dlho neprečítal žiadnu non-ficition knihu tak rýchlo. Poučná aj pútavá, klobúk dole!
[Samuel]
Knihu si môžete kúpiť tu.