Jak nie analizować danych statystycznych, cz. 2

jest to ciąg dalszy innego wpisu

Przykład 3:

Zrobiono badania statystyczne w jaki sposób robią zakupy mężczyźni i kobiety, i otrzymano następujące wyniki:

  • mężczyzna mając kupić sobie spodnie idzie do konkretnego sklepu i je kupuje; kosztuje to go 50 zł i zajmuje 12 minut
  • kobieta mając kupić sobie spodnie obchodzi wszystkie sklepy w galerii handlowej, spotyka przyjaciółkę, plotkuje z nią przez jakiś czas w kawiarni, ogląda wszystkie wystawy i kupuje również inne rzeczy; w sumie wydaje 650 zł co zajmuje jej 199 minut

Patrząc na ilość wydanych pieniędzy i czas trwania zakupów można by stwierdzić, że kobieta jest mniej ekonomiczna. Lecz dane te można też zinterpretować w inny sposób – wyliczyć koszt na minutę:

  • mężczyzna wydał ok. 4,17 zł/min
  • kobieta wydała ok. 3,27 zł/min!!!

Wniosek: Gdyby kobieta wydawała na minutę tyle samo pieniędzy co mężczyzna to wydałaby prawie 830 zł a nie 650 zł. W ten sposób zaoszczędziła pieniądze i może sobie jeszcze kupić spodnie oraz dalej iść na zakupu cały czas oszczędzając…

Przykład 4 (paradoks Simpsona):

Firmy A i B prowadzą takie same szkolenia. Dokonano analizy ilość osób kończących szkolenia z oceną pozytywną, z podziałem na płeć:

  • mężczyźni:
    • firma A: 210 osób zdało, 190 – nie zdało (zdawalność 52,5%)
    • firma B: 30 osób zdało, 70 – nie zdało (zdawalność 30,0%)
  • kobiety:
    • firma A: 590 osób zdało, 10 – nie zdało (zdawalność 98,3%)
    • firma B: 870 osób zdało, 30 – nie zdało (zdawalność 96,7%)

Zarówno dla kobiet jak i mężczyzn oddzielnie firma A kształci lepiej. Jednak dokonując analizy całościowej:

  • firma A: 800 osób zdało, 200 – nie zdało (zdawalność 80%)
  • firma B: 900 osób zdało, 100 – nie zdało (zdawalność 90%)

wynika, że firma B jest lepsza!

Przykład 5:

Prezes niewielskiej spółki przedstawił na walnym zebraniu zachwycające wyniki związane z poziomem płac w firmie. Szczycił się, że średnia płaca wynosi 3.100 zł. Nie powiedział jednak, że wartość ta została zawyżona przez jego pensję i pensje wicedyrektora. Dokładna lista płac wyglądała tak:

  • prezes: 20.000 zł/m-c
  • wicedyrektor: 5.000 zł/m-c
  • księgowa: 3.000 zł/m-c
  • szef produkcji: 2.000 zł/m-c
  • szef zaopatrzenia: 2.000 zł/m-c
  • sekretarka: 1.600 zł/m-c
  • sześciu pracowników: każdy po 600 zł/m-c

Podając tylko wartość średnią (3.100 zł) zataił prawdziwe informacje, że wartością modalną (najczęściej występującą) jest bardzo niska płaca poszczególnych pracowników (po 600 zł każdy).

0 thoughts on “Jak nie analizować danych statystycznych, cz. 2

  1. Pingback: Jak nie analizować danych statystycznych, cz. 3 | sadowski.edu.pl

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

*

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>