Sumární statistika
Sumární nebo souhrnné statistiky, příp. charakteristiky se používají v popisné statistice pro shrnutí souboru pozorování, aby bylo možné jednoduše sdělit co největší množství informací. Statistici obvykle popisují pozorování pomocí
- nějaké charakteristiky umístění nebo centralní tendence, jako je aritmetický průměr
- nějaké charakteristiky variability, jako je směrodatná odchylka
- nějaké charakteristiky tvaru rozdělení, jako je koeficient šikmosti nebo koeficient špičatosti
- pokud se pracuje s více než jednou proměnnou, pak nějakou charakteristikou statistické závislosti, jako je Pearsonův korelační koeficient
Často používanou sadou pořadových statistik používaných jako sumární statistiky jsou pětičíselná charakteristika souboru, někdy rozšířená na sedmičíselnou charakteristiku souboru a příslušné krabicové diagramy (boxplots).
Za sumární statistiku můžeme považovat také položky v tabulce analýzy rozptylu.[1]
Příklady sumárních statistik
Umístění
Běžnými charakteristikami umístění nebo centrální tendence jsou aritmetický průměr, medián, modus, a mezikvartilový průměr.[2][3]
Variabilita
Běžnými charakteristikami variability jsou směrodatná odchylka, rozptyl, variační rozpětí, mezikvartilové rozpětí, absolutní odchylka, střední absolutní rozdíl a vzdálenostní standardní odchylka. K charakteristikám, které hodnotí variabilitu ve srovnání s typickou velikostí datových hodnot, patří variační koeficient.
Giniho koeficient původně vyvinutý pro měření nerovnosti příjmů je ekvivalentní s jedním z L-momentů.
Pro jednoduché shrnutí datového souboru se používají určité pořadové statistiky jako aproximace vybraných percentilů rozdělení.
Tvar
Nejpoužívanějšími charakteristikami tvaru rozdělení jsou koeficient šikmosti a koeficient špičatosti; jejich alternativy bývají založeny na L-momentech. Jinou charakteristikou je vzdálenostní šikmost, jejíž nulová hodnota naznačuje centrální symetrii.
Závislost
Běžnou charakteristikou závislosti mezi dvojicemi náhodných proměnných je Pearsonův korelační koeficient, zatímco běžnou alternativní souhrnnou statistikou je Spearmanův koeficient pořadové korelace. Je-li vzdálenostní korelace nulová, jde o nezávislé veličiny.
Lidské vnímání sumárních statistik
Lidé efektivně využívají sumární statistiky pro rychlé porozumění podstatě sluchových a vizuálních informací.[4][5][6]
Odkazy
Reference
V tomto článku byl použit překlad textu z článku Summary statistics na anglické Wikipedii.
- ↑ UPTON, G.; COOK, I. Oxford Dictionary of Statistics. [s.l.]: OUP, 2008. Dostupné online. ISBN 978-0-19-954145-4.
- ↑ BULLEN, P. Handbook of Means and Their Inequalities. [s.l.]: Springer, 2003.
- ↑ GRABISCH, M.; MARICHAL, J.L.; MESIAR, R.; PAP, E. Aggregation Functions. [s.l.]: Oxford University Press, 2009.
- ↑ PIAZZA, Elise A.; SWEENY, Timothy D.; WESSEL, David; SILVER, Michael A.; WHITNEY, David, 2013. Humans Use Summary Statistics to Perceive Auditory Sequences. Psychological Science. Roč. 24, čís. 8, s. 1389–1397. DOI 10.1177/0956797612473759. PMID 23761928.
- ↑ ALEXANDER, R. G.; SCHMIDT, J.; ZELINSKY, G. Z. Are summary statistics enough? Evidence for the importance of shape in guiding visual search.. Visual Cognition. 2014, roč. 22, čís. 3–4, s. 595–609. DOI 10.1080/13506285.2014.890989. PMID 26180505.
- ↑ UTOCHKIN, Igor S., 2015. Ensemble summary statistics as a basis for rapid visual categorization. Journal of Vision. Roč. 15, čís. 4, s. 8. DOI 10.1167/15.4.8. PMID 26317396.
Související články
- Testovací statistiky
- Popisná statistika
- Výběrová charakteristika
- Dostatečná statistika
- Percentil
- Kvantil
- Decil
Externí odkazy
- Obrázky, zvuky či videa k tématu Charakteristika náhodné veličiny na Wikimedia Commons