Statisztikai programcsomagok laborgyakorlat (2014 tavasz)
Időpontok, helyszín: hétfő 16-18 és 18-20, M8 terem.
Tudnivalók: A gyakorlaton az ingyenesen telepíthető R statisztika programcsomaggal ismerkedünk meg. A félév folyamán két darab kétórás dolgozatot iratok, melyek során a gyakorlaton elhangzott anyagot kérem számon. A dolgozatokon 40-40 pont szerezhető, és a gyakorlati jegy az alábbi pontszámok szerint alakul ki. A dolgozatok nem javíthatóak, igazolt hiányzás esetén az egyik - de csak az egyik! – pótolható a vizsgaidőszak első hetében. A gyakorlaton vett feladatok és az adatfájlok letölthetőek az adatkönyvtárból.
Ponthatárok:
68-80 | jeles (5) |
58-67 | jó (4) |
48-57 | közepes (3) |
38-47 | elégséges 2) |
0-37 | elégtelen (1) |
Telepítési útmutató: Az R csomagot mi az RStudio nevű interface használatával fogjuk majd futtatni. Először az R kernelt kell telepíteni, majd ezután az RStudiot. Az RSudion belül az R már kényelmesen bővíthető további csomagokkal, melyek különféle repozitóriumokból tölthetőek le.
Letöltési oldalak és dokumentáció:
Az R project oldala, innen lehet telepíteni a kernelt.
Az RStudio oldala.
Az R csomagok egyik repozitóriuma.
Bevezetés az R nyelvbe.
Részletes dokumentáció a statisztikai függvényekről.
Előzetes tematika:
Február 10.: Bevezetés az R nyelvbe: változótípusok, műveletek, scriptek, függvények, input és output.
Február 17.: Statisztikai minta, alapstatisztikák, adatok grafikus ábrázolása.
Február 24.: Paraméteres próbák: t-próba, kétmintás t-próba, F-próba. Konfidencia intervallumok.
Március 3.: Az egyszempontos és a többszempontos varianciaanalízis (ANOVA), a páros t-próba.
Március 10.: Valószínűségek tesztelése: t-próba, binomiális-próba, khinégyzet-próba.
Március 17.: Függőségvizsgálat, a Pearson- és a Spearman-korreláció. Mediántesztek: t-próba, binomiális-teszt, Wilcoxon-próba.
Március 24.: Dolgozat.
Március 31.: Eloszlás- és homogenitástesztek: khinégyzet-próba, Kolmogorov—Szmirnov-próbák, Mann—Whitney-próba. A Q-Q plot. Véletlen számok generálása és a véletlenszerűség tesztelése.
Április 7.: Lineáris és nemlineáris regresszió, többváltozós regresszió. Regresszióanalízis.
Április 14.: Faktoranalízis, főkomponens-analízis.
Április 21.: Diszkriminancia analízis, logisztikus regresszió.
Április 28.: Klaszteranalízis.
Május 5.: Cenzorált minta, Kaplan—Meyer-becslés, Cox-regresszió.
Május 12.: Dolgozat.
Vizsgaidőszak első hete: Pótdolgozat.
Ajánlott irodalom:
Peter Dalgaard: Introductory statistics with R, Springer, 2008.
Nagy-György Judit: Bevezetés a matematikai statisztikába, előadásjegyzet.
Viharos László: A sztochasztika alapjai, Polygon Jegyzettár sorozat, Szegedi Egyetemi Kiadó, Szeged, 2008.
Bolla Marianna, Krámli András: Statisztikai következtetések elmélete, Typotex Kiadó, Budapest, 2005.