Statisztikai programcsomagok laborgyakorlat (2014 tavasz)

Időpontok, helyszín: hétfő 16-18 és 18-20, M8 terem.

Tudnivalók: A gyakorlaton az ingyenesen telepíthető R statisztika programcsomaggal ismerkedünk meg. A félév folyamán két darab kétórás dolgozatot iratok, melyek során a gyakorlaton elhangzott anyagot kérem számon. A dolgozatokon 40-40 pont szerezhető, és a gyakorlati jegy az alábbi pontszámok szerint alakul ki. A dolgozatok nem javíthatóak, igazolt hiányzás esetén az egyik - de csak az egyik! – pótolható a vizsgaidőszak első hetében. A gyakorlaton vett feladatok és az adatfájlok letölthetőek az adatkönyvtárból.

Ponthatárok:

68-80 jeles (5)
58-67jó (4)
48-57közepes (3)
38-47elégséges 2)
0-37elégtelen (1)

Telepítési útmutató: Az R csomagot mi az RStudio nevű interface használatával fogjuk majd futtatni. Először az R kernelt kell telepíteni, majd ezután az RStudiot. Az RSudion belül az R már kényelmesen bővíthető további csomagokkal, melyek különféle repozitóriumokból tölthetőek le.

Letöltési oldalak és dokumentáció:

Adatkönyvtár.

Elméleti összefoglaló.

Az R project oldala, innen lehet telepíteni a kernelt.

Az RStudio oldala.

Az R csomagok egyik repozitóriuma.

Bevezetés az R nyelvbe.

Részletes dokumentáció a statisztikai függvényekről.

Előzetes tematika:

Február 10.: Bevezetés az R nyelvbe: változótípusok, műveletek, scriptek, függvények, input és output.

Február 17.: Statisztikai minta, alapstatisztikák, adatok grafikus ábrázolása.

Február 24.: Paraméteres próbák: t-próba, kétmintás t-próba, F-próba. Konfidencia intervallumok.

Március 3.: Az egyszempontos és a többszempontos varianciaanalízis (ANOVA), a páros t-próba.

Március 10.: Valószínűségek tesztelése: t-próba, binomiális-próba, khinégyzet-próba.

Március 17.: Függőségvizsgálat, a Pearson- és a Spearman-korreláció. Mediántesztek: t-próba, binomiális-teszt, Wilcoxon-próba.

Március 24.: Dolgozat.

Március 31.: Eloszlás- és homogenitástesztek: khinégyzet-próba, Kolmogorov—Szmirnov-próbák, Mann—Whitney-próba. A Q-Q plot. Véletlen számok generálása és a véletlenszerűség tesztelése.

Április 7.: Lineáris és nemlineáris regresszió, többváltozós regresszió. Regresszióanalízis.

Április 14.: Faktoranalízis, főkomponens-analízis.

Április 21.: Diszkriminancia analízis, logisztikus regresszió.

Április 28.: Klaszteranalízis.

Május 5.: Cenzorált minta, Kaplan—Meyer-becslés, Cox-regresszió.

Május 12.: Dolgozat.

Vizsgaidőszak első hete: Pótdolgozat.

Ajánlott irodalom:

Peter Dalgaard: Introductory statistics with R, Springer, 2008.

Nagy-György Judit: Bevezetés a matematikai statisztikába, előadásjegyzet.

Viharos László: A sztochasztika alapjai, Polygon Jegyzettár sorozat, Szegedi Egyetemi Kiadó, Szeged, 2008.

Bolla Marianna, Krámli András: Statisztikai következtetések elmélete, Typotex Kiadó, Budapest, 2005.