Adatkeretek feltárása; R a reprodukálható tudományos elemzéshez
Ütemterv
KérdésekHogyan tudom kezelni az adatkeretet?

Tudjon hozzáadni és eltávolítani sorokat és oszlopokat.
Legyen képes eltávolítani az NA értékű sorokat .
Tudjon két adatkeretet csatolni.
Tudja megfogalmazni, hogy mi a tényező, és hogyan lehet átalakítani a tényező és a karakter között .
Legyen képes megérteni az adatkeret alapvető tulajdonságait, beleértve az oszlopok méretét, osztályát vagy típusát, a neveket és az első sorokat.
Mostanra már látta az alapvető R adattípusokat és struktúrákat, és minden, amit tesz, ezeknek az eszközöknek a manipulálása lesz. Most megtanulunk egy-két dolgot az adatkeret osztállyal (az adatstruktúrával, amelyet legtöbbször használni fogsz, és amely a műsor sztárja lesz) való együttműködésről. Adatkeret az a táblázat, amelyet akkor hozunk létre, amikor információkat töltünk be egy csv fájlból.
Kulcsszavak
Parancs: Fordítás
nrow: sorok száma
ncol: oszlopok száma
rbind: kombinálja a sorokat
cbind: oszlopok egyesítése
Oszlopok és sorok hozzáadása egy adatkerethez
Megtudtuk, hogy egy adatkeret oszlopai vektorok. Ezért tudjuk, hogy adataink összhangban vannak az oszlopban szereplő adatok típusával. Ha új oszlopot akarunk hozzáadni, akkor új vektor létrehozásával kezdhetjük:
Ezután oszlopként hozzáadhatjuk a következőn keresztül:
Ne feledje, hogy nem fog sikerülni, ha megpróbálunk egy vektort hozzáadni más bemenetekkel, mint az adatkeret sorainak száma.
Mert nem dolgoztam? Természetesen R egy elemet szeretne látni az új oszlopunkban a táblázat minden sorához:
Ahhoz, hogy működjön, meg kell adnunk nrow (macskák) = hosszúságot (életkor). Új adatkeretünkkel felül fogjuk írni a macskák tartalmát.
Mi lenne a sorok hozzáadásával, ebben az esetben utoljára láttuk, hogy az adatkeret sorai listákból állnak:
Mit jelent az R által megadott hiba? Az „érvénytelen faktorszint” mond valamit a tényezőkről ... de mi a tényező? A faktor egy adattípus R-ben. A faktor olyan kategória (például szín), amellyel R bizonyos műveleteket végezhet. Például:
A tényezők sorrendje is átrendeződhet.
Tényezők
A faktorosztály objektumai egy másik típusú adatok, amelyeket körültekintően kell használnunk. Amikor R létrehoz egy tényezőt, akkor csak azokat az értékeket engedélyezi, amelyek eredetileg ott voltak, amikor az adatokat betöltöttük. Például esetünkben „fekete”, „fahéj” és „csíkos”. Minden új kategóriát, amely nem felel meg ezeknek a kategóriáknak, elutasítják (és NA-kká válnak).
A figyelmeztetés (figyelmeztetés) arra utasít minket, hogy színtényezőnkhez adjunk hozzá „teknőshéjat”. De a többi értéket, a 3.3-at (típusú numerikus), az IGAZ-ot (logikai típusú) és a 9-et (a numerikus típus) sikeresen hozzáadták a súlyhoz, például a_húr_húr és az életkor, mivel ezek az értékek nem típusfaktorok. Ahhoz, hogy egy új „teknősbéka” kategóriát hozzáadjunk a színoszlop macskák adatkeretéhez, kifejezetten hozzá kell adnunk a „teknőshéjat” új szintként (szintként) a faktorba:
Alternatív megoldásként megváltoztathatjuk az oszlopot típusú karakterre. Ebben az esetben elveszítjük a kategóriákat, de ezentúl bármely szót felvehetünk az oszlopba, anélkül, hogy problémát jelentene a faktorszint.
1. kihívás
Képzeljük el, hogy a kutyákhoz hasonlóan 1 emberi év megegyezik a macskák 7 évével (a Purina cég kifinomultabb algoritmust használ).
- Hozzon létre egy human.age nevű vektort úgy, hogy megszorozza a macskák $ korát 7-vel.
- Az emberi életkor átalakítása tényezővé.
- Konvertálja az emberi életkorot numerikus vektorgá az as.numeric () függvény segítségével. Most ossza el a 7-et, hogy visszatérjen az eredeti korokhoz. Magyarázza el, mi történt.