Adatok elemzése és vizualizáció Python Instructor Notes segítségével
Telepítse a műhelyhez szükséges csomagokat
A leckéhez szükséges programok telepítéséhez kövesse a Telepítési dokumentum utasításait. Ha problémákat talál, kérjük, hozzon létre egy probléma a címkével Magas prioritás.
A létesítmények ellenőrzése
A _includes/scripts könyvtárban található egy forgatókönyv nevű check_env.py. Ellenőrzi az Anaconda telepített verziójának működését.
Alapértelmezés szerint a Data Carpentry nem követeli meg az emberektől, hogy töltsék le a teljes lerakatot az összes szkript és csonk mellett. Ezért oktatóként el kell döntenie, hogyan szeretné átadni ezt a szkriptet a hallgatóknak, ha úgy dönt. Használatához a hallgatók navigálhatják termináljukat a _includes/szkriptekhez, és futtathatják a következőket:
Ha a hallgatók AssertionError-t kapnak, az tájékoztatja Önt arról, hogyan segíthet a telepítés kijavításában. Ellenkező esetben elmondja, hogy a rendszer készen áll a Data Carpentry használatára!
01-short-Introduction-to-Python
Kihívások a tincsekkel kapcsolatban
Mi történik, ha a_tuple [2] = 5 futtat ?
Mivel a tuple változhatatlan, nem támogatja az elem hozzárendelését. A listaelemek egyedileg módosíthatók.
Mit mond a type (a_tuple) az a_tuple-ről ?
Szótár kihívások
- Szótárak módosítása: 2. Jelölje ki újra a második értéket.
Feltétlenül tisztázza azt is, hogy a "második érték" elérése a kulcs nevéről szól. Adjon például rev [10] = "tíz" -t annak tisztázására, hogy nem a pozícióról van szó.
02-kezdve-adatokkal
Megjegyzés a hibákról
Pandas surveys_df ['weight']. A Describe () hibát adhat vissza futás közben.
Kihívások a DataFrame-ekkel kapcsolatban
Oszlopnevek. (Opcionális: display surveys_df.columns [4] = "plotid". Az index nem változtatható; az előző epizódhoz hasonlít. A név adaptálását az átnevezési függvény végzi: surveys_df.rename (oszlop =))
felmérések_df.head (). Továbbá, mit jelent a surveys_df.head (15) ?
Mutassa meg az első 5 sort. Mutassa meg az első 15 sort.
Mutassa meg az utolsó 15 sort.
felmérések_df.alakja. Vegye figyelembe az alakzat kimenetét - Milyen formátumú az attribútum kimenete, amely visszaadja a DataFrame alakját?
Kihívások a statisztikai adatok kiszámításával kapcsolatban
Hozzon létre egy listát a plot_id webhelyazonosítókról, amelyek szerepelnek a felmérések_felmérés adatai között. Hívjuk ezt a listát site_names néven. Hány hely van az adatokban? Hány faj van az adatokban?
plot_names = pd.unique (felmérések_df ["plot_id"]). A webhely-azonosítók száma: plot_names.size vagy len (plot_names). Fajok száma az adatokban: len (pd.unique (Survey_df ["faj"]))
Mi a különbség a len (plot_names) és a surveys_df ['plot_id'] között. Nunique () ?
Mindkettő ugyanazt a kimenetet eredményezi, amely az egyedi értékek megszerzésének alternatív módjaként szolgál. az apáca ötvözi a számlálást az egyedi értékek kinyerésével.
Klaszter kihívások
Hány megfigyelés nő F és hány férfi M ?
Mi történik, ha két oszlopot csoportosít a következő utasítás segítségével, majd felveszi az átlagértékeket?
Az átlagérték kiszámításra kerül a plot_id és a sex minden egyes kombinációjára. Ne feledje, hogy az átlagnak nincs értelme minden változónál, ezért oszloponként adhatja meg: ha például meg szeretné tudni az utolsó regisztrált évet, akkor a lábak hosszának mediánját és az egyes kombinációk súlyának átlagértékét cselekmény és nem:
- Kiszámítja az egyes plot_id súlysúlyának leíró statisztikáit .
Milyen más módon lehet létrehozni a fajok listáját és társítani azt az adatminták számlálásának számával?
Ahelyett, hogy a kapott csoportból lekérné, majd megszámolná az eredményül kapott oszlopokat, a groupby-val együtt is számolhat (az összes oszlopon), és az így kapott DataFrame-ből összeállíthatja a kijelölést: surveys_df.groupby ('species_id'). Count () ["record_id"]
Grafikai kihívások
- Készítsen grafikont a faj átlagos súlyáról telephelyenként.

- Hozzon létre egy grafikont az összes hím és a teljes nőstény teljes adatkészletéről.
03-index-szelet-részhalmaz
Tipp: Használja a .head () metódust ebben a leckében a képernyő tisztántartása érdekében. Arra ösztönözze a tanulókat, hogy teszteljék a .head () nélküli és anélküli parancsokat, hogy megerősítsék az eszköz hasznosságát, majd preferenciáiktól függően használják vagy sem. Például, ha egy hallgató aggodalmát fejezi ki a gépeléssel való lépést illetően, közölje vele, hogy elkerülheti a .head () -t, de arra fogja használni, hogy több korábbi kódsor látható maradjon.