Adatok elemzése és vizualizáció Python Instructor Notes segítségével

Telepítse a műhelyhez szükséges csomagokat

A leckéhez szükséges programok telepítéséhez kövesse a Telepítési dokumentum utasításait. Ha problémákat talál, kérjük, hozzon létre egy probléma a címkével Magas prioritás.

A létesítmények ellenőrzése

A _includes/scripts könyvtárban található egy forgatókönyv nevű check_env.py. Ellenőrzi az Anaconda telepített verziójának működését.

Alapértelmezés szerint a Data Carpentry nem követeli meg az emberektől, hogy töltsék le a teljes lerakatot az összes szkript és csonk mellett. Ezért oktatóként el kell döntenie, hogyan szeretné átadni ezt a szkriptet a hallgatóknak, ha úgy dönt. Használatához a hallgatók navigálhatják termináljukat a _includes/szkriptekhez, és futtathatják a következőket:

Ha a hallgatók AssertionError-t kapnak, az tájékoztatja Önt arról, hogyan segíthet a telepítés kijavításában. Ellenkező esetben elmondja, hogy a rendszer készen áll a Data Carpentry használatára!

01-short-Introduction-to-Python

Kihívások a tincsekkel kapcsolatban

Mi történik, ha a_tuple [2] = 5 futtat ?

Mivel a tuple változhatatlan, nem támogatja az elem hozzárendelését. A listaelemek egyedileg módosíthatók.

Mit mond a type (a_tuple) az a_tuple-ről ?

Szótár kihívások

  • Szótárak módosítása: 2. Jelölje ki újra a második értéket.

Feltétlenül tisztázza azt is, hogy a "második érték" elérése a kulcs nevéről szól. Adjon például rev [10] = "tíz" -t annak tisztázására, hogy nem a pozícióról van szó.

02-kezdve-adatokkal

Megjegyzés a hibákról

Pandas surveys_df ['weight']. A Describe () hibát adhat vissza futás közben.

Kihívások a DataFrame-ekkel kapcsolatban

Oszlopnevek. (Opcionális: display surveys_df.columns [4] = "plotid". Az index nem változtatható; az előző epizódhoz hasonlít. A név adaptálását az átnevezési függvény végzi: surveys_df.rename (oszlop =))

felmérések_df.head (). Továbbá, mit jelent a surveys_df.head (15) ?

Mutassa meg az első 5 sort. Mutassa meg az első 15 sort.

Mutassa meg az utolsó 15 sort.

felmérések_df.alakja. Vegye figyelembe az alakzat kimenetét - Milyen formátumú az attribútum kimenete, amely visszaadja a DataFrame alakját?

Kihívások a statisztikai adatok kiszámításával kapcsolatban

Hozzon létre egy listát a plot_id webhelyazonosítókról, amelyek szerepelnek a felmérések_felmérés adatai között. Hívjuk ezt a listát site_names néven. Hány hely van az adatokban? Hány faj van az adatokban?

plot_names = pd.unique (felmérések_df ["plot_id"]). A webhely-azonosítók száma: plot_names.size vagy len (plot_names). Fajok száma az adatokban: len (pd.unique (Survey_df ["faj"]))

Mi a különbség a len (plot_names) és a surveys_df ['plot_id'] között. Nunique () ?

Mindkettő ugyanazt a kimenetet eredményezi, amely az egyedi értékek megszerzésének alternatív módjaként szolgál. az apáca ötvözi a számlálást az egyedi értékek kinyerésével.

Klaszter kihívások

Hány megfigyelés nő F és hány férfi M ?

Mi történik, ha két oszlopot csoportosít a következő utasítás segítségével, majd felveszi az átlagértékeket?

Az átlagérték kiszámításra kerül a plot_id és a sex minden egyes kombinációjára. Ne feledje, hogy az átlagnak nincs értelme minden változónál, ezért oszloponként adhatja meg: ha például meg szeretné tudni az utolsó regisztrált évet, akkor a lábak hosszának mediánját és az egyes kombinációk súlyának átlagértékét cselekmény és nem:

  • Kiszámítja az egyes plot_id súlysúlyának leíró statisztikáit .

Milyen más módon lehet létrehozni a fajok listáját és társítani azt az adatminták számlálásának számával?

Ahelyett, hogy a kapott csoportból lekérné, majd megszámolná az eredményül kapott oszlopokat, a groupby-val együtt is számolhat (az összes oszlopon), és az így kapott DataFrame-ből összeállíthatja a kijelölést: surveys_df.groupby ('species_id'). Count () ["record_id"]

Grafikai kihívások

  • Készítsen grafikont a faj átlagos súlyáról telephelyenként.

adatok

  • Hozzon létre egy grafikont az összes hím és a teljes nőstény teljes adatkészletéről.

03-index-szelet-részhalmaz

Tipp: Használja a .head () metódust ebben a leckében a képernyő tisztántartása érdekében. Arra ösztönözze a tanulókat, hogy teszteljék a .head () nélküli és anélküli parancsokat, hogy megerősítsék az eszköz hasznosságát, majd preferenciáiktól függően használják vagy sem. Például, ha egy hallgató aggodalmát fejezi ki a gépeléssel való lépést illetően, közölje vele, hogy elkerülheti a .head () -t, de arra fogja használni, hogy több korábbi kódsor látható maradjon.