A gépi tanulás tudja, mi ez, és milyen különbségek vannak a típusai között

A gépi tanulás vagy a gépi tanulás alapvetően abból áll, hogy különböző algoritmusok segítségével automatizálják az adatokban „elrejtett” mintákat vagy trendeket. Emiatt nagyon fontos nemcsak a legmegfelelőbb algoritmus kiválasztása (és annak későbbi paraméterezése az egyes problémákra), hanem az is, hogy nagy mennyiségű, megfelelő minőségű adattal rendelkezzen.

Az elmúlt években a gépi tanulás nagyon fontos lett az üzleti világban, mivel az adatelemzés intelligens használata kulcsfontosságú az üzleti siker szempontjából. A Gartner 2020-ra vonatkozó előrejelzései azt mutatják, hogy az intelligens döntéshozatalban, a robotikában, az autonóm járművekben és a hiperautomatizálásban rejlő előnyök mellett a biztonság területe is nagy erőkkel jelenik meg. Különösen a mesterséges intelligencia alkalmazásai az IoT-hez kapcsolódó rendszerek védelmére.

Ebben a bejegyzésben elmagyarázzuk, miből áll a gépi tanulás, milyen típusú tanulás létezik, hogyan működnek és mire használják őket.

Tényleg, mi a gépi tanulás?

Ez a mesterséges intelligencia egyik ága, amely a 80-as években kezdett elterjedni. Ez egy olyan mesterséges intelligencia-típus, amely már nem a szabályokon és a programozón múlik, hanem a számítógép képes létrehozni saját szabályait, és saját maga is tanul.

A gépi tanulás keresztül történik algoritmusok. Az algoritmus nem más, mint egy feladat végrehajtásához elrendezett lépések sora.

A cél gépi tanulás létrehozni a modell amely lehetővé teszi számunkra egy adott feladat megoldását. Akkor tudom vonat a modell nagy mennyiségű adat felhasználásával. A modell tanuljon ezekből az adatokból és képes megtenni jóslatok. A végrehajtani kívánt feladattól függően megfelelőbb lesz egy vagy másik algoritmussal dolgozni.

Az algoritmus kiválasztása nem könnyű. Ha információt keresünk az interneten, nagyon részletes cikkek valóságos lavináját találhatjuk, amelyek néha ahelyett, hogy segítenének, összezavarnak bennünket. Ezért megpróbálunk néhány alapvető iránymutatást adni a munka megkezdéséhez.

Két alapvető kérdést kell feltennünk magunknak. Az első:

Mit akarunk csinálni?

A helyzet az világosan határozza meg a célt. Problémánk megoldásához tehát feltesszük a kérdést magunknak, hogy milyen feladatot kell vállalnunk. Lehet például:

Osztályozási kérdések, például spam vagy levélszemét-észlelés.
Csoportosítási problémák, például könyv ajánlása a felhasználónak korábbi vásárlásai alapján (ajánlási rendszer) f
Regressziós problémák, például annak kiderítése, hogy egy adott ügyfél mennyit fog igénybe venni a szolgáltatással (érték meghatározása)

Ha figyelembe vesszük a ügyfélmegtartás, Látjuk, hogy különböző megközelítésekből közelíthetjük meg. Ügyfélszegmentálást akarunk végezni, igen, de melyik stratégia a legmegfelelőbb? Jobb osztályozási, klaszterezési vagy akár regressziós problémaként kezelni? A legfontosabb nyomot a második kérdés feltevésével fogjuk megadni.

Milyen információkkal rendelkezem a célom eléréséhez?

Ha azt kérdezem magamtól: "Ügyfeleim, természetes módon vannak-e csoportosítva?", Akkor nem határoztam meg célt (célt) a csoportosításhoz.

Ha azonban más módon teszem fel a kérdést: Meg tudjuk-e azonosítani azon ügyfelek csoportjait, amelyek nagy valószínűséggel kérik a szolgáltatás felmondását, amint a szerződésük lejár? cél tökéletesen meghatározva: leiratkozik-e az ügyfélről?, és a kapott válasznak megfelelően akarunk cselekedni.

Az első esetben a tanulás példájával állunk szemben felügyelet nélkül, míg a második származik felügyelt tanulás.

Az adattudományi folyamat kezdeti szakaszában nagyon fontos eldönteni, hogy a "támadási stratégia" felügyelet alatt áll-e, vagy nem, és ez utóbbi esetben pontosan meg kell határozni, hogy mi lesz a támadás. célváltozó. Ahogy döntünk, az egyik vagy másik algoritmuscsaláddal fogunk dolgozni.