A felügyelt, felügyelet nélküli és megerősített tanulás három különböző megközelítés a gépi tanulás területén. Mindegyik megközelítés különböző technikákat és algoritmusokat használ a különböző típusú problémák megoldására és meghatározott célok elérésére. Vizsgáljuk meg e megközelítések közötti különbségeket, és adjunk átfogó magyarázatot jellemzőikről és alkalmazásukról.
A felügyelt tanulás a gépi tanulás egyik fajtája, ahol az algoritmus a címkézett adatokból tanul. A címkézett adatok a megfelelő kimeneti vagy célértékkel párosított bemeneti példákból állnak. A felügyelt tanulás célja egy olyan modell betanítása, amely pontosan megjósolja az új, nem látott bemenetek kimenetét. A tanuló algoritmus a címkézett adatokat használja a bemeneti jellemzők és a kimeneti címkék közötti minták és kapcsolatok megállapítására. Ezután általánosítja ezt a tudást, hogy előrejelzéseket készítsen új, címkézetlen adatokra. A felügyelt tanulást általában olyan feladatoknál használják, mint az osztályozás és a regresszió.
Például egy osztályozási probléma esetén az algoritmus egy olyan adathalmazra van betanítva, ahol minden adatpont egy adott osztállyal van felcímkézve. Az algoritmus megtanulja besorolni az új, nem látott adatpontokat valamelyik előre meghatározott osztályba a címkézett példákból tanult minták alapján. Egy regressziós feladatban az algoritmus megtanulja megjósolni a folytonos számértéket a bemeneti jellemzők alapján.
A felügyelet nélküli tanulás viszont címkézetlen adatokkal foglalkozik. A felügyelet nélküli tanulás célja rejtett minták, struktúrák vagy kapcsolatok felfedezése az adatokon belül a kimeneti címkék előzetes ismerete nélkül. A felügyelt tanulással ellentétben a nem felügyelt tanulási algoritmusoknak nincs kifejezett célértékük a tanulási folyamat irányítására. Ehelyett arra összpontosítanak, hogy értelmes reprezentációkat vagy klasztereket találjanak az adatokban. A felügyelet nélküli tanulást általában olyan feladatoknál használják, mint a klaszterezés, a dimenziócsökkentés és az anomáliák észlelése.
A klaszterezés a felügyelet nélküli tanulás népszerű alkalmazása, ahol az algoritmus a hasonló adatpontokat belső tulajdonságaik alapján csoportosítja. Például az ügyfelek szegmentálása során egy felügyelt tanulási algoritmus használható a vásárlók különálló csoportjainak azonosítására vásárlási viselkedésük vagy demográfiai információik alapján.
A megerősítő tanulás egy másik paradigma, ahol az ügynök megtanul kölcsönhatásba lépni a környezettel, hogy maximalizálja a kumulatív jutalomjelet. A megerősítő tanulás során az algoritmus próba-szerencse folyamaton keresztül tanul azáltal, hogy lépéseket tesz, megfigyeli a környezet állapotát, és visszajelzést kap jutalom vagy büntetés formájában. A cél az, hogy megtaláljuk azt az optimális politikát vagy intézkedéscsomagot, amely maximalizálja a hosszú távú jutalmat. A megerősítő tanulást általában olyan feladatokban használják, mint a játék, a robotika és az autonóm rendszerek.
Például a sakkjátékban egy megerősítést tanuló ügynök megtanulhat játszani úgy, hogy megvizsgálja a különböző mozdulatokat, jutalmat vagy büntetést kap az egyes lépések eredménye alapján, és úgy módosítja stratégiáját, hogy maximalizálja a nyerési esélyeket.
A felügyelt tanulás címkézett adatokat használ az előrejelzési feladatok modelljének betanításához, a felügyelet nélküli tanulás mintákat és struktúrákat fedez fel a címkézetlen adatokban, a megerősített tanulás pedig a környezettel való interakción keresztül tanul a jutalomjel maximalizálása érdekében. Mindegyik megközelítésnek megvannak a maga erősségei és gyengeségei, és különböző típusú problémákra és alkalmazásokra alkalmas.
További friss kérdések és válaszok ezzel kapcsolatban EITC/AI/GCML Google Cloud Machine Learning:
- Mi az a szövegfelolvasó (TTS), és hogyan működik az AI-val?
- Milyen korlátai vannak a nagy adatkészletekkel való munkavégzésnek a gépi tanulásban?
- A gépi tanulás segíthet némi párbeszédben?
- Mi az a TensorFlow játszótér?
- Mit jelent valójában egy nagyobb adatkészlet?
- Milyen példák vannak az algoritmus hiperparamétereire?
- Mi az az együttes tanulás?
- Mi a teendő, ha a kiválasztott gépi tanulási algoritmus nem megfelelő, és hogyan lehet biztosan a megfelelőt kiválasztani?
- Egy gépi tanulási modellnek szüksége van felügyeletre a képzés során?
- Melyek a neurális hálózat alapú algoritmusok legfontosabb paraméterei?
További kérdések és válaszok az EITC/AI/GCML Google Cloud Machine Learningben