A gépi tanulási modell betanítási folyamata magában foglalja a hatalmas mennyiségű adatnak való kitételt, hogy lehetővé tegye a minták megtanulását, valamint előrejelzések vagy döntések meghozatalát anélkül, hogy kifejezetten az egyes forgatókönyvekre lenne programozva. A betanítási szakaszban a gépi tanulási modell egy sor iteráción megy keresztül, ahol úgy állítja be belső paramétereit, hogy minimalizálja a hibákat és javítsa az adott feladaton belüli teljesítményét.
A képzés során a szupervízió a modell tanulási folyamatának irányításához szükséges emberi beavatkozás szintjét jelenti. A felügyelet szükségessége a használt gépi tanulási algoritmus típusától, a feladat összetettségétől és a képzéshez szolgáltatott adatok minőségétől függően változhat.
A felügyelt tanulásban, amely a gépi tanulás egy olyan fajtája, ahol a modellt címkézett adatokon tanítják, a felügyelet elengedhetetlen. A címkézett adatok azt jelentik, hogy minden bemeneti adatpont a megfelelő kimenettel van párosítva, lehetővé téve a modell számára, hogy megtanulja a bemenetek és a kimenetek közötti leképezést. A felügyelt betanítás során emberi felügyelet szükséges a betanítási adatok megfelelő címkéinek megadásához, a modell előrejelzéseinek kiértékeléséhez és a modell paramétereinek visszajelzés alapján történő beállításához.
Például egy felügyelt képfelismerési feladatnál, ha a cél egy modell kiképzése a macskák és kutyák képeinek osztályozására, az emberi felügyelőnek minden képet macskának vagy kutyának kell címkéznie. A modell ezután tanulna ezekből a megjelölt példákból, hogy új, még nem látott képekre jósoljon. A felügyelő értékeli a modell előrejelzéseit, és visszajelzést ad a modell pontosságának javítása érdekében.
Másrészt a felügyelet nélküli tanulási algoritmusok nem igényelnek címkézett adatokat a betanításhoz. Ezek az algoritmusok mintákat és struktúrákat tanulnak meg a bemeneti adatokból kifejezett útmutatás nélkül. A felügyelet nélküli tanulást gyakran használják olyan feladatokhoz, mint a klaszterezés, az anomáliák észlelése és a dimenziócsökkentés. A felügyelet nélküli tanulás során a gép önállóan tud tanulni, anélkül, hogy az edzés során emberi felügyeletre lenne szükség.
A félig felügyelt tanulás egy hibrid megközelítés, amely egyesíti a felügyelt és a nem felügyelt tanulás elemeit. Ebben a megközelítésben a modellt címkézett és címkézetlen adatok kombinációjára tanítják. A címkézett adatok bizonyos felügyeletet biztosítanak a tanulási folyamat irányításához, míg a címkézetlen adatok lehetővé teszik a modell számára, hogy további mintákat és kapcsolatokat fedezzen fel az adatokban.
A megerősítő tanulás a gépi tanulás egy másik paradigmája, ahol az ügynök megtanul szekvenciális döntéseket hozni a környezettel való interakció révén. A megerősítő tanulás során az ágens visszajelzést kap jutalmak vagy büntetések formájában a tettei alapján. Az ügynök kísérletek és hibák segítségével megtanulja maximalizálni halmozott jutalmát az idő múlásával. Míg a megerősített tanulás nem igényel a hagyományos értelemben vett kifejezett felügyeletet, emberi felügyeletre lehet szükség a jutalmazási struktúra kialakításához, a tanulási célok kitűzéséhez vagy a tanulási folyamat finomhangolásához.
A gépi tanulási képzés során a felügyelet szükségessége az alkalmazott tanulási paradigmától, a címkézett adatok elérhetőségétől és a feladat összetettségétől függ. A felügyelt tanulás emberi felügyeletet igényel a címkézett adatok biztosításához és a modell teljesítményének értékeléséhez. A felügyelet nélküli tanuláshoz nincs szükség felügyeletre, mivel a modell a címkézetlen adatoktól függetlenül tanul. A félig felügyelt tanulás egyesíti a felügyelt és a nem felügyelt tanulás elemeit, míg a megerősített tanulás a környezettel való interakción keresztüli tanulást foglalja magában.
További friss kérdések és válaszok ezzel kapcsolatban EITC/AI/GCML Google Cloud Machine Learning:
- Mi az a szövegfelolvasó (TTS), és hogyan működik az AI-val?
- Milyen korlátai vannak a nagy adatkészletekkel való munkavégzésnek a gépi tanulásban?
- A gépi tanulás segíthet némi párbeszédben?
- Mi az a TensorFlow játszótér?
- Mit jelent valójában egy nagyobb adatkészlet?
- Milyen példák vannak az algoritmus hiperparamétereire?
- Mi az az együttes tanulás?
- Mi a teendő, ha a kiválasztott gépi tanulási algoritmus nem megfelelő, és hogyan lehet biztosan a megfelelőt kiválasztani?
- Melyek a neurális hálózat alapú algoritmusok legfontosabb paraméterei?
- Mi az a TensorBoard?
További kérdések és válaszok az EITC/AI/GCML Google Cloud Machine Learningben