3. Rész: A motorháztető alatt – Hogyan tanul a gép?

június 2, 2026|Péter Teszáry|0 megjegyzések

Képzeljük el a gépi tanulást úgy, mint egy folyamatot, ahol a szoftver a tapasztalatok (adatok) révén folyamatosan javítja döntései hatékonyságát.

1. Bevezetés: A mintázatfelismerés művészete

Üdvözöllek ötrészes szakmai cikksorozatunk harmadik fejezetében! Az eddigiekben az MI történeti ívét és alapfogalmait vizsgáltuk, most azonban elérkeztünk a technológia valódi magjához. Fontos tisztázni: a mesterséges intelligencia elnevezés tudományos szempontból gyakran félrevezető. Ezek a rendszerek nem „gondolkodnak” az emberi kogníció értelmében, hanem komplex mintázatfelismerést és valószínűségi alapú kiegészítést végeznek.

Vegyük az „alma” példáját: ha egy algoritmusnak be kell fejeznie a mondatot, a betanított adathalmaz gyakorisági eloszlására támaszkodik. Ha az adatokban az „alma piros” 7-szer, az „alma zöld” 2-szer, az „alma sárga” pedig 1-szer szerepelt, a rendszer 70%-os valószínűséggel a piros szót fogja választani. Ez a „statisztikai jóslás” képezi a mai intelligens rendszerek működésének alapját.

A bejegyzés főbb pontjai:

A tanulás fogalma és a három alapvető tanulási paradigma.
A felügyelt tanulás matematikai céljai: osztályozás és regresszió.
Döntési fák és az „anytime” algoritmusok logikája.
A túltanulás (overfitting) jelensége és Ockham borotvája.
A Perceptrontól a konvolúciós neurális hálózatokig (CNN).

2. Mi a gépi tanulás (Machine Learning) lényege?

A szakirodalmi definíció szerint a tanulás egy olyan folyamat, amely során a világról tett megfigyelések (adatok) alapján javítjuk a jövőbeli döntéseink és cselekvésünk hatékonyságát. Ez a gépi tanulás esetében azt jelenti, hogy az algoritmus nem előre rögzített szabályokat hajt végre, hanem az adatokból von le következtetéseket.

Alan Turing már 1950-ben felvázolta a „gyermeki elme” metaforáját: ahelyett, hogy egy felnőtt emberi agy teljes bonyolultságát próbálnánk leprogramozni, hozzunk létre egy egyszerűbb, tanulásra képes rendszert, amelyet tanítással (adatokkal) emelünk magasabb intelligenciaszintre. A modern ML-rendszerek pontosan ezt teszik: a példákból tanulják meg a szabályszerűségeket.

3. A gépi tanulás három fő paradigmája

A tanulási folyamat módszertana alapján három fő típust különböztetünk meg. Érdemes megjegyezni, hogy a szakirodalom a felügyelet nélküli tanulást gyakran egyfajta szabályrendszer mentén történő gyakorlásként definiálja.

Felügyelt tanulás (Supervised Learning): Előre megadott bemeneti-kimeneti adatpárok (címkézett adatok) alapján tanítjuk a rendszert.
Felügyelet nélküli tanulás (Unsupervised Learning): A rendszer csak bemeneti adatokat kap. Egy belső szabályrendszer alapján, a bemeneteken gyakorolva fedezi fel a rejtett struktúrákat (pl. klaszterezés).
Megerősítéses tanulás (Reinforcement Learning): A rendszer interakcióba lép a környezetével, és jutalmazás vagy büntetés révén optimalizálja stratégiáját.

Szempont	Felügyelt tanulás	Felügyelet nélküli tanulás
Cél	Új adatok kimenetének megjósolása	Adatok csoportosítása, minták keresése
Adatigény	Címkézett tanulóhalmaz	Címkézetlen adatok
Példa	Betűfelismerés, hitelbírálat	Ügyfélszegmentáció, klaszterezés

4. Osztályozás és Regresszió: A felügyelt tanulás két arca

A felügyelt tanulási feladatokat a kimeneti érték típusa szerint két nagy csoportra osztjuk:

Típus	Leírás	Példa
Osztályozás (Classification)	A kimenet egy véges halmaz eleme (diszkrét érték).	Kézírás-felismerés (melyik betű?), hitelbírálat (igen/nem).
Regresszió (Regression)	A kimenet egy folytonos skálán mozgó valós szám.	Tárgy távolságának becslése, ingatlan várható ára.

5. Döntési fák (Decision Trees) – Az algoritmusok logikája

A döntési fa a gépi tanulás egyik legátláthatóbb eszköze, amely bonyolult összefüggéseket elemi tesztek sorozatára bont le.

Gyökér: Az első, legfontosabb döntési pont (pl. „Az éves jövedelem < 4 millió Ft?”).
Belső pontok: További tesztek (pl. „Van ingatlana?”, „30 év alatti?”, „Gyermekek száma ≥ 3?”).
Levelek: A végső döntés vagy címke (pl. „Hitel jóváhagyva” vagy „Megtagadva”).

A döntési fák képesek kezelni a zajos adatokat, mivel automatikusan kiszűrik a döntés szempontjából irreleváns változókat. Különleges formájuk az anytime decision tree: ebben a modellben a belső csomópontokhoz is rendelhetünk döntést. Ez lehetővé teszi, hogy ha kevés idő áll rendelkezésre, a rendszer azonnal adjon egy előzetes (nem feltétlenül optimális) választ, ha viszont van idő, a fa mélyebb szintjeit is bejárva pontosítsa azt.

6. A modellalkotás csapdája: Túltanulás (Overfitting) és Ockham borotvája

A gépi tanulás során egy olyan hipotézist (h) keresünk, amely jól általánosít az új adatokon. Ha a modellünk túl komplex – például egy 1. ábra (b) típusú, magasabb fokú polinomot illesztünk néhány pontra –, fellép a túltanulás (overfitting). Ilyenkor a modell a tanulóadatok zaját és egyedi hibáit is „bemagolja”, de az ismeretlen tesztadatokon elbukik.

Szakértői megjegyzés: A modellválasztás alapelve Ockham borotvája: ha két hipotézis ugyanúgy illeszkedik az adatokra, mindig az egyszerűbbet válasszuk. Egy egyenes (lineáris modell) általában sokkal jobban általánosít, mint egy minden ponton átmenő, de értelmetlenül hullámzó görbe (konzisztens hipotézis). A cél a kompromisszum a tanító adatokon mutatott pontosság és a modell egyszerűsége között.

7. A Perceptron és a lineáris szeparálhatóság

1943-ban McCullogh és Pitts alkotta meg a Perceptront, az MI első tudományos modelljét. Ez egy matematikai egység, amely a bemeneti értékeket (x1, x2…) súlyokkal (w1, w2…) látja el, és hozzáad egy konstans eltolást (bias, b).

A Perceptron a következő függvényt számítja ki: f(x) = w1*x1 + w2*x2 + ... + wn*xn + b

Ha az eredmény > 0, az adatot az egyik osztályba sorolja, egyébként a másikba. A tanulási fázis a w súlyok és a b érték finomhangolását jelenti. A Perceptron korlátja azonban a lineáris szeparálhatóság: csak olyan csoportokat tud elkülöníteni, amelyek egy egyenessel vagy síkkal elválaszthatók. Emiatt egyetlen Perceptron képtelen megtanulni az XOR (kizáró vagy) függvényt, mivel annak pontjai nem választhatók el egyetlen egyenessel.

8. Mesterséges Neurális Hálózatok (ANN)

A neurális hálózatok az agyi idegsejtek hálózatát modellezik, és áttörik a Perceptron korlátait. Több rétegből állnak:

Bemeneti réteg: Fogadja a nyers adatokat.
Rejtett rétegek: Itt történik a nemlineáris összefüggések kinyerése. Ezek teszik lehetővé az XOR-probléma és más komplex logikai függvények megoldását.
Kimeneti réteg: Szolgáltatja a végső előrejelzést.

A tanulás itt a hálózat összes kapcsolatának (súlyának) folyamatos módosítása, amíg a kimeneti hiba minimálisra nem csökken.

9. Mélytanulás (Deep Learning) és a Konvolúciós hálózatok (CNN)

A Deep Learning (mélytanulás) a többrétegű neurális hálózatok evolúciója, amely a 2000-es évek közepétől, a számítási kapacitás robbanásával vált meghatározóvá. Mérföldköve a 2016-os AlphaGo győzelme volt, amely demonstrálta a technológia rendkívüli erejét.

A képi látás területén a Konvolúciós Neurális Hálózatok (CNN) hoztak áttörést. Ezekben speciális konvolúciós szűrők (úgynevezett filterek) találhatók, amelyek digitális nagyítókként pásztázzák végig a pixeleket. A szűrők meghatározott mintázatokat – éleket, görbületeket, formákat – keresnek, így a gép nemcsak pontok halmazát látja, hanem képes felismerni a tárgyakat is. Ez a technológia terjeszti ki a Turing-tesztben elvárt gépi látás képességeit a modern diagnosztikától az önvezető autókig.

10. Gyakorlati megvalósítás: Eszközök és könyvtárak

A modern MI-fejlesztés standard környezete a Python nyelv és annak ökoszisztémája (BME tematikus források alapján):

Google Colab: Interaktív, felhőalapú futtatókörnyezet.
NumPy és Pandas: A matematikai műveletek és az adattáblák kezelésének alapkövei.
Scikit-learn (sklearn): A klasszikus ML algoritmusok (döntési fák, regresszió) könyvtára.
TensorFlow és Keras: Komplex Deep Learning architektúrák építésére szolgáló keretrendszerek.
Matplotlib és Plotly: Az adatok és a modellek eredményeinek vizualizációjához.

11. Összegzés és kitekintés

Láthattuk, hogy a gépi tanulás nem fekete mágia, hanem precíz matematikai és logikai modellek sorozata, amelyek az adatokból nyerik erejüket. Legyen szó a jövedelem vagy a gyermekek száma alapján hozott hitelbírálatról, vagy a pixeleket elemző konvolúciós szűrőkről, a cél közös: a jövőbeli döntések hatékonyságának maximalizálása.

A sorozat 4. részében továbblépünk a technikai alapokról az MI társadalmi hatásai felé: górcső alá vesszük az etikai kérdéseket, az algoritmusok elfogultságát, valamint az Erős MI és a Szuperintelligencia jövőbeli kilátásait.