2. Rész: A logika útján – Az MI története Turingtól napjainkig

május 20, 2026|Péter Teszáry|0 megjegyzések

Üdvözöllek ebben a cikksorozatban! Szakértőként és technológiai edukátorként az a célom, hogy segítsek eloszlatni a mesterséges intelligenciát (MI) övező misztikumot és az esetleges szorongásokat.

1. Bevezetés és kontextus

Cikksorozatom első részében tisztáztuk a mesterséges intelligencia alapfogalmait és jelenkori jelentőségét. Azonban az MI fejlődése nem egy légüres térben létrejött technológiai robbanás, hanem egy évszázados intellektuális utazás eredménye. A mesterséges intelligencia története az emberiség egyik legmélyebb ambíciójáról szól: nem csupán megérteni kívánjuk saját kognitív folyamatainkat, hanem célul tűztük ki azok mesterséges reprodukálását és technológiai megvalósítását is.

Ez a törekvés mélyen gyökerezik a társtudományokban. A filozófia évezredek óta kutatja a tudás eredetét, a matematika – különösen Kurt Gödel 1931-es nemteljességi tétele révén – kijelölte a formális rendszerek határait, a közgazdaságtan pedig a játékelmélet és a döntéselmélet alapjaival járult hozzá a racionális ágensek modelljéhez. Az MI-kutatás ezen interdiszciplináris alapokra építve próbálja áthidalni a szakadékot a biológiai értelem és a szilíciumalapú logika között.

2. A hajnal: McCulloch, Pitts és a biológiai ihletés (1943)

A mesterséges intelligencia tudományos hajnala 1943-ra datálható, amikor Warren McCulloch és Walter Pitts publikálta úttörő tanulmányát. A szerzők forradalmi felismerése az volt, hogy a neurobiológia, a formális logika és a Turing-gép elmélete közös nevezőre hozható. Modelljükben a biológiai neuronokat egyszerű logikai kapukként („on/off” állapotú egységekként) kezelték.

Bebizonyították, hogy egy ilyen, kétállapotú neuronokból álló hálózat elvben bármilyen kiszámítható aritmetikai és Boole-függvény megvalósítására képes. Ezzel igazolták, hogy a biológiai inspirációjú struktúrák képesek a digitális logika teljes spektrumát lefedni. A tanulás folyamatára Donald Hebb 1949-ben adott elméleti keretet, rávilágítva, hogy az ismeretszerzés kulcsa a neuronok közötti kapcsolatok, az úgynevezett súlyok módosítása. Ez az elv vezetett 1950-ben az első hálózati szimulátor, a 40 neuronos SNARC megépítéséhez.

„A tanulás során a neuronok közötti kapcsolaterősség változik: azok a kapcsolatok erősödnek meg, amelyek gyakran aktiválódnak együtt.” – Donald Hebb szabálya, amely a modern neurális hálózatok súlykorrekciós algoritmusainak (pl. backpropagation) közvetlen elméleti őse.

3. Alan Turing és a gép, amely gondolkodik

Alan Turing, a modern számítástudomány atyja, látnoki erejű írásaiban (1947, 1950) túllépett a puszta számítási kapacitáson. Paradigmaváltó gondolata a „gyermek-gép” metaforája volt: ahelyett, hogy egy statikus, felnőtt szintű intelligenciát próbálnánk mereven beprogramozni, egy olyan rugalmas alaprendszert kell létrehoznunk, amely képes a környezetéből tanulni és fejlődni.

Turing meghatározta azokat a kritériumokat is, amelyek elengedhetetlenek ahhoz, hogy egy gépet intelligensnek tekintsünk. A híres Turing-teszt sikeres teljesítéséhez a gépnek négy alapvető képességgel kell rendelkeznie: természetes nyelvfeldolgozás (NLP), tudásreprezentáció (tárolás), automatizált következtetés és gépi tanulás.

Fogalom	Turing elképzelése	Modern megfelelője
Turing-teszt	Kommunikációs próba, ahol a kérdező nem tudja eldönteni, emberrel vagy géppel beszél-e.	LLM-ek (pl. GPT-4) értékelése és a Loebner-díj versenyei.
Gyermek-gép	Tanulásra képes alaprendszer létrehozása a kész tudás beprogramozása helyett.	Deep Learning és megerősítéses tanulás (Reinforcement Learning).
Genetikus algoritmusok	Az evolúció elveit (szelekció, mutáció) követő algoritmusok fejlesztése.	Evolúciós stratégiák a hálózati architektúrák optimalizálásában.

4. 1956: A hivatalos születés – A Dartmouth konferencia

Az MI mint önálló tudományág 1956 nyarán, a Dartmouth College-ban rendezett két hónapos workshopon született meg. John McCarthy nemcsak a rendezvény házigazdája volt, hanem a „mesterséges intelligencia” kifejezés megalkotója is. A konferencia az alapító atyák („A négy nagy”) különböző tudományos megközelítéseit egyesítette:

John McCarthy: A szimbolikus MI hirdetője, aki a logikai következtetést tartotta elsődlegesnek.
Marvin Minsky: A kognitív szemlélet és a neurális hálózatok korai kutatója.
Claude Shannon: Az információelmélet atyja, aki a jelek és adatok matematikai továbbítását helyezte fókuszba.
Nathaniel Rochester: Az IBM mérnökeként a gyakorlati megvalósíthatóságért felelt.

A résztvevők optimizmusa határtalan volt: úgy vélték, egy-két évtized elegendő lesz az emberi intelligencia alapfunkcióinak mesterséges leképezésére. Bár a jóslataik túlzónak bizonyultak, ez az esemény indította el az MI-kutatás első intézményesített hullámát.

5. Az aranykor és a szakértői rendszerek (1970-es – 1980-as évek)

Az 1970-es évektől a kutatás a szakértői rendszerek felé fordult. Ezek a programok a „ha-akkor” típusú logikai szabályokra építve próbálták megismételni egy-egy szűk szakterület (például orvosi diagnosztika vagy műszaki konfiguráció) emberi szakértőinek tudását.

Ez volt az MI első komoly üzleti sikereket hozó korszaka. A leghíresebb példa a DEC számára kifejlesztett R1 (XCON) rendszer, amely a számítógépes konfigurációk összeállítását automatizálta. A rendszer évi 40 millió dolláros megtakarítást hozott a cégnek 1986-ra. A tudásalapú megközelítés dominanciája idején az MI-ipar milliárd dolláros piaccá nőtt, először bizonyítva a technológia gazdasági életképességét.

6. Az MI telek (AI Winters): A csalódás időszakai

A történelem során az MI fejlődése többször is megtorpant. Az 1970-es és 1990-es évek „MI telei” a túlzott elvárások és a valós technológiai korlátok közötti szakadék miatt alakultak ki. A források elapadásának hátterében több meghatározó ok állt:

Számítási és adatkiválósági korlátok: A korabeli hardverek képtelenek voltak a komplex hálózatok futtatására, és nem állt rendelkezésre elegendő digitális adat a tanításhoz.
Az XOR probléma (Lineáris korlátok): A korai lineáris osztályozók (mint a Perceptron) elméleti falba ütköztek. Bebizonyosodott, hogy képtelenek megoldani az XOR (kizáró vagy) logikai műveletet, mert az nem lineárisan szeparálható. Ez a felismerés évtizedekre visszavetette a neurális hálózatok kutatását.
Kezelhetőség (NP-teljesség): Számos logikai probléma megoldási ideje exponenciálisan nőtt az adatok számával, ami a korabeli algoritmusokat használhatatlanná tette nagy léptékben.

7. A reneszánsz: Deep Blue és a gépi tanulás visszatérése

A mélypont után 1997-ben az IBM Deep Blue számítógépe visszahozta az MI-t a köztudatba, amikor legyőzte Garri Kaszparov sakkvilágbajnokot. Bár a Deep Blue sikere nagyrészt a „brute force” módszernek (nyers számítási kapacitásnak) és az előre beprogramozott sakkismereteknek volt köszönhető, a győzelem szimbolikus jelentősége óriási volt.

Ez az időszak jelezte a váltást a merev szabályalapú rendszerektől a gépi tanulás (Machine Learning) felé. A hangsúly az előre definiált szabályokról a mintázatfelismerésre helyeződött át: a rendszerek már nem csupán végrehajtották az utasításokat, hanem az adatokból saját maguk kezdték kinyerni az összefüggéseket.

8. A mélytanulás forradalma és az AlphaGo (2000-es évektől napjainkig)

A 2000-es években a Big Data és a GPU-k (grafikus processzorok) párhuzamos feldolgozási képessége elhozta a mélytanulás (Deep Learning) korát. A sokrétegű neurális hálózatok képessé váltak bonyolult, nemlineáris összefüggések felismerésére is.

A technológiai ugrást az AlphaGo 2016-os győzelme szemlélteti Lee Sedol ellen. A Go játékban több lépéskombináció létezik, mint ahány atom található a megfigyelhető világegyetemben, így a nyers számítási erő itt kudarcot vallott volna. Az AlphaGo sikere az intuitív mintázatfelismerés és a saját maga ellen játszott partikból való tanulás diadala volt.

Deep Blue (1997) vs. AlphaGo (2016) technológiai különbségei:

Deep Blue: Determinisztikus, szakértői szabályokra és hatalmas keresési fára (brute force) épített.
AlphaGo: Szubszimbolikus megközelítés, mély neurális hálózatok és valószínűségi alapú mintázatfelismerés.

9. Napjaink MI-je: A ChatGPT és a mintázatfelismerés ereje

A modern nagy nyelvi modellek (LLM-ek), mint a ChatGPT, a valószínűségi mintázatfelismerés csúcsát képviselik. Fontos megérteni: ezek a rendszerek nem „gondolkodnak” a szó humán értelmében, hanem a betáplált adatok statisztikai összefüggéseit tükrözik vissza.

Vegyük az alma színének példáját a mintázatfelismerés szemléltetésére: Ha az MI a tanítás során látott 10 példát, amelyből 7-szer az alma piros, 2-szer zöld és 1-szer sárga volt, akkor a következő szó behelyettesítésekor a legnagyobb valószínűséget (70%) a „piros” szóhoz rendeli. Ez a statisztikai predikció adja a modern MI „intelligenciájának” alapját.

A jelenlegi technológiai spektrum:

Gyenge MI (Narrow AI): Speciális feladatokra (szöveggenerálás, képelemzés) optimalizált rendszerek. Itt tartunk ma.
Erős MI (General AI): Általános emberi értelmi képességekkel rendelkező rendszer. Ez jelenleg kutatási célkitűzés.
Statikus vs. Dinamikus tudás: Míg az ingyenes modellek gyakran statikus (pl. 2023-as) adathalmazra támaszkodnak, a fizetős verziók (mint a GPT-4o) már képesek élő internetes keresésre és valós idejű dokumentum-összefoglalásra, áthidalva az adatok elavulásából adódó problémákat.

10. Összegzés

Az MI útja a logikai kapuktól az öntanuló hálózatokig tartó folyamatos evolúció:

1943–1949: Megszületnek az elméleti alapok és a neuronmodellek.
1956: A Dartmouth konferencia intézményesíti a tudományágat.
1970–1980: A szakértői rendszerek hozzák az első üzleti sikereket (R1).
1990–2010: A számítási kapacitás és a Big Data elhozza a mélytanulás reneszánszát.
Napjaink: A generatív MI és a valószínűségi modellek integrálódnak a mindennapokba.

A cikksorozatom következő, 3. részében részletesen megvizsgáljuk az MI különböző típusait, és választ keresünk arra, hogy hol húzódik a határ a Gyenge MI, az Erős MI és a távoli jövőben felsejlő Szuperintelligencia között.