Kereső toggle

Mesterséges agyalás

Önállóan tanuló neuronhálózatok

Továbbítás emailben
Cikk nyomtatása

A Facebook üzleti modellje alapvetően azon alapul, hogy a regisztráltak profilja alapján a hirdetők hatékonyabban érhetik el a célközönségüket. Nem mindenki áll meg azonban ennél: bizonyos cégek arra specializálódtak, hogy a Facebook-profilok alapján értékeljék az emberek hitelképességét. Ez ugyanis jól jöhet, ha más információ nem áll valakiről rendelkezésre. Ma a nagyobb informatikai vállalkozások világában ez a jelenség nem egyedülálló, számos cég kísérletezik olyan megoldásokkal, amelyek lényege a meglévő adatok újszerű elemzése és felhasználása.

Mivel az élvonalbeli cégek adatbázisai hatalmas méretűek és bonyolult szerkezetűek, ezért a szakértők számára is nehézséget okoz az összefüggések kihámozása. Emiatt egyre többen kezdik el alkalmazni az úgynevezett gépi tanulási módszereket. Ezek olyan speciális programok, amelyeknek ha kellő mintát mutatunk, elkezdenek maguktól felfedezni összefüggéseket, amelyeket új minták esetén is tudnak alkalmazni (hasonlóan ahhoz, ahogy egy iskolás is példákkal tanul a dolgozatírásra).
Például ha sok Facebook-profilt mutatunk a gépi tanulási programnak, ahol azt is megmondjuk, hogy az illető mennyire volt jó vagy rossz hitelfizető, akkor képes lesz azoknak a – sok esetben nüansznyi – részleteknek a felismerésére, amelyek alapján maga a gép döntést tud hozni a hitelkérelmek minősítésénél. Így a későbbiekben olyan esetekben is pontos hitelbesorolásra lesz majd képes, ahol az igénylő megbízhatósága nem ismert.
Erre szolgáltat példát a Fico nevű hitelképesség-értékelő cég, ahol a rossz és jó adósok Facebook-profiljait vizsgálják. A cég vezérigazgatója nemrég azt nyilatkozta, hogy „ha azt nézzük, hogy valaki hányszor írta a (Facebook) profiljában, hogy »ki vagyok ütve«, az mindenképpen bír valamennyi jelentősséggel a hitelképessége szempontjából.”

Kik és hol használják?

A gépi tanulási módszerek sokkal univerzálisabb, új eszköztárat jelentenek az informatikában, mint a fenti példa. Számos feladatot sokkal hatékonyabban képesek végrehajtani, mint a hagyományos programok: ilyen például az objektum- és arcfelismerés képeken és videókon vagy képek szöveges jellemzése. Nem véletlen, hogy a nagyobb tech-cégeknek, mint a Facebook vagy a Google, saját gépi tanulással foglalkozó kutatócsoportja van. Ezek a maguk nemében sem számítanak kicsinek, például a Facebook FAIR elnevezésű kutatócsoportja jelenleg 50 fős, de duplájára tervezik bővíteni.
A kutatások fókuszában sokszor (de nem kizárólag) az idegrendszer működését utánzó úgynevezett mesterséges neurális hálózatok alkalmazása áll, amelyeket már ma is megtalálhatunk egyes szolgáltatásokban, termékekben. A legújabb Google Translate alkalmazásban egy neurális hálózat dolgozza fel a kamera képét, hogy az ott megjelenő szöveg karaktereit kiolvassa. Ezek után egy másik neurális hálózat fordítja le a szöveget a kívánt nyelvre. Ugyanúgy neurális hálózatok felelősek a Google autóinak biztonságos vezetéséért is: ezek ismerik fel és jellemzik az autó látóterébe kerülő objektumokat.
Ezeknek az eljárásoknak az érdekessége, hogy sok esetben ki is tudják fejezni, amit megtanultak. Például egy házszámot felismerő neurális hálózat képes házszámokat ábrázoló képeket „festeni”, vagy egy zenére „hangolt” hálózat új zenék „komponálásra” is képes. Bár ezek sokszor kevésbé élvezetesek, mint az eredetiek, de meglepően jól utánozzák az igazit. Ebben az az érdekes, hogy a mesterséges neurális hálózat nem kap magyarázatot a megértendő anyagok mellé, hanem csupán a nyers tartalom alapján képes lesz absztrakt fogalmak használatára (lásd keretes írásunkat!).
Bár elég elvontnak tűnik a mesterséges neurális hálózatok fogalma, nézzük meg egy egyszerű példával, hogy milyen elven működik az egyik típusuk, az arcfelismerésre használt hálózat. Ahogyan az agyunkban az idegsejtek, a neuronok hálózatot alkotnak, a mesterséges neuronokat is hálózatba szervezik, amelyben a szomszédos neuronok egymás felé jelzéseket küldenek, ha bizonyos inger éri őket. A képfelismerésnél az egyik trükk az, hogy többrétegű hálózatot alkalmaznak, így a hálózat a felismerési problémát részekre tudja bontani.  Míg az első réteg csak a nyers képet „látja”, a második réteg képes érzékelni, hogy azon hol helyezkednek el élek és további vonások. A második réteg jelentéséből pedig a harmadik réteg képes felismerni összetettebb objektumokat, mint a szemek vagy a száj, és ebből végül összeáll a végső kép.

Morális kérdések

Az eredményeket és a cégóriások erőfeszítéseit figyelembe véve sejthető, hogy nem lesz tiszavirág életű a gépi tanulási módszerek alkalmazása, sőt, számos helyen szolgálnak majd ki bennünket efféle programok. Azonban ez számos, hétköznapi életet érintő morális kérdést is felvet.
A bankok számára csábító lehetőség, hogy a hitelképesség felmérésére alkalmazzák a gépi tanulás módszerét. Azaz például az aktuális bevételek, meglévő hitelek, munkahelyen eltöltött idő alapján próbálják megjósolni, hogy valaki egy hitelt vissza fog-e fizetni vagy sem. Ennek korlátot szab, hogy sok országban meg kell indokolni, hogy ha elutasítanak egy jelentkezőt, akkor miért nem kaphat hitelt – viszont a gépi döntések mellé nem jár indoklás, és a magyarázat keresése sokszor még szakértők számára sem könnyű feladat.
Azonban a privátszférára gyakorolt hatás sem elhanyagolható. Kiváló példa erre a Facebook kutatócsoportjában fejlesztett arcfelismerő alkalmazás, amely 83 százalékos pontossággal volt képes felismerni emberi arcokat. Ugyanez az alkalmazás 97,25 százalékos pontossággal tudta azt is megmondani két arcról, hogy ugyanarról a személyről van-e szó. Bár ez kétségkívül hasznos lehet az olyan alkalmazásokban, mint a Facebook Moments, amely a telefonunkon lévő képeket csoportosítja arcfelismerés segítségével, de nem kívánt helyeken is felfedhet bennünket: például demonstrációk résztvevőit automatikusan kigyűjthetik és számon tarthatják, vagy képek alapján alternatív kapcsolatrendszert építhetnek fel emberek között.
A gépi tanulási eljárásokat ajánlórendszerekben is használják, hiszen jól képesek „ráérezni” azokra az összefüggésekre, amelyek alapján választunk. Ez különösen hasznos lehet, hogyha például bor vásárlásra készülünk, azonban rossz irányba befolyásolhatja a tájékozódásunkat, ha ilyen algoritmusok döntik el, milyen cikkeket olvassunk el, és milyeneket ne. Ráadásul a (szándékos) részrehajlások kimutatása a rendszerek bonyolultsága miatt az esetek többségében nehéz lehet.

A több mindig jobb

A gépi tanulás terén jól ismert ökölszabály, hogy egy buta algoritmus sok adattal jobb eredményt képes elérni, mint egy okos algoritmus kevés adattal. Ezért miközben gőzerővel folynak a kutatások az algoritmusok fejlesztése területén, a cégek adatéhsége sem csillapodik. A Facebook az utóbbi években látványosan kiterjesztette adatgyűjtését az oldalán kívülre is. Például a különböző szájtokon – például hírportálokon – megjelenő likegombok segítségével információkat gyűjtenek arról, hogy az adott felhasználó mit csinál a weben (akkor is, ha az illető nem kattint rá a like-ra). Ehhez ráadásul nem is kell a közösségi hálózat tagjának lenni: legfeljebb nem névhez, hanem egy számsorhoz társítják az így begyűjtött adatokat – amelyeket célzott hirdetések értékesítéséhez használnak fel a későbbiekben.

Így írnak ők

Jelen cikk kedvéért betanítottunk egy neurális hálózatot, hogy utánozni tudja lapunk egyik szerkesztőjének, Morvay Péternek az írásait. A hálózat csaknem két napon keresztül olvasta Péter Hetek-archívumban elérhető cikkeit – nagyjából 450 ilyet találtunk, összesen kicsivel hosszabb terjedelműek, mint Shakespeare összes műve együttvéve. A hálózat csupán egy számára értelmezhetetlen karakterfolyamként látta ezeket a műveket, anélkül, hogy a nyelvi szabályokról, vagy egyáltalán a karakterek, szavak jelentéséről, a mondat absztrakt fogalmáról értesítettük volna. A feladata az volt, hogy ezeknek az absztrakt fogalmaknak a használatát maga találja ki, és legyen képes Péter írásait utánozni. Végül efféle szövegeket írt magától a neurális hálózat:
„A bibliai pápa megismerte a zsidó pénzt, Hamaszban jártak hosszú határozatunk között. A lista jövője elmondva esetemkel szemben, akik is terroristák képviselte pénzikkelet, kiszorultam a zsidó nagykövetet. Ha Moszkva ellenére – amit kijelentette: Az unió azt vérek egy alkotmányban. Irán és egy dolgokat váltott, miközben a keresztény állam is megállíthatatlanná vált Halmon, a Teremtők szenitéke.”
Ugyan a fentebbi idézetek nem értelmezhetőek, de látszik, hogy a gépnek sikerült „megértenie” a szavak fogalmát és rendjét a mondatokban, mint ahogy az írásjelek használatát is, sőt, a szerző témáit is tükrözi a „mondanivalója”. A szöveg értelmetlensége nem meglepő, hiszen a hálózat a nyers szövegeken kívül nem rendelkezett más információval, így nem is volt módja arra, hogy a fogalmak mögötti tartalmat „megértse”. Voltaképpen olyasmit kaptunk végeredményül, mint egy ügyesen improvizáló papagáj.
 

Olvasson tovább: