Az AI-nak jobb a szókincse, mint az embernek

SAJTÓKÖZLEMÉNY eLitMed

2024. SZEPTEMBER 13.

HUNGARIAN

JOGKÉRÉS Megosztás

Szöveg nagyítása:

100%

A mesterséges intelligencia alapú szoftverek verbális intelligenciáját vizsgálták az ELTE PPK-n. A kutatás nyomán kiderült, hogy szóismeretükben a gépek még a doktori fokozattal rendelkező anyanyelvi beszélőket is maguk mögé utasítják.

A nagy nyelvi modellek (large language models) olyan mesterségesintelligencia-típusok, amelyek képesek ember alkotta szövegekhez hasonló tartalmak létrehozására. Ezek a modellek – például a népszerű ChatGPT – forradalmi változást hoztak az AI világában, és mára már képesek igen élethűen utánozni az emberi képességeket.

A szakembereket régóta foglalkoztatja, mennyire intelligensek a gépek az emberekhez képest. A klasszikus összehasonlító tesztek (mint például a Turing-teszt) azonban nem képesek differenciálni az emberi teljesítményben: csak azt lehet mérni velük, hogy a gépek mennyire képesek utánozni az emberi kogníció univerzális aspektusait, például a kommunikációs készséget. Ezzel szemben az emberi intelligencia vizsgálata épp az egyéni különbségekre fókuszál – maga az IQ is egy olyan relatív mutató, amely a teljesítményünket másokéhoz viszonyítja.

Egyes kutatók szerint az AI intelligenciáját úgy lehet a legjobban mérni, ha a modellekkel embereknek tervezett pszichometriai teszteket végeztetünk el. Ennek fényében Kovács Kristóf, az ELTE PPK tudományos főmunkatársa, a Kognitív Képességek Kutatócsoport vezetője és a tesztező platformokkal foglalkozó Klein Balázs vizsgálatukban két mesterséges intelligencia alkalmazás (ChatGPT és Bing) verbális intelligenciáját hasonlították össze több mint 9000 emberével.

Ehhez egy számítógépes adaptív szókincstesztet használtak, ahol kilenc felsorolt szó közül mindig azt a kettőt kellett kiválasztani, amelyek jelentésben a legközelebb álltak egymáshoz. Az adaptív tesztelés során egy algoritmus választja ki az elemeket egy kérdésbankból úgy, hogy a nehézségi szint mindig közel legyen az alany képességeihez. Ezáltal pontosabb eredményt kaphatunk, mint egy fix kérdésekből álló teszt esetén.

A teszten mindkét nyelvi modell magas teljesítményt nyújtott: 20-ból 19 embernél – azaz az emberek 95%-ánál – jobb eredményt értek el, és jobban teljesítettek a doktori fokozattal rendelkező anyanyelvi beszélőknél is. Ha ezek a gépek emberek lennének, kiemelkedő tehetségnek számítanának – hívják fel a figyelmet a szerzők, akik szerint valószínűsíthető, hogy az AI alkalmazásoknak a közeljövőben az emberek 100%-ánál jobb szókincsük lesz.

A gépek kiemelkedő teljesítményük ellenére azonban vétettek néhány hibát is. Az ismétlődő kérdések 42%-ánál eltérő válaszokat adtak az egyes alkalmakkor – ilyen embereknél nem történik. Emellett esetenként „hallucinációik” is voltak: olyan szavakkal válaszoltak, amelyek nem szerepeltek a megadott opciók között. (Ez akkor is megtörtént, ha korábban már megválaszolták helyesen az adott kérdést, tehát nem arról volt szó, hogy nem tudták a megoldást.) Ezek a hibák azonban nem a szoftverek hiányosságaira utalnak, hanem sokkal inkább arra mutatnak rá, hogy az embereknek szánt pszichometriai teszteknek a mesterséges intelligencia esetében vannak korlátai.

Az eredményeket olvasva felmerülhet a kérdés, hogy miként különböztethetjük meg a mesterséges intelligencia által generált tartalmakat és az ember által írt szövegeket, ha már a gépek is ilyen magas verbális teljesítményre képesek. A kutatók azt tanácsolják, ne a túl felszínes, hanem épp a túl szofisztikált kommunikáció esetén fogjunk gyanút – hiszen könnyen előfordulhat, hogy egy AI szoftver színesebb szókincsből dolgozik, mint mi.

Forrás: ELTE Kommunikáció

Kapcsolódó anyagok

Klinikum

Kettős thrombocytaaggregáció-gátlás vs. minor akut ischaemiás stroke-ban

Chen és munkatársai a JAMA-ban megjelent cikkükben a kettős APT (dual APT, DAPT) noninferioritását vizsgálták intravénás thrombolysissel szemben minor, rokkantságot nem okozó ischaemiás stroke-okban.

HUN

2023. NOVEMBER 14.

PharmaPraxis

A ChatGPT a gyógyszertári gyakorlatban

Keresztmetszeti vizsgálat a patikusok percepciójáról, praxisáról és véleményéről: a Journal of Pharmaceutical Policy and Practice tanulmányának célja az volt, hogy kiderítse, mennyit tudnak a jordániai közvetlen lakossági gyógyszerellátásban dolgozó gyógyszerészek a ChatGPT-ről, és hogyan használják azt munkájukban.

HUN

2023. OKTÓBER 31.

Hírvilág

Mesterséges Intelligencia az orvoslásban - beszámoló a gazdag 2023 őszi konferencia kínálatról, a Neumann társaság konferenciáitól az MTA rendezvényekig.

Az elmúlt hónapokban sokat és sokszor hallunk a mesterséges intelligenciáról a LAM Mesterséges intelligencia rovatában is. A terület fontosságát mutatja, hogy a közelmúltban több konferencia is foglalkozott a területtel. Ezekből ad áttekintést dr. Balkányi László, a LAM „Mesterséges intelligencia az orvoslásban” rovat vezetője.

HUN

2023. DECEMBER 13.

Egészségpolitika

„Az egészségügyi adatokkal való visszaélés bűncselekmény”

KUN J Viktória

Az egészségügyi adatok újabb szabályozását is tartalmazza a júniusban elfogadott salátatörvény. A változás az MI alkalmazását segíti, kérdés azonban, hogy a jövőben jobban kiszűrhetőek-e az emberi tényezők - például amiket az elmúlt hónapok politikai botrányainál láttunk.

HUN

2024. JÚLIUS 08.

Balkányi László Interjúja Dr. Papp Zsolt háziorvossal

Mesterséges intelligencia

Az AI-nak jobb a szókincse, mint az embernek

KULCSSZAVAK

A rovat további cikkei

Mesterséges intelligenciával a rák ellen

Kapcsolódó anyagok

Kettős thrombocytaaggregáció-gátlás vs. minor akut ischaemiás stroke-ban

A ChatGPT a gyógyszertári gyakorlatban

Mesterséges Intelligencia az orvoslásban - beszámoló a gazdag 2023 őszi konferencia kínálatról, a Neumann társaság konferenciáitól az MTA rendezvényekig.

„Az egészségügyi adatokkal való visszaélés bűncselekmény”