2015. október 14., szerda

A nyelvek rendszertana

Megszakítom rendszertani sorozatomat, mert ma megjelent egy cikk, ami egyrészt érdekes (mi másért kerülne ide), másrészt köze van a rendszertanhoz, harmadrészt köze van a biológiához is. Szeretem azokat a témákat, amelyek megmutatják, hogy egyes tudományterületek egymásnak is segíthetnek, s a tudományterületeknek nem szabad a saját külön kis erődjeikbe elbújniuk. Ezekkel az átfedésekkel, egymásra gyakorolt jótékony hatással foglalkozom az integratív biológia kurzusomban is.

Szóval nyelvészkedés. Ahhoz úgyis mindenki ért, legalábbis igen gyakran szeretnek emberek rokonítani nyelveket a szavak alapján. Amúgy ezt a törekvést teljességgel megértem. Aki egy kicsit is tud valamilyen Indo-Európai nyelven, lehetőleg vagy a latin vagy a germán nyelvcsaládban, az nagyon gyorsan megtalálhatja a hasonlóságokat ezen nyelvek között egyszerűen a szavakra nézve. Persze ezek a nyelvek nem váltak régen el egymástól, s így kevés szükség van bevetni a nyelvészet minden eszközét, hogy hasonlóságaikat meglássuk. Saját nyelvünk a legközelebbi ma is létező rokonaitól (s most fogadjuk el a finn-ugor nyelvi rokonságok) is több ezer éve elvált. Nem csoda, hogy a hasonlóság észrevehetetlen (bár messziről a finn hangzása abban nagyon hasonló a magyarhoz, hogy a hangsúly mindig az első szótagon van. Találkoztam már olyan amerikaival, aki ezért finnek nézett, mondván, hogy a családommal beszélt nyelv nagyon hasonlít egy finn ismerősük által beszéltre.).

Szóval a nyelvészek azért annyira nincsenek odáig a szavak hasonlítgatásáért. Mégis a most ismertetendő cikkben pontosan ez történik. A nyelvész szerző fogott egy adatbázist, amiben igen sok nyelv (4400 nyelv van benne a ma létező körülbelül 6000-ből) 40 szava szerepel pontos fonetikus lejegyzéssel. Na ehhez viszont kellenek a nyelvészek, mert aki angolul vagy franciául tanult az tudja, hogy az írásnak és a kiejtett szavaknak nem nagyon vagy egymáshoz közük. Ebben az adatbázisban tehát az van ahogy a szavakat kiejtik.

S itt jön be a rendszertan eszköztára. Vannak karakterláncaink (szavak), amelyek között hasonlóságot kell megállapítani, majd ebből egy "törzsfát" készíteni. Erre a biológiában bevett bioinformatikai eszközök állnak rendelkezésre. Természetesen azokat a GCTU betűkből álló hosszú "szavak" hasonlóságának elemzésére fejlesztették ki, de most alkalmazzuk őket az emberi nyelv szavaira.
A csodálatos ebben az, hogy lényegében visszakapták azokat a nyelvcsaládokat, sőt nagyobb nyelv szupercsaládokat, amelyeket a nyelvészek hosszas elemzéssel megállapítottak a nyelvtan és a hangváltozások szabályai alapján. Az ilyen nyelvészeti vizsgálódás azonban csak körülbelül 10.000 évre visszamenőleg tud leszármazási vonalakat megállapítani. Az emberi nyelvek ennél régebbi elválásokkal is rendelkeznek. A mostani elemzés ebben segíthet.
Nyelvcsaládok rendszere. Csak Európában és Ázsiában beszélt nyelvekre korlátozták az elemzést, az Afrikai, Afrikai-Ázsiai és az amerikai nyelveket (pl. eszkimó) kihagyták. Mi az uráli nyelvek közé tartozunk.
Az ismert nagy nyelvcsaládokat teljesen visszaadja ez a fa (ezeket a belső elágazásokat nem mutatja az ábra). Érdekes ugye a nyelvcsaládok egymáshoz való viszonya. Vegyük a saját uráli nyelvcsaládunkat (ennek egy alhalmaza a finn-ugor nyelvcsalád)! Legközelebbi rokonunk a nivkh nyelv (nyelvcsalád). Ezt a nyelvet külső mandzsúriában Oroszország távol-keleti részén beszéli talán 4000 ember. Hmm. A Yugakhir nyelvet szintén valahol Szibéria keleti részén beszélik, mára alig 600-an. Erről a nyelvről korábban is felvetődött, hogy rokona az urálinak. Az Indo-Európai (ugye ide tartozik lényegében a többi európai nyelv) és a Chukotko-Kamchatkai közel kerültek egymáshoz. Ez utóbbi Szibéria legészak-keletibb csücskében beszélt olyan 2-5 nyelv összefoglaló neve. Összesen 2500 beszélőjük lehet. A nyelvészek az urálit is összeháziasították már a szibériai nyelvekkel. De ezekhez még mindig túl közel áll az Indo-Európai. A felső pirossal jelöl csoport viszont lényegében megegyezik az Eurázsiai nagy nyelvcsaláddal (amibe még az altáji nyelvek tartoznak a török-, mongol- és tunguszi nyelvcsaládokkal), amelynek létezéséről azért van még némi vita. Ez az elemzés némi alátámasztást ad neki.

Az elemzés a szerző által is bevallottan még nyers. A távolságmátrix számolásánál figyelembe vettek bizonyos nyelvészeti ismereteket, de a bioinformatika a változásra nézve is alkalmaz ismereteket a biológiai mutációról alkotott ismereteink alapján. Hasonlóan a hangtani változások szabályai segíthetnek tovább finomítani a módszert. De a módszer még így is meglepően jól egybecsengő eredményt adott a más - nyelvészeti - módszerekkel alkotott fákkal.

Úgy érzem a nyelvészek nekiállhatnak rendszertant/bioinformatikát tanulni. Vagy mi nyelvészetet, hogy segítsük őket.

Hivatkozott irodalom

Jäger, G. 2015. Support for linguistic macrofamilies from weighted sequence alignment. Proceedings of the National Academy of Sciences 112(41): 12752-12757

Nincsenek megjegyzések:

Megjegyzés küldése