A következő címkéjű bejegyzések mutatása: nyelv. Összes bejegyzés megjelenítése
A következő címkéjű bejegyzések mutatása: nyelv. Összes bejegyzés megjelenítése

2024. január 19., péntek

Mik a nyelv evolúciós változásainak mozgatórugói?

Bevallom van az, hogy egy cikk nagyon érdekes a címe és az összefoglalója alapján, aztán végül egy nagy csalódás az egész. Most is belefutottam egy ilyenbe (Li et al., 2024).


A nyelv egy evolúciós rendszer



A nyelv kialakulása egy nagy evolúciós átmenet. Kialakul egy új replikátor, amit Richard Dawkins mémnek hív (nem összekeverendő a fura képekkel, amelyek szintén mémek, de a fogalom ennél tágabb). Fogalmak, jelentések, akár teljes nyelvtani szerkezetek változnak az évszázadok során. Ezért hat régiesen akár már Jókai is, pedig nem túl sok generáció telt el azóta. A magyar nyelv is folyamatosan változik. Mindenkinek ajánlom Nádasdy Ádámtól a „Milyen nyelv a magyar?” című könyvét. Olyan meglepő dolgokat olvashatunk, mint hogy névelő nem mindig volt a magyarban (a finnben most sincs tudtommal), vagy, hogy az igeidők és kifejezéseik folyamatosan változnak. És megérthetjük, hogy miért „rontják” el oly sokan a -ba/-ban (-be/-ben) ragokat: mert nem olyan régóta van külön -ban rag és korábban mindkét esetben a -ba/-be rag volt használatos. Ahogy bizonyos helyeken ma is. A nyelv az egy „élő”, változó (evolválódó) dolog.


Megtanítjuk a biológusoknak, hogy evolúcióhoz öröklődés, szaporodás és változatosság kell. A szaporodás amikor valakinek megtanítjuk a nyelvet. Van, hogy ez kötődik a biológiai szaporodáshoz, van, hogy valaki idegen nyelvként tanulja meg ékes anyanyelvünket. Az öröklődés is tetten érhető, mert úgy fogjunk beszélni a nyelvet, ahogy az, aki megtanított. Később finomíthatunk magunk, de például pont ezért van tájszólás vagy régiónként eltérő megnevezés egyes dolgokra. És macokként ismerem a krumplilángosként vagy tócsniként is ismert ételt. A Mátra környékén ez a neve. Máshol meg más a neve.


És van természetesen változatosság is a nyelvben. A rokonértelmű szavak például változatosságot adnak, de elképzelhető, hogy valamelyik változat majd egyszer fixálódik, azaz egyeduralkodó lesz. A változások, például két forma használatának gyakorisága egy evolúciós folyamat (vö. öröklődő tulajdonságok gyakoriságának változása időben). Például észre lehet venni, hogy a hagyományos „Jó napot kívánok!” helyett egyre gyakoribb a „Szép napot kívánok!” (vagy persze egyszerűbben jó napot és szép napot).


Hogyan vizsgálható a szóhasználat?


Az egyik kísérletben egy történetet kell saját szavakkal továbbadni. Ahogy az emberek továbbadják a történetet, az alkalmazott szavak változhatnak. Azt figyelik, hogy mely szavak maradnak meg (azaz minden továbbadó használja őket) és melyek vesznek el, cserélődnek le más szavakra. A másik kísérletben az elmúlt 200 év szövegeit elemzik. Az egyre több digitalizált szöveg lehetővé teszi a nyelv változásának (sőt a hangulatok változásának) követését az alkalmazott szavak és nyelvtani formák gyakorisága alapján.


Mik a nyelv evolúciós változásainak mozgatórugói?


  • Azok a szavak inkább megmaradnak, amelyeket fiatalabban tanultunk meg.
  • A konkrétabb jelentésű szavak inkább megmaradnak (Konkrét például egy tárgy, mint a kő vagy egy állat, mint a madár neve. Kevéssé konkrétat az absztrakt fogalmak, mint az igazság, hit, szeretet.)
  • Az izgató szavak inkább megmaradnak (bár a szex is az izgató szavakhoz tartozik, de mondjuk a kígyó is. A talajrög vagy az alvás, pedig a nyugtató szavakhoz.)
  • A főneveket és az igéket inkább megtartjuk
  • A hosszabb szavak kevésbé maradnak meg. A nyelv a könnyebb tanulhatóság, egyszerűsödés felé halad.

Egy szakcikknek is olvasmányosnak kéne lennie


De miért is rossz ez a cikk? Azért, mert egy megveszekedett példa sincs benne. Milyen egy izgató szó? Elő kellett bányásznom egy másik cikkből. Mely szavakat tanuljuk meg előbb és melyeket később. Értem, hogy a mama és baba korai, az antagonisztikus pleiotrópia pedig a legfeljebb a vizsgára megtanulandó kifejezések közé tartozik. De ha csak ezek között van különbség, akkor sokat nem állítottunk. És mi van a változásokkal? Mely szavak gyakorisága csökkent? Mely kevésbé konkrét szavak koptak ki és mely konkrétak gyakorisága nőtt? Nem tudjuk meg a cikkből. Értem, hogy tízezer különböző szót figyeltek, de ezért a 10 ezres táblázat és az egyetlen példa sem között még lehetett volna mit választani.


Egyedül a kiegészítő információkban van elásva két példa, az egyik nagyon közismert, a másikat én nem tudtam. A közismert a gay kifejezés jelentésének változása. A XX. század elején ez nagyjából boldog, vidám jelentéssel bírt, míg ma lényegében csak a homoszexuális jelentése létezik. A want szót viszont akar, szeretne (elérni, megszerezni) jelentéssel ismertem, pedig a régebbi jelentése a szegény, hiányt szenvedő. Ennyit legalább tanultam.


Egy másik cikkben (Snefjella et al., 2019) találtam, hogy a terrific eredeti jelentése alapvetően negatív, félelmetesen jelent. Most viszont inkább pozitív jelentése van jót, klaszt jelent. Szóval lehet példákat találni és alapvetően példákon keresztül értjük meg a körülöttünk levő világot.


Minden szakcikk is egy történet. Nem egyszerűen információ halmaza, hanem egy történet. Emberek vagyunk és történetek jobban megmaradnak a fejünkben (legalábbis az igéi és főnevei, a rövidebb szavai és az izgató kifejezések), mint egy adattábla. Tanács a cikket íróknak: gondold végig, hogy miért is kéne másnak végigolvasnia a cikkedet. Az kevés, hogy neked kedved volt megcsinálni az elemzést vagy kell még egy cikk a doktoridhoz. Mivel tudok többet meg a világról azáltal, hogy elolvasom a cikket. És kérlek vezess végig azon a cikken. Éjjel fogom olvasni, fáradtan, vagy félálomban a vonaton, sietve. Még is meg kell értenem. És ha érdekes, akkor a részleteket is figyelmesen el fogom olvasni.


Hivatkozott irodalom


2018. január 17., szerda

Anyanyelv helyett "születésihelynyelv"

Az anyanyelv kifejezés azt sugallja, hogy ezt a nyelvet édesanyánktól sajátítjuk el. Ez az olyan homogén nyelvű környezetben, mint Magyarország (vagy Európa zöme), akár természetes is. De valójában az édesanya első nyelve határozza meg a következő generáció által használt nyelvet?


A születési helyen használt nyelv lesz az elsődleges nyelve a gyermekeknek, függetlenül a szüleik nyelvétől.


Ezen a kijelentésen nem lepődünk meg, bár itt érdemes lenne megkérdezni a külföldre szakadt családtagjainkat és ismerőseinket. Mi a gyermekük elsődleges nyelve? Gyanítom a magyar. Az itt ismertetendő tanulmány nem Európában, hanem Indonéziában vizsgálódott, ahol igen nagy számú nyelvet beszélnek ma is, s akár szomszédos falvak nyelve is más lehet. Zömében az ausztronéz nyelvcsaládhoz (további információk itt) tartozó nyelvet beszélnek, de találunk itt pápua nyelvcsaládhoz tartozó nyelvet beszélőt is. Mindehhez hozzátartozik, hogy tartják azokat a szokásokat, amelyek meghatározzák, hogy kinek honnan kell házasodnia. E tekintetben négy lehetőség adódik: (1) mindenki a szülőhelyén marad és ott házasodik, (2) mindenki a szülőhelyétől eltérő helyre házasodik, s ott is fog élni, (3) a férfiak a szülőhelyükön maradnak, a nők viszont másik településre mennek férjhez, és (4) a nők maradnak helyben és a férfiak nősülnek egy másik településre vándorolva.
Sumba és Timor szigeteken a vizsgálatba vont települések és azon nyelvi megoszlása. A Bunak (pápuai nyelv) kivételével a többi nyelv ausztronéz.

A vizsgálatokat Timor és Sumba szigeteken folytatták. Az utóbbin a települések egynyelvűek, míg az előbbiben egy-egy településben több nyelv is egymás mellett élhet. A települések zömében a férfiak maradnak a szülőhelyükön (patrilokális családmodell), de Timor közepén, Wehali környékén több matrilokális (nők maradnak a születési helyükön) falu is található. A kutatásban feljegyezték a személyek elsődleges nyelvét, genetikai mintát vettek tőlük és feljegyezték a családfájukat a nagyszülőkig visszamenőleg.


A genetikai vizsgálatok alapján rokonságot lehet vizsgálni a vizsgálatba vont személyek között. Amennyiben az Y kromoszómájuk hasonló úgy apai ágon rokonok (az Y kromoszóma csak férfiakban van, így apáról fiára öröklődik). Az anyai rokonok viszont a mitokondriális genomjukban hasonlóak, amit mindenki az anyukájától kap. Mivel mindkét jel együtt csak férfiakban van jelen, így csak férfiakat vizsgáltak.


A patrilokális társadalmakban az apai ágon való rokonság erősen korrelált az azonos nyelvvel, míg a matrilokális társadalmakban a nőági rokonok "születésihelynyelve"1 volt hasonló. Tehát az elsődleges nyelvet az határozza meg, hogy ki hol nő fel és nem az, hogy az édesanyja milyen nyelvet beszél. Természetesen nem minden vándorlás jár nyelvváltással, hiszen a közeli falvakban hasonló (általában azonos) nyelvet beszélnek (főleg Sumbán).


A vizsgált személyek közötti rokonság messze távolabbi volt mint, amire szokásosan emlékezünk (a közös ősök a történelem homályába vesznek). A genetikai távolság (és így a szétválás becsült ideje) és a beszélt nyelv azonossága vagy mássága alapján becsülhető, hogy milyen gyakran váltanak nyelvet az egyes leszármazási vonalak. A nyelvváltás átlagos valószínűség 0,5% generációnként (0,3%–1%). Tehát igen sokáig, több ezer évig változatlan egy egy leszármazási vonalon a nyelv.


Ez egyrészt azt jelenti, hogy egy-egy leszármazási vonal nagyon együtt tud maradni és a kultúra is változatlan sokáig. Sőt a közös gén és kultúra tovább megmaradhat, mint amilyen sokáig egy nyelv fennmarad, azaz egy leszármazási vonal együtt is cserélheti a nyelvét.


Timor közelmúltjában volt némi felfordulás, ami jelentősebb populációs mozgást eredményezett (migráció). Ennek ellenére a nyelv és a leszármazási vonal együttmaradása nem változott. Sőt, a többnyelvű falvakban is igaz ez a jelenség, azaz az egyes leszármazási vonalak megtartják a nyelvüket a jelenlévő többi nyelv ellenére.


A kultúra nagyon erősen képes összetartani a népeket, sokkal inkább, mint önmagában a közös leszármazás. A génáramlás messze szabadabb lenne, de a nyelvi határok ennek korlátot szabnak. Azon elmélkedem, hogy mond-e ez számunkra valamit. Egyrészt Magyarország viszonylatában azt látjuk, hogy bár genetikailag nem nagyon térünk el a környező népektől, nyelvünket meg tudtuk tartani. Azaz a nyelv sokkal stabilabban öröklődik, mint a gének. Adhat-e ez alátámasztást annak, hogy esetleg sokkal régebben beszélnek a Kárpát-medencében magyarul, mint az gondolnánk?



1 Tudom, hogy ez így helyesírásilag nem helyes, de az anyanyelv mintájára itt pontosabb.


Hivatkozott irodalom

Lansing, J. S., Abundo, C., Jacobs, G. S., Guillot, E. G., Thurner, S., Downey, S. S., Chew, L. Y., Bhattacharya, T., Chung, N. N., Sudoyo, H. és Cox, M. P. 2017. Kinship structures create persistent channels for language transmission. Proceedings of the National Academy of Sciences 114(49): 12910–12915

2015. október 14., szerda

A nyelvek rendszertana

Megszakítom rendszertani sorozatomat, mert ma megjelent egy cikk, ami egyrészt érdekes (mi másért kerülne ide), másrészt köze van a rendszertanhoz, harmadrészt köze van a biológiához is. Szeretem azokat a témákat, amelyek megmutatják, hogy egyes tudományterületek egymásnak is segíthetnek, s a tudományterületeknek nem szabad a saját külön kis erődjeikbe elbújniuk. Ezekkel az átfedésekkel, egymásra gyakorolt jótékony hatással foglalkozom az integratív biológia kurzusomban is.

Szóval nyelvészkedés. Ahhoz úgyis mindenki ért, legalábbis igen gyakran szeretnek emberek rokonítani nyelveket a szavak alapján. Amúgy ezt a törekvést teljességgel megértem. Aki egy kicsit is tud valamilyen Indo-Európai nyelven, lehetőleg vagy a latin vagy a germán nyelvcsaládban, az nagyon gyorsan megtalálhatja a hasonlóságokat ezen nyelvek között egyszerűen a szavakra nézve. Persze ezek a nyelvek nem váltak régen el egymástól, s így kevés szükség van bevetni a nyelvészet minden eszközét, hogy hasonlóságaikat meglássuk. Saját nyelvünk a legközelebbi ma is létező rokonaitól (s most fogadjuk el a finn-ugor nyelvi rokonságok) is több ezer éve elvált. Nem csoda, hogy a hasonlóság észrevehetetlen (bár messziről a finn hangzása abban nagyon hasonló a magyarhoz, hogy a hangsúly mindig az első szótagon van. Találkoztam már olyan amerikaival, aki ezért finnek nézett, mondván, hogy a családommal beszélt nyelv nagyon hasonlít egy finn ismerősük által beszéltre.).

Szóval a nyelvészek azért annyira nincsenek odáig a szavak hasonlítgatásáért. Mégis a most ismertetendő cikkben pontosan ez történik. A nyelvész szerző fogott egy adatbázist, amiben igen sok nyelv (4400 nyelv van benne a ma létező körülbelül 6000-ből) 40 szava szerepel pontos fonetikus lejegyzéssel. Na ehhez viszont kellenek a nyelvészek, mert aki angolul vagy franciául tanult az tudja, hogy az írásnak és a kiejtett szavaknak nem nagyon vagy egymáshoz közük. Ebben az adatbázisban tehát az van ahogy a szavakat kiejtik.

S itt jön be a rendszertan eszköztára. Vannak karakterláncaink (szavak), amelyek között hasonlóságot kell megállapítani, majd ebből egy "törzsfát" készíteni. Erre a biológiában bevett bioinformatikai eszközök állnak rendelkezésre. Természetesen azokat a GCTU betűkből álló hosszú "szavak" hasonlóságának elemzésére fejlesztették ki, de most alkalmazzuk őket az emberi nyelv szavaira.
A csodálatos ebben az, hogy lényegében visszakapták azokat a nyelvcsaládokat, sőt nagyobb nyelv szupercsaládokat, amelyeket a nyelvészek hosszas elemzéssel megállapítottak a nyelvtan és a hangváltozások szabályai alapján. Az ilyen nyelvészeti vizsgálódás azonban csak körülbelül 10.000 évre visszamenőleg tud leszármazási vonalakat megállapítani. Az emberi nyelvek ennél régebbi elválásokkal is rendelkeznek. A mostani elemzés ebben segíthet.
Nyelvcsaládok rendszere. Csak Európában és Ázsiában beszélt nyelvekre korlátozták az elemzést, az Afrikai, Afrikai-Ázsiai és az amerikai nyelveket (pl. eszkimó) kihagyták. Mi az uráli nyelvek közé tartozunk.
Az ismert nagy nyelvcsaládokat teljesen visszaadja ez a fa (ezeket a belső elágazásokat nem mutatja az ábra). Érdekes ugye a nyelvcsaládok egymáshoz való viszonya. Vegyük a saját uráli nyelvcsaládunkat (ennek egy alhalmaza a finn-ugor nyelvcsalád)! Legközelebbi rokonunk a nivkh nyelv (nyelvcsalád). Ezt a nyelvet külső mandzsúriában Oroszország távol-keleti részén beszéli talán 4000 ember. Hmm. A Yugakhir nyelvet szintén valahol Szibéria keleti részén beszélik, mára alig 600-an. Erről a nyelvről korábban is felvetődött, hogy rokona az urálinak. Az Indo-Európai (ugye ide tartozik lényegében a többi európai nyelv) és a Chukotko-Kamchatkai közel kerültek egymáshoz. Ez utóbbi Szibéria legészak-keletibb csücskében beszélt olyan 2-5 nyelv összefoglaló neve. Összesen 2500 beszélőjük lehet. A nyelvészek az urálit is összeháziasították már a szibériai nyelvekkel. De ezekhez még mindig túl közel áll az Indo-Európai. A felső pirossal jelöl csoport viszont lényegében megegyezik az Eurázsiai nagy nyelvcsaláddal (amibe még az altáji nyelvek tartoznak a török-, mongol- és tunguszi nyelvcsaládokkal), amelynek létezéséről azért van még némi vita. Ez az elemzés némi alátámasztást ad neki.

Az elemzés a szerző által is bevallottan még nyers. A távolságmátrix számolásánál figyelembe vettek bizonyos nyelvészeti ismereteket, de a bioinformatika a változásra nézve is alkalmaz ismereteket a biológiai mutációról alkotott ismereteink alapján. Hasonlóan a hangtani változások szabályai segíthetnek tovább finomítani a módszert. De a módszer még így is meglepően jól egybecsengő eredményt adott a más - nyelvészeti - módszerekkel alkotott fákkal.

Úgy érzem a nyelvészek nekiállhatnak rendszertant/bioinformatikát tanulni. Vagy mi nyelvészetet, hogy segítsük őket.

Hivatkozott irodalom

Jäger, G. 2015. Support for linguistic macrofamilies from weighted sequence alignment. Proceedings of the National Academy of Sciences 112(41): 12752-12757