A következő címkéjű bejegyzések mutatása: bioinformatika. Összes bejegyzés megjelenítése
A következő címkéjű bejegyzések mutatása: bioinformatika. Összes bejegyzés megjelenítése

2017. március 17., péntek

Mezőgazdaságot családok hozták, a sztyeppéről férfiak törtek be Európába

Európa benépesítése több hullámban történt. Az első hullámmal vadászó-gyűjtögető emberek érkeztek ide éztízezrekkel ezelőtt. A mezőgazdaság kifejlődésével (9000 évvel ezelőtt) a Közel-Kelet felől elindult egy újabb migrációs hullám, amely jelentősen átírta Közép-Európa genetikai térképét. Végül úgy 5000 éve a sztyeppékről jött egy újabb emberhullám. Sokan az indo-germán törzsek európai megjelenését teszik erre az időpontra.


Felmerül a kérdés, hogy főleg férfiak jöttek ezekkel a vándorlási hullámokkal, vagy nők is. A kérdés megválaszolásához egyrészt sok régi DNS-re van szükség, másrészt elég komoly populációgenetikai számolásra. Itt az alapok megtanításához is több táblányi - amúgy egyszerű - képletet kell levezetni, s általában nem kedvelik a hallgatók. Pedig az utóbbi évek izgalmas eredményeihez ezekre is szükség van, csakúgy, mint az egyre jobban fejlődő DNS szekvenálási technikákhoz.


A kérdés boncolgatásához az X kromoszómákat és autoszómákat (nemet meg nem határozó kromoszómák) hasonlítottak össze populációk között. Az elgondolás a következő: a X kromoszómát főleg az anyák adják tovább. Egy fiúnak bizonyosan, hiszen ők az apjuktól Y-t kapnak. A lányok mindkét szülőjüktől kapnak X-et. Autoszómákat viszont mindig mindkét szülőtől kapnak az emberek. Amennyiben nagyjából egyenlően jönnek egy helyre férfiak és nők, úgy egy másik populációhoz képest mind az X, mind az autoszómák összetételében hasonló változást várunk (nem mutációkról beszélünk, hanem egyes variánsok gyakoriságának a megváltozásáról). Viszont, ha mondjuk zömében férfiak jönnek az adott helyre, akkor az X kromoszóma inkább a helyiekét tükrözi, s kevésbé változik populációs átlagban, míg az autoszómák jelentősebben keverednek.


Bár korábban a mezőgazdaság megjelenését követő bevándorlással kapcsolatban is felmerült, hogy főleg férfiak hozták be az új technológiát, ez a tanulmány az ellenkezőjét állítja: 1:1 arányban jöttek férfiak és nők. Azaz teljes családok, népek vándoroltak új helyre.


A sztyeppei nomádok beáramlásakor viszont inkább férfiak jöttek, s terjedtek el új Y kromoszómás haplotípusok (R1a és R1b).


Az genetikai adatok ÉS a populációgenetikai számolások egyre többet segítenek az ember korai történelmének feltárásában. Hangsúlyozom ez utóbbit. A bonyolult gépek mindig jobban megfogják az ember fantáziáját, s ezért érezzük azt inkább tudománynak. De a molekuláris biológia csak nyers adatokat szolgáltat. A száraznak tűnő számolások nélkül az adatokból sohasem lesz megértés, új ismeret.

Hivatkozott irodalom

Goldberg, A., Günther, T., Rosenberg, N. A., Jakobsson, M. 2017. Ancient X chromosomes reveal contrasting sex bias in Neolithic and Bronze Age Eurasian migrations. Proceedings of the National Academy of Sciences 114(10): 2657-2662.

2016. február 10., szerda

A fehérjék a kései mitokondrium mellett érvelnek

Bár egyesek szerint a fehérjeszintézis eredete az a témakör, amibe a kutatók beleőrülnek, ha egyszer belekezdenek, az eukarióták eredete sem éppen egy egyszerű kérdés. Erről már írtam korábban. Egy újabb cikk okán újból írok a témáról. A szépsége a kérdéskörnek, hogy akár pár hét elteltével megjelenhetnek olyan tanulmányok, amelyek egymásnak homlokegyenesen ellentmondanak. Nem csodálom, hogy a hallgatóknak annyira nem tetszett az elméleteket felsorakoztató előadás (pedig értékelhették volna, hogy mennyi érdekes nyitott kérdés vár még rájuk).


Röviden arról van szó, hogy sok fehérje összehasonlításával azt tapasztalják, hogy a mitokondrium ősének tekintett alfa-proteobaktérium eredetű fehérjék lényegesen később váltak el a bakteriális génektől, mint a DNS másolással és fehérje transzlációval kapcsolatos és archaeák génjeivel rokoníthatók.


Hasonlítsunk össze sok fehérje leszármazási-vonalat.


Vegyünk egy nagy adag teljesen megszekvenált élőlényt (http://eggnog.embl.de). Jelen esetben 3.686 ilyen genomot. Ebből 3318 baktérium, 130 archaea és 238 eukarióta. Ez jól jellemzi, hogy baktériumból sokkal többnek ismerjük a teljes genomját, mint archaeának (nehéz őket tenyészteni) vagy eukariótának (a jelentősen hosszabb genomot nehezebb szekvenálni). Ezekből vegyünk ki úgy, hogy lefedjük az élők rendszerének minél nagyobb részét. Végül 37 eukarióta és 692 prokarióta maradt a vizsgálatra.


Ezen fajok összes fehérjéjét összevetették és megnézték milyen leszármazási vonalba rendeződnek (egy leszármazási vonalba olyan fehérjék tartoznak, amelyeknek volt közös ősük, génduplikáció nélkül). Ezekből az érdekel, amelyek lehetőleg minden Eukariótában megvannak. Ilyenből viszonylag kevés volt, így végül elégségesnek vették, ha az Excavata, Archaeplastida, SAR+Hacrobia és Podiates kládakból legalább 3-ban benne van (és ez utóbbiban benne vannak). Ez azért egy jó közelítés, hogy mi lehet univerzálisan jelen az eukariótákban, s így az utolsó eukarióta közös ősben (LECA = Last Eukarypotic Common Ancestor).


Származás, működés és sejten belüli elhelyezkedés


A fehérje családokat működésük és sejten belül elhelyezkedésük szerint is csoportosították, továbbá kiszámolták, hogy milyen közel vannak a nem-Eukarióta hasonló fehérjékhez. Minél hasonlóbb egy fehérjecsalád a prokarióták hasonló fehérjéihez, annál később váltak el egymástól.


Így négy nagy csoportot különítettek el.
(1) Legkésőbb levált csoport (452 fehérje). Főleg alfa-proteobaktérium vagy közelebbről nem meghatározott bakteriális, kisebb mértékben delta-proteobaktérium, illetve PVC baktérium eredetű gének, amelyek a mitokondriumban működnek. Funkciójukra nézve főleg az energiatermelésben vesznek részt (ugye ez mitokondrium feladata), illetve az aminosav bioszintézisben és transzportban, valamint a koenzimek előállításában és szállításában.
(2) Prokariótákhoz nem csatolható csoport (284 tag), amelynek tagjai jellemzően a szénhidrátanyagcserében vesznek részt és a belső membránrendszerben helyezkednek el. Úgy is mondhatjuk, hogy eukarióta specifikus fehérjék.
(3) Replikáció, transzkripció és transzláció fehérjéi (234) amelyek zömében a sejtmagban helyezkednek el és archeákkal rokoníthatók. Kivéve azt a párat, ami Actinobacteria szerű. Ez utóbbi érdekes, mert a Neomura hipotézisnek ad némi alátámasztást, annak ellenére, hogy egyes nevesebb eukarióta eredet kutató nem hisz benne (és nem neves kutatók, mint én sem, de lehet, hogy nincs igazam).
(4) A legősibb csoport (94 gén) a transzlációval és a riboszómával kapcsolatos, archeákkal rokonítható és a sejt mindenféle részén van belőlük. A mára klasszikusnak nevezhető, az élőket baktériumokra és egymáshoz közel álló Archaeákra és Eukariótákra osztó rendszertannak ez az alapja.


A mitokondriumot egy összetett, eukarióta szerű élőlény háziasította


A mitokondrium nem rég vált el az alfa-proteobaktériumoktól. A nem rég persze relatív (most kb. 1 milliárd évre rakják az eukarióták kialakulását), de kevésbé régen, mint ahogy más eukarióta újítás, mint maga a sejtmag, megjelenhetett. Bár az enzimek a sejtmagról keveset mondanak (ne feledjük, hogy a legtöbb eukarióta enzimnek nincs ortológja a prokarióták között, s ezért ez az elemzés nem végezhető el), de a membránhoz kapcsolódó funkciók arra engednek következtetni, hogy belső membránrendszere volt a mitokondrium ősét bekebelező élőlénynek.


Tisztább lett valamelyest a kép? Nem igazán. A gének szintjén az egyik elemi probléma az eukariótákkal, hogy egy adag génjük bacik génjeire hasonlít, egy kis adag archaea génekre hasonlít, s a legtöbb máshol nem található meg. Mindezt bonyolítja, hogy nem minden baktérium eredetű gén vezethető vissza a mitokondriumra, s ahhoz sok van, hogy mindet a horizontális géntranszfer számlájára írjuk. Továbbá ott a kényelmetlen tény, hogy a DNS másolás, fehérje szintézis és hasonló nagyon fontos funkciók génjei az archaeákra hasonlítanak. De az archaeák amúgy nagyon nem hasonlítanak az eukariótákra, a bacik sem nagyon, de az archaeák még annyira sem. A sejttan és a genetika itt nagyon mást mutat.


Mit gondolok én? Szerintem valahogy kialakult egy komplex belső membránnal rendelkező élőlény, talán még sejtmagja is volt. Ez vagy egy baktériumból alakult ki, vagy a baktériumokat megelőző élőlények egy csoportjából. Ez a lény aztán, sokkal később bekebelezett egy alfa-proteobaktériumot, s így születtek a ma ismert eukarióták. S mi van az archaeákkal? Szerintem ők egy végtelenül leegyszerűsödött oldalága ennek a komplex élőlénynek. Azaz inkább úgy kell rájuk tekinteni, hogy az eukariótáktól (az ősüktől) származnak, s nem fordítva.


Hivatkozott irodalom

2015. október 14., szerda

A nyelvek rendszertana

Megszakítom rendszertani sorozatomat, mert ma megjelent egy cikk, ami egyrészt érdekes (mi másért kerülne ide), másrészt köze van a rendszertanhoz, harmadrészt köze van a biológiához is. Szeretem azokat a témákat, amelyek megmutatják, hogy egyes tudományterületek egymásnak is segíthetnek, s a tudományterületeknek nem szabad a saját külön kis erődjeikbe elbújniuk. Ezekkel az átfedésekkel, egymásra gyakorolt jótékony hatással foglalkozom az integratív biológia kurzusomban is.

Szóval nyelvészkedés. Ahhoz úgyis mindenki ért, legalábbis igen gyakran szeretnek emberek rokonítani nyelveket a szavak alapján. Amúgy ezt a törekvést teljességgel megértem. Aki egy kicsit is tud valamilyen Indo-Európai nyelven, lehetőleg vagy a latin vagy a germán nyelvcsaládban, az nagyon gyorsan megtalálhatja a hasonlóságokat ezen nyelvek között egyszerűen a szavakra nézve. Persze ezek a nyelvek nem váltak régen el egymástól, s így kevés szükség van bevetni a nyelvészet minden eszközét, hogy hasonlóságaikat meglássuk. Saját nyelvünk a legközelebbi ma is létező rokonaitól (s most fogadjuk el a finn-ugor nyelvi rokonságok) is több ezer éve elvált. Nem csoda, hogy a hasonlóság észrevehetetlen (bár messziről a finn hangzása abban nagyon hasonló a magyarhoz, hogy a hangsúly mindig az első szótagon van. Találkoztam már olyan amerikaival, aki ezért finnek nézett, mondván, hogy a családommal beszélt nyelv nagyon hasonlít egy finn ismerősük által beszéltre.).

Szóval a nyelvészek azért annyira nincsenek odáig a szavak hasonlítgatásáért. Mégis a most ismertetendő cikkben pontosan ez történik. A nyelvész szerző fogott egy adatbázist, amiben igen sok nyelv (4400 nyelv van benne a ma létező körülbelül 6000-ből) 40 szava szerepel pontos fonetikus lejegyzéssel. Na ehhez viszont kellenek a nyelvészek, mert aki angolul vagy franciául tanult az tudja, hogy az írásnak és a kiejtett szavaknak nem nagyon vagy egymáshoz közük. Ebben az adatbázisban tehát az van ahogy a szavakat kiejtik.

S itt jön be a rendszertan eszköztára. Vannak karakterláncaink (szavak), amelyek között hasonlóságot kell megállapítani, majd ebből egy "törzsfát" készíteni. Erre a biológiában bevett bioinformatikai eszközök állnak rendelkezésre. Természetesen azokat a GCTU betűkből álló hosszú "szavak" hasonlóságának elemzésére fejlesztették ki, de most alkalmazzuk őket az emberi nyelv szavaira.
A csodálatos ebben az, hogy lényegében visszakapták azokat a nyelvcsaládokat, sőt nagyobb nyelv szupercsaládokat, amelyeket a nyelvészek hosszas elemzéssel megállapítottak a nyelvtan és a hangváltozások szabályai alapján. Az ilyen nyelvészeti vizsgálódás azonban csak körülbelül 10.000 évre visszamenőleg tud leszármazási vonalakat megállapítani. Az emberi nyelvek ennél régebbi elválásokkal is rendelkeznek. A mostani elemzés ebben segíthet.
Nyelvcsaládok rendszere. Csak Európában és Ázsiában beszélt nyelvekre korlátozták az elemzést, az Afrikai, Afrikai-Ázsiai és az amerikai nyelveket (pl. eszkimó) kihagyták. Mi az uráli nyelvek közé tartozunk.
Az ismert nagy nyelvcsaládokat teljesen visszaadja ez a fa (ezeket a belső elágazásokat nem mutatja az ábra). Érdekes ugye a nyelvcsaládok egymáshoz való viszonya. Vegyük a saját uráli nyelvcsaládunkat (ennek egy alhalmaza a finn-ugor nyelvcsalád)! Legközelebbi rokonunk a nivkh nyelv (nyelvcsalád). Ezt a nyelvet külső mandzsúriában Oroszország távol-keleti részén beszéli talán 4000 ember. Hmm. A Yugakhir nyelvet szintén valahol Szibéria keleti részén beszélik, mára alig 600-an. Erről a nyelvről korábban is felvetődött, hogy rokona az urálinak. Az Indo-Európai (ugye ide tartozik lényegében a többi európai nyelv) és a Chukotko-Kamchatkai közel kerültek egymáshoz. Ez utóbbi Szibéria legészak-keletibb csücskében beszélt olyan 2-5 nyelv összefoglaló neve. Összesen 2500 beszélőjük lehet. A nyelvészek az urálit is összeháziasították már a szibériai nyelvekkel. De ezekhez még mindig túl közel áll az Indo-Európai. A felső pirossal jelöl csoport viszont lényegében megegyezik az Eurázsiai nagy nyelvcsaláddal (amibe még az altáji nyelvek tartoznak a török-, mongol- és tunguszi nyelvcsaládokkal), amelynek létezéséről azért van még némi vita. Ez az elemzés némi alátámasztást ad neki.

Az elemzés a szerző által is bevallottan még nyers. A távolságmátrix számolásánál figyelembe vettek bizonyos nyelvészeti ismereteket, de a bioinformatika a változásra nézve is alkalmaz ismereteket a biológiai mutációról alkotott ismereteink alapján. Hasonlóan a hangtani változások szabályai segíthetnek tovább finomítani a módszert. De a módszer még így is meglepően jól egybecsengő eredményt adott a más - nyelvészeti - módszerekkel alkotott fákkal.

Úgy érzem a nyelvészek nekiállhatnak rendszertant/bioinformatikát tanulni. Vagy mi nyelvészetet, hogy segítsük őket.

Hivatkozott irodalom

Jäger, G. 2015. Support for linguistic macrofamilies from weighted sequence alignment. Proceedings of the National Academy of Sciences 112(41): 12752-12757