Information

Was sind Haplogruppen?

Was sind Haplogruppen?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Was genau bedeutet der Begriff Haplogruppe oder Haplotyp?

Wie wird behauptet, dass Menschen, die derselben Haplogruppe angehören, gemeinsame Vorfahren haben?


Unter Haplogruppe verstehe ich die Gruppe von Menschen, die den gleichen gegebenen Haplotyp für eine Region des Genoms teilen. Ein Haplotyp ist das Auslesen der DNA-Sequenz für einen Teil des Genoms in einer der beiden Kopien, die diploide Organismen haben. Wenn Sie beginnen, die DNA-Sequenz für einen bestimmten Punkt im Genom aus einer Ihrer Kopien und den Kopien einer anderen Person zu lesen, wird sie bis zu einem Punkt übereinstimmen, an dem sich eine Änderung ergibt. Es ist wahrscheinlicher, längere identische Haplotypen zu haben, wenn die beiden verglichenen Personen verwandt sind. Je eng die Beziehung ist, desto länger sind ihre Haplotypen identisch. Was die Haplotyp-Identität bricht, sind Rekombinationsereignisse, die in der Keimlinie der vorherigen Generation auftreten, und Mutationen, die im Laufe der Zeit sowohl in der Keimlinie als auch im Soma (dem Rest Ihres Körpers) auftreten.


Menschliche Haplogruppe

EIN menschliche Haplogruppe ist eine Gruppe von Merkmalen, die in der Humangenetik untersucht wurden und zunehmend für die Genealogie nützlich sind.

Der Begriff "Haplogruppe" umfasst die gesamte Biologie, aber in diesem Wiki (und in gewissem Umfang in Wikipedia, wie dem Großteil des Wikipedia: Haplogruppe-Artikels) wird er im Allgemeinen verwendet, um "menschliche Haplogruppe" zu bedeuten.

Die folgende Tabelle muss aktualisiert werden (Stand Mai 2010). Sie kann mit ihrer Einführung am besten in eine andere Seite wie Human Y-Chromosom DNA Haplogroup integriert werden, aber wenn sie effektiv aktualisiert werden kann, kann es sich lohnen, sie als Schnell- Referenzseite mit einem Y-DNA-spezifischen Titel, z. B. Tabelle der Y-DNA-Haplogruppen. Die Aktualisierung sollte wahrscheinlich durch einen sorgfältigen Vergleich mit relevanten Wikipedia-Artikeln und der ISOGG-Website erfolgen.

Das Folgende basiert auf Informationen, die auf der [1] Website sowie auf Wikipedia-Artikeln gefunden wurden, einschließlich der Seite, die wir jetzt in die Human Y-Chromosom DNA Haplogroup kopiert haben. Es bietet eine kurze Zusammenfassung der wichtigsten Haplogruppen der männlichen Linie, wie sie im Jahr 2007 verstanden wurden. Basierend auf der Präsentation von Genetree wurden einige Änderungen vorgenommen, um die Informationen systematischer zu präsentieren

a) Entstehungszeit, b) Entstehungsort und c) Zentrum des modernen Vorkommens.


Was sind Haplogruppen? - Biologie

Viele 23andMe-Kunden, die sich an den Kundendienst wenden, sind verwirrt über ihre Haplogruppen-Zuweisungen und deren Bedeutung.

Aber wenn Sie Ihre Haplogruppe kennen und wissen, wie Sie sie verwenden können, können Sie viel mehr Klarheit über Ihre eigene Abstammung gewinnen. Um Ihnen zu helfen, werden wir ein Beispiel für eine mütterliche und väterliche Haplogruppenzuweisung durchgehen und erklären, wie Sie durch die Kenntnis Ihrer Haplogruppen in den menschlichen Stammbaum aufgenommen und mit Ihrer Vorfahren verbunden werden können.

In diesem Fall verwenden wir einen Asiaten mit Wurzeln in Südostasien. Aber seine mütterliche Haplogruppe – B4’5 und genauer die Untergruppe B5a1a – wird am häufigsten bei den amerikanischen Ureinwohnern des Südwestens der USA und Nordmexikos gefunden.

Migration

Was verbindet ihn mit Indianern?

Hier ist es hilfreich, ein wenig über Haplogruppen zu verstehen, um Sie und Ihre Vorfahren in den breiteren Kontext der Menschheitsgeschichte einzuordnen. Jede Haplogruppe beschreibt einzelne Zweige – oder eng verwandte Gruppen von Zweigen – im genetischen Stammbaum aller Menschen. Alle Mitglieder einer Haplogruppe führen ihre Abstammung auf ein einzelnes Individuum zurück. In diesem Fall teilt das Individuum seine mütterliche Haplogruppe mit vielen amerikanischen Ureinwohnern, weil vor 12.000 Jahren Menschen von Asien nach Alaska wanderten, als der Meeresspiegel niedriger war.

Oder eine andere Sichtweise ist, dass Nachkommen seines alten Vorfahren mütterlicherseits – ein gemeinsamer Vorfahre, den er mit vielen amerikanischen Ureinwohnern teilt – die Bering Land Bridge überquert hatten, um Amerika zu bevölkern. Wenn man sich seine Ergebnisse genauer ansieht, ist seine mütterliche Haplogruppe eine Untergruppe von B4’5, insbesondere B5a1a. Es hat seine eigene Geschichte, wo es in Südostasien von B4’5 abbrach.

Die jüngsten Migrationsmuster haben die globale Verteilung dieser Haplogruppe verändert, aber diese alte Geschichte ist in seiner DNA geschrieben und die Fähigkeit, diese zu lesen und seine mütterliche Haplogruppe zu identifizieren, verbindet ihn mit dieser Geschichte. Die Fähigkeit, die mütterliche Haplogruppe einer Person so weit zurückzuverfolgen – mehr als 50.000 Jahre im Fall von B4'5 – hat damit zu tun, wie sie von unserer Mutter und ihrer Mutter und der Mutter ihrer Mutter an jeden von uns weitergegeben wird , und so weiter in der Zeit zurück.

Mütterliche Haplogruppen

Maternale Haplogruppen werden durch die Definition von Varianten in Ihrer mitochondrialen DNA bestimmt. Jeder erbt seine Mitochondrien von seiner Mutter. Im Gegensatz zu Ihren anderen DNA-Stücken ist Ihre mitochondriale DNA die einzige Art von DNA, die außerhalb des Zellkerns gefunden wird. Aus diesem Grund rekombiniert Ihre mitochondriale DNA nicht mit anderen DNA-Typen. Da Ihre Mitochondrien direkt von Ihrer Mutter geerbt werden und nur sehr wenig Rekombination erfahren, teilen Sie dieselbe mütterliche Haplogruppe mit jedem Verwandten, mit dem Sie eine direkte mütterliche Linie teilen. Zum Beispiel würden Sie, Ihre Mutter, Ihr Bruder, Ihre Schwester, Ihre Tante mütterlicherseits, Ihre Großmutter mütterlicherseits usw. alle dieselbe mütterliche Haplogruppe wie Sie teilen. Und diese mütterliche Haplogruppe geht über die Generationen bis zu einer einzigen Mutation an einem bestimmten Ort und zu einer bestimmten Zeit zurück.

In dem Fall, den wir betrachten, ist seine mütterliche Haplogruppe eine, die von vielen Menschen geteilt wird, nicht nur mit Han-Chinesen, sondern auch mit vielen Polynesiern, Indianern und Südostasiaten.

Väterliche Haplogruppen

Nachdem wir uns nun die mütterlichen Haplogruppen angeschaut haben, können wir uns nun den väterlichen Haplogruppenzuweisungen zuwenden. In diesem Fall lautet die väterliche Haplogruppenzuordnung der Person O3a3c1*.

Es geht auf Ostasien zurück und ist auch unter Han-Chinesen, Koreanern, Filipinos und Malaysiern verbreitet. Die Zuordnung der väterlichen Haplogruppe wird durch die Definition von Varianten in Ihrem Y-Chromosom bestimmt. Das Y-Chromosom ist das geschlechtsbestimmende Chromosom des Mannes, das Männer von ihren Vätern erben. Daher haben Sie keine väterliche Haplogruppenzuordnung, es sei denn, Sie haben ein Y-Chromosom von Ihrem Vater geerbt. (Hier erfahren Sie mehr darüber.) Aus diesem Grund sehen Frauen, dass diese Seite für sie in ihrem 23andMe-Konto nicht verfügbar ist, aber gleich erklären wir, wie Frauen ihre väterliche Haplogruppe bestimmen können.

Zunächst ist es hilfreich, ein wenig mehr über das Y-Chromosom zu verstehen. Das Y-Chromosom durchläuft eine Rekombination mit dem X-Chromosom, jedoch nur an den Enden. So bleiben etwa 95 Prozent des Y-Chromosoms über Generationen hinweg relativ intakt. Aus diesem Grund ist das Y-Chromosom ein Spiegelbild Ihrer alten väterlichen Vorfahren. Sie würden sich daher eine väterliche Haplogruppenzuweisung mit jedem männlichen Verwandten teilen, mit dem Sie eine direkte väterliche Linie teilen.

Eine Frau kann auf ihre väterliche Haplogruppe schließen, wenn ein männlicher Verwandter ihrer väterlichen Linie von 23andMe genotypisiert wurde. Da sich sowohl das Y-Chromosom als auch die mitochondriale DNA über Generationen hinweg so wenig ändern, sind sie sehr aufschlussreich über Ihre alte Vorfahren. Das heißt aber nicht, dass sie sich überhaupt nicht ändern. Tatsächlich entspricht jeder Buchstabe und jede Zahl, die Sie in Ihrer Haplogruppe sehen, einer Reihe von definierenden Mutationen in Ihrer mitochondrialen DNA oder Ihrem Y-Chromosom. Dies markiert einen Zeitraum, in dem sich Ihre Haplogruppe in eine eindeutige Linie verzweigt hat. So kann es beispielsweise kennzeichnen, wann eine Bevölkerung zum ersten Mal aus Afrika abwanderte oder eine andere Gruppe geografisch isoliert wurde.

Zuweisen von Haplogruppen

23andMe ist in der Lage, Ihre Vorfahren basierend auf diesen Mutationen zu verfolgen, da sie in bestimmten Zeiträumen an verschiedenen geografischen Orten aufgetreten sind. Haplogruppenzuordnungen können sogar auf bestimmte Sprachen zurückgeführt werden. Dieser DNA-Beweis wird oft durch den Fossilienbestand bestätigt. Unsere ältesten Fossilien sind 200.000 Jahre alt und wurden in Omo Kibish in Äthiopien gefunden. Nach genetischen und paläontologischen Aufzeichnungen begann Homo sapiens erst vor 60.000-70.000 Jahren aus Afrika auszuwandern und in den eurasischen Kontinent zu wandern.

Einige dieser Migranten zogen entlang der indischen Küste und erreichten vor etwa 50.000 Jahren zuerst Südostasien und dann Australien. Seitdem haben verschiedene Wanderungsereignisse unsere Spezies auf verschiedenen Routen und Pfaden über die Kontinente verbreitet. Wir sind in der Lage, Migrationsmuster anhand von Mutationen in der mitochondrialen DNA und der Y-Chromosom-DNA zu verfolgen.

Im Fall des Individuums, das wir in diesem Beitrag betrachten, gehörten alte Vorfahren, die Teil seiner mütterlichen Haplogruppe waren, zu einer Gruppe von Individuen, die sich in Südostasien aufhielten und einige dieser Individuen wanderten schließlich über die Bering-Landbrücke nach Amerika bevölkern. Einige blieben in Ostasien und entwickelten einige neue definierende Mutationen in ihrer mitochondrialen DNA, die sie zu B5a1a machten. Es ist wichtig zu bedenken, dass Ihre mitochondriale DNA und Ihr Y-Chromosom einen sehr kleinen Teil Ihrer DNA und einen kleinen Teil Ihrer gesamten Abstammung ausmachen.

Da die meisten Haplogruppen vor über Zehntausenden von Jahren entstanden sind, spiegeln diese DNA-Stücke im Allgemeinen Ihre sehr alte Vorfahren wider. Daher ist es möglich, dass zwei Personen die gleiche Haplogruppenzuweisung teilen, aber keine neuere Abstammung haben. Während Sie beispielsweise eine väterliche Haplogruppe mit Stephen Colbert teilen, haben Sie wahrscheinlich keine gemeinsamen Vorfahren.

Ein großer Teil unserer DNA befindet sich in Ihrer autosomalen DNA. Diese DNA durchläuft eine Rekombination mit jeder nachfolgenden Generation. Ihre Ergebnisse bei der Analyse Ihrer autosomalen DNA spiegeln daher im Allgemeinen Ihre Abstammung innerhalb der letzten fünf bis zehn Generationen wider. Daher ist es nicht ungewöhnlich, dass die Vorfahren in Ihrer Haplogruppe oder Ihrer Vorfahrenzusammensetzung von Ihren eigenen abweichen. Dies bedeutet nicht, dass eines dieser Teile falsch ist. Sie beschreiben jeweils einfach einen anderen Teil Ihrer reichen und einzigartigen Vorfahren.


Santos Alonso, Carlos Flores, Vicente Cabrera, Antonio Alonso, Pablo Martín, Cristina Albarrán, Neskuts Izagirre, Concepción de la Rúa und Oscar García. "Der Platz der Basken in der europäischen Landschaft der Y-Chromosomen-Diversität." Europäische Zeitschrift für Humangenetik 13:12 (2005): Seiten 1293–1302.
Die Y-Chromosomen von 68 männlichen Basken wurden analysiert. Etwa 86 Prozent von ihnen trugen Sorten der Haplogruppe R1*(xR1a,R1b3f)-M173, von denen die meisten R1b3*-M269 trugen. Dies ist eine Gemeinsamkeit zwischen Basken und anderen Westeuropäern. 7,1 Prozent der Basken in dieser Studie (eine geringere Häufigkeit als andere Wissenschaftler festgestellt hatten) trugen die iberischen Unterklassen R1b3d-M153 und R1b3f-SRY2627, wobei letztere 2,4 Prozent der Stichprobe ausmachten. 1,2 Prozent der baskischen Männchen tragen Haplogruppen nordwestafrikanischen Ursprungs, nämlich E3*-P2 und E3b2-M81.

Ana M. González, Oscar García, José M. Larruga und Vicente M. Cabrera. "Die mitochondriale Linie U8a zeigt eine paläolithische Siedlung im Baskenland." BMC Genomics 7:1 (23. Mai 2006): 124.
Die mtDNA-Haplogruppe U8a ist in Europa selten und alt, und Basken haben die ältesten Unterklassen davon.

Doron M. Behar, C. Harmant, J. Manry, Mannis van Oven, W. Haak, B. Martínez-Cruz, J. Salaberria, B. Oyharçabal, F. Bauduer, David Comas, Lluís Quintana-Murci, and the Genographic Konsortium. "Das baskische Paradigma: genetische Beweise für eine mütterliche Kontinuität in der französisch-kantabrischen Region seit vorneolithischer Zeit." Amerikanisches Journal für Humangenetik 90:3 (9. März 2012): Seiten 486-493. Erstmals online veröffentlicht am 23. Februar 2012. Ein Erratum wurde in der Ausgabe vom 4. Mai 2012 (90:5) auf Seite 936 veröffentlicht.
Die Forscher untersuchten die mtDNA-Linien von "908 baskischen und nicht-baskischen Individuen aus dem Baskenland und den unmittelbar angrenzenden Regionen", wobei den Zweigen der Haplogruppe H besondere Aufmerksamkeit geschenkt wurde. Auszüge aus dem Abstract:

4.000 Jahre vor der Gegenwart (YBP) und schätzten ihre Trennung vom paneuropäischen Genpool auf

8.000 YBP, vor der indoeuropäischen Ankunft in der Region. Unsere Ergebnisse unterstützen eindeutig die Hypothese einer partiellen genetischen Kontinuität zeitgenössischer Basken mit den vorangegangenen paläolithischen/mesolithischen Siedlern ihres Heimatlandes.

Sergio Cardoso, Miguel A. Alfonso-Sánchez, Laura Valverde, Adrian Odriozola, Ana Maria Peacuterez-Miranda, José A. Pentildea und Marian M. de Pancorbo. "Das mütterliche Erbe der Basken im Norden von Navarra: Neue Einblicke in die mitochondriale DNA-Vielfalt des französisch-kantabrischen Raums." American Journal of Physical Anthropology 145:3 (Juli 2011): Seiten 480-488. Erstmals online veröffentlicht am 3. Mai 2011.
Sie testeten 110 Basken aus Navarra in Nordspanien, um ihre mitochondriale DNA-Vielfalt zu untersuchen. 11,8 Prozent dieser Basken trugen die mtDNA-Haplogruppe J1c, während 10,9 Prozent H3 trugen. Einige der Basken der Studie trugen die Haplogruppe H2a5 und sie gilt als autochthon für die Basken. 15,5 Prozent der Basken der Studie trugen die Haplogruppe U5b, mehr als Basken aus anderen Orten. Ein geringerer Anteil der Basken von Navarra trägt die Haplogruppen HV0 und H1 im Vergleich zu anderen nördlichen Iberern.

Óscar García, Santos Alonso, Nicole Huber, Martin Bodner und Walther Parson. "Forensisch relevante phylogeographische Bewertung der Mitogenomvariation im Baskenland." Forensic Science International: Genetics 46 (Mai 2020): Artikelnummer 102260. Erstmals online verfügbar am 6. Februar 2020.
Sie testeten die vollständigen mtDNA-Sequenzen von 178 Basken aus dem Baskenland in Nordspanien. X2b7 ist eine der vielen Haplogruppen, die sie unter diesen Basken gefunden haben. Sie fanden auch einige mtDNA-Linien, die sie "baskisch-spezifisch" nennen.

Chrystelle Richard, Erwan Pennarun, Toomas Kivisild, Kristiina Tambets, Helle-Viivi Tolk, Ene Metspalu, Maere Reidla, Sylviana Chevalier, Stéphanie Giraudet, Lovorka Barac-Lauc, Marijana Pericic, Pavao Rudan, Mire Dorille Claus, Claude I Muller, Richard Villems, Andreacute Chaventreacute und Jean-Paul Moisan. "Eine mtDNA-Perspektive der französischen genetischen Variation." Annalen der Humanbiologie 34:1 (Januar-Februar 2007): Seiten 68-79.
Diese mitochondriale DNA-Studie an 868 Personen aus 12 Gebieten Frankreichs umfasst Basken aus der baskischen Provinz Lapurdi in Frankreich. Diese französischen Basken wiesen im Vergleich zu spanischen Basken bemerkenswerte Unterschiede in der mtDNA-Verteilung auf.

Auszüge aus der Rubrik Ergebnisse:

"[. ] Der mtDNA-Pool der französischen Basken hat einige Gemeinsamkeiten mit dem der spanischen Basken, wie die hohe Häufigkeit der Haplogruppe H. Die französischen Basken weisen jedoch eine Reihe von unterschiedlichen Merkmalen auf, die sich vor allem in der Prävalenz von Haplogruppen ausdrücken verbunden mit der neolithischen Verbreitung in Europa. [. ]"

Auszüge aus dem Textkörper:

"[. ] Es ist etwas überraschend, Hg U4 mit einer relativ hohen Häufigkeit (6,2%) und Diversität unter den französischen Basken (abwesend in den spanischen Basken) zu finden, da diese Untergruppe von U größtenteils osteuropäisch und westsibirisch ist (Tambets et al. 2003) in seiner Verteilung. Im Gegensatz zu U4 ist Hg U5b2 bei den französischen Basken selten (2,5%) und häufiger bei den spanischen Basken. Eine weitere Besonderheit des französischen Basken findet sich bei Hg J, häufiger als in den spanischen Basken (siehe Tabelle I) sowie das Vorkommen des Hg J1c-Haplotyps mit HVS-I-Motiv 16069-16126-16300. Die Derivate dieses Zweigs von Hg J wurden bisher hauptsächlich in nahöstlichen Populationen gefunden (Richards et al., 2002 Metspalu et al europäischen Kontext (Richards et al. 2000) sind mehr folge unter den französischen Basken. [. ] Die französischen Basken zeigen eine repräsentative Häufigkeit von Hgs T1 und J, von denen vermutet wird, dass sie mit der Ankunft in Europa eingeführt wurden Abbildung 4. [. ] Auf der anderen Seite sind Haplogruppen wie U5 und HV0, die in spanischen Basken häufig vorkommen, in den französischen Basken nicht vorhanden oder selten, während die Verteilung für Hg U4 umgekehrt ist. Das im mtDNA-Pool der französischen Basken aus der Region Lapurdi beobachtete Muster kann durch genetische Drift und kulturelle Isolation in einer relativ kleinen langfristigen effektiven Populationsgröße erklärt werden. Darüber hinaus ist es auch wahrscheinlich, dass sowohl französische als auch spanische Basken, obwohl sie eine gemeinsame sprachliche und wahrscheinlich auch genetische Abstammung haben, von Vermischungen aus unterschiedlichen Quellen betroffen waren. Unterdessen spricht die insgesamt hohe Häufigkeit von autosomal-rezessiven Gerinnungsfaktoren-Defizienzen in der französischen Baskenpopulation (Bauduer et al. 2004) für eine genetische Drift, die auf diese Population einwirkt. [. ] Zusammengenommen stützen unsere Ergebnisse die Vorstellung, dass „Basken“ eine stark unterteilte Population sind, und stützen die Schlussfolgerung, dass französische und spanische Basken über einen ausreichend langen Zeitraum effektiv voneinander isoliert waren, um eine zufällige genetische Drift zu ermöglichen, um sie zu unterscheiden. "

Ildeigo Olalde, Swapan Mallick, Nick Patterson, Nadin Rohland, Vanessa Villalba-Mouco et al. "Die Genomgeschichte der Iberischen Halbinsel in den letzten 8000 Jahren." Wissenschaft 363:6432 (15. März 2019): Seiten 1230-1234.
Diese wichtige Studie mit Dutzenden von Co-Autoren vergleicht die autosomale DNA von Hunderten von alten Iberern mit modernen Iberern. Obwohl die Basken von männlichen Eroberern, die ungefähr 2000 v. und die mtDNA-Verteilung der Iberer wesentlich verändert und die Y-Chromosomenverteilung fast vollständig verändert haben, erhielten die Basken nicht die späteren Beimischungen von Nordafrikanern und östlichen Mittelmeerländern (Phönizier und sephardische Juden), die andere Iberer aufgrund einer genetischen kulturell und sprachlich) zwischen Basken und den anderen Iberern aufgeteilt, beginnend in der frühen Römerzeit (3.-1. Jahrhundert v. Chr.), die dem Ende der Eisenzeit folgte. Was die Basken mit anderen Iberern teilen, ist ein großer Anteil der Y-DNA-Haplogruppe R1b-M269. Auszüge aus dem Abstract:

Neskuts Izagirre und Concepción de la Rúa. "Eine mtDNA-Analyse in alten baskischen Populationen: Implikationen für Haplogruppe V als Marker für eine bedeutende paläolithische Expansion aus Südwesteuropa." Das American Journal of Human Genetics 65:1 (Juli 1999): Seiten 199-207.
Eine Studie, die antike und moderne spanische Basken aus verschiedenen Regionen des Baskenlandes vergleicht.

J. Bertranpetit, J. Sala, F. Calafell, Peter A. Underhill, P. Moral und David Comas. "Menschliche mitochondriale DNA-Variation und der Ursprung der Basken." Annalen der Humangenetik 59:1 (Januar 1995): Seiten 63-81.
Sie testeten 45 spanische Basken auf ihre mtDNA-Linien und fanden darunter 27 verschiedene mtDNA-Subclades.

B. Martínez-Crus, C. Harmant, DE Platt, W. Haak, J. Manry, E. Ramos-Luis, DF Soria-Hernanz, F. Bauduer, J. Salaberria, B. Oyharçabal, Lluís Quintana-Murci, David Comas und das Genographic Consortium. "Nachweis der vorrömischen Stammes-Genstruktur in Basken durch einseitig vererbte Marker." Molekularbiologie und Evolution 29:9 (2012): Seiten 2211–2222.
Etwa 900 baskische und nicht-baskische Personen wurden untersucht. Es wurde festgestellt, dass Basken anderen Südwesteuropäern ähnlich sind. Auszüge aus dem Abstract:

Torsten Günthera, Cristina Valdiosera, Helena Malmströma, Irene Ureña, Ricardo Rodriguez-Varela, Óddny Osk Sverrisdóttir, Evangelia A. Daskalaki, Pontus Skoglund, Thijessen Naidonacute, Jan Storå, Eneko Iriarte, Juan Luis Arsuaga, José-Miguel Carretero, Anders Götherstr¨m und Mattias Jakobsson. "Alte Genome verbinden frühe Bauern von Atapuerca in Spanien mit den heutigen Basken." Proceedings of the National Academy of Sciences of the United States of America (PNAS) 12:38 (22. September 2015): Seiten 11917-11922. Erstmals online veröffentlicht am 2. September 2015.
Diese Wissenschaftler verwendeten autosomale DNA-Analysen moderner und alter Proben, um zu dem Schluss zu kommen, dass die Basken von einer Kombination aus ausländischen neolithischen Bauern abstammen, die auf die Iberische Halbinsel zogen, und lokalen mesolithischen Jägern und Sammlern (WHG). In den letzten Jahrtausenden hatten die Basken jedoch keine zusätzlichen Vermischungen mit Außenseitern wie andere Iberer.

Laura R. Botigué, Brenna M. Henn, Simon Gravel, Brian K. Maples, Christopher R. Gignoux, Erik Corona, Gil Atzmon, Edward Burns, Harry Ostrer, Carlos Flores, Jaume Bertranpetit, David Comas und Carlos D. Bustamante. "Genfluss aus Nordafrika trägt zur unterschiedlichen genetischen Vielfalt des Menschen in Südeuropa bei." Proceedings of the National Academy of Sciences of the United States of America (PNAS) 110:29 (16. Juli 2013): Seiten 11791-11796.
Diese Studie analysierte autosomale DNA von „2.099 Individuen in 43 Populationen“ und stellte fest, dass Basken im Vergleich zu anderen ethnischen Gruppen Spaniens weniger nordafrikanische (Berber-bezogene) Beimischungen tragen.

F. Bauduer, J. Feingold und D. Lacombe. "Die Basken: Überprüfung der Populationsgenetik und Mendelschen Störungen." Menschliche Biologie 77:5 (Oktober 2005): Seiten 619–637.
Beinhaltet eine Diskussion der Y-DNA- und mtDNA-Linien der Basken und ihrer humanen Leukozyten-Antigen-(HLA)-Typen, basierend auf früheren Studien.

Ana Maria Päacuterez-Miranda, Miguel A. Alfonso-Säcutenchez, Joseacute A. Pentildea und R. Calderoacuten. "HLA-DQA1-Polymorphismus bei autochthonen Basken aus Navarra (Spanien): genetische Position im europäischen und mediterranen Bereich." Gewebeantigene 61:6 (Juni 2003): Seiten 465-474.
Diese Studie über humane Leukozyten-Antigen-(HLA)-Typen fand das DQA1*02-Allel unter einem hohen Anteil von Basken aus Guipúzcoa und Nord-Navarra. Die Forscher konnten keine HLA-Gemeinsamkeit zwischen Basken und Nordafrikanern bestätigen. Ihre Schlussfolgerung war, dass die Basken relativ genetisch von ihren nicht-baskischen Nachbarn isoliert waren, mit "geringem Beimischungsgrad".

S. Garcácutea-Obregóacuten, Miguel A. Alfonso-Sáacutenchez, Ana Maria Péacuterez-Miranda, Marian M. de Pancorbo und Joséacute A. Pentildea. "Polymorphe Alu-Insertionen und die genetische Struktur der iberischen Basken." Zeitschrift für Humangenetik 52:4 (2007): Seiten 317-327. Erstmals online veröffentlicht am 3. Februar 2007.

Neskuts Izagirre, Santos Alonso und Concepcióacuten de la Ruacutea. "DNA-Analyse und die Evolutionsgeschichte der baskischen Bevölkerung: Ein Rückblick." Zeitschrift für anthropologische Forschung 57:3 (Herbst 2001): Seiten 325–344.


Schlussfolgerungen

Zusammenfassend haben wir eine detaillierte Phylogenie der Haplogruppe Q erstellt und datiert, die neue Einblicke in die geografische Verteilung ihrer eurasischen und amerikanischen Zweige in modernen und alten Proben bietet.

Zum ersten Mal fanden wir zwei verschiedene Y-Chromosom-Linien, die die beiden wichtigsten „Vorfahren“-Komponenten (ANC-A, ANC-B) widerspiegeln, die zuvor durch neuere genomische Studien charakterisiert wurden [5, 38, 42]. Die Differenzierung dieser Linien erfolgte wahrscheinlich im Osten der Beringien vor ihrem Eintritt in Amerika auf zwei Routen: der Küstenroute (ANC-A, Q-Z780/Q-M848) und der Binnenroute (ANC-B, Q-Y4276). Einmal in Amerika eingedrungen, vermischten sich diese beiden Ahnenkomponenten wahrscheinlich sehr früh in Nordamerika, wie das alte Kerngenom von Kennewick, das zu ANC-A (Q-M848) gehört, nahelegt, aber eine ANC-B mtDNA-Haplogruppe (X2a) trägt.

Darüber hinaus haben wir zwei große Expansionen der ANC-A-Linien in Meso- und Südamerika verfolgt, eine um 15 kya, früh nach der ersten Bevölkerung, und eine andere um 3 kya, nach klimatischen Verbesserungen und lokalen kulturellen Übergängen.

Weitere Unterstützung für unsere Schlussfolgerungen und neuen Erkenntnisse könnte die Analyse von modernen und antiken Genomen der Ureinwohner sein, die den gesamten zeitlichen Rahmen der ersten amerikanischen Bevölkerung umfasst, einschließlich der derzeit unterrepräsentierten Regionen des Kontinents.


Diskussion

Obwohl bekannt ist, dass Mitochondrien eine entscheidende Rolle bei der Homöostase spielen, gibt es nur wenige mitochondriale Genom-weite Studien zur Bevölkerungsstratifizierung. Daher sollte unsere umfassende Studie zur mtDNA das genetische und biologische Wissen über Mitochondrien erweitern. Durch die genetische und phänotypische Analyse der mtDNA basierend auf den Varianten, die aus den groß angelegten WGS- und GWAS-Daten der japanischen Individuen gewonnen wurden, konnte unsere Studie erfolgreich die populationsspezifische mtDNA-Struktur und ihre pleiotropen Assoziationen mit den humanen komplexen Merkmalen aufklären.

Unsere Studie hebt die folgenden neuartigen Merkmale hervor. Zuerst konnten wir die hochauflösenden Spektren der Haplogruppen definieren, die von einem bis neun Buchstaben reichten. Die Häufigkeitsspektren der Haplogruppen waren für Japaner populationsspezifisch und innerhalb Japans sogar heterogen zwischen den geografischen Regionen. Dies sollte eine Bedeutung der WGS-basierten Katalogisierung der detaillierten Haplogruppen in verschiedenen Populationen nahelegen. Zweitens konnten wir durch die Anwendung der neuesten nichtlinearen ML-Dimensionsreduktionsmethode von UMAP die feineren individuellen Klassifikationen entfalten, die den hochstelligen Sub-Haplogruppen mit drei Buchstaben entsprechen als die traditionelle lineare ML-Methode. Dieses Ergebnis erweitert die Anwendung der nichtlinearen ML-Methode, um neue menschliche Genommerkmale ohne Vorkenntnisse zu extrahieren. Drittens wiesen mtDNA-Varianten unterschiedliche Merkmale von denen der nDNA auf: (i) kein entfernungsabhängiger LD-Zerfall, (ii) spärliche gemeinsame Variantenmarkierung und (iii) mehrere gemeinsame Haplotypen, die die gesamte mtDNA überspannen. Insbesondere mtDNA-Varianten ohne gemeinsame Tagging-Varianten wurden meist in der D-Loop-Region beobachtet, möglicherweise aufgrund der hohen Mutationsrate und wiederkehrenden Mutationen in dieser Region 22 . Angesichts der Tatsache, dass nicht alle gängigen mtDNA-Varianten von den aktuellen SNP-Mikroarrays genotypisiert (oder markiert) wurden, legen diese Merkmale die Notwendigkeit nahe, die Variantenlisten zu katalogisieren, um die mtDNA-Variationen unterschiedlicher ethnischer Zugehörigkeit effizient zu markieren. Viertens fanden wir keinen Hinweis auf eine mtDNA- (oder mtCN-) nDNA-Genotyp-Assoziation. Obwohl mtDNA-nDNA-Assoziationen in einem Tierversuch und einer humanen Genexpressionsstudie 5,6 berichtet wurden, wären weitere Untersuchungen erforderlich, um ihre Assoziationen auf Genotyp-Ebene aufzuklären.

Schließlich zeigte Biobank-gesteuertes mitochondriales PheWAS zahlreiche genetische mtDNA-Risiken für eine Vielzahl komplexer menschlicher Merkmale, einschließlich neu identifizierter Risiken für die Kreatinkinase und ein immunbezogenes Merkmal (Morbus Basedow). Unser PheWAS konnte pleiotrope Effekte der niederfrequenten mtDNA-Varianten entsprechend der spezifischen Sub-Haplogruppe nachweisen. Da die Mehrzahl der Haplogruppen selten und schwer mit hoher Genauigkeit zu imputieren war, wurde in unserer Studie kein haplogruppenbasierter PheWAS durchgeführt. Die nachgewiesenen Varianten hatten im Vergleich zu den pathogenen seltenen mtDNA-Mutationen, die angeborene mitochondriale Erkrankungen verursachen, relativ moderate Effektstärken, was auf ihre modifizierende Rolle auf die Phänotypen schließen lässt 38 . Unsere Studie zeigte eine erfolgreiche Imputation der mtDNA-Varianten unter Verwendung des groß angelegten WGS als Referenzpanel. Ein Teil der gemeinsamen mtDNA-Varianten wurde jedoch aufgrund des Fehlens der genotypisierten Tag-SNPs nicht imputiert und es wäre auch schwierig, die kausalen Varianten genau zu kartieren, wenn die identifizierte Risikovariante zu den gemeinsamen Haplotypen gehörte, die die gesamte mtDNA überspannen. Weitere Bemühungen zur Risikofeinzuordnung einschließlich kundenspezifischer Gestaltung der Variantenliste auf den Microarrays, trans-ethnische Vergleiche, eine Replikationsstudie zur Untersuchung unserer PheWAS-Ergebnisse und funktionelle Validierungsassays wären angebracht.

Zusammenfassend konnte unsere Studie durch die groß angelegte WGS und PheWAS von mtDNA umfassend die genetischen und phänotypischen Landschaften der mtDNA in der japanischen Bevölkerung aufklären.


1 |. EINLEITUNG

Die Sahelzone ist eine Zone zwischen der Sahara im Norden und der Savanne im Süden. Es erstreckt sich über den afrikanischen Kontinent vom Atlantischen Ozean bis zum Roten Meer, einschließlich Teilen von Senegal, Mauretanien, Mali, Burkina Faso, Algerien, Niger, Kamerun, Tschad, der Zentralafrikanischen Republik, der Republik Sudan, dem Südsudan, Eritrea , und Äthiopien. Als solche beherbergt die Sahelzone eine beträchtliche genetische Vielfalt, die auf viele ethno-linguistische Gruppen verteilt ist. Jüngste populationsgenetische Studien haben geografisch verteilte Vorfahren auf globaler Ebene offenbart (Baker, Rotimi, & Shriner, 2017 Shriner, Tekola-Ayele, Adeyemo, & Rotimi, 2014 Tishkoff et al., 2009). Im Tschad wurden fünf Vorfahren identifiziert: Westafrika, West-Zentralafrika, Ostafrika, Nordafrika und Arabisch (Tishkoff et al., 2009 Triska et al., 2015). Es wurde festgestellt, dass jede dieser Vorfahren mit einer primären Sprachfamilie oder einem Zweig korreliert: Westafrikanische Vorfahren mit Mande West-Zentralafrikanische Vorfahren mit Niger-Kongo, Bantu und Nicht-Bantu kombiniert ostafrikanische Vorfahren mit Nilo-Sahara Nordafrikanische Vorfahren mit Berber und arabische Vorfahren mit Semitic (Baker et al., 2017). Neben den berberischen und semitischen Zweigen umfasst die afroasiatische Sprachfamilie tschadische, kuschitische, ägyptische und omotische Zweige. Für kuschitische und omotische Sprecher wurden unterschiedliche Vorfahren abgeleitet (Shriner et al., 2014), aber die Abstammung von tschadischen Sprechern ist unklar. Zwei Möglichkeiten sind, dass tschadische Sprecher eine unterschiedliche Vorfahren haben oder dass sie ostafrikanische Vorfahren haben und eine Sprachverschiebung erlebt haben (Tishkoff et al., 2009).

Die Y-DNA-Haplogruppe R-M207 entstand vor 31,9 [29,8, 34,0] Kilojahren (kya) (Urasin, 2017a), wahrscheinlich in Zentralasien. Sein Nachkomme R1b1a2-V88 entstand 17,1 [15.3, 19.0] kya (Urasin, 2017b). Das Vorkommen von R1b1a2-V88 in vielen Populationen in der Sahelzone zeugt von einem eindeutigen Fall eurasischer Einwanderung, aber wann diese Haplogruppe nach Afrika gelangte und von wem sie getragen wurde, ist unklar (Bekada et al., 2013 Bučková, čková, čková x0010cerný, & Novelletto, 2013 Cruciani et al., 2010a Cruciani et al., 2010b).

Gegenwärtig überlappen sich die Verteilungen von R1b1a2-V88 und Sprechern tschadischer Sprachen teilweise (Bučková et al., 2013 Cruciani et al., 2010a), aber ob es einen kausalen, historischen Zusammenhang gibt, ist unbekannt. Basierend auf der Verteilung der mitochondrialen DNA-Haplogruppe L3f3 wurde vermutet, dass tschadischsprachige Hirten aus Nordost- oder Ostafrika mit einer Obergrenze des frühen Holozäns einwanderten (჎rný et al., 2009). Tschadische Sprachen werden in die afroasiatische Familie eingeordnet, aber die genealogischen Beziehungen zu den anderen Zweigen der afroasiatischen Familie sind umstritten. Die Verbreitung der tschadischen Sprachen wurde entweder von der Nordsahara nach Süden zum Tschadsee verlief, wobei das Tschadische am engsten mit Berber verwandt ist (Ehret, 2002), oder vom Niltal durch den Sudan nach Westen, wobei das Tschadische am engsten verwandt ist zu Kuschitisch (Blench, 1999).

Um diese Probleme zu beleuchten, haben wir Genotypdaten aus Diversity-Projekten im Tschad, der Sahelzone, im Sudan und im Südsudan in eine zuvor kuratierte Sammlung von 5.966 Individuen aus der ganzen Welt integriert (Baker et al., 2017). Mit einer Kombination aus überwachter Clusterbildung und Abbau des Kopplungsungleichgewichts haben wir eine mehrschichtige Geschichte von Wanderungen durch den Tschad von fast 3.000 Jahren aufgedeckt. Die Entwirrung dieser Schichten ergab Erkenntnisse über die Quelle und Verbreitung von R1b und Tschadisch.


Materialen und Methoden

Proben, mtDNA-Sequenzierung und Haplogruppenzugehörigkeit

Wir sammelten insgesamt 102 sudanesische, 77 äthiopische (beide Emigranten in Dubai) und 148 somalische (Flüchtlinge im Jemen) Proben von nicht verwandten Personen, die eine angemessene Einwilligung zur Verwendung ihrer biologischen Proben für die mtDNA-Charakterisierung gaben. Die Arbeit entsprach der Helsinki Declaration of Ethical Principles (59. World Medical Association General Assembly, Seoul, Oktober 2008) und wurde von der Ethikkommission der Universität Porto (11/CEUP/2011) genehmigt. Wir sequenzierten die hypervariablen Segmente I und II (HVS-I und HVS-II) aller sudanesischen und äthiopischen Proben und HVS-I in der somalischen Bevölkerung mit einem zuvor beschriebenen Verfahren (Pereira et al. 2000). Diese Informationen wurden verwendet, um Proben Haplogruppen zuzuordnen, gemäß den neuesten phylogenetischen Beweisen, die auf der Phylotree-Website veröffentlicht wurden (van Oven und Kayser 2009). Die erhaltenen Sequenzen sind in Ergänzungstabelle S1 und Ergänzungsmaterial 2, Ergänzungsmaterial online, aufgeführt.

Wir wählten für die vollständige mtDNA-Sequenzierung insgesamt 21 sudanesische, 16 äthiopische und 20 somalische Proben aus, die aus den in dieser Arbeit charakterisierten Sequenzen ausgewählt wurden, und 11 aus Tschad und 2 aus Soqotra, die zur Haplogruppe L3 gehören, aus zuvor veröffentlichten Datensätzen (Cerný et al. 2007 Cerný, Pereira, et al., 2009). Wir haben die Methodik und die Prüfverfahren befolgt, die in Pereira et al. (2007) und Mutationen wurden relativ zur revidierten Cambridge-Referenzsequenz bewertet (Andrews et al. 1999). Die 70 vollständigen mtDNA-Sequenzen sind bei der GenBank hinterlegt (Zugangsnummern JN655773–JN655842).

Wir haben eine Datenbank mit veröffentlichten HVS-I- und vollständigen L3-Linien zusammengestellt, die im ergänzenden Text und den ergänzenden Tabellen S2 und Ergänzende Daten, ergänzendes Material online beschrieben sind.

Statistische Analysen

Für die L3-Phylogenie-Rekonstruktion führten vorläufige Reduced-Median-Netzwerkanalysen (Bandelt et al. 1995) zu einer vorgeschlagenen Verzweigungsreihenfolge für die Bäume, die wir dann am sparsamsten von Hand konstruierten. Wir haben die Software mtDNA-GeneSyn ( Pereira et al. 2009) verwendet, um Dateien zu konvertieren.

Zur Schätzung der TMRCA für bestimmte Kladen in der Phylogenie haben wir die ρ Statistik ( Forster et al. 1996) und Maximum Likelihood (ML). Wir verwendeten ρ (die mittlere Sequenzabweichung vom abgeleiteten anzestralen Haplotyp der fraglichen Klade) mit einer Schätzung der Mutationsrate für die vollständige mtDNA-Sequenz einer Substitution alle 3.624 Jahre, korrigiert für die reinigende Selektion unter Verwendung des bereitgestellten Rechners ( Soares et al. 2009) und eine synonyme Mutationsrate von einer Substitution alle 7.884 Jahre. Wir haben die Standardfehler wie in Saillard et al. (2000). Wir erhielten auch ML-Schätzungen der Zweiglängen unter Verwendung von PAML 3.13 (Yang 1997) unter Annahme des HKY85-Mutationsmodells mit gamma-verteilten Raten (angenähert durch eine diskrete Verteilung mit 32 Kategorien). Wir haben den Mutationsabstand in ML in Zeit umgerechnet, indem wir dieselbe vollständige mtDNA-Genomuhr verwendet haben.

Wir erhielten Bayes'sche Skyline-Plots (BSPs) ( Drummond et al. 2005) von BEAST 1.4.6 ( Drummond und Rambaut 2007) für die vollständigen L3-Sequenzen mit einer entspannten molekularen Uhr ( Drummond et al. 2006) (lognormal in der Verteilung über die Zweige und unkorreliert zwischen ihnen) und das HKY-Modell der Nukleotid-Substitutionen mit gamma-verteilten Raten. Frühere ML-Analysen zeigten, dass HKY ein adäquates Modell ist und es nicht notwendig ist, komplexere Modelle zu verwenden ( Soares et al. 2009). BSPs schätzen die effektive Populationsgröße im Zeitverlauf unter Verwendung von Zufallssequenzen aus einer bestimmten Population.

Haplogruppe L3 ist eindeutig nicht mit Populationsdaten gleichzusetzen, aber das mit dieser Haplogruppe verbundene Signal könnte dennoch demografische Prozesse in den Populationen signalisieren, die sie tragen, wie zuvor vorgeschlagen (Atkinson et al. 2009). Der Hauptzweck dieser Analyse bestand darin, BSP-Plots basierend auf den L3-Daten bereitzustellen – keine unabhängige Kalibrierung der L3-Phylogenie durchzuführen, da wir keinen sicheren Kalibrierungspunkt innerhalb von L3 erkannten. Zu diesem Zweck führten wir eine Analyse durch, die darauf abzielte, die Mutationsrate der in den übrigen Analysen verwendeten anzunähern. Dies basierte auf dem Alter von L3, wobei eine Normalverteilung mit einem Modusalter von 65 ka und einem 95. Perzentil zwischen 60 und 70 ka basierend auf den Altersschätzungen mit ρ und ML. Da die Mutationsrate zeitabhängig ist, haben wir für einige der jüngeren Kladen Schätzungen des Mindestalters vorgenommen, um ein gewisses Maß an Unabhängigkeit von den verbleibenden Analysen beizubehalten ρ und ML. Es wurde angenommen, dass einige der im südlichen Afrika (und in Zentralafrika) vorkommenden Unterklassen innerhalb von L3d1a1, L3e1a, L3e1b, L3e1d, L3e3a, L3e4a, L3f1b1 und L3f1b4 dort aufgrund von Bantu-Migrationen angekommen sind (Newman 1995), eine Vorstellung, die verstärkt wurde durch die Ergebnisse der Gründeranalyse (siehe unten). Auf diese Weise wurde diesen Kladen ein Alter von mindestens 3,5 ka zugeschrieben, da die Klade mindestens das Alter der Bantu-Expansion haben muss, aber älter sein könnte, wenn sie in Zentralafrika bereits vor Beginn der Expansion nach Süden eine gewisse Vielfalt trug. Um dies zu berücksichtigen, haben wir eine Exponentialverteilung mit einem Modus von 3,5 ka und einem 95. Perzentil von 8 ka festgelegt, wodurch das Alter deutlich über 3,5 ka liegen kann. BEAST verwendet einen Markov-Chain-Monte-Carlo-Ansatz (MCMC), um Stichproben aus den Posterior-Verteilungen von Modellparametern (Verzweigungszeiten im Baum und Substitutionsraten) zu ziehen. Konkret haben wir 100.000.000 Iterationen durchgeführt, wobei alle 10.000 MCMC-Schritte Stichproben gezogen wurden, nach einem verworfenen Burn-In von 10.000.000 Schritten. Wir haben die Konvergenz zur stationären Verteilung und ausreichende Probennahme durch Inspektion der hinteren Proben überprüft und BSPs mit Tracer v1.3 visualisiert. Wir haben eine Generationszeit von 25 Jahren verwendet, wie in Fagundes et al. (2008) und zwangen die größeren Subhaplogruppen, in der Analyse monophyletisch zu sein, da wir eine Baumstruktur anstrebten, die mit den übrigen Analysen direkt vergleichbar ist.

Wir verwendeten die im L3-Gesamtbaum erhaltene Mutationsrate, um Analysen für die Subhaplogruppen und Subregionen durchzuführen. Die Subhaplogruppenanalysen erlaubten uns zu unterscheiden, welche Kladen hauptsächlich für die Zunahme der effektiven Populationsgrößen verantwortlich waren, die in der L3-Gesamtanalyse beobachtet wurden. Die Subregion-Analysen erlauben uns zu beobachten, ob eine gegebene Region das Signal für eine gegebene Populationszunahme in ihren spezifischen L3-Sequenzen enthält, was auf eine mögliche Populationsexpansion innerhalb dieser Region mit mehreren der Subcladen hinweist. Um einen systematischen Vergleich und eine Beschreibung der Zuwachsperioden der effektiven Populationsgröße des BSP durchzuführen, berechneten wir eine Rate der Veränderung der Populationsgröße über die Zeit, und sie wurde relativ zu Individuen pro 100 Individuen für einen Zeitraum von 100 Jahren berechnet ( siehe ergänzende Abb. S1 , Online-Ergänzungsmaterial für eine Grafik der Variation dieses Wertes für den BSP von Gesamt-L3). Als Definition betrachteten wir die Anstiegsrate von mindestens 1 Person pro 100 Personen in 100 Jahren als steileren Anstieg, der gut mit der Visualisierung der BSPs übereinstimmt.

Um die geografische Verteilung von L3 und seinen Subhaplogruppen zu visualisieren, haben wir mit der „Spatial Analyst Extension“ von ArcView Version 3.2 (www.esri.com/software/arcview/) Interpolationskarten erstellt. We used the “inverse distance weighted” (IDW) option with a power of two for the interpolation of the surface. IDW assumes that each input point has a local influence that decreases with distance. The geographic location used is the center of the distribution area from which the individual samples of each population were collected. The data used are listed in supplementary table S2 , Supplementary Material online.

We employed a founder analysis ( Richards et al. 2000) for the L3 sequences in Africa. It assumes a strict division between source and sink populations and a series of criteria to partly account for homoplasy and back migrations between regions. The distinction between source and sink populations is straightforward for most lineages in Africa, except for some deep-ancestry clades which are present in both Eastern Africa and Central Africa. Some cautionary steps were taken in order to allow for the effect of gene flow in both directions. We performed the following founder analyses:

(1) From Eastern Africa into Central Africa: Eastern Africa was the source of most of the ancient L3 variation, although some subclades (L3b, L3d, and L3e, as we will discuss in Results) most probably emerged in Central Africa, with their presence in Eastern Africa related to migrants from Central Africa and not the other way around so these subclades were not assumed to be founders from Eastern Africa. Instead, two founders (containing the entire L3bd and L3e clades) were accounted for as Eastern African founders into Central Africa. We opted for enlarged definitions of Central Africa (including all of Nigeria) and East Africa (extending from Sudan to Tanzania) for the four founder analyses to minimize potential problems with genetic drift that might arise with selected smaller data sets. In this case, the inclusion of all of Nigeria in Central Africa would only increase the data set of the sink population and is perfectly valid when considering an eastern source.

(2) From Central Africa into Eastern Africa: Central African haplogroups were involved in important expansions in Central Africa, namely the Bantu expansion. In this case, only L3b, L3c, and L3e would provide founders into Eastern Africa. We included a single founder, the L3 root type that emerged and evolved in situ, to account for the remaining L3 variation observed in Eastern Africa. Although only a small fraction of Nigeria was a source for Bantu speakers, the extended boundaries are nevertheless beneficial for its use as a source for Bantu lineages into Eastern Africa (or Southern Africa) since it would either contain lineages that had subsequently moved from the more strictly defined Central Africa, improving the source data set, or contain lineages not involved in these migrations that would not impact on the analysis.

(3) From Central and Eastern Africa into North Africa: We excluded the Sahel from the analysis as this region has had continuous recurrent gene flow both from north and south, dissolving the definition of well-defined populations, and the populations in this area would be difficult to either classify as source or sink population.

(4) From Central and Eastern Africa into Southern Africa: We performed this analysis in two ways, considering two versions of the Southern African data set as the sink population. At least two major routes are thought to have been taken by Bantu speakers spreading into Southern Africa, a “western stream” and an “eastern stream.” The western stream took the expanding Bantu from eastern Nigeria/Cameroon into Angola, South Africa, and Botswana from around 3.5 ka, whereas the eastern stream reached Mozambique and South Africa within the last 2 ka, starting from a core area in the Great Lakes region of Uganda 2.5 ka ( Bandelt et al. 2001 Salas et al. 2002 Phillipson 2005). In the first, we considered the entire Southern African data set, but for the second, we tested for the possibility of a more recent ancestry for populations at the extreme southeastern tip of the continent, which likely received migrants primarily from the eastern stream of the Bantu expansion as well as more recent immigration from Eastern Africa ( Phillipson 2005 Huffman 2007). Here, we therefore only included samples from Mozambique and South Africa.

We reconstructed, haplogroup by haplogroup, HVS-I networks in the range 16,051–16,400 bp of the reference sequence ( Andrews et al. 1999). Data used are indicated in supplementary table S2 , Supplementary Material online. We used an f1 criterion (which dictates that a sequence type is only considered a founder if it presents derived variation in the hypothetical source population) to identify founders, in order to allow for some homoplasy and back migrations ( Richards et al. 2000).

We estimated the age of the migration of each founder using the ρ statistic ( Forster et al. 1996) and an HVS-I mutation rate of one mutation every 16,677 years ( Soares et al. 2009). In order to assess the error in the Bayesian partitioning across the different migration times realistically, we calculated an effective number of samples in each founder. This was obtained by multiplying the number of samples in each founder by a ratio of the variance assuming a starlike network and the variance calculated with the Saillard et al. (2000) method. We scanned the distribution of founder ages for each region defining equally spaced 200-year intervals for each migration from 0 to 100 ka. We performed a second analysis using defined migration times, based on the previous scan in the context of archaeological and climatological evidence. This second analysis allowed us to fractionate the L3 lineages into each migration and to probabilistically detect which lineages moved in each migration.


About us

Welcome to the mitochondrial DNA haplogroup U4 project! Haplogroup U4 (Ulrike) is a small Indo-European haplogroup that is particularly prevalent in Finland and Russia. It is found at low frequencies throughout Europe, North America and Asia. We have project members living in the following countries: Australia, Austria, Bahamas, Belarus, Belgium, Brazil, Bulgaria, Canada, Czech Republic, Denmark, England, Finland, France, Germany, Greece, Hungary, Ireland, Italy, Japan, Lithuania, Macedonia, The Netherlands, New Zealand, Norway, Poland, Romania, Russia, Scotland, South Africa, Spain, Sweden, Switzerland, Turkey, United Arab Emirates, Virgin Islands, West Indies, USA. U4 is divided into four main subclades: U4a, U4b, U4c and U4d. Each subclade has numerous branches.

Description of haplogroup U4 from Wikipedia
Haplogroup U4 has its origin in the Upper Palaeolithic,dating to approximately 25,000 years ago and has been implicated in the expansion of modern humans into Europe occurring before the Last Glacial Maximum. U4 is an ancient mitochondrial haplogroup and is relatively rare in modern populations. U4 is found in Europe with highest concentrations in Scandinavia and the Baltic states and is found in the Sami population of the Scandinavian peninsula (although, U5b has a higher representation).

U4 is also associated with the remnants of ancient European hunting-gatherers preserved in the indigenous populations of Siberia. U4 is found in Nganasans, the indigenous inhabitants of the Taimyr Peninsula, in the Mansi (16.3%), an endangered people, and in the Ket people (28.9%) of the Yenisey River. U4 is also preserved in the Kalash people (current population size 3,700) a unique tribe among the Indo-Aryan peoples of Pakistan where U4 (subclade U4a1) attains its highest frequency of 34%.

Haplogroup U4 is associated with ancient European hunter-gatherers and has been found in 7,200 to 6,000-year-old remains of the Pitted Ware culture in Gotland, Sweden, and in 4,400 to 3,800-year-old remains from the Damsbo site of the Danish Bell-Beaker culture. Remains identified as subclade U4a2 are associated with the Battle Axe culture which flourished 5,200 to 4,300 years ago in eastern and central Europe and encompassed most of continental northern Europe from the Volga River in the east to the Rhine River in the west. Mitochondrial DNA recovered from 3,500 to 3,300-year-old remains at the Bredtoftegård site in Denmark associated with the Nordic Bronze Age include haplogroup U4 with 16179T in its HVR1 indicative of subclade U4c1. (Source: Wikipedia article on haplogroup U. Reproduced under the Creative Commons Licence.)

Description of Ulrike from Bryan Sykes
The clan of Ulrike (German for Mistress of All) is not among the original "Seven Daughters of Eve" clans, but with just under 2% of Europeans among its members, it has a claim to being included among the numerically important clans. Ulrike lived about 18,000 years ago in the cold refuges of the Ukraine at the northern limits of human habitation. Though Ulrike's descendants are nowhere common, the clan is found today mainly in the east and north of Europe with particularly high concentrations in Scandinavia and the Baltic states. (Source: www.oxfordancestors.com/content/view/35/55)

Mitgliedschaft
The project is open to everyone who has taken a mitochondrial DNA (mtDNA) test with Family Tree DNA, the Genographic Project or one of the FTDNA partners (e.g., IGENEA, DNA Worldwide), and whose results show that they belong to haplogroup U4 or one of its subclades. There is no fee to join the project, and no additional testing is required.

If you have tested with the Genographic Project you will first need to transfer your results to the Family Tree DNA database. For instructions on transferring your results see this page in the FTDNA Learning Center. Geno 1.0 HVR1 results are included on the U4 project's results page. The Geno 2.0 test and the Geno 2.0 NextGen test scan selected SNPs from across the entire mt genome, but do not sequence the entire hypervariable region - the sections that are used for low-resolution genealogical matches. Geno 2.0 results cannot therefore be displayed on the project's results page and cannot be used for genealogical matching purposes. Nevertheless we are still happy to welcome Geno 2.0 testers to the project though we would encourage you to upgrade and order an mtDNA test from FTDNA in order to participate in the matching database.

If you have tested with any other company you will have to retest with Family Tree DNA if you wish to participate in the U4 Project. This blog post explains more about the various mtDNA tests offered by the different testing companies. The International Society of Genetic Genealogy have a chart on their website showing the differences in the mtDNA tests offered by the various companies which can be seen here.

Please provide details of your most distant known ancestor on your direct maternal line (your mother, your mother's mother, your mother's mother and so on). Click here to see a chart on the ISOGG website which shows the path of mtDNA transmission. There is also a useful animated video on the Learn Genetics website which can be seen by clicking here. You can enter the information via the My Account/Most Distant Ancestors menu on your FTDNA personal page. Please provide the full name, year of birth and location of your most distant known ancestor on your direct maternal line. As we are an international project with members from many different countries please avoid the use of local abbreviations (eg, US state abbreviations, UK Chapman county codes) for clarity.

If you have taken the full mitochondrial sequence (FMS) test (also known as the mega or full genomic sequence (FGS) test) please consider sharing your coding region results with the project administrators so that we can help you with your results. The coding region results are not shown on the project's results page and will not be made public, and by default they are also hidden from the project administrators. The coding region results allow us to check your subclade assignment against the latest version of the mtDNA tree on Phylotree. We can often provide a more detailed classification than that provided by FTDNA. FTDNA is currently using Build 14 of Phylotree. Some U4 subclades in Build 14 are not yet recognised by FTDNA. All U4 project results have been updated to conform with the most recent Phylotree build (Build 16).

To share your coding region results with the project administrators , please log into your FTDNA account, select My Account and click on Results Display Settings. In the section "Show My mtDNA Coding Region Mutations to Administrators of these Projects", make sure that you have indicated "Yes" for the U4 project. For instructions see also the article by Rebekah Canada on Your Privacy and Showing Your mtDNA Coding Region Results.

Instructions for joining the U4 Project in other languages
Currently, we have our "Join Request" in six languages (English, Русский, Deutsch, Français, Español and Italiano). Click here to see these translations.

Privatsphäre
The privacy of project members is respected at all times. The U4 administrators strictly adhere to the Family Tree DNA Group Project Administrator Terms and Policies and the ISOGG Project Administrator Guidelines. See also the Family Tree DNA Privacy Policy and Terms of Service and the Learning Center pages on DNA Group Projects. For information on adjusting your FTDNA privacy settings see the article in the FTDNA Learning Centre on Privacy and Sharing.

Geographical projects
We encourage all our project members to join the appropriate geographical project wherever possible. A full list of geographical projects can be found in the ISOGG Wiki. There is no limit on the number of projects you can join at Family Tree DNA, but admission to a project is subject to approval by the project administrators.

ISOGG
We encourage all our members to join (it's free!) the International Society of Genetic Genealogy (ISOGG). Further information can be found on the ISOGG website and in the ISOGG Wiki.

Scientific papers of particular relevance to haplogroup U4
Der Sarkissian C, Balanovsky O, Brandt G, Khartanovich V, Buzhilova A, et al. (2013) Ancient DNA Reveals Prehistoric Gene-Flow from Siberia in the Complex Human Population History of North East Europe. PLoS Genetics 9(2): e1003296. (Full article available online.)

Melchior L, Lynnerup N, Siegismund HR, Kivisild T, Dissing J (2010). Genetic Diversity among Ancient Nordic Populations. PLoS ONE 5(7): e11898. (Full article available online.)
Malyarchuk B, Grzybowski T, Derenko M, Perkova M, Vanecek T, Lazur J, Gomolcak P, Tsybovsky I. Mitochondrial DNA phylogeny in Eastern and Western Slavs. Molekularbiologie und Evolution 2008 25(8):1651-1658. (Full article available online.)

Soares P, Acchili A, Semino O, Davies W, Macaulay v, Bandelt h, Torroni A, Richards M (2010). The Archaeogenetics of Europe. Current Biology 23 February 2010 (Vol. 20, Issue 4, pp. R174-R183). The authors provide an age estimate of U4 at 20.8 thousand years based on an analysis of the complete mtDNA genome sequences of 956 West Eurasian samples. They state: "It has been argued that several lineages that are most prominent in eastern Europe, in particular within U4, may be the result of expansions from an eastern refuge, perhaps in the Ukraine." (Full article available online)

Samara Rubinstein, Matthew C. Duuk, Omer Gokcumen, Sergey Zhadanov, Ludmila Osipova, Maggie Cocca, Nishi Mehta, Marina Gubina, Olga Posukh, Theodore G Schurr. Russian Old Believers: genetic consequences of their persecution and exile, as shown by mitochondrial DNA evidence (Report). Human Biology June 01, 2008. (Report available online.)

Kristiina Tambets. Dissertationes Biologicae Universitatis Tartuensis. Towards the understanding of post-glacial spread of human mitochondrial DNA haplogroups in Europe and beyond: a phylogeographic approach. Council of the Institute of Molecular and Cell Biology, University of Tartu, Estonia, 2004. (Thesis available online.)

B. A. Malyarchuk. Differentiation of the Mitochondrial Subhaplogroup U4 in the Populations of Eastern Europe, Ural, and Western Siberia: Implication to the Genetic History of the Uralic Populations. Russian Journal of Genetics November 2004, Volume 40, Number 11. (Abstract and preview available online.)

Olga A. Derbeneva, Elena B. Starikovskaya, Douglas C. Wallace, and Rem I. Sukernik. Traces of Early Eurasians in the Mansi of Northwest Siberia Revealed by Mitochondrial DNA Analysis. Amerikanisches Journal für Humangenetik 2002 April 70(4): 1009�. (Full article available online.)

Other scientific papers of interest
Hans-Jürgen Bandelt, Anita Kloss-Brandstätter, Martin B Richards, Yong-Gang Yao and Ian Logan. The case for the continuing use of the revised Cambridge Reference Sequence (rCRS) and the standardization of notation in human mitochondrial DNA studies. Journal of Human Genetics (5 December 2013).

Doron M. Behar, Mannis van Oven, Saharon Rosset et al (2012). A "Copernican" Reassessment of the Human Mitochondrial DNA Tree from its Root. American Journal of Human Genetics , Volume 90, Issue 4, 6 April 2012, pp675�. A number of U4 sequences from Family Tree DNA customers were used in this paper.

Melchior L, Lynnerup N, Siegismund HR, Kivisild T, Dissing J (2010). Genetic Diversity among Ancient Nordic Populations. PLoS ONE 5(7): e11898. An ancient DNA study which found a U4 sample amongst the Neolithic Bell Beaker people along with a later Bronze age U4 sample.

Helena Malmström, M. Thomas P. Gilbert, Mark G. Thomas et al. Ancient DNA Reveals Lack of Continuity between Neolithic Hunter-Gatherers and Contemporary Scandinavians. Aktuelle Biologie 2009 9(2): 1758-1762. (Abstract only available online.) A discussion can be found on Dienekes' Anthropology Blog. The article is also discussed on the GenomeWeb website. Eight U4 samples were included in the study.

B. Bramanti, M. G. Thomas, W. Haak et al. Genetic Discontinuity Between Local Hunter-Gatherers and Central Europe’s First Farmers. By (3 September 2009) Science [DOI: 10.1126/science.1176869] (Abstract only available online.) The article is reviewed on Dienekes Anthropology Blog. Dienekes comments: "Pre-farming populations seem to have been dominated by mtDNA haplogroup U". He quotes from the paper: "it is intriguing to note that 82% of our 22 hunter-gatherer individuals carried clade U (fourteen U5, two U4, and two unspecified U-types". The two U4 samples were from Bad Duerrenberg, Germany (c. 6850 BC) and Spiginas, Lithuania (c. 6350 BC). The paper states that "U4 types show frequencies between 1% and 5% in most parts of Europe, with Western Europe at the lower end of this range, and northeastern Europe and central Asia showing percentages in excess of 7%".

A. Achilli, C. Rengo, V. Battaglia et al. Saami and Berbers—An Unexpected Mitochondrial DNA Link. The American Journal of Human Genetics, 2005, Volume 76, Issue 5, Pages 883-886. (Full article available online)

O. A. Derbeneva, E. B. Starikovskaya, N. V. Volodko, D. C. Wallace and R. I. Sukernik. Mitochondrial DNA variation in the Kets and Nganasans and its implications for the initial peopling of Northern Eurasia. Russian Journal of Genetics, vol. 38, No. 11, 2002, pp.1316�. Translated from Genetika, vol. 38, No. 11, 2002, pp.1554�. (Abstract and preview available online.)

Haftungsausschluss
The mtDNA Haplogroup U4 Project is an independent genealogical research study run by volunteer administrators. The project receives no funding, and participants are responsible for the costs of their own tests. The project was organised as a co-operative effort among those who wish to explore genetic testing to advance their knowledge of deep and recent family backgrounds.

Member information and data obtained from the Haplogroup U4 Project must be attributed to the project, administrators, and Family Tree DNA. Please notify administrators when using data for public or private research.