Information

24.3: Verknüpfung reduziert Rekombinationshäufigkeit - Biologie

24.3: Verknüpfung reduziert Rekombinationshäufigkeit - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Nachdem wir oben die nicht verknüpften Loci betrachtet haben, wenden wir uns der umgekehrten Situation zu, in der zwei Loci auf einem Chromosom so nah beieinander liegen, dass sich die elterlichen Kombinationen von Allelen immer zusammen trennen (Abbildung (PageIndex{3})). Das ist Komplett (oder absolut) Verknüpfung und ist selten, da die Loci so nahe beieinander liegen müssen, dass Übergänge zwischen ihnen nie entdeckt werden.


Sequenzbasierte ultradichte genetische und physikalische Karten zeigen strukturelle Variationen allopolyploider Baumwollgenome

SNPs sind der am häufigsten vorkommende Polymorphismustyp und wurden in vielen genomischen Studien an Nutzpflanzen untersucht, darunter Reis und Mais. Die Entdeckung von SNPs in allotetraploiden Baumwollgenomen ist aufgrund ihrer Komplexität und Polyploidie hinter denen anderer Kulturpflanzen zurückgeblieben. In dieser Studie werden genomweite SNPs systematisch mit Next-Generation-Sequencing und effizienten SNP-Genotyping-Methoden nachgewiesen und verwendet, um eine Kopplungskarte zu erstellen und die strukturellen Variationen in polyploiden Baumwollgenomen zu charakterisieren.

Ergebnisse

Wir konstruieren eine ultradichte interspezifische genetische Karte mit 4.999.048 SNP-Loci, die ungleichmäßig in 26 allotetraploiden Baumwollbindungsgruppen verteilt sind und 4.042 cM abdecken. Die Karte wird verwendet, um tetraploide Baumwollgenomgerüste für den genauen Zusammenbau von G. hirsutum gem. TM-1. Rekombinationsraten und Hotspots werden im gesamten Baumwollgenom durch Vergleich der zusammengesetzten Entwurfssequenz und der genetischen Karte identifiziert. Anhand dieser Karte werden Genomumlagerungen und zentromerische Regionen in tetraploider Baumwolle identifiziert, indem Informationen aus öffentlich zugänglichen Daten kombiniert werden G. raimondii Genom mit Fluoreszenz vor Ort Hybridisierungsanalyse.

Schlussfolgerungen

Wir berichten über die Genotyp-by-Sequencing-Methode, mit der Millionen von SNPs zwischen G. hirsutum und G. barbadense. Wir konstruieren und verwenden eine ultradichte SNP-Karte, um Sequenzfehlanordnungen zu korrigieren, Gerüste zu Pseudomolekülen zusammenzuführen, die den Chromosomen entsprechen, um Genomumlagerungen zu erkennen und zentromere Regionen in allotetraploiden Baumwollen zu identifizieren. Wir finden, dass die zentromerische Retroelementsequenz von tetraploider Baumwolle, die aus dem D-Subgenom-Vorläufer stammt, nach allotetrapolyploider Bildung in die A-Subgenom-Zentromere eingedrungen sein könnte. Diese Studie dient als wertvolle genomische Ressource für die genetische Forschung und Züchtung von Baumwolle.


Morgan’s Experiment

Morgan ausgewählt Drosophila melanogaster als sein Thema aus folgenden Gründen:

  • Er bemerkte eine weißäugige männliche Drosophila anstelle der normalen roten Augen.
  • Es war klein
  • Sie haben eine kurze Lebensdauer und so können viele Generationen in kurzer Zeit untersucht werden.
  • Sie haben eine hohe Reproduktionsrate

Er kreuzte einen reinrassigen weißäugigen Rüden mit einer reinrassigen rotäugigen Hündin. Wie erwartet, wurden die F1-Nachkommen nach Mendels Gesetzen mit roten Augen geboren. Wenn die F1-Generation untereinander gekreuzt wurde, betrug das Verhältnis von rotäugigen zu weißäugigen Nachkommen 3:1. Er bemerkte jedoch, dass es in der F2-Generation kein weißäugiges Weibchen gab.

Um weiter zu verstehen, führte er eine Kreuzung zwischen einem heterozygoten rotäugigen Weibchen mit einem weißäugigen Männchen durch. Dies ergab ein Verhältnis von 1:1:1:1 bei den Nachkommen (1 weißäugiges Weibchen, 1 rotäugiges Weibchen, 1 weißäugiges Männchen und 1 rotäugiges Männchen). Dies brachte Morgan dazu, über die Verbindung zwischen den Merkmalen und den Geschlechtschromosomen nachzudenken. Er führte viele weitere Kreuzungen durch und stellte fest, dass das für die Augenfarbe verantwortliche Gen auf dem X-Chromosom lag.

Sie können das Spickzettel zu den Prinzipien der Vererbung und Variation herunterladen, indem Sie auf die Download-Schaltfläche unten klicken


Rekombinations- und Kopplungsungleichgewicht in Arabidopsis thaliana

Das Kopplungsungleichgewicht (LD) ist ein wichtiger Aspekt der Organisation der genetischen Variation in natürlichen Populationen. Hier beschreiben wir das genomweite Muster von LD in einer Stichprobe von 19 Arabidopsis thaliana Akzessionen mit 341.602 Nicht-Singleton-SNPs. LD zerfällt im Durchschnitt innerhalb von 10 kb, deutlich schneller als bisher angenommen. Tag-SNP-Selektionsalgorithmen und „Hide-the-SNP“-Simulationen deuten darauf hin, dass die genomweite Assoziationskartierung nur 40–50 % der beobachteten SNPs erfordert, eine Verringerung ähnlich der Schätzungen in einer Stichprobe von Afroamerikanern. Basierend auf diesen Ergebnissen wurde ein Affymetrix-Genotypisierungs-Array mit 250.000 SNPs entwickelt. Wir zeigen, dass es eine mehr als ausreichende Abdeckung für die genomweite Assoziationskartierung bieten sollte. Das Ausmaß der LD ist sehr variabel, und wir finden klare Hinweise auf Rekombinations-Hotspots, die bevorzugt in intergenischen Regionen auftreten. LD spiegelt auch die Wirkung der Selektion wider und ist zwischen nicht-synonymen Polymorphismen ausgedehnter als zwischen synonymen Polymorphismen.


Diskussion

Geschichte der Orang-Utans

Das am besten passende demografische Modell (M6) legt nahe, dass die beiden Pongo Arten divergierten zwischen 650 und 1000 kya und erlebten einen Durchmischungsschub um 300 kya. Angesichts der pleistozänen Geschichte der periodischen Meeresspiegeländerungen in Südostasien [26] erscheint ein solches Szenario des sekundären Kontakts biogeographisch plausibler als eine kontinuierliche Migration. Beruhigenderweise stimmen unsere Schätzungen der Divergenzzeit unter M6 mit früheren Schätzungen auf der Grundlage des SMC [8, 24] überein und stimmen gut mit den geschätzten Artenteilungen für andere inselendemischen Säugetiere in Südostasien überein [26].

Insgesamt stimmen unsere Ergebnisse im Allgemeinen mit früheren Analysen über das Fehlen eines rezenten Genflusses (< 250 kya) zwischen Borneo- und Sumatra-Orang-Utans überein [13]. Ebenso unsere Schlussfolgerung eines größeren ne in Sumatra im Vergleich zu Borneo-Orang-Utans stimmt mit relativen Maßen der Nukleotiddiversität und früheren Analysen mit verschiedenen Datentypen überein [12, 19, 23, 25]. Während wir für die Bornean-Population unter M3 eine Kontraktion ableiten, wären in Übereinstimmung mit den einfacheren Modellen, die von [25] untersucht wurden, Stichproben auf feineren räumlichen Skalen erforderlich, um die Substruktur sowohl in der Sumatra- als auch der Borneo-Population aufzulösen.

Beruhigenderweise stimmt der Zeitpunkt der sekundären Beimischung unter M6 mit der geschätzten Zwischenzeit zwischen den beiden überein Pongo Spezies für einfachere Modelle M1–M4 (Tabelle 1), die denen von Locke et al. al. [23]. Mit dem gemeinsamen SFS (δeinδich, [3]), Locke et. al. [23] schätzen eine Artendivergenzzeit von 400 kya ein, was etwas älter ist als unsere Schätzung (250–300 kya) unter M1–M4. Ein ähnlicher Unterschied in den Schätzungen wurde jedoch bereits beim Hidden-Markov-Modell-Ansatz von Mailund et. al. [13] (siehe Supplemental Text S2 in [13]), das eine vereinfachte Demographie der Artbildung mit kontinuierlichem Genfluss und Rekombination unter Verwendung von Gesamtgenomdaten modelliert.

Schließlich ist die kürzliche Entdeckung einer neuen Art (P. tapanuliensis, [33]) in Sumatra hat keinen signifikanten Einfluss auf unsere Gesamtergebnisse, wie die cbSFS-Analyse ohne die Person aus dieser Population zeigt (Zusatzdatei 2: Tabelle S5). Wir stellen fest, dass die neu abgeleiteten effektiven Populationsgrößen niedriger sind als unsere vorherigen Schätzungen, was zu erwarten ist, da die Entfernung des KB9258-Individuums (aus dem Süden des Toba-Sees) erheblich zurückgegangen sein wird (angesichts seines „Ausreißer“-Status, [37 ]) der im cbSFS enthaltene Gesamtpolymorphismus. In dieser Analyse, die versucht, die neue Spezies zu erklären, wurde die genomweite Rekombinationsrate konstant gehalten (2 × 10 –8 /bp/Generation), um den Informationsverlust auszugleichen. Dies könnte die niedrigeren Schätzungen der Divergenzzeiten erklären, die mit dem cbSFS von 500-bp-Blöcken erhalten wurden.

Absoluter Modelfit und die Wirkung der Selektion

Wie die meisten demografischen Inferenzmethoden geht ABLE von selektiver Neutralität aus. Darüber hinaus beruht eine effiziente Berechnung oder Approximation des bSFS auf der Annahme, dass Blöcke statistisch austauschbar sind, was die Heterogenität der Mutations- und Rekombinationsraten ignoriert.

Wir können die absolute Anpassung unseres demografischen Modells an die Daten visualisieren, indem wir die beobachtete Verteilung der bSFS-Konfigurationen mit der unter M6 erwarteten (erhalten mit 50 Millionen simulierten blockweisen ARGs) vergleichen. Wenn die Daten vollständig durch die abgeleitete demografische Geschichte generiert würden, würden wir erwarten, dass die gängigsten bSFS-Konfigurationen dieser Erwartung am besten entsprechen (siehe Zusatzdatei 1: Abbildung S11). Im Gegensatz dazu zeigt Abb. 7, dass unabhängig davon, welches demografische Modell wir annehmen, einige Aspekte der Daten schlecht erfasst werden. Insbesondere bSFS-Konfigurationen mit wenigen (oder keinen) Mutationen (blau dargestellt) sind häufig und in den Daten überrepräsentiert. Diese Fehlpaarung ist kompatibel mit Hintergrundselektion [38] und/oder positiver Selektion, die die genetische Diversität bei einem Bruchteil von Blöcken reduziert.

Absolute Modellanpassung an das beobachtete 2-kb-bSFS für die gängigsten Konfigurationen. Jeder Punkt repräsentiert eine einzigartige Mutationskonfiguration, aus der das bSFS besteht. Das erwartete bSFS (x-Achse) wurde mit ABLE unter Verwendung von 50 Millionen ARGs am MCLE für jedes Modell (Tabelle 1) generiert und gegen das beobachtete bSFS aufgetragen (ja-Achse) aus den Orang-Utan-Daten. Die diagonale schwarze Linie zeigt die perfekte Übereinstimmung zwischen Erwartetem und Beobachtetem an. Die Farben stellen die Gesamtzahl der SNPs dar, die in jeder Konfiguration enthalten sind

Verknüpfte Auswahl kann Schätzungen von Vorfahren reduzieren ne unter neutralen Annahmen. Dies könnte erklären, warum wir eine viel kleinere effektive Größe für die Vorfahrenpopulation (Tabelle 1 und zusätzliche Datei 2: Tabelle S1) als frühere Studien erhalten haben [12, 19, 23, 25], während unsere ne Schätzungen für die beiden aktuellen Populationen stimmen ziemlich gut überein [13]. Wie erwartet verschwindet diese Signatur der verknüpften Auswahl, wenn wir ein bSFS mit kürzerer Blockgröße betrachten (Zusatzdatei 1: Abbildung S12). Es wird interessant sein, die Möglichkeit zu untersuchen, mit dem bSFS gemeinsam auf Demographie und verschiedene Formen der Selektion zu schließen [39].

Einfluss von Blocklänge und Stichprobenumfang

Eine interessante Eigenschaft des bSFS ist, dass es sowohl in den Grenzen der minimalen Blocklänge (eine Basis) als auch der maximalen Blocklänge (alle Daten in einem einzigen Block) auf das SFS zusammenfällt. Bei beiden Extremen gehen alle Verknüpfungsinformationen verloren, und daher müssen die in der Verteilung von bSFS-Typen enthaltenen Informationen auf eine gewisse Zwischenblocklänge maximiert werden. Während ABLE auf einer willkürlichen Aufteilung des Genoms in Blöcke fester Länge beruht, definieren Rekombinations-Bruchpunkte im ARG echte „Sequenzblöcke“, die durch Abstammung identisch sind (IBD) mit einer Längenverteilung, die von der demographischen Geschichte in einem Komplex abhängt Weg. Da der Abstand von IBD-Blöcken eine direkte Funktion der Länge der genealogischen Zweige ist, werden Informationen über verschiedene demografische Prozesse über verschiedene physikalische Skalen maximiert. Zum Beispiel erzeugt ein Burst einer kürzlichen Beimischung einen Überschuss an langen Blöcken, die den Abstieg über das Beimischungsereignis teilen, aber vor der Beimischung unterschiedliche Abstammung haben. Die Tatsache, dass man im Allgemeinen wenig Vorwissen über die Demografie hat, macht es schwierig, die aussagekräftigste Blocklänge für einen bestimmten Datensatz zu bestimmen.

Bei Kenntnis des relativen Verhältnisses von Mutation zu Rekombinationsereignissen μ/ρ und unter der Annahme, dass die Informationen im bSFS maximiert werden, wenn Blöcke im Durchschnitt eine kleine Zahl enthalten x von IBD-Trakten kann die Blocklänge heuristisch für einen bestimmten x. Angenommen zum Beispiel μ/ρ≈1 für Menschenaffen, unsere 2-kb-Blöcke enthalten im Durchschnitt jeweils zwei bis drei Rekombinationsereignisse Pongo Arten (gegeben) θW= 2,19 und 2,91 in 2 kb-Blöcken für die Bornean- bzw. Sumatra-Populationen). Eine sinnvolle obere (aber ebenso heuristische) Grenze für die Blocklänge ist die Länge, bei der die Anzahl der einzigartigen bSFS-Konfigurationen maximiert wird, die für die abgeleitete Geschichte der beiden Orang-Utan-Arten etwa 5 kb beträgt (Zusatzdatei 1: Abbildung S13). Versuche, die Orang-Utan-Daten in Blöcke mit viel mehr als 2 KB zu unterteilen, führten jedoch zu einem erheblichen Datenverlust (angesichts der bescheidenen Gesamtabdeckung), sodass wir dies nicht weiter untersuchen.

Die Tatsache, dass ABLE- und Multi-Locus-Ansätze im Allgemeinen auf einer festen (und notwendigerweise willkürlichen) Blocklänge beruhen, ist eine definitive Einschränkung. Eine interessante Richtung für zukünftige Arbeiten wäre daher die Integration von CL-Schätzungen basierend auf dem bSFS über eine Reihe von Blockgrößen, was die Aussagekraft für die Rückschlüsse auf jüngste demografische Ereignisse verbessern sollte. Ein verwandtes Inferenzschema, das über einen Bereich von Fenstergrößen integriert, wurde kürzlich implementiert [20].

Unsere Entdeckung von größeren R Schätzungen bei der Verwendung kürzerer Blöcke für die Orang-Utan-Daten waren überraschend. Da unsere Methode die Heterogenität in beiden ignoriert R und μ, die beide die Autokorrelation über kurze Distanzen erhöhen, erwarteten wir das Gegenteil, d. h. eine Abnahme von R Schätzungen für kürzere Blöcke. Unsere Simulationsanalyse hat jedoch gezeigt, dass ABLE relativ unverzerrte Schätzungen von R für kurze (500 bp) Blöcke, wenn die Inferenz mit zwei oder mehr diploiden Proben pro Population durchgeführt wurde (Zusatzdatei 2: Tabelle S3). Eine plausible Erklärung für das große R Schätzungen für die Orang-Utan-Daten könnten eine Genkonversion sein, da Konversionsereignisse, die Blockgrenzen überspannen, nicht von Cross-Over-Ereignissen zu unterscheiden sind. Ergebnisse einer einfachen Simulation eines bSFS aus 500-bp-Blöcken mit Genkonversion unterstreichen dies als wahrscheinlichen Grund für höhere Schätzungen der Rekombinationsrate (Zusatzdatei 2: Tabelle S3). Darüber hinaus muss die Genkonversion bei Blöcken, die länger sind als die typische Konversionstraktlänge von mehreren hundert Basen, einen vermindernden Effekt auf das bSFS haben (siehe Tabelle 2 in [40]). In Zukunft soll es möglich sein, diese Abhängigkeit von der Blocklänge zu nutzen, um explizite Schätzer für Genkonversions- und Cross-over-Raten zu entwickeln.

Selbst unter einer komplexen Demografie wie M6 zeigen unsere simulationsbasierten Poweranalysen, dass die meisten demografischen Parameter mit nur einem einzigen diploiden Genom pro Population vernünftig wiederhergestellt werden können (Zusatzdatei 2: Tabelle S3). Die Erhöhung der Stichprobengröße auf zwei diploide Genome hat die Standardabweichung der Schätzungen für einige Parameter, insbesondere die Rekombinationsrate, mehr als halbiert (Zusatzdatei 1: Abbildung S2). Eine weitere Zunahme der Stichprobengröße ergab jedoch trotz des erheblichen Rechenaufwands (zusätzliche Datei 1: Abbildung S3) eine vernachlässigbare Verbesserung: Die Anzahl der einzigartigen bSFS-Konfigurationen stieg mehr als um das Dreifache mit drei statt zwei diploiden Genomen pro Population. Diese abnehmende Rendite mit zunehmender Stichprobengröße (in Bezug auf die Sequenzen) ist eine grundlegende Eigenschaft der Koaleszenz [41, 42]: Wenn man die Zeit rückwärts betrachtet, sind größere Stichproben jeder Art wahrscheinlich auf eine kleine Anzahl von Abstammungslinien zusammengewachsen (siehe Abb. 3 in [42]) vor dem Beimischungsereignis und dürften daher kaum zusätzliche Informationen über ältere demografische Prozesse liefern.

Das SFS, das bSFS und das cbSFS

In diesem Artikel haben wir die Intuition untersucht, dass die Verwendung von Verknüpfungsinformationen, die im bSFS enthalten sind, die demografische Inferenz im Vergleich zum SFS verbessern sollte, die nur eine Funktion der erwarteten Länge der genealogischen Zweige ist [5, 6]. Es wurde zuvor gezeigt, dass die bSFS für eine kleine Stichprobe (n=5) enthält deutlich mehr Informationen über vergangene Engpässe als der SFS für eine große Stichprobe (n=20, siehe Abb. 3 in [22]). Ebenso unsere Analyse zum Vergleich von ABLE mit dem SFS-basierten eini [3] für progressiv komplex unterteilte Populationsszenarien (M1, M2 und M6) führten zu verbesserten Schlussfolgerungen (mit dem bSFS) der Populationsgrößen der Vorfahren, der Divergenzzeiten und der Beimischungsraten, wenn auch mit erhöhter Varianz in den Schätzungen (Zusatzdatei 1: Abbildung S8, Abbildung S9 und Abbildung S10).

Wir verwenden jedoch nur eine Teilmenge von zwei diploiden Genomen für die ABLE-Analyse im Vergleich zu der gesamten Stichprobe von fünf diploiden Genomen, die von einich. Diese Leistungssteigerung kann durch die Tatsache erklärt werden, dass das bSFS eine höherdimensionale und daher viel reichhaltigere Zusammenfassung der Sequenzvariation ist als das SFS [18, 22]. Dieser Informationszuwachs ist jedoch mit Rechenaufwand verbunden (Zusatzdatei 1: Abbildung S3) und es kann im Allgemeinen nützlich sein, den Parameterraum mit SFS-basierten Ansätzen wie eini [3] vor einer ABLE-Analyse. Schließlich bietet das cbSFS-Schema eine Alternative, indem alle Teilmengen der ursprünglichen Stichprobe berücksichtigt werden, was die Analyse beliebig großer Stichproben bei minimalem Rechenaufwand ermöglicht.

Grenzen der Inferenz

Während unsere Modellwahl von Vorkenntnissen zur demografischen Geschichte der Orang-Utans geleitet wurde [13, 23–25], bleibt abzuklären, wo die Grenzen der Modellkomplexität und -identifizierbarkeit mit unserem Ansatz liegen und inwieweit die Verteilung der bSFS-Muster überwindet die Nichtidentifizierbarkeit des SFS [7, 43, 44]. Anders als bei analytischen Likelihood-Berechnungen (z. B. [18]) gibt es bei der Approximation der Likelihood für einen gegebenen Punkt im Parameterraum mit steigender Modellkomplexität keinen signifikanten Anstieg des Rechenaufwands. Das Durchsuchen des Parameterraums ist jedoch mit einer größeren Modellkomplexität mit offensichtlichen und schnell steigenden Kosten verbunden. Wie alle Annäherungswahrscheinlichkeitsansätze erfordert ABLE, dass der Benutzer sorgfältige Entscheidungen über die Anzahl der Parameter, die Anzahl der pro Punkt im Parameterraum abzutastenden Genealogien und die Suchgrenzen für den MCLE trifft, die alle entscheidende Elemente der Optimierungsstrategie sind [4]. In diesem Zusammenhang schlagen wir vor, dass einfache Pilotanalysen, die einige oder alle der oben genannten Faktoren variieren (siehe Zusatzdatei 1: Abbildung S14 und Abbildung S13), die Inferenzstrategie unterstützen sollten.

Es ist auch klar, dass die Informationen in den Daten unabhängig vom Inferenzansatz endlich sind, so dass es eine harte Grenze geben muss, wie realistisch eine Geschichte zu schlussfolgern sein kann. Die Tatsache, dass ABLE im Prinzip für die Anpassung jedes demografischen Modells verwendet werden kann, legt dem Benutzer somit die Verpflichtung auf, die Inferenz auf Szenarien zu beschränken, die sowohl statistisch identifizierbar als auch biologisch interpretierbar sind. Die Bewertung der relativen Anpassung einfacher verschachtelter Modelle ist eine wichtige Überprüfung der Informationsgrenzen in den Daten. Unser Vergleich von Analysen basierend auf 2-kb- und 500-bp-Blöcken (Abb. 5 bzw. Zusatzdatei 1: Abbildung S15) verdeutlicht die Grenzen unseres Inferenzschemas für kurze Blocklängen.

Der in ABLE implementierte Inferenzansatz verwendet den Koaleszenzsimulator Frau [45] für die Probenahme von blockweisen Genealogien oder ARGs. Grundsätzlich kann ABLE auch andere Simulatoren aufnehmen und ist somit für zusätzliche Prozesse wie Linked Selection geeignet [46, 47]. Ein weiterer interessanter Weg für weitere Forschungen besteht darin, ungefähre zusammengesetzte Wahrscheinlichkeiten basierend auf dem bSFS entlang des Genoms anzuwenden. Ein solcher Ansatz würde nicht nur dazu beitragen, Rekombinationskarten für Nicht-Modellorganismen zu verbessern, sondern könnte auch einen robusten Rahmen für die Identifizierung von Ausreißerregionen des Genoms unter positiver Selektion und/oder durch Introgression von einer anderen Spezies beeinflusst.


Rückschluss auf die Landschaft der Rekombination mit Hilfe rekurrenter neuronaler Netze

Die genaue Ableitung der genomweiten Landschaft der Rekombinationsraten in natürlichen Populationen ist ein zentrales Ziel der Genomik, da Verknüpfungsmuster alles von der genetischen Kartierung bis zum Verständnis der Evolutionsgeschichte beeinflussen. Hier beschreiben wir ReLERNN, eine Deep-Learning-Methode zur genauen Schätzung einer genomweiten Rekombinationslandschaft mit nur vier Proben. Anstatt Zusammenfassungen des Kopplungsungleichgewichts als Eingabe zu verwenden, berücksichtigt ReLERNN Spalten aus einem Genotyp-Alignment, die dann unter Verwendung eines rekurrenten neuronalen Netzwerks als Sequenz über das Genom modelliert werden. Wir zeigen, dass ReLERNN die Genauigkeit verbessert und Verzerrungen im Vergleich zu bestehenden Methoden reduziert und eine hohe Genauigkeit angesichts der Fehlspezifikation des demografischen Modells beibehält. Wir wenden ReLERNN auf natürliche Populationen afrikanischer Drosophila melanogaster und zeigen, dass genomweite Rekombinationslandschaften, obwohl sie zwischen Populationen weitgehend korreliert sind, wichtige populationsspezifische Unterschiede aufweisen. Schließlich verbinden wir die abgeleiteten Rekombinationsmuster mit den Frequenzen der Hauptinversionen, die sich in natürlichem segregieren Drosophila Bevölkerungen.


Ergebnisse

Positive (antagonistische oder abnehmende Rendite) Epistase

Als Folge des Eintrags schädlicher Mutationen in die verschiedenen Gene ist die Epistaserichtung positiv, was bedeutet, dass Mutationen in Kombination einen schwächeren Effekt auf die Protozell-Fitness haben (Abschnitt 3 in S1 Text, siehe S1 Abb). Unter dieser Bedingung wird immer eine verminderte Rekombination begünstigt [17,29]. Es ist erwähnenswert, dass antagonistische Epistase aus Studien zum Effekt von Mutationen auf die RNA-Faltung [30] und Analysen von RNA-Viren [31] sowie aus E. coli und S. cerevisiae mithilfe von Flussbilanzanalysen und in silico-Studien von metabolischen Netzwerken [32].

Chromosomatisierung und Genomerweiterung

Wir fassen zunächst die wichtigsten Erkenntnisse zusammen und konzentrieren uns dann auf ein bestimmtes Szenario, um die Dynamik des Systems zu verstehen. In allen analysierten Situationen breiten sich Chromosomen trotz starker Selektion innerhalb der Protozellen gegen sie aus. Selbst wenn ein langes Chromosom bricht, kann im Gleichgewicht ein vielfältiger Satz kleinerer Chromosomen mit unterschiedlicher Anzahl von Genen vorhanden sein. In allen Fällen dominieren jedoch Chromosomen mit vollständigen Gensätzen das System. Wenn die geteilte Größe S niedrig ist (d. h. wenn die maximale Anzahl von Genen zum Zeitpunkt der Protozellteilung niedrig ist), sind Chromosomen mit einem vollständigen Satz essentieller Gene in relativ hoher Konzentration vorhanden. Mit zunehmender Split-Size nimmt die Konzentration der Chromosomen mit zwei (oder mehr) vollständigen Gensätzen zu, d. h. wir beobachten eine Genom-Expansion verknüpfter Gene als Funktion der Split-Size. Ein Chromosomenbruch produziert einzelne Gene und kürzere Chromosomen, die keine vollständigen Gensätze enthalten, wodurch die durchschnittliche Länge der Chromosomen und die Protozell-Fitness reduziert werden. Dennoch führt der Chromosomenbruch in der Übergangszeit zu der notwendigen Variation, um eine optimale Zusammensetzung der Gene im Chromosom zu erreichen. Ohne Chromosomenbruch könnte das System in einem suboptimalen Zustand einfrieren und im Gleichgewicht verbleiben nur wenige Chromosomentypen im System, was eine weitere Optimierung ausschließt. Schließlich haben wir festgestellt, dass die Rekombination innerhalb der Zelle die Ergebnisse nicht qualitativ beeinflusst.

Wir konzentrieren uns nun auf einen bestimmten Fall unter der Annahme D = 3 essentielle Gene (A, B und C). Tabelle 1 zeigt die Anzahl und das Verhältnis verschiedener Gentypen in Chromosomen mit unterschiedlichen Genzahlen im Gleichgewicht. Das häufigste Chromosom (

50%) in der Bevölkerung war mit den Genen ABC perfekt ausbalanciert und am zweithäufigsten (

21%) Chromosom mit den Genen ABCABC. Ausgeglichene ABCABCABC-Chromosomen (

1,5 %) waren ebenfalls vorhanden. In anderen Fällen war die Genzusammensetzung weniger ausgewogen, aber insgesamt herrscht auf Populationsebene ein nahezu perfektes Gleichgewicht in der Genzusammensetzung. Brüche produzieren immer wieder solitäre Gene und aufgrund der Sortimentslast ist das Verhältnis von solitären Genen unterschiedlicher Art nicht ausgewogen.


Eine Einführung in die genetische Analyse. 7. Auflage.

Wenn in einem Chromosom zwei Brüche auftreten, dreht sich manchmal die Region zwischen den Brüchen um 180 Grad, bevor sie sich wieder mit den beiden Endfragmenten verbindet. Ein solches Ereignis erzeugt eine Chromosomenmutation, die als Inversion bezeichnet wird. Im Gegensatz zu Deletionen und Duplikationen verändern Inversionen nicht die Gesamtmenge des genetischen Materials, sodass Inversionen im Allgemeinen lebensfähig sind und keine besonderen Anomalien auf phänotypischer Ebene aufweisen. In einigen Fällen befindet sich einer der Chromosomenbrüche innerhalb eines Gens mit essentieller Funktion, und dann wirkt dieser Bruchpunkt als tödliche Genmutation, die mit der Inversion verbunden ist. In einem solchen Fall konnte die Inversion nicht homozygot gezüchtet werden. Viele Inversionen können jedoch homozygot gemacht werden, außerdem können Inversionen in haploiden Organismen nachgewiesen werden. In diesen Fällen liegt der Haltepunkt eindeutig nicht in einem wesentlichen Bereich. Einige der möglichen Ergebnisse einer Inversion auf DNA-Ebene sind in Abbildung 17.14 dargestellt.

Abbildung 17-14

Auswirkungen von Inversionen auf DNA-Ebene. Gene werden repräsentiert durch EIN, B, C, und D. Schablonenstrang ist dunkelgrün Nicht Schablonenstrang ist hellgrün gezackte Linien zeigen einen Bruch in der DNA an. Der Buchstabe P steht für Promoter dicker Pfeil zeigt die Position an (mehr.)

Die meisten Inversionsanalysen verwenden heterozygote Inversionen𠅍iploide, bei denen ein Chromosom die Standardsequenz hat und eines die Inversion trägt. Die mikroskopische Beobachtung der Meiose in Inversions-Heterozygoten zeigt die Lage des invertierten Segments, weil sich ein Chromosom einmal an den Enden der Inversion verdreht, um sich mit dem anderen, unverdrehten Chromosom zu paaren, auf diese Weise bilden die gepaarten Homologen ein Inversionsschleife (Abbildung 17-15).

Abbildung 17-15

Die Chromosomen von Inversions-Heterozygoten paaren sich bei der Meiose in einer Schleife. (a) Schematische Darstellung jedes Chromosom ist eigentlich ein Paar Schwesterchromatiden. (b) Elektronenmikroskopische Aufnahmen synaptonemaler Komplexe in der Prophase I der Meiose bei einer heterozygoten Maus (mehr. )

Die Lage des Zentromers relativ zum invertierten Segment bestimmt das genetische Verhalten des Chromosoms. Befindet sich das Zentromer außerhalb der Inversion, dann heißt die Inversion parazentrisch, während Inversionen, die das Zentromer überspannen, perizentrisch:

Wie verhalten sich Inversionen genetisch? Crossing-over innerhalb der Inversionsschleife einer parazentrischen Inversion verbindet homologe Zentromere in a dizentrische Brücke und gleichzeitig produzieren ein azentrisches Fragment𠅎in Fragment ohne Zentromer. Wenn sich die Chromosomen in der Anaphase I trennen, bleiben die Zentromere dann durch die Brücke verbunden, die die Zentromere so ausrichtet, dass die Nicht-Crossover-Chromatide am weitesten auseinander liegen. Das azentrische Fragment kann sich nicht ausrichten oder bewegen und geht folglich verloren. Spannung bricht schließlich die Brücke und bildet zwei Chromosomen mit terminalen Deletionen (Abbildung 17.16). Die Gameten, die solche deletierten Chromosomen enthalten, können unlebendig sein, aber selbst wenn sie lebensfähig sind, sind die Zygoten, die sie schließlich bilden, unlebendig. Daher erzeugt ein Crossover-Ereignis, das normalerweise die rekombinante Klasse meiotischer Produkte erzeugt, stattdessen tödliche Produkte. Das Gesamtergebnis ist eine niedrigere rekombinante Frequenz. Tatsächlich ist die RF für Gene innerhalb der Inversion null. Bei Genen, die die Inversion flankieren, wird die RF proportional zur relativen Größe der Inversion reduziert.

Abbildung 17-16

Meiotische Produkte, die aus einem einzigen Crossover innerhalb einer parazentrischen Inversionsschleife resultieren. Zwei Nicht-Schwesterchromatiden kreuzen sich innerhalb der Schleife.

Inversionen wirken sich auch auf andere Weise auf die Rekombination aus. Inversions-Heterozygoten haben oft mechanische Paarungsprobleme im Bereich der Inversion, diese Paarungsprobleme reduzieren die Frequenz des Crossing-overs und damit die rekombinante Frequenz in der Region.

Der genetische Nettoeffekt einer perizentrischen Inversion ist der gleiche wie der einer parazentrischen 𠅌rossover-Produkte werden nicht wiederhergestellt, aber aus anderen Gründen. Bei einer perizentrischen Inversion lösen sich die Chromosomen, die gekreuzt wurden, auf normale Weise, ohne dass eine Brücke entsteht, da die Zentromere in der invertierten Region enthalten sind. Der Crossover erzeugt jedoch Chromatiden, die eine Duplikation und einen Mangel für verschiedene Teile des Chromosoms enthalten (Abbildung 17-17). Wenn in diesem Fall ein Kern mit einem Crossover-Chromosom befruchtet wird, stirbt die Zygote aufgrund ihres genetischen Ungleichgewichts. Das Ergebnis ist wiederum die selektive Gewinnung von Nicht-Crossover-Chromosomen in lebensfähigen Nachkommen.

Abbildung 17-17

Meiotische Produkte, die aus einer Meiose mit einem einzigen Crossover innerhalb einer perizentrischen Inversionsschleife resultieren.

BOTSCHAFT

Zwei Mechanismen reduzieren die Anzahl rekombinanter Produkte unter den Nachkommen von Inversions-Heterozygoten: Eliminierung der Crossover-Produkte in der Inversionsschleife und Hemmung der Paarung im Bereich der Inversion.

Es lohnt sich, einen Hinweis zu homozygoten Inversionen hinzuzufügen. In solchen Fällen paaren und kreuzen sich die homologen invertierten Chromosomen normal, es gibt keine Brücken und die meiotischen Produkte sind lebensfähig. Ein interessanter Effekt ist jedoch, dass die Verknüpfungskarte die umgekehrte Genreihenfolge zeigt.

Genetiker verwenden Inversionen, um Duplikationen bestimmter Chromosomenregionen für verschiedene experimentelle Zwecke zu erzeugen. Betrachten Sie beispielsweise eine heterozygote perizentrische Inversion mit einem Bruchpunkt an der Spitze (T) des Chromosoms, wie in Abbildung 17.18 gezeigt. Ein Crossover in der Schleife erzeugt einen Chromatidtyp, bei dem der gesamte linke Arm dupliziert wird, wenn die Spitze nicht essentiell ist, wird ein Duplikatsstock zur Untersuchung erzeugt. Eine andere Möglichkeit, eine Duplizierung (und einen Mangel) zu erzeugen, besteht darin, zwei parazentrische Inversionen mit überlappenden Breakpoints zu verwenden (Abbildung 17-19). Eine komplexe Schleife wird gebildet, und ein Crossover innerhalb der Inversion erzeugt die Duplikation und die Deletion. Diese Manipulationen sind nur in Organismen mit gründlich kartierten Chromosomen möglich, für die große Sätze von Standardumlagerungen verfügbar sind.

Abbildung 17-18

Erzeugung einer lebensfähigen Non-Tandem-Duplikation aus einer perizentrischen Inversion nahe einer entbehrlichen Chromosomenspitze.

Abbildung 17-19

Erzeugung einer Nicht-Tandem-Duplikation durch Crossing-Over zwischen zwei überlappenden Inversionen.

Wir haben gesehen, dass sowohl genetische Analysen als auch meiotische Chromosomenzytologie gute Methoden zum Nachweis von Inversionen sind. Wie bei den meisten Umlagerungen besteht auch hier die Möglichkeit des Nachweises durch mitotische Chromosomenanalyse. Ein wichtiges Betriebsmerkmal ist die Suche nach neuen Armverhältnissen. Betrachten Sie ein Chromosom, das wie folgt mutiert ist:

Beachten Sie, dass das Verhältnis des langen zum kurzen Arm durch die perizentrische Inversion von etwa 4 auf etwa 1 geändert wurde. Parazentrische Inversionen verändern das Armverhältnis nicht, können aber mikroskopisch nachgewiesen werden, wenn Banding oder andere chromosomale Landmarken vorhanden sind.

BOTSCHAFT

Die wichtigsten diagnostischen Merkmale von Inversionen sind Inversionsschleifen, Verringerung der Rekombinationshäufigkeit und verringerte Fertilität durch unausgeglichene oder deletierte meiotische Produkte, die alle bei Individuen beobachtet werden, die für Inversionen heterozygot sind. Einige Inversionen können direkt als umgekehrte Anordnung chromosomaler Landmarken beobachtet werden.

Inversionen werden bei etwa 2 Prozent der Menschen gefunden. Die heterozygoten Inversionsträger zeigen im Allgemeinen keinen nachteiligen Phänotyp, produzieren aber die erwartete Anordnung anomaler meiotischer Produkte durch das Überkreuzen in der Inversionsschleife. Betrachten wir als Beispiel perizentrische Inversionen. Personen, die für perizentrische Inversionen heterozygot sind, produzieren Nachkommen mit den Duplikationschromosomen, von denen vorhergesagt wurde, dass diese Nachkommen je nach Länge der betroffenen Chromosomenregionen unterschiedliche Grade von Anomalien aufweisen. Einige Phänotypen, die durch duplizierte �letion-Chromosomen verursacht werden, sind so anormal, dass sie bis zur Geburt nicht überleben können und als Spontanaborte verloren gehen. However, there is a way to study the abnormal meiotic products that does not depend on survival to term. Human sperm placed in contact with unfertilized eggs of the golden hamster penetrate the eggs but fail to fertilize them. The sperm nucleus does not fuse with the egg nucleus, and, if the cell is prepared for cytogenetic examination, the human chromosomes are easily visible as a distinct group (Figure 17-20). This technique makes it possible to study the chromosomal products of a male meiosis directly and is particularly useful in the study of meiotic products of men who have chromosome mutations.

Figure 17-20

Human sperm and hamster oocytes are fused to permit study of the chromosomes in the meiotic products of human males. (After original art by Renພ Martin.)

In one case, a man heterozygous for an inversion of chromosome 3 underwent sperm analysis. The inversion was a large one with a high potential for crossing-over in the loop. Four chromosome 3 types were found in the man’s sperm—normal, inversion, and two recombinant types (Figure 17-21). The sperm contained the four types in the following frequencies:

Figure 17-21

(a) Four different chromosomes 3 found in sperm of a man heterozygous for a large pericentric inversion. The duplication-deletion types result from a crossover in the inversion loop. (b) Two complete sperm chromosome sets containing the two duplication�letion (more. )

The duplication-q�letion-p recombinant chromosome had been observed previously in several abnormal children, but the duplication-p�letion-q type had never been seen, and probably zygotes receiving it are too abnormal to survive to term. Presumably, deletion of the larger q fragment has more severe consequences than deletion of the smaller p fragment.

In Absprache mit dem Verlag ist dieses Buch über die Suchfunktion zugänglich, jedoch nicht durchsuchbar.


Gene Mapping

The chromosome mapping or gene mapping is based on two important assumptions:(i) that genes are arranged on a chromosome in a linear fashion, and (ii) that the percentage of crossing over (recombination frequencies) between the two genes is an index of their distance apart. A chromosome map is a line on which the genes are represented points that are separated by distance proportional to the amount of crossing over. The gene mapping is based on the percentage of crossing over between genes, it is sometimes known as a crossing over map. The relationship between the cross over frequency and the distance between loci was first suggested in 1913 by A. I. Sturtevant. Thus, the chromosome map is a condensed graphic representation of relative distances between the linked genes, expressed in percentage of recombination among the genes in one linkage group. Distances between genes can be expressed in map units, where one map unit is defined as 1 per cent recombination. So, The representation in figure of relative position of genes on the chromosome is known as chromosome map in the process of identifying gene loci is called gene mapping.

Explanation of Gene Mapping

The amount of crossing over, on which the gene mapping is prepared, has been drawn from Test crosses. There is no direct microscopic examination of the chromosome. The gene mapping is based on two assumptions which are very easy to understand, those are: i) The genes are arranged in a liner fashion on the chromosome. ii) The percentage of crossing over between the two genes is an index of their distance in the chromosome.

Recombination frequency or Cross over value = Total number of recombinants in Test Cross / Total number of progeny of the Test Cross. The value is generally represented as a per cent of the total population. The variation in recombination frequency is governed by the distance between the genes. Closer the distance between the two genes, the less are the chances of crossing over. As a result there is lower frequency of recombination. The greater is the distance between the genes, the higher is the percentage of crossing over between them.

Construction of gene mapping

To construct the gene mapping of an animal or plant, its chromosomes are first represented by straight lines and then the positions of genes are determined from the percentage of crossing over data. The percentage of crossing over is governed by the distance between the genes concerned. If the two genes are closer then the chance of crossing over will be less I which will be reflected in the recombination frequency.

Technique of gene mapping

The assumption of consistent gene order along the chromosome, coupled with the fact that crossing occurs, makes it almost certain that gene loci can be determined in relation to each other. If genes are located in a consistent linear order along a chromosome, then the distance between any two genes and the amount of (Tossing over that occurs between them should be in direct proportion. Homologous chromosomes cross over each other and such cross over occasionally lead to an exchange of chromosome segments between the pairs. When such an exchange occurs, the linkage between certain genes is broken and new gamete possibilities arise. Higher the number of such gametes, greater will be the portion of the offspring showing the cross over phenotype. This percentage, therefore, gives direct measure of the amount of chromosomal crossing over. In other word, it provides a direct measure of the distance between the genes involved.

Factors Affecting Gene Mapping

(i) Double Crossing Over : This phenomenon occurs between two genes which are situated by long distance on the same chromosome. It has been observed, though there is double crossing over yet the two genes are remaining on the same chromosome. There is no apparent sign of crossing over. So, calculation of crossing over percentage may cause mistakes in the chromosome map. (ii) Interference : One chiasma may interfere to form another chiasma formation in the vicinity. As a result, one crossing over may reduces the crossing over in the vicinity. (iii) Temperature : High and low temperatures increase the frequency of crossing over. Hence, the temperature causes fluctuations in the location of genes on chromosome. (iv) X-ray : This ray increases the frequency of crossing over and disturb the location of genes on chromosome mapping. (v) Age : Experiment of Bridges shows that crossing over is more frequent in older females of Drosophila. Thus age also affects the frequency of crossing over. Hence, ageing also cause fluctuations in loci of genes on chromosome. (vi) Location : Crossing over is less frequent near centromere and near the terminal ends of chromosome. (vii) Sex : The males of many organisms show less frequency of crossing over. In male Drosophila there is no crossing over. Thus, sex may also affect the frequency of crossing over.

Utility or Importance of Gene Mapping

(i) Chromosome mapping or gene mapping are very useful in the study of genetic engineering. (ii) Chromosome maps are very helpful to find out the exact location of new mutant gene in chromosome. (iii) Chromosome maps have established the validity that genes are arranged in a linrar fashion in chromosome. (NS) Gene Mapping have established the concept that the specific genes occupy the specific loci in the specific chromosome.


Schau das Video: DNA und Gene: so hängen sie zusammen Biologie. Duden Learnattack (Oktober 2022).