Information

6.6: Ausgedrückte Sequenz-Tags - Biologie

6.6: Ausgedrückte Sequenz-Tags - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Nur ein sehr kleiner Prozentsatz (1,2% beim Menschen) der DNA in Vertebraten-Genomen kodiert für Proteine ​​(das "Proteom"), da die Exons der meisten Gene durch viel längere Introns getrennt sind zwischen unseren Genen liegen riesige DNA-Mengen, von denen ein Großteil erscheint die Expression unserer Gene zu regulieren, wird aber nicht transkribiert und in ein Proteinprodukt übersetzt. Selbst wenn die vollständige Sequenz eines Genoms bekannt ist, ist es daher oft schwierig, bestimmte Gene (offene Leseraster oder ORFs) zu erkennen.

Ein Ansatz zur Lösung des Problems besteht darin, a Transkriptom des Organismus. Am häufigsten wird dies definiert als: Alle aus dem Genom transkribierten Boten-RNA-Moleküle (mRNA). Es ist „ein“ Transkriptom, nicht „das“ Transkriptom, denn welche Gene in einer Zelle transkribiert werden, hängt von der Art der Zelle ab (z. B. Leberzelle vs. Lymphozyten) und was die Zelle gerade tut, z.

  • Vorbereitung zur Teilung durch Mitose;
  • Reaktion auf die Ankunft eines Hormons oder Zytokins;
  • sich bereit machen, ein Proteinprodukt abzusondern.

Expressed Sequence Tags (ESTs)

ESTs sind kurze (200–500 Nukleotide) DNA-Sequenzen, die verwendet werden können, um ein Gen zu identifizieren, das zu einem bestimmten Zeitpunkt in einer Zelle exprimiert wird.

Der Ablauf:

  • Isolieren Sie die Boten-RNA (mRNA) aus einem bestimmten Gewebe (z. B. Leber)
  • Behandeln Sie es mit reverser Transkriptase. Reverse Transkriptase ist eine DNA-Polymerase, die RNA als Matrize verwendet. Dadurch ist es in der Lage, genetische Informationen in umgekehrter (RNA -> DNA) ihrer normalen Richtung (DNA -> RNA) fließen zu lassen.
  • Dabei entsteht komplementäre DNA (cDNA). Beachten Sie, dass sich cDNA vom normalen Gen dadurch unterscheidet, dass die Intronsequenzen fehlen.
  • Sequenz 200–500 Nukleotide sowohl am 5'- als auch am 3'-Ende jeder cDNA.
  • Untersuchen Sie die Datenbank des Genoms des Organismus, um eine passende Sequenz zu finden.

Genomweite Analyse der Genexpression

Karine G. Le Roch, Elizabeth A. Winzeler, in Encyclopedia of Biological Chemistry, 2004

Serielle Methoden zur globalen Analyse der Genexpression

Die serielle Analyse der Genexpression (SAGE) ist eine Technik zum Sammeln von genomweiten Expressionsdaten, bei der kurze Sequenz-Tags (7–9 Basen lang) mit biochemischen Methoden aus der Nähe des 3'-Endes von Transkripten isoliert werden (Abbildung 1). Die kurzen Tags (normalerweise 10.000–20.000 pro Bedingung) werden verkettet und dann sequenziert. Schließlich wird jeder SAGE-Tag unter Verwendung von Sequenzdaten des vollständigen Genoms auf das Gen, von dem es stammt, zurück kartiert. Durch das Zählen der Anzahl der SAGE-Tags für ein Gen für mehrere verschiedene Bedingungen kann man eine Schätzung erhalten, wie sich die Expression des Gens ändert. Diese Technik, die nicht von der Konstruktion eines Mikroarrays abhängt, kann mit vollständiger Genomsequenzinformation initiiert werden und ist sehr quantitativ, insbesondere für stark exprimierte Gene. Die Technik ist relativ teuer und viel zeitaufwendiger als die Mikroarray-Analyse. Andere serielle Verfahren umfassen das Sequenzieren von Bibliotheken von exprimierten Sequenz-Tags (ESTs).

Abbildung 1 . Serielle Analyse der Genexpression. RNA aus dem interessierenden Zustand wird zuerst unter Verwendung von reversen Transkriptase- und DNA-Polymerase-Enzymen (A) in doppelsträngige cDNA umgewandelt. Die doppelsträngige cDNA wird dann mit einem Restriktionsenzym gespalten, das alle paar hundert Basen in das interessierende Genom schneidet (normalerweise NlaIII, dessen Stelle hier durch ausgefüllte Kreise dargestellt ist). Ein kurzes DNA-Stück wird dann an der Schnittstelle des ersten Restriktionsenzyms (B) ligiert, wodurch eine Erkennungsstelle für ein Typ-II-Restriktionsenzym (normalerweise BsmFI, dessen Erkennungsstelle als ausgefülltes Rechteck dargestellt ist) erzeugt wird, das einen definierten Abstand schneidet von seiner Erkennungsstelle, wodurch ein 15 bp SAGE-Tag erzeugt wird. Nach Restriktion mit dem Enzym Typ Ii (C) werden die Tags dann biochemisch miteinander verknüpft und schließlich sequenziert (D). Die Anzahl der SAGE-Tags, die einem Gen zugeordnet sind, wird dann tabellarisch dargestellt, um das Expressionsniveau des Gens zu bestimmen.


  1. Restriktionsfragmentlängenpolymorphismus (RFLP)
  2. Amplifizierter Fragmentlängenpolymorphismus (AFLP)
  3. Zufällig amplifizierte polymorphe DNA (RAPD)
  4. Gespaltene amplifizierte polymorphe Sequenzen (CAPS)
  5. Simple Sequence Repeat (SSR) Längenpolymorphismus
  6. Einzelstrang-Konformationspolymorphismus (SSCP)
  7. Heteroduplex-Analyse (HA)
  8. Einzelnukleotidpolymorphismus (SNP)
  9. Expressed Sequence Tags (EST)
  10. Sequenzgetaggte Sites (STS)

Restriktionsfragmentlängenpolymorphismen (RFLPs):

RFLPs beziehen sich auf Variationen, die innerhalb einer Spezies in der Länge von DNA-Fragmenten gefunden werden, die durch spezifische Endonuklease erzeugt werden. RFLPs sind die erste Art von DNA-Markern, die entwickelt wurden, um Individuen auf DNA-Ebene zu unterscheiden. Die RFLP-Technik wurde vor der Entdeckung der Polymerase-Kettenreaktion (PCR) entwickelt.

Die Vor-, Nachteile und Einsatzmöglichkeiten dieser Technik werden im Folgenden vorgestellt:

Die RFLP-Technik hat mehrere Vorteile. Es ist eine billigere und einfache Technik der DNA-Sequenzierung. Es erfordert keine spezielle Instrumentierung. Die Mehrheit der RFLP-Marker ist kodominant und hochgradig locusspezifisch. Dies sind leistungsstarke Werkzeuge für Vergleichs- und Synteny-Mapping.

Es ist nützlich bei der Entwicklung anderer Marker wie CAPS und INDEL. Mehrere Proben können gleichzeitig durch diese Technik unter Verwendung verschiedener Sonden gescreent werden. RFLP-Genotypen für Single-Copy-Gene oder Gene mit niedriger Kopienzahl können leicht bewertet und interpretiert werden.

Die Entwicklung von Sätzen von RFLP-Sonden und -Markern ist arbeitsintensiv. Diese Technik erfordert eine große Menge hochwertiger DNA. Das Multiplexverhältnis ist niedrig, typischerweise eins pro Gel. Der Genotypisierungsdurchsatz ist gering. Dabei werden radioaktive Chemikalien verwendet. RFLP-Fingerabdrücke für Familien mit mehreren Genen sind oft komplex und schwer zu erfassen. RFLP-Sonden können nicht zwischen Labors geteilt werden.

Sie können bei der Feststellung von Vaterschaftsfällen verwendet werden. In Kriminalfällen können sie zur Bestimmung der Quelle der DNA-Probe verwendet werden. Sie können verwendet werden, um den Krankheitsstatus einer Person zu bestimmen. Sie sind nützlich bei der Genkartierung, Keimplasmacharakterisierung und Marker-unterstützten Selektion. Sie sind beim Nachweis von Krankheitserregern in Pflanzen nützlich, selbst wenn sie sich im latenten Stadium befinden.

Amplifizierter Fragmentlängenpolymorphismus (AFLP):

AFLPs sind Unterschiede in den Restriktionsfragmentlängen, die durch SNPs oder INDELs verursacht werden, die Restriktionsendonuklease-Erkennungsstellen erzeugen oder aufheben. AFLP-Assays werden durch selektives Amplifizieren eines Pools von Restriktionsfragmenten unter Verwendung von PCR durchgeführt. Die RFLP-Technik war ursprünglich als selektive Restriktionsfragmentamplifikation bekannt.

Es bietet ein sehr hohes Multiplexverhältnis und einen sehr hohen Genotypisierungsdurchsatz. Diese sind in allen Labors sehr gut reproduzierbar. Es sind jedoch keine Markerentwicklungsarbeiten erforderlich, jedoch ist häufig ein AFLP-Primer-Screening erforderlich, um optimale Primerspezifitäten und -kombinationen zu identifizieren.

Für die Durchführung von AFLP-Assays ist keine spezielle Instrumentierung erforderlich, jedoch ist eine spezielle Instrumentierung für die kodominante Bewertung erforderlich.

Die Anlaufkosten sind moderat niedrig. AFLP-Assays können mit sehr kleinen DNA-Proben (typischerweise 0,2 bis 2,5 pg pro Individuum) durchgeführt werden. Die Technologie kann mit minimaler anfänglicher Entwicklung auf praktisch jeden Organismus angewendet werden.

Der maximale polymorphe Informationsgehalt für jeden biallelischen Marker beträgt 0,5. DNA von hoher Qualität wird benötigt, um einen vollständigen Restriktionsenzymverdau zu gewährleisten. Die DNA-Qualität kann je nach Spezies eine Schwäche sein oder nicht. Schnelle Methoden zur Isolierung von DNA erzeugen möglicherweise keine ausreichend saubere Template-DNA für die AFLP-Analyse.

Für die Bewertung von Heterozygoten und ++-Homozygoten ist eine proprietäre Technologie erforderlich. Andernfalls müssen AFLPs dominant gewertet werden. Dominanz kann je nach Anwendung eine Schwäche sein oder nicht.

Die Homologie eines Restriktionsfragments kann nicht eindeutig über Genotypen oder Kartierungspopulationen hinweg festgestellt werden. Die Entwicklung von Locus-spezifischen Markern aus einzelnen Fragmenten kann schwierig sein und scheint nicht weit verbreitet zu sein.

Der Wechsel zu nicht-radioaktiven Assays erfolgte nicht schnell. Chemilumineszente AFLP-Fingerprinting-Verfahren wurden entwickelt und scheinen gut zu funktionieren.

Die durch Fluoreszenz-AFLP-Testverfahren erzeugten Fingerabdrücke sind oft schwer zu interpretieren und zu bewerten und scheinen daher nicht weit verbreitet zu sein. AFLP-Marker häufen sich häufig in zentromerischen Regionen bei Arten mit großen Genomen, z. B. Gerste (Hordeum vulgare L.) und Sonnenblume (Helianthus annuus L.).

Diese Technik wurde weit verbreitet bei der Konstruktion genetischer Karten verwendet, die hohe Dichten an DNA-Markern enthalten. In der Pflanzenzüchtung und Genetik werden AFLP-Marker bei der Sortenidentifizierung, Keimplasmacharakterisierung, Gen-Tagging und Marker-unterstützten Selektion verwendet.

Zufällig amplifizierte polymorphe DNA (RAPDs):

RAPD bezieht sich auf Polymorphismus, der innerhalb einer Spezies in der zufällig amplifizierten DNA gefunden wird, die durch das Restriktionsendonuklease-Enzym erzeugt wird. RAPDs sind PCR-basierte DNA-Marker. RAPD-Markerassays werden unter Verwendung eines einzelnen DNA-Primers beliebiger Sequenz durchgeführt.

RAPD-Primer sind leicht erhältlich, da sie universell sind. Sie bieten einen mäßig hohen Genotypisierungsdurchsatz. Diese Technik ist ein einfacher PCR-Assay (kein Blotting und keine Radioaktivität). Es erfordert keine spezielle Ausrüstung. Es wird nur PCR benötigt. Die Startkosten sind gering.

RAPD-Marker-Assays können mit sehr kleinen DNA-Proben (5 bis 25 ng pro Probe) durchgeführt werden. RAPD-Primer sind universell und können im Handel erworben werden. RAPD-Marker können problemlos zwischen Labors ausgetauscht werden. Aus RAPD-Markern können Locus-spezifische, co-dominante PCR-basierte Marker entwickelt werden. Es bietet mehr Polymorphismus als RFLPs.

Der Nachweis von Polymorphismus ist begrenzt. Der maximale polymorphe Informationsgehalt für jeden biallelischen Marker beträgt 0,5. Diese Technik erkennt nur dominante Marker. Die Reproduzierbarkeit von RAPD-Assays in allen Labors ist oft gering. Die Homologie von Fragmenten über Genotypen hinweg kann ohne Kartierung nicht festgestellt werden. Sie ist nicht anwendbar im markergestützten Zuchtprogramm.

Diese Technik kann auf verschiedene Weise verwendet werden, wie zum Beispiel zur Sortenidentifikation, DNA-Fingerabdruck, Gen-Tagging und Konstruktion von Kopplungskarten. Es kann auch verwendet werden, um die phylogenetische Beziehung zwischen Arten und Unterarten und die Bewertung der Variabilität in Brutpopulationen zu untersuchen.

Gespaltene amplifizierte polymorphe Sequenzen (CAPS):

CAPS-Polymorphismen sind Unterschiede in den Restriktionsfragmentlängen, die durch SNPs oder INDELs verursacht werden, die Restriktionsendonuklease-Erkennungsstellen in PCR-Amplikons erzeugen oder aufheben, die von Locus-spezifischen Oligonukleotid-Primern produziert werden.

CAPS-Assays werden durch Verdauen von Locus-spezifischen PCR-Amplikons mit einem oder mehreren Restriktionsenzymen und Trennen der verdauten DNA auf Agarose- oder Polyacrylamidgelen durchgeführt.

Die CAPS-Analyse ist vielseitig und kann mit Einzelstrang-Konformationspolymorphim (SSCP), sequenzcharakterisierter amplifizierter Region (SCAR) oder zufällig amplifizierter polymorpher DNA (RAPD) kombiniert werden, um die Wahrscheinlichkeit zu erhöhen, einen DNA-Polymorphismus zu finden.

Michaels und Amasino (1998) schlugen eine Variante der CAPS-Methode namens dCAPS basierend auf SNPs vor.

Der Genotypisierungsdurchsatz ist mäßig hoch. Es ist ein einfacher PCR-Assay. Marker werden aus den DNA-Sequenzen von zuvor kartierten RFLP-Markern entwickelt. Die meisten CAPS-Marker sind kodominant und ortsspezifisch. Zur Durchführung manueller CAPS-Marker-Assays ist keine spezielle Ausrüstung erforderlich.

CAPS-Markerassays können unter Verwendung halbautomatischer Verfahren durchgeführt werden, z. B. Fluoreszenzassays auf einem DNA-Sequenzer (z. B. ABI377). Die Anlaufkosten für manuelle Assay-Methoden sind gering. CAPS-Assays können mit sehr kleinen DNA-Proben (typischerweise 50 bis 100 ng pro Individuum) durchgeführt werden. Die meisten CAPS-Genotypen sind leicht zu bewerten und zu interpretieren. CAPS-Marker können problemlos zwischen Labors ausgetauscht werden.

Typischerweise muss eine Reihe von Restriktionsenzymen getestet werden, um Polymorphismen zu finden. Obwohl CAPS-Marker immer noch von großem Nutzen sind und nicht übersehen werden sollten, haben sich andere Verfahren als Werkzeuge zum Screenen von ortsspezifischen DNA-Fragmenten auf Polymorphismen herausgebildet, z. B. SNP-Assays. Die Entwicklung von leicht zu bewertenden und interpretierbaren Assays kann für einige Gene schwierig sein, insbesondere für diejenigen, die zu Multi-Gen-Familien gehören.

Dies ist ein einfacher Weg, um PCR-basierte Marker aus den DNA-Sequenzen von zuvor kartierten RFLP-Markern zu entwickeln. Es handelt sich um eine einfache Methode, die auf der Investition einer RFLP-Karte aufbaut und das DNA-Blotting überflüssig macht.

Einfache Sequenzwiederholungen (SSRs):

Simple Sequence Repeats (SSRs) oder Mikrosatelliten sind tandemartig wiederholte Mono-, Di-, Tri-, Tetra-, Penta- und Hexanukleotidmotive. SSR-Längenpolymorphismen werden durch Unterschiede in der Anzahl der Wiederholungen verursacht. SSR-Loci werden einzeln durch PCR amplifiziert, wobei Paare von Oligonukleotid-Primern verwendet werden, die für einzigartige DNA-Sequenzen spezifisch sind, die die SSR-Sequenz flankieren.

Jeffreys (1985) zeigte, dass einige Polymorphismen der Restriktionsfragmentlänge durch VNTRs verursacht werden. Der Name “Mini-Satellit” wurde aufgrund der Ähnlichkeit von VNTRs mit größeren Satelliten-DNA-Wiederholungen geprägt.

SSR-Marker neigen dazu, hoch polymorph zu sein. Der Genotypisierungsdurchsatz ist hoch. Dies ist ein einfacher PCR-Assay. Viele SSR-Marker sind multiallelisch und hoch polymorph. SSR-Marker können gemultiplext werden, entweder funktionell durch das Poolen unabhängiger PCR-Produkte oder durch echte Multiplex-PCR. Es wurden halbautomatische SSR-Genotypisierungsmethoden entwickelt. Die meisten SSRs sind kodominant und ortsspezifisch.

Für die Durchführung von SSR-Assays ist keine spezielle Ausrüstung erforderlich, jedoch ist für einige Assay-Verfahren eine spezielle Ausrüstung erforderlich, z. B. halbautomatische Fluoreszenz-Assays, die an einer DNA-Sequenz durchgeführt werden. Die Anlaufkosten für manuelle Assay-Methoden sind gering (sobald die Marker entwickelt sind). SSR-Assays können mit sehr kleinen DNA-Proben (

100 ng pro Person). SSR-Marker können problemlos zwischen Labors ausgetauscht werden.

Die Entwicklung von SSRs ist arbeitsintensiv. Die Entwicklungskosten für SSR-Marker sind sehr hoch. SSR-Marker sind taxaspezifisch. Die Anlaufkosten für automatisierte SSR-Assay-Methoden sind hoch. Die Entwicklung von PCR-Multiplexen ist schwierig und teuer. Einige Marker können möglicherweise nicht gemultiplext werden.

SSR-Marker werden zur Kartierung von Genen in Eukaryoten verwendet.

Einzelstrang-Konformationspolymorphismen (SSCPs):

SSCPs beziehen sich auf DNA-Polymorphismen, die durch differenzielle Faltung von einzelsträngiger DNA mit Mutationen erzeugt werden. Die Konformation des gefalteten DNA-Moleküls wird durch intramolekulare Wechselwirkungen erzeugt und ist somit eine Funktion der DNA-Sequenz.

SSCP-Markerassays werden unter Verwendung von hitzedenaturierter DNA auf nicht denaturierenden DNA-Sequenzierungsgelen durchgeführt. Spezielle Gele (z. B. Mutationserkennungsverstärkungsgele) wurden entwickelt, um die Entdeckung von einzelsträngigen Konformationspolymorphismen, die durch INDELs, SNPs oder SSRs verursacht werden, zu verbessern.

Es ist ein einfacher PCR-Assay. Viele SSCP-Marker sind multiallelisch und hoch polymorph. Die meisten SSCPs sind kodominant und ortsspezifisch. Es ist keine spezielle Ausrüstung erforderlich. Die Anlaufkosten sind gering. SSCP-Marker-Assays können mit sehr kleinen DNA-Proben (typischerweise 10 bis 50 ng pro Individuum) durchgeführt werden.

SSCP-Marker können problemlos zwischen Labors ausgetauscht werden. SSCP-Gele können mit Silber gefärbt werden (keine Radioaktivität). Die Komplexität von PCR-Produkten kann beurteilt und einzelne Fragmente können isoliert und sequenziert werden.

Die Entwicklung von SSCP-Markern ist arbeitsintensiv. Die Entwicklungskosten für SSCP-Marker können hoch sein. Die SSCP-Markeranalyse kann nicht automatisiert werden.

SSCPs sind in der Humangenetik weit verbreitet, um Krankheitsgene auf DNA-Polymorphismen zu screenen. Obwohl die SSCP-Analyse nicht jeden DNA-Sequenzpolymorphismus aufdeckt, ist die Methodik einfach und es kann eine beträchtliche Anzahl von Polymorphismen entdeckt werden. Die SSCP-Analyse kann ein leistungsstarkes Werkzeug zur Beurteilung der Komplexität von PCR-Produkten sein.

Heteroduplex-Analyse (HA):

Es bezieht sich auf DNA-Polymorphismen, die durch Trennen von Homoduplex- von Heteroduplex-DNA unter Verwendung nicht-denaturierender Gelelektrophorese oder teilweise denaturierender Hochleistungs-Flüssigkeitschromatographie erzeugt werden.

Fehlpaarungen einzelner Basen zwischen Genotypen erzeugen Heteroduplexe, daher signalisiert das Vorhandensein von Heteroduplexen das Vorhandensein von DNA-Polymorphismen. Heteroduplex-Analysen können an zahlreichen Genotypen schnell und effizient durchgeführt werden, bevor spezifische Allele sequenziert werden, wodurch die Sequenzierungskosten bei der SNP-Entdeckung und SNP-Markerentwicklung stark reduziert werden.

Es ist eine leistungsstarke Methode zur SNP-Erkennung. Automatisierte HA kann unter Verwendung von HPLC durchgeführt werden. Die meisten Heteroduplex-Marker sind kodominant und ortsspezifisch. HA kann mit sehr kleinen DNA-Proben durchgeführt werden (typischerweise 10 bis 50 ng pro Individuum). HA-Marker können problemlos zwischen Labors ausgetauscht werden.

Erfordert spezielle Ausrüstung. Für Heteroduplex-Analysen verschiedener Targets über HPLC reicht ein Protokoll möglicherweise nicht aus.

Die Heteroduplex-Analyse wurde hauptsächlich in der Humangenetik verwendet, um Krankheitsgene auf DNA-Polymorphismus zu untersuchen. In der Pflanzenzüchtung wird es zum Nachweis von Krankheitserregern verwendet, die sich im latenten Stadium befinden und daher bei der Selektion krankheitsfreier Pflanzen nützlich sind. Es ist auch nützlich bei der Entdeckung von Einzelnukleotidpolymorphismus.

Einzelnukleotidpolymorphismus (SNP):

Die Variationen, die an einer einzelnen Nukleotidposition gefunden werden, werden als Einzelnukleotidpolymorphismen oder SNP bezeichnet. Eine solche Variation resultiert aus Substitution, Deletion oder Insertion. Diese Art von Polymorphismen hat zwei Allele und wird auch als biallelische Loci bezeichnet. Dies ist die häufigste Klasse von DNA-Polymorphismen. Es wird sowohl in natürlichen Linien als auch nach induzierter Mutagenese gefunden. Die Hauptmerkmale von SNP-Markern sind unten angegeben.

1. SNP-Marker sind hoch polymorph und meist biallelisch.

2. Der Genotypisierungsdurchsatz ist sehr hoch.

3. SNP-Marker sind ortsspezifisch.

4. Solche Variationen resultieren aus Substitution, Deletion oder Insertion.

5. SNP-Marker sind eine ausgezeichnete langfristige Investition.

6. SNP-Marker können verwendet werden, um funktionellen Polymorphismus zu lokalisieren.

7. Diese Technik erfordert eine kleine DNA-Menge.

SNP-Marker sind bei der Genkartierung nützlich. SNPs helfen beim Nachweis von Mutationen auf molekularer Ebene. SNP-Marker sind beim positionellen Klonen eines Mutanten-Locus nützlich. SNP-Marker sind beim Nachweis von krankheitsverursachenden Genen nützlich.

Die meisten SNPs sind bialleleisch und weniger informativ als SSRs. Multiplexing ist nicht für alle Loci möglich. Einige SNP-Assay-Techniken sind kostspielig. Die Entwicklung von SNP-Markern ist arbeitsorientiert. Bei der Erstellung genetischer Karten werden mehr (dreimal) SNPs benötigt als SSR-Marker.

SNPs sind nützlich bei der Erstellung genetischer Karten. Sie wurden bei der Erstellung menschlicher genetischer Karten verwendet. In der Pflanzenzüchtung wurden SNPs in geringerem Maße verwendet.

Expressed Sequence Tags (EST):

Expressed Sequence Tags (ESTs) sind kleine DNA-Stücke und ihre Position und Sequenz auf dem Chromosom sind bekannt. Die Variationen, die an einer einzelnen Nukleotidposition gefunden werden, sind bekannt. Der Begriff Expressed Sequence Tags (ESTs) wurde erstmals 1991 von Venter und seinen Kollegen verwendet. Die Hauptmerkmale von EST-Markern sind unten angegeben.

1. ESTs sind kurze DNA-Sequenzen (200-500 Nukleotide lang).

2. Sie sind eine Art von sequenzgetaggten Stellen (STS).

3. ESTs bestehen nur aus Exons.

Es ist eine schnelle und kostengünstige Technik, um ein Gen zu lokalisieren. ESTs sind nützlich, um neue Gene im Zusammenhang mit genetischen Krankheiten zu entdecken. Sie können zur gewebespezifischen Genexpression verwendet werden.

ESTs haben keine Primspezifität. Es ist eine zeitaufwendige und arbeitsorientierte Technik. Die Präzision ist geringer als bei anderen Techniken. Es ist schwierig, große (> 6kb) Transkripte zu erhalten. Multiplexing ist nicht für alle Loci möglich.

ESTs werden häufig verwendet, um Gene bekannter Funktion zu kartieren. Sie werden auch für phylogenetische Studien und die Generierung von DNA-Arrays verwendet.

Sequenzgetaggte Sites (STS):

In der Genomik ist eine sequenzgetaggte Stelle (STS) eine kurze DNA-Sequenz, die eine einzelne Kopie in einem Genom aufweist und deren Ort und Basensequenz bekannt sind. Die Hauptmerkmale von STS-Markern sind unten aufgeführt.

1. STSs sind kurze DNA-Sequenzen (200-500 Nukleotide lang).

2. STS kommen nur einmal im Genom vor.

3. STS werden durch PCR in Gegenwart aller anderen genomischen Sequenzen nachgewiesen.

4. STSs werden von cDNAs abgeleitet.

STSs sind nützlich bei der physikalischen Kartierung von Genen. Diese Technik ermöglicht die gemeinsame Nutzung von Daten zwischen den Labors. Es ist eine schnelle und spezifischste Technik als DNA-Hybridisierungstechniken. Es hat ein hohes Maß an Genauigkeit. Es kann automatisiert werden.

Die Entwicklung von STS ist eine schwierige Aufgabe. Es ist eine zeitaufwendige und arbeitsorientierte Technik. Es erfordert hohe technische Fähigkeiten.

STS ist die leistungsstärkste physikalische Kartierungstechnik. Es kann verwendet werden, um jeden Ort auf dem Chromosom zu identifizieren. STSs werden als Standardmarker verwendet, um Gene in einer beliebigen Region des Genoms herauszufinden. Es wird verwendet, um detaillierte Karten großer Genome zu erstellen.


Diskussion

Frühere Studien haben auf eine Rolle von HPS bei der Kontrolle des Samenglanzes bei Sojabohnensorten hingewiesen [2, 5]. Jetzt haben wir eine umfangreiche Studie über Hps Kopienzahlpolymorphismen in einer Reihe von Sojabohnenlinien und verwandten Leguminosenarten. Die Struktur der Hps Gen wurde durch Isolieren und Charakterisieren von Klonen aus der genomischen Region untersucht. Die Ergebnisse haben uns dazu veranlasst, ein Modell vorzuschlagen, um die Variation des Samenglanzes zu berücksichtigen, die durch . gesteuert wird Hps.

Aus der Analyse von DNA-Blot-Hybridisierungen verschiedener Sojabohnensorten, -linien und verwandter Arten können wir schließen, dass Hps Kopienzahlpolymorphismen sind bei Sojabohnen weit verbreitet. Die Hps Locus scheint sich in Soja entwickelt und diversifiziert zu haben (Glycin max) im Vergleich zu seinem wilden Vorfahren (Glycin Soja). Hybridisierungsmuster zeigen, dass die Hps Die Sequenz selbst ist ebenfalls für diese beiden Spezies spezifisch, ein Ergebnis, das durch die Suche nach DNA- und Proteinsequenzen in der GenBank (nicht gezeigt) unterstützt wird. HPS weist Ähnlichkeiten mit sogenannten bimodularen Proteinen auf, die pflanzliche Lipidtransferprotein (LTP)-Domänen enthalten [5]. Die pflanzlichen LTPs bilden eine große Gruppe verwandter Proteine, die aus der Prolamin-Superfamilie stammen. Unsere Ergebnisse zeigen, dass sich HPS erheblich von anderen LTPs unterscheidet und dass es bei anderen Arten keine nahen Gegenstücke gibt.

Alle Glycin max Linien, die getestet wurden, enthielten mehrere Kopien der Hps Gen, aber es gab große Unterschiede in der Anzahl der Kopien von Hps je nach untersuchter Sorte. Wir beobachteten eine gute Korrelation zwischen den scheinbaren Hps Kopienzahl, beurteilt durch Hybridisierungsintensität auf DNA-Blots und Samenglanz. Dies gilt insbesondere für Phänotypen mit matten und glänzenden Samen und für Zwischenprodukte zwischen diesen Typen. Diese Beziehung war für Blütenphänotypen nicht offensichtlich, eine Ausnahme, die in früheren Studien festgestellt wurde, die das Auftreten von HPS-Protein mit dem Glanz der Samen korrelierten [2, 5]. Zwei analysierte Blüten-Phänotypen, Clark B1 und Sooty, erzeugten kontrastierende Muster von Hps Hybridisierung. Dies kann durch das Zurückverfolgen des Stammbaums von Clark B1 erklärt werden. Der CV Clark ist ein stumpfer Phänotyp mit einer hohen Kopie Hps RFLP-Muster, wohingegen Sooty ein Bloom-Phänotyp mit einem Low-Copy-RFLP-Muster ist. Clark B1 ist eine Isolinie, die aus einer Kreuzung zwischen Clark und Sooty stammt, mit Clark als wiederkehrendem Elternteil. Dies weist darauf hin, dass der Blütenphänotyp (B1) wird von Genen gesteuert, die unabhängig sind von B und Hps.

Mehrere Kopien von Hps konnten durch konventionelle DNA-Blot-Hybridisierungen in einer Reihe verschiedener Sojabohnen-Kultivare und -Linien nachgewiesen werden. Mehrere genomische Kopien von Hps wurden auch durch Echtzeit-PCR-Analyse nachgewiesen (nicht gezeigt). Die Schätzungen der Kopienzahl aus der Echtzeit-PCR-Analyse waren variabler und übertrafen immer die Schätzungen, die durch konventionelle Hybridisierungen bestimmt wurden. Jede Art von Analyse, Echtzeit-PCR und konventionelle Hybridisierung, wurde viele Male durchgeführt und insgesamt haben wir größeres Vertrauen in die Ergebnisse konventioneller Hybridisierungen. Nach dieser Methode besitzt die Sojabohnensorte Harosoy 63 schätzungsweise 27 ± 5 Kopien von Hps pro haploidem Genom.

Variation in Hps Kopienzahl zwischen verschiedenen Sojabohnenlinien konnte auch durch vergleichende genomische Hybridisierung (CGH) an cDNA-Mikroarrays nachgewiesen werden. Obwohl erhebliche Unterschiede in Hps Kopienzahl wurden von CGH erkannt und quantifiziert die Anzahl der Hps Kopien in einem bestimmten Genom war nicht möglich, da die Hybridisierungsintensitäten nicht kalibriert wurden. Nichtsdestotrotz haben wir gezeigt, dass CGH verwendet werden kann, um nach Kopienzahlpolymorphismen in Pflanzengenomen zu suchen. Es ist eine potenziell leistungsstarke Anwendung von Microarrays, die möglicherweise unterschätzt wird. Beispielsweise könnte genomische DNA aus Pflanzenlinien, die sich in einem bestimmten interessierenden Merkmal unterscheiden, unter Verwendung von Mikroarrays gescreent werden, um Gene zu identifizieren, die Unterschiede in der Kopienzahl aufweisen. Diese Gene könnten als Kandidaten für das interessierende Merkmal getestet werden.

Aus unserer Analyse von Hps Genstruktur weisen mindestens drei Beweise darauf hin, dass die meisten Hps Kopien teilen einen hohen Grad an Sequenzidentität. Erstens zeigen die Hybridisierungsmuster, die beim Verdau von genomischer DNA mit einer Vielzahl von Enzymen erzeugt werden, dass Restriktionsenzymstellen in den meisten Genkopien konserviert wurden. Zweitens, Analyse von Hps genomische Klone weist darauf hin, dass unabhängige Klone mit nahezu identischen Sequenzen separaten Kopien von . entsprechen Hps Gene. Schließlich Codierung von exprimierten Sequenz-Tags Hps Transkripte weisen keinen hohen Sequenzpolymorphismus auf [14, 15]. Es scheint also, dass die meisten Kopien der Hps Gen nicht in der Sequenz divergiert. Dies weist darauf hin, dass die Duplikation und Expansion dieses Genclusters ein kürzlich aufgetretenes Ereignis war oder dass die Sequenzidentität durch häufige Rekombinationsereignisse, die innerhalb des Clusters auftreten, aufrechterhalten wird. Natürlich wäre es wünschenswert, eine zusammenhängende Region genomischer DNA zu klonieren, die das gesamte Tandem-Array von . umfasst Hps Gene. Wir versuchten dies durch Screening bakterieller künstlicher Chromosomen (BAC)-Bibliotheken, waren jedoch erfolglos. Es ist bekannt, dass Tandem-Arrays beim Klonen und Vermehren schwer zu handhaben sind [16], was dieses Ergebnis möglicherweise erklärt.

In der Kreuzung zwischen den Sojabohnenlinien OX281 und Mukden, Hps Kopienzahlpolymorphismen, die mit dem Phänotyp des Samenglanzes cosegregiert sind B und damit verbundene genetische Marker. Dieses Ergebnis wurde erwartet, da frühere Studien gezeigt haben, dass B cosegregiert mit der Anwesenheit von HPS-Protein auf der Samenoberfläche und mit einem DNA-Marker, der von der Hps cDNA-Sequenz [2]. Die mehrfachen Kopien von Hps die in OX281 vorkommen, segregieren auf Mendelsche Weise, was darauf hinweist, dass sie an einem einzigen genetischen Locus vorkommen und nicht über das gesamte Genom verteilt sind. Die Analyse und Montage von Hps genomische Klone untermauern die Vererbungsergebnisse, da die Klone ausgerichtet werden könnten, um ein wiederholtes Array von zu erzeugen Hps Gene. Alle Beweise deuten daher auf ein Tandem-Array von Hps Gene, die in einer strukturellen Konfiguration vorkommen, die sich aus der Genamplifikation ergibt.

Genamplifikation tritt auf, wenn mehrere identische Kopien einer DNA-Sequenz innerhalb des Genoms dupliziert werden. Es kann sich um einen adaptiven Mechanismus handeln, der aus einem selektiven Druck auf das Genom resultiert, wie die in Zelllinien oder Populationen beobachtete Arzneimittel-, Insektizid- oder Herbizidresistenz zeigt [17–19]. Die Amplifikation führt typischerweise zu einem Tandem-Array von sich wiederholenden Einheiten, wie es für Gene beobachtet wird, die rRNA, snRNA und Histone kodieren [17]. Im Gegensatz zu Genen, die einer Duplikation und Divergenz unterliegen [20], sind einzelne Einheiten innerhalb eines Tandem-Arrays eingeschränkt und behalten ein hohes Maß an Sequenzidentität bei. Strukturgene, die in über Generationen stabilen Tandem-Arrays vorkommen, wie rDNAs, gelten als Mechanismus, um den zellulären Bedarf an großen Mengen identischer Genprodukte zu decken. In Tandem-Arrays eingebettete genetische Komponenten, die die Genamplifikation stabilisieren oder fördern, wurden vorgeschlagen, wie z. B. AT-reiche Trakte, autonom replizierende Sequenzelemente (ARS) und Matrix-Attachment-Regionen (MAR) [17]. Diese cis-wirkenden Elemente wurden sogar verwendet, um die Genkopienzahl und das Expressionsniveau von heterologen Genen in transformierten Zellen zu modulieren [21].

Somit sind die Eigenschaften des Hps Locus scheinen mit Merkmalen konsistent zu sein, die mit anderen amplifizierten Genen von Pflanzen und Tieren assoziiert sind. Es ist bekannt, dass Pflanzengenome viele große Genfamilien haben und duplizierte Gene, die in Tandem-Arrays vorkommen, sind ebenfalls ziemlich verbreitet [22]. Eines der größten in Pflanzen charakterisierten Tandem-Arrays entspricht einem Gencluster von 22 Kopien, die für Alpha-Zeine in kodieren Zea mays [23], aber es gibt nur wenige andere Beispiele für umfangreiche Arrays nahezu identischer Strukturgene an einem Locus. Die Hps Locus ist auch aufgrund der allelischen Variation der Kopienzahl dieses Genclusters zwischen verschiedenen Sojabohnensorten und -linien außergewöhnlich. Obwohl nicht klar ist, ob alle Kopien von Hps funktionell exprimiert und transkribiert werden, haben frühere Arbeiten gezeigt, dass Transkripte, die Hps sind weitaus häufiger im Endokarp von Sojabohnenlinien mit vielen genomischen Kopien von Hps als in Zeilen mit wenigen Exemplaren [5].

Die Ergebnisse dieser Studie können zusammen mit früheren Arbeiten [2, 5] in ein Modell integriert werden, wobei Hps Die genomische Kopienzahl wirkt als genetischer Rheostat, um den Transkriptions- und Translationsfluss und die resultierende Menge an HPS-Protein, das vom Endokarp synthetisiert wird, zu kontrollieren. Variationen der im Endokarp exprimierten HPS-Proteinspiegel könnten dann das variable Muster der Anheftung dieses Gewebes an die Samenoberfläche und die resultierenden Samenglanz-Phänotypen erklären. Alternative Erklärungen können nicht ausgeschlossen werden, aber die bisherige Evidenz spricht für diese auf Genamplifikation basierende Hypothese. Welcher Selektionsdruck könnte dazu führen? Größe, Form, Farbe und allgemeines Erscheinungsbild des Saatguts sind Merkmale, die bei Nutzpflanzen, insbesondere bei Hülsenfrüchten, einem starken Selektionsdruck ausgesetzt sind. Auch heute können bestimmte Märkte für bestimmte Verwendungszwecke stumpfe oder glänzende Sojabohnen bevorzugen, daher ist es nicht unvernünftig anzunehmen, dass die Selektion auf verschiedene Glanzphänotypen die Entwicklung und Expansion dieser Kultur seit ihrer Domestikation vor etwa 3.000 Jahren begleitet hat [24].


Wir danken L. Hood und D. Smoller für hilfreiche Diskussionen A.J. Ross, S. O'Brien und A. Cziko für Bienensammlungen S. O'Brien für Bienenhirndissektionen D. Toma für die RNA-Extraktion M. Rebeiz für die Unterstützung bei der PERL-Programmierung A. Cziko für die Unterstützung bei der Mikroarray-Herstellung und R. Hoskins , S. Clough und Mitgliedern des Robinson-Labors für die Überprüfung des Manuskripts. Besonderer Dank geht an H. A. Lewin, Direktor des Keck Centers, für die hervorragende Beratung während des gesamten Projekts und seinen unermüdlichen und kreativen Einsatz, die Genomforschung auf diesem Campus zu ermöglichen. Diese Forschung wurde durch ein NSF Postdoctoral Fellowship in Bioinformatics (C.W.W.) und Stipendien des Critical Research Initiatives Program der University of Illinois und des Burroughs Wellcome Trust (G.E.R.) unterstützt.

Die Veröffentlichungskosten dieses Artikels wurden teilweise durch die Zahlung von Seitengebühren bestritten. Dieser Artikel muss daher hiermit gemäß 18 USC Abschnitt 1734 als �vertisement” gekennzeichnet werden, nur um auf diese Tatsache hinzuweisen.


EXTRINSISCH FLUORESZIERENDE PROTEINE MIT EXOGENEN LIGANDEN

Analog zu den Proteinen, die endogene Fluorophore binden, wurden auch Proteine ​​entwickelt, die exogene Fluorophore binden. Die am besten charakterisierten davon sind Fluorogen-aktivierende Proteine, einkettige Antikörper, die ein nichtfluoreszierendes Molekül binden und es in einem fluoreszierenden Zustand stabilisieren (Szent-Györgyi et al., 2008 Bruchez, 2015). Diese sind im Handel sowohl mit zelldurchlässigen als auch mit zellundurchlässigen Liganden erhältlich, was eine Unterscheidung zwischen intrazellulären Fusionen und extrazellulären Fusionen ermöglicht. A related labeling scheme is that of FlAsH/ReAsh, in which a six–amino acid tetracysteine motif recognizes arsenic-containing dyes (Griffin et al., 1998 Gaietta et al., 2002). By themselves, the dyes are not fluorescent, but they become fluorescent when bound to the tetracysteine tag. Nonspecific binding to cysteines can lead to background fluorescence and is suppressed by washing with sulfhydryl-containing compounds. Although not widely used, this labeling scheme is noteworthy because the tag is very small. Spectral properties for these tags are given in Table 1.

An alternative way to fluorescently label a protein of interest is by covalently coupling a dye molecule to it. Although this has long been done in vitro using amine- or sulfhydryl-reactive dyes, more recently, self-labeling tag sequences have been used for this. These tags covalently react with a small-molecule substrate containing a fluorophore (Table 2). The most widely used tags are the SNAP(f), CLIP(f), and Halo tags (Keppler et al., 2003 Gautier et al., 2008 Los et al., 2008 Sun et al., 2011). The SNAP and CLIP tags are variants of Ö 6 -alkylguanine-DNA alkyltransferase that react with benzylguanine and benzylcytosine derivatives, respectively (Figure 1). The Halo tag is derived from haloalkane dehalogenase and reacts with alkylhalides. A similar but less widely used tag is the TMP tag, which uses an engineered Escherichia coli dihydrofolate reductase to react with trimethoprim-fused fluorophores (Miller et al., 2005 Chen et al., 2012). In these systems, the reactive group that covalently binds to the tag is independent of the attached fluorophore, allowing a wide variety of fluorophores (and other molecules, such as affinity tags) to be attached. This chemical versatility allows changing the label on the protein by simply changing the substrate and enables experiments that would be difficult to carry out with other tags, such as two-color pulse-chase labeling by first incubating with one substrate and then by a second, or distinguishing intracellular from extracellular protein by labeling with cell-permeant and cell-impermeant substrates. The major drawback to these proteins is the added complexity of using an external substrate that is itself fluorescent and may require washing to reduce background, although there is a version of the TMP tag that reacts with nonfluorescent substrates to produce fluorescent adducts (Jing and Cornish, 2013). In addition, newly synthesized protein is fluorescently labeled only if substrate is available, which makes these methods less useful for long time-lapse imaging experiments.

TABLE 2: Other genetically encoded tagging strategies.

Modular tags for protein and RNA sequences that are discussed in the text are listed here. For more information, see the text.


Abstrakt

The prediction that selection affects the genome in a locus-specific way also affecting flanking neutral variation, known as genetic hitchhiking, enables the use of polymorphic markers in noncoding regions to detect the footprints of selection. However, as the strength of the selective footprint on a locus depends on the distance from the selected site and will decay with time due to recombination, the utilization of polymorphic markers closely linked to coding regions of the genome should increase the probability of detecting the footprints of selection as more gene-containing regions are covered. The occurrence of highly polymorphic microsatellites in the untranslated regions of expressed sequence tags (ESTs) is a potentially useful source of gene-associated polymorphisms which has thus far not been utilized for genome screens in natural populations. In this study, we searched for the genetic signatures of divergent selection by screening 95 genomic and EST-derived mini- and microsatellites in eight natural Atlantic salmon, Salmo salar L., populations from different spatial scales inhabiting contrasting natural environments (salt-, brackish, and freshwater habitat). Altogether, we identified nine EST-associated microsatellites, which exhibited highly significant deviations from the neutral expectations using different statistical methods at various spatial scales and showed similar trends in separate population samples from different environments (salt-, brackish, and freshwater habitats) and sea areas (Barents vs. White Sea). We consider these ESTs as the best candidate loci affected by divergent selection, and hence, they serve as promising genes associated with adaptive divergence in Atlantic salmon. Our results demonstrate that EST-linked microsatellite genome scans provide an efficient strategy for discovering functional polymorphisms, especially in nonmodel organisms.


Present address: Program in Genetics and Genomic Biology, Hospital for Sick Children, University Avenue, Toronto, Ontario, M5G 1X8, Canada

Present address: Facultad de Química, Cátedra de Inmunología, Universita de la Republica, Montevideo, 11300, Uruguay

Mitgliedschaften

Institute of Cell, Animal and Population Biology, University of Edinburgh, Edinburgh, EH9 3JT, UK

Yvonne M Harcus, John Parkinson, Cecilia Fernández, Jennifer Daub, Mark L Blaxter & Rick M Maizels

Department of Biological Sciences, Imperial College London, London, SW7 2AZ, UK


Schau das Video: How to sequence the human genome - Mark J. Kiel (Oktober 2022).