Information

Welche Domänen oder Motive können sowohl an DNA als auch an RNA binden?

Welche Domänen oder Motive können sowohl an DNA als auch an RNA binden?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Domänen oder Motive von Transkriptionsfaktoren sind katalytisch aktiv, um an die Nukleinsäure eines beliebigen Typs zu binden. Wo finde ich eine Liste von Domänen oder Motiven, die sich sowohl an DNA als auch an RNA anlagern können? zum Beispiel binden KH-Domänen entweder an RNA oder einzelsträngige DNA.


Prion

Prionen sind fehlgefaltete Proteine ​​mit der Fähigkeit, ihre fehlgefaltete Form auf normale Varianten desselben Proteins zu übertragen. Sie charakterisieren mehrere tödliche und übertragbare neurodegenerative Erkrankungen beim Menschen und vielen anderen Tieren. [3] Es ist nicht bekannt, was die Fehlfaltung des normalen Proteins verursacht, aber die abnormale dreidimensionale Struktur wird vermutet, dass sie infektiöse Eigenschaften verleiht und benachbarte Proteinmoleküle in die gleiche Form kollabiert. Das Wort Prion leitet sich von "proteinartigen infektiösen Partikeln" ab. [4] [5] [6] Die hypothetische Rolle eines Proteins als Infektionserreger steht im Gegensatz zu allen anderen bekannten Infektionserregern wie Viroiden, Viren, Bakterien, Pilzen und Parasiten, die alle Nukleinsäuren (DNA, RNA oder beides).

Prion-Isoformen des Prion-Proteins (PrP), deren spezifische Funktion ungewiss ist, werden als Ursache für übertragbare spongiforme Enzephalopathien (TSE) vermutet [7] einschließlich Scrapie bei Schafen, chronischer Auszehrungskrankheit (CWD) bei Hirschen, boviner spongiformer Enzephalopathie ( BSE) bei Rindern (allgemein bekannt als "Rinderwahnsinn") und Creutzfeldt-Jakob-Krankheit (CJK) beim Menschen. Alle bekannten Prionenkrankheiten bei Säugern beeinflussen die Struktur des Gehirns oder anderer neuraler Gewebe alle sind fortschreitend, haben keine bekannte wirksame Behandlung und sind immer tödlich. [8] Bis 2015 wurde angenommen, dass alle bekannten Prionenkrankheiten bei Säugetieren durch das Prionprotein (PrP) verursacht werden, aber im Jahr 2015 wurde die multiple Systematrophie (MSA) als durch eine Prionenform von Alpha-Synuclein verursacht. [9]

Prionen bilden abnormale Aggregate von Proteinen, die Amyloide genannt werden, die sich in infiziertem Gewebe ansammeln und mit Gewebeschäden und Zelltod in Verbindung gebracht werden. [10] Amyloide sind auch für mehrere andere neurodegenerative Erkrankungen wie Alzheimer und Parkinson verantwortlich. [11] [12] Prionenaggregate sind stabil, und diese strukturelle Stabilität bedeutet, dass Prionen resistent gegen Denaturierung durch chemische und physikalische Mittel sind: Sie können nicht durch normale Desinfektion oder Kochen zerstört werden. Dies erschwert die Entsorgung und Eindämmung dieser Partikel.

Eine Prionenerkrankung ist eine Art von Proteopathie oder eine Erkrankung strukturell abnormaler Proteine. Beim Menschen wird angenommen, dass Prionen die Ursache der Creutzfeldt-Jakob-Krankheit (CJK), ihrer Variante (vCJK), des Gerstmann-Sträussler-Scheinker-Syndroms (GSS), der tödlichen familiären Schlaflosigkeit (FFI) und des Kuru sind. [4] Es gibt auch Hinweise darauf, dass Prionen eine Rolle im Prozess der Alzheimer-Krankheit, der Parkinson-Krankheit und der amyotrophen Lateralsklerose (ALS) spielen könnten Prionen-ähnliche Erkrankungen. [13] [14] [15] [16] Mehrere Hefeproteine ​​wurden ebenfalls mit prionogenen Eigenschaften identifiziert. [17] [18] Die Replikation von Prionen unterliegt wie bei anderen Replikationsformen der Epimutation und natürlichen Selektion, und ihre Struktur variiert leicht zwischen den Arten. [19]


Inhalt

Virale RdRps wurden in den frühen 1960er Jahren aus Studien mit Mengovirus und Poliovirus entdeckt, als beobachtet wurde, dass diese Viren gegenüber Actinomycin D, einem Medikament, das die zelluläre DNA-gerichtete RNA-Synthese hemmt, nicht empfindlich waren. Dieser Mangel an Sensitivität deutet darauf hin, dass es ein virusspezifisches Enzym gibt, das RNA von einer RNA-Matrize und nicht von einer DNA-Matrize kopieren könnte.

RdRps sind in allen Viren hochkonserviert und sogar mit Telomerase verwandt, obwohl der Grund dafür seit 2009 eine anhaltende Frage ist. [3] Die Ähnlichkeit hat zu Spekulationen geführt, dass virale RdRps Vorfahren der menschlichen Telomerase sind.

Das bekannteste Beispiel für RdRP ist das Polio-Virus. Das virale Genom besteht aus RNA, die durch rezeptorvermittelte Endozytose in die Zelle gelangt. Von dort aus kann die RNA sofort als Matrize für die komplementäre RNA-Synthese fungieren. Der komplementäre Strang ist dann selbst in der Lage, als Matrize für die Produktion neuer viraler Genome zu fungieren, die weiter verpackt und aus der Zelle freigesetzt werden, um weitere Wirtszellen zu infizieren. Der Vorteil dieser Replikationsmethode besteht darin, dass es kein DNA-Stadium gibt, die Replikation ist schnell und einfach. Der Nachteil ist, dass es keine „Backup“-DNA-Kopie gibt.

Viele RdRps sind eng mit Membranen verbunden und daher schwer zu untersuchen. Die bekanntesten RdRps sind das poliovirale 3Dpol, das vesikuläre Stomatitis-Virus L [4] und das Hepatitis-C-Virus-NS5B-Protein.

Viele Eukaryoten haben auch RdRps, die an der RNA-Interferenz beteiligt sind, diese amplifizieren microRNAs und kleine temporale RNAs und produzieren doppelsträngige RNA unter Verwendung kleiner interferierender RNAs als Primer. [5] Tatsächlich können dieselben RdRps, die in den Abwehrmechanismen verwendet werden, von RNA-Viren zu ihrem Vorteil an sich gerissen werden. [6] Ihre Evolutionsgeschichte wurde überprüft. [7]

RdRp unterscheidet sich von RNA-Polymerase dadurch, dass es die Synthese eines RNA-Strangs katalysiert, der zu einer gegebenen RNA-Matrize komplementär ist, anstatt eine DNA-Matrize zu verwenden. Der RNA-Replikationsprozess ist, wie beschrieben, ein vierstufiger Mechanismus.

  1. Bindung von Nukleotidtriphosphat (NTP) – anfangs präsentiert sich das RdRp mit einem freien aktiven Zentrum, an das das NTP bindet. Eine korrekte NTP-Bindung führt dazu, dass die RdRp eine Konformationsänderung durchmacht. [8]
  2. Schließung des aktiven Zentrums – die durch die korrekte NTP-Bindung eingeleitete Konformationsänderung führt zu einer Einschränkung des Zugangs zum aktiven Zentrum und erzeugt einen katalytisch kompetenten Zustand. [8]
  3. Phosphodiesterbindungsbildung - Zwei Mg 2+ -Ionen liegen im katalytisch aktiven Zustand vor und ordnen sich so um den RNA-Primer an, dass das Substrat NTP einen Phosphatidyltransfer eingehen und mit der vorhandenen Nukleotidkette eine Phosphodiesterbindung eingehen kann. [9] Bei Verwendung dieser Mg 2+ -Ionen ist das aktive Zentrum nicht mehr katalytisch stabil und der RdRp-Komplex geht in eine offene Konformation über. [9]
  4. Translokation – sobald das aktive Zentrum geöffnet ist, kann sich der RNA-Strang durch den RdRp-Proteinkomplex bewegen und ein neues NTP binden und die Kettenverlängerung fortsetzen, sofern die Matrize nicht anders spezifiziert. [8]

Die RNA-Synthese kann mit einem Primer-unabhängigen (de novo) oder einen Primer-abhängigen Mechanismus, der einen viralen Protein Genom-linked (VPg) Primer verwendet. [10] Die de novo Die Initiierung besteht in der Zugabe eines Nukleosidtriphosphats (NTP) zum 3'-OH des ersten initiierenden NTP. [10] Während der folgenden sogenannten Elongationsphase wird diese Nukleotidyltransferreaktion mit nachfolgenden NTPs wiederholt, um das komplementäre RNA-Produkt zu erzeugen. Die Termination der durch RdRp produzierten naszierenden RNA-Kette ist nicht vollständig bekannt, es wurde jedoch gezeigt, dass die RdRp-Termination sequenzunabhängig ist. [11]

Ein großer Nachteil der RNA-abhängigen RNA-Polymerase-Replikation ist die immense Fehlerrate bei der Transkription. [10] Es ist bekannt, dass RdRps einen Mangel an Genauigkeit in der Größenordnung von 10 4 Nukleotiden aufweisen, was vermutlich eine direkte Folge seiner unzureichenden Korrekturlesefähigkeiten ist. [10] Diese hohe Variationsrate wird in viralen Genomen begünstigt, da sie es dem Pathogen ermöglicht, Abwehrmechanismen zu überwinden, die von Wirten entwickelt wurden, die versuchen, eine Infektion zu vermeiden, was ein evolutionäres Wachstum ermöglicht.

Virale/prokaryontische RNA-gerichtete RNA-Polymerasen verwenden zusammen mit vielen Einzeluntereinheiten-DNA-gerichteten Polymerasen eine Falte, deren Organisation mit der Form einer rechten Hand mit drei Unterdomänen verbunden ist, die Finger, Handfläche und Daumen genannt werden. [12] Nur die Palm-Subdomäne, die aus einem viersträngigen antiparallelen Beta-Faltblatt mit zwei Alpha-Helices besteht, ist von all diesen Enzymen gut konserviert. In RdRp umfasst die Palm-Subdomäne drei gut konservierte Motive (A, B und C). Motiv A (D-x(4,5)-D) und Motiv C (GDD) liegen räumlich nebeneinander, die Asparaginsäurereste dieser Motive sind an der Bindung von Mg 2+ und/oder Mn 2+ beteiligt. Der Asparaginrest von Motiv B ist an der Selektion von Ribonukleosidtriphosphaten gegenüber dNTPs beteiligt und bestimmt somit, ob RNA statt DNA synthetisiert wird. [13] Die Domänenorganisation [14] und die 3D-Struktur des katalytischen Zentrums eines breiten Spektrums von RdRps, auch von solchen mit geringer Gesamtsequenzhomologie, bleiben erhalten. Das katalytische Zentrum wird von mehreren Motiven gebildet, die eine Reihe konservierter Aminosäurereste enthalten.

Eukaryotische RNA-Interferenz erfordert eine zelluläre RNA-abhängige RNA-Polymerase (c RdRp). Im Gegensatz zu den "Hand"-Polymerasen ähneln sie vereinfachten DNA-abhängigen RNA-Polymerasen (DdRPs) mit mehreren Untereinheiten, insbesondere in den katalytischen β/β'-Untereinheiten, indem sie zwei Sätze von Doppel-psi-β-Fässern im aktiven Zentrum verwenden. QDE1 ( Q9Y7G6 ) in Neurospora crassa, das beide Fässer in derselben Kette hat, [15] ist ein Beispiel für ein solches Enzym. [16] Bakteriophagenhomologe, einschließlich des ähnlich einkettigen DdRp yonO (O31945), scheinen näher an c RdRps zu sein als DdRPs. [5] [17]

Es gibt 4 Superfamilien von Viren, die alle RNA-haltigen Viren ohne DNA-Stadium abdecken:

  • Viren, die Positivstrang-RNA oder Doppelstrang-RNA enthalten, ausgenommen Retroviren und Birnaviridae
    • Alle eukaryontischen Viren mit positivem RNA-Strang ohne DNA-Stadium
    • Bei allen RNA-haltigen Bakteriophagen gibt es zwei Familien von RNA-haltigen Bakteriophagen: Leviviridae (positive ssRNA-Phagen) und Cystoviridae (dsRNA-Phagen)
    • dsRNA-Virusfamilie Reoviridae, Totiviridae, Hypoviridae, Partitiviridae

    Die RNA-Transkription ähnelt [ wie? ], aber nicht dasselbe wie die DNA-Replikation.

    Flaviviren produzieren ein Polyprotein aus dem ssRNA-Genom. Das Polyprotein wird in eine Reihe von Produkten gespalten, darunter NS5, eine RNA-abhängige RNA-Polymerase. Diese RNA-gerichtete RNA-Polymerase besitzt eine Reihe kurzer Regionen und Motive, die zu anderen RNA-gerichteten RNA-Polymerasen homolog sind. [18]

    RNA-Replikase, die in Positivstrang-ssRNA-Viren gefunden werden, sind miteinander verwandt und bilden drei große Superfamilien. [19] Birnavirale RNA-Replikase ist insofern einzigartig, als ihr das Motiv C (GDD) in der Handfläche fehlt. [20] Mononegaviraler RdRp (PDB 5A22) wurde automatisch als ähnlich zu (+)-ssRNA-RdRps klassifiziert, insbesondere einer von Pestivirus und einer von Leviviridae. [21] Bunyavirales RdRp-Monomer (PDB 5AMQ) ähnelt dem heterotrimeren Komplex von Orthomyxoviral (Influenza PDB 4WSB) RdRp. [22]

    Da es ein universelles Protein für RNA-enthaltende Viren ist, ist RdRp ein nützlicher Marker für das Verständnis ihrer Evolution. [23] Die allgemeine strukturelle Evolution von viralen RdRps wurde überprüft. [24]

    Rekombination Bearbeiten

    Bei der Replikation seines (+)ssRNA-Genoms ist das Poliovirus RdRp in der Lage, eine Rekombination durchzuführen. Die Rekombination scheint durch einen Copy-Choice-Mechanismus zu erfolgen, bei dem die RdRp während der Negativstrangsynthese (+)ssRNA-Matrizen umschaltet. [25] Die Rekombinationsfrequenz wird teilweise durch die Genauigkeit der RdRp-Replikation bestimmt. [26] RdRP-Varianten mit hoher Replikationstreue zeigen eine reduzierte Rekombination, und RdRPs mit niedriger Wiedergabetreue zeigen eine erhöhte Rekombination. [26] Die Rekombination durch RdRp-Strangwechsel findet auch häufig während der Replikation in den (+)ssRNA-Pflanzen-Carmoviren und -Tombusviren statt. [27]

    Intragene Komplementation Bearbeiten

    Sendai-Virus (Familie) Paramyxoviridae) hat ein lineares, einzelsträngiges, negatives, nicht segmentiertes RNA-Genom. Die virale RdRp besteht aus zwei viruskodierten Untereinheiten, einer kleineren P und einer größeren L. Wenn verschiedene inaktive RdRp-Mutanten mit Defekten über die gesamte Länge der L-Untereinheit in paarweisen Kombinationen getestet wurden, wurde in einigen Fällen eine Wiederherstellung der viralen RNA-Synthese beobachtet Kombinationen. [28] Diese positive L-L-Wechselwirkung wird als intragene Komplementation bezeichnet und weist darauf hin, dass das L-Protein ein Oligomer im viralen RNA-Polymerase-Komplex ist.

    RdRps können als Wirkstoff-Targets für virale Pathogene verwendet werden, da ihre Funktion für das eukaryontische Überleben nicht notwendig ist. Durch die Hemmung der RNA-abhängigen RNA-Polymerasefunktion können neue RNAs nicht von einem RNA-Matrizenstrang repliziert werden, die DNA-abhängige RNA-Polymerase bleibt jedoch funktionsfähig.

    Derzeit gibt es antivirale Medikamente gegen Hepatitis C und COVID-19, die speziell auf RdRp abzielen. Dazu gehören Sofosbuvir und Ribavirin gegen Hepatitis C [29] und Remdesivir, das einzige von der FDA zugelassene Medikament gegen COVID-19.

    GS-441524-Triphosphat ist ein Substrat für RdRP, jedoch nicht für Säuger-Polymerasen. Es führt zu einem vorzeitigen Kettenabbruch und einer Hemmung der Virusreplikation. GS-441524-Triphosphat ist die biologisch aktive Form des Phosphat-Prodrugs Remdesivir. Remdesivir wird als Nukleotidanalogon klassifiziert, in dem es die Funktion von RdRp hemmt, indem es kovalent an die entstehende RNA bindet und deren Termination durch frühe oder verzögerte Termination unterbricht oder eine weitere Verlängerung des RNA-Polynukleotids verhindert. [30] [31] Diese frühe Termination führt zu nichtfunktioneller RNA, die durch normale zelluläre Prozesse abgebaut wird.

    Die Verwendung von RNA-abhängiger RNA-Polymerase spielt eine wichtige Rolle bei der RNA-Interferenz in Eukaryoten, einem Prozess, der verwendet wird, um die Genexpression durch die Bindung kleiner interferierender RNAs (siRNAs) an die mRNA, die sie inaktiv macht, zum Schweigen zu bringen. [32] Eukaryotisches RdRp wird in Gegenwart von dsRNA aktiv, RdRp ist jedoch nur in einer ausgewählten Untergruppe von Eukaryoten vorhanden, einschließlich C. elegans und P. tetraurelia. [33] Diese Anwesenheit von dsRNA löst die Aktivierung von RdRp- und RNAi-Prozessen aus, indem sie die Initiation der RNA-Transkription durch die Einführung von siRNAs in das System anregt. [33] In C. elegans, werden siRNAs in den RNA-induzierten Silencing-Komplex RISC integriert, der zusammen mit mRNAs, die auf Interferenzen abzielen, mehr RdRps rekrutiert, um mehr sekundäre siRNAs zu synthetisieren und die Genexpression zu unterdrücken. [34]


    Methoden

    Die untersuchten ssDNA-ssDBPs- und ssRNA-ssRBPs-Systeme

    Für eine umfassende Analyse einer Vielzahl von Wechselwirkungen zwischen Proteinen und einzelsträngigen Nukleinsäuren untersuchten wir 12 Komplexe: sechs ssDNA-ssDBP-Komplexe und sechs ssRNA-ssRBP-Komplexe, deren dreidimensionale Strukturen bekannt sind (zusammengefasst in Tabelle 1). Die Sätze von Protein-DNA- und Protein-RNA-Komplexen umfassen Proteine ​​mit unterschiedlichen Funktionen, mit unterschiedlich großen Faltungen und mit heterogenen ssDNA/ssRNAs mit unterschiedlichen Längen und Sequenzen. Die Proteine ​​in diesen ssDNA-ssDBP-Komplexen gehören zu verschiedenen Strukturdomänen: der Oligonukleotid/Oligosaccharid-Bindungs-(OB)-Faltung, der RNA-Erkennungsmotiv-(RRM)-Domäne und der K-Homologie-(KH)-Domäne. Wir bemerken, dass sich die vier Komplexe mit OB-Falten in ihrer Struktur unterscheiden (ich.e., Proteinlänge) und Sequenzen. Ebenso wurden die sechs ssRNA-ssRBP-Komplexe ausgewählt, um verschiedene strukturelle Domänen abzudecken, nämlich die OB-Faltung, RRM, PUF-Domäne, Zinkfingerdomäne, RAMP-Protein und ein Fab. Insgesamt betrachteten wir verschiedene Faltungen, bei denen die elektrostatischen und aromatischen Stapelenergiebeiträge von einem sehr hohen Stapelenergieanteil (der OB-Faltung) bis zu einem hohen elektrostatischen Energieanteil (KH-Domäne und RAMP) variieren. Ausgehend von den verfügbaren Strukturen der 12 hier untersuchten Komplexe und den verfügbaren ungebundenen Strukturen erscheint es unwahrscheinlich, dass die Proteine ​​eine erhebliche Konformationsänderung durchlaufen, um ihre ssDNA/ssRNA-Liganden zu binden. Die ssDNA- und ssRNA-Moleküle sind in Lösung viel flexibler als gefaltete Proteine. Dementsprechend kann man schlussfolgern, dass die Bindungsoberflächen in ssDBPs und ssRBPs vordefiniert sind und eine große Konformationsänderung nur für ssDNA/ssRNA auftritt.


    Titel: RNA-abhängiges RNA-Targeting durch CRISPR-Cas9

    Die Bindung und Spaltung von doppelsträngiger DNA (dsDNA) durch Cas9 ist ein Kennzeichen der bakteriellen adaptiven Immunität von Typ II CRISPR-Cas. Es wird angenommen, dass alle bekannten Cas9-Enzyme DNA ausschließlich als natürliches Substrat erkennen, das Schutz gegen DNA-Phagen und -Plasmide bietet. Hier zeigen wir, dass Cas9-Enzyme der beiden Subtypen II-A und II-C einzelsträngige RNA (ssRNA) durch einen RNA-gesteuerten Mechanismus erkennen und spalten können, der unabhängig von einer Protospacer-adjacent-Motiv (PAM)-Sequenz im Ziel ist RNA. Die RNA-gesteuerte RNA-Spaltung ist programmierbar und ortsspezifisch, und wir stellen fest, dass diese Aktivität genutzt werden kann, um die Infektion durch einzelsträngige RNA-Phagen in vivo zu reduzieren. Wir zeigen auch, dass Cas9 die PAM-unabhängige Unterdrückung der Genexpression in Bakterien steuern kann. Zusammenfassend zeigen diese Ergebnisse, dass eine Untergruppe von Cas9-Enzymen die Fähigkeit besitzt, sowohl auf DNA- als auch auf RNA-Zielsequenzen einzuwirken, und legen das Potenzial für die Verwendung in programmierbaren RNA-Targeting-Anwendungen nahe.


    RG-reiche Repeats — Das Schweizer Taschenmesser der Protein-RNA-Interaktionen

    Ein häufig vorkommendes ungeordnetes RNA-Bindungsmotiv in RBPs besteht aus Repeats von Arginin und Glycin, die als RGG-Boxen oder GAR-Repeats bezeichnet werden. Diese Sequenzen sind sowohl in der Anzahl der Wiederholungen als auch in ihrem Abstand heterogen. Eine kürzlich durchgeführte Analyse teilte diese RG-reichen Regionen in Di- und Tri-RG- und -RGG-Boxen ein und identifizierte Fälle solcher Wiederholungen in der Größenordnung von Dutzenden (Di- und Tri-RGG) bis Hunderten (Tri-RG) und fast zweitausend (di-RG)-Proteine ​​[47]. Proteine, die solche Repeats enthalten, sind an RNA-Stoffwechselfunktionen angereichert [47]. Es ist jedoch derzeit nicht klar, ob die verschiedenen Wiederholungsarchitekturen unterschiedliche funktionale Signaturen bereitstellen.

    Die RGG-Box wurde zuerst im heterogenen nuklearen Ribonukleoprotein Protein U (hnRNP-U, auch bekannt als SAF-A) als ausreichender und für die RNA-Bindung erforderlicher Bereich identifiziert (Tabelle 1, Abb. 1). hnRNP-U hat keine kanonischen RBDs, hat aber eine semistrukturierte SAP-Domäne, die an der DNA-Bindung beteiligt ist [48–50]. Es wurde festgestellt, dass hnRNP-U Hunderte von nicht-kodierenden RNAs angreift, einschließlich kleiner nukleärer (sn)RNAs, die am RNA-Spleißen beteiligt sind, und einer Reihe langer nicht-kodierender (lnc)RNAs, in einer RGG-Box-abhängigen Weise [51 ]. Die RGG-vermittelte Interaktion von hnRNP-U mit den lncRNAs Xist [52] und PANDA [53] wurde mit der epigenetischen Regulation in Verbindung gebracht.

    Die RG[G]-vermittelte RNA-Bindung spielt auch beim nuklearen RNA-Export eine Rolle, wie durch den nuklearen RNA-Exportfaktor 1 (NXF1) veranschaulicht. Während NXF1 ein RRM enthält, das RNA binden kann [54], wird der größte Teil der in vivo-RNA-Bindungskapazität der RGG-haltigen, N-terminalen Region zugeschrieben [55] (Tabelle 1). Die Arginine in diesem Motiv spielen eine Schlüsselrolle in der Interaktion mit RNA, die sequenzunabhängig, aber für den RNA-Export notwendig ist [55]. Die Gesamtaffinität von NXF1 für RNA ist gering [55, 56] und erfordert die Zusammenarbeit mit dem Exportadapter ALY/REF [57]. ALY/REF trägt auch eine N-terminal ungeordnete argininreiche Region, die einer RGG-Box ähnelt [57] und sowohl die RNA-Bindung [54, 58, 59] als auch die Interaktion mit NXF1 [60] vermittelt. Die Aktivierung von NXF1 wird vermutlich durch die Bildung eines ternären Komplexes zwischen ALY/REF und NXF1 ausgelöst, in dem ihre RG-reichen ungeordneten Regionen eine zentrale Rolle spielen. Analoge Sequenzen wurden in viralen Proteinen identifiziert und erleichtern auch den viralen RNA-Export durch Umgehen kanonischer nuklearer Exportwege (Tabelle 1).

    Fragile X mental retardation protein (FMRP) ist ein weiteres RBP mit einer gut charakterisierten, RNA-bindenden RGG-Box (Abb. 1). Der Verlust der FMRP-Aktivität ist an der Translationsrepression im Gehirn beteiligt [61] und führt zu Veränderungen der synaptischen Konnektivität [62], zu geistiger Retardierung [63–65] und kann auch das Auftreten neurodegenerativer Erkrankungen fördern [66]. Zusätzlich zu seiner RGG-Box enthält FMRP zwei KH-Domänen, die zur RNA-Bindung beitragen. Es wurde gezeigt, dass die RGG-Box von FMRP mit hoher Affinität mit G-Quadruplex-RNA-Strukturen interagiert [67–77]. Die RGG-Box ist in ihrem ungebundenen Zustand unstrukturiert [70, 78], faltet sich jedoch bei Bindung an einen guaninreichen, strukturierten G-Quadruplex in der Ziel-RNA [78] (Abb. 2). Sowohl Arginine als auch Glycine spielen eine Schlüsselrolle in der Funktion der RGG-Box und der Ersatz dieser Aminosäuren beeinträchtigt die RNA-Bindung [78]. Die zur Interaktion mit RNA verwendeten Argininreste variieren je nach Ziel-RNA [70, 76, 78]. Die FMRP RGG-Box zielt mit ihrer eigenen mRNA auf eine G-Quadruplex-Struktur, die die RGG-Box kodiert [69]. Diese Bindung reguliert alternatives Spleißen von FMRP-mRNA in der Nähe des G-Quartetts, was darauf hindeutet, dass sie das Gleichgewicht der FRMP-Isoformen automatisch regulieren kann [74]. Überraschenderweise fand eine kürzlich durchgeführte transkriptomweite Studie zu polysom-assoziiertem FMRP keine Anreicherung für vorhergesagte G-Quadruplex-Strukturen in den 842 Ziel-mRNAs mit hoher Konfidenz [79]. Eine andere Studie identifizierte FMRP-Bindungsstellen, die mit spezifischen Sequenzmotiven angereichert waren, wobei die KH2-Domänen als die wichtigsten Spezifitätsdeterminanten hervortraten [80]. Diese Ergebnisse legen nahe, dass die Rolle der RGG-Box in diesem RBP begrenzt sein könnte, um die Gesamtbindungsaffinität des Proteins zu erhöhen, was die sequenzspezifischen Interaktionen unterstützt, die durch die KH2-Domänen vermittelt werden. Wir können jedoch die Möglichkeit einer unterschiedlichen UV-Vernetzungseffizienz der KH2-Domänen und der RGG-Box nicht ausschließen, was zu verzerrten Bindungssignaturen in CLIP-Studien führen könnte.

    Strukturbeispiele RNA-gebundene ungeordnete Regionen. ein Das an a . gebundene RGG-Peptid des humanen FMRP in vitro-selektierte guaninreiche sc1-RNA bestimmt durch NMR (PDB 2LA5) [78] B Der basische Patch des Disordered Bovine Immunodeficiency Virus (BIV) Tat bildet bei Interaktion mit seiner Ziel-RNA, TAR, eine β-Schleife. Struktur bestimmt durch NMR (PDB 1MNB) [91] C Dimer des basischen Pflasters mit Rev-Protein des humanen Immunschwächevirus (HIV) im Komplex mit Ziel-RNA, RRE, kristallographisch bestimmt [102] (PDB 4PMI). Rot, Peptidgelb, RNA. Illustrationen wurden mit PyMol . erstellt

    Eine Reihe anderer RBPs verwenden eine RGG-Repeat-Region, um auf G-reiche und strukturierte RNA-Ziele abzuzielen, und sind an neurologischen Erkrankungen sowie Krebs beteiligt (Tabelle 1). Diese RG-reichen Regionen können sowohl unselektive als auch spezifische Interaktionen mit RNA vermitteln und können an verschiedenen RNA-Stoffwechselprozessen beteiligt sein.


    Welche Domänen oder Motive können sowohl an DNA als auch an RNA binden? - Biologie

    CRISPR/Cas-Systeme verleihen Bakterien und Archaeen eine adaptive Immunität gegen Viren und Plasmide, indem sie crRNAs verwenden, um die Stummschaltung eindringender Nukleinsäuren zu steuern. Wir zeigen hier, dass in einer Untergruppe dieser Systeme die reife crRNA basengepaart mit trans-aktivierende tracrRNA bildet eine Zwei-RNA-Struktur, die das CRISPR-assoziierte Protein Cas9 anweist, doppelsträngige (ds) Brüche in die Ziel-DNA einzuführen. An Stellen, die zur crRNA-guide-Sequenz komplementär sind, spaltet die Cas9-HNH-Nuklease-Domäne den komplementären Strang, während die Cas9-RuvC-ähnliche Domäne den nicht-komplementären Strang spaltet. Die dual-tracrRNA:crRNA steuert, wenn sie als einzelne RNA-Chimäre konstruiert wird, auch die sequenzspezifische Cas9-dsDNA-Spaltung. Unsere Studie enthüllt eine Familie von Endonukleasen, die duale RNAs für die ortsspezifische DNA-Spaltung verwenden, und unterstreicht das Potenzial, das System für die RNA-programmierbare Genom-Editierung zu nutzen.

    Bakterien und Archaeen haben RNA-vermittelte adaptive Abwehrsysteme namens CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)/Cas (CRISPR-assoziiert) entwickelt, die Organismen vor eindringenden Viren und Plasmiden schützen (13). Diese Abwehrsysteme beruhen auf kleinen RNAs zum sequenzspezifischen Nachweis und zur Stummschaltung fremder Nukleinsäuren. CRISPR/Cas-Systeme bestehen aus ca Gene, die in Operon(en) organisiert sind, und ein CRISPR-Array, bestehend aus einzigartigen genom-zielenden Sequenzen (sogenannte Spacer), die mit identischen Wiederholungen durchsetzt sind (13). Die CRISPR/Cas-vermittelte Immunität erfolgt in drei Schritten. In der adaptiven Phase reagieren Bakterien und Archaeen, die einen oder mehrere CRISPR-Loci beherbergen, auf Virus- und Plasmid-Challenge, indem sie kurze Fragmente einer fremden Sequenz (Protospacer) in das Wirtschromosom am proximalen Ende des CRISPR-Arrays integrieren (13). In der Expressions- und Interferenzphase liefert die Transkription des Repeat-Spacer-Elements in Vorläufer-CRISPR-RNA (Prä-crRNA)-Moleküle, gefolgt von einer enzymatischen Spaltung, die kurzen crRNAs, die Basenpaare mit komplementären Protospacer-Sequenzen von eindringenden viralen oder Plasmid-Targets (411). Die Zielerkennung durch crRNAs steuert die Stummschaltung der Fremdsequenzen durch Cas-Proteine, die im Komplex mit den crRNAs wirken (10, 1220).

    Es gibt drei Arten von CRISPR/Cas-Systemen (2123). Die Systeme vom Typ I und III teilen einige übergreifende Merkmale: spezialisierte Cas-Endonukleasen verarbeiten die Prä-crRNAs, und sobald sie ausgereift sind, fügt sich jede crRNA zu einem großen Multi-Cas-Proteinkomplex zusammen, der in der Lage ist, zur crRNA komplementäre Nukleinsäuren zu erkennen und zu spalten. Im Gegensatz dazu verarbeiten Typ-II-Systeme prä-crRNAs nach einem anderen Mechanismus, bei dem eine transaktivierende crRNA (tracrRNA), die zu den Wiederholungssequenzen in prä-crRNA komplementär ist, die Verarbeitung durch die doppelsträngige RNA-spezifische Ribonuklease RNase III in Gegenwart von das Protein Cas9 (früher Csn1) (4, 24) (Abb. S1). Es wird angenommen, dass Cas9 das einzige Protein ist, das für die crRNA-gesteuerte Stummschaltung fremder DNA verantwortlich ist (2527).

    Wir zeigen hier, dass Cas9-Proteine ​​in Typ-II-Systemen eine Familie von Enzymen darstellen, die eine basengepaarte Struktur benötigen, die zwischen der aktivierenden tracrRNA und der zielenden crRNA gebildet wird, um doppelsträngige (ds) Ziel-DNA zu spalten. Die ortsspezifische Spaltung erfolgt an Stellen, die sowohl durch die Basenpaarungs-Komplementarität zwischen der crRNA und der Ziel-Protospacer-DNA als auch durch ein kurzes Motiv (als das benachbarte Protospacer-Motiv oder PAM bezeichnet) neben der komplementären Region in der Ziel-DNA bestimmt werden. Unsere Studie zeigt außerdem, dass die Cas9-Endonuklease-Familie mit einzelnen RNA-Molekülen programmiert werden kann, um spezifische DNA-Stellen zu spalten, was die spannende Möglichkeit eröffnet, ein einfaches und vielseitiges RNA-gesteuertes System zu entwickeln, um dsDNA-Brüche (DSBs) für Genom-Targeting und -Editierung zu erzeugen.

    Cas9 ist eine DNA-Endonuklease, die von zwei RNAs gesteuert wird. Es wurde angenommen, dass Cas9, das charakteristische Protein von Typ-II-Systemen, sowohl an der crRNA-Reifung als auch an der crRNA-gesteuerten DNA-Interferenz beteiligt ist (Abb. S1) (4, 2527). Cas9 ist an der crRNA-Reifung beteiligt (4), aber seine direkte Beteiligung an der Zerstörung der Ziel-DNA wurde nicht untersucht. Um zu testen, ob und wie Cas9 in der Lage sein könnte, Ziel-DNA zu spalten, haben wir ein Überexpressionssystem verwendet, um das aus dem Erreger stammende Cas9-Protein zu reinigen Streptococcus pyogenes (Abb. S2) und testete seine Fähigkeit, eine Plasmid-DNA oder einen Oligonukleotidduplex zu spalten, der eine zu einer reifen crRNA komplementäre Protospacersequenz und eine echte PAM trägt. Wir fanden, dass reife crRNA allein nicht in der Lage war, die Cas9-katalysierte Plasmid-DNA-Spaltung zu steuern ( 1A und S3A ). Die Zugabe von tracrRNA, die Basenpaare mit der Wiederholungssequenz von crRNA bilden kann und in diesem System für die crRNA-Reifung essentiell ist, veranlasste Cas9 jedoch, Plasmid-DNA zu spalten (Abb. 1A und Abb. S3A). Die Spaltungsreaktion erforderte sowohl Magnesium als auch die Anwesenheit einer zur DNA komplementären crRNA-Sequenz .S3A, vergleiche crRNA-sp2 mit crRNA-sp1 und Abb. S4A). Ähnliche Ergebnisse wurden mit einem kurzen linearen dsDNA-Substrat erhalten (Abb. 1B und Abb. S3, B und C). Die trans-aktivierende tracrRNA ist somit eine kleine nicht-kodierende RNA mit zwei kritischen Funktionen: Auslösen der Prä-crRNA-Prozessierung durch das Enzym RNase III (4) und anschließend die Aktivierung der crRNA-gesteuerten DNA-Spaltung durch Cas9.

    Cas9 ist eine DNA-Endonuklease, die von zwei RNA-Molekülen gesteuert wird. (EIN) Cas9 wurde mit einer 42-Nukleotid-crRNA-sp2 (crRNA mit Spacer-2-Sequenz) in Gegenwart oder Abwesenheit von 75-Nukleotid-tracrRNA programmiert. Der Komplex wurde zu zirkulärer oder XhoI-linearisierter Plasmid-DNA hinzugefügt, die eine zum Spacer 2 komplementäre Sequenz und eine funktionelle PAM trug. crRNA-sp1, Spezifitätskontrolle M, DNA-Marker siehe Abb. S3A. (B) Cas9 wurde mit crRNA-sp2 und tracrRNA (Nukleotide 4-89) programmiert. Der Komplex wurde mit doppel- oder einzelsträngigen DNAs inkubiert, die eine zu Spacer 2 komplementäre Sequenz und eine funktionelle PAM (4). Die komplementären oder nicht komplementären Stränge der DNA wurden 5'-radiomarkiert und mit einem nicht markierten Partnerstrang verbunden. Siehe Abb. S3, B und C. (C) Sequenzierungsanalyse von Spaltprodukten aus Fig. 1A. Die Terminierung der Primerverlängerung in der Sequenzierungsreaktion zeigt die Position der Schnittstelle an. Der 3'-terminale A-Überhang (Sternchen) ist ein Artefakt der Sequenzierungsreaktion. Siehe Abb. S5, A und C. (D) Die Spaltprodukte aus Fig. 1B wurden zusammen mit 5'-endmarkierten Größenmarkern analysiert, die von den komplementären und nicht komplementären Strängen des Ziel-DNA-Duplex abgeleitet wurden. M, Marker P, Spaltprodukt. Siehe Abb. S5, B und C. (E) Schematische Darstellung von tracrRNA, crRNA-sp2 und Protospacer 2-DNA-Sequenzen Regionen der crRNA-Komplementarität zu tracrRNA (orange) und der Protospacer-DNA (gelb) sind dargestellt PAM-Sequenz, graue Spaltstellen kartiert in (C) und (D) werden durch . dargestellt blaue Pfeile (C), ein roter Pfeil (D, komplementärer Strang) und eine rote Linie (D, nicht komplementärer Strang).

    Die Spaltung von sowohl Plasmid als auch kurzer linearer dsDNA durch tracrRNA:crRNA-geführtes Cas9 ist ortsspezifisch (Abb. 1, C bis E und Abb. S5, A und B). Die Plasmid-DNA-Spaltung erzeugte stumpfe Enden an einer Position drei Basenpaare stromaufwärts der PAM-Sequenz (Abb. 1, C und E und Abb. S5, A und C) (26). In ähnlicher Weise wird innerhalb kurzer dsDNA-Duplexe der DNA-Strang, der zur Zielbindungssequenz in der crRNA komplementär ist (der komplementäre Strang), an einer Stelle drei Basenpaare stromaufwärts der PAM gespalten (Abb. 1, D und E und Abb .S5, B und C). Der nicht komplementäre DNA-Strang wird an einer oder mehreren Stellen innerhalb von 3 bis 8 Basenpaaren stromaufwärts der PAM gespalten. Weitere Untersuchungen ergaben, dass der nicht-komplementäre Strang zunächst endonukleolytisch gespalten und anschließend durch eine 3'-5'-Exonuklease-Aktivität getrimmt wird (Abb. S4B). Die Spaltungsraten von Cas9 unter Single-Turnover-Bedingungen reichten von 0,3 bis 1 min −1 , vergleichbar mit denen von Restriktionsendonukleasen (Abb. S6A), während die Inkubation des Wildtyp-Cas9-tracrRNA:crRNA-Komplexes mit einem 5-fachen molaren Überschuss von Substrat-DNA lieferte den Beweis, dass das dual-RNA-gesteuerte Cas9 ein Enzym mit mehreren Umsätzen ist (Abb. S6B). Im Gegensatz zum CRISPR Typ I Cascade Komplex (18) spaltet Cas9 sowohl linearisierte als auch superspiralisierte Plasmide (Fig. 1A und 2A). Ein eindringendes Plasmid kann daher prinzipiell mehrfach von mit unterschiedlichen crRNAs programmierten Cas9-Proteinen gespalten werden.

    Cas9 verwendet zwei Nukleasedomänen, um die beiden Stränge in der Ziel-DNA zu spalten. (EIN) Oben: Schematische Darstellung der Cas9-Domänenstruktur mit den Positionen der Domänenmutationen. Unten: Komplexe von Wildtyp- oder Nuklease-mutanten Cas9-Proteinen mit tracrRNA:crRNA-sp2 wurden auf Endonuklease-Aktivität wie in 1A getestet. (B) Komplexe von Wildtyp-Cas9- oder Nukleasedomänen-Mutanten mit tracrRNA und crRNA-sp2 wurden wie in 1B auf Aktivität getestet.

    Jede Cas9-Nukleasedomäne spaltet einen DNA-Strang. Cas9 enthält Domänen, die sowohl zu HNH- als auch zu RuvC-Endonukleasen homolog sind (Abb. 2A und Abb. S7) (2123, 27, 28). Wir entwarfen und reinigten Cas9-Varianten, die inaktivierende Punktmutationen in den katalytischen Resten der HNH- oder RuvC-ähnlichen Domänen enthalten (Abb. 2A und Abb. S7) (23, 27). Incubation of these variant Cas9 proteins with native plasmid DNA showed that dual-RNA–guided mutant Cas9 proteins yielded nicked open circular plasmids, while the wild-type Cas9 protein-tracrRNA:crRNA complex produced a linear DNA product (Figs. 1A and 2A and figs. S3A and S8A). This result indicates that the Cas9 HNH and RuvC-like domains each cleave one plasmid DNA strand. To determine which strand of the target DNA is cleaved by each Cas9 catalytic domain, we incubated the mutant Cas9-tracrRNA:crRNA complexes with short dsDNA substrates in which either the complementary or the noncomplementary strand was radiolabeled at its 5′ end. The resulting cleavage products indicated that the Cas9 HNH domain cleaves the complementary DNA strand, while the Cas9 RuvC-like domain cleaves the noncomplementary DNA strand (Fig. 2B and fig. S8B).

    Dual-RNA requirements for target DNA binding and cleavage. tracrRNA might be required for target DNA binding and/or to stimulate the nuclease activity of Cas9 downstream of target recognition. To distinguish between these possibilities, we used an electrophoretic mobility shift assay to monitor target DNA binding by catalytically inactive Cas9 in the presence or absence of crRNA and/or tracrRNA. Addition of tracrRNA substantially enhanced target DNA binding by Cas9, whereas little specific DNA binding was observed with Cas9 alone or Cas9-crRNA (fig. S9). This indicates that tracrRNA is required for target DNA recognition, possibly by properly orienting the crRNA for interaction with the complementary strand of target DNA. The predicted tracrRNA:crRNA secondary structure includes base-pairing between the 3′-terminal 22-nucleotides of the crRNA and a segment near the 5′ end of the mature tracrRNA (Fig. 1E). This interaction creates a structure in which the 5′-terminal 20 nucleotides of the crRNA, which vary in sequence in different crRNAs, are available for target DNA binding. The bulk of the tracrRNA downstream of the crRNA base-pairing region is free to form additional RNA structure(s) and/or to interact with Cas9 or the target DNA site. To determine whether the entire length of the tracrRNA is necessary for site-specific Cas9-catalyzed DNA cleavage, we tested Cas9-tracrRNA:crRNA complexes reconstituted using full-length mature (42-nt) crRNA and various truncated forms of tracrRNA lacking sequences at their 5′ or 3′ ends. These complexes were tested for cleavage using a short target dsDNA. A substantially truncated version of the tracrRNA retaining nucleotides 23-48 of the native sequence was capable of supporting robust dual-RNA–guided Cas9-catalyzed DNA cleavage (Fig. 3, A and C, and fig. S10, A and B). Truncation of the crRNA from either end showed that Cas9-catalyzed cleavage in the presence of tracrRNA could be triggered with crRNAs missing the 3′-terminal 10 nucleotides (Fig. 3, B and C). In contrast, a 10-nucleotide deletion from the 5′ end of crRNA abolished DNA cleavage by Cas9 (Fig. 3B). We also analyzed Cas9 orthologs from various bacterial species for their ability to support S. pyogenes tracrRNA:crRNA-guided DNA cleavage. In contrast to closely related S. pyogenes Cas9 orthologs, more distantly related orthologs were not functional in the cleavage reaction (fig. S11). Ähnlich, S. pyogenes Cas9 guided by tracrRNA:crRNA pairs originating from more distant systems were unable to cleave DNA efficiently (fig. S11). Species specificity of dual-RNA–guided cleavage of DNA indicates co-evolution of Cas9, tracrRNA and the crRNA repeat, as well as the existence of a still unknown structure and/or sequence in the dual-RNA that is critical for the formation of the ternary complex with specific Cas9 orthologs.

    Cas9-catalyzed cleavage of target DNA requires an activating domain in tracrRNA and is governed by a seed sequence in the crRNA. (EIN) Cas9-tracrRNA:crRNA complexes were reconstituted using 42-nucleotide crRNA-sp2 and truncated tracrRNA constructs and assayed for cleavage activity as in Fig. 1B. (B) Cas9 programmed with full-length tracrRNA and crRNA-sp2 truncations was assayed for activity as in (A). (C) Minimal regions of tracrRNA and crRNA capable of guiding Cas9-mediated DNA cleavage (blue box). (D) Plasmids containing wild-type or mutant protospacer 2 sequences with indicated point mutations (right) were cleaved in vitro by programmed Cas9 as in Fig. 1A (left top) and used for transformation assays of wild-type or pre-crRNA-deficient S. pyogenes (left bottom). The transformation efficiency was calculated as CFU per μg of plasmid DNA error bars represent standard deviations for three biological replicates. (E) Plasmids containing wild-type and mutant protospacer 2 inserts with varying extent of crRNA-target DNA mismatches (right) were cleaved in vitro by programmed Cas9 (left). The cleavage reactions were further digested with XmnI. The 1880 bp and 800 bp fragments are Cas9-generated cleavage products.

    To investigate the protospacer sequence requirements for Type II CRISPR/Cas immunity in bacterial cells, a series of protospacer-containing plasmid DNAs harboring single-nucleotide mutations were analyzed for their maintenance following transformation in S. pyogenes and their ability to be cleaved by Cas9 in vitro. In contrast to point mutations introduced at the 5′ end of the protospacer, mutations in the region close to the PAM and the Cas9 cleavage sites were not tolerated in vivo and resulted in decreased plasmid cleavage efficiency in vitro (Fig. 3D). Our results are in agreement with a previous report of protospacer escape mutants selected in the Type II CRISPR system from S. thermophilus in vivo (27, 29). Furthermore, the plasmid maintenance and cleavage results hint at the existence of a “seed” region located at the 3′ end of the protospacer sequence that is crucial for the interaction with crRNA and subsequent cleavage by Cas9. In support of this notion, Cas9 enhanced complementary DNA strand hybridization to the crRNA and this enhancement was the strongest in the 3′-terminal region of the crRNA targeting sequence (fig. S12). Corroborating this, a contiguous stretch of at least 13 base pairs between the crRNA and the target DNA site proximal to the PAM is required for efficient target cleavage, while up to six contiguous mismatches in the 5′-terminal region of the protospacer are tolerated (Fig. 3E). These findings are reminiscent of the previously observed seed sequence requirements for target nucleic acid recognition in Argonaute proteins (30, 31) and the Cascade and Csy CRISPR complexes (13, 14).

    A short sequence motif dictates R-loop formation. In multiple CRISPR/Cas systems, recognition of self versus non-self has been shown to involve a short sequence motif that is preserved in the foreign genome, referred to as the PAM (27, 29, 3234). PAM motifs are only a few base pairs in length, and their precise sequence and position vary according to the CRISPR/Cas system type (32). In dem S. pyogenes Type II system, the PAM conforms to an NGG consensus sequence, containing two G:C base pairs that occur one base pair downstream of the crRNA binding sequence, within the target DNA (4). Transformation assays demonstrated that the GG motif is essential for protospacer plasmid DNA elimination by CRISPR/Cas in bacterial cells (fig. S13A), consistent with previous observations in S. thermophilus (27). The motif is also essential for in vitro protospacer plasmid cleavage by tracrRNA:crRNA-guided Cas9 (fig. S13B). To determine the role of the PAM in target DNA cleavage by the Cas9-tracrRNA:crRNA complex, we tested a series of dsDNA duplexes containing mutations in the PAM sequence on the complementary or noncomplementary strands, or both (Fig. 4A). Cleavage assays using these substrates showed that Cas9-catalyzed DNA cleavage was particularly sensitive to mutations in the PAM sequence on the noncomplementary strand of the DNA, in contrast to complementary strand PAM recognition by Type I CRISPR/Cas systems (18, 34). Cleavage of target single-stranded DNAs was unaffected by mutations of the PAM motif. This observation suggests that the PAM motif is required only in the context of target dsDNA and may thus be required to license duplex unwinding, strand invasion, and the formation of an R-loop structure. Using a different crRNA-target DNA pair (crRNA-sp4 and protospacer 4 DNA), selected due to the presence of a canonical PAM not present in the protospacer 2 target DNA, we found that both G nucleotides of the PAM were required for efficient Cas9-catalyzed DNA cleavage (Fig. 4B and fig. S13C). To determine whether the PAM plays a direct role in recruiting the Cas9-tracrRNA:crRNA complex to the correct target DNA site, binding affinities of the complex for target DNA sequences were analyzed by native gel mobility shift assays (Fig. 4C). Mutation of either G in the PAM sequence substantially reduced the affinity of Cas9-tracrRNA:crRNA for the target DNA. This finding argues for specific recognition of the PAM sequence by Cas9 as a prerequisite for target DNA binding and possibly strand separation to allow strand invasion and R-loop formation, which would be analogous to the PAM sequence recognition by CasA/Cse1 implicated in a Type I CRISPR/Cas system (34).

    A PAM is required to license target DNA cleavage by the Cas9-tracrRNA:crRNA complex. (EIN) Dual RNA-programmed Cas9 was tested for activity as in Fig. 1B. Wild-type and mutant PAM sequences in target DNAs are indicated (right). (B) Protospacer 4 target DNA duplexes (labeled at both 5′ ends) containing wild-type and mutant PAM motifs were incubated with Cas9 programmed with tracrRNA (nt 23-89):crRNA-sp4. At indicated time points (min), aliquots of the cleavage reaction were taken and analyzed as in Fig. 1B. (C) Electrophoretic mobility shift assays were performed using RNA-programmed Cas9 (D10A/H840A) and protospacer 4 target DNA duplexes [same as in (B)] containing wild-type and mutated PAM motifs. Cas9 (D10A/H840A)-RNA complex was titrated from 100 pM to 1 μM.

    Cas9 can be programmed with a single chimeric RNA. Examination of the likely secondary structure of the tracrRNA:crRNA duplex (Figs. 1E and 3C) suggested the possibility that the features required for site-specific Cas9-catalyzed DNA cleavage could be captured in a single chimeric RNA. Although the tracrRNA:crRNA target selection mechanism works efficiently in nature, the possibility of a single RNA-guided Cas9 is appealing due to its potential utility for programmed DNA cleavage and genome editing (Fig. 5A). We designed two versions of a chimeric RNA containing a target recognition sequence at the 5′ end followed by a hairpin structure retaining the base-pairing interactions that occur between the tracrRNA and the crRNA (Fig. 5B). This single transcript effectively fuses the 3′end of crRNA to the 5′ end of tracrRNA, thereby mimicking the dual-RNA structure required to guide site-specific DNA cleavage by Cas9. In cleavage assays using plasmid DNA, we observed that the longer chimeric RNA was able to guide Cas9-catalyzed DNA cleavage in a manner similar to that observed for the truncated tracrRNA:crRNA duplex (Fig. 5B and fig. S14, A and C). The shorter chimeric RNA did not work efficiently in this assay, confirming that nucleotides 5-12 positions beyond the tracrRNA:crRNA base-pairing interaction are important for efficient Cas9 binding and/or target recognition. Similar results were observed in cleavage assays using short dsDNA as a substrate, which further indicate that the position of the cleavage site in target DNA is identical to that observed using the dual tracrRNA:crRNA as a guide (Fig. 5C and fig. S14, B and C). Finally, to establish whether the design of chimeric RNA might be universally applicable, we engineered five different chimeric guide RNAs to target a portion of the gene encoding the green-fluorescent protein (GFP) (fig. S15, A to C), and tested their efficacy against a plasmid carrying the GFP coding sequence in vitro. In all five cases, Cas9 programmed with these chimeric RNAs efficiently cleaved the plasmid at the correct target site (Fig. 5D and fig. S15D), indicating that rational design of chimeric RNAs is robust and could in principle enable targeting of any DNA sequence of interest with few constraints beyond the presence of a GG dinucleotide adjacent to the targeted sequence.

    Cas9 can be programmed using a single engineered RNA molecule combining tracrRNA and crRNA features. (EIN) Top: In Type II CRISPR/Cas systems, Cas9 is guided by a two-RNA structure formed by activating tracrRNA and targeting crRNA to cleave site-specifically target dsDNA (refer to fig. S1). Bottom: A chimeric RNA generated by fusing the 3′ end of crRNA to the 5′ end of tracrRNA. (B) A plasmid harboring protospacer 4 target sequence and a wild-type PAM was subjected to cleavage by Cas9 programmed with tracrRNA(4-89):crRNA-sp4 duplex or in vitro-transcribed chimeric RNAs constructed by joining the 3′ end of crRNA to the 5′ end of tracrRNA with a GAAA tetraloop. Cleavage reactions were analyzed by restriction mapping with XmnI. Sequences of chimeric RNAs A and B are shown with DNA-targeting (yellow), crRNA repeat-derived (orange) and tracrRNA-derived (light blue) sequences. (C) Protospacer 4 DNA duplex cleavage reactions were performed as in Fig. 1B. (D) Five chimeric RNAs designed to target the GFP gene were used to program Cas9 to cleave a GFP gene-containing plasmid. Plasmid cleavage reactions were performed as in Fig. 3E, except that the plasmid DNA was restriction mapped with AvrII following Cas9 cleavage.

    Conclusions. In summary, we identify a DNA interference mechanism involving a dual-RNA structure that directs a Cas9 endonuclease to introduce site-specific double-stranded breaks in target DNA. The tracrRNA:crRNA-guided Cas9 protein utilizes distinct endonuclease domains, HNH and RuvC-like, to cleave the two strands in the target DNA. Target recognition by Cas9 requires both a seed sequence in the crRNA and a GG dinucleotide-containing PAM sequence adjacent to the crRNA-binding region in the DNA target. We further show that the Cas9 endonuclease can be programmed with guide RNA engineered as a single transcript to target and cleave any dsDNA sequence of interest. The system is efficient, versatile and programmable by changing the DNA target-binding sequence in the guide chimeric RNA. Zinc-Finger Nucleases (ZFNs) and Transcription-Activator Like Effector Nucleases (TALENs) have attracted considerable interest as artificial enzymes engineered to manipulate genomes (3538). We propose an alternative methodology based on RNA-programmed Cas9 that could offer considerable potential for gene targeting and genome editing applications.


    Kink-turns in RNA

    The kink-turn (usually abbreviated to k-turn) is a widespread structural motif in RNA, first noted as a repeated structural element in the large ribosomal subunit by the Steitz lab (1). It introduces a very tight kink into the axis of helical RNA. It clearly plays an important structural role in RNA, and is significant in many aspects of RNA function including translation, modification and splicing, as well as genetic regulation.

    The sequence of Kt-7, an almost canonical k-turn found in the 50S subunit of the Haloarcula marismortui ribosome.

    The standard k-turn comprises a three-nucleotide bulge flanked on its 3 side by A G and G A basepairs (N-C stem), and on its 5 side by a section of regular basepairing (C stem) (1).

    The structure of a generic k-turn. A schematic of the structure is shown on the left, and the structure of Kt-7 in the H. marismortui ribosome is shown on the right.

    Kt-7 of the 23S rRNA of the H. marismortui ribosome is close to the consensus sequence for k-turns. The structure introduces a pronounced kink in the RNA (from whence its name), with an included angle between the axes of

    50 . The minor grooves of the two helices are juxtaposed, and the conformation is stabilized by interactions between the stacked adenosines of the A G basepairs and the C stem, and by stacking of the 5 and central bases of the bulge on the ends of the C and N-C stems respectively.

    The two A G basepairs at the center of the k-turn. The A G pairs of Kt-7 are shown in the molecular graphics.

    The A G basepairs are highly conserved. Both are trans sugar edge (G) to Hoogsteen edge (A) pairs, linked by potential hydrogen bonds G-N2 to A-N7 and A-N6 to G-N3. The 1b 1n pair is strongly buckled, while the bases of the 2n 2b pair are much closer to coplanarity. In some k-turns, the A-N6 to G-N3 hydrogen bond is not formed in the 2b 2n pair (see below). In the folded structure the minor groove edges of the two A G pairs are juxtaposed with the minor groove of the opposing C helix to participate in A-minor interactions (2). The structural principles of k-turn geometry have been analyzed using isostericity matrices (3).

    Many k-turns are bound by proteins in their natural state, at least some of which stabilize the kinked geometry. This is discussed further below.

    A general nucleotide numbering system for k-turns

    We have devised a universal nomenclature for the nucleotide positions in k-turns (4), thus avoiding the confusion that could arise from the many different numbering systems used in various crystal structures.

    A systematic nomenclature for the nucleotides of a k-turn.

    In this system, the unpaired bulge nucleotides are labelled Lj, where the index j is numbered sequentially from the 5 side. Unpaired nucleotides on the opposite strand (found in a small fraction of k-turns) are designated Lnj, with j increasing 5 to 3 . For all the remaining nucleotides, the two strands are differentiated by the suffix of b for the Bulge-containing strand or n for the non-bulged strand. The nucleotides of the non-canonical stem are positively numbered from the first G A mismatch in the 5 to 3 direction relative to the bulged strand, while those of the canonical stem are negatively numbered in the 3 to 5 direction. The numbering system can accommodate loops of different sizes.

    Where are k-turns found ?

    Some k-turns have been identified unequivocally, from their structure vor Ort within crystal structures of larger RNA structures or complexes. Others are assumed by virtue of their sequence, and perhaps their homology with known k-turns in related species. The pronounced kink of the k-turn can also be observed using a variety of biophysical methods, such as FRET (5).

    The k-turn was first identified as a novel motif occurring multiple times in the ribosome (1,6,7). Further examples have been found in mRNA (8-11), and in riboswitches (12-16). They are very commonly found in C/D and H/ACA guide snoRNAs, and U3 snoRNA species (17-25). There is also a near-canonical k-turn in a stem-loop of the human U4 snRNA (26,27).

    Metal ion-induced folding of k-turns

    In order to adopt the tightly-kinked geometry, k-turn motifs require the presence of metal ions (5,27,28), or the binding of proteins (29). In the absence of either of these factors the RNA adopts a conformation that is more extended, like that of any three-nucleotide bulge in a duplex (30). The kinked conformation can be stabilized by addition of either divalent or monovalent metal ions (5), and folding can be treated as a two-state process.

    Ion-induced folding of Kt-7 observed by the increase in fluorescence resonance energy transfer between terminally-attached fluorophores that become closer when the RNA adopts the kink turn conformation.

    Folding is induced by micromolar concentrations of divalent ions, or millimolar concentrations of monovalent ions. For example, FRET analysis reveals that the folding of Kt-7 is achieved with a [Mg 2+ ]1/2 = 80 M, and a [Na + ]1/2 = 30 mM (4).

    There is no evidence for site-specific binding of metal ions to k-turns. It is likely that electrostatic interactions must be screened to allow the folded structure to achieve stability, and this is achieved by an ion atmosphere of loosely bound metal ions.

    This suggests a dynamic character for k-turn structures, where they sample both the kinked and a more extended geometry, consistent with fluorescent lifetime measurements (31). Computer modelling studies have suggested that k-turns undergo hinge-like motions on a fast timescale (32-34).

    Protein binding by k-turn RNA

    The majority of k-turns are known to bind one or more proteins. A few are not, including that found in the SAM riboswitch (12), although it remains possible that in the cellular environment even that too is bound by proteins.

    The archetypal k-turn binding protein is the ribosomal L7Ae and related proteins. These form a family of RNA-binding proteins including the eukaryotic and archaeal proteins L7Ae, L30e and S12e (35), the yeast Nhp2 and Snu13p proteins, and the human 15.5 kDa protein (36). Each of these proteins binds k-turn motifs in RNA, and some functional substitutions are tolerated (21). The assembly of the RNA methylation (box C/D) and pseudouridylation (box H/ACA) nucleoproteins are initiated by the binding of L7Ae-type proteins to k-turns contained within the guide RNA (37,38). The 15.5 kDa protein binds a k-turn of the U4 stem-loop in the U4-U6.U5 tri-snRNP (36). Crystal structures are available for the complexes of Archäoglobus fulgidus L7Ae and box C/D RNA (22), Methanococcus jannaschii L7Ae and box H/ACA RNA (23) and the human 15.5 kDa protein and the U4 snRNA (26). In each case, the k-turn adopts the tightly-kinked conformation in the complex with the protein.

    Crystal structure of the L7Ae protein complexed with the box C/D k-turn (22).

    Even in the absence of added metal ions, the kinked conformation is induced by the binding of the protein. Moreover, the binding occurs with extremely high affinity. We have measured a dissociation constant of KD = 10 pM for Archeoglobus fulgidus L7Ae binding to Kt-7 (39).

    The binding of L7Ae to Kt-7 observed by FRET. The k-turn becomes folded into the kinked geometry on binding L7Ae, and thus adopting the structure that exhibits high FRET efficiency. Thus the position of equilibrium can be followed in this manner. The data are fitted to a two-state model. However, the binding is so tight that only an upper limit can be measured for the KD. An accurate value was measured using kinetic measurements of association and dissociation rates (39).

    In principle it could be imagined that k-turn folding could be promoted by protein binding in one of two ways, by passive selection of the kinked structure (conformational selection), or a more active process in which the protein manipulates the RNA structure (induced fit). The former requires an equilibrium between extended and folded k-turn structure in solution, as indicated in our measurement of fluorescent lifetimes (40). Real-time binding single-molecule experiments provide no evidence for a more extended intermediate down to a time resolution of 16 ms, supporting the conformational selection model (41).

    Stabilization of k-turn structure by tertiary interactions

    There is a third mechanism of stabilization, arising from longer-range tertiary interactions within the RNA. The k-turn introduces an abrupt transition in helical trajectory in the RNA helix that can be an important element in building the large-scale architecture of large RNA species. This is exemplified by the SAM-I riboswitch, where a long helix (P2) is kinked by a standard k-turn to allow the terminal loop to dock into a receptor in helix P4 (12,14).

    Schematic of the secondary structure of the SAM-I riboswitch. The k-turn is colored in our conventional manner. Note the loop-receptor interaction with the terminal loop of helix P2B.

    This stabilizes the global fold of the riboswitch that creates the binding pocket for its ligand S-adenosyl methionine (SAM - shown in red above), and removal of the k-turn completely prevents SAM binding. Conversely though, the tertiary structure of the RNA stabilizes the local structure of the k-turn. We observed that a G2nA substitution prevented the k-turn from folding as an isolated duplex, yet allowed the riboswitch to retain full function indicative of unperturbed folding (42). Solving the crystal structure of the modified SAM-I riboswitch showed that the k-turn was folded completely normally, despite the presence of an A A pair at the 2b 2n position.

    Crystal structure of the SAM-I riboswitch containing a k-turn that has been modified by a G2nA substitution. A. The 3D structure of the complete riboswitch. B. The structure of the k-turn (colored) superimposed with that of the unmodified sequence (grey).

    We conclude that the free energy of the tertiary interactions in the riboswitch is coupled to the folding of the k-turn so that an intrinsically unstable k-turn can fold normally.

    Thus we see that the folded structure of the k-turn can be stabilized in three ways : 1. By neutralization of charge on addition of metal ions. 2. By the binding of proteins, including members of the L7Ae family. 3. By tertiary interactions within larger RNA species. There is likely to be an interplay between these different processes in larger RNA-protein assemblies.

    Hydrogen bonding interactions that stabilize the kinked geometry

    The majority of k-turns have a G A pair at the 1b 1n position, and an A G pair at the 2b 2n position. Sequence substitution of any of the four nucleotides is usually highly detrimental to folding (5). Both are trans sugar edge (G) to Hoogsteen edge (A) pairs, linked by potential hydrogen bonds G-N2 to A-N7 and A-N6 to G-N3. We have found experimentally that all four hydrogen bonds are important to the stability of the kinked form of the RNA. But the G-N2 to A-N7 hydrogen bonds of the two G A pairs are the most critical to the stability of kinked form of Kt-7 in Mg 2+ ions, so that folding is completely prevented by G to inosine substitutions at either position (39).

    A cartoon summarizing the important hydrogen-bonding interactions involving O2 groups that stabilize the kinked geometry of the k-turn. Hydrogen bonds are indicated by the cyan arrows, with a thickness that reflects their conservation and importance in stabilizing the structure.

    In addition to the bonds linking the G A pairs, a number of critical hydrogen bonds involving O2 groups play a key role in stabilizing the kinked structure. These are summarized in the figure above. The most important are those in the core of the turn, and ribose-phosphate interactions around the bulge. These are strongly conserved in all k-turns, and critical to folding. Of these the single-most important hydrogen bond is one donated from the O2 of L1 ribose to the N1 of the A1n in the kink-proximal A G pair.

    The critical hydrogen bond formed between the O2 of L1 ribose to the N1 of the A1n.

    This is present in all known k-turn structures, and removal of the O2 from L1 completely prevents metal ion-induced folding (4). Another important hydrogen bond stabilizes the tight turn made at the loop of the k-turn. An interaction between the O2 of L3 and the ProfiS non-bridging O of the phosphate between L1 and L2 bridges the neck of the turn, and is observed in most k-turn crystal structures. Removal of the O2 from L3 ribose in Kt-7 led to marked impairment of ion-induced folding (4).

    Two important hydrogen bonds in the loop, seen here in Kt-7. One is donated from the O2 of L3 to the ProfiS non-bridging O of the phosphate between L1 and L2. The other is between the O2 of L2 and the ProfiS O of the L2/L3 phosphate group.

    There is a further key hydrogen bond in the A-minor interaction between the C and NC helices, from the O2' of -1n to the nucleobase of the conserved adenine 2b. However, the acceptor can be N3 or N1, and this divides most of the known k-turn structures into two structural classes (31) . This is also true for the k-turns with an A A pair at the 2b 2n position. The rotation of the adenine nucleobase required to present either N3 or N1 as acceptor affects the basepairing with the base at the 2n position. For example, where this is guanine, the G A pair is bonded by two hydrogen bonds for the N3 class however in the N1 class the A2b N6 to G2n N3 is too long to be considered hydrogen bonded.

    Examples of the N3 and N1 classes of k-turn, showing the A-minor interaction between A2b and the O2' at the -1n position, and the hydrogen bonding between A2b and G2n. The red broken line in Kt-38 indicates an N-N distance of 4.7 , too long to be bonded.

    K-turns that depart from the consensus sequence

    Some k-turns break the rules of the standard motif. We divide these into two classes :
    1. The simple k-turns. These retain the same ordering of key nucleotides with respect to the primary sequence.
    2. The complex k-turns. In these k-turns the key nucleotides do not map onto the primary sequence in a linear way.

    Some of the simple k-turns have sequence changes that alter the seemingly essential G A pairs. This is well exemplified by Kt-23 of the small ribosomal subunit, that exhibits frequent changes from the consensus in the 2n position.

    WebLogo (43) summary of Kt-23 sequences

    In Kt-23 of Thermophilus (6), the 2n nucleotide is uridine, forming a non-Watson-Crick A U pair with A2b. Although making the same change in Kt-7 totally prevents folding from occurring, Kt-23 folds efficiently on addition of magnesium ions, and its structure in the 30S ribosomal subunit is superimposable with that of Kt-7 (44).

    Overlay of the crystal structures of Kt-7 (blue) and Kt-23 (red), showing the closely similar positions of the adenine nucleobases at the 1n and 2b positions.

    A relatively rare subset of Kt-23 sequences have adenine at the 2n position, giving a potential A A pair at the 2b 2n position. One such example is found in Thelohania solenopsae. This can be folded into the k-turn conformation by the binding of L7Ae, or by tertiary interactions in the SAM-I riboswitch (45). The crystal structure of the latter construct shows that the RNA adopts standard k-turn geometry, with the 1n and 2b adenine nucleobases directed into the C helix minor groove as normal, and preservation of the standard hydrogen bonding pattern (45). This is an N1 structure, and consequently there is no hydrogen bond between A2b N6 and A2n N3 (N-N distance 4.7 ).

    The structure of the A2b A2n pair observed in the crystal structure of T. solenopsae Kt-23 (45). The electron density is the calculated composite omit map.

    The complex k-turns exhibit more radical departure from the simple k-turns such as H. marismortui Kt-7, where the key nucleotides appear to be out of order (as in T. thermophilus Kt-11), and can even pass between strands (as in H. marismortui Kt-15).

    The connectivity of the nucleotides in the structures of H. marismortui Kt-15, and T. thermophilus Kt-11.

    Despite the major departures of the sequences from the conventional k-turn, both form standard k-turn structures in the ribosome. We recommend naming the nucleotides according to their location in the structure, rather than their position in the linear sequence. Thus the adenine paired with G2n in Kt-15 is best termed 2b, even though it is covalently located on the non-bulged strand.

    In some species k-turns are functionally replaced by structures that are strongly kinked, yet not k-turns (if we define k-turns by the A G pairs and the juxtaposition of the N and NC helix minor grooves). Zum Beispiel die B. subtilis lysine riboswitch contains a probable k-turn that introduces a kink into the structure required for the tertiary structure (13), yet in Thermatoga maritima this is replaced by a sequence that is plainly not a k-turn (40). The latter may well be a point of flexibility rather than an intrinsic kink, but it functions in a similar manner vor Ort. In another example, RNase P of T. Maritima contains a sequence (termed a pk turn) that is kinked similarly to a k-turn (47) , but lacks the G A pairs and cross-strand hydrogen bonding. However the pk-turn and the k-turn are functionally exchangeable between the SAM-I riboswitch and RNase P (40). In the crystal structure of the group I intron ribozyme of Azoarcus, Strobel and colleagues found a sequence that they termed the reverse k-turn (48). This motif has an A A pair at the putative 1b 1n position, and bends in the opposite direction compared to conventional k-turns, so that the major grooves become juxtaposed. We feel that this should not be classified as a k-turn because it lacks all the key elements that define a k-turn.

    A role for k-turns in building complex RNA structures ?

    Kink turns could play a key role in RNA architecture and the biogenesis of large assemblies. This includes the formation of functional RNA-protein complexes such as the box C/D in guided methylation, where the first even is the binding of an L7Ae-related protein to a k-turn. On a larger scale, the ribosome has many k-turns that are bound by a variety of different proteins. The dynamic character of the k-turn should provide opportunity for RNA to explore conformational space, but once folded the tight kink can provide long-range organization of the structure in a delicate interplay between the local structure and tertiary interactions. This may provide flexibility during the assembly of the structure, with subsequent fixation by the high-affinity binding of specific proteins to k-turns.


    Danksagung

    We thank K. Makarova for assistance with the PSIBLAST search and S. Gottesman, S. Melamed, M. Raina, T. Updegrove, J. Vogel, and Z. Wroblewska for comments. Research in the M.O. lab is supported by the National Science Centre in Poland (grant no. 2014/15/B/NZ1/03330), KNOW RNA Research Centre in Poznań (grant no. 01/KNOW2/2014), and the Foundation for Polish Science (grant no. TEAM/2011-8/5), co-financed by the European Union Regional Development Fund. Research in the G.S. lab is supported by the Intramural Research Program of the Eunice Kennedy Shriver National Institute of Child Health and Human Development. Die Autoren geben keinen Interessenkonflikt an.

    Bitte beachten Sie: Der Herausgeber ist nicht verantwortlich für den Inhalt oder die Funktionalität der von den Autoren bereitgestellten unterstützenden Informationen. Alle Anfragen (außer fehlenden Inhalten) sollten an den entsprechenden Autor des Artikels gerichtet werden.


    Schau das Video: Untranslated regions: how 5 and 3 UTRs regulate transcription and translation (Dezember 2022).