Information

Epitop-annotiertes Protein

Epitop-annotiertes Protein


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Was ist mit Epitop annotiertes Protein?
Das Buch, aus dem ich diesen Begriff habe, ist:
http://www.springer.com/biomed/immunology/book/978-1-4939-1114-1


Wenn Sie nach einem bestimmten kleinen Begriff fragen, überprüfen Sie am besten Ihre Rechtschreibung. Wenn Sie sich die Empfindung tatsächlich ansehen, werden Sie feststellen, dass Sie einen sehr wichtigen Bindestrich weggelassen haben:

Pellequer verglich mehrere Methoden der Neigungsskala mit einem Datensatz von 14 Epitop-annotierte Proteine. [Betonung hinzugefügt]

Der Ausdruck bedeutet, dass auf den Proteinsequenzen (Aminosäuresequenz) die Epitope markiert sind. Wenn Sie sich das zitierte Papier ansehen, sehen Sie die verschiedenen Tabellen und Aufschlüsselungen der bestimmten Epitope. Pellequers Gruppe hat einen Großteil der frühen Arbeit geleistet, als die Leute noch an Techniken arbeiteten, um die Orte von Epitopen zu "kartieren" (die aufgrund der Proteinstruktur oft nicht in linearen Segmenten der Proteinsequenz liegen).


12.2: Antigene und Epitope

  • Beigetragen von Gary Kaiser
  • Professor (Mikrobiologie) am Community College of Baltimore Country (Cantonsville)
  1. Definieren Sie Antigen und Immunogen.
  2. Geben Sie an, woraus Antigene chemisch zusammengesetzt sind.
  3. Listen Sie 3 Eigenschaften auf, die ein Antigen haben muss, um immunogen zu sein.
  4. Epitop definieren.
  5. Beschreiben Sie kurz, wie der Körper ein Antigen als fremd erkennt.
  6. Vergleichen Sie B-Zell-Rezeptoren und T-Zell-Rezeptoren im Hinblick darauf, wie sie Epitope erkennen.
  7. Nennen Sie in Bezug auf Infektionskrankheiten 2 Kategorien von mikrobiellem Material, das als Antigen wirken kann.
  8. Nennen Sie 3 Gruppen nicht infektiöser Materialien, die als Antigen wirken können.
  9. Definieren Sie Folgendes:
    1. endogenes Antigen
    2. exogenes Antigen
    3. Autoantigen
    4. Hapten

    Ein Antigen ist definiert als eine Substanz, die mit Antikörpermolekülen und Antigenrezeptoren auf Lymphozyten reagiert. Ein Immunogen ist ein Antigen, das vom Körper als körperfremd erkannt wird und eine adaptive Immunantwort stimuliert. Der Einfachheit halber werden sowohl Antigene als auch Immunogene üblicherweise als Antigene bezeichnet.

    Um immunogen zu sein, muss ein Antigen drei Eigenschaften aufweisen:

    • ein hohes Molekulargewicht haben,
    • chemische Komplexität aufweisen und
    • Fremdheit zeigen (vom Körper als Nicht-Selbst erkannt).

    Chemisch gesehen sind Antigene Proteine ​​mit großem Molekulargewicht (einschließlich konjugierter Proteine ​​wie Glykoproteine, Lipoproteine ​​und Nukleoproteine) und Polysaccharide (einschließlich Lipopolysaccharide). Diese Protein- und Polysaccharid-Antigene finden sich auf den Oberflächen von Viren und Zellen, einschließlich mikrobieller Zellen (Bakterien, Pilze, Protozoen) und menschlichen Zellen.


    Identifizierung von zwei antigenen Epitopen auf dem SARS-CoV-Spike-Protein

    Das Spike (S)-Protein des schweren akuten respiratorischen Syndroms-Coronavirus (SARS-CoV) ist ein wichtiges Virion-Strukturprotein. Es spielt eine wichtige Rolle bei der Interaktion mit dem Rezeptor und der Induktion neutralisierender Antikörper. In der Studie wurden sechs vorläufige antigene Epitope (S1 S2 S3 S4 S5 S6) des Spike-Proteins von SARS-CoV durch bioinformatische Analyse vorhergesagt, und ein chimäres Gen mit mehreren Epitopen von S1-S2-S3-S4-S5- S6 wurde synthetisiert und an das stromabwärts gelegene GST-Gen in pGEX-6p-1 fusioniert. Das Western-Blotting zeigte, dass das Rekonvaleszenzserum von SARS-Patienten das rekombinante Fusionsprotein erkennen konnte. Gegen das Fusionsprotein wurde eine Reihe von monoklonalen Antikörpern entwickelt. Darüber hinaus wurden die sechs vorhergesagten Epitop-Gene einzeln an GST von pGEX-6p-1 fusioniert bzw. in Escherichia coli BL21 exprimiert. Von den sechs Fusionspeptiden reagierte S5 mit dem monoklonalen Antikörper D3C5 und S2 mit dem monoklonalen Antikörper D3D1 gegen das Spike-Protein von SARS-CoV. Die von den monoklonalen Antikörpern D3C5 und D3D1 erkannten Epitope sind linear und entsprechen 447-458 bzw. 789-799 Aminosäuren des Spike-Proteins von SARS-CoV. Die Identifizierung des antigenen Epitops des Spike-Proteins von SARS-CoV könnte die Grundlage für die Entwicklung immunitätsbasierter prophylaktischer, therapeutischer und diagnostischer Techniken zur Kontrolle des schweren akuten respiratorischen Syndroms bilden.

    Figuren

    Schematische Darstellung der relativen Lage…

    Schematische Darstellung der relativen Lage ausgewählter Spike-Proteinsegmente. Die Kiste steht für…

    Western-Blotting-Analyse von Multiepitopen…

    Western-Blotting-Analyse von Multi-Epitop-Fusionspeptid und Epitop S2 und S5. GST…

    Western-Blotting-Analyse rekombinanter…

    Western-Blotting-Analyse rekombinanter Fusionspeptide mit monoklonalen Antikörpern. E coli mit…

    Nachweis rekombinanter Fusionspeptide…

    Nachweis rekombinanter Fusionspeptide mit McAbs durch ELISA. 96-Zellen-Mikrotiterplatten wurden…

    Nachweis von S2 oder S5 und ihren Derivaten mit McAbs durch Western-Blotting.…


    Ergebnisse

    Modell in voller Länge S

    Um nach möglichen Epitopen zu suchen, konstruierten wir ein detailliertes Strukturmodell von glykosyliertem Volllängen-S. Während hochauflösende Strukturen des S-Kopfes verfügbar sind [6, 7], sind Stiel und Membrananker bisher nicht am atomaren Niveau.

    Wir haben ein Modell des vollständigen S erstellt, indem wir experimentelle Strukturdaten und bioinformatische Vorhersagen kombiniert haben. Unser Volllängenmodell des S-Trimers besteht aus der großen Ektodomäne (Reste 1-1137), die den Kopf bildet, zwei Coiled-Coil (CC)-Domänen, bezeichnet als CC1 (Reste 1138-1158) und Heptad-Repeat 2 (HR2, Reste 1167- 1204), den Stiel bildend, der α-helikale TMD (Reste 1212-1237) mit flankierenden amphipathischen Helices (AH, 1243-1255) und mehreren palmitoylierten Cysteinen und einer kurzen C-terminalen Domäne (CTD, Reste 1256-1273), siehe S1(A) Abb. für Domänendefinitionen . Wir haben das Glykosylierungsmuster modelliert, wie es kürzlich für überexprimiertes S gezeigt wurde [30] (siehe S1(B) Abb.). Trotz der Passage durch einen intakten Golgi ähneln die exprimierten Glykane denen von nativem SARS-CoV S [31].

    Wie gezeigt [23] passt das Modell bemerkenswert gut zu hochauflösenden CryoET-Elektronendichtedaten von S-Proteinen auf der Oberfläche von Virionen, die aus einer Kultur infizierter Zellen extrahiert wurden. Es erfasst auch die Stieldomäne mit seinen drei flexiblen Scharnieren zwischen dem S-Kopf und CC1, CC1 und HR2 sowie HR2 und dem TMD. Auch die tomographischen Karten bestätigten die weitgehende Glykosylierung des Modells [23].

    Atomistische MD-Simulationen im Multi-Mikrosekundenbereich zeigen die Dynamik von S und seinem Glykanschild

    Wir führten eine 2,5 μs lange atomistische MD-Simulation eines viralen Membranpatches mit vier flexiblen S-Proteinen durch, die in einem Abstand von etwa 15 nm eingebettet waren [32, 33] (Abb. 1). Während der Simulation blieben die vier S-Proteine ​​gefaltet (S2(G)–S2(J) Abb) und mit gut getrennten TMDs stabil in der Membran verankert.

    Drei Proteine ​​sind in Oberflächendarstellung gezeigt, wobei Glykane als grüne Stäbchen dargestellt sind. Ein Protein ist in Cartoon-Darstellung gezeigt, wobei die drei Ketten einzeln gefärbt sind und Glykane aus Gründen der Übersichtlichkeit weggelassen wurden. Wasser ist als transparente blaue Fläche dargestellt und Ionen wurden der Übersichtlichkeit halber weggelassen. Zur besseren Sichtbarkeit werden zwei Simulationsboxkanten nicht gezeichnet.

    Die S-Köpfe neigten sich dynamisch und interagierten mit ihren Nachbarn (S1 Movie). Hochauflösende KryoET-Bilder [23] und eine kürzlich durchgeführte MD-Studie [26] zeigten unabhängig voneinander eine signifikante Kopfneigung im Zusammenhang mit der Beugung der Gelenke im Stiel, was unsere Beobachtungen stark unterstützt. Da sie sehr mobil sind, bedecken die Glykane den größten Teil der S-Oberfläche (Abb. 2A–2C).

    Zeitgemittelte Glykan-Elektronendichte-Isooberflächen werden mit hoher (EIN), Mittel (B), und tief (C) Konturebenen bzw. Die blau-weiße Proteinoberfläche zeigt eine hohe bis niedrige Zugänglichkeit in der Strahlenanalyse an. (Einschub) Schnappschüsse (Stöcke) eines biantennären, kernfucosylierten und sialylierten Glykans an Position 1098 entlang der MD-Trajektorie.

    Antikörper-Bindungsstellen, vorhergesagt aus Zugänglichkeit, Rigidität, Sequenzerhaltung und Sequenzsignatur

    Zugänglichkeit der Sektodomäne.

    Die Antikörperbindung erfordert zumindest einen vorübergehenden Zugang zu Epitopen. Der Glykanschild, der die Oberflächenproteine ​​umhüllter Viren bedeckt, kann den Zugang zu diesen Bindungsstellen sterisch behindern und SARS-CoV-2 helfen, einer robusten Immunantwort zu entgehen [34]. Wir untersuchten die Zugänglichkeit von S auf der viralen Membran und die Oberflächenbedeckung durch Glykane durch (i) Strahlen- und (ii) Antigen-bindende Fragmente (Fab) Docking-Analysen der S-Konfigurationen in unseren MD-Simulationen. In der Strahlenanalyse beleuchteten wir das Proteinmodell mit diffusem Licht in der Fab-Docking-Analyse, wir führten Starrkörper-Monte-Carlo-Simulationen von S-Konfigurationen aus den MD-Simulationen zusammen mit dem SARS-CoV-2-Antikörper CR3022 Fab durch, um zu quantifizieren, wie einfach ein Fab-Antikörper konnte auf die Oberfläche von S zugreifen. Um die Protein- und Glykanmobilität zu berücksichtigen, führten wir beide Analysen einzeln für 4 × 250 Schnappschüsse aus, die in Zeitintervallen von 10 ns aus der 2.5 μs MD-Simulation mit vier glykosylierten S-Proteinen aufgenommen wurden.

    Der dynamische Glykanschild bedeckt effektiv die S-Oberfläche (Abb. 3A und 3B). Obwohl Glykane zu einem bestimmten Zeitpunkt nur einen kleinen Teil der Proteinoberfläche bedecken (Abb. 1), führt ihre hohe Mobilität zu einer starken sterischen Abschirmung von S (Abb. 2). Ein Vergleich der Strahlen- (S3(A)–S3(C) Abb) und Fab-Docking-Ergebnisse (S3(D)–S3(I) Abb) für glykosyliertes und unglykosyliertes S veranschaulicht diesen Effekt. Wir betrachten Strahlen- und Docking-Analysen als komplementär: Die Strahlenanalyse liefert eine obere Schranke für die Zugänglichkeit, da die dünnen Strahlen den Glykanschild leichter durchdringen können als Antikörper, während das Rigid-Body-Docking eine untere Schranke ergibt, weil sie nicht Berücksichtigen Sie jegliche induzierte Anpassung durch Wechselwirkungen zwischen Glykanen und Antikörper. Wichtig ist, dass die beiden Methoden konsistent sind bei der Identifizierung von Regionen mit hoher und niedriger Zugänglichkeit ( 4A und 4B ). Ray- und Docking-Analysen zeigen, dass Glykane eine Verringerung der Zugänglichkeit um etwa 34 % bzw. 80 % bewirken (Tabelle B in S1-Text). Der stärkste Effekt tritt bei der HR2-Coiled-Coil in der Nähe der Membran auf. Ohne Glykosylierung ist HR2 mit Glykosylierung vollständig zugänglich, HR2 wird für das Fab-Docking unzugänglich. Während kleine Moleküle mit dem HR2-Proteinstiel interagieren können, werden Antikörper vom Oberflächenzugang blockiert, in Übereinstimmung mit neueren unabhängigen Simulationen [26].

    Zugänglichkeitsbewertungen von (EIN) Strahlenanalyse und (B) Fab Starrkörper-Docking werden kombiniert mit (C) Steifigkeitswerte, alle gemittelt über 4 × 2.5 μs von S-Protein-MD-Simulationen. Ebenfalls enthalten sind (D) eine Sequenzerhaltungsbewertung [35] und (E) BepiPred-2.0-Epitop-Sequenz-Signatur-Vorhersage. (F) Kombinierter Epitop-Score. (g) Bindungsstellen bekannter neutralisierender Antikörper. Höhere Farbintensität in EIN-F zeigt eine höhere Punktzahl und eine höhere Farbintensität in g zeigt Stellen an, die an mehrere verschiedene Antikörper binden.

    Felder (A-F) und Farben wie in Abb. 3. Alle Werte werden gefiltert und normalisiert (siehe Methoden). Die Markierungen E1–E9 in (F) markieren Kandidatenepitope. Grüne Linien zeigen Glykosylierungsstellen an. Schwarze Rechtecke zeigen bekannte Antikörperbindungsstellen, die ebenfalls in Schwarz entlang der S-Sequenz im unteren Kasten angezeigt werden.

    Auf SARS-CoV-2-Virionen bilden S-Proteine ​​gelegentlich dichte Cluster, was die Avidität der Interaktionen mit menschlichen Wirtszellen verstärken kann [23]. Um den Effekt von Crowding zu quantifizieren, verglichen wir die Epitopzugänglichkeit von S aus den Strahlen- und Dockinganalysen im dichten Simulationssystem (S3(C) und S3(I) Abb) und isoliert (S3(B) und S3(H) Abb), dh mit den anderen Proteinen aus dem MD-System entfernt. Insgesamt reduzierte Protein-Crowing die Zugänglichkeit von S um weitere ∼ 5% in der Strahlenanalyse und ∼ 6% in der Fab-Docking-Analyse, was zu einer kombinierten Reduktion der Zugänglichkeit durch Glykane und überfüllte Proteine ​​von ∼ 39% bzw. ∼ 86% führte.

    Steifigkeit von S.

    Von strukturierten Epitopen wird erwartet, dass sie stark und spezifisch an Antikörper binden. Im Gegensatz dazu neigen mobile Regionen dazu, im gebundenen Zustand strukturiert zu werden, was zu einem Entropieverlust führt und ihre Struktur möglicherweise nicht beibehalten, wenn sie in einem Impfstoffkonstrukt präsentiert werden. Mit dem Ziel, eine robuste Immunantwort hervorzurufen, haben wir uns entschieden, Rigidität in unseren Epitop-Score aufzunehmen. Hier konzentrieren wir uns auf Bewegungen von Domänen im Bereich von etwa 1 nm. In einer anderen Arbeit haben wir die großskalige Konformationsdynamik im Zusammenhang mit den flexiblen Scharnieren im Stiel und Membrananker analysiert [23]. Wir haben die Wurzel-Mean-Square-Fluktuationen (RMSF) bestimmt, indem wir Proteinstrukturen überlagert und den RMSF in einen Rigidity-Score umgerechnet haben, wie in Methoden beschrieben.

    Die Oberfläche von S weist sowohl dynamische als auch starre Bereiche auf (Fig. 4C). Interessanterweise sind die RBD und ihre Umgebung vergleichsweise flexibel, was mit der experimentellen Feststellung großer Unterschiede in der Struktur der drei Peptidketten in offenen und geschlossenen Zuständen übereinstimmt [7]. Im Gegensatz dazu ist die Proteinoberfläche der S2-Domäne, die die Fusionsmaschinerie bedeckt, relativ starr ( 4C ), möglicherweise um diese funktionskritische Domäne in der metastabilen Präfusionskonformation zu schützen.

    Sequenzerhaltung.

    Das Targeting von Epitopen, deren Sequenzen hoch konserviert sind, stellt die Wirksamkeit über alle Stämme hinweg sicher und verhindert, dass das Virus dem Immundruck durch Mutationen mit minimaler Fitnesseinbuße entkommt. Wir haben die Sequenzkonservierung aus den natürlich vorkommenden Variationen an jeder Aminosäureposition in den von der GISAID-Initiative (https://www.gisaid.org/) gesammelten und kuratierten Sequenzen abgeschätzt. Die Analyse von 30.426 Aminosäuresequenzen ergab, dass S insgesamt hochkonserviert ist, wobei für 52% der Aminosäurepositionen keine Mutation aufgezeichnet wurde. Als Erhaltungsscore haben wir die Entropie an jeder Position auf das Intervall zwischen Null und Eins abgebildet (siehe Methoden). Gerade Oberflächenregionen sind in der Folge meist gut konserviert (Fig. 4D).

    Sequenzbasierter Prädiktor für die Immunogenität.

    Konservierte, starre und zugängliche Regionen stellen im Allgemeinen gute Kandidaten für die Bindung von Proteinpartnern dar. Um diese Informationen zu ergänzen, bewerteten wir das immunogene Potenzial basierend auf Sequenzsignaturen, auf die Antikörper gerichtet sind. Die epitopähnlichen Motive in der S-Sequenz, die unter Verwendung des BepiPred 2.0-Servers [36] identifiziert wurden, liegen über die Sektodomäne verstreut und umfassen bekannte Epitope (Fig. 3E und 4E), enthalten aber auch vergrabene Regionen, die für Antikörper unzugänglich sind.

    Konsens-Epitop-Score.

    Wir kombinierten unsere Zugänglichkeits-, Rigiditäts-, Konservierungs- und Immunogenitäts-Scores zu einem einzigen Konsensus-Epitop-Score ( 3F und 4F ). Indem wir das Produkt aller Einzelbewertungen genommen haben, stellten wir sicher, dass Epitop-Kandidaten in allen Merkmalen hohe Punktzahlen aufweisen. Diese strenge Anforderung eliminiert viele Kandidatenstellen, hauptsächlich weil die Zugänglichkeitsbewertungen ( 4A und 4B ) und die Steifigkeitsbewertung ( 4C ) entgegengesetzte Trends zeigen, in Übereinstimmung mit dem umfangreichen Auftreten von flexiblen Schleifen auf der S-Oberfläche.

    Mit unserem Konsensus-Score identifizierten wir neun Epitop-Kandidaten (E1–E9 Abb. 5 und Tabelle 1). Die Epitopkandidaten E3–E6 stellen bekannte Epitope wieder her (Abb. 3F, 3G und 4F), in einigen Fällen erreichen sie eine Genauigkeit auf Rückstandsebene (S4 Abb). Zusätzlich identifizieren wir die Epitopkandidaten E1, E2 und E7–E9. Alle Epitopkandidaten befinden sich im strukturierten Kopf von S. Im Gegensatz dazu führen die geringe Zugänglichkeit und die hohe Flexibilität in den Scharnieren [23] dem Stiel zu niedrigen Gesamtepitopwerten.

    (EIN) Draufsicht von S, dargestellt wie in Fig. 3F. Epitopkandidaten sind gemäß Tabelle 1 gekennzeichnet. (B) Seitenansicht mit Farbgebung und Beschriftung wie in A. (C) Zoom-Ins auf Epitop-Kandidaten (E1, E2, E7–E9) in einer Cartoon-Darstellung und eingefärbt wie in A. Rückstände mit einem Epitop-Konsensus-Score >0,2 werden in gelber Lakritz-Darstellung gezeigt.

    In unserer Simulation wurden zwei der RBD-Domänen in der geschlossenen Konformation und eine in der offenen Konformation abgetastet. Um die Wirkung von offenen und geschlossenen Zuständen zu beurteilen, berechneten wir die Zugänglichkeits- und Konsensus-Scores für alle acht Proteinketten mit geschlossener RBD-Konformation (S10 Abb.). Ein Vergleich mit Abb. 4 zeigt, dass die einzigen nennenswerten Unterschiede in der Zugänglichkeit in der RBD-Region auftreten.

    Die Verdrängung von S führt zu einem signifikanten Abfall des Scores der Epitopkandidaten E1 und E2, während es auf die Kandidaten E3–E4 und E7–E8 nur wenig und auf die Kandidaten E5–E6 und E9 keinen Einfluss hat (S5 Abb.).

    Kollektives Verhalten von S.

    Trotz der bemerkenswert zufälligen Verteilung von S an der Oberfläche der Virionen sind dicht besiedelte Patches keine Seltenheit (vgl. Abb. 5G in [23]). Mehrere S werden wahrscheinlich in Kontakt kommen, wenn sie gleichzeitig an ein einzelnes ACE2-Dimer gebunden oder durch Antikörper vernetzt werden. Wir nutzten unseren Simulationsaufbau und analysierten die Wechselwirkungen zwischen S. Während 2,5 μs beobachteten wir eine Reihe von Kontakten, die sowohl Glykane als auch Proteinoberflächen einbeziehen, was zu einer teilweisen Blockierung von drei der S in einer charakteristischen dreieckigen Anordnung von S-Kopfdomänen und mit das vierte S wechselwirkt nur schwach mit zwei seiner Nachbarn (S9(A) Abb). Im blockierten Zustand bildeten Glykane ein ausgedehntes Netzwerk von Wechselwirkungen, wie in S9(B) zu sehen ist (D) Abb.). Wir fanden, dass sich die Mehrheit der proteinvermittelten Kontakte in den unstrukturierten Schleifen innerhalb der NTD-Regionen befindet. Glykan-vermittelte Kontakte konzentrieren sich in den Sequenzen, die sich in den NTD- und RBD-Bereichen und am unteren Ende des S-Kopfes befinden. Trotz ihrer Größe waren die am Stiel befindlichen Glykane nicht an den Inter-S-Kontakten beteiligt. Stattdessen blieben sie durch die viel geräumigeren Kopfdomänen relativ abgeschirmt.


    3. Ergebnisse und Diskussion

    3.1. Proteinauswahl und -bewertung

    Es hat sich gezeigt, dass die Kombination einer langen Liste von Antigenen die Wirksamkeit von Impfstoffen erhöhen kann (Rossi et al., 2004). Malfertheineret al. (2008) untersuchten einen Mehrkomponenten-Impfstoff an menschlichen Freiwilligen und stellten fest, dass der Impfstoff sicher und stark immunogen war und lang anhaltende humorale und zelluläre Reaktionen auf die Antigene auslöste. Daher wurden 11 Proteine ​​für unseren Impfstoff ausgewählt. UreB wurde in vielen Studien zur Antigenität berichtet. VacA, CagA, GGT, NapA und OipA sind die Hauptproteine, die an den pathogenen Mechanismen beteiligt sind. HpaA, FlaA, FecA, BabA und SabA wurden aufgrund ihrer Beteiligung an den Mechanismen der Adhäsion und Kolonisation ausgewählt.

    Ausgewählte Proteine ​​wurden im nächsten Schritt weiter auf weitere Parameter untersucht, darunter subzelluläre Lokalisierung, Essentialität, Virulenz, nicht-humane Homologie, TM-Helixe und Molekulargewicht. Unsere Vorhersagen zeigten, dass UreB und NapA eine zytoplasmatische Position besaßen. CagA, FlaA, VacA und BabA waren extrazellulär, während OipA, SabA, HpaA und FecA als Proteine ​​der äußeren Membran vorhergesagt wurden. Darüber hinaus wurde GGT als periplasmatisches Protein klassifiziert, wie in Tabelle 1 gezeigt. Oberflächen- und extrazelluläre Proteine ​​sind gute Angriffsziele für die Entwicklung eines Impfstoffs zur Prävention bakterieller Infektionen und Krankheiten (Dwivedi et al., 2016).

    Tabelle 1.Die subzelluläre Lokalisierung, Genessentizität, Virulenz, Humanhomologie, Transmembranhelix, isoelektrischer Punkt und Molekulargewichtsvorhersagen von Helicobacter pylori Ausgewählte Proteine

    aa, Aminosäure C, zytoplasmatisch E, essentielles ES, extrazelluläres N-ES, nicht essentielles N-H, Nichthomologie N-V, nicht virulentes OM, äußere Membran P, periplasmatische TM, transmembrane V, virulent.

    Bei der Analyse essentieller Gene durch OGEE wurden die Gene HP1118 (GGT) und HP0807 (FecA) identifiziert. Essentielle Gene sind diejenigen Gene eines Organismus, die für sein Überleben entscheidend sind. Essentielle Gene sind aufgrund ihrer theoretischen und praktischen Anwendungen von besonderer Bedeutung, z (Chen et al., 2017). Darüber hinaus wurden 9 der 11 Proteine ​​in der Datenbank der Virulenzfaktoren von PATRIC gefunden FecA und GGT wurden in dieser Kategorie nicht identifiziert. Die Homologieanalyse der 11 priorisierten Proteine ​​unter Verwendung von BLASTp ergab ≤30% Identität, was signifikant war, um die Sequenzen als nicht-menschliche Homologe zu deklarieren Impfstoff-Ziele sollten keine menschlichen Homologe sein, um Autoimmunität zu vermeiden. Die Vorhersage der Topologie von Proteinen durch TMHMM zeigte, dass VacA und GGT eine TM-Helix aufweisen, während andere Proteine ​​das Vorhandensein einer solchen Topologie nicht aufdecken. VacA und GGT zeigten das Vorhandensein einer TM-Helix an den Positionen 35–57 bzw. 5–27 Aminosäuren. Schließlich ergaben die mit dem Compute pI/Mw-Tool berechneten Molekulargewichte von neun Proteinen ein Gewicht von <110 kDa, während VacA und CagA Molekulargewichte von 139,3 bzw. 132,4 kDa aufweisen (Tabelle 1).

    Als gute Impfstoffkandidaten werden diejenigen angesehen, die keine Homologie mit menschlichen Proteinen aufweisen, um die Erzeugung einer potentiellen Autoimmunantwort zu vermeiden, diesen Kandidaten müssen auch TM-Regionen fehlen, um ihre Expression zu erleichtern. Eine weitere Eigenschaft, die ein guter Impfstoffkandidat haben sollte, sind gute antigene Eigenschaften, die für die Pathogenese des Mikroorganismus und den Schutz vor der Krankheit wichtig sind (Monterrubio-López et al., 2015). Einige Autoren haben diese Ansätze bei der Auswahl von Proteinkandidaten für das in silico-Design von H. pylori Impfstoffe (Naz et al., 2015 Nezafat et al., 2017).

    3.2. Konsens-Antigen

    Um ein universelles . zu entwickeln H. pylori Impfstoff wurde eine Konservierungsanalyse der ausgewählten Antigene durchgeführt. Die Aminosäuresequenzen jedes Proteins wurden verglichen und mit 85 Sequenzen ausgerichtet, die vollständig annotierten Genomen von . entsprechen H. pylori aus verschiedenen geografischen Regionen zum Zeitpunkt der Studie. Es wurde eine hohe Variabilität bei den Proteinen CagA, VacA, FecA, BabA und SabA beobachtet, wie in Abbildung 1 gezeigt. Um die Variabilität zwischen H. pylori Stämme wurden Konsensussequenzen erhalten. Dieser Ansatz wurde gegen Infektionserreger mit einer hohen Variabilitätsrate wie HIV verwendet (Thomson et al., 2005 Grimm und Ackerman, 2013). Im Gegensatz dazu waren die Proteine ​​mit dem höchsten Prozentsatz (~95 %) der Konservierung UreB, NapA, GGT, FlaA, HpaA und OipA (Fig. 2).

    FEIGE. 1. Analyse der Konservierung ausgewählter Proteine. Ganze Proteinsequenzen unter den 85 annotierten Genomen von Helicobacter pylori wurden mit der CLC-Hauptwerkbank ausgerichtet, und die Erhaltungsbewertungen wurden in einem 2D-Liniendiagramm dargestellt. (ein) CagA, (B) SabA, (C) BabA, (D) VacA, und (e) FecA. 2D, zweidimensional.

    FEIGE. 2. Analyse der Konservierung ausgewählter Proteine. Ganze Proteinsequenzen unter den 85 annotierten Genomen von Helicobacter pylori wurden mit der CLC-Hauptwerkbank ausgerichtet, und die Erhaltungsbewertungen wurden in einem 2D-Liniendiagramm dargestellt. (ein) UreB, (B) GGT, (C) NapA, (D) FlaA, (e) OipA und (F) HpaA.

    3.3. T- und B-Zell-Epitope

    Die Vorhersageanalyse verschiedener Bioinformatik-Server für T- und B-Zellen (unter Verwendung von MHC-I/-II-Allelen für Human- und Maus-BALB/c) ermöglichte die Auswahl von 11 Epitopen basierend auf ihrem Score, der Anzahl der Allele und der Übereinstimmung zwischen den verwendeten Servern . Erhaltene Epitope waren NapA30–49, CagA1103–1122, FlaA487–506, OipA211–230, GGT106–126, HpaA33–52, BabA129–149, FecA437–456, SabA540–559, VacA459–478, und UreB170–189 (Tabelle 2). HpaA33–52 Epitop wurde zuvor von Hu et al. (2016) untersuchten sie die Reaktion antigenspezifischer CD4 + T-Lymphozyten, die mit rekombinantem HpaA von 101 . stimuliert wurden H. pylori-infizierten Personen wurde eine signifikante Zunahme der Interferon-γ-produzierenden Zellen beobachtet. Außerdem sind neun Reste von UreB170–189 in dieser Studie vorhergesagtes Epitop stimmt mit UreB . überein181–195 Epitop, das von Qiu et al. sie beobachteten die positive Reaktivität mit Seren von H. pylori-infizierte Patienten durch Enzyme-linked Immunosorbent Assay Mäuse, die mit Glutathion-S-Transferase-UreB . immunisiert wurden181–195 Fusionspeptid zeigte, dass epitopspezifische Antikörper in der Lage waren, die enzymatische Aktivität der Urease zu hemmen. In einer anderen Studie haben Guo et al. (2017) entwarfen und bewerteten einen multivalenten, auf Epitopen basierenden Impfstoff (genannt CWAE), der UreB . enthält181–195 Epitop. Die orale therapeutische Immunisierung mit CWAE reduzierte die Zahl der H. pylori Kolonien im Magen von Mongolische Rennmäuse. Der Schutz von CWAE war mit einem höheren Level an gemischter CD4 + T-Zellantwort, Immunglobulin G und sekretorischem Immunglobulin A verbunden (Guo et al., 2017).


    Epitop-annotiertes Protein - Biologie

    Links zur Antikörper-Ressourcenseite (ARP).
    Bio-Rad Antibody (ehemals AbD Serotec) Resources - Antikörperbezogene Mini-Rezensionen, pädagogische Zusammenfassungen, Anwendungshinweise und Blog.
    IHCWelt.

    Ressourcen zum Antikörper-Locator

    AbMiner - Antikörpersuche mit Schwerpunkt Antikörpervalidierung (Genomics and Bioinformatics Group, LMP, CCR, National Cancer Institute).
    Antibodypedia - eine Open-Access-Datenbank mit kommerziell erhältlichen Antikörpern gegen menschliche Proteinziele (Teil der Human Antibody Initiative (HAI) von HUPO in Zusammenarbeit mit der Nature Publishing Group.
    Antikörper-Explorer - Sigma-Aldrich-Einrichtung zum Durchsuchen ihrer großen Antikörpersammlung.
    The Antibody Registry - Register eindeutig identifizierter Antikörper, einschließlich kommerzieller Antikörper von etwa 200 Anbietern.
    Antikörper-Ressourcenseite (ARP).
    Bioz - Ein Wissenschaftsaggregator, der auf seiner Homepage eine umfassende Such- und Ranking-Funktion für Antikörper sowie eine durchsuchbare Liste von Antikörper- und verwandten Kategorien hier bereitstellt.
    Standortservice für Antikörper von Biocompare.
    Human Protein Atlas - Antikörperproteomik zur systematischen Erforschung des menschlichen Proteoms.
    IHCWelt.
    Linscott's Directory of Immunological & Biological Reagents.

    Epitop-Datenbanken und zugehörige Tools

    AntiJen - Eine kinetische, thermodynamische und zelluläre Datenbank v2.0 (T- und B-Zell-Epitope)
    Bcipep - Eine Datenbank von B-Zell-Epitopen (Bioinformatics Centre, Institute of Microbial Technology, Indien).
    Vorhersagen der HLA-Peptidbindung Online-Einrichtung der Abteilung für Bioinformatik und Molekularanalyse (BIMAS), NIH.
    IEDB - The Immune Epitope Database and Analysis Resource (T- und B-Zell-Epitope NIAID/NIH).
    IMGT - ImMunoGeneTics Informationssystem, das auf MHC-, Ig- und TcR-Moleküle aller Wirbeltierarten spezialisiert ist.
    MHCBN v4.0 - eine kuratierte Datenbank von MHC/TAP-bindenden, nicht bindenden Peptiden und T-Zell-Epitopen (Bioinformatics Centre, Institute of Microbial Technology, Indien).
    MHCPred - Vorhersage der Peptid-MHC-Klasse-I-Bindung unter Verwendung künstlicher neuronaler Netze (Center for Biological Sequence Analysis (CBS), Technische Universität Dänemark).
    NetMHC 4.0 - Server sagt die Bindung von Peptiden an mehr als 500 HLA-DR-Allele mithilfe künstlicher neuronaler Netze voraus (Center for Biological Sequence Analysis (CBS), Technical University of Denmark).
    NetMHCIIpan 2.0 - Server sagt die Bindung von Peptiden an mehr als 500 HLA-DR-Allele mithilfe künstlicher neuronaler Netze voraus (Center for Biological Sequence Analysis (CBS), Technical University of Denmark).
    ProPred - MHC-Klasse-II-Epitop-Vorhersageserver (Bioinformatics Centre, Institute of Microbial Technology, Chandigarh, Indien).
    ProPred I - Online-Einrichtung zur Vorhersage von MHC-Klasse-I-Bindungspeptiden (Bioinformatics Centre, Institute of Microbial Technology, Indien).
    SDAP - Strukturdatenbank für allergene Proteine ​​(Department of Biochemistry and Molecular Biology, University of Texas Medical Branch).
    SYFPEITHI - Datenbank von MHC-Liganden und Peptidmotiven (Biomedizinische Informatik (BMI), Heidelberg/Institut für Immunologie, Universität Tübingen).

    Protein-3D-Strukturvorhersage

    3D-JIGSAW - Server erstellt 3-D-Proteinmodelle basierend auf Homologen bekannter Struktur Biomolecular Modeling Laboratory, Cancer Research UK, London.
    3D-Strukturvorhersage - Umfassende Link-Ressource auf VLS3D.com (Virtual Ligand Screening).
    Zentrum für Molekulare Modellierung (CMM) (NIH).
    CPHmodels – Server für Proteinhomologiemodellierung (Center for Biological Sequence Analysis, (CBS), Technische Universität Dänemark).
    ESyPred3D - Homologie-Modellierungsserver, der MODELLER (siehe unten) zum Aufbau der endgültigen Protein-3-D-Struktur verwendet (Universität Namur, Belgien).
    EVA - Kontinuierliche automatische Überwachung von Proteinstruktur-Vorhersageservern in "Echtzeit".
    Interactome3D - Einzigartige Homologie-Modellierungsressource zur dynamischen Abbildung von Strukturinformationen auf beliebige Protein-Protein-Interaktionsdatensätze in Echtzeit (Institute for Research in Biomedicine, Barcelona).
    MMDB (Molecular Modeling DataBase) - 3D-Strukturdatenbank für die molekulare Modellierung (NCBI).
    MODELLER - Proteinmodellierung durch Erfüllung räumlicher Beschränkungen (Network Science - NetSci).
    Phyre2 - Phyre2 (Protein Homology/analogY Recognition Engine) entfernter Homologie-Modellierungsserver (Structural Bioinformatics Group, Imperial College, London).
    Protein Model Portal (PMP) - Zugang zu verschiedenen interaktiven Diensten zur Modellbildung und Qualitätsbewertung (Computational Structural Biology Group, SIB).
    Protein Structure Prediction Center (University of California, Davis).
    ROBETTA - Server zur Vorhersage der vollständigen Proteinstruktur von Anbietern von Rosetta-Software (Baker Lab, University of Washington).
    SWISS-MODEL - Ein vollautomatisierter ExPASy Proteinstrukturhomologie-Modellierungsserver (eine gute Seite für Anfänger). Dieser Server ist auch über das herunterladbare Programm DeepView (Swiss-PDBViewer) zugänglich.
    TINKER - Softwaretools für molekulares Design.

    Allosteric Database (ASD) - Datenbank allosterischer Proteine ​​und Modulatoren (Molecular Design Laboratory, Shanghai Jaiotong University, China) .
    Atlas der Protein-Seitenketten-Interaktionen - Protein-Protein und Protein-DNA The Biomolecular Structure and Modeling group, University College London) .
    Blue Gene Project - Supercomputing angewendet auf die Proteinstruktur (IBM)
    CLICK - Topologieunabhängiger Vergleich biomolekularer 3-D-Strukturen (Bioinformatics Institute A*STAR, Singapur).
    Dali-Server - Online-Einrichtung zum Vergleich von Protein-3D-Strukturen (Institut für Biotechnologie, Universität Helsinki).
    Database of Macromolecular Movements - mit zugehörigen Werkzeugen für Flexibilität und geometrische Analyse (Gerstein Lab, Yale University).
    DNA-bindende Proteinstrukturfamilien - Hyperlink-Informationen gruppiert nach DNA-Erkennungsmotiv (The Biomolecular Structure and Modeling Group, University College London).
    EDS - Der Elektronendichteserver (Universität Uppsala, Schweden).
    ELM - Die Eukaryotic Linear Motif-Ressource für die Vorhersage der funktionellen Stellen von Proteinen aus der Eingabesequenz (ELM-Konsortium).
    Datenbank für Enzymstrukturen - EC PDB-Datenbank bekannter Enzymstrukturen, hinterlegt in der Protein Data Bank (PDB).
    Epitome - Datenbank von strukturell abgeleiteten antigenen Epitopen in Proteinen.
    iELM - Die Interaktionen der eukaryotischen Linearmotiv-Ressource sagt kurze lineare Motive (SLiMs) voraus, die mit Protein-Protein-Interaktionsschnittstellen (EMBL) verbunden sind.
    Interactome3D - Ein Webservice zur strukturellen Annotation von Protein-Protein-Interaktionsnetzwerken (Institute for Research in Biomedicine, Barcelona).
    JenaLib Jena Bibliothek biologischer Makromoleküle. Ressource zur Visualisierung und Analyse von Proteinatlas (Institut für Molekularbiologie (IMB), Jena, Deutschland).
    MMDB (Molecular Modeling DataBase) - 3D-Strukturdatenbank für die molekulare Modellierung (NCBI).
    ModBase - Datenbank vergleichender Proteinstrukturmodelle (Sali Lab, University of California, San Francisco).
    PartsList - Ressource zur Analyse von Proteinfalten (Gerstein Lab, Yale University).
    PDBsum - Eine wichtige Internetquelle für Proteinstrukturinformationen (EMBL-EBI).
    PDBWiki - Eine von der Community kommentierte Wissensdatenbank über biologische molekulare Strukturen.
    PISA (PDBePISA) - Werkzeug für Proteingrenzflächen, Oberflächen und Anordnungen und Vorhersage wahrscheinlicher quartärer Strukturen (EMBL-EBI).
    PRINTS - Ein Kompendium von Protein-Fingerabdrücken, eine Gruppe von konservierten Motiven, die verwendet werden, um eine Proteinfamilie zu charakterisieren.
    Motif Scan - ProSite-Profil- und Mustermotive und Pfam-Proteinfamilien (SIB - ISREC).
    PROSITE-Datenbank von Proteindomänen, Familien und funktionellen Stellen (ExPASy - SIB).
    Proteindatenbank (PDB) - Vom Forschungsverbund für Strukturelle Bioinformatik (RCSB).
    Protein Data Bank in Europe (PDBe) - Europäische Ressource für die Sammlung, Organisation und Verbreitung von Daten zu biologischen makromolekularen Strukturen (EMBL-EBI).
    Protein Data Bank Japan (PDBj) - Datenbank makromolekularer Strukturen und integrierter Werkzeuge (National Bioscience Database Center und Osaka University).
    Protein Model Portal (PMP ehemals PSI Protein Structure Knowledgebase) - Zugang zu Modellen eines bestimmten Proteins, die mit verschiedenen vergleichenden Modellierungsmethoden berechnet wurden (Computational Structural Biology Group, SIB).
    Ramachandran-Plot - Server, der die Torsionswinkel der Hauptkette von einem Eingangsprotein bekannter Struktur anzeigt (Supercomputer Education and Research Centre, Bangalore).
    SALIGN – Ein Server zur Ausrichtung mehrerer Proteinsequenzen/Strukturen basierend auf der Verwendung von MODELLER (siehe vorheriger Abschnitt) (Sali Lab, University of California, San Francisco).
    SWISS-MODEL Repository - Datenbank mit annotierten 3-D-Vergleichsmodellen von Proteinstrukturen, die von der ExPASy-Modellierungspipeline SWISS-MODEL generiert wurden (siehe vorheriger Abschnitt).
    Theseus - Simultane Überlagerung mehrerer makromolekularer Strukturen unter Verwendung einer neuartigen Methode der Maximum-Likelihood-Überlagerung, die Ausrichtungslücken nicht verwirft (Brandeis University, Massachusetts).

    Proteinfamilien und -domänen

    CATH Protein Structure Classification Database - Durchsuchbare Datenbank von Proteinstrukturen in PDB, klassifiziert nach Domänenstruktur und Superfamilie (Orengo Group, University College, London).
    Combinatorial Extension (CE) Einrichtung zum Vergleichen und Abgleichen von Proteinstrukturen (RCSB PDB).
    Conserved Domain Database (CDD) und Proteinsucheinrichtung (NCBI).
    Dali Proteinstruktur-Alignment entweder zu einer anderen Proteinstruktur (paarweiser Vergleich) oder zu allen Einträgen in der PDB (Universität Helsinki, Finnland). Die paarweise Strukturausrichtung von Dali ist auch hier bei EMBL-EBI verfügbar.
    DBAli Eine Datenbank mit Proteinstruktur-Alignments (Sali Lab, University of California, San Francisco).
    FETTE KATZE - Flexible Struktur EINLignmenT von Chaining EINligierte Fragmentpaare ermöglichen Twists (Sanford-Burnham Medical Research Institute, USA).
    InterPro kombiniert Daten aus PROSITE, PRINTS, PFAM, PRODOM, SMART und anderen Datenbanken, um Proteine ​​in Familien zu klassifizieren und Domänen und funktionelle Stellen vorherzusagen (EMBL-EBI).
    PASS2 - Protein Alignments organisiert als strukturelle Superfamilien (National Center for Biological Sciences (NCBS), Bangalore, Indien).
    PDBeFold Secondary Structure Matching (SSM) Service zum interaktiven Vergleich, Alignment und Superposition von Proteinstrukturen in 3-D (EMBL-EBI).
    PeCoP - Server, der nach . sucht Sporthartnäckig Conserviert PPositionen in Sequenzen von nahen und entfernten Mitgliedern der Proteinfamilie.
    Pfam - Proteinfamilien-Datenbank von Alignments und Hidden-Markov-Modellen (EMBL-EBI).
    POSA (Partial Order Structure Alignment). Mehrere flexible Strukturausrichtung unter Verwendung von Graphen partieller Ordnung.
    ProDom - Datenbank für Proteindomänenfamilien, die automatisch aus der UniProt-Wissensdatenbank generiert wird.
    SCOP (Structural Classification of Proteins) - Proteindomänen-Datenbank, die einen umfassenden Überblick über alle bekannten Proteinfaltungen und detaillierte Informationen über nahe Verwandte eines bestimmten Proteins bietet (MRC Laboratory of Molecular Biology, Cambridge, UK).
    SMART (Simple Molecular Architecture Research Tool) - Proteindomänendatenbank und Sequenzanalyseeinrichtung (EMBL).
    TOPSCAN Eine schnelle Methode zum Vergleich von Proteinstrukturen basierend auf ihren Sekundärstrukturen (University College London, UK).
    GROSS VSektor EINAusrichtung Sohren Tool zum Nachweis ähnlicher Protein-3D-Strukturen und entfernte Homologe, die der Erkennung durch Sequenzvergleich (NCBI) entgehen.

    Vorhersage der Proteinsignal-/Sortiersequenz

    PSORT - Vorhersage von Proteinsortiersignalen und Lokalisierungsstellen in Aminosäuresequenzen.
    SignalP - Vorhersage von Signalpeptid-Spaltungsstellen in Proteinsequenzen (Center for Biological Sequence Analysis, (CBS), Technische Universität Dänemark).
    SOSUIsignal Signal Peptidvorhersageserver (Department of Biotechnology, Tokyo University of Agriculture and Technology).
    TargetP - Vorhersage der subzellulären Position eukaryontischer Proteine ​​(Center for Biological Sequence Analysis, (CBS), Technische Universität Dänemark).

    Membranproteine ​​und Topologievorhersage

    DAS - DAS (Dense Alignment Surface Method) Transmembrane Prediction Server (Stockholm Bioinformatics Center).
    HMMTOP - Server zur Vorhersage von Transmembranhelices und Proteintopologie (gehostet von der Ungarischen Akademie der Wissenschaften).
    Membranprotein-Datenbank (MPDB) - Datenbank mit ausgewählten strukturellen und funktionellen Informationen zu Membranproteinen und -peptiden (Trinity College Dublin).
    Membranproteinressourcen (Stephen White Labor, University of California, Irvine).
    Membranproteine ​​bekannter 3D-Struktur - ständig aktualisierte Liste vom Stephen White Laboratory, University of California, Irvine.
    Orientierungen von Proteinen in Membranen (OPM) – Datenbank mit Topologien von Membranproteinen relativ zur Lipiddoppelschicht des Kohlenwasserstoffkerns (Mosberg Lab, University of Michigan, USA).
    orientTM - Vorhersage der Orientierung (Topologie) von Transmembranproteinen anhand der Sequenz (gehostet von der Universität Athen).
    Proteindatenbank für Transmembranproteine ​​(PDBTM) Eine umfassende und aktualisierte Datenbank von Transmembranproteinen im PDB (Institut für Enzymologie, Ungarische Akademie der Wissenschaften).
    SOSUI - Klassifizierung und Sekundärstrukturvorhersage von Membranproteinen (Department of Applied Physics, Nagoya University, Japan).
    TMHMM - Vorhersage von Transmembranhelices in Proteinen (Center for Biological Sequence Analysis, (CBS), Technische Universität Dänemark).
    TMPred - Vorhersage von Transmembranregionen und -orientierung (Schweizerisches Institut für Bioinformatik).
    TopPred - Topologievorhersage von Membranproteinen (Institut Pasteur).

    COILS - Vorhersage von Protein-Coiled-Coil-Regionen (Schweizerisches Institut für Bioinformatik).
    MARCOIL - Hidden Markov Modellbasiertes Programm zur Vorhersage von Protein-Coiled-Coil-Domänen. (Bioinformatik, Walter und Eliza Hall Institute of Medical Research, Australien).
    MultiCoil - Vorhersage von dimeren und trimeren Protein Coiled Coils (MIT Computer Science and Artificial Intelligence Laboratory (CSAIL)).
    PairCoil2 - Vorhersage von Coiled-Coil-Regionen in nicht-multimeren Proteinen (MIT - CSAIL).

    Eine Ressource zum Proteinabbau (Wilkinson Lab, Emory University School of Medicine, Atlanta, USA).
    AAA - ATPases Associated with different cellular Activities Protein-Superfamilie - Informationen und Links (Institut für Molekulare Biowissenschaften, Graz, Österreich.
    CutDB - Datenbankressource mit Schwerpunkt auf der Annotation von tatsächlichen und vorhergesagten individuellen proteolytischen Ereignissen (Sanford-Burnham Medical Research Institute, USA).
    EC-IUBMB-Peptidase-Nomenklatur: Listet a und b auf.
    HIV-Protease-Datenbank (National Institute of Standards and Technology (NIST), USA).
    Internationale Gesellschaft für Proteolyse (IPS).
    MEROPS - Peptidase-Datenbank (Wellcome Trust Sanger Institute, UK).
    NetChop - Neuraler Netzwerk-basierter Server zur Vorhersage der Proteasom-Spaltungsstelle (Center for Biological Sequence Analysis, (CBS), Technische Universität Dänemark).
    PAProC - Proteasom-Spaltstellen-Vorhersageeinrichtung (Institute für Immunologie und Biomathematik, Universität Tübingen.
    PeptideCutter – Protease-Spaltungsstellen-Prädiktor (ExPASy-SIB).
    PoPS - Computerwerkzeuge zur Vorhersage und Modellierung der Proteasespezifität (Victorian Bioinformatics Consortium-Monash University, Australien.

    Ausgewählte weitere spezialisierte Proteinfamilien

    Computerbiologie/Bioinformatik

    Bioinformatik @ Manchester University of Manchester (UK).
    Sektion Bioinformatik und Molekulare Analyse (BIMAS) - Zentrum für Informationstechnologie (CIT), NIH.
    Bioinformatics.ca (kanadisches Bioinformatik-Portal).
    Bioinformatikzentrum (National University of Singapore).
    Bioinformatics Institute of India - gemeinnütziges Bildungs-, Forschungs- und Entwicklungszentrum.
    Canadian Bioinformatics.ca Links Directory - eine dynamische Liste von Bioinformatik-Ressourcen, die auch alle Links auflistet, die in der NAR-Webserver-Ausgabe enthalten sind.
    Bioinformatics Organization - Bietet kostenlose, offene Ressourcen für Forschung, Entwicklung und Bildung.
    Zentrum für Molekulare und Biomolekulare Informatik (CMBI) - Universität Nijmegen, Niederlande.
    Zentrum für Computerbiologie (IBM).
    Computational Cancer Genomics (CCG) Gruppe des Schweizerischen Instituts für Bioinformatik (SIB) - Entwicklung von Analysetools und Datenbanken zu molekularen Sequenzen und biologischen Funktionen.
    DB-Browser - (Bioinformatik, Universität Manchester).
    Europäisches Bioinformatik-Institut (EMBL-EBI).
    Portal der Global Organization for Bioinformatics Learning, Education & Training (GOBLET).
    Institut für Bioinformatik und Biotechnologie (IBB) - University of Pune, Indien).
    Internationale Gesellschaft für Computerbiologie (ISCB).
    Mathematische, Computer- und Systembiologie (MCSB University of California, Irvine).
    National Center for Biotechnology Information (NCBI) - US National Library of Medicine (NLM).
    Shanghai Center for Bioinformation Technology (SCBIT)
    South African National Bioinformatics Institute (SANBI) - University of the Western Cape.
    Schweizerisches Institut für Bioinformatik (SIB).
    Die Open Bioinformatics Foundation (O|B|F) - gemeinnützige, ehrenamtlich geführte Organisation, die sich auf die Unterstützung der Open-Source-Programmierung in der Bioinformatik konzentriert.

    Copyright 2020 ePitope Informatik


    Konsens e Pitop-Vorhersage
    (Menschliche DNA
    Protein reparieren,
    MGMT - Spitze
    Epitopreste
    in Gold dargestellt).


    Abstrakt

    Wir präsentieren eine neue multidisziplinäre Strategie, die Computerbiologie mit Hochdurchsatz-Mikroarray-Analyse kombiniert, um das molekulare Verständnis der Protein-Antikörper-Erkennung in das Design effizienter und selektiver proteinbasierter Analyse- und Diagnosewerkzeuge zu übersetzen. Die Strukturen zweier Proteine ​​mit unterschiedlichen Faltungen und Sekundärstrukturinhalten, nämlich des Beta-Barrel-FABP und des α-helicalen S100B, wurden als Grundlage für die Vorhersage und das Design potenzieller Antikörper-bindender Epitope mit der kürzlich entwickelten MLCE-Rechenmethode verwendet . Ausgehend von der Idee, dass die Struktur, Dynamik und Stabilität eines Protein-Antigens eine Schlüsselrolle bei der Interaktion mit Antikörpern spielt, integriert MLCE die Analyse der dynamischen und energetischen Eigenschaften von Proteinen, um nicht optimierte energetische Interaktionsnetzwerke geringer Intensität zu identifizieren auf der Oberfläche der isolierten Antigene, die Substrukturen entsprechen, die von einem Bindungspartner passend erkannt werden können. Die identifizierten Epitope wurden als nächstes als freie Peptide synthetisiert und verwendet, um bei Kaninchen spezifische Antikörper hervorzurufen. Wichtig ist, dass die resultierenden Antikörper in Mikroarray-basierten Tests spezifisch und selektiv die ursprünglichen Proteine ​​in voller Länge erkennen. Kompetitionsexperimente zeigten ferner die Spezifität der molekularen Erkennung zwischen den immobilisierten Zielproteinen und den erzeugten Antikörpern. Unsere integrierten Computer- und Mikroarray-basierten Ergebnisse demonstrieren die Möglichkeit, synthetische Epitope rational zu entdecken und zu entwerfen, die in der Lage sind, Antikörper hervorzurufen, die für Volllängenproteine ​​spezifisch sind, und zwar ausgehend von dreidimensionalen Strukturinformationen über das Ziel. Wir diskutieren Implikationen für Diagnose- und Impfstoffentwicklungszwecke.


    Weitere Informationen

    Autorenbeiträge

    HL führte Klonierungsverfahren durch, HA-, MYC- und TAP-Tagging von Cbf1 und Tbf1 in C. albicans, Immunoblots, Tagging und Affinitätsreinigung von NOP1-TAP, ChIP-CHIP von Cbf1-TAP und Tbf1-TAP sowie lacZ Reporter-Assays. AS und CA konstruierten den Mcm1-TAP C. albicans Stamm und führten ChIP-CHIP von Mcm1-TAP sowohl im Hefe- als auch im Hyphenzustand durch. AN und MW beaufsichtigten die Arbeiten. Der erste Entwurf des Artikels wurde von HL und AS verfasst. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt.


    Ergebnisse

    Proteine ​​können potentiell an ihrem N- oder C-Terminus markiert werden. Für die GCE-basierte Markierung haben wir uns für das Design eines N-terminalen Tags entschieden, um Proteinverkürzungen aufgrund eines ineffizienten Einbaus der ncAA zu vermeiden [5, 6, 16, 17]. Auf der Grundlage unserer früheren Arbeiten wurden potenzielle Tags in einen einzigen Expressionsvektor kloniert, der den Einbau des ncAA Bicyclo-Nonin Lysin (BCN-Lys) kodiert, das bioorthogonal mit Tetrazin-konjugierten Fl-Farbstoffen reagiert (Abb. 1b und ). Zusatzdatei 1: Abbildung S1a) [6, 18, 19]. Die Markierungsstärke wurde zunächst unter Verwendung von α-Tubulin als Benchmark und der Bewertung der Mikrotubuli (MT)-Markierung in lebenden Säugerzellen in Gegenwart von Silizium-Rhodamin-Tetrazin (SiR-Tet) bewertet [6, 20]. Die MT-Markierung, die nach ortsspezifischem Einbau von BCN-Lys in α-Tubulin an Position 45 (α-Tubulin 45TAG) erhalten wurde, wurde als Referenz verwendet, da unsere frühere Demonstration der Wirksamkeit der MT-Markierung an dieser Stelle [6].

    Der minimalste N-terminale GCE-Tag sollte ein TAG-Codon enthalten, das den Einbau von BCN-Lys kodiert. Leider wurde bei der Expression von α-Tubulin, das ein TAG-Codon an seinem N-Terminus (direkt vor dem ersten Rest) trägt, in Gegenwart von SiR-Tet keine spezifische Markierung erhalten, wobei Live-Cell-Imaging oder In-Gel-Fluoreszenz verwendet wurde (Zusätzliche Datei 1: Abbildung S1b und S2). Dies weist darauf hin, dass die alleinige Hinzufügung eines TAG-Codons stromaufwärts einer Protein-codierenden Sequenz zur Markierung nicht ausreichend ist, möglicherweise aufgrund des Versagens des Ribosoms, die ncAA am äußersten N-Terminus eines Proteins einzubauen. Potentielle N-terminale Tags mit unterschiedlichen Längen wurden daher basierend auf dem üblicherweise verwendeten neun Aminosäuren (AA) langen Hämagglutinin (HA)-Epitop als Rückgrat entworfen [21] (Abb. 2a und Zusatzdatei 1: Abbildung S1c- F). Das TAG-Codon wurde entweder innerhalb der HA-Sequenz (ersetzt das letzte Codon im Epitop) (1), unmittelbar nach der HA-Sequenz (2) oder nach einem kurzen, häufig verwendeten flexiblen Linker, der entweder Glycin-Serin (GS 3) oder Glycin-Glycin-Serin-Glycin (GGSG 4). Unter Verwendung eines dieser Tags wurden niedrige, aber merkliche Mengen an α-Tubulin beobachtet, was darauf hinweist, dass N-terminal markiertes α-Tubulin in Zellen exprimiert wurde ( 2b ). In Experimenten zur Markierung von lebenden Zellen mit SiR-Tet wurde wenig bis keine MT-Dekoration erhalten, wenn α-Tubulin, das mit den Sonden 1 oder 2 markiert war, verwendet wurde (Abb. 2c, 1–2), während eine klare und spezifische Markierung mit den Tags 3 und 4 . beobachtet wurde (Abb. 2c, 3-4), was darauf hinweist, dass die Sonden 3 und 4 potenziell als GCE-Tags für α-Tubulin dienen können.

    Optimierung eines minimalen Tags für die Fluoreszenzmarkierung auf der Grundlage der genetischen Codeerweiterung (GCE) mit α-Tubulin. ein Schematische Darstellung der verwendeten und getesteten Tags Be. Vollständige Sequenzen der Tags sind in Zusatzdatei 1 dargestellt: Abbildung S1c-f. Be GCE-Tags (angegeben in a) wurden an den N-Terminus von α-Tubulin unter Verwendung des pBUD-Pyl-RS-tub-Plasmids (zusätzliche Datei 1: Abbildung S1a) subkloniert. HEK293T (B) oder COS7 (Ce)-Zellen wurden mit pBUD-Pyl-RS-tub-Plasmiden transfiziert, die verschiedene Tags, eine WT-Version von &agr;-Tubulin oder ohne ein Zielprotein trugen, und 48 h in Gegenwart des ncAA BCN-Lys inkubiert. Die Zellen wurden dann einer Western-Blot-Analyse unterzogen (B) oder 1 h mit SiR-Tet beschriftet und live abgebildet (Ce). Bilder in C sind Projektionen maximaler Intensität von 3D-Z-Stapeln, die von repräsentativen Zellen erhalten wurden. D Vergrößerte Bilder der in gelben Quadraten markierten Regionen in C. Intensitätswerte entlang der roten Linien, die in den Bildern eingezeichnet sind, sind unten aufgetragen und zeigen die Verbesserung des SNR. e SNR-Werte, gemessen in Zellen, die α-Tubulin exprimieren, wobei BCN-Lys entweder in Position G45 oder im N-Terminus über Tags 3 oder 4 eingebaut ist. Der durchschnittliche SNR, gemessen in Zellen, die WT-Tubulin exprimieren, betrug 1,2 (rote gestrichelte Linie). Das zuvor mit GFP gemessene durchschnittliche SNR betrug 1,75 (grüne gestrichelte Linie). n = 25. Ergebnisse präsentiert in Be wurden in mindestens 3 unabhängigen Experimenten erhalten. F Schematische Darstellung des optimierten GCE-Tags zur weiteren Kennzeichnung. Maßstabsleisten: C 10 μm, D 2 μm

    Um die unter Verwendung potenzieller GCE-Tags erhaltenen Markierungseffizienzen zu bewerten, wurden Signal-Rausch-Verhältnisse (SNRs) in markierten Zellen basierend auf Linienintensitätsprofilen gemessen, wie in 2d dargestellt. Die SNR-Werte, die in Zellen, die eine der α-Tubulin-Versionen exprimieren, gemessen wurden, waren signifikant höher als die durchschnittlichen Hintergrundwerte, die in Zellen gemessen wurden, die eine Wildtyp-(WT)-Version von α-Tubulin exprimieren, die die ncAA nicht aufnehmen kann, was bestätigt, dass die Markierung spezifisch ist ( Abb. 2e). Zellen, die mit Sonde 4 markiertes α-Tubulin exprimierten, zeigten im Vergleich zu Sonde 3 ein signifikant höheres SNR, was darauf hinweist, dass HA-GGSG-ncAA gegenüber HA-GS-ncAA für die MT-Markierung bevorzugt ist. Bemerkenswerterweise waren die durchschnittlichen SNR-Werte, die in Zellen, die mit Sonde 4 markiertes α-Tubulin exprimierten, trotz der relativ niedrigen Expressionsniveaus, die mit Sonde 4 erhalten wurden, höher als diejenigen, die in Zellen erhalten wurden, die α-Tubulin 45TAG exprimieren, oder in Zellen, die α-Tubulin-GFP exprimieren ( Abb. 2d, e) [6]. Verbesserte SNRs bei niedrigeren α-Tubulin-Expressionsniveaus können aus der Verringerung des Anteils an zytosolischem (nicht polymerisiertem) markiertem Tubulin in Zellen resultieren und sind für die Zellphysiologie bevorzugt. Wir kamen daher zu dem Schluss, dass HA-GGSG-ncAA-markiertes α-Tubulin dem ortsspezifischen ncAA-inkorporierten α-Tubulin für die MT-Markierung überlegen ist. Basierend auf diesen Ergebnissen haben wir N′ HA-GGSG-ncAA als minimalen Tag für die GCE-basierte bioorthogonale Markierung von Proteinen in lebenden Säugerzellen definiert ( 2f ).

    Um die Anwendbarkeit und Spezifität des GCE-Tags (HA-GGSG-ncAA, Abb. 2f und Zusatzdatei 1: Abbildung S1f) zur Markierung verschiedener Zellkompartimente zu untersuchen, haben wir ihn zunächst auf Zellmarker angewendet, die an GFP konjugiert sind, d. der Plasmamembran (PM)-Marker GFP-CAAX und der peroxisomale Marker GFP-SKL (Abb. 3 und 4). GCE-markiertes GFP-CAAX wurde in Zellen in höheren Konzentrationen exprimiert als GFP-CAAX, das ein TAG-Codon an der optimierten Position in GFP trägt (GFP 150TAG-CAAX, Abb. 3a) [19]. Konsequenterweise wurde eine PM-Dekoration in Zellen beobachtet, die entweder GCE-markiertes GFP-CAAX oder GFP 150TAG-CAAX exprimierten und mit SiR-Tet sowohl in den GFP- als auch in den SiR-Kanälen mit relativ ähnlichen SNR-Werten markiert waren ( 3b , c). Die SNR-Werte, die für die PM-Markierung unter Verwendung des SiR-Kanals für GCE-markiertes GFP-CAAX oder GFP 150TAG CAAX gemessen wurden, waren ähnlich und signifikant höher als die in Zellen, die GFP-CAAX exprimieren, die nicht in der Lage sind, die ncAA (WT GFP-CAAX) aufzunehmen. Dies weist darauf hin, dass die Markierung spezifisch ist und nicht durch das GCE-Tag beeinträchtigt wird (Abb. 3d, e).

    Die über den minimalen GCE-Tag erhaltene Plasmamembran (PM)-Markierung ist vergleichbar mit der GFP- und ortsspezifischen Markierung. HEK293T (ein) oder COS7 (Be) Zellen wurden mit pBUD-Pyl-RS-Plasmiden transfiziert, die GCE-tag-GFP-CAAX, an Position 150 zu TAG mutiertes GFP-CAAX oder eine WT-Version von GFP-CAAX trugen, und 48 h in Gegenwart von BCN-Lys . inkubiert . Die Zellen wurden dann einer Western-Blot-Analyse unterzogen (ein) oder 1 h mit SiR-Tet beschriftet und live abgebildet (Be). Bilder repräsentieren einzelne konfokale Schnitte repräsentativer Zellen. D Linienintensitätsprofile, erhalten in Zellen, die die angegebenen Konstrukte exprimieren und mit SiR-Tet markiert sind. Oberes Panel: vergrößerte Bilder von konfokalen Schichten. Unteres Feld: Intensitätswerte entlang der in den Bildern gezeichneten gestrichelten Linie. e SNR-Werte, die für GFP und SiR in Zellen gemessen wurden, die die verschiedenen Versionen von GFP-CAAX exprimieren. n = 30. Ergebnisse wurden in mindestens 3 unabhängigen Experimenten erhalten. Maßstabsleisten: B, C 10 μm, D 2 μm

    Nachweis der Markierungsspezifität und -effizienz in Peroxisomen, die mit GCE-markiertem GFP-SKL markiert sind. HEK293T (ein, B) oder COS7 (CF) Zellen wurden mit pBUD-Pyl-RS-Plasmiden, die die angegebenen GFP-SKL-Konstrukte trugen, transfiziert und 48 h in Gegenwart des ncAA BCN-Lys inkubiert (außer für Bahnen 1 und 3 in B). Die Zellen wurden dann einer Western-Blot-Analyse unterzogen (ein) oder 1 h mit SiR-Tet markiert und einer In-Gel-Fluoreszenz (B) oder live abgebildet (Cg). B Zellen wurden lysiert und gleiche Gesamtproteinmengen wurden auf eine SDS-PAGE geladen. Die Ergebnisse wurden unter Verwendung von SiR-Fluoreszenz aufgezeichnet. Eine spezifische Bande, die eine ähnliche Größe wie die im Western Blot erhaltene erreichte, wurde nur in Zellen gesehen, die GCE-tag-GFP-SKL exprimierten und mit BCN-Lys inkubiert wurden, was eine spezifische Markierung anzeigt. C, D Projektionen der maximalen Intensität repräsentativer Zellen. Von links nach rechts: in jedem Kanal erhaltene Fluoreszenz, zusammengeführtes Bild und Kolokalisationsanalyse zwischen Intensitätswerten von 640 (SiR) und 488 (GFP) auf einer großen Teilmenge der Zelle, die den Zellkern ausschließt (weißes Rechteck im zusammengeführten Bild): Korrelationswerte nach Pearson: C 0.86, D 0.07. e Von links nach rechts: ein vergrößertes Bild der Zelle in C, ein Linienintensitätsprofil, das für die gestrichelte Linie im vergrößerten Bild gemessen wurde, und eine Zusammenfassung der SNR-Werte, die für GFP und SiR in Zellen gemessen wurden, die die verschiedenen Versionen von GFP-SKL exprimieren. n = 40. F, g Zellen, die die angegebenen Konstrukte exprimieren, wurden mit SiR-Tet markiert und unter Verwendung ähnlicher Bildgebungsparameter (Belichtungszeit und Laserintensität) abgebildet. F GFP-positive Peroxisomen wurden nach Intensität segmentiert. Für jedes Peroxisom wurde die mittlere Intensität im GFP-Kanal gegen die mittlere Intensität im SiR-Kanal aufgetragen.

    95 % der GFP-markierten Peroxisomen zeigten SiR-Intensitätsniveaus, die über dem Hintergrund lagen. g SiR-positive Puncta wurden nach Intensität segmentiert. Für jedes Punctum wurde die mittlere Intensität im SiR-Kanal gegen die mittlere Intensität im GFP-Kanal aufgetragen.

    5% der SiR-positiven Puncta waren GFP-negativ. Die mittleren Intensitätsniveaus, die für SiR puncta in Zellen, die GCE-tag-GFP-SKL exprimieren, gemessen wurden, waren mindestens zweifach höher als die Werte, die für SiR puncta, segmentiert in Kontrollzellen, die WT GFP-SKL exprimieren, gemessen wurden, was auf eine spezifische Markierung hinweist. Ergebnisse wurden in mindestens 3 unabhängigen Experimenten erhalten. Maßstabsleisten 10 μm

    GCE-markiertes GFP-SKL wurde in HEK293-Zellen exprimiert, und eine spezifische Bande ähnlicher Größe wurde in einem In-Gel-Fluoreszenzassay nach Markierung der Zellen mit SiR-Tet in Gegenwart von BCN-Lys beobachtet (Abb. 4a, B). Während WT GFP-SKL im Vergleich zu GCE-markiertem GFP-SKL in höheren Konzentrationen exprimiert wurde, wurde für WT GFP-SKL unter Verwendung von In-Gel-Fluoreszenz keine spezifische Markierung beobachtet, was stark darauf hindeutet, dass die Markierung spezifisch durch die Bindung des Fl- induziert wird. Farbstoff zum ncAA in GCE-markiertem GFP-SKL. In lebenden Zellen wurde eine bemerkenswerte Co-Lokalisierung von GFP und SiR in kleinen Puncta in der gesamten Zelle (außer im Zellkern) bei ähnlichen SNRs beobachtet (Abb. 4c, Korrelation nach Pearson = 0,86). Dies war bei Zellen, die WT-GFP-SKL exprimierten und mit SiR markiert waren, nicht der Fall, die eine Antikorrelation zwischen GFP und SiR-Punkten zeigten (Fig. 4d, e, Korrelation nach Pearson = 0,07). In diesen Zellen wurde eine kleine Population von SiR-Punkten beobachtet, aber diese Punkte kolokalisierten nicht mit den in der gesamten Zelle beobachteten GFP-Punkten. Diese Ergebnisse zeigen weiterhin, dass die beobachtete Co-Lokalisierung in Zellen, die GCE-markiertes GFP-SKL exprimieren, aus einer spezifischen SiR-Markierung des Proteins resultiert.

    Die Organisation des Fluoreszenzsignals in diskrete Puncta in SKL-markierten Zellen ermöglichte es uns, die relativen Markierungsausbeuten abzuschätzen, indem die Population von Puncta in einem Kanal segmentiert und ihre Intensitäten im anderen Kanal quantifiziert wurden ( 4f , g). GFP-Punkte, die aus Zellen segmentiert waren, die WT-GFP-SKL exprimierten und mit SiR-Tet markiert waren, zeigten SiR-Spiegel geringer Intensität, die nicht mit den GFP-Intensitätsniveaus skalierten ( 4f ). Wir folgerten daher, dass die in diesen Zellen erhaltenen SiR-Spiegel die Hintergrund-SiR-Fluoreszenz darstellen. In Zellen, die GCE-markiertes GFP-SKL exprimieren, ist die Mehrheit der segmentierten GFP-Punkte (

    95%) hatten höhere SiR-Intensitätsniveaus als diejenigen, die in Zellen gemessen wurden, die WT GFP-SKL exprimierten. Darüber hinaus wurden die Intensitätsniveaus im SiR-Kanal mit den GFP-Intensitäten skaliert, was darauf hindeutet, dass die SiR-Fluoreszenz zur Quantifizierung der relativen Niveaus von GFP-SKL in einzelnen Peroxisomen verwendet werden kann. Die Segmentierung der SiR-positiven Puncta in Zellen, die GCE-markiertes GFP-SKL exprimieren, führte global zu einem ähnlichen Verhalten mit einer kleinen Population (weniger als 5%) von SiR-puncta, die GFP-negativ erschienen ( 4g ). In Zellen, die WT GFP-SKL exprimieren, wurde eine kleine Population von SiR-Punkten segmentiert. Diese Puncta hatten niedrige Intensitätsniveaus sowohl in GFP- als auch in SiR-Kanälen im Vergleich zu SiR-Punta, die in GCE-markierten GFP-SKL-exprimierenden Zellen segmentiert waren, was darauf hindeutet, dass sie Rauschen darstellen. Diese Strukturen können mit Hilfe der Bildverarbeitung leicht nach Intensität herausgefiltert werden. Zusammengenommen weisen diese Daten darauf hin, dass die GCE-Tag-SiR-basierte Kennzeichnung

    95% Ausbeute im Vergleich zu GFP und dass es für die quantitative Bildgebung von Peroxisomen in lebenden Zellen verwendet werden kann.

    Als nächstes testeten wir die Robustheit des Tags, indem wir es auf verschiedene Zellorganellen applizierten. Dazu verwendeten wir Lamp1 als lysosomalen Marker, CD63 als Marker für multivesikuläre Körper (MVBs), ER cb5 TM als endoplasmatisches Retikulum (ER)-Marker, Exo70 als exosomaler Marker und Mito cb5 TM (mito) oder mito- DsRed als mitochondriale Marker (Sequenzen siehe Zusatzdatei 1: Tabelle S1). Eine Kernmarkierung wurde aufgrund der bekannten unspezifischen Markierung des Kerns vermieden, die bei der GCE-basierten Markierung beobachtet wurde (Abb. 2c, 3b, c und 4c, d) [4, 6, 16]. Eine wirksame Lysosomenmarkierung wurde unter Verwendung von GCE-markiertem Lamp1 in Gegenwart von SiR-Tet erhalten (Fig. 5a, b). Insgesamt war die Markierung mit der von Lamp1-mVenus vergleichbar. Lysosomen, die mit einem der Tags (d. h. GCE-Tag oder mVenus) markiert waren, zeigten eine ähnliche Reaktion auf die Chloroquin-Behandlung und hatten ähnliche SNR-Werte (Abb. 5a–c) [22]. Wir stellten fest, dass, während die Lysosomenmarkierung mit Lamp1-mVenus sowohl gefüllte als auch hohle Strukturen hervorhob, in Zellen, die mit GCE-tag-SiR-Lamp1 markiert waren, nur gefüllte Strukturen beobachtet wurden. Dieser Unterschied kann sich aus der Position des Tags ergeben, bei dem der mVenus-Tag dem Zytosol zugewandt ist, während der GCE-Tag dem lysosomalen Lumen zugewandt ist. Die Markierung von lysosomalen Lumenproteinen mit herkömmlichen fluoreszierenden Proteinen ist aufgrund der pH-Empfindlichkeit der letzteren eine Herausforderung [23]. Unsere Daten legen nahe, dass die Markierung auf GCE-Tag-Basis mit der Markierung saurer Zellstrukturen kompatibel ist.

    Eine effiziente Lysosomenmarkierung wird unter Verwendung von SiR-Tet erhalten, während die MVB-Markierung TAMRA-Tet ​​erfordert. einC Zellen, die GCE-tag-Lamp1 exprimieren, markiert mit SiR-Tet (ein) oder Lampe1-mVenus (B). Linke Felder: keine Behandlung. Rechte Tafeln: Behandlung mit dem Lysosom-Inhibitor Chloroquin (3 h, 120 μM). Vergrößerte Bilder einer Teilmenge der Zellen (entsprechen den Quadraten in den oberen Feldern) werden in den unteren Feldern angezeigt. Pfeile zeigen gefüllte gegenüber hohlen Lysosomenmarkierungen an. C Von links nach rechts: Linienintensitätsprofile gemessen für die rote gestrichelte Linie in ein, die grüne gestrichelte Linie in Bund eine Zusammenfassung der SNR-Werte, die in Zellen gemessen wurden, die die angegebenen Plasmide exprimieren (n = 50). D COS7-Zellen, die den an den GCE-Tag konjugierten MVB-Marker CD63 exprimierten, wurden fixiert und mit Anti-HA- und Anti-CD63-Antikörpern gefärbt. e, F MVB-Markierung in Zellen, die GCE-tag-CD63 exprimieren, markiert mit TAMRA-Tet ​​(e) oder CD63-mCherry (F). g SNR-Werte, gemessen in Zellen, die die angegebenen Plasmide exprimieren. n = 50. Die in jedem Panel präsentierten Ergebnisse wurden in mindestens 3 unabhängigen Experimenten erhalten. Maßstabsleisten, 10 μm vergrößerte Bilder, 2 μm

    Erste Versuche, MVBs, ER, Mitochondrien und Exosomen mit dem GCE-Tag und SiR-Tet zu markieren, führten zu keiner spezifischen Färbung (Zusatzdatei 1: Abbildung S3). In Immunfärbungsexperimenten unter Verwendung von Anti-CD63-Antikörpern kolokalisierte jedoch GCE-markiertes CD63 mit endogenem CD63 (Fig. 5d). Wir folgerten daher, dass GCE-markiertes CD63 richtig exprimiert und in Zellen gezielt wurde, jedoch den Fl-Farbstoff nicht über die bioorthogonale Reaktion binden konnte. In Übereinstimmung mit dieser Vorstellung führte der Ersatz von TAMRA-Tet ​​für SiR-Tet zu einer spezifischen Markierung von MVBs, ER und Exosomen unter Verwendung von GCE-markiertem CD63, ER cb5 TM bzw. Exo70 (Abb. 5e–g und 6). Mitochondriale Markierung wurde weder mit SiR- noch mit TAMRA-Tet ​​zusammen mit den GCE-tag-Mito cb5 TM- oder Mito-DsRed-Sonden erhalten (zusätzliche Datei 1: Abbildung S4). Basierend auf Immunfluoreszenzexperimenten scheint es, dass sich Mito cb5 TM zwar nicht in Mitochondrien lokalisieren konnte, GCE-markiertes Mito-DsRed jedoch richtig lokalisierte, aber den Tetrazin-konjugierten Farbstoff nicht binden konnte (zusätzliche Datei 1: Abbildung S4). Expressionsmuster und SNR-Werte, die mit den erfolgreich markierten GCE-markierten Organellenmarkern (dh für MVBs, ER und Exosomen) erhalten wurden, waren insgesamt vergleichbar mit denen, die mit herkömmlichen Fl-Protein-Markern erhalten wurden, wobei bessere SNRs für GCE-markierte MVBs erhalten wurden und niedrigere SNRs für GCE-markierten ER erhalten (Abb. 5e–g und 6). In allen Fällen (SiR- oder TAMRA-markierte GCE-markierte zelluläre Strukturen) waren die Signalintensitätspegel erheblich höher als die Hintergrundpegel, die in Zellen gemessen wurden, die ein Plasmid exprimierten, das nur das orthogonale tRNA/tRNA-Synthetase-Paar kodiert und mit dem entsprechenden Tet-konjugierten . markiert ist Fl-Farbstoffe (Abb. 6g). Zusammen bestätigen diese Ergebnisse die Markierungsspezifität und Kompatibilität des GCE-Tags für die Organellenmarkierung.

    Exosomen und ER weisen in Gegenwart von TAMRA-Tet ​​eine spezifische zelluläre Markierung über den minimalen GCE-Tag auf. COS7-Zellen wurden mit den angegebenen Plasmiden transfiziert, markiert, wenn angezeigt, und 48 Stunden später live abgebildet. ein, B, D, e Von links nach rechts: maximale Projektionsbilder, vergrößerte Bilder einer Teilmenge der Zellen (entsprechen den Quadraten in den linken Feldern), Linienintensitätsprofile gemessen für die gestrichelten Linien in den mittleren Feldern. C, F SNR-Werte gemessen in Zellen, die die angegebenen Plasmide exprimieren (n Exo70 = 40, ER cb5 TM = 45). g Zellen wurden mit den angegebenen pBUD-Pyl-RS-Plasmiden transfiziert und wie angegeben mit SiR-Tet oder TAMRA-Tet ​​markiert. Für jede Bedingung wurden mittlere Intensitätsniveaus für einen interessierenden Bereich innerhalb der Zelle gemessen und durch die mittlere Hintergrundintensität, die außerhalb der Zelle gemessen wurde, geteilt. Als Negativkontrollen (kein Protein) wurden pBUD-Pyl-RS-Plasmide verwendet, die nicht für ein interessierendes Protein kodieren. n = 15. Die in jedem Panel präsentierten Ergebnisse wurden in mindestens 3 unabhängigen Experimenten erhalten. Maßstabsleisten, 10 μm vergrößerte Bilder, 2 μm

    Eine erfolgreiche und spezifische Markierung wurde auch für das GCE-markierte extrazelluläre Protein EGFR und das intrazelluläre ESCRT-III-Protein CHMP4B erhalten, wie durch In-Gel-Fluoreszenz und Live-Cell-Imaging angezeigt (zusätzliche Datei 1: Abbildung S5). Für die EGFR-Markierung wurde der GCE-Tag zwischen das Signalpeptid und die Protein-kodierende Sequenz eingefügt (zusätzliche Datei 1: Abbildung S5c, d), was darauf hinweist, dass der GCE-Tag nicht ausschließlich für den N-Terminus gilt. Somit kann der GCE-Tag neben seiner Verwendung bei der Organellenmarkierung zur Markierung von intra- und extrazellulären Proteinen in lebenden Zellen verwendet werden.

    Die Fl-Farbstoff-Markierung der GCE-markierten Konstrukte ermöglichte die Aufzeichnung von Lebendzellen und die Verfolgung jeder der markierten Zellstrukturen (dh MT, PM, Peroxisomen, ER, MVB und Exosomen Abb. 7 und zusätzliche Datei 2: Film S1, Zusatzdatei 3: Movie S2, Zusatzdatei 4: Movie S3, Zusatzdatei 5: Movie S4, Zusatzdatei 6: Movie S5, Zusatzdatei 7: Movie S6, Zusatzdatei 8: Movie S7 und Zusatzdatei 9 Movie S8). Fluoreszenz-Erholung nach Photobleaching (FRAP)-Experimente wurden erfolgreich mit dem GCE-ER cb5 TM ER-Marker durchgeführt, mit vergleichbaren Erholungszeiten wie im ER mit VSVG-GFP gemessen [24] (Abb. 7c und Zusatzdatei 8: Film S7, Zusätzliche Datei 9: Film S8). Erwähnenswert ist, dass die Gesamtgröße des GCE-tag-ER cb5 TM ER-Markers deutlich kleiner ist als die von VSVG-GFP (GCE-tag-ER cb5 TM,

    84,5 kDa). Zusammengenommen weisen diese Ergebnisse darauf hin, dass die hier vorgestellten neu entwickelten GCE-basierten Organellenmarker verwendet werden können, um die Organellendynamik in lebenden Zellen mit viel kleineren Sonden zu untersuchen.

    Live-Zell-Aufnahmen von Zellorganellen, die mit GCE-Tag und einem Tetrazin-konjugierten Fl-Farbstoff markiert sind. ein Live-Zell-Aufnahmen von Zellen, die GCE-tag-GFP-SKL exprimieren, markiert mit SiR-Tet. Oberes Feld: maximale Projektionsbilder der gesamten Zelle, aufgenommen zum Zeitpunkt 0. Unteres Feld: sequentielle vergrößerte Bilder einer Teilmenge der Zelle (entspricht dem Quadrat im oberen Feld) aus der Filmreihe. Jedes vierte Bild aus der Filmreihe wird gezeigt (Zusatzdatei 4: Film S3). B Live-Zell-Aufnahmen von Zellen, die GCE-tag-CD63 exprimieren, markiert mit TAMRA-Tet. Links ein maximales Projektionsbild der gesamten Zelle, aufgenommen zum Zeitpunkt 0. Auf der rechten Seite werden sequentielle vergrößerte Bilder einer Teilmenge der Zelle (entspricht dem Quadrat im linken Feld) aus der Filmreihe gezeigt. Jedes vierte Bild der Filmreihe wird gezeigt (Zusatzdatei 6: Film S5). C FRAP-Analyse von Zellen, die GCE-tag-ER cb5 TM exprimieren, markiert mit TAMRA-Tet. Im oberen Bereich werden Schnappschüsse einer Teilmenge einer repräsentativen Zelle aus der Filmreihe (Zusatzdatei 8: Film S7) angezeigt. Sequenzielle Bilder des gebleichten ROI werden im unteren Bereich angezeigt (zusätzliche Datei 9: Film S8). Das Diagramm auf der rechten Seite zeigt die exponentielle Anpassung der Erholung der Fluoreszenzintensität gegenüber der Zeit nach dem Photobleichen im ROI. Intensitätswerte wurden für unbeabsichtigtes Bleichen korrigiert und auf Intensitätsniveaus normiert, die vor dem Bleichen gemessen wurden. Die in jedem Panel präsentierten Ergebnisse wurden in mindestens 3 unabhängigen Experimenten erhalten. Maßstabsleisten, 10 μm vergrößerte Bilder, 2 μm

    Zusätzliche Datei 2: Film S1. Mikrotubulusdynamik in Zellen, die mit GCE-tag-α-Tubulin markiert sind. COS7-Zellen, die GCE-tag-α-Tubulin exprimieren und mit SiR-Tet markiert sind, wurden in Intervallen von 4 s aufgezeichnet. Gezeigt sind Projektionen maximaler Intensität von 3 z-Schichten, die von einer repräsentativen Zelle genommen wurden. Maßstabsleiste: 10 μm.

    Zusätzliche Datei 4: Film S3. Peroxisomendynamik in Zellen, die mit GCE-tag-GFP-SKL markiert sind. COS7-Zellen, die GCE-tag-GFP-SKL exprimieren und mit SiR-Tet markiert sind, wurden in Intervallen von 5,3 s aufgezeichnet. Linkes Panel: 488 (GFP, grün) Kanal, mittleres Panel: 640 (SiR, rot) Kanal. Gezeigt sind Projektionen maximaler Intensität von 30 z-Scheiben, die von einer repräsentativen Zelle aufgenommen wurden. Maßstabsleiste: 10 μm.

    Zusatzdatei 8: Film S7. Visualisierung der ER-Dynamik durch Anwendung von FRAP auf GCE-tag-ER cb5 TM markiertes ER. COS7-Zellen, die mit TAMTA-Tet ​​markierten GCE-tag-ER cb5 TM exprimierten, wurden 2 min in 2 s-Intervallen abgebildet. Photobleaching wurde nach 4 Baseline-Zeitpunkten (12 s) durchgeführt. Gezeigt sind Projektionen maximaler Intensität von 3 z-Schichten, die von einer repräsentativen Zelle genommen wurden. Maßstabsleiste: 10 μm.

    Der hier beschriebene 14-Reste lange GCE-Tag umfasst die komplette Sequenz des HA-Tags. Als solches kann das HA-Epitop noch für andere Anwendungen wie Immunblot, Immunfluoreszenz und Immunpräzipitation genutzt werden (Abb. 2b und 5d). Um die Vielseitigkeit des Tags zu erweitern, haben wir getestet, ob das HA-Epitop durch FLAG (8 Reste) oder Myc (10 Reste) Epitope ersetzt werden kann (Abb. 8 und zusätzliche Datei 1: Abbildung S6). GFP-SKL-Konstrukte, die HA/FLAG/Myc-GCE-Tags tragen, wurden erfolgreich in Zellen exprimiert, wobei die SiR-Tet-Fluoreszenz mit GFP kolokalisiert wurde (Pearsons Korrelationswerte: FLAG, 0,87 Myc, 0,67) (Abb. 8a, b oberes Feld, und Zusatzdatei 1: Abbildung S6a, b). Eine effiziente Markierung von Exosomen wurde auch mit den an Exo70 konjugierten FLAG- und Myc-Tag-Versionen erhalten, wie durch Live-Cell-Imaging und In-Gel-TAMRA-Fluoreszenz gezeigt (Abb. 8c oberes Feld und zusätzliche Datei 1: Abb. S6c, e). Die MT-Markierung schien jedoch unter Verwendung von FLAG/Myc GCE-Tags beeinträchtigt zu sein, wobei nur sehr wenige Zellen eine MT-Färbung unter Verwendung des Myc GCE-Tags zeigten (Abb. 8d oberes Feld und zusätzliche Datei 1: Abbildung S6d). Eine verringerte spezifische Markierung wurde auch bei Verwendung von In-Gel-SiR-Fluoreszenz beobachtet (zusätzliche Datei 1: Abbildung S6f). Während jedoch die MT-Färbung unter Verwendung des FLAG-GCE-Tags deutlicher war, wurde eine höhere Markierung für Myc-GCE-Tag unter Verwendung von In-Gel-Fluoreszenz beobachtet. Diese Daten legen nahe, dass in einigen Fällen die Gesamtmenge des markierten Proteins nicht seine Fähigkeit widerspiegelt, eine spezifische Zellstruktur zu markieren. Zusammengenommen zeigen diese Ergebnisse, dass das System im Hinblick auf das im Tag verwendete Epitop vielseitig ist. Aber während die HA-Version des Tags robust zu sein scheint, muss die Kennzeichnung mit den anderen Epitop-Versionen sorgfältiger evaluiert werden.

    Der GCE-Tag ist vielseitig einsetzbar und kann in einigen Fällen weiter minimiert werden. ein Western-Blot-Analyse von HEK293T-Zellen, transfiziert mit pBUD-Pyl-RS-Plasmid, inseriert mit GFP-SKL N-terminal markiert mit (von links nach rechts) dem optimierten GCE-Tag (HA-GGSG-ncAA), Tags mit alternativen kurzen Epitopen FLAG- GGSG-ncAA und Myc-GGSG-ncAA und ein Tag ohne Epitop (GGSG-ncAA). Die Zellen wurden 48 h in Gegenwart von BCN-Lys inkubiert, geerntet und einer Western-Blot-Analyse unter Verwendung von Anti-GFP-Antikörpern unterzogen. BD Projektionen maximaler Intensität, die aus Live-Zell-Bildern von COS7-Zellen entnommen wurden, die mit FLAG-GGSG-ncAA (obere Felder) oder GGSG-ncAA (untere Felder) konjugiert an GFP-SKL transfiziert wurden (B), Exo70 (C) oder α-Tubulin (D) und mit den angegebenen Tetrazinfarbstoffen markiert. Grundstücke in B stellen die Kolokalisierungsanalyse zwischen Intensitätswerten der 640 (SiR) und 488 (GFP) Kanäle dar, die an großen Teilmengen der Zellen durchgeführt wurden, die den Zellkern ausschließen (entsprechen den Rechtecken im zusammengeführten Bild) Korrelationswerte nach Pearson: oberes Feld, 0,87 unteres Feld, 0,76. C, D Links, maximale Intensitätsprojektion repräsentativer Zellen. Rechts, Linienintensitätsprofile gemessen für die gestrichelten Linien in den linken Feldern. Die in jedem Panel präsentierten Ergebnisse wurden in mindestens 3 unabhängigen Experimenten erhalten. Maßstabsbalken 10 μm

    Zuletzt haben wir getestet, wie sich das Entfernen der Epitopsequenz vom GCE-Tag auf die Markierung auswirkt (zusätzliche Datei 1: Abbildung S1i). Mit anderen Worten, ist eine Sequenz, die den GGSG-Linker kodiert, gefolgt von einem TAG, für die GCE-basierte bioorthogonale Markierung von Proteinen ausreichend? Beim Markieren von α-Tubulin mit einem GCE-Tag, dem die HA-Sequenz fehlt, wurde fast keine spezifische Markierung erhalten, sowohl durch In-Gel-Fluoreszenz als auch durch Bildgebung in lebenden Zellen (Abb. 8d unteres Feld und zusätzliche Datei 1: Abb. S6f). Für Peroxisomen und Exosomen wurde eine spezifische Markierung erhalten, wenn auch auf reduzierten Niveaus ( 8b , c untere Felder). In Peroxisomen stimmte die reduzierte Markierung mit der reduzierten Expression des Proteins überein, die durch Western-Blot beobachtet wurde ( 8a , b unteres Feld Pearson-Korrelationen, 0,76). Eine verringerte spezifische Markierung wurde auch für Exo70 unter Verwendung von In-Gel-Fluoreszenz beobachtet (zusätzliche Datei 1: Abbildung S6e), was die Möglichkeit aufwirft, dass die in Zellen beobachtete verringerte Markierung darauf zurückzuführen ist, dass die ncAA während der Translation nicht eingebaut wurden. Daher kann in speziellen Fällen, in denen die Länge des Tags für die Erhaltung der Funktion des Proteins kritisch ist, der GCE-Tag auf nur fünf Reste reduziert werden. Dies hat jedoch den Preis der Kennzeichnungseffizienz und sollte daher im Einzelfall geprüft werden.


    Teilnehmer des MGH COVID-19 Collection & Processing Teams

    Sammlungsteam: Kendall Lavin-Parsons 1 , Blair Parry 1 , Brendan Lilley 1 , Carl Lodenstein 1 , Brenna McKaig 1 , Nicole Charland 1 , Hargun Khanna 1 , Justin Margolin 1

    Bearbeitungsteam: Anna Gonye 2 , Irena Gushterova 2 , Tom Lasalle 2 , Nihaarika Sharma 2 , Brian C. Russo 3 , Maricarmen Rojas-Lopez 3 , Moshe Sade-Feldman 4 , Kasidet Manakongtreecheep 4 , Jessica Tantivit 4 , Molly Fisher Thomas 4

    Massachusetts Konsortium für Pathogen Readiness:Betelihem A. Abayneh 5 , Patrick Allen 5 , Diane Antille 5 , Katrina Armstrong 5 , Siobhan Boyce 5 , Joan Braley 5 , Karen Branch 5 , Katherine Broderick 5 , Julia Carney 5 , Andrew Chan 5 , Susan Davidson 5 , Michael Dougan 5 , David Drew 5 , Ashley Elliman 5 , Keith Flaherty 5 , Jeanne Flannery 5 , Pamela Forde 5 , Elise Gettings 5 ​​, Amanda Griffin 5 , Sheila Grimmel 5 , Kathleen Grinke 5 , Kathryn Hall 5 , Meg Healy 5 , Deborah Henault 5 , Grace Holland 5 , Chantal Kayitesi 5 , Vlasta LaValle 5 , Yuting Lu 5 , Sarah Luthern 5 , Jordan Marchewka (Schneider) 5 , Brittani Martino 5 , Roseann McNamara 5 , Christian Nambu 5 , Susan Nelson 5 , Marjorie Noone 5 , Christine Ommerborn 5 , Lois Chris Pacheco 5 , Nicole Phan 5 , Falisha A. Porto 5 , Edward Ryan 5 , Kathleen Selleck 5 , Sue Slaughenhaupt 5 , Kimberly Smith Sheppard 5 , Elizabeth Suschana 5 , Vivine Wilson 5 , Galit Alter 6 , Alejandro Balazs 6 , Julia Bals 6 , Max Barbash 6 , Yannic Bartsch 6 , Julie Boucau 6 , Josh Chevalier 6 , Fatema Chowdhury 6 , Kevin Einkauf 6 , Jon Fallon 6 , Liz Fedirko 6 , Kelsey Finn 6 , Pilar Garcia-Broncano 6 , Ciputra Hartana 6 , Chenyang Jiang 6 , Paulina Kaplonek 6 , Marshall Karpell 6 , Evan C. Lam 6 , Kristina Lefteri 6 , Xiaodong Lian 6 , Mathias Lichterfeld 6 , Daniel Lingwood 6 , Hang Liu 6 , Jinqing Liu 6 , Natasha Ly 6 , Ashlin Michell 6 , Ilan Millstrom 6 , Noah Miranda 6 , Claire O'Callaghan 6 , Matthew Osborn 6 , Shiv Pillai 6 , Yelizaveta Rassadkina 6 , Alexandra Reissis 6 , Francis Ruzicka 6 , Kyra Seiger 6 , Libera Sessa 6 , Christianne Sharr 6 , Sally Shin 6 , Nishant Singh 6 , Weiwei Sun 6 , Xiaoming Sun 6 , Hannah Ticheli 6 , Alicja Trocha Piechocka 6 , Daniel Worrall 6 , Alex Zhu 6 , George Daley 7 , David Golan 7 , Howard Heller 7 , Arlene Sharpe 7 , Nikolaus Jilg 8 , Alex Rosenthal 8 , Colline Wong 8

    1 Abteilung für Notfallmedizin, Massachusetts General Hospital, Boston, MA, USA. 2 Krebszentrum des Massachusetts General Hospital, Boston, MA, USA. 3 Abteilung für Infektionskrankheiten, Medizinische Abteilung, Massachusetts General Hospital, Boston, MA, USA. 4 Massachusetts General Hospital Center for Immunology and Inflammatory Diseases, Boston, MA, USA. 5 Massachusetts General Hospital, Boston, MA, USA. 6 Ragon Institute of MGH, MIT und Harvard, Cambridge, MA, USA. 7 Harvard Medical School, Boston, MA, USA. 8 Brigham and Women’s Hospital, Boston, MA, USA.