Information

Wie hängen Mutationen und Proteinsynthese mit Krebs zusammen?

Wie hängen Mutationen und Proteinsynthese mit Krebs zusammen?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Wie hängen Mutationen und Proteinsynthese mit Krebs zusammen?

Ich weiß, dass eine Mutation in der DNA dazu führen kann, dass sich der Triplett-Code auf der mRNA ändert, sodass verschiedene Aminosäuren hergestellt werden und eine andere Reihenfolge bedeutet, dass ein anderes Protein hergestellt wird, aber wie hängt es mit Krebs zusammen, wenn Krebs durch unkontrollierbare Mitose verursacht wird?

Danke schön

Diese Frage ist auf GCSE-Niveau, also Erstsemester- / Zweitsemester-Niveau.


Mutationen in der DNA können nützlich, schädlich oder wirkungslos sein. Dies hängt von der Genposition ab, an der diese Mutation aufgetreten ist.

Verschiedene Gene, die mit Krebs in Verbindung stehen, sind:

Tumorsuppressorgene: Diese Gene regulieren das Zellwachstum, indem sie die Zellteilung kontrollieren, fehlgepaarte DNA reparieren und den Zelltod regulieren. Mutationen in diesem Gentyp führen zu unreguliertem Zellwachstum und zur Bildung von Tumoren.

Beispiele:

  • TP53 ist das am häufigsten mutierte Tumorsuppressor-Gen. Mehr als 50 % der Krebserkrankungen werden durch Mutationen in diesem Gen verursacht.
  • Mutationen in BRCA1- oder BRCA2-Genen sind für Brust- und Eierstockkrebs verantwortlich. Es kann auch das Risiko für Bauchspeicheldrüsenkrebs und Melanome erhöhen.

Proto-Onkogene: Diese Gene helfen den Zellen, normal zu wachsen. Mutationen in diesem Gen bewirken seine permanente Aktivierung und ein unreguliertes Zellwachstum findet statt und führt zu Krebs. Dieses abnorme Gen wird als Onkogen bezeichnet.

Beispiele:

  • HER2 ist für Brust- und Eierstockkrebs verantwortlich.

  • RAS-Genfamilie, die für die Zellkommunikation, das Zellwachstum und den Zelltod verantwortlich ist.

DNA-Reparatur-Gene: Diese Gene spielen eine Rolle bei der Reparatur von DNA, die während der Replikation fehlgepaart ist. Ein Defekt im DNA-Reparatur-Gen führt zur Synthese von falsch gebildeter DNA und schließlich zu einer falschen Proteinsynthese.


Gene und Proteine ​​regulieren die Mitose. Das bekannteste Beispiel für ein Protein, das den Zellzyklus reguliert und Krebs verhindert, ist P53.

Wenn Sie mehr erfahren möchten, schauen Sie sich die Kontrollpunkte des Zellzyklus an.


Mutationen und Krankheiten

Die DNA unterliegt ständig Mutationen, zufälligen Änderungen ihres Codes. Mutationen können zu fehlenden oder missgebildeten Proteinen führen, und das kann zu Krankheiten führen.

Wir alle beginnen unser Leben mit einigen Mutationen. Diese von Ihren Eltern geerbten Mutationen werden als Keimbahnmutationen bezeichnet. Sie können jedoch auch zu Lebzeiten Mutationen erwerben. Einige Mutationen treten während der Zellteilung auf, wenn die DNA dupliziert wird. Noch andere Mutationen werden verursacht, wenn die DNA durch Umweltfaktoren wie UV-Strahlung, Chemikalien und Viren beschädigt wird.

Wenige Mutationen sind schlecht für Sie. Tatsächlich können einige Mutationen von Vorteil sein. Im Laufe der Zeit schaffen genetische Mutationen eine genetische Vielfalt, die die Populationen gesund hält. Viele Mutationen haben überhaupt keine Wirkung. Diese werden als stille Mutationen bezeichnet.

Aber die Mutationen, von denen wir am häufigsten hören, sind diejenigen, die Krankheiten verursachen. Einige bekannte genetische Erbkrankheiten sind unter anderem Mukoviszidose, Sichelzellenanämie, Tay-Sachs-Krankheit, Phenylketonurie und Farbenblindheit. Alle diese Störungen werden durch die Mutation eines einzelnen Gens verursacht.

Die meisten genetischen Erbkrankheiten sind rezessiv, was bedeutet, dass eine Person zwei Kopien des mutierten Gens erben muss, um eine Störung zu erben. Dies ist einer der Gründe, warum von einer Ehe zwischen nahen Verwandten abgeraten wird. Zwei genetisch ähnliche Erwachsene geben einem Kind eher zwei Kopien eines defekten Gens.

Krankheiten, die durch nur eine Kopie eines defekten Gens verursacht werden, wie die Huntington-Krankheit, sind selten. Dank der natürlichen Selektion neigen diese dominanten genetischen Krankheiten dazu, im Laufe der Zeit aus Populationen zu verschwinden, da betroffene Träger mit größerer Wahrscheinlichkeit sterben, bevor sie sich fortpflanzen.

Wissenschaftler schätzen, dass jeder von uns zwischen 5 und 10 potenziell tödliche Mutationen in seinen Genen hat. Die gute Nachricht ist, dass diese Krankheiten sich nicht manifestieren, da es normalerweise nur eine Kopie des schlechten Gens gibt.

Krebs entsteht normalerweise aus einer Reihe von Mutationen innerhalb einer einzelnen Zelle. Oft ist ein fehlerhaftes, beschädigtes oder fehlendes p53-Gen schuld. Das p53-Gen stellt ein Protein her, das mutierte Zellen an der Teilung hindert. Ohne dieses Protein teilen sich Zellen ungehindert und werden zu Tumoren.


Epigenetische Veränderungen bei Krebs

In Krebszellen übliche Silencing-Gene, die durch epigenetische Mechanismen auftreten, umfassen Modifikationen an Histonproteinen und DNA.

Lernziele

Beschreiben Sie die Rolle epigenetischer Veränderungen der Genexpression bei der Entstehung von Krebs

Die zentralen Thesen

Wichtige Punkte

  • Die DNA in der Promotorregion von stummgeschalteten Genen in Krebszellen ist an Cytosin-DNA-Resten in CpG-Inseln methyliert.
  • Histonproteinen, die die Promotorregion von stummgeschalteten Genen umgeben, fehlt die Acetylierungsmodifikation, die vorhanden ist, wenn die Gene in normalen Zellen exprimiert werden.
  • Wenn die Kombination von DNA-Methylierung und Histon-Deacetylierung in Krebszellen auftritt, wird das in dieser chromosomalen Region vorhandene Gen stummgeschaltet.
  • Epigenetische Veränderungen, die bei Krebs verändert werden, können rückgängig gemacht werden und können daher bei der Entwicklung neuer Medikamente und Therapien hilfreich sein.

Schlüsselbegriffe

  • epigenetisch: die Untersuchung erblicher Veränderungen der Genexpression oder des zellulären Phänotyps, die durch andere Mechanismen als Veränderungen der zugrunde liegenden DNA-Sequenz verursacht werden
  • Methylierung: die Addition einer Methylgruppe an Cytosin- und Adeninreste in der DNA, die zur epigenetischen Modifikation der DNA und zur Verringerung der Genexpression und Proteinproduktion führt
  • Acetylierung: die Reaktion eines Stoffes mit Essigsäure oder einem ihrer Derivate die Einführung einer oder mehrerer Acetylgruppen in einen Stoff

Krebs und epigenetische Veränderungen

Krebsepigenetik ist die Untersuchung epigenetischer Veränderungen am Genom von Krebszellen, die keine Veränderung der Nukleotidsequenz beinhalten. Epigenetische Veränderungen sind bei der Umwandlung einer Zelle in Krebs genauso wichtig wie genetische Mutationen. Zu den Mechanismen der epigenetischen Stummschaltung von Tumorsuppressorgenen und der Aktivierung von Onkogenen gehören: Veränderung der Methylierungsmuster von CpG-Inseln, Histonmodifikationen und Fehlregulation von DNA-bindenden Proteinen.

Epigenetische Veränderungen in Krebszellen: In Krebszellen kommt es häufig vor, dass Gene durch epigenetische Mechanismen zum Schweigen gebracht werden. Mechanismen können Modifikationen an Histonproteinen und DNA umfassen, die mit diesen Silencing-Genen assoziiert sind.

Das Abschalten von Genen durch epigenetische Mechanismen ist in Krebszellen sehr verbreitet und umfasst Modifikationen an Histonproteinen und DNA, die mit stillgelegten Genen verbunden sind. In Krebszellen ist die DNA in der Promotorregion von stummgeschalteten Genen an Cytosin-DNA-Resten in CpG-Inseln methyliert, Genomregionen, die eine hohe Häufigkeit von CpG-Stellen enthalten, wo ein Cytosinnukleotid neben einem Guaninnukleotid auftritt. Histonproteinen, die diese Region umgeben, fehlt die Acetylierungsmodifikation (das Hinzufügen einer Acetylgruppe), die vorhanden ist, wenn die Gene in normalen Zellen exprimiert werden. Diese Kombination aus DNA-Methylierung und Histon-Deacetylierung (epigenetische Modifikationen, die zu Gen-Silencing führen) wird häufig bei Krebs gefunden. Wenn diese Modifikationen auftreten, wird das in dieser chromosomalen Region vorhandene Gen stummgeschaltet. Wissenschaftler verstehen zunehmend, wie diese epigenetischen Veränderungen bei Krebs verändert werden. Da diese Veränderungen vorübergehend sind und rückgängig gemacht werden können (z. B. durch Verhinderung der Wirkung des Histon-Deacetylase-Proteins, das Acetylgruppen entfernt, oder durch DNA-Methyltransferase-Enzyme, die Methylgruppen zu Cytosinen in der DNA hinzufügen), ist es möglich, neue Medikamente zu entwickeln und neue Therapien, um die reversible Natur dieser Prozesse zu nutzen. Tatsächlich testen viele Forscher, wie ein stummgeschaltetes Gen in einer Krebszelle wieder eingeschaltet werden kann, um normale Wachstumsmuster wiederherzustellen.

Es wird angenommen, dass Gene, die an der Entstehung vieler anderer Krankheiten beteiligt sind, von Allergien über Entzündungen bis hin zu Autismus, ebenfalls durch epigenetische Mechanismen reguliert werden. Da sich unser Wissen darüber vertieft, wie Gene kontrolliert werden, werden neue Wege zur Behandlung dieser Krankheiten und Krebs auftauchen.


Was ist der Zusammenhang zwischen Proteinsynthese und Mutationen?

Was ist der Zusammenhang zwischen Proteinsynthese und Mutationen!?

MUTATION: Eine Änderung der Basenreihenfolge in der DNA

Eine Veränderung eines oder weniger Nukleotide kann eine Veränderung des exprimierten Gens bewirken!

Mutationen können entweder sein: i) nützlich (+) ii) neutral ( ) iii) schädlich (-)

Interessante Tiermutationen…. Vorteilhaft? Neutral? oder schädlich? Zweiköpfige Schildkröte

Haarloses Frettchen Haarlose Katze

Siamese Twins – preisgekrönte Sumo-Ringer-

Silver Wood Ducks -Wassergeflügel Farbmutationen-

Schneeflocke im Zoo von Barcelona Albinismus: Eine Störung, die die Haut- / Haarfarbe dieses Gorillas beeinflusst. Snowflake starb 2003 im Alter von etwa 37 Jahren an Krebs. Er hatte eine Reihe von Nachkommen, die alle keinen Albinismus hatten.

Was ist der Zusammenhang zwischen Mutationen und Evolution? Mutationen sind die Grundlage der Evolution! Ohne Mutationen gibt es keine Veränderung im Laufe der Zeit, also keine Evolution! Veränderungen in der DNA können Veränderungen sowohl im Aussehen als auch im Verhalten codieren. Die natürliche Selektion begünstigt (selektiert) oder benachteiligt solche Veränderungen, weil sie die Überlebens- und Fortpflanzungsfähigkeit (Fitness!)

Mutationen können entweder sein: i) nützlich (+) ii) neutral ( ) iii) schädlich (-)

Nützliche Mutationen Bsp: Sichelzellenanämie rote Blutkörperchen sind sichelförmig, nicht rund Eine Kopie dieses Gens macht eine Person resistent gegen tödliche Malaria

Beispiel: Bakterien, die Öl verdauen können Wird verwendet, um Ölverschmutzungen zu beseitigen Beispiel: Superbugs… Mutation ermöglicht es einigen Bakterien, gegen Antibiotika, die für die für den Menschen schädlichen Bakterien nützlich sind, zu widerstehen / nicht abgetötet zu werden!

Schädliche Mutationen Bsp: Mukoviszidose -> Schleim baut sich in der Lunge auf Lungeninfektionen können tödlich sein

Diabetes-Insulinprotein wird nicht richtig hergestellt Der Blutzuckerspiegel ist außer Kontrolle

Wie entstehen Mutationen? I. Frameshift-Mutationen: Addition oder Deletion eines Nukleotids THE CAT ATE THE RAT Deletion von ‘C’ verursacht: THE ATA TET HER AT Die gesamte Botschaft ist betroffen (alle Codons!)

II. Punktmutationen Ein einzelnes Nukleotid wird verändert Nur 1 Codon betroffen i) Silent – ​​keine Wirkung GAT GAC – beide kodieren für Leucin ii) Missense – die endgültige Form und Funktion des Proteins beeinflusst CTT CAT – Valin ersetzt Glutamat ii) Nonsense-Protein kann nicht funktionieren AGT ATT – Serin ersetzt durch STOP

Mutagene: Umweltfaktoren, die Mutationen verursachen 1. Hochenergetische Strahlung: Röntgenstrahlen, Gammastrahlen, UV-Licht 2. Chemische Mutagene: Benzole, Dioxine, einige Substanzen im Zigarettenrauch und in Pestiziden

https: //www. Krebsforschung uk. org/aboutcancer/cances-of-cancer/cancer-controversies/plasticbottles-and-food-containers

Verarbeitetes Fleisch und Leukämierisiko bei Kindern https: //www. ncbi. nlm. NIH. gov/pubmed/8167267


DNA-Sequenzen

Im Kern werden zwei DNA-Stränge durch stickstoffhaltige Basen (auch Nukleobasen oder Basen genannt) zusammengehalten. Vier Basen – Cytosin, Guanin, Adenin und Thymin – bilden die Buchstaben der Wörter im DNA-Rezeptbuch.

Ein DNA-Strang enthält den ursprünglichen Code. Wenn die Anweisungen dieses Codes sorgfältig befolgt werden, kann ein spezifisches korrektes Polypeptid außerhalb des Kerns zusammengebaut werden. Der zweite DNA-Strang – der Template-Strang – ist ein Spiegelbild des Originalstrangs. Es muss ein Spiegelbild sein, da Nukleobasen nur an komplementäre Partner binden können. Zum Beispiel paart Cytosin immer nur mit Guanin und Thymin nur mit Adenin.

Sie werden wahrscheinlich Codes wie CTA, ATA, TAA und CCC in verschiedenen Biologie-Lehrbüchern gesehen haben. Sind dies die Codons (drei Basensätze) des ursprünglichen DNA-Strangs, heftet sich der Matrizenstrang mit seinen Partnern an diese an. Unter Verwendung der angegebenen Beispiele wird die Template-DNA mit GAT, TAT, ATT und GGG an den ursprünglichen DNA-Strang angehängt.

Messenger-RNA kopiert dann den Matrizenstrang. Dies bedeutet, dass am Ende eine exakte Kopie des Originalstrangs erstellt wird. Der einzige Unterschied besteht darin, dass mRNA Thymin durch eine Base namens Uracil ersetzt. Die mRNA-Kopie des Matrizenstrangs unter Verwendung der angegebenen Beispiele würde CUA, AUA, UAA und CCC lauten.

Diese Codes können durch Transfer von RNA außerhalb des Zellkerns gelesen werden. Das Rezept kann von einem Molekül verstanden werden, das die Sprache des Originals nicht vollständig versteht (es versteht nicht Thymin, nur Uracil). Transfer-RNA hilft, die richtigen Teile zum Fließband des Ribosoms zu bringen. Dort wird eine Proteinkette aufgebaut, die den Anweisungen im ursprünglichen DNA-Strang entspricht.


Auswirkung der Mutation auf die Proteinstruktur | Genetik | Biologie

Punktmutationen beinhalten das Hinzufügen, Löschen oder Ersetzen von Basenpaaren in einem Gen.

2. Chromosomale Mutationen:

Hinzufügen oder Deletion von DNA verursacht Mutationen während des Crossing-Over.

3. Springende Gene bewirken auch eine Veränderung der Proteinstruktur, indem sie ihre Position von einem Chromosom zum anderen verschieben.

Die durch Mutationen produzierte abnorme mRNA führt zu einer Veränderung der Proteinstruktur und -funktion. Frameshift-Mutation, die durch Addition oder Deletion von einer oder zwei Basen verursacht wird, führt zur Bildung eines vollständig neuen Polypeptids.

Mutation kann ein normales Codon in ein Terminator-Codon ändern, was zur Bildung eines unvollständigen Polypeptids führt. Das veränderte oder unvollständige Polypeptid kann inaktiv sein und kann sich als tödlich für die Zelle erweisen. Zum Beispiel wird die Sichelzellenanämie durch eine einzelne Basensubstitution verursacht. Dies bewirkt den Ersatz von Glutaminsäure durch Valin an Position 6 in der Hämoglobinkette.

Aber eine Veränderung der dritten Base in einem Triplett kann keine Veränderung des Polypeptids bewirken. Dies liegt daran, dass das Codon mit dem Anticodon der entsprechenden tRNA interagieren kann. Dieses Phänomen ist als Wobble-Hypothese bekannt. Es wurde von Crick im Jahr 1966 vorgeschlagen.

Nach dieser Hypothese binden nur die ersten beiden Basen des tRNA-Anticodons an die ersten beiden Basen des mRNA-Codons. Die dritte Position wird als Wobble-Position bezeichnet. Mutationen, die keine Veränderung des Proteins bewirken, werden als stille Mutationen bezeichnet.


Proto-Onkogene

Die Gene, die für die kodieren positive Zellzyklusregulatoren werden als Proto-Onkogene bezeichnet. Proto-Onkogene sind normale Gene, die wenn mutiert, werden sie zu Onkogenen– Gene, die eine Zelle krebsartig werden lassen. Überlegen Sie, was mit dem Zellzyklus in einer Zelle mit einem kürzlich erworbenen Onkogen passieren könnte. In den meisten Fällen führt die Veränderung der DNA-Sequenz zu einem weniger funktionellen (oder nicht funktionellen) Protein. Das Ergebnis ist schädlich für die Zelle und wird wahrscheinlich verhindern, dass die Zelle den Zellzyklus abschließt, der Organismus wird jedoch nicht geschädigt, da die Mutation nicht weitergetragen wird. Wenn sich eine Zelle nicht reproduzieren kann, wird die Mutation nicht vermehrt und der Schaden ist minimal. Gelegentlich verursacht jedoch eine Genmutation eine Veränderung, die die Aktivität eines positiven Regulators erhöht. Zum Beispiel könnte eine Mutation, die es ermöglicht, Cdk, ein Protein, das an der Regulierung des Zellzyklus beteiligt ist, zu aktivieren, bevor es sein sollte, den Zellzyklus über einen Kontrollpunkt hinausschieben, bevor alle erforderlichen Bedingungen erfüllt sind. Sind die entstandenen Tochterzellen zu stark geschädigt, um weitere Zellteilungen vorzunehmen, würde die Mutation nicht vermehrt und der Organismus nicht geschädigt. Wenn sich die atypischen Tochterzellen jedoch weiter teilen können, wird die nachfolgende Zellgeneration wahrscheinlich noch mehr Mutationen anhäufen, einige möglicherweise in zusätzlichen Genen, die den Zellzyklus regulieren.

Das Cdk-Beispiel ist nur eines von vielen Genen, die als Proto-Onkogene gelten. Zusätzlich zu den regulatorischen Proteinen des Zellzyklus kann jedes Protein, das den Zyklus beeinflusst, so verändert werden, dass es Kontrollpunkte des Zellzyklus außer Kraft setzt. Sobald ein Proto-Onkogen so verändert wurde, dass die Geschwindigkeit des Zellzyklus zunimmt, wird es als Onkogen bezeichnet.


Einige menschliche Krankheiten werden durch spontane Mutationen verursacht

Viele häufige menschliche Krankheiten, die oft verheerende Auswirkungen haben, sind auf Mutationen in einzelnen Genen zurückzuführen. Erbkrankheiten entstehen durch spontane Mutationen in Keimzellen (Ei und Spermien), die an zukünftige Generationen weitergegeben werden. Zum Beispiel, Sichelzellenanämie, die 1 von 500 Personen afrikanischer Abstammung betrifft, wird durch eine einzelne Missense-Mutation am Codon 6 des β-Globin-Gens verursacht im mutierten Protein. Diese Veränderung hat einen tiefgreifenden Einfluss auf Hämoglobin, das Sauerstoffträgerprotein der Erythrozyten, das aus zwei α-Globin- und zwei β-Globin-Untereinheiten besteht (siehe Abbildung 3-11). Die desoxygenierte Form des mutierten Proteins ist in Erythrozyten unlöslich und bildet kristalline Anordnungen. Die Erythrozyten der betroffenen Personen werden starr und ihr Durchgang durch die Kapillaren wird blockiert, was zu starken Schmerzen und Gewebeschäden führt. Da die Erythrozyten heterozygoter Individuen gegen den in Afrika endemischen Malaria-Erreger resistent sind, wurde das mutierte Allel beibehalten. Es ist nicht so, dass Individuen afrikanischer Abstammung wahrscheinlicher als andere eine Mutation erwerben, die den Sichelzellendefekt verursacht, sondern die Mutation wurde in dieser Population durch Kreuzung aufrechterhalten.

Die spontane Mutation in somatischen Zellen (d. h. Körperzellen, die keine Keimbahn sind) ist auch ein wichtiger Mechanismus bei bestimmten menschlichen Krankheiten, einschließlich Retinoblastom, die mit Netzhauttumoren bei Kindern assoziiert ist (siehe Abbildung 24-11). Die erbliche Form des Retinoblastoms zum Beispiel resultiert aus einer Keimbahnmutation in einem Rb Allel und eine zweite somatisch vorkommende Mutation im anderen Rb Allel (Abbildung 8.7a). Wenn ein Rb heterozygote Netzhautzelle eine somatische Mutation erleidet, es bleibt kein normales Allel übrig, die Zelle proliferiert unkontrolliert und führt zu einem Netzhauttumor. Eine zweite Form dieser Krankheit, genannt sporadisches Retinoblastom, resultiert aus zwei unabhängigen Mutationen, die beide stören Rb Allele (Abbildung 8-7b). Da für die Tumorentwicklung bei Kindern mit hereditärem Retinoblastom nur eine somatische Mutation erforderlich ist, tritt sie viel häufiger auf als die sporadische Form, die den Erwerb von zwei unabhängig voneinander auftretenden somatischen Mutationen erfordert. Es wurde gezeigt, dass das Rb-Protein eine entscheidende Rolle bei der Kontrolle der Zellteilung spielt (Kapitel 13).

Abbildung 8-7

Die Rolle der spontanen somatischen Mutation beim Retinoblastom, einer durch Netzhauttumore gekennzeichneten Kinderkrankheit. Tumore entstehen aus Netzhautzellen, die zwei Mutanten tragen Rb − Allele. (a) Beim hereditären Retinoblastom erhält ein Kind ein normales Rb + Allel von (mehr.)

In einem späteren Abschnitt werden wir sehen, wie normale Kopien von krankheitsbezogenen Genen isoliert und kloniert werden können.


Abstrakt

Die Liste genetischer Erkrankungen, die durch Mutationen verursacht werden, die die mRNA-Translation beeinflussen, wächst schnell. Obwohl die Proteinsynthese ein grundlegender Prozess in allen Zellen ist, zeigen die Krankheitsphänotypen einen überraschenden Grad an Heterogenität. Studien zu einigen dieser Krankheiten haben faszinierende neue Einblicke in die Funktionen von Proteinen geliefert, die am Translationsprozess beteiligt sind, zum Beispiel deuten Hinweise darauf hin, dass einige neben ihrer Rolle bei der Translation noch andere Funktionen haben. Angesichts der zahlreichen Proteine, die an der mRNA-Translation beteiligt sind, ist es wahrscheinlich, dass weitere Erbkrankheiten durch Mutationen in Genen verursacht werden, die an diesem komplexen Prozess beteiligt sind.


ERGEBNISSE

Validierungstest

Um die Fähigkeit des FIS-Scores zu testen, die funktionelle Auswirkung einer Mutation vorherzusagen, haben wir das Rechenprotokoll auf bekannte „krankheitsassoziierte“ und „gemeinsame Polymorphismus“-Varianten und -Mutationen angewendet, die in UniProt (HUMSAVAR, Version 2010_08) kommentiert wurden. Durch einen Vergleich der FIS-Scores für krankheitsassoziierte und häufige polymorphe Varianten haben wir die Hypothese getestet, dass krankheitsassoziierte Varianten und Mutationen typischerweise einen negativen Einfluss auf die Proteinfunktion haben und daher eher in Positionen mit niedriger Mutationsfixierungsrate beobachtet werden, dh in konservierten Positionen, während funktionell neutrale oder schwach schädliche polymorphe Varianten eher in evolutionär promiskuitiven Positionen beobachtet werden. Wir verlangen daher, dass der evolutionäre Konservierungsscore zwischen krankheitsassoziierten und polymorphen Varianten unterscheidet und als Maß für den funktionellen Einfluss von Mutationen verwendet werden kann. Um herauszufinden, wie diese Anforderung am besten erfüllt werden kann, haben wir 1000 diskrete Schwellenwerte im FIS getestet und die Anzahl der krankheitsassoziierten und polymorphen Varianten auf beiden Seiten des Schwellenwerts gezählt. Die Erkennungsgenauigkeit, definiert als Prozentsatz der richtig zugeordneten Varianten, beträgt 79 %, wenn falsch positive und falsch negative Ergebnisse ausgeglichen werden (gleiche Fraktionen) ( Abbildung 2 ). Die zusammenfassenden Ergebnisse der Validierungstests und eine Kalibrierungskurve des funktionellen Scores sind in den Abbildungen 2 und 3 und in den Ergänzenden Daten (Zusatztabelle S1) zu finden.

Trennung von krankheitsassoziierten und polymorphen Varianten durch Functional Impact Score. ( EIN ) Normalisierte geglättete Verteilungen der Werte des funktionellen Scores, wie sie für 19 179 bekannte „krankheitsassoziierte“ und 35 608 „gemeinsame Polymorphismus“-Varianten und -Mutationen berechnet wurden, die in UniProt annotiert wurden (HUMSAVAR, Version 2010_08 http://www.uniprot.org/ docs/humsavar ). ( B ) Die kumulativen Verteilungen der berechneten Score-Werte für krankheitsassoziierte und polymorphe Varianten, gleiche Daten wie in (A). Eine gleichmäßig ausgewogene Trennung (79 %) zwischen den beiden Variantenklassen wird bei einer Score-Schwelle von FIS∼1,9 erreicht. Bei diesem Schwellenwert werden 79 % aller krankheitsassoziierten Varianten höher als dieser Schwellenwert bewertet und ∼79 % aller polymorphen Varianten werden niedriger bewertet. Die maximale Trennung (∼80,3%) zwischen den beiden Klassen wird beim Schwellenwert von 2,26 erreicht, ∼70% der krankheitsassoziierten Varianten werden höher bewertet und 86% der polymorphen Varianten werden niedriger bewertet.

Trennung von krankheitsassoziierten und polymorphen Varianten durch Functional Impact Score. ( EIN ) Normalisierte geglättete Verteilungen der Werte des funktionalen Scores, berechnet für 19 179 bekannte „krankheitsassoziierte“ und 35 608 „gemeinsame Polymorphismus“-Varianten und Mutationen, die in UniProt annotiert wurden (HUMSAVAR, Version 2010_08 http://www.uniprot.org/ docs/humsavar ). ( B ) Die kumulativen Verteilungen der berechneten Score-Werte für krankheitsassoziierte und polymorphe Varianten, gleiche Daten wie in (A). Eine gleichmäßig ausgewogene Trennung (79 %) zwischen den beiden Variantenklassen wird bei einer Score-Schwelle von FIS∼1,9 erreicht. Bei diesem Schwellenwert werden 79 % aller krankheitsassoziierten Varianten höher als dieser Schwellenwert bewertet und ∼79 % aller polymorphen Varianten werden niedriger bewertet. Die maximale Trennung (∼80,3%) zwischen den beiden Klassen wird beim Schwellenwert von 2,26 erreicht, ∼70% der krankheitsassoziierten Varianten werden höher bewertet und 86% der polymorphen Varianten werden niedriger bewertet.

ROC-Analyse der Klassifikation zwischen krankheitsassoziierten und polymorphen Varianten. Der beobachtete Score-Bereich (-6, 6) wurde in 1000 diskrete Schwellenwerte unterteilt, und für jeden der Schwellenwerte wurden Prozentsätze der krankheitsassoziierten und polymorphen Varianten oberhalb und unterhalb des Score-Schwellenwertes bestimmt. Der Prozentsatz der krankheitsassoziierten Varianten oberhalb der Score-Schwelle wird als „echt positiv“ definiert, während der Prozentsatz der polymorphen Varianten oberhalb der Score-Schwelle als „falsch positiv“ definiert wird. Die ROC-Kurven wurden für zwei Testsätze erstellt: Im ersten Satz wurden alle verfügbaren ∼55,7 K-Varianten (∼19,2 K krankheitsassoziiert und ∼36,5 K polymorph) verwendet, die Scores der Varianten, die auf Regionen ohne Sequenzhomologie fallen, waren gleich Null im zweiten Satz genommen, wurden die Scores für einen reduzierten Satz von ∼ 27,4 K Varianten (∼ 13,7 K krankheitsassoziiert und ∼ 13,6 K polymorph) unter Verwendung von Alignments von 75 oder mehr Sequenzen berechnet.

ROC-Analyse der Klassifikation zwischen krankheitsassoziierten und polymorphen Varianten. Der beobachtete Score-Bereich (-6, 6) wurde in 1000 diskrete Schwellenwerte unterteilt, und für jeden der Schwellenwerte wurden Prozentsätze der krankheitsassoziierten und polymorphen Varianten oberhalb und unterhalb des Score-Schwellenwertes bestimmt. Der Prozentsatz der krankheitsassoziierten Varianten über der Score-Schwelle wird als „echt positiv“ definiert, während der Prozentsatz der polymorphen Varianten über der Score-Schwelle als „falsch positiv“ definiert wird. Die ROC-Kurven wurden für zwei Testsätze erstellt: Im ersten Satz wurden alle verfügbaren ∼55,7 K-Varianten (∼19,2 K krankheitsassoziiert und ∼36,5 K polymorph) verwendet, die Scores der Varianten, die auf Regionen ohne Sequenzhomologie fallen, waren gleich Null im zweiten Satz genommen, wurden die Scores für einen reduzierten Satz von ∼ 27,4 K Varianten (∼ 13,7 K krankheitsassoziiert und ∼ 13,6 K polymorph) unter Verwendung von Alignments von 75 oder mehr Sequenzen berechnet.

Robustheitsanalyse

Ein signifikanter Anteil polymorpher Varianten fällt in Regionen mit geringer Abdeckung von Sequenzhomologen ( 2 ). Von den gesamten 55 K-Varianten fallen 10,5 K-Varianten in Regionen mit geringer Homologieabdeckung (MSA hat <10 Sequenzen). Von diesen Varianten waren 90% polymorphe Varianten und nur ∼10% waren krankheitsassoziierte Varianten. Varianten mit geringer Homologieabdeckung erhalten per Definition niedrige Score-Werte. Wie wirkt sich die ungleichmäßige Verteilung von Varianten mit geringer Homologieabdeckung auf die Gesamtgenauigkeit der Trennung zwischen krankheitsassoziierten und polymorphen Varianten aus? Wie hängt die Genauigkeit der Trennung zwischen krankheitsassoziierten und polymorphen Varianten von der Größe eines multiplen Sequenz-Alignments ab? Um diese Fragen zu beantworten, haben wir die Score-Verteilungen für krankheitsassoziierte und polymorphe Varianten verglichen, die eine Homologieabdeckung von 1 bis zu 600 oder mehr Sequenzen in einem Familien-Alignment aufweisen. Wir fanden, dass die Anreicherung von polymorphen Varianten mit niedriger Homologie verschwindet, wenn die minimale Alignment-Größe 75 Sequenzen pro Familie überschreitet. Bei einer Abdeckung von 75 oder mehr Sequenzen werden ∼ 14 K krankheitsassoziierte und 14 K polymorphe Varianten (∼ 1/2 aller getesteten Mutationen) mit einer Genauigkeit von besser als 76 % und einer AUC in der ROC-Analyse von 0,83 getrennt (Abbildung 3). . Wir wiederholten diesen Test mit größeren Größen der minimalen Ausrichtung. Die Genauigkeit der Trennung zwischen krankheitsassoziierten und polymorphen Varianten blieb gleich, wenn die minimale Alignment-Größe zwischen 30 und bis zu 350 Sequenzen variierte. Somit beeinflusst die in der Praxis beobachtete Anreicherung polymorpher Varianten in Regionen mit geringer Homologieabdeckung die Unterscheidung von krankheitsassoziierten und polymorphen Varianten nicht. Weitere Einzelheiten zu den Erkennungstests bei verschiedenen Ausrichtungsgrößen sind in der Ergänzungstabelle S1 angegeben.

Validierung des FI-Scores an experimentell getesteten TP53-Mutationen

Von besonderem Interesse für die Validierung der Methode sind Fälle, in denen die vorhergesagten funktionellen Auswirkungen von Mutationen mit direkten Messungen der funktionellen Aktivität verglichen werden können. Daher haben wir den FI-Score anhand von Daten getestet, die aus experimentellen Studien zum funktionellen Einfluss von TP53-Mutationen gewonnen wurden, wie sie in der IARC TP53-Datenbank gesammelt wurden ( 55 ). TP53-Mutanten bei Krebs können sowohl zu einem „Funktionsverlust“ als auch in einigen Fällen zu einem „Funktionsgewinn“ führen ( 56 ). Obwohl die biologischen Wirkungen von TP53-Mutationen bei Krebs durch verschiedene posttranskriptionelle Faktoren beeinflusst werden ( 56 ), sind direkte Messungen der Transkriptionsaktivität von mutiertem TP53 sehr nützlich für die Bewertung der Auswirkungen von TP53-Mutationen bei Krebs.

Für jede der 2314 Mutationen gibt die Tabelle „TP53MUTfunction2R15“ der IARC TP53-Datenbank acht promotorspezifische Transkriptionsaktivitäten an, die in Hefefunktionsassays gemessen und als Prozentsatz der Wildtyp-Aktivität ausgedrückt werden. Obwohl diese acht normalisierten Aktivitäten über alle untersuchten Mutanten hinweg korreliert sind, können die einzelnen Aktivitäten, die für eine bestimmte TP53-Mutante gemessen werden, erheblich variieren. Insbesondere beträgt der Durchschnittswert der Standardabweichung von acht Aktivitäten ∼25%. Um Divergenzen und experimentelle Fehler bei den Auswirkungen von Mutationen zu reduzieren, berechneten wir Durchschnittswerte der Transkriptionsaktivitäten und verglichen die FIS-Verteilungen für Mutationen, von denen die durchschnittlichen Aktivitäten in acht verschiedene Klassen fielen: [0–20], [20–40], [40 –60], [60–80], [80–100], [100–120], [120–140], [140–250] ( Abbildung 4 ). Die Aktivität des normalen TP53 beträgt 100.

FIS-Verteilungen von Mutationen in TP53, eingeteilt in acht Klassen, basierend auf dem Einfluss der Mutationen. Die normalisierten Transkriptionsaktivitäten von 2314 TP53-Mutanten wurden gemittelt und je nach durchschnittlichem Aktivitätswert wurden die Mutationen in acht Klassen eingeteilt, die Bereiche der durchschnittlichen Transkriptionsaktivität sind unterhalb der Bin-Markierungen angegeben. Die FIS-Verteilungen werden durch die Boxplots dargestellt. Dicke schwarze Linien zeigen die Mediane der Verteilungen jede der Boxen wird zwischen dem unteren und oberen Quartil der Verteilungen gezeichnet, die gestrichelten Linien erstrecken sich bis zu den minimalen und maximalen Werten der Verteilungen. Die Mutationen mit größerer funktioneller Auswirkung, d. h. höherer oder niedriger als normaler Transkriptionsaktivität („Funktionsverlust“ oder „Funktionsgewinn“) haben tendenziell die höheren Werte des FIS-Scores.

FIS-Verteilungen von Mutationen in TP53, eingeteilt in acht Klassen, basierend auf dem Einfluss der Mutationen. Die normalisierten Transkriptionsaktivitäten von 2314 TP53-Mutanten wurden gemittelt und je nach durchschnittlichem Aktivitätswert wurden die Mutationen in acht Klassen eingeteilt, die Bereiche der durchschnittlichen Transkriptionsaktivität sind unterhalb der Bin-Markierungen angegeben. Die FIS-Verteilungen werden durch die Boxplots dargestellt. Dicke schwarze Linien zeigen die Mediane der Verteilungen jede der Boxen wird zwischen dem unteren und oberen Quartil der Verteilungen gezeichnet. Die gestrichelten Linien erstrecken sich bis zu den minimalen und maximalen Werten der Verteilungen. Die Mutationen mit größeren funktionellen Auswirkungen, d. h. höherer oder niedriger als normaler Transkriptionsaktivität („Funktionsverlust“ oder „Funktionsgewinn“) haben tendenziell die höheren Werte des FIS-Scores.

Offensichtlich unterscheiden sich Mutationen in den Bins [0–20] und [80–100] signifikant durch ihre funktionellen Auswirkungen. Mutationen in bin [0–20] reduzieren auffallend die Transkriptionsaktivität von TP53, während Mutationen in bin [80–100] nahezu normal sind. Der Unterschied zwischen zwei Mutationsklassen wird durch die entsprechenden FIS-Verteilungen deutlich. Die Mutationen von bin [0–20] werden signifikant höher bewertet als Mutationen von bin [80–100]. Die Fläche unter der Empfänger-Betriebs-Kennlinie für die Zwei-Klassen-Unterscheidung zwischen Mutationen von bin [0–20] und Mutationen von bin [80–100] liegt nahe bei 0,93. Die FIS-Verteilungen der Bins [20–40], [40–60] und [60–80] sind von den höheren zu den niedrigeren Werten verschoben, was mit der Erhöhung der Transkriptionsaktivität von TP53 übereinstimmt. Die FIS-Verteilungen in Bins [100–120], [120–140], [140–250] werden von niedrigeren Werten zu höheren Werten verschoben, auch in Übereinstimmung mit der Erhöhung der Transkriptionsaktivität von TP53. Somit korreliert der Functional Impact Score mit dem experimentell gemessenen funktionellen Impact von Mutationen: Der Score ist höher für Mutationen, die zu „Funktionsverlust“ und „Funktionsgewinn“ von TP53 führen. Weitere Einzelheiten zu den FIS-Verteilungen von TP53-Mutationen sind in den ergänzenden Daten S4 angegeben.

Funktionelle Mutationen in der COSMIC-Datenbank

Derzeit gibt es nicht-synonyme Punktmutationen mit 10,7 K in verschiedenen Tumoren, die im Catalog of Somatic Mutations in Cancer (COSMIC, v49) aufgeführt sind. Many of these mutations have been studied experimentally and their functional impact and role in cancer are fairly well characterized. However, for the majority of mutations, their functional impact and role in cancer remains unknown.

Cancer mutations can be ranked by the number of occurrences of particular mutations similarly, the genes implicated in cancer can be ranked by the total number of mutations detected for a particular gene. Obviously, particular numbers of mutations depend on sampling. However, in general, mutations that promote cancer will be selected more frequently than neutral mutations, and therefore, recurrent mutations and recurrently mutated genes are likely to play a key role in cancer. Thus, mutations of frequently mutated genes are likely to be functional.

In this study, we ranked mutations and mutated genes by their potential role in cancer by combining several factors: the predicted impact of a mutation on protein function, the occurrence of an individual mutation in different tumors, the total numbers of mutations detected for a particular gene and the gene’s role in cancer (tumor suppressor or oncogene) provided by a Cancer Gene resource at MSKCC ( 57 ).

To substantiate ranking of mutations and genes, we conducted three computational tests. In the first test, we tested the hypothesis that recurrently observed cancer mutations are significantly enriched by mutations of predicted high functional impact and therefore can be differentiated from single mutations, many of which are passenger mutations with low functional impact. In the second test, we tested a similar hypothesis that is mutations of frequently mutated genes are enriched by predicted functional mutations as compared to mutations of solitary mutated genes. In the third test, the scores of mutations in tumor suppressors (TS) or oncogenes (OG) were compared to the scores of mutations in the genes non-annotated as TS or OG. We tested the hypothesis that mutations in primary cancer genes (TS and OG) are enriched by high scoring functional mutations as compared to the mutations of non-cancer genes and therefore can be differentiated from all other mutations.

The ‘case and control’ sets of mutations used in these tests are not completely independent because many of recurrent mutations affect multiply mutated genes with key roles in cancer (TS or OG). However, conducted together, these tests give a more complete presentation of the distribution of functional mutations in cancer than each of the tests conducted individually.

The results of the tests are in Figures 5 and 6 .

Cumulative score distributions computed for recurrent cancer mutations in the COSMIC database (release 49, September, 2010), the scores were computed for 10 005 unique non-synonymous point mutations affecting 3630 genes. Recurrent cancer mutations observed two or more times (1828) and highly recurrent mutations observed five or more times (712) are scoring significantly higher compared to mutations observed only once (8177) the ROC analysis (not shown) of separation of recurrent mutations from one-time-observed mutations gives AUC = 0.75 the accuracy of separation is ∼69%, when a percentage of false positives is equal to a percentage of false negatives.

Cumulative score distributions computed for recurrent cancer mutations in the COSMIC database (release 49, September, 2010), the scores were computed for 10 005 unique non-synonymous point mutations affecting 3630 genes. Recurrent cancer mutations observed two or more times (1828) and highly recurrent mutations observed five or more times (712) are scoring significantly higher compared to mutations observed only once (8177) the ROC analysis (not shown) of separation of recurrent mutations from one-time-observed mutations gives AUC = 0.75 the accuracy of separation is ∼69%, when a percentage of false positives is equal to a percentage of false negatives.

Cumulative score distributions computed for mutations of multiply mutated genes in the COSMIC database mutations in COSMIC are distributed non-uniformly across genes: one mutation per gene is detected in 1349 genes two or more mutations are detected in 620 genes, three or more—in 265 genes, five or more in 96 genes, 10 or more—in 51 genes, 19 or more—in 37 genes. Multiply mutated genes (mutated two or more times) are enriched in high score mutations compared to single mutated genes and polymorphisms.

Cumulative score distributions computed for mutations of multiply mutated genes in the COSMIC database mutations in COSMIC are distributed non-uniformly across genes: one mutation per gene is detected in 1349 genes two or more mutations are detected in 620 genes, three or more—in 265 genes, five or more in 96 genes, 10 or more—in 51 genes, 19 or more—in 37 genes. Multiply mutated genes (mutated two or more times) are enriched in high score mutations compared to single mutated genes and polymorphisms.

The FIS score distributions of Figure 5 show that cancer mutations collected in COSMIC are more significantly enriched in high score mutations than are polymorphic variants. Interestingly, recurrent mutations (observed in two or more samples) have a score distribution very close to the score distribution of disease-associated variants, while highly recurrent mutations (observed in five or more samples) are even more significantly enriched in high-score mutations than disease-associated variants ( Figure 5 ). We also found that mutations of singly mutated genes in COSMIC are two times more enriched in high scoring mutations than are polymorphic mutations.

These results confirm the hypothesis that recurrent mutations are likely to be functional mutations and can be differentiated from single mutations by the evolutionary derived functional impact score.

The score distributions of Figures 6 and 7 also confirm that mutations of multiply mutated gene and mutations in annotated tumor suppressors and oncogenes are enriched in functional mutations: multiply mutated genes (mutated two or more times) are more enriched in high score mutations than singly mutated genes and polymorphisms.

Cumulative score distributions computed for mutations in genes annotated as tumor suppressors and oncogenes in the COSMIC database 4413 mutations in tumor suppressors and oncogenes are enriched in high-scoring mutations compared to 5592 mutations in genes non-annotated as TS and OG. The ROC analysis (not shown) of separation of recurrent mutations from one-time-observed mutations gives AUC = 0.6745 accuracy of separation is 64%, when the percentage of false positives is equal to the percentage of false negatives.

Cumulative score distributions computed for mutations in genes annotated as tumor suppressors and oncogenes in the COSMIC database 4413 mutations in tumor suppressors and oncogenes are enriched in high-scoring mutations compared to 5592 mutations in genes non-annotated as TS and OG. The ROC analysis (not shown) of separation of recurrent mutations from one-time-observed mutations gives AUC = 0.6745 accuracy of separation is 64%, when the percentage of false positives is equal to the percentage of false negatives.

We found that the more mutations are observed in a gene, the bigger the fraction of high scoring mutations in this gene ( Figure 6 ). However, the portion of high-scoring mutations in multiply mutated genes is smaller than in disease-associated variants or in recurrent individual mutations. We found similar results for mutations detected in key cancer genes—tumor suppressors and oncogenes ( Figure 7 ). Mutations in TSs and OGs are scoring significantly higher than mutations in genes non-annotated as TSs or OGs. However a fraction of high-scoring mutations in TSs and OGs is less, than in a reference set of disease-associated mutations. Taking into account that the score generally correctly distinguish functional and non-functional mutations ( Figures 2–5 ), this difference emphasizes the fact that not all mutations in multiply mutated genes or in known cancer genes are automatically functional and, hence, not all of them play role in cancer. Thus, a functional analysis of mutations is necessary to narrow down a list of potential driver mutations.

Ranked list of cancer mutations and cancer genes

Ranking mutations by a functional impact score makes possible the determination of mutation sets that are enriched by either functional or non-functional mutations. Obviously, there is no strict value of the score that can definitely separate functional and non-functional mutations. However there is a score threshold that separates sets of likely functional and likely non-functional mutations. Using this threshold, one can assess a number of functional mutations in a given set of mutations.

Using available sequence data, the automated procedure could assess a functional impact of ∼10 K unique mutations of the total ∼10.7 K unique mutations of COSMIC database (release 49). Based on the computed scores and the optimal separation threshold ( Figure 4 ), a portion of mutations of high and medium impact can be estimated as ∼51%. A summary of functional analysis of missense mutations from COSMIC database is given in Table 1 and Figure 8 . Note significant enrichment of predicted functional mutations in recurrent mutations, cancer genes (TS or OG) and in genes with multiple mutations.

Ranking mutated genes by significance for cancer. The cancer gene ranking score (R S ), derived from information reported in the COSMIC database, is defined as RS = log 2 ( nm * nC ), wo nm is a number of unique cancer-associated mutations reported in the gene, and nC is a number of different cancer types with mutations in this gene. All analyzed 3629 genes were divided into four categories depending on presence or absence of predicted functional mutations and known association to cancer (gene is considered as cancer associated, if it is annotated as TS or OG, or it interacts with one or more of TS or OG). Cancer associated genes are enriched with predicted functional mutations ( P < 10 −20 in two-tail Fisher test) compared to genes with unknown cancer association. Using a reasonable cutoff, one nominates a list of 957 genes with significance for cancer (arrow). A gene is above the cut either because it is observed to be multiply mutated ( RS > 1, three or more mutations) or, for RS = 1 (two mutations), if at least one of the mutations in the gene is predicted as functional. Detailed statistical information on mutated genes is in Supplementary Table SM2 . The higher proportion of genes with at least one predicted functional mutation (orange or brown) in frequently mutated genes (peak at left) is not surprising—in fact, a fair number of these mutations have been functionally validated in the literature. A particularly interesting set of genes (998, bottom left) are those that (so far) have been observed just once ( RS = 0) but contain a mutation predicted to be functional. Such genes may be rare, but functionally significant, contributors to oncogenesis and are good candidates for experimental follow-up.

Ranking mutated genes by significance for cancer. The cancer gene ranking score (R S ), derived from information reported in the COSMIC database, is defined as RS = log 2 ( nm * nC ), wo nm is a number of unique cancer-associated mutations reported in the gene, and nC is a number of different cancer types with mutations in this gene. All analyzed 3629 genes were divided into four categories depending on presence or absence of predicted functional mutations and known association to cancer (gene is considered as cancer associated, if it is annotated as TS or OG, or it interacts with one or more of TS or OG). Cancer associated genes are enriched with predicted functional mutations ( P < 10 −20 in two-tail Fisher test) compared to genes with unknown cancer association. Using a reasonable cutoff, one nominates a list of 957 genes with significance for cancer (arrow). A gene is above the cut either because it is observed to be multiply mutated ( RS > 1, three or more mutations) or, for RS = 1 (two mutations), if at least one of the mutations in the gene is predicted as functional. Detailed statistical information on mutated genes is in Supplementary Table SM2 . The higher proportion of genes with at least one predicted functional mutation (orange or brown) in frequently mutated genes (peak at left) is not surprising—in fact, a fair number of these mutations have been functionally validated in the literature. A particularly interesting set of genes (998, bottom left) are those that (so far) have been observed just once ( RS = 0) but contain a mutation predicted to be functional. Such genes may be rare, but functionally significant, contributors to oncogenesis and are good candidates for experimental follow-up.

Prediction of the functional impact of mutations observed in cancer (COSMIC database a )

Mutations/Genes . All scored (taken as 100%) n . Scored (FIS ≤ 0.8) neutral impact b , n (%) . Scored (0.8 < FIS ≤ 1.9) low impact, n (%) . Scored (1.9 < FIS ≤ 3.5) medium impact, n (%) . Scored (FIS > 3.5) high impact, n (%) .
Mutations total 10 005 2049 (20) 2814 (28) 3748 (37.5) 1349 (13.5)
Mutations observed ≥2 times 1828 89 (5) 254 (14) 862 (47.2) 623 (34.1)
Mutations observed 1 time 8177 1960 (24) 2560 (31) 2886 (35.3) 771 (9.4)
Mutations in one-time-mutated genes not annotated as TS c or OG c 2324 699 (30) 777 (33) 693 (29.8) 155 (6.7)
Mutations in genes mutated ≥5 times 5174 616 (12) 1198 (23) 2314 (44.7) 1046 (20.2)
Mutations in TS or OG 4413 477 (11) 996 (23) 2000 (45.3) 940 (21.3)
Mutations in genes not annotated as TS or OG 5592 1572 (28) 1818 (33) 1748 (31.3) 454 (8.1)
Genes total d 3629 841 (23) 1115 (31) 1268 (34.9) 405 (11)
Genes annotated as TS or OG 338 50 (15) 124 (37) 92 (27.2) 72 (21)
Genes mutated ≥5 times 188 2 (1) 9 (5) 96 (51.1) 81 (43)
Mutations/Genes . All scored (taken as 100%) n . Scored (FIS ≤ 0.8) neutral impact b , n (%) . Scored (0.8 < FIS ≤ 1.9) low impact, n (%) . Scored (1.9 < FIS ≤ 3.5) medium impact, n (%) . Scored (FIS > 3.5) high impact, n (%) .
Mutations total 10 005 2049 (20) 2814 (28) 3748 (37.5) 1349 (13.5)
Mutations observed ≥2 times 1828 89 (5) 254 (14) 862 (47.2) 623 (34.1)
Mutations observed 1 time 8177 1960 (24) 2560 (31) 2886 (35.3) 771 (9.4)
Mutations in one-time-mutated genes not annotated as TS c or OG c 2324 699 (30) 777 (33) 693 (29.8) 155 (6.7)
Mutations in genes mutated ≥5 times 5174 616 (12) 1198 (23) 2314 (44.7) 1046 (20.2)
Mutations in TS or OG 4413 477 (11) 996 (23) 2000 (45.3) 940 (21.3)
Mutations in genes not annotated as TS or OG 5592 1572 (28) 1818 (33) 1748 (31.3) 454 (8.1)
Genes total d 3629 841 (23) 1115 (31) 1268 (34.9) 405 (11)
Genes annotated as TS or OG 338 50 (15) 124 (37) 92 (27.2) 72 (21)
Genes mutated ≥5 times 188 2 (1) 9 (5) 96 (51.1) 81 (43)

a Of the total 10716 missense mutations in COSMIC 45, 10 005 mutations were mapped on sequences of UniProt, and determined as unique non-synonymous.

b Approximately 50% of polymorphic variants and ∼7% of disease-associated variants got FIS score <0.8 ∼27% of polymorphic variants and ∼14% of disease-associated variants got FIS score between 0.8 and 1.9 ∼17% of polymorphic variants and ∼50% of disease-associated variants got FIS score between 1.9 and 3.5 ∼21% of polymorphic variants and ∼79% of disease-associated variants got FIS score >1.9 ∼3% of polymorphic variants and ∼30% of disease-associated variants got FIS score >3.5.

c TS and OG stand, respectively, for tumor suppressor and oncogene.

d A gene is scored according to the highest FIS bin of any of its mutations.

Prediction of the functional impact of mutations observed in cancer (COSMIC database a )

Mutations/Genes . All scored (taken as 100%) n . Scored (FIS ≤ 0.8) neutral impact b , n (%) . Scored (0.8 < FIS ≤ 1.9) low impact, n (%) . Scored (1.9 < FIS ≤ 3.5) medium impact, n (%) . Scored (FIS > 3.5) high impact, n (%) .
Mutations total 10 005 2049 (20) 2814 (28) 3748 (37.5) 1349 (13.5)
Mutations observed ≥2 times 1828 89 (5) 254 (14) 862 (47.2) 623 (34.1)
Mutations observed 1 time 8177 1960 (24) 2560 (31) 2886 (35.3) 771 (9.4)
Mutations in one-time-mutated genes not annotated as TS c or OG c 2324 699 (30) 777 (33) 693 (29.8) 155 (6.7)
Mutations in genes mutated ≥5 times 5174 616 (12) 1198 (23) 2314 (44.7) 1046 (20.2)
Mutations in TS or OG 4413 477 (11) 996 (23) 2000 (45.3) 940 (21.3)
Mutations in genes not annotated as TS or OG 5592 1572 (28) 1818 (33) 1748 (31.3) 454 (8.1)
Genes total d 3629 841 (23) 1115 (31) 1268 (34.9) 405 (11)
Genes annotated as TS or OG 338 50 (15) 124 (37) 92 (27.2) 72 (21)
Genes mutated ≥5 times 188 2 (1) 9 (5) 96 (51.1) 81 (43)
Mutations/Genes . All scored (taken as 100%) n . Scored (FIS ≤ 0.8) neutral impact b , n (%) . Scored (0.8 < FIS ≤ 1.9) low impact, n (%) . Scored (1.9 < FIS ≤ 3.5) medium impact, n (%) . Scored (FIS > 3.5) high impact, n (%) .
Mutations total 10 005 2049 (20) 2814 (28) 3748 (37.5) 1349 (13.5)
Mutations observed ≥2 times 1828 89 (5) 254 (14) 862 (47.2) 623 (34.1)
Mutations observed 1 time 8177 1960 (24) 2560 (31) 2886 (35.3) 771 (9.4)
Mutations in one-time-mutated genes not annotated as TS c or OG c 2324 699 (30) 777 (33) 693 (29.8) 155 (6.7)
Mutations in genes mutated ≥5 times 5174 616 (12) 1198 (23) 2314 (44.7) 1046 (20.2)
Mutations in TS or OG 4413 477 (11) 996 (23) 2000 (45.3) 940 (21.3)
Mutations in genes not annotated as TS or OG 5592 1572 (28) 1818 (33) 1748 (31.3) 454 (8.1)
Genes total d 3629 841 (23) 1115 (31) 1268 (34.9) 405 (11)
Genes annotated as TS or OG 338 50 (15) 124 (37) 92 (27.2) 72 (21)
Genes mutated ≥5 times 188 2 (1) 9 (5) 96 (51.1) 81 (43)

a Of the total 10716 missense mutations in COSMIC 45, 10 005 mutations were mapped on sequences of UniProt, and determined as unique non-synonymous.

b Approximately 50% of polymorphic variants and ∼7% of disease-associated variants got FIS score <0.8 ∼27% of polymorphic variants and ∼14% of disease-associated variants got FIS score between 0.8 and 1.9 ∼17% of polymorphic variants and ∼50% of disease-associated variants got FIS score between 1.9 and 3.5 ∼21% of polymorphic variants and ∼79% of disease-associated variants got FIS score >1.9 ∼3% of polymorphic variants and ∼30% of disease-associated variants got FIS score >3.5.

c TS and OG stand, respectively, for tumor suppressor and oncogene.

d A gene is scored according to the highest FIS bin of any of its mutations.

In Supplementary Table SM1 , we present a list of COSMIC mutations (10 005) for which the functional impact score was computed. For each of the mutations, the table provides its sequence and genomic coordinates, the functional impact characteristics of the mutation, the characteristics of the protein domain family, the statistics of cancer mutations in a gene and the basic oncogenic annotations, the URL links presenting mutation in context of MSA and homologous 3D structures of PDB.

We used our assessments of mutation impact to rank genes by their significance for cancer. To that end, we divided all genes into four categories taking into account the presence or absence of predicted functional mutations in a gene and gene’s known associations with cancer. Genes annotated as TS or OG and genes interacting with TS or OG genes were defined as associated with cancer gene interactions were taken from the PIANA database ( 58 ) cancer annotations were taken from the Cancer Gene resource at MSKCC ( 57 ).

Genes were classified into the following categories: (i) genes with functional mutations and known cancer association (ii) genes with functional mutations and no available associations with cancer (iii) genes with no functional mutations and with known cancer association and (iv) genes with no functional mutations and no available associations with cancer. It is reasonable to assume that the more unique mutations are detected in a gene, and the more cancer types are affected by these mutations, the more important this gene is for development of cancer. Therefore we used as a gene ranking score the product of the ‘number of unique mutations’ and the ‘number of different cancer types’ affected by these mutations. Note that truncating mutations, i.e. premature stop codons (so-called non-sense mutations) are not taken into account.

The ranked list of 3629 genes is given in Supplementary Table SM2 . Distributions of the gene ranking scores are in Figure 8 . Genes with multiple mutations and genes with cancer associations are at the top of the list. Based on this ranking, we nominated ∼957 genes as genes with very likely cancer implications ( Figure 8 ). These genes are of primary interest for experimental cancer genomics projects. The specific oncogenic roles of many of the top-scoring mutated genes are known or being studied. However, there are many genes of ‘moderate significance’, i.e. mutated approximately two times in approximately two cancers, for which the specific oncogenic roles in cancer is not yet well determined. A particularly interesting set of genes ( Figure 8 , bottom left) are those that have been observed just once, as reported in the COSMIC database, but contain a mutation predicted to be functional. Such genes may be rare, but functionally significant, contributors to oncogenesis and are good candidates for experimental follow-up.

Switch-of-function: a new type of functional impact?

The effect of a functional mutation can be described as a change of the specificity (selectivity) of interactions between a mutated protein and its specific interactors—proteins, nucleic acids or small molecules. One can imagine a set of free energies of interactions between a given protein and all other proteins and ligands. As a result of a mutation, the native spectrum of the binding free energies will change. An extreme example of a strong functional impact of a mutation is a destabilization of a protein globule resulting in the complete loss of the specificity, i.e. a ‘loss of function’ (LOF). The opposite example of a functional impact is a ‘gain of function’ (GOF), which can result from a change in the specificity of particular protein-substrate interactions or a change in the specificity of interactions with regulatory proteins. Both LOF and GOF mutations assume changes of free energies of interaction with einheimisch binders.

However, a mutation impact can also result in a ‘switch of function’ (SOF), which is an acquisition of new specific interactors and, consequently, a new biological function. A mutation in a protein-binding site can result in new specific interactions. One mutation in a binding site of isocitrate dehydrogenase 1 (IDH1) that resulted in a switch of molecular function was recently discovered in glioma ( 44 ). Mutations of R132 to C, H, L or S alter the activity of IDH1, such that isocitrate is no longer converted to alpha-ketoglutarate, but, instead, alpha-ketoglutarate is converted to R(-)-2-hydroxyglutarate, which elevates the risk of brain tumors ( 44 ). The affected position, R132 is highly conserved in the protein family alignment and all the above mutations get a high FIS score.

In cells, there are many families of homologous proteins (and protein domains) each protein in such a family has its own specific function and specific interactors. Mutations can switch the specific interaction between a protein family members resulting in a drastic impact on the phenotype. Mutations in evolutionarily selected specificity residues are likely candidates for SOF. Switch of the specific signaling of Rho GTPases caused by mutations was studied experimentally Heo and Meyer ( 59 ). All of the experimentally studied functional mutations reported in ( 59 ) have a high specificity component of the FIS score. In Figure 9 , we show the multiple sequence alignment and the 3D position of one the key mutations that switch the Rac1-signaling phenotype (lamellipodia) to the Cdc42-signaling phenotype (filopodia) ( 59 ). This mutation affects one of the key predicted specificity positions of Rho family.

Functional mutation in a predicted specificity position of RAC1 (Ras-related C3 botulinum toxin substrate 1). ( EIN ) The mutation affects a residue that is conserved as A (Ala) in subfamily #1 (top sequences, close homologues of RAC1) and as E (Glu) in subfamily #2 (bottom sequences, close homologues of CDC42) Uniprot name, species identifier, residues number range and subfamily number are in left columns. The sequence subfamilies and specificity scores (vertical bars at top) were computed from a non-redundant MSA (multiple sequence alignment) of 274 sequences using CEO clustering. The mutation A95E of RAC1 has a high specificity score in RAC1. ( B ) The position affected by the mutation is in the binding interface of RAC1 in contact with the T-lymphoma invasion and metastasis factor 1 (Tiam1) (PDB code 1foe).

Functional mutation in a predicted specificity position of RAC1 (Ras-related C3 botulinum toxin substrate 1). ( EIN ) The mutation affects a residue that is conserved as A (Ala) in subfamily #1 (top sequences, close homologues of RAC1) and as E (Glu) in subfamily #2 (bottom sequences, close homologues of CDC42) Uniprot name, species identifier, residues number range and subfamily number are in left columns. The sequence subfamilies and specificity scores (vertical bars at top) were computed from a non-redundant MSA (multiple sequence alignment) of 274 sequences using CEO clustering. The mutation A95E of RAC1 has a high specificity score in RAC1. ( B ) The position affected by the mutation is in the binding interface of RAC1 in contact with the T-lymphoma invasion and metastasis factor 1 (Tiam1) (PDB code 1foe).

The mutation-caused rewiring of protein interaction network is of the high interest in cancer, where missense mutations are one of the common factors of oncogenesis. Currently, it is impossible to determine such mutations by direct de novo modeling. However, one can narrow down a list of potential SOF mutations by determining mutations in binding sites that change the identity of an amino acid residue located in one of the functional evolutionarily selected (predicted specificity) positions, and, especially by determining mutations that change amino acid identities between already existing groups (classes) of residue specificity. We estimated a number of such mutations by identifying mutations that fall into binding sites and that have high specificity score and low conservation score. Among ∼10 K mutations of COSMIC, 3631 affect annotated functional regions and binding sites, and, among those, 554 mutations (∼5%) have a specificity score >2.5 (top 25%) and a conservation score less than the specificity score. This set of mutations is enriched in potential SOF mutations. A few examples of putative SOF mutation are given in Supplementary Data S5 .


Identifying the mutations

Figure 7: Identifying
sequence mutations. Click to
enlarge image

Using the worksheets, the students will compare a section of DNA sequence from a healthy cell and a tumour cell from the same patient. The easiest way to identify whether a mutation has occurred is to write the DNA sequence below the coloured peaks (there is a colour key on the sheet to help) and to compare the written sequences.

If one of the letters is different (a peak has changed colour), this indicates a mutation in the sequence. In Figure 7 (right), the A in the DNA sequence from the healthy cell has been replaced by G in the tumour cell.


Figure 9: Ticking off the gene
regions that have been
checked and marking any
Mutationen

Image courtesy of the
Wellcome Trust Sanger Institute
Communication and Public
Engagement team

Figure 8: A heterozygous
Mutation. Click to enlarge
image

Images courtesy of the
Wellcome Trust Sanger Institute
Communication and Public
Engagement team

If the students find a double peak at one base position, this should be recorded with the two alternative bases at that position, one above the other. In Figure 8, the healthy DNA sequence has a G, whereas the tumour sequence has both G and C. This is not an insertion: it represents a heterozygous mutation where only one copy of the gene has substituted a C for a G. In this case the tumour sequence has replaced G with a C.

All students should indicate the gene regions they have checked by ticking off the relevant region on the gene sheet (see Figure 9).

Students who find a mutation should indicate the specific base by circling it on the gene sheet (see Figure 9, left) and make a note of which codon this lies in (in this example, codon 12).

They should also fill in the table at the base of the worksheet, using the codon wheel to translate the DNA sequence into the amino acid, as shown in Table 1:

Table1: Mutations as listed on th individual worksheets
Amino acid number Healthy cell DNA sequence Tumour cell DNA sequence Healthy cell amino acid Tumour cell amino acid
12 GGT GTT Glycine (G) Valine (V)

When all mutations have been found, record them on the summary data sheet (see Table 2).

Table 2: Mutations as recorded on the summary data sheet
Amino acid number Healthy cell DNA sequence Tumour cell DNA sequence Healthy cell amino acid Tumour cell amino acid
12 GGT G T T G (glycine) V (valine)
13 GGC G A C G (glycine) D (aspartic acid)
30 GAC GA T D (aspartic acid) D (aspartic acid)
61 CAA C G A Q (glutamine) R (arginine)
146 GCA C CA A (alanine) P (proline)
173 GAT GA C D (aspartic acid) D (aspartic acid)

Discussing the results

The results above are all single base substitutions. These mutations within the protein-coding region of the KRAS gene may be classified into one of three types, depending on the information encoded by the altered codon.

  • Silent mutations code for the same amino acid.
  • Missense mutations code for a different amino acid.
  • Nonsense mutations code for a stop and can truncate the protein.

Discuss whether the mutations are significant – will they have an impact on protein function or are they ‘silent’? In this activity, codons 30 and 173 are silent and therefore do not have a functional impact.

Table 3: Type of mutation, as recorded onthe summary data sheet
Amino acid number Healthy cell DNA sequence Tumour cell DNA sequence Healthy cell amino acid Tumour cell amino acid Type of Mutation Significant yes / no
12 GGT G T T G (glycine) V (valine) Point (missense) yes
13 GGC G A C G (glycine) D (aspartic acid) Point (missense) yes
30 GAC GA T D (aspartic acid) D (aspartic acid) Point (silent) Nein
61 CAA C G A Q (glutamine) R (arginine) Point (missense) yes
146 GCA C CA A (alanine) P (proline) Point (missense) yes
173 GAT GA C D (aspartic acid) D (aspartic acid) Point (silent) Nein


Figure 10: A 3D
representation of the KRAS
Protein. Amino acids 12
(blue), 13 (yellow), 61
(orange) and 146 (pink) are
those which carry mutations

Image courtesy of the
Wellcome Trust Sanger Institute
Communication and Public
Engagement team, created with
RasMol

The presentation has a 3D space-fill image of the KRAS protein (Figure 10, right) slides 26–30 show where on the protein the significant mutations are, and you will notice they are all in the same region. Codons 12, 13 and 61 were the first mutations to be associated with oncogenic transformation in the KRAS protein mutation 146 was only discovered in 2005. Use these slides to discuss the impact that the mutations could have on protein structure and KRAS’s function in growth signalling.

As an optional activity, the students can use RasMol, the molecular modelling software used to create the images on slides 26–30, to highlight the mutated amino acids in the protein structure. See the teacher notes w6 for details.


Schau das Video: Mutations Updated (Oktober 2022).