Information

Einfache Herleitung der Kimura-Approximation für die Wahrscheinlichkeit der Fixierung einer Mutation

Einfache Herleitung der Kimura-Approximation für die Wahrscheinlichkeit der Fixierung einer Mutation


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Kimuras Approximation für die Wahrscheinlichkeit der Fixierung einer Mutation unter Selektion findet bis heute immer wieder Verwendung in Populationsgenetikmodellen. Ich versuche, die mathematische Grundlage dieser Gleichung zu verstehen, aber keines der Lehrbücher oder Online-Ressourcen, die ich überprüft habe, bietet eine einfache Ableitung dieser Näherung, sondern zitiere einfach Kimuras Aufsatz von 1962.

$$P_ ext{fix} approx frac{1-e^{-4Nsp} }{1-e^{-4Ns}} qquad (1)$$

Ich habe also das Originalpapier gelesen, aber die angegebene Herleitung scheint mir nicht klar zu sein.


Einzelheiten

Kimura beginnt mit der Definition der Wahrscheinlichkeit einer Änderung der Allelfrequenz als:

$$u(p,t+delta t) = int f(p+delta p; delta t) u(p+delta p,t) d(delta p) qquad (2)$$

wo (genau zitiert)

  • $u(p,t)$ ist die Wahrscheinlichkeit, dass ein Allel in einem Zeitintervall $t$ fixiert wird, wenn seine Anfangshäufigkeit $p$ ist.
  • $f(p+delta p; delta t)$ ist die Wahrscheinlichkeitsdichte der Änderung von $p$ auf $p+delta p$


Dann verwendet er Taylor-Reihen-Approximation, um eine Gleichung dieser Form zu erhalten:

$$frac{partial u(p,t)}{partial t}=frac{V}{2}frac{partial^2u}{partial p^2}+Mfrac{partial u}{partial p} qquad (3)$$

Er definiert $M$ und $V$ als Mittelwert und Varianz der Veränderung von $p$ pro Generation. Diese sind formal definiert als:

$$M=lim_{delta t o 0}frac{1}{delta t}int (delta p). f(p+delta p; delta t). d(delta p)$$

$$V=lim_{delta t o 0}frac{1}{delta t}int (delta p)^2. f(p+delta p; delta t). d( delta p)$$

($V$ sollte laut mathematischer Definition eigentlich nur der zweite Moment sein und nicht Varianz)

Dann löst er Gleichung 3 im stationären Zustand mit den Randbedingungen $u(0,t)=0$ und $u(1,t)=1$, um folgendes zu erhalten:

$$u(p)=frac{displaystyleint_0 ^p G(x) dx}{displaystyleint_0 ^1 G(x) dx} qquad (4)$$

wo:

$$G(x)=expleft(-int frac{2M}{V}dx ight)$$

Die Herleitung habe ich bis hierhin verstanden.

Dann schreibt er einfach:

$$M=sx(1-x)$$ $$V=x(1-x)/2N$$

und erhält Gleichung 1.


Zusamenfassend

Gibt es eine einfache Herleitung für Gleichung 1?
Wenn nicht, kann mir jemand erklären, wie M und V wie oben angenähert wurden?


Vermutlich haben Sie dies gelöst, aber falls nicht, liegt es daran, dass die PDE eine Kolmogorov-Rückwärtsgleichung ist, sodass die Koeffizienten erster und zweiter Ordnung der Mittelwert und die Varianz des zugrunde liegenden stochastischen Prozesses sind, der modelliert wird.

Betrachten Sie im Detail eine stochastische Differentialgleichung (deren Lösung durch einen Ito-Diffusionsprozess gegeben ist): $$ dp_t = mu(p_t,t) dt + sigma(p_t,t) dW_t $$ dann gilt folgendes System (unter bestimmten Bedingungen): $$ -frac{partial}{partial t} u(p,t) = mu(p,t)frac{partial}{partial p}u(p,t) + frac{1 }{2}sigma^2(p,t)frac{partial^2}{partial p^2} u(p,t) $$ wo $u$ ist die Dichte von $p$ bei $t$.

Beachten Sie, dass die Drift (unendlicher Mittelwert) $M=mu(p,t)$ und Diffusionskoeffizient (unendliche Varianz) $V=sigma^2(p,t)$ sind wie im Papier (bis auf das negative Vorzeichen, das ich für vernachlässigbar halte, da es ihm meistens nur um den Fall zu gehen scheint, wenn $partial_t uapprox 0$ ohnehin). Tatsächlich sind sie äquivalent geschrieben: egin{align} mu(p,t) &= lim_{delta t ightarrow 0}frac{1}{delta t} mathbb{E}left[ p_{t + delta t} - p_t mid p_t=p ight] =: M sigma^2(p,t) &= lim_{delta t ightarrow 0}frac{1}{delta t} mathbb{E }left[ (p_{t + delta t} - p_t)^2 mid p_t=p ight] =: V end{align} wie Kimura schreibt.

Beachten Sie, dass eine nützliche Näherung der Übergangsdichte gegeben ist durch: $$ mathbb{P}[p_{t+delta t} mid p_t] approx mathcal{N}(p_{t+delta t}mid p_t + mu(p_t,t),delta t , sigma^2(p_t,t) ,delta t) ag{TD} $$

Ok, alles oben ist nur die grundlegende Theorie stochastischer Prozesse. Wenn wir also ein stochastisches Modell für die Populationsdynamik haben, können wir Werte für $M$ und $V$ daraus (durch Berechnen seiner Momente), und diese werden auf die rückwärts gerichtete Kolmogorov-Gleichung übertragen, auf der Kimuras Arbeit beruht.

Hier zeigt sich meine Unkenntnis der Bevölkerungsdynamik. Da Kimura jedoch Fisher und Wright erwähnt, habe ich das Wright-Fisher-Modell nachgeschlagen. Es scheint, als ob Kimura die Diffusionsprozess-Approximation des Wright-Fisher-Modells verwendet. Dies scheint ein gut untersuchtes und vielschichtiges Modell zu sein, das ich hier nicht vollständig beschreiben kann; stattdessen fand ich die Arbeit von Tataru et al., Statistische Inferenz im Wright-Fisher-Modell unter Verwendung von Allelfrequenzdaten eine ausgezeichnete Beschreibung davon zu sein, obwohl ich nicht vorgebe, viel davon zu verstehen.

Wichtig ist jedoch, dass die Veränderung der Gene (Übergangsdichte) durch eine Binomialverteilung beschrieben werden kann. Dies kann durch eine Normalverteilung angenähert werden: $$ mathbb{P}[p_{t+delta t} mid p_t] approx mathcal{N}(p_{t+delta t}mid p_t + a(p_t) delta t,, p_t ( 1-p_t) delta t ) $$ unter Verwendung der Standard-Approximation an das Binomial. Das gibt uns dann a nach vorne Kolomogorov-Gleichung (nicht rückwärts) geschrieben: $$ frac{partial}{partial t} u = - frac{partial}{partial p}left[a(p_t) u(p_t) ight] + frac{1}{2} frac{partial^2}{partial p^2} left[ p_t(1-p_t)u(p_t) ight] $$ Dies impliziert im Grunde, dass $V=p(1-p)$.

( Mir ist aufgefallen, dass eine andere Möglichkeit, dies zu beweisen, darin besteht, zu bemerken, dass die Wright-Fisher ungefähre Verbreitung (ohne Auswahl usw.) $aäquivalent 0$) hat einen infinitesimalen Generator, der gegeben ist durch: $ mathfrak{G} f(p) = p(1-p)partial_{tt} f(p) / 2 $. Dies impliziert sofort $V=p(1-p)$. Aber vielleicht weniger einfach zu verstehen. )

Verwirrenderweise hat das Papier jedoch die Zeitskalen (Variablen) geändert, so dass $delta t leftarrow Delta t / (2N)$, und dann einstellen $delta t$ zu $1$ (wahrscheinlich damit sie nicht schreiben müssten $2N$ überall, überallhin, allerorts). Wenn wir diese Transformation rückgängig machen, erhalten wir $$ mathbb{P}[p_{t+delta t} mid p_t] approx mathcal{N}(p_{t+delta t}mid p_t + a(p_t) delta t,, p_t ( 1-p_t) delta t/(2N) ) $$ Wenn Sie dies mit unserer obigen ungefähren Übergangsdichte (Gleichung (TD)) vergleichen, werden Sie sehen, dass dies Folgendes impliziert: $$ sigma^2 = V = p(1-p)/[2N] $$ wie gewünscht.

Was ist nun der infinitesimale Mittelwert, d.h. $a$ oder $M$? Dies hängt eindeutig vom Auswahlmodell ab, da es steuert, wie sich die "Umgebung" deterministisch auf den Prozess auswirkt. Kimura beschreibt dies als „konstanten Selektionsvorteil“ mit Koeffizient $s$. Das Tataru-Papier stellt fest, dass die Diffusionsnäherung an Wright-Fisher unter genetischer Drift, Mutation und Selektion gegeben ist durch: $$ a(p) = - u p + xi(1-p) + 2N au p(1-p)[h-(1-2h)p] $$ Wenn wir (1) die Mutation ignorieren, indem wir $ u=xi=0$, (2) entfernen allelische Dominanzeffekte durch Einstellung $h=1/2$, und (3) definieren $s:= N au$, wir bekommen: $$ a(p) = s p(1-p) =: M $$ was wir natürlich sehen, indem wir notieren $M=a(p)$ Streichhölzer $mu$ in der Gleichung (TD) oben. (Notiere dass der $2N$ Transformation fand auch hier statt, aber sie war im Inneren verborgen $s$).

Somit haben wir abgeleitet, wo Kimuras $M$ und $V$ stammen, wenn auch wahrscheinlich nicht auf die einfachste Weise.

Es bleibt nur noch die (stationäre) Gleichung für $u$. Ich denke, ich werde es der Vollständigkeit halber tun.

Wenn wir die stationären Indizes ignorieren, erhalten wir: egin{align} G(x) &= expleft( -int frac{2M}{V} dx ight) = expleft( -int 4sN dx ight) = expleft ( -4sNx ight) [0.15cm] u(p) &= frac{displaystyle int_0^p G(x) dx}{displaystyle int_0^1 G(x) dx} = frac{ displaystyle frac{1}{4Ns}left[ expleft( -4sNx ight) ight]_0^p}{displaystyle frac{1}{4Ns}left[ expleft( - 4sNx ight) ight]_0^1} = frac{displaystyle -left[ expleft( -4sNp ight) - 1 ight]}{displaystyle -left[ expleft( - 4sN ight) -1 ight]} &= frac{1 - exp(-4Nsp)}{1 - exp(-4Ns)} end{align} nach Bedarf.


Entschuldigung für eventuelle Fehler. (Ich bin weder ein Bevölkerungsdynamikmodellierer noch ein Mathematiker, also weisen Sie bitte auf Probleme hin).


Schau das Video: Newtonverfahren, Newtonsches Näherungsverfahren, Gleichungen lösen. Mathe by Daniel Jung (Dezember 2022).