Die Leistungsfähigkeit von Zwillingsdesigns ergibt sich aus der Tatsache, dass Zwillinge entweder eineiig sein können (identisch (MZ): Entwicklung aus einer einzigen befruchteten Eizelle und daher gemeinsame Nutzung aller ihrer Allele) – oder zweieiig (DZ: Entwicklung aus zwei befruchteten Eizellen und daher gemeinsame Nutzung von durchschnittlich 50% ihrer polymorphen Allele, das gleiche Maß an genetischer Ähnlichkeit wie bei Nicht-Zwillingsgeschwistern). Diese bekannten Unterschiede in der genetischen Ähnlichkeit, zusammen mit einer testbaren Annahme gleicher Umgebungen für identische und brüderliche Zwillinge, bilden die Grundlage für das Zwillingsdesign zur Untersuchung der Auswirkungen genetischer und umweltbedingter Varianz auf einen Phänotyp.
Die grundlegende Logik der Zwillingsstudie kann mit sehr wenig Mathematik über ein Verständnis der Varianzkonzepte und der daraus abgeleiteten Korrelation hinaus verstanden werden.
Klassische Zwillingsmethodebearbeiten
Wie jede verhaltensgenetische Forschung beginnt die klassische Zwillingsstudie mit der Bewertung der Varianz eines Verhaltens (von Genetikern als Phänotyp bezeichnet) in einer großen Gruppe und versucht abzuschätzen, wie viel davon auf Folgendes zurückzuführen ist:
- genetische Effekte (Erblichkeit);
- gemeinsame Umgebung – Ereignisse, die beiden Zwillingen passieren und sie auf die gleiche Weise betreffen;
- nicht geteilt oder einzigartig oder nicht geteilt umwelt – Ereignisse, die bei einem Zwilling auftreten, aber nicht bei dem anderen, oder Ereignisse, die einen Zwilling auf andere Weise betreffen.
Typischerweise werden diese drei Komponenten A (additive Genetik), C (common Environment) und E (unique environment) genannt; daher das Akronym ACE. Es ist auch möglich, nicht-additive genetische Effekte zu untersuchen (oft als D für Dominanz bezeichnet (ADE-Modell); siehe unten für komplexere Zwillingsdesigns).
Das ACE-Modell gibt an, welcher Anteil der Varianz in einem Merkmal vererbbar ist, im Vergleich zum Anteil aufgrund der gemeinsamen Umgebung oder der nicht gemeinsamen Umgebung. Die Forschung wird mit SEM-Programmen wie OpenMx durchgeführt, Die Kernlogik des Zwillingsdesigns ist jedoch dieselbe, wie unten beschrieben:
Eineiige (identische – MZ) Zwillinge, die in einer Familie aufgewachsen sind, teilen sowohl 100% ihrer Gene als auch die gesamte gemeinsame Umgebung. Alle Unterschiede, die sich unter diesen Umständen zwischen ihnen ergeben, sind zufällig (eindeutig). Die Korrelation zwischen eineiigen Zwillingen liefert eine Schätzung von A + C. Zweieiige (DZ) Zwillinge teilen auch C, teilen aber im Durchschnitt 50% ihrer Gene: Die Korrelation zwischen zweieiigen Zwillingen ist also eine direkte Schätzung von ½A + C. Wenn r Korrelation ist, dann sind rmz und rdz einfach die Korrelationen des Merkmals bei identischen bzw. zweieiigen Zwillingen. Für ein bestimmtes Merkmal, dann:
rmz = A + C rdz = ½A + C
A ist daher der doppelte Unterschied zwischen identischen und brüderlichen Zwillingskorrelationen : der additive genetische Effekt (Falknerformel). C ist einfach die MZ-Korrelation minus dieser Schätzung von A. Der zufällige (eindeutige) Faktor E ist 1 − rmz: dh MZ-Zwillinge unterscheiden sich nur aufgrund einzigartiger Umgebungen. (Jinks & Fulker, 1970; Plomin, DeFries, McClearn, & McGuffin, 2001).
Die Differenz zwischen diesen beiden Summen erlaubt es uns also, nach A, C und E zu lösen. Da die Differenz zwischen den identischen und brüderlichen Korrelationen vollständig auf eine Halbierung der genetischen Ähnlichkeit zurückzuführen ist, ist der additive genetische Effekt ‚A‘ einfach doppelt so groß wie die Differenz zwischen den identischen und brüderlichen Korrelationen:
A = 2 (rmz − rdz)
Da die identische Korrelation die volle Wirkung von A und C widerspiegelt, kann E geschätzt werden, indem diese Korrelation von 1 subtrahiert wird
E = 1 – rmz
:
C = rmz − A
Moderne Modellierungbearbeiten
Ab den 1970er Jahren wechselte die Forschung zur Modellierung genetischer Umweltauswirkungen mit Maximum-Likelihood-Methoden (Martin & Eaves, 1977). Obwohl rechnerisch viel komplexer, hat dieser Ansatz zahlreiche Vorteile, die ihn in der aktuellen Forschung nahezu universell machen.
Ein beispielhaftes Strukturmodell (für die Erblichkeit der Körpergröße bei dänischen Männern) wird gezeigt:
A: ACE-Modell mit rohen (nicht standardisierten) Varianzkoeffizienten |
B: ACE-Modell mit standardisierten Varianzkoeffizienten |
Modell A auf der linken Seite zeigt die rohe Varianz in der Höhe. Dies ist nützlich, da die absoluten Auswirkungen von Genen und Umgebungen erhalten bleiben, und drückt diese in natürlichen Einheiten aus, wie mm der Höhenänderung. Manchmal ist es hilfreich, die Parameter zu standardisieren, sodass jeder Parameter als Prozentsatz der Gesamtvarianz ausgedrückt wird. Da wir die Varianz in A, C und E zerlegt haben, ist die Gesamtvarianz einfach A + C + E. Wir können dann jeden der einzelnen Parameter als Anteil dieser Summe skalieren, dh A–A = A / (A + C + E). Erblichkeit ist der standardisierte genetische Effekt.
Modellvergleichbearbeiten
Ein Hauptvorteil der Modellierung ist die Möglichkeit, Modelle explizit zu vergleichen: Anstatt einfach einen Wert für jede Komponente zurückzugeben, kann der Modellierer Konfidenzintervalle für Parameter berechnen, aber vor allem Pfade löschen und hinzufügen und den Effekt über Statistiken wie den AIC testen. So kann beispielsweise ein AE-Modell objektiv mit einem vollständigen ACE-Modell verglichen werden, um vorhergesagte Auswirkungen der Familie oder der gemeinsamen Umgebung auf das Verhalten zu testen. Zum Beispiel können wir die obige Abbildung nach der Höhe fragen: Kann C (Shared Environment) ohne signifikanten Anpassungsverlust fallen gelassen werden? Alternativ können Konfidenzintervalle für jeden Pfad berechnet werden.
Multigruppen- und multivariate Modellierungbearbeiten
Multivariate Modellierung kann Antworten auf Fragen zur genetischen Beziehung zwischen Variablen geben, die unabhängig erscheinen. Zum Beispiel: Teilen IQ und Langzeitgedächtnis Gene? Teilen sie ökologische Ursachen? Weitere Vorteile sind die Fähigkeit, mit Intervall-, Schwellen- und kontinuierlichen Daten umzugehen, vollständige Informationen aus Daten mit fehlenden Werten beizubehalten, die latente Modellierung mit Messgrößen zu integrieren, seien es gemessene Umgebungen oder jetzt gemessene molekulargenetische Marker wie SNPs. Darüber hinaus vermeiden Modelle Einschränkungsprobleme bei der Rohkorrelationsmethode: Alle Parameter liegen, wie sie sollten, zwischen 0 und 1 (standardisiert).Multivariate und Mehrzeit-Wellenstudien mit gemessener Umgebung und wiederholten Messungen potenziell kausaler Verhaltensweisen sind heute die Norm. Beispiele für diese Modelle sind erweiterte Zwillingsdesigns, Simplexmodelle und Wachstumskurvenmodelle.
SEM-Programme wie OpenMx und andere Anwendungen, die für Einschränkungen und mehrere Gruppen geeignet sind, haben die neuen Techniken für einigermaßen qualifizierte Benutzer zugänglich gemacht.
Modellierung der Umgebung: MZ discordant designsEdit
Da MZ-Zwillinge sowohl ihre Gene als auch ihre familiären Umweltfaktoren teilen, spiegeln alle Unterschiede zwischen MZ-Zwillingen E: die einzigartige Umgebung wider. Forscher können diese Informationen verwenden, um die Umwelt auf leistungsfähige Weise zu verstehen, was epidemiologische Tests der Kausalität ermöglicht, die sonst typischerweise durch Faktoren wie Gen-Umwelt-Kovarianz, umgekehrte Kausalität und Verwechslung verwechselt werden.
Ein Beispiel für einen positiven MZ-diskordanten Effekt ist unten links dargestellt. Der Zwilling, der bei Merkmal 1 eine höhere Punktzahl erzielt, erzielt auch bei Merkmal 2 eine höhere Punktzahl. Dies ist kompatibel mit einer „Dosis“ von Merkmal 1, die eine Zunahme von Merkmal 2 verursacht. Natürlich könnte Merkmal 2 auch Merkmal 1 beeinflussen. Die Entwirrung dieser beiden Möglichkeiten erfordert ein anderes Design (siehe unten für ein Beispiel). Ein Nullergebnis ist mit einer Kausalhypothese unvereinbar.
Eine Darstellung von MZ-Diskordanzdaten |
MZ diskordanter Test der Hypothese, dass Bewegung vor Depressionen schützt |
Nehmen wir zum Beispiel den Fall eines beobachteten Zusammenhangs zwischen Depression und Bewegung (siehe Abbildung oben rechts). Menschen, die depressiv sind, berichten auch von wenig körperlicher Aktivität. Man könnte vermuten, dass dies ein kausaler Zusammenhang ist: Dass die „Dosierung“ von Patienten mit Bewegung ihre Stimmung heben und vor Depressionen schützen würde. Die nächste Abbildung zeigt, was empirische Tests dieser Hypothese ergeben haben: ein Null-Ergebnis.
Longitudinal discordance designs
Ein querverzögertes longitudinales MZ discordant Twin Design. Dieses Modell kann Beziehungen zwischen Unterschieden zwischen Merkmalen zum ersten Zeitpunkt berücksichtigen und dann die unterschiedlichen Hypothesen untersuchen, dass Inkremente in Merkmal1 eine spätere Änderung dieses Merkmals in der Zukunft oder, was wichtig ist, in anderen Merkmalen bewirken.
Wie in der nächsten Abbildung zu sehen ist, kann dieses Design auf mehrere Messungen ausgedehnt werden, wodurch die Arten von Informationen, die man lernen kann, zunehmen. Dies wird als Cross-Lagged-Modell bezeichnet (mehrere Merkmale, die über mehr als eine Zeit gemessen wurden).
Im longitudinalen Diskordanzmodell können Unterschiede zwischen eineiigen Zwillingen verwendet werden, um Beziehungen zwischen Unterschieden zwischen Merkmalen zum Zeitpunkt eins (Pfad A) zu berücksichtigen und dann die unterschiedlichen Hypothesen zu untersuchen, dass Inkremente in Merkmal1 eine spätere Änderung dieses Merkmals in der Zukunft bewirken (Pfade B und E) oder, was wichtig ist, in anderen Merkmalen (Pfade C & D). Im Beispiel kann die Hypothese getestet werden, dass die beobachtete Korrelation, bei der depressive Personen häufig auch weniger als durchschnittlich trainieren, kausal ist. Wenn Bewegung vor Depressionen schützt, sollte Pfad D signifikant sein, wobei ein Zwilling, der mehr trainiert, weniger Depressionen als Folge zeigt.
Annahmenbearbeiten
Wie aus der obigen Modellierung hervorgeht, ist die Hauptannahme der Zwillingsstudie die gleiche Umgebung, auch bekannt als die Annahme gleicher Umgebungen. Diese Annahme wurde direkt getestet. Ein besonderer Fall tritt auf, wenn Eltern glauben, dass ihre Zwillinge nicht identisch sind, obwohl sie tatsächlich genetisch identisch sind. Studien zu einer Reihe psychologischer Merkmale zeigen, dass diese Kinder genauso übereinstimmend bleiben wie MZ-Zwillinge, die von Eltern aufgezogen wurden, die sie als identisch behandelten.
Molekulargenetische Methoden der Heritabilitätsschätzung haben tendenziell niedrigere Schätzungen als klassische Zwillingsstudien erbracht, was den Nachweis erbringt, dass die Annahme des klassischen Zwillingsdesigns für die Gleichbehandlung möglicherweise nicht stichhaltig ist. Eine Studie aus dem Jahr 2016 ergab, dass die Annahme, dass die pränatale Umgebung von Zwillingen gleich war, weitgehend haltbar war. Die Forscher diskutieren weiterhin, ob die Annahme der gleichen Umgebung gültig ist oder nicht.
Gemessene Ähnlichkeit: Ein direkter Test von Annahmen in Zwillingsdesignenbearbeiten
Eine besonders leistungsfähige Technik zum Testen der Zwillingsmethode wurde von Visscher et al. Anstatt Zwillinge zu verwenden, nutzte diese Gruppe die Tatsache, dass Geschwister im Durchschnitt 50% ihrer Gene teilen, die tatsächliche Genfreigabe für einzelne Geschwisterpaare jedoch um diesen Wert variiert und im Wesentlichen ein Kontinuum genetischer Ähnlichkeit oder „Zwillingsnähe“ innerhalb von Familien schafft. Schätzungen der Erblichkeit, die auf direkten Schätzungen des Genaustauschs basieren, bestätigen die der Zwillingsmethode und stützen die Annahmen der Methode.
Geschlechtsunterschiedebearbeiten
Genetische Faktoren können sich zwischen den Geschlechtern unterscheiden, sowohl in der Genexpression als auch im Bereich der Gen-Umwelt-Interaktionen. Brüderliche Zwillingspaare des anderen Geschlechts sind von unschätzbarem Wert, um diese Effekte zu erklären.
Im Extremfall darf ein Gen nur in einem Geschlecht exprimiert werden (qualitative Geschlechtsbeschränkung). Häufiger können die Auswirkungen von Genallelen vom Geschlecht des Individuums abhängen. Ein Gen kann eine Gewichtsänderung von 100 g bei Männern verursachen, aber vielleicht 150 g bei Frauen – ein quantitativer Geneffekt. Solche Effekte können sich auf die Fähigkeit von Genen auswirken, sich auszudrücken, und können dies über Geschlechtsunterschiede tun. Zum Beispiel würden Gene, die das Wahlverhalten beeinflussen, bei Frauen keine Wirkung haben, wenn Frauen von der Abstimmung ausgeschlossen werden. Allgemeiner kann sich die Logik des Geschlechtsdifferenztests auf jede definierte Untergruppe von Individuen erstrecken. In Fällen wie diesen, Die Korrelation für gleich- und gegengeschlechtliche DZ-Zwillinge wird sich unterscheiden, die Wirkung des Geschlechtsunterschieds verraten.
Aus diesem Grund ist es normal, drei Arten von zweieiigen Zwillingen zu unterscheiden. Ein standardmäßiger analytischer Workflow würde das Testen auf Geschlechtsbeschränkung beinhalten, indem Modelle an fünf Gruppen angepasst werden, identischer Mann, identische Frau, brüderlicher Mann, brüderliche Frau, und brüderliches Gegenteil Sex. Die Zwillingsmodellierung geht somit über die Korrelation hinaus, um Kausalmodelle mit potenziellen Kausalvariablen wie dem Geschlecht zu testen.
Gene × environment interactionsEdit
Geneffekte können oft von der Umgebung abhängig sein. Solche Wechselwirkungen sind als G × E-Wechselwirkungen bekannt, bei denen sich die Auswirkungen eines Genallels in verschiedenen Umgebungen unterscheiden. Einfache Beispiele wären Situationen, in denen ein Gen die Wirkung einer Umgebung multipliziert: vielleicht 1 Zoll zur Höhe in Umgebungen mit hohem Nährstoffgehalt hinzufügen, aber nur einen halben Zoll zur Höhe in Umgebungen mit niedrigem Nährstoffgehalt. Dies zeigt sich in verschiedenen Reaktionsschrägen auf eine Umgebung für verschiedene Genotypen.
Oft interessieren sich Forscher für Veränderungen der Erblichkeit unter verschiedenen Bedingungen: In Umgebungen, in denen Allele große phänotypische Effekte auslösen können (wie oben), wird die relative Rolle von Genen zunehmen, was einer höheren Erblichkeit in diesen Umgebungen entspricht.Ein zweiter Effekt ist die G × E-Korrelation, bei der bestimmte Allele dazu neigen, bestimmte Umgebungen zu begleiten. Wenn ein Gen dazu führt, dass ein Elternteil Spaß am Lesen hat, werden Kinder, die dieses Allel erben, aufgrund dieser Korrelation wahrscheinlich in Haushalten mit Büchern großgezogen: Einer oder beide Elternteile haben das Allel und sammeln daher eine Buchsammlung an und geben das buchlesende Allel weiter. Solche Effekte können getestet werden, indem das angebliche Umweltkorrelat (in diesem Fall Bücher im Haushalt) direkt gemessen wird.
Oft scheint die Rolle der Umwelt sehr früh im Leben maximal zu sein und nimmt nach Beginn der Schulpflicht rapide ab. Dies wird zum Beispiel beim Lesen beobachtetsowie Intelligenz. Dies ist ein Beispiel für einen G * Age-Effekt und ermöglicht eine Untersuchung sowohl von GE-Korrelationen aufgrund von elterlichen Umgebungen (diese werden mit der Zeit aufgebrochen) als auch von G * E-Korrelationen, die von Individuen verursacht werden, die aktiv nach bestimmten Umgebungen suchen.
Normen der Reaktionbearbeiten
Studien an Pflanzen oder in der Tierzucht ermöglichen die Messung der Auswirkungen experimentell randomisierter Genotypen und Umweltkombinationen. Im Gegensatz dazu sind Humanstudien typischerweise beobachtend. Dies kann darauf hindeuten, dass Reaktionsnormen nicht bewertet werden können.Wie in anderen Bereichen wie Wirtschaft und Epidemiologie wurden mehrere Designs entwickelt, um von der Fähigkeit zu profitieren, differentielles Gen-Sharing, wiederholte Expositionen und gemessene Exposition gegenüber Umgebungen (wie Kinder) zu nutzen sozialer Status, Chaos in der Familie, Verfügbarkeit und Qualität der Bildung, Ernährung, Toxine usw.), um diese Verwechslung der Ursachen zu bekämpfen. Ein inhärenter Reiz des klassischen Twin-Designs ist, dass es beginnt, diese Verwirrungen zu entwirren. Zum Beispiel werden bei identischen und brüderlichen Zwillingen gemeinsame Umwelt- und genetische Effekte nicht verwechselt, wie sie in Nicht-Zwillings-Familienstudien sind. Zwillingsstudien sind daher teilweise durch den Versuch motiviert, das zufällige Sortiment von Genen zwischen Familienmitgliedern zu nutzen, um diese Korrelationen zu verstehen.Während die Zwillingsstudie uns nur sagt, wie Gene und Familien das Verhalten innerhalb des beobachteten Bereichs von Umgebungen beeinflussen, und mit dem Vorbehalt, dass Gene und Umgebungen oft variieren, ist dies ein beträchtlicher Fortschritt gegenüber der Alternative, die keine Kenntnis der verschiedenen Rollen von Genen und Umwelt hat. Zwillingsstudien werden daher häufig als Methode zur Kontrolle mindestens eines Teils dieser beobachteten Varianz verwendet: Partitionierung, zum Beispiel, was bisher als familiäre Umgebung angenommen wurde, in eine gemeinsame Umgebung und additive Genetik unter Verwendung des Experiments vollständig und teilweise geteilter Genome bei Zwillingen.
Kein einziges Design kann alle Probleme lösen. Zusätzliche Informationen sind außerhalb des klassischen Twin-Designs verfügbar. Adoptionsdesigns sind eine Form des natürlichen Experiments, bei dem Reaktionsnormen getestet werden, indem derselbe Genotyp in verschiedenen Umgebungen platziert wird. Assoziationsstudien erlauben z.B. die direkte Untersuchung allelischer Effekte. Die mendelsche Randomisierung von Allelen bietet auch die Möglichkeit, die Auswirkungen von Allelen nach dem Zufallsprinzip in Bezug auf ihre assoziierten Umgebungen und andere Gene zu untersuchen.
Erweiterte Zwillingsentwürfe und komplexere genetische Modellebearbeiten
Das grundlegende oder klassische Zwillingsdesign enthält nur identische und brüderliche Zwillinge, die in ihrer biologischen Familie aufgezogen wurden. Dies stellt nur eine Untermenge der möglichen genetischen und umweltbezogenen Beziehungen dar. Es ist daher fair zu sagen, dass die Heritabilitätsschätzungen aus Zwillingsentwürfen einen ersten Schritt zum Verständnis der Verhaltensgenetik darstellen.Die Varianzpartitionierung der Zwillingsstudie in additive genetische, geteilte und nicht geteilte Umgebungen ist eine erste Annäherung an eine vollständige Analyse unter Berücksichtigung der Gen-Umwelt-Kovarianz und Interaktion sowie anderer nicht-additiver Effekte auf das Verhalten. Die Revolution in der Molekulargenetik hat effektivere Werkzeuge zur Beschreibung des Genoms zur Verfügung gestellt, und viele Forscher verfolgen die Molekulargenetik, um den Einfluss von Allelen und Umgebungen auf Merkmale direkt zu bewerten.Eine anfängliche Einschränkung des Zwillingsdesigns besteht darin, dass es keine Möglichkeit bietet, sowohl die gemeinsame Umgebung als auch nicht-additive genetische Effekte gleichzeitig zu berücksichtigen. Dieses Limit kann durch Hinzufügen zusätzlicher Geschwister zum Design behoben werden.
Eine zweite Einschränkung besteht darin, dass die Gen-Umwelt-Korrelation nicht als eindeutiger Effekt nachweisbar ist. Um diese Grenze zu erreichen, müssen Adoptionsmodelle oder Designs für Kinder von Zwillingen einbezogen werden, um familiäre Einflüsse zu bewerten, die nicht mit gemeinsamen genetischen Effekten zusammenhängen.
Kontinuierliche Variablen und ordinale Variablenbearbeiten
Während Konkordanzstudien Merkmale vergleichen, die bei jedem Zwilling vorhanden oder nicht vorhanden sind, vergleichen Korrelationsstudien die Übereinstimmung kontinuierlich variierender Merkmale zwischen Zwillingen.