Automatische genetische Analytik
Günter Mertes et al.
WILEY-VCH
Gunter Mertes, Thomas Schafer, Thomas A. Schild, Ger...
205 downloads
1383 Views
14MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Automatische genetische Analytik
Günter Mertes et al.
WILEY-VCH
Gunter Mertes, Thomas Schafer, Thomas A. Schild, Gerald Schmidt, Dagmar Schuster,Jorg vom Stein
Automatische genetische Analytik Unter Mitarbeit von: Albrecht von Brunn, Karl-Heinz Grzeschik, Dietmar Lohmann, Hermann Schmitter, Norbert Speich, Jurgen Weber
@ WILEY-VCH Weinheim * New York Chichester . Brisbane Singapore * Toronto
This page intentionally left blank
G. Mertes, T. Schafer, T. A. Schild, G. Schmidt, D. Schuster, J. vom Stein
Automatische genetische Analytik
@ WILEY-VCH
This page intentionally left blank
Gunter Mertes, Thomas Schafer, Thomas A. Schild, Gerald Schmidt, Dagmar Schuster,Jorg vom Stein
Automatische genetische Analytik Unter Mitarbeit von: Albrecht von Brunn, Karl-Heinz Grzeschik, Dietmar Lohmann, Hermann Schmitter, Norbert Speich, Jurgen Weber
@ WILEY-VCH Weinheim * New York Chichester . Brisbane Singapore * Toronto
Dr. Guntcr Mcrtes Dr. Thomas Schdfcr Dr. Thomas A. Schild Dr. Gerald Schmidt Dr. Dagmar Schuster Dr. J6rg vom Stcin PE-Applied Biosystems Brunncnwcg 13 D-64331 Wciterstadt
Das vorlicgcndc Wcrk wurdc sorgfaltig crarbeitet. Dcnnoch ubcrnchmcn Autorcn und Verlag fur dic Richtigkcit von Angabcn, Hinwciscn und Ratschlagcn sowic fur eventuelle Druckfehler keine Haftung.
Lektorat: Karin Dcmbowsky Herstcllcrischc Bctrcuung: Hans-Jochcn Schmitt
Titelhild: Dcr Hintcrgrund zcigt cin Gclhild nach elektrophorctischcr Auftrennung und automatischcr Multi-color-DNA-Dctektion von Multiplcx-PCR-Reaktionsproduktcn.Das Diagramm im Vordergrund bcschrciht das Analyscprinzip dcr simultancn multifluorophorcn Prismen-CCD-DNA-Dctcktion.
Dic Dcutschc Bihliothck - CIP-Einhcitsaufnahme Automatische genetische Analytik / Guntcr Mertes _ . .Untcr Mitarb von: Albrccht von Brunn ... - Wcinhcim : VCH, 1997 ISBN 3-527-30076-7 0 VCH Vcrlagsgescllschaft mhH, D-69451 Wcinheim (Bundcsrcpublik Dcutschland). 1Y97
Gedruckt auf saurcfrciem und chlorfrci gcblcichtem Papicr Allc Rcchtc. insbesonderc die dcr Uhcrsetzung in andcrc Sprachcn. vorbchaltcn. Kcin Teil diescs Buchcs darf ohnc schriftlichc Gcnchmigung des Verlagcs in irgcndcincr Form - durch Photokopic. Mikrovcrfilmung odcr irgcndcin andcrcs Verfahren - rcproduzicrt odcr in cinc v o n Maschinen, insbcsondcrc von Datcnverarbcitungsmaschincn. verwendbarc Sprache ubertragcn odcr iihersetzt werden. Die Wicdcrgahc von Warcnbezcichnungcn. Handelsnamcn odcr sonstigen Kennzeichcn in diesem Buch berechtigt nicht zu dcr Annahmc, daB dicsc von jcdcrmann frci henutzt werden durfcn. Viclmehr kann es sich aueh dann um cingetragcnc Warcnzcichen odcr sonstigc gesetzlich geschutztc Kcnnzcichcn handcln, wcnn sic nicht eigens als solchc markicrt sind. All rights rcscrvcd (including thosc of translation into othcr languages). N o part of this hook may be reproduced in any form - by photoprinting. microfilm, or any othcr means - nor transmittcd or translated into a machine language without writtcn permission from the publishers. Registered names, trademarks, ctc. used in this hook, even when not spccifically marked as such, arc not to be considcrcd unprotected by law. Satz: Kuhn & Wcyh, D-79015 Frcihurg Druck: Colordruck, D-69181 Lcimcn Bindung: W. Osswald, D-67433 Ncustadt Printed in thc Fcdcral Republic of Gcrmany
Vorwort
Was hat die Autoren veranlaflt, sich dem Thema ,,Automatkche genetische Analytik" in Form eines Buches ausfuhrlicher zu widmen? Zunachst einmal verstehen die Autoren unter ,,Genetkcher Analytik" die stark erweiterten Anwendungsmoglichkeiten von molekularbiologischen Basistechniken zur molekularen Charakterisierung von DNA rnit Hilfe einer speziellen instrumentellen Analysetechnologie. Ziel der ,,Automatkchen genetischen Analytik" ist es, die molekulare Analyse der DNA zu vereinfachen, zu optimieren und zu automatisieren. Die Beschaftigung rnit diesem Thema hat naturlich rnit dem beruflichen Werdegang der Autoren zu tun. Alle Autoren haben nach dem Studium der Biologie oder Chemie in der molekularbiologisch orientierten Forschung gearbeitet. Die Forschungsarbeiten bestanden zunachst aus reiner Grundlagenforschung in den jeweiligen Fachdisziplinen. Aber gerade in diesen sehr verschiedenen Fachausrichtungen von der organischen Grundstoffchemie uber die Molekulargenetik der Pflanzen bis hin zur medizinischen Virologie und Tumorgenetik kamen sehr schnell auch anwendungsorientierte Forschungsaspekte in den Blickpunkt. Gemeinsam war allen Anwendungsbereichen aber eine wesentliche methodische Grundlage: die molekulare Analyse einer Biomolekulklasse rnit der angelsachsischen Kurzform DNA (Desoxyribonucleicacid). Eine weitere Gemeinsamkeit der Autoren und der noch intensivere Bezug zum Thema des vorliegenden Buches ergab sich durch die Kombination des bisherigen Arbeitsfeldes rnit neuen Aufgabenbereichen in der instrumentellen Analytik bei einem fuhrenden industriellen Anbieter. Es ware aber sicher niemals zu diesem Buch gekommen, wenn nicht auch in den letzten Jahren die generelle Bedeutung der ,,Genetkchen Analyse" in den unterschiedlichsten Anwendungsbereichen gravierend zugenommen hatte. Als ,,eingefleischte Molekularbiologen" haben wir in den letzten Jahren nicht selten gestaunt, da13 wir mehr und mehr rnit Gesprachspartnern zu tun hatten, die sich, obwohl ,,molekularbiologisch fachfremd", sehr interessiert rnit DNA-Analysen beschaftigten. Diese Gesprachspartner waren Palaontologen, Anthropologen, Juristen, Politiker, Tier- und Pflanzenzuchter, Lebensmittelproduzenten und naturlich Mitglieder nahezu aller Fachbereiche der medizinischen Wissenschaften. So ist z. B. die forensische DNA-Analytik als Methode innerhalb der Rechtsmedizin und des kriminaltechnischen Dienstes bereits eine Routinemethode geworden. In anderen Bereichen steht diese Entwicklung kurz bevor bzw. ist jetzt schon absehbar. Die methodischen Quantensprunge in den Basistechniken der DNA-Analyse und die Innovationen in der dafur speziell entwickelten instrumentellen Analytik haben diese Entwicklung wesentlich beschleunigt, ja teilweise auch erst moglich gemacht. Beispielhaft ware da die Entwicklung der
VI
Vorworr
,,Polymerase-Chain-Reaction" (PCR) zu nennen, die den Zugriff zum Biomolekul DNA um ein Vielfaches einfacher und effektiver gemacht hat. Auch die Entwicklung einer auf nichtradioaktiver Markierung basierenden automatischen DNA-Analyse hat einen wesentlichen Beitrag zur einfachen und effektiven Anwendung der ,,Genetkchen Analytik" geleistet. Wie oft, wenn rasante methodische Entwicklungen mit einer enormen Ausweitung der Anwendungsmoglichkeiten einhergehen, wachst der Bedarf fur eine zusammenfassende Darstellung dieses neuen Fachgebiets. Damit ist auch die Zielsetzung des Buches schon angesprochen. Die methodischen Moglichkeiten und Anwendungsbeispiele der ,,Automatischen genetischen Analytik" sollen in einem zusammenfassenden Uberblick dargestellt werden. Dabei soll vor allem Wert auf den gesamten ProzeB vom biologischen Material uber die Analyse his hin zur Datenauswertung und Datenverarbeitung gelegt werden. Die Integration von diesen Teilprozessen mit dem entsprechenden Praxisbezug soll der ,,rote Faden" in diesem Buch sein. Es wird dabei weniger auf eine detaillierte Vollstandigkeit eingegangen, als mehr auf einen zusammenfassenden Uberblick mit Praxisbezug. Gerade der Praxisbezug soll durch die Anwendungsbeispiele von Vertretern verschiedener Fachrichtungen unterstrichen werden. Das Buch wendet sich sowohl an aktuelle oder zukunftige Anwender der molekularen DNA-Analyse, als auch an interessierte Leser, die sich uber den aktuellen Stand und die Anwendungmoglichkeiten der automatischen genetischen Analytik informieren mochten. Das vorliegende Buch kann und will kein vollstandiges Laborhandbuch oder gar Lehrbuch sein. Aus diesem Grund sind Protokolle und Methoden nur beispielhaft dargestellt. Es wird aber an geeigneter Stelle auf weiterfuhrende und detaillierte Literatur hingewiesen. Die dargestellten Methoden und Anwendungsbeispiele bauen auf die am weitesten verbreitete multifluorophore LaserScanning-Detektion als Standardtechnologie fur die Automatisierung der genetischen Analyse auf. Andere Technologien und Methoden werden nur am Rande erwahnt, und gegebenenfalls auf spezielle Literatur verwiesen wird. SchlieBlich mochten wir mit diesem Buch einen aktuellen Uberblick uber die derzeitigen Methoden und Anwendungsmoglichkeiten der ,,Automatischen Genetischen Analytik" geben, ohne diese aber in ihren Folgen zu bewerten, zu kommentieren oder eine ethische Diskussion zu fuhren. Wegen der ethischen Relevanz und moglichen Folgen aktueller und zukunftiger Anwendungsmoglichkeiten halten die Autoren diese Diskussion aber an anderer Stelle fur notwendig und sehen dieses Buch als eine mogliche Informationsgrundlage an. Die Autoren mochten der WILEY-VCH Verlagsgesellschaft Weinheim fur die geduldige und kooperative Zusammenarbeit danken. Wir mochten auch den externen Autoren fur die Praxisbeispiele aus ihren Fachgebieten und die gute Kooperation danken. Dieses Buch ware sicher auch nicht so entstanden ohne den Rat und die Hilfe vieler Kollegen und Freunde. Fur das Autorenteam: Dr. Jorg vom Stein
Im Fruhjahr 1997
Geleitwort
Es wird zur Zeit vie1 von Zukunftstechnologien gesprochen, erhofft man sich doch von deren gezielter Forderung eine deutliche Unterstutzung bei der Losung der heutigen wirtschaftlichen Probleme und eine prosperierende Wirtschaftsentwicklung fur die Zukunft. Doch bei diesen Zukunftstechnologien denkt man in Deutschland bevorzugt und oft fast ausschliel3lich an die Informations- und Kommunikationstechniken. Diese werden von einer breiten Offentlichkeit akzeptiert, und niemand bestreitet, daB wir unbedingt an diesem revolutionaren ProzeB angemessen teilhaben mussen. Vie1 weniger beachtet und noch weniger akzeptiert wird die revolutionare Entwicklung in der Biologie und den Biowissenschaften, die aber einen mindestens ebenso groljen EinfluB auf unsere Zukunft haben wird wie die Revolution in der Informationstechnologie. So wird der molekularen Biologie und deren Anwendungsbereichen wie genetische Analytik, Biotechnologie und Gentechnologie mit grol3er Skepsis begegnet, und immer noch steht eine Mehrheit diesen Technologien ablehnend gegenuber. Dabei wird allein schon die auf modernen molekularbiologischen Erkenntnissen beruhende genetische Analytik das Leben jedes einzelnen entscheidend beeinflussen. Nahrung und Gesundheit, die Grundbedurfnisse eines jeden, werden von der Entwicklung der genetischen Analytik bestimmt werden. Das vorliegende Buch ,,Automatische genetische Analytik" stellt in einem breiten Rahmen die modernsten Methoden in der genetischen Analytik vor, wobei neben der Analytik selbst auch andere grundlegende Entwicklungen dargestellt werden, wie die moderne DNA Synthese und der hohe Entwicklungsstand der PCR Technik, ohne die eine moderne genetische Analytik undenkbar ware. Dies Buch erscheint zu einem Zeitpunkt zu dem die genetische Analytik an ihrer entscheidenden Schwelle steht: dem Ubergang von einer Methode fur Spezialisten in der Grundlagenforschung zur Routinemethode fur ein breites analytisches Anwendungsspektrum. Damit geht in vielen Bereichen eine grundlegende Anderung traditioneller Analysenmethoden einher. Moglich und beschleunigt wird dieser ProzeB durch eine immer weiter gehende Automatisierung der genetischen Analytik und durch die kommerzielle Bereitstellung kompletter und validierter Analysenprodukte. So ist die genetische Analytik in der Forensik bereits zur essentiellen Routineanalytik geworden, sie uberschreitet auf breiter Front die Schwelle zu allen Bereichen der medizinischen Wissenschaften, genauso ist dies der Fall in der Pharmaforschung bei der Entwicklung neuer, gezielt wirkender Arzneimittel. Sie wird zur Routinemethode in den Agrarwissenschaften, und der erste Einstieg in die Lebensmittel- und Umweltanalytik findet gerade statt. Neben den wissen-
VlII
Grleitwort
schaftlichen Grundlagen der automatischen genetischen Analytik beschreibt dieses Buch auch den beginnenden Routineeinsatz in den fortgeschrittenen Anwendungsbereichen. Dies wurde moglich durch ein Autorenteam, das kompetent und aus eigener praktischer Erfahrung die unterschiedlichen Aspekte der genetischen Analytik in ihrer ganzen Breite darstellen konnte. Somit moge dieses Buch dabei helfen, ein breites Fachpublikum mit dem heutigen Stand der Technik vertraut zu machen und aufiuzeigen, welches Zukunftspotential sich hier eroffnet. Obwohl in diesem Buch keine ethische Diskussion uber die genetische Analytik gefuhrt wird, so kann es doch durch seine klare praxisnahe Beschreibung, was genetische Analytik ist, dazu beitragen, dalj in Zukunft emotionsloser und sachlicher uber die ethischen Probleme der genetischen Analytik gesprochen werden kann. Dem Autorenteam mochte ich aufrichtig fur das Engagement danken. Alle haben die Arbeit an diesem Buch sehr ernst genommen und vie1 Zeit und Muhe investiert. Das Ergebnis kann sich sehen lassen, und ich hoffe, es kann mit seinen aufklarenden Informationen dazu beitragen, da13 die modernen Biowissenschaften auf ein breiteres Verstandnis stol3en und da13 ungerechtfertigte Ressentiments weiter abgebaut werden. Dr. Karl-Heinz Franzen
Im Fruhjahr 1997
1 Bedarf und Konzept einer integrierten automatischen DNA-Analyse 1.1 1.2 1.3 1.3.1 1.3.2
1
Was hat die DNA-Analyse so popular gemacht? 1 Methodische Quantensprunge machten die DNA ,,reif" fur die Routineanalyse 3 Was bedeutet integrierte automatische genetische Analyse? 4 Teilbereiche der molekularen DNA-Analyse 4 Das Konzept der Integration 5
2 Die DNA-Praparation fur die automatische DNA-Analyse 7 2.1 2.2 2.3 2.4 2.4.1 2.4.2 2.4.3 2.5 2.6 2.7 2.8
Einfuhrung 7 Vektoren fur die DNA-Praparation 7 DNA-Praparation durch PCR 9 Methoden zur Plasmidpraparation 9 Alkalische Lyse 9 Boiling-Methode 10 Aufreinigung der Plasmid-DNA uber Saulen 10 ,,Solid-Phase"-DNA-Praparation 12 Molekularbiologische Workstation 12 Auswirkungen der DNA-Template-Qualitat auf die automatische DNA-Sequenzierung 17 Literatur 17
3 Die PCR als Grundlage in der molekularen DNA-Analyse 3.1 3.2 3.3 3.3.1 3.3.2 3.4 3.5 3.5.1 3.5.2 3.5.3 3.6 3.6.1 3.6.2 3.6.3 3.6.4
PCR - das Grundprinzip 19 Automatisierung der PCR 22 Optimierung von PCR-Reaktionen 24 Reaktionsparameter 24 Optimierungsstrategien 28 Optimierung der Amplifikationsprazision 29 Spezielle PCR-Verfahren 30 Touchdown-PCR 30 Nested-PCR 31 Hot-Start-Technik 32 Thermostabile Enzyme 33 Taq-DNA-Polymerase 34 rTth-DNA-Polymerase 35 VentTM-DNA-Polymerase 36 Pfu-DNA-Polymerase 36
19
X
Inhall
3.6.5 3.7 3.8 3.8.1 3.8.2 3.8.3 3.8.4 3.9
UITmaTM-DNA-Polymerase 36 PCR und Kontaminationen 37 Analyse der Amplifikationsprodukte 38 Gelelektrophorese 39 High Performance Liquid Chromatographie (HPLC) 40 Kapillar-Elektrophorese (CE) 40 TaqManTM-Assayzur Analyse von PCR-Produkten 41 Literatur 43
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse 45 4.1 4.2 4.3 4.3.1 4.3.2 4.3.3 4.3.4 4.4 4.5 4.6 4.6.1 4.6.2 4.6.3 4.7 4.8 4.8.1 4.8.2 4.8.3 4.9 4.10
Entwicklung der DNA-Synthese 45 Chemische Grundlagen der DNA-Synthese 45 Chemischer Ablauf der DNA-Synthese 48 Detritylierung 48 Monomeraddition 49 Capping 50 Oxidation 50 Automatisierung der DNA-Synthese 50 Optimierung der DNA-Synthese 52 Aufarbeitung von Oligonukleotiden 52 Gelelektrophorese 53 High Performance Liquid Chromatographie (HPLC) 55 Kapillar-Elektrophorese 58 Mogliche Konsequenzen der Verwendung nichtgereinigter Oligonukleotide auf spatere Anwendungen 58 Markierung von Oligonukleotiden 59 Biotin-Markierung 59 Phosphorylierung 60 Fluoreszenzmarkierung 61 Anwendungen von Oligonukleotiden 62 Literatur 62
5 DNA-Sequenzanalyse 65
5.1 5.2 5.2.1 5.2.2 5.2.3 5.2.4 5.3 5.3.1 5.3.2 5.3.3
Einleitung 65 Sequenzier-Techniken 65 Maxam-Gilbert-Sequenzierung 65 Sequenzierung nach Sanger 66 ,,Cycle-Sequenzierung" 68 Multiplex-Sequenzierung 70 Templates 70 Phagen und Phagemide 70 Plasmide und Cosmide 71 PCR-Produkte 72
Inhalt
5.3.4 5.4 5.4.1 5.4.2 5.4.3 5.4.4 5.5 5.5.1 5.5.2 5.5.3 5.5.4 5.5.5 5.6 5.7
Magnetic Beads 72 Markierungs-Methoden 73 Sequenzierung rnit markierten Primern 73 Sequenzierung rnit markierten Desoxynukleotiden 74 Sequenzierung mit markierten Didesoxynukleotiden (DyeTerminatoren) 75 Nachtragliche Sequenz-Markierung 75 Der Weg zur vollstandigen Sequenz 76 Geringer Aufwand fur die Probenvorbereitung 77 Kurze Analysezeiten rnit hoher Genauigkeit 78 Hohe Leseweiten 79 Vergleichende Sequenzbestimmung 83 Detektionsverfahren 83 Datendarstellung 84 Literatur 86
6 DNA-FragmentgroBenbestimmungund Quantifizierung 87
6.1 6.2 6.2.1 6.2.2 6.2.3 6.3 6.4 6.5 6.6 6.7 6.7.1 6.7.2 6.7.3 6.7.4 6.7.5 6.8 6.9 6.10 6.11
Einfuhrung in die DNA-Fragmentanalyse 87 Markierung der DNA-Fragmente 89 Fluoreszenzmarkierte Primer 89 Markierung rnit fluoreszenzmarkierten dNTPs 91 Markierung von dsDNA rnit Fluoreszenzdimeren (Interkalatoren) 92 Exakte Langenbestimmung rnit Hilfe eines internen Langenstandards 94 Sensitivitat, Kapazitat und Reproduzierbarkeit der automatischen Fragmentlangenbestimmung 97 Automatische Datenanalyse 97 Quantitative Anwendungen in der Fragmentanalyse 98 Mutations-Detektions-Methoden 100 Die Identifizierung von Mutationen 100 PCR-basierende Mutations-Detektions-Methoden 102 Multiplex-PCR fur die Detektion von Deletionen 102 Detektion von Punktmutationen 103 Vergleich und Bewertung der verschiedenen MutationsDetektions-Methoden 108 Kopplungsanalysen 109 STR-Analysen in der forensischen Spurenkunde 113 Automatische genetische Analyse in der Landwirtschaft 117 Literatur 123
7 Grundlagen und Entwicklung der multifluorophoren Laser-ScanningTechnologie 127
7.1
Einleitung
127
XI
XI1
Inhalt
7.2
Die Ausgangssituation: Monomarkersysteme auf der Basis radioaktiver Nuklide oder einzelner Fluorochrome zur Detektion von DNA-Fragmenten 127 7.2.1 Radioaktivitat 128 7.2.2 Chemilumineszenz 128 7.2.3 Fluorescein- und Rhodaminderivate, Ethidiumbromid, TOTO'rM 129 7.2.4 Detektion von Emissionsstrahlung bei nichtradioaktiven Monomarkersystemen 130 7.2.5 Datenerfassung und -interpretation 131 Multimarkersysteme auf der Basis von Fluoreszenzfarbstoffen 7.3 zur Detektion von DNA-Fragmenten 133 7.3.1. Das Systemkonzept 134 7.3.2 Chemische Struktur und physikalische Grundlagen der Fluorophore: Absorption, Emission und Empfindlichkeit 136 Laser-( Scanning-)Technologic als Grundlage eines Multimarker7.4 Detektionssystems 138 7.4.1 Grundlagen der ,,On-line"-Detektion von Multimarkersystemen 139 7.4.2 Das Systemkonzept der Laser-Scanning-Technologie: Der Aufbau einer Multimarker-DNA-Analysestation mit hoher Kapazitat 140 7.4.3 Das Systemkonzept der Laserdetektion bei der Multimarker-DNA-Analyse in Kapillaren 143 7.5 Variable Medien und Gellangen: Die vielseitigen Moglichkeiten der Elektrophorese mit ,,On-line"-Detektion 14.5 Perspektiven in der Detektionstechnologie 147 7.6 7.7 Literatur 148 8 Datenverarbeitung in der genetischen Analyse 8.1 8.1.1 8.1.2 8.1.3 8.2 8.2. I 8.2.2 8.2.3 8.2.3.1 8.2.3.2 8.2.3.3 8.2.3.4
149
Grundanforderungen: Integration, Automatisierung und Flexibilitat 149 Integration 149 Automatisierung 150 Flexibilitat 150 Einzelne Arbeitsprozesse der Datenverarbeitung in der genetischen Analyse 151 Datenvisualisierung 151 Dateneditierung 153 Datenanalyse 154 Sequenzalignment und Homologieanalysen 156 Sequenzassembling und KonsensussequenzGenerierung 157 Datenbanksuche 157 Sequenzstruktur- und Motivanalyse 1.58
8.2.3.5 Analyse des Informationsgehalts von DNASequenzen 158 8.2.4 Datenarchivierung/Datenbanken 159 Spezifische Anforderungen bei der Analyse von DNA8.3 Fragmentdaten 160 8.4 Kriterien fur die Auswahl der Hard- und Software 162 8.4.1 Plattformubergreifendes Arbeiten 163 8.4.2 Erweiterbarkeit 163 8.4.3 Netzwerkfahigkeit 164 8.5 Sicherheit der Datenverarbeitung 164 9 Identifizierung von Genen und Markern
9.1 9.2 9.3 9.4 9.5
165
Genetische Kartierung 166 Kartierung von genetischen Markern 168 Automatisierung der Genotypisierung 170 Perspektiven der genetischen Kartierung 173 Literatur 177
10 Polymorphismus- und Mutationsanalyse 179
10.1 10.2 10.3 10.4
Segregationsanalyse gekoppelter polymorpher Marker Mutationsanalyse 183 Zusammenfassung 189 Literatur 189
180
11 DNA-Analytik in der Forensik 191 11.1 11.2 11.3 11.4 11.4.1 11.4.2 11.5 11.6 11.7
Spurenmaterial in Kriminalfallen 191 Aussagekraft bei Ubereinstimmungen von Erbmerkmalen Forensisch bedeutsame Polymorphismen 192 Methoden der VNTR-Typisierung 194 Southern-Analyse 194 Polymerase Chain Reaktion (PCR) 195 Aussichten der VNTR-Typisierung 199 Weitere Aspekte der DNA-Analyse in der Forensik 200 Literatur 201
12 DNA-Sequenzierung in der medizinischen Mikrobiologie 203 12.1 12.2 12.3 12.3.1 12.3.2
Einfuhrung 203 Theoretische Grundlagen 204 Humanes Immundefizienzvirus 204 Sequenzvariation von HIV-Subtypen 206 Sequenzvariation in der PND des HIV-l/gpl20Oberflachenproteins 206
192
XI V
lnhalt
12.3.3 Bestimmung antiretroviraler Resistenzen gegen HIVTherapeutika 207 12.4. Hepatitis B-Virus 210 12.5 Resistenzentwicklungen bei bakteriellen Erregern 21 1 12.6 Ausblick 212 12.7 Literatur 212
13 Anwendung molekularbiologischer Methoden im Agrarbereich 215 13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8
Einleitung 215 Malignes Hyperthermie-Syndrom beim Schwein (MHS) 215 Bovine Leukozyten-Adhasions-Defizienz (BLAD) 217 Molekularbiologische Bestimmung der Milchproteinvarianten 218 DNA-Fingerprinting 219 DNA-Mikrosatelliten-Analyse 219 Zusammenfassung 222 Literatur 223
Glossar 225 Sachverzeichnis 231
Autorenverzeichnis Dr. Gunter Mertes Dr. Thomas Schafer Dr. Thomas Schild Dr. Gerald Schmidt Dr. Dagmar Schuster Dr. Jorg vom Stein PE - Applied Biosystems Brunnenweg 13 64331 Weiterstadt Dr. Albrecht von Brunn Max von Pettenkofer Institut Pettenkoferstr. 9a 80336 Munchen Prof. Dr. Karl-Heinz Grzeschik Medizinisches Zentrum fur Humangenetik der Phillips-Universitat Marburg Bahnhofsstr. 7a 35037 Marburg Dr. Dietmar Lohmann Institut fur Humangentik der Universitatsklinik Essen Virchowstr. 171 45122 Essen Dr. Hermann Schmitter Bundeskriminalamt Abteilung KT31 Thaerstr. 11 65193 Wiesbaden Dr. Norbert Speich Labor Dr. Jung & Dr. Niemann, Laborarztpraxis Genetisch-DiagnostischesLabor Paul-Schallck-Str. 8 50939 Koln Dr. Jiirgen Weber Institut fur molekulare Diagnostik GmbH Katzenburgweg 7-9 53115 Bonn
This page intentionally left blank
1 Bedarf und Konzept einer integrierten automatischen DNA-Analyse Jorg vom Stein In diesem einfuhrenden Kapitel soll der Begriff der Jntegrierten automatischen DNA-Analyse" erlautert und in den Zusammenhang des Buches gestellt werden. Es wird dabei auf die entsprechenden Kapitel des Buches venviesen, um dem Leser einen direkten Zugang zu den ihn besonders interessierenden Themen und Aspekten zu ermoglichen. Zunachst einige allgemeine Bemerkungen zum Stichwort ,,Automatisierung": Allein die Tatsache, da13 ein Verfahren und insbesondere eine Analysemethode den Weg von der manuellen Durchfiihrung hin zu einer Automatisierung durchschritten hat, impliziert bereits wichtige Eigenschaften dieser Analysemethode: Es liegt ein ausreichend hoher und wachsender Anwendungsbedarf fur diese Analysemethode vor. Die Automatisierung der Methode ist unter Kosten-Nutzen-Gesichtspunkten moglich und fur den Anwender sinnvoll. Die Automatisierung bringt nicht nur quantitative, sondern auch qualitative Vorteile fur die Sicherheit und Reproduzierbarkeit der gewonnenen Daten.
Im weiteren Verlauf des Buches soll deutlich gemacht werden, wie zutreffend diese mehr theoretischen Grundlagen einer Automatisierung fur die DNA-Analyse sind.
1.1 Was hat die DNA-Analyse so popular gemacht? Diese Frage scheint mir berechtigt, da DNA-Analysen ganz wertneutral eine gewisse Popularitat erlangt haben. Zunachst einmal eine kurze Definition des Begriffs DNA-Analyse: Im Kontext des Buches wird unter DNA-Analyse die molekulare Charakterisierung der DNA mit folgenden Zielen verstanden: 1. Die Analyse der Abfolge der DNA-Bausteine (die DNA-Sequenzierung) 2. Die Bestimmung der GroBe von spezifischen DNA-Bruchstucken (die DNAFragmentanal yse) 3. Die Bestimmung von Mengenverhaltnissen spezifischer DNA-Fragmente zueinander (relative DNA-Quantifizierung) Sowohl der DNA-Sequenzierung als auch der DNA-Fragmentanalyse sind eigene Kapitel in diesem Buch gewidmet. Auf die relative Quantifizierung von DNAFragmenten wird im Rahmen der Beschreibung der DNA-Fragmentanalyse ein-
2
Jorg vom Stein
gegangen. Alle in diesem Buch aufgefiihrten aktuellen Anwendungsbeispiele basieren auf einer der drei genannten Analysemethoden. Diese Abgrenzung ist notwendig, weil z. B. folgende Techniken im Kontext dieses Buches keine Berucksichtigung finden, da sie fur die dargestellten aktuellen Anwendungen der automatischen genetischen Analyse nicht relevant sind: 0 0 0 0
absolute Quantifizierung der DNA dreidimensionale DNA-Strukturanalyse Molekulargewichtsbestimmung der DNA Analyse DNA enthaltener Strukturen (z. B. DNA-Protein-Strukturen)
Nach diesen Begriffsdefinitionen und Abgrenzungen wieder zuruck zur Eingangsfrage, was die DNA eigentlich heute so ,,popular" gemacht hat. Diese zugegeben etwas salopp formulierte ,,Popularitat" basiert nicht auf der seit Jahrzehnten bestehenden fachlichen Notwendigkeit, sich innerhalb der Biowissenschaften mit der DNA zu beschaftigen. Vielmehr haben das erlangte Wissen aus diesen Forschungen und zugleich die methodischen Fortschritte die DNA-Analysen in vielen Bereichen des alltaglichen Lebens zu einer zunehmend wichtiger werdenden GroBe gemacht. DNA-Analysen sind auf dem Weg, Entwicklungen und Entscheidungen im juristischen, sozialen, medizinischen und wirtschaftlichen Umfeld unseres Lebens zu beeinflussen. Naturlich tragen auch theoretische und praktische Grunde dazu bei, warum die DNA als Objekt der Analyse in vielen Bereichen bisherige andere Analysemethoden ersetzt. Im wesentlichen sind drei Grunde zu nennen:
1. Die leichte Zuganglichkeit und Stabilitat des Biomolekuls DNA ist eine wichtige Grundlage fur die Entwicklung und Anwendung von DNA-Analyseverfahren. 2. Die Natur der DNA als biologische Informationseinheit und Datenbank, geschrieben aus vier Buchstaben (die organischen Basen Adenin, Guanin, Cytosin und Thymin), erlaubt bei der Analyse den direkten Zugriff auf die primare Information, die die Lebensvorgange codiert und somit auch Organismen unverwechselbar voneinander unterscheidet. 3. Der Informationsgehalt der DNA-Sequenzen ist mittels geeigneter Hard- und Software relativ einfach zu verarbeiten und gezielt auszuwerten. Fur die breite Anwendung der molekularen automatischen DNA-Analyse waren aber methodische Entwicklungen notwendig, die nachfolgend kurz beschrieben werden sollen.
I Bedarf und Konzept einer integrierten automatischen DNA-Analyse
3
1.2 Methodische Quantensprunge machten die DNA 11reif" fur die Routineanalyse Zwei wichtige methodische Grundlagen haben der molekularen DNA-Analyse den Weg zur Automatisierung und zu der rasanten Ausweitung des Anwendungsspektrums geebnet: Zum einen die ,,Polymerase-Ketten-Reaktion" (PCR) und zum anderen die ,,Multifluorophore Laser-Scanning-DNA-Detektion" (MLSDD). Wahrend die PCR die methodische Voraussetzung schaffte, auf leichte und schnelle Weise Zugriff auf spezifische DNA-Molekule aus biologischem Material zu bekommen, sorgte die MLSDD fur die analytische Voraussetzung, um sicher, schnell und mit hohem Durchsatz die DNA zu analysieren. Beiden methodischen Grundlagen sind in diesem Buch eigene Kapitel gewidmet, so darj hier nicht naher auf die Einzelheiten eingegangen werden soll. Entscheidend und von praktischer Bedeutung ist, darj in den letzten Jahren beide Methoden andere, viel aufwendigere Methoden ablosten, die sehr viel schwieriger zu automatisieren waren. Im Falle der PCR kann man nun aus nahezu jedem beliebigen biologischen Material ausreichend DNA fur die Analyse gewinnen, wobei bereits eine Kopie der Zielsequenz ausreicht, um d a m die gewunschten DNA-Fragmente anzureichern. Im Falle der MLSDD hat man seit etwa 9 Jahren eine neue detektionstechnologische Plattform, die bisherige Analysetechniken, die z. B. auf einem radioaktiven DNA-Nachweis beruhten, endlich ablosen konnten. Die Moglichkeiten fur weitergehende Entwicklungen im Hinblick auf Probendurchsatz und Methodenflexibilitat sind bis heute keineswegs ausgeschopft und bieten sehr viele Perspektiven fur neue Entwicklungen. Ahnliche technologische Ansatze basierend auf einer monofluorophoren Detektion halfen zwar, die auf Radioaktivitat basierenden Techniken zu ersetzen, bieten aber nicht die Flexibilitat und Weiterentwicklungsmoglichkeiten wie die MLSDD, so darj sie in diesem Buch nur am Rande erwahnt werden. Mit der PCR und einer routine- und leistungsfahigen DNA-Analysetechnologie waren nun wichtige methodische Voraussetzungen erfullt, damit die ,,Automatische genetische Analyse" als Routine- und Standardmethode in vielen und neuen Anwendungsbereichen eingesetzt werden konnte. Diese neuen methodischen Rahmenbedingungen haben dazu gefuhrt, daB keine fundierten molekularbiologischen Erfahrungen notwendig sind, urn die DNA-Analyse in der Routine betreiben zu konnen. So hat sich naturlich auch der potentielle Anwenderkreis fur die automatischen DNA-Analysen stark erweitert. An dieser Stelle soll aber darauf hingewiesen werden, dalj zwar die Generierung von ,,genetkchen Daten" durch die neuen methodischen Moglichkeiten stark vereinfacht worden ist, darj aber die sachgemaBe Interpretation und Analyse dieser Daten immer noch einen hohen Grad an Erfahrung und Wissen erforderlich macht. Dies ist gerade bei der Analyse von menschlicher DNA von besonderer Brisanz, da ausgehend von den Ergebnissen einer DNA-Analyse Entscheidungen und Diagnosen von grorjer Tragweite getroffen werden.
4
J iirg vorn Stein
1.3 Was bedeutet integrierte automatische genetische Analy se? Es wurden bereits verschieden Techniken der ,,Automatischen DNA-Analyse" erwahnt: PCR, DNA-Sequenzierung, DNA-Fragmentanalyse. Diese Aufzahlung ist noch nicht vollstandig. Wir mochten in dem vorliegenden Buch dem Leser den gesamten ProzeB der automatischen DNA-Analyse vom biologischen Material bis hin zur Datenauswertung aufzeigen und dabei auch in den einzelnen Kapiteln immer wieder auf die Integration der verschiedenen Teilprozesse hinweisen.
1.3.1 Teilbereiche der molekularen DNA-Analyse Ausgehend vom biologischen Material 1aBt sich die ,,Automatische DNA-Analyse" unterschiedlichster Herkunft in folgende Teilbereiche gliedern:
1. Probenvorbereitung der DNA 2. Unterstutzende Probenvorbereitung durch synthetische hergestellte DNA (DNA-Synthese) 3. Spezifische DNA-Anreicherung mittels PCR 4. Analyse der DNA durch Sequenzbestimmung, GroBenbestimmung oder Quan tifizierung 5. Analyse und Interpretation der Daten Die Probenvorbereitung der DNA beinhaltet die primare Bereitstellung der DNA aus dem biologischen Material. Die DNA mu13 dazu aus Zellkulturen, Gewebeproben oder anderen biologischen Materialien isoliert und so weit aufgereinigt werden, daB sie fur andere, nachfolgende Arbeitsschritte verwendbar wird. Die DNA-Synthese ist eine automatisierte organisch-chemische Herstellung von DNA-Hilfsmolekulen (z. B. DNA-Primern), die fur alle nachfolgenden DNA-Analysemethoden von essentieller Bedeutung sind. Die DNA-Primermolekule werden als sogenannte ,,Starter" (Primer) sowohl fur die Durchfuhrung der PCR als auch fur die DNA-Sequenzierung benotigt. Ausgehend von der isolierten DNA, kann dann ein definierter Zielbereich rnittels der PCR spezifisch angereichert werden und schlieljlich durch die enzymatische DNA-Sequenzierung oder Fragmentanalyse bzw. Quantifizierung analysiert werden. Die gewonnenen Analysedaten werden im letzten Schritt der ,,Automatischen DNA-Analyse" ausgewertet, indem sie mit Datenbanken oder anderen Daten verglichen, editiert und dokumentiert werden.
I Bedarf iind Konzept einer integrierten automatischen DNA-Analyse
5
1.3.2 Das Konzept der Integration In der ,,Automatischen genetischen Analyse" geht der AutomatisierungsprozeB schrittweise voran. Einzelne Teilprozesse, wie die Sequenzanalyse, Fragmentanalyse und DNA-Synthese, sind schon seit einigen Jahren zumindest teilweise automatisiert. Andere Teilbereiche, wie die PCR, Probenvorbereitung und Datenanalyse, sind gerade im Prozel3 der Automatisierung, bzw. Automatisierungslosungen sind in der Entwicklung. Ziel ist es, anwendungsspezifische, komplette automatisierte ,,Analysestrecken" zu schaffen. Dabei ist das Konzept der Integration verschiedener Teilprozesse eine entscheidende GroBe. Die Integration mul3 vorallem folgende Faktoren umfassen: 1. Kompatibilitat der Protokolle und Methoden verschiedener Teilprozesse 2. Standardisierung und Datenkompatibilitat in allen Teilbereichen 3. Ubergreifende und kompatible Automatisierung aller Teilbereiche In den nachfolgenden Kapiteln sol1 an geeigneter Stelle auf diese Punkte hingewiesen werden.
This page intentionally left blank
2 Die DNA-Praparation fur die automatische DNA-Analyse Dagmar Schuster
2.1 Einfuhrung Die erfolgreiche DNA-Analytik setzt eine sorgfaltige Praparation der fur die Reaktion benotigten DNA voraus [l].Eine Reihe von Praparationsmethoden konnen hierfur eingesetzt werden, wobei im Rahmen dieses Kapitels nicht auf jede Methode im einzelnen eingegangen werden kann. Die wichtigsten Praparationsmethoden sollen allerdings kurz beschrieben werden [2]. Neue Technologien sind oft Schrittmacher, gerade fur die biologische und medizinische Forschung. Sie geben den AnstoB zur Entwicklung von neuen oder erleichtern die Anwendung schon bekannter und grundlegender Arbeitstechniken. Die prazise Handhabung von Mikrovolumina unter 1p1 gewinnt bei molekularbiologischen Arbeitsmethoden zunehmend an Bedeutung [3]. Zum einen fur die Erreichung konstant guter Ergebnisse, zum anderen aber auch, um die Volumina von Reaktionsansatzen zu reduzieren, damit Kosten eingespart werden konnen. Das gilt vor allem fur Methoden, bei denen groBe Probenmengen anfallen, wie z. B. die DNA-Sequenzierung und DNA-Fragmentanalyse oder Anwendungen der ,,Polymerase Chain Reaction" (PCR). Automatische Arbeitsstationen fur die ,,Template-Praparation" und die Sequenzierungsreaktionen sind von entscheidender Signifikanz, um einen hohen AusstoB von Proben mit hoher Qualitat und reproduzierbaren Ergebnissen zu ermoglichen [4].Es ist muhsam, in ,,Handarbeit" diese umfangreichen und groBen Projekte abzuarbeiten. Wichtig ist, eine gute Balance zwischen der Reinheit der ,,Template-DNA" und ihren Herstellungskosten zu finden. Ein hoher Aufreinigungsgrad ist immer Voraussetzung fur die automatischen Anwendungen.
2.2 Vektoren fur die DNA-Praparation Der Vektor ist eines der wesentlichen Elemente der Gentechnologie. Vektoren konnen Bakteriophagen (Viren, die kleine Bakterien befallen) und Plasmide (kleine, ringformige geschlossene DNA-Stucke, die neben den eigentlichen Bakterienchromosomen in der Bakterienzelle existieren) sein. An definierten Stellen
8
Dagniar Schicsrer
werden die Vektoren mit Restriktionsenzymen geschnitten, in die hinein dann fremde DNA-Stucke (Inserts) kloniert werden konnen. Die Wiedervereinigung der DNA-Stucke besorgen die DNA-Ligasen. Man erhalt so DNA-Chimare, die alle aus der gesamten Plasmid-DNA und einem fremden DNA-Stuck bestehen. Phagen [5] injizieren ihre DNA einem Bakterium und bringen es dazu, diese viele Male zu kopieren. Plasmide [6] leben in einer eher symbiotischen Beziehung mit der Bakterienzelle, in der sie sich vermehren. Die bekanntesten Vektoren sind: Phagen Die ersten Vektoren, die fur die automatische Sequenzierung benutzt wurden, waren Derivate des Bakteriophagen M13. Die zu sequenzierende DNA wird in die doppelstrangige replikative Form des Virus kloniert, in E. coli transformiert und anschlieaend die Phagenpartikel, die ssDNA tragen, isoliert [7]. ssDNA ist ideal fur die Sequenzierung. Probleme, die durch die Strangtrennung der dsDNA hervorgerufen werden, treten nicht auf. Ein Nachteil ist allerdings, dalj der Klon nur in einer Richtung sequenziert werden kann. Plasmide Bisher wurde eine groBe Anzahl von Plasmidvektoren entwickelt, die Kombinationen von Elementen verschiedener natiirlicher Plasmide darstellen (pUC, pEMBL, Bluescript und pTZ). Wegen ihrer einfachen Handhabung werden Plasmide am haufigsten als ,,Template" fur die DNA-Sequenzierung eingesetzt [S]. Vor allem die Saulenpraparationen (s. 2.4.3) von Plasmid-DNAs setzen sich immer mehr durch [9]. Die doppelstrangigen Plasmidvektoren mussen vor der Sequenzierung denaturiert werden. Sequenziert man mit der T7-DNA-Polymerase, trennt man die Strange mit Hilfe von Natriumhydroxid. Nach der Neutralisation kann der spezifische Sequenzierungsprimer binden. Beim Einsatz der thermostabilen TuqDNA-Polymerase konnen die Strange im Thermocycler hitzedenaturiert werden. Beim Abkuhlen lagert sich der Primer an. Ein separater Denaturierungsschritt ist nicht notwendig. Cosmide Es handelt sich hier um ein Plasmid, das neben den fur seine Vermehrung notwendigen Elementen noch die sog. ,,cos"-Stelle aus dem Lambda-Phagen tragt. Die Gegenwart dieses ca. 400 bp langen Sequenzabschnitts, der die uberstehendcn Enden des Lambda-Genoms einschlient, erlaubt die Verpackung des Cosmids iM vitro in Lambda-Phagenkopfe [lo].
2 Die DNA-Praparation fur die automatische DNA-Analyse
9
2.3 DNA-Praparationdurch PCR Bei der PCR flankieren zwei Primer das zu amplifizierende DNA-Fragment, und sich wiederholende Zyklen auf dem Thermocycler fuhren die Denaturierung der DNA, die Anlagerung der Primer und die Kettenverlangerung rnit einer DNAPolymerase durch [ll]. Das Ergebnis ist eine exponentielle Akkumulation eines spezifischen Bereichs der Ziel-DNA um annahernd 2", wobei n die Anzahl der Zyklen ist (s. Kap. 3). Werden gleiche Konzentrationen der beiden Primer verwendet, entsteht ein doppelstrangiges, symmetrisches PCR-Produkt. 1st ein Primer im Uberschul3 vorhanden, wird ein uberwiegend einzelstrangiges, asymmetrisches Produkt gebildet. Folgendes Ausgangsmaterial kann verwendet werden: 0
Genomische DNA (0,2-1,0 pg) Bakterienkolonie Zellysat Gereinigte Plasmid- oder Phagen-DNA (50-300 pg)
Die PCR macht fur eine Reihe von Anwendungen die Plasmid- oder PhagenDNA-Praparation uberflussig. Als Ausgangsmaterial reicht eine Bakterienkolonie, die das Plasmid oder den Phagen tragt. Sogar PCR-Amplifikate von genomischer DNA konnen direkt fur die DNA-Sequenzierung eingesetzt werden. Inserts, die bereits in die entsprechenden Vektoren kloniert wurden, konnen rnit Standardprimern der Restriktionsschnittstellen vervielfaltigt werden.
2.4 Methoden zur Plasmidpraparation Im folgenden sollen die wichtigsten Plasmid-Praparationsmethoden beschrieben werden. Die Saulen-Praparationen liefern dabei rnit Abstand die beste DNAQualitat [12].
2.4.1 Alkalische Lyse Die alkalische Lyse [13] ist die am haufigsten angewandte Methode fur die Praparation von Plasmid-DNA. Durch die Behandlung mit einer NaOH/SDSLosung werden die Bakterien einer Ubernachtkultur (1,5 ml) lysiert. Nach Zugabe von 5 M Kaliumacetat-Losung stellt man die Probe fur 5 min auf Eis und entfernt die chromosomale DNA und die bakteriellen Proteine durch eine kurze Zentrifugation aus der Losung. Der in ein neues Rohrchen transferierte Uberstand wird rnit 1 Volumen Isopropanol gefullt. Das Sediment wird rnit 70% Ethanol gewaschen und anschlierjend in TE-Puffer gelost. Sol1 die RNA vollstan-
10
Dagmar Schiister
dig entfernt werden, ist ein RNase-Verdau zu empfehlen. AnschlieBend wird die Plasmid-DNA erneut gefullt und resuspendiert. Der Ertrag liegt bei ca. S pg.
2.4.2 Boiling-Methode 5 ml LB-Medium, das rnit dem entsprechenden Antibiotikum supplementiert ist, wird rnit einer Einzelkolonie angeimpft und uber Nacht bei 37 "C geschuttelt (Ubernachtkultur). 1,5 ml der Ubernachtkultur wird in ein Eppendorf-Rohrchen transferiert und zentrifugiert. Die Zellen werden durch die Zugabe eines Lysispuffers und kurzes Erhitzen auf 100 "C lysiert [ 141. Nach der Zentrifugation wird das Pellet gewaschen und in einer entsprechenden Menge TE-Puffer aufgenommen. Die Ausbeute an Plasmid-DNA betragt im Durchschnitt 5 pg.
2.4.3 Aufreinigung der Plasmid-DNA iiber Saulen Saulcnaufreinigungen [12] garantieren eine DNA rnit sehr hoher Qualitat, die fur nahczu alle Applikationen eingesetzt werden kann. Anhand der Saulen der Firma QIAGEN [9] sol1 das Aufreinigungsprinzip erlautert werden (,,QIAwell Plasmid Purification System"). Ausbeuten von 15-25 pg gangiger ,,High-Copy" Plasmide werden bei Verwendung von 5 ml LB-Kulturen erreicht. Wie auch bei den zuvor beschriebenen Methoden geht man von einer Bakterien-Ubernachtkultur aus. Die pelletierte und erneut resuspendierte Bakterienkultur wird auf ein Filtersystem (QIAfilter) aufgetragen. Prazipitierte Ruckstande des Bakterienlysates werden rnit Hilfe dieses Prafiltrationssystems (QIAfilter) zuruckgehalten. AnschlieBend tragt man das Material auf eine Saule auf, die ein Anionenaustauscherharz enthalt. Letzteres besteht aus einer hohen Dichte von positiv geladenen ,,DEAE-Gruppen", die die negativ geladenen Phosphatgruppen des DNA-Stranges binden. Das Harz ist auch in Form eines Streifens erhaltlich. Der Streifen enthalt den Anionenaustauscher in Form einer rnit 3 M entwickelten Membran (QIAwell). Ein Vorteil dieses Materials besteht darin, da die DNA nur mit sehr hohen Salzkonzentrationen gelost werden kann. Verunreinigungen wie RNA, Proteine und Kohlenhydrate lassen sich durch Salzpuffer rnit niederen Konzentrationen entfernen. Die DNA wird dann rnit Hilfe eines hochkonzentrierten Salzpuffers eluiert und rnit Isopropanol gefullt. Kombiniert man QIAwell rnit einem zweiten Streifen (QIAprep), entfallt die zeitaufwendige Isopropanolfullung. QIAprep dient der Entsalzung. Plasmid-DNA wird im Hochsalz von QIAwell eluiert und auf einer Silica-Membran des QIAprep Streifens entsalzt. Doppelstrangige Plasmid-DNA bindet an die Silica-Membran des QIAprep Streifens, so da13 Salze und andere Kontaminationen rnit einem EthanoUWasser Waschschritt entfernt werden. Die Elution erfolgt in 1SO pl
2 Die DNA-Praparation fur die automatische DNA-Analyse
11
1mM Tris (pH 8,5) zur direkten Verwendung in der automatischen Taq-Zyklussequenzierung. Die DNA-Konzentrationen im Eluat liegen bei 150-200 ng/ p1. Samtliche Aufreinigungsschritte lassen sich in einer Vakuumkammer (QIAvac) durchfuhren. Zum einen wird der Flurj der Losungen durch die verschiedenen Membranen erleichtert, zum anderen wird aber auch der direkte Transfer der Losungen von einer Einheit zur nachsten garantiert. Bis zu 96 Proben konnen parallel bearbeitet werden (96-well plate). Der Zeitaufwand betragt 2 Stunden (Abb. 1).
Reurrpendlarung Lyw Und Transfer
1 ,
1 Hochmim Plasmid-DNA
Abb. 1. Das ,,QIAwell Plasmid Purification System".
12
Dagniar Schicster
Der QIAGEN BioRobot 9600, eine Roboter-Workstation, entwickelt fur die Plasmid- Aufreiningung nach dem ,,QIAwell Plasmid Purification System" automatisiert den gesamten ProzeB. GroBe Mengen an ,,Templates", die in der automatischen genetischen Analytik das Ausgangsmaterial darstellen, lassen sich somit schnell und einfach herstellen. In der Illustration ist das ,,QIAwell 96 Ultra Plasmid Purification System" gezeigt. 96 Proben konnen gleichzeitig aufgereinigt werden.
2.5 ,,Solid-Phase"-DNA-Praparation Zur Erzeugung und Aufreinigung von einzelstrangiger DNA konnen ,,Magnetic Beads" eingesetzt werden (Dynabeads@M-280/DYNAL). Dabei handelt es sich um rnit Streptavidin besetzte Eisenoxid-Partikel, die paramagnetischen Charakter besitzen. Streptavidin hat eine extrem hohe Affinitat (KD: 10-15 mol-') und Spezifitat fur Biotin. Der Strang von Interesse muB Biotin am 5'-Ende enthalten. Das 1aBt sich uber die Biotinylierung eines entsprechenden Primers erreichen. Die Biotinylierung ist durch das Anfugen (Addition) eines Biotinamidits im letzten Syntheseschritt an das 5'-Ende des Primers moglich. Zur Generierung von einzelstrangiger DNA wird rnit der Ziel-DNA eine symmctrische PCR durchgefuhrt. Als Ausgangsmaterial ist genomische DNA oder rekombinante DNA (Vektoren) geeignet. Einer der eingesetzten PCR-Primer liegt dabei am 5'-Ende rnit Biotin markiert vor. Nach der Reaktion werden die ,,Magnetic Beads" zum PCR-Ansatz addiert. Wahrend einer 15minutigen Reaktion bei Raumtemperatur (Immobilisierung) bindet das Biotin des PCR-Produktes an das Streptavidin der ,,Magnetic Beads". Nach der Immobilisierung wascht man die DNA, um die Reaktionskomponenten dNTPs, PCR-Primer und den PCR-Puffer zu entfernen. Die Doppelstrangige DNA wird rnit Natriumhydroxid denaturiert und die beiden Strange magnetisch getrennt. Einzelstrang-DNA entsteht zu loo%, die fur die automatische Sequenzierung, sowohl mit der Tuq-DNA-Polymerase als auch rnit der T7-DNA-Polymerase, einsetzbar ist [ 15, 16, 171. Das gesamte Template bei einer Lange von 200-600 bp wird bei der T7DNA-Polymerase eingesetzt, wahrend beim Taq-Enzym in der Regel 30% des Ansatzes ausreichen (s. Kap. 5). In Abbildung 2 ist der Reaktionsmechanismus dargestellt.
2.6 Molekularbiologische Workstation Neue Moglichkeiten zur automatischen DNA-Probenvorbereitung, DNASequenzierung und Anwendungen der PCR durch eine prazise Handhabung von Mikrovolumina unter 1 yl ist durch den ABI Prism 877 ,,Integrated Thermalcyc-
2 Die DNA-Praparation fiir die automatkche DNA-Analyse
13
ler" (PE Applied Biosystems) gewahrleistet. Durch eine bessere Kontrolle der mit dem Pipettieren von Mikrovolumina und beim Thermocycling verbundenen Parameter verbessert diese automatische Arbeitsstation die Datenzuverlassigkeit und die Produktivitat eines Labors.
b
Amplitik8tion
I
1mmobllisierung
Strangtrennung
Feftph.sen-Sequenzicrung
Abb.2. Reaktionsmechanismus ,,Solid-Phase"-DNA-Praparation. Diese Methode garantiert eine hohe DNA-Qualitat, da viele Kontaminationen leicht entfernt werden konnen [lX, 19, 201. Des weitern entfallen zeitaufwendige Arbeitsschritte, wie die Zentrifugation, Phenolextraktion und Ethanolprazipitation (s. 2.4.1 und 2.4.2).
14
Dagtnar Schiistrr
Die Workstation stellt optimierte Protokolle fur die automatische Anwendung der PCR und fur die automatische DNA-Sequenzierung zur Verfugung. Zum einen unterstutzt das System die Zyklussequenzierung von zuvor generierten PCR-Produkten rnit fluoreszenzmarkierten Primern, zum anderen die Zyklussequenzierung rnit fluoreszenzmarkierten Didesoxynukleotiden (Terminatoren). Protokolle rnit flexiblen Parametern steuern die verschiedenen Applikationen. Nachdem der ,,Integrated Thermalcycler" rnit Proben und Reagenzien bestuckt und das Reaktionsprotokoll an der Systemsteuereinheit (MacIntoshTMComputer) gewahlt worden ist, fuhrt das System die Reaktionen parallel und ohne manuellen Eingriff selbstandig durch. In der Sequenzierung sind rnit dem System 24 Reaktionen parallel und bis zu 96 pro Tag moglich. Mit Hilfe der ,,Integrated Thermalcycler" T U R B O Arbeitsplattform konnen die Sequenzierungsreaktionen um das 4fache schneller abgearbeitet werden. Neben einer Thermocyclerplatte rnit 512 Reaktionskammern, wovon 384 fur die Reaktionen eingesetzt werden, sind noch zwei gekuhlte Aufbewahrungsplattformen mit je 96 Reaktionskammern vorhanden. Bis zu 384 Reaktionen rnit fluoreszenzmarkierten Primern und 288 Reaktionen rnit fluoreszenzmarkierten Terminatoren lassen sich durchfuhren. Die Mikrovolumentechnologie erlaubt auljerdem, die Reaktionsvolumina zu senken. Bis zu 50% Reaktionsvolumen spart man gegenuber dem manuellen Ansetzen der Sequenzierungen ein. Anwendungen der PCR sind ebenfalls durchfuhrbar. 2500 PCR-Reaktionen pro Woche konnen im 5 yl-Mal3stab bewaltigt werden. Die verschiedenen Produkte kann man anschliefiend automatisch in einem Reaktionsansatz vereinigen. Die PCR-Applikation 1al3t sich auljerdem rnit den Sequenzierungsprotokollen koppeln. Zuerst wird eine normale PCR-Reaktion durchgefuhrt. Hierbei konnen Plaques oder Kolonien als Ausgangsmaterial eingesetzt werden. Anschlieljend inkubiert man den PCR-Ansatz mit den Enzymen Exonuklease und alkalische Phosphatase [21], um die uberschussigen Primer und Nukleotide zu degradieren. Eine Hitzedenaturierung inaktiviert beide Enzyme, so dal3 eine Taq-Zyklussequenzierung angeschlossen werden kann. In Zukunft werden noch weitere molekularbiologische Arbeitstechniken und Probenvorbereitungen auf der flexiblen Arbeitsplattform durchfuhrbar sein, wie z. B. die TURBO PCR. Das System hat eine modulare Arbeitsflache (Abb. 3), die sehr leicht geanderten Applikalionen angepaflt werden kann. Daruber hinaus beinhaltet die Systemsteuerung uber einen MacIntoshTM-Computerdas notwendige Potential, um flexibel und kreativ zukunftige Applikationen zu steuern. Der Thermocycler ist oben links und die beiden gekuhlten Aufbewahrungsblocke unten links und rechts abgebildet. Die modulare Bauweise der ,,Integrated Thermalcycler"-Workstation ermoglicht eine einfache Anpassung der Hardware an eine Applikation. Der sogenannte Referenzlot dient als Ursprungspunkt fur die Kalibrierung des Roboterarms. Referenzdaten werden an die Systemsteuerung weitergegeben und zur weiteren Kalibrierung des Arms verwendet. Die Thermocyclerplatte besteht aus Aluminium, das rnit einem inerten Polymer beschichtet ist, um optimale Aufheizung und Abkuhlung zu gewahrleisten. Kalte Aufbewahrungsmodule konnen Mikrozentrifugengefafle aufnehmen.
2 Die DNA-Praparation fur die automatische DNA-Analyse
15
Abb. 3. Die modulare Arbeitsflache der ,,Integrated Thermalcycler''-Workstation.
Mit dem ,,Integrated Thermalcycler" wurde ein System entwickelt, das ein exaktes und reproduzierbares Pipettieren und Thermocycling selbst von Submikrolitervolumina ermoglicht. Exaktes und reproduzierbares Pipettieren hangt sowohl von der zuverlassigen Fliissigkeitsforderung und -ansaugung ab, als auch von der exakten Positionierung der Kanulenspitze. Bei ersterem entschied man sich fur eine positive Flussigkeitsverdrangung mit einer Spritzentechnik. Fur den Mikrovoluminabereich ist diese Technologie wesentlich genauer als die Luftverdrangungstechnik. Ebenfalls zur Erzielung einer hohen Genauigkeit bei der Pipettierung wurde ein Roboterarm mit einer einzigen Kanule entwickelt, die automatisch und regelmarjig mit den verschiedenen Arbeitsflachenmodulen kalibriert wird. Da die Kanule aus rostfreiem Stahl gefertigt ist, besitzt sie die Leitfahigkeit, die notwendig ist, um bei der Beruhrung einer Flussigkeitsoberflache eine Leitfahigkeitskapazitatsanderung zu erzeugen. Durch diese Leitfahigkeitsanderungsmessung kann die Kanule die Flussigkeitsoberflache aufspuren und sich exakt positionieren (Abb. 4). Die exakte Positionierung des Roboterarms mit der Kanule ist aus zwei Grunden fur die Pipettierung von Mikrovolumina wichtig. Durch die Vermeidung des Eintauchens in die Flussigkeit wird eine Flussigkeitsverschleppung durch die Kanule verhindert. Zusatzlich positioniert sich die Kanule uber dem optimalen Bereich der ReaktionsgefaBe bzw. der Mikrotiterplattenbohrung.Wenn zum Beispiel 0,5 p1 zu einer Probe von 2 p1 pipettiert werden sollen, so ist dieser Bereich
16
Dri,yiiirir
Schirsrer
am Bodcn des ReaktionsgefaBes nur 0,2-0.6 mm grolj. Nur durch diese innovative automatische Roboterarmpositionierung uber Leitfahigkeitsmessung und Selbstkalibrierung konnen diese kleinen Volumina exakt pipettiert werden. Diese Technik ermoglicht es ebenfalls, ohne Pipettenspitzen als Verbrauchsartikel auszukommen. da die Kanule nicht in die Flussigkeit eintaucht. Mit der einzigen Kaniilc konnen genugend Reagenzien aus den temperierten VorratsgefaBen aufgenommen werden, um in einem Zyklus mehrere Proben damit zu beliefern.
Ahh.4. Die innovative Pipettiertcchnik dcs ,.Integrated Thermalcycler" 877: Roboterarm und
Edelstahlkanule.
Dadurch wird die Bewegung des Roboterarms minimiert. Zeit gespart und reproduzierbar hintereinander pipettiert. Jede automatische molekularbiologische Arbeitsoberflache muB uber die Moglichkeiten cines schnellen und reproduzierbaren Thermocyclings verfugen. ohne daB Vcrdunstung und Kondensation auftreten. Dies ist besonders kritisch bei Volumina unter 1 0 ~ 1 .Deshalb wurden Thermocyclerplatten mit 96 bzw. 512 Reaktionskammern aus Aluminium mit einer inerten Polymerbeschichtung entwickelt. Diese Platten ermoglichen Aufheiz- und Abkuhleharakteristiken, die mit herkbmmlichen KunststoffgefaBen und Mikrotiterplatten nicht erreicht werden kiinnen. Der Deckel ist mit einer Dichtung ausgestattet, die ein Verdampfen der Probe minimiert und ein uberschiehten mit 01 nicht mehr notwendig macht. Zur Vcrmeidung von Kondensation am Deckel wird dieser stets auf cine etwas hiihere Temperatur erhitzt. Die speziell entwickelten Reaktionskammern des Thermocyclers verjungen sieh am Boden, so daB die Reaktionsflussigkeit genau von der Pipettiersonde geortet werden kann. GroBere Reaktionskammern wurden die Gefahr von Pipettierfehlern aufgrund von Oberflachenkraften erhohen. Wcitere molekularbiologische Arbeitsstationen wurden von den Firmen Beckmann (Biomek). Amersham (Vistra Labstation) und Qiagen (BioRobot 9600) entwickelt.
2 Die DNA-Praparation fur die automatische DNA-Analyse
17
2.7 Auswirkungen der DNA-Template-Qualitat auf die automatische DNA-Sequenzierung Ein wichtiger Faktor in der DNA-Aufreinigung ist die Qualitat der ausgehenden Bakterienkultur. Zwei Elemente sind entscheidend: Zum einen der Wirtsstamm und zum anderen die Wachstumsbedingungen [2]. Plasmide, die in den Stammen DH1, DHSa, C600 und XL1-Blue wachsen, konnen sehr leicht aufgereinigt werden. Dagegen zeigen HBlOl Stamme und deren Derivate grolje Mengen an Kohlenhydraten, die wahrend der Zellyse freigesetzt werden. Sie konnen bei nicht vollstandiger Entfernung die Template-Qualitat beeinflussen. Bakterienkulturen sollten nur von einer einzigen Kolonie wachsen. Subkulturen eigenen sich oft nicht als Ausgangsmaterial (Glyzerin-Stocks und flussige Kulturen). Die Antibiotikaselektion ist ebenfalls von groljer Bedeutung. Entfallt eine effektive Selektion konnen sich die Zellen ohne Plasmide stark vermehren, so dalj sich die Plasmidausbeute reduziert. Kontaminationen, wie RNA, Polysaccharide, Proteine, Salze oder Ethanol in der DNA-Losung inhibieren die Polymeraseaktivitat. Das wiederum fiihrt zu vorzeitigen und unspezifischen Terminationen, was vor allem bei der farbstoffmarkierten Primer-Chemie storend wirken kann. Diese unspezifischen Terminationen sind beim Einsatz von farbstoffmarkierten Terminatoren unsichtbar. Salzverunreinigungen fuhren zu schwacheren Signalintensitaten, verkiirzten Leseweiten, und die Lesegenauigkeit ist erheblich reduziert. Je hoher die Salzkonzentrationen, um so schlechter die Resultate. Diese Art von Verunreinigungen lassen sich durch ein unzureichendes Waschen mit Ethanol oder durch ein nicht vollstandiges Entfernen des Uberstandes erklaren. Ethanolverunreinigungen reduzieren die Peakhohen, so da13 auch hier die Leseweite stark abnimmt. Diese Kontaminationen treten durch das unvollstandige Trocknen des DNA-Pellets auf, so dalj Spuren von Ethanol im Eluat vorliegen. Werden die oben genannten Faktoren beachtet, besitzt man ein qualitativ hochwertiges DNA-Template, das sich fur die automatische DNA-Analyse problemlos einsetzen laljt (s. Kap. 5 und 6).
2.8 Literatur [I] Hunkapillar, T. et al., ,,Large-Scale and Automated DNA Sequence Determination" Science 254 (1991), 59-67. [2] Sambrook, J. et al., ,,Molecular Cloning: A Laboratory Manual" Cold Spring Harbor Press, Cold Spring Harbor (1989), New York. [3] Pettersson, B. et. al., ,,Direct automated solid phase sequencing of an in vitro amplified segment of 16s rDNA from bacteria ECB6" Proceedings of the 6th European Congress on Biotechnology (1994), ed. by Alberghina, L. et al., 359-362.
18
Dagmar Schuster
[4] Olsvik, 0. et al., ,,Magnetic separation techniques in diagnostic microbiology" Clinical Mikrobiology Reviews 7 (1994), 43-54. [5] Enquist, L., Sternberg, N., ,,In vitro packaging of Lambda Dam Vectors and their use in cloning DNA fragments" Methods in Enzymology 68 (1980), 281-298. [6] Bolivar, F. et al., ,,Construction and characterization of new cloning vehicles. 11. A multipurpose cloning system" Gene 2 (1977), 95-113. [7] Vieira, J., Messing, J., ,,Bacteriophage M13" Methods Enzymol. 153 ( 1987), 3-11. [8] Chen, E.Y.,Seeburg, P.H., ,,Plasmid DNA for DNA-Sequencing" DNA 4 (1985), 165-170. [9] Qiagen Sequencing Guide ,,The Qiagen Guide to Template Purification and DNA Sequencing" (1995). [lo] Meyerowitz, E.M. et al., ,,A new high capacity cosmid vector and its use" Gene 11 (1980), 211-282. [l 11 Gibbs, R.A., ,,Perspective: Analytical Biotechnology: DNA amplification by the polymerase chain reaction" Anal. Chem. 63 (1990), 1202-1214. [12] Hradetzky, D. et al., ,,Taq Cycle Sequencing of Plasmid DNA Purified by Various Procedures" BFE 9 (1992), 471472. [13] Birnboim, H.C., Doly, J., ,,A rapid alkaline extraction method for screening recombinant plasmid DNA" Nucleic Acids Res. 7 (1979), 1513-1523. [14] Del Sal, G. et al., ,,A one-tube plasmid DNA mini-preparation suitable for sequencing" Nucleic Acids Res. 16 (1988), 1013. [15] Applied Biosystems, Inc., DNA Sequencing, ,,Magnetic beads [Dynabeads@] used as solid support in purification and cycle sequencing of PCR products" User Bulletin 21 (1992). [16] Tong, X., Smith, L.M., ,,Solid phase purification in automated DNA sequencing" DNA sequence 4 (1993), 151-162. [17] Perkin Elmer - Applied Biosystems Division, Technical Booklet, ,,Mitochondria1 DNA Sequencing" (1995). [ 181 Kaneoka, H. et al., ,,Solid-Phase Direct DNA Sequencing of Allele-Specific Polymerase Chain Reaction Amplified LA-DR GenesSelected" BioTechniques 497 (1992), 113-122. [I91 Hultman, T. et al., ,,Direct solid phase sequencing of genomic and plasmid DNA using magnetic beads as solid support" Nucleic Acids Res. 17 (1989), 49374946. [20] Hultman, T. et al., ,,Bidirectional solid phase sequencing of in vitro-amplified plasmid D N A BioTechniques 10 (1991), 84-93. [21] Werle, E. et al., ,,Convenient single-step, one tube purification of PCR products for direct sequencing" Nucleic Acids Res. 22 (1994), 43544355.
3 Die PCR als Grundlage in der molekularen DNA-Analyse Thomas Schild Im Jahre 1985 wurde von Wissenschaftlern der Firma Cetus in Kalifornien eine neue Labortechnik entwickelt, die nur vier Jahre spater von der renommierten Zeitschrift ,,Science" zur Methode des Jahres 1989 gekurt wurde [l]. Obwohl ihr geistiger Vater Kary B. Mullis im Jahre 1993 fur seine Entdeckung dieser Form der Zn-vitro-Vervielfaltigungvon DNA den Nobelpreis fur Chemie verliehen bekam, war er zunachst von seiner Idee alles andere als uberzeugt: Sie erschien ihm schlichtweg als zu einfach [2]. Heute, nur 10 Jahre nach ihrer Entdeckung, ist die Polymerase-Kettenreaktion (engl. Polymerase Chain Reaction, kurz PCR), nicht mehr aus der molekularbiologischen, biochemischen und medizinischen Forschung wegzudenken. Daruber hinaus ist sie zu einer Routinemethode in der medizinischen Diagnostik und der Forensik geworden und findet auch in anderen Disziplinen wie der Tier- oder Pflanzenzuchtung verbreitet Anwendung.
3.1 PCR - das Grundprinzip PCR ist eine Methode, die es ermoglicht, definierte Abschnitte auf der DNA mit einer hohen Spezifitat in vitro, also im ReaktionsgefaB, enzymatisch zu vervielfaltigen. Dies wird uber sich wiederholende, automatisierbare Zyklen erreicht, bei denen sich die Anzahl der DNA-Kopien mit jeder neuen Runde verdoppelt. Ein Zyklus besteht im Prinzip aus drei Teilschritten: Denaturierungsschritt: Auftrennung des DNA-Doppelstranges bei einer Temperatur von > 92 "C in seine beiden Einzelstrange. Primer-Anlagerungsschritt (Annealing): Beim Abkuhlen auf eine niedrige Temperatur (37-72 "C) lagern sich zwei sequenzspezifische Primer an die Zielregion auf den beiden DNA-Einzelstrangen an. Sie flankieren den zu amplifizierenden DNA-Abschnitt und begrunden somit die Spezifitat der Reaktion. Primer-Extensionsschritt: Bei einer Temperatur von 72 "C erfolgt mit Hilfe einer DNA-Polymerase ausgehend von den beiden Primern die Kettenverlangerung, wodurch der Zyklus abgeschlossen wird. In den nachfolgenden Zyklen dienen die neusynthetisierten DNA-Strange jeweils als neue Matrizen. Abbildung 1 zeigt ein Schema zum Ablauf einer PCR. Die im ersten Zyklus einer PCR hergestellten Kopien der Matrize besitzen noch keine definierte Lange. Im zweiten Zyklus werden bereits teilweise Kopien her-
20
Thomas Schild
gestellt, die einen Einzelstrang der korrekten Lange enthalten. A b dem dritten Zyklus werden schliel3lich die gewunschten Produkte definierter GroBe hergestellt. Im Idealfall wird wahrend dieses Vorganges eine exponentielle Akkumulation des Zielbereichs um annahernd 2" erreicht. Dabei steht n fur die Anzahl der Zyklen, die durchlaufen werden. Von einer einzigen in die PCR eingesetzten Matrize werden somit nach 35 Zyklen theoretisch bis zu mehr als 34 x lo9 Kopien produziert. In der Praxis wird eine 100%ige Ausbeute jedoch nicht erreicht. Die tatsachliche Effizienz der
-
Zielbereich
Denaturierung
Primer-Anlagerung
1. Zyklus
Denaturierung, Primer-Anlagerung,& Primer-Extension
2. Zyklus
I
n Zyklen
Abb.1. Schematische Darstellung der PCR. Der Zielbereich auf der DNA ist farbig dargestellt. Die Primer-Sequenzen sind griin bzw. blau hervorgehoben. WeiRe Dreiecke symbolisieren die freien 3'-OH-Enden der Primer, an denen die im Reaktionsansatz enthaltenen freien Nukleotide angehangt werden. Graue Ovale reprasentieren die Taq-DNA-Polymerase.
3 Die PCR als Grundlage in der rnolekularen DNA-Analyse
21
PCR liegt ublicherweise zwischen 70 und 80% [3]. Betrachtet man die Anreicherung von Kopien der Zielsequenz als eine Funktion der Zyklenzahl n (Abb. 2), so verlauft die Reaktion in den ersten Zyklen tatsachlich annahernd exponentiell, flacht dann jedoch zunehmend ab und erreicht schliefllich ein Plateau. Fur diesen sogenannten ,,Plateau-Effekt" gibt es eine Reihe von Grunden, die sich insbesondere in den spaten PCR-Zyklen auswirken. So kommt es durch die millionenfache Vervielfaltigung des Zielbereichs im Verlauf der Reaktion einerseits zu einem Anstieg der Schmelztemperatur (T,) der Doppelstrang-DNA-Molekiile. Damit sinkt jedoch andererseits die Effizienz des Denaturierungsschrittes, da im allgemeinen die Denaturierungstemperatur wahrend der PCR nicht verandert wird. Mehr noch wird durch die zunehmende Kopienzahl das Reannealing der Produktstrange als Konkurrenzreaktion zur Primer-Anlagerung zu einem Problem, welches durch die fortschreitende Abnahme der Primer-Konzentration im Verlauf der Reaktion sogar noch verstarkt werden kann. Das PCR-Enzym der Wahl, die T'q-DNA-Polymerase, ist zwar ein thermostabiles Enzym, jedoch kommt es trotzdem durch den HitzestreS wahrend der PCR zu einer fortschreitenden thermischen Inaktivierung von Enzymmolekulen (die Halbwertszeit von Zahl der Kopien (N) 10''
10
10
10
No =
lo3
10
20
30
40
50
60
Zahl der Zyklen (n)
Abb. 2. Graphische Darstellung der Anreicherung einer definierten Zielsequenz ausgehend von einer bestimmten zu Beginn der Reaktion eingesetzten Kopienzahl No als Funktion der Zyklenzahl n.
22
Thomas Schild
ArnpliTaqO DNA Polymerase bei 95°C betragt 40 min). Als Folge der zunehrnenden Produktanreicherung sowie der stetig abnehrnenden Anzahl biologisch aktiver Enzymmolekule kann schlieBlich die T'q-DNA-Polymerase zurn lirnitierenden Faktor werden. Ein Rechenbeispiel soll dies verdeutlichen: Ublicherweise werden zu einem 100 pl PCR-Ansatz 2-2,5 U Tuq-DNA-Polymerase zugesetzt, was ungefahr einer Konzentration von M entspricht. Dern Ansatz in diesem Beispiel soll 1 p g eukaryontischer genornischer DNA zugegeben werden, was etwa 3 x lo5 Kopien eines Single-copy-Gens entspricht. Nach etwa 20 PCR-Zyklen erreicht die arnpliM, was der Anfangsfizierte Zielsequenz bereits eine Konzentration von ca. konzentration der T'q-DNA-Polymerase entspricht. Vergleicht man nach 25 Zyklen die Anzahl der Molekule, so stehen ca. 2,2 x 10l2 Molekule des Zielbereichs nur 8,01 x 10" Enzymmolekulen gegenuber, was einem deutlichen rnolaren UberschuB entspricht. Als Folge sinkt die Effizienz der PCR. In den spaten PCR-Zyklen, insbesondere wenn uber das Plateau hinaus amplifiziert wird, kornmt schlieBlich noch eine Eigenschaft der T'q-DNA-Polymerase zur Geltung, die gerne ubersehen wird: Ihre 5'-3'-Exonukleaseaktivitat. Wahrend des Produkt-Reannealings, aber auch bei stabilen Sekundarstrukturen im Zielbereich, kann diese Enzyrnaktivitat zu einem Verdau der Matrizen durch die Taq-DNA-Polymerase fuhren. Die Reaktion verlauft daher in den spaten Zyklen einer PCR nur noch linear, ja es kann sogar bei einer Amplifikation in das Plateau hinein zu einer Abnahme der Kopienzahl komrnen. Die Anzahl der Zyklen, die durchlaufen werden rnussen, urn ein nachweisbares PCR-Produkt zu erhalten und dabei nicht in das Plateau hinein zu amplifizieren, richtet sich insbesondere nach der Menge an eingesetzten Matrizenrnolekulen. So werden bei relativ geringen Mengen (1-100 Matrizen) zwischen 30 und 45 Zyklen benotigt. Liegen hingegen groBe Mengen vor (1 000-100000 Matrizen), so genugen bereits 20-30 Zyklen. Ursprunglich wurde das Klenow-Fragment der E.coli DNA-Polymerase I zur Durchfuhrung der Reaktion verwendet [4]. Dieses Enzyrn hat jedoch einige Nachteile (s. Tab. l ) , die alle Versuche scheitern lieBen, die PCR zu autornatisieren. Erst mit der Einfuhrung der therrnostabilen DNA-Polymerase des Mikroorganismus Thermus aquaticus - Taq-DNA-Polymerase - wurde es moglich, die PCR zyklisch ohne erneute Enzyrnzugabe nach jedem Denaturierungsschritt durchzufuhren. Die PCR konnte ihren Siegeszug antreten.
3.2 Automatisierung der PCR Zur Autornatisierung der sich periodisch wiederholenden Heiz- und Kuhlvorgange wahrend einer PCR werden prinzipiell zwei Konstruktionslinien verfolgt: Bei der ersten wird der zyklische Temperaturwechsel dadurch erreicht, daB die Proben rnechanisch zwischen verschiedenen, definierten Temperaturbereichen hin- und hertransportiert werden. Vorteil dieser Roboter ist ein sehr schneller
3 Die PCR als Grundlage in der molekularen DNA-Analyse
23
Temperaturwechsel, ein groBer Nachteil jedoch der Transport und die damit verbundene fehlende Kontrolle der Probentemperatur wahrend dieses Zeitraums. Deshalb hat sich auf dem Markt die zweite Konstruktionslinie mit periodisch heizenden bzw. kuhlenden Systemen durchgesetzt. Tab. 1. Vergleich zwischen Klenow-Fragmentund Taq-DNA-Polymerase. Klenow-Fragment
Taq-DNA-Polymerase
Thermolabil - nach jedem Hitzedenaturierungsschritt erneute Enzymzugabe notig
Thermostabil- automatisierbar,nur einmalige Enzymzugabe erforderlich
Geringe Spezifitat - enger, auf niedrige Temperaturen beschrankter Bereich von Primeranlagerungstemperaturenfordert falsches Annealing
Hohe Spezifitat - groRer Bereich von Primeranlagerungstemperaturenfordert Spezifitat
Hoher unspezifischer Hintergrund
Je nach Optimierung niedriger bis kein Hintergrund
Schlechte Produktausbeute
Hohe Produktausbeute
Amplifikatlange max. einige hundert bp
Amplifikate von mehreren kb Lange
Diese sogenannten ,,Thermocycler" arbeiten je nach Hersteller wiederum nach verschiedenen Prinzipien. So gibt es z. B. Thermocycler, deren Thermoblocke eine schwarze Oberflache besitzen, die mittels einer Lichtquelle aufgeheizt und uber einen Ventilator gekuhlt wird. Andere wiederum machen sich sogenannte ,,Peltier-Elemente" zunutze, die aus zwei unterschiedlichen, miteinander verbundenen Metallen bestehen. In Abhangigkeit von der Stromrichtung wird die Verbindungsstelle zwischen den beiden Schichten aufgeheizt bzw. abgekuhlt. Vorteile von Peltier-betriebenen Thermocyclern sind ihre Kompaktheit und Flexibilitat. Allerdings fuhrt der permanente Temperaturwechsel an den Verbindungsstellen zu Abnutzungserscheinungen, in deren Folge das Temperaturverhalten der Gerate trager wird. Eine dritte Konstruktionsform schlieBlich verwendet elektrische Widerstande zum Aufheizen, jedoch ein getrenntes Kuhlsystem wie das eines Kuhlschrankes zum Herunterkuhlen der Proben. Vorteil dieser Bauart ist ein ausgezeichnetes Temperaturverhalten der Systeme, jedoch bedingt das separate Kuhlsystem, daB diese Thermocycler groBer und schwerer sind. Die Zeit, die der Thermocycler zum Aufheizen bzw. Abkuhlen benotigt, wird im allgemeinen als ,,ramp time" bezeichnet. Sie ist bei hochwertigen Geraten so kurz wie moglich gehalten und laBt sich bei einigen modernen Systemen fur spezielle Applikationen dariiber hinaus auch frei programmieren. Sehr wichtig ist bei Thermocyclern die Temperaturuniformitat uber den Block. In ihrer Reproduzierbarkeit anspruchsvolle PCRs, wie die RAPD-Analyse (Random Amplified Polymorphic DNA, S. 16) lassen dies besonders deutlich werden [5]. Moderne
24
Thornus Schild
Thermocycler besitzen im allgemeinen einen beheizbaren Deckel, der die Reaktionsansatze von oben so stark erhitzt, daB Konzentrationsveranderungen im Ansatz durch Verdunstungs- und Kondensationsvorgange vermieden werden und somit eine Oluberschichtung der Proben, wie noch bei Geraten der ersten Generation notig, iiberflussig wird. Neben Blocken fur konventionelle ReaktionsgefaBe gibt es mittlerweile auch solche im 96er-Mikrotiterformat, die einen erhohten Probendurchsatz erlauben. Die neuesten Entwicklungen ermoglichen sogar die Durchfuhrung einer sogenannten In-situ-PCR auf Objekttragern. Damit kann das Amplifikationssignal einzelnen Zellen zugeordnet werden, was insbesondere fur die Pathologie von Interesse ist. Die Vorbereitung der Proben, sprich das Pipettieren der einzelnen Ansatze, kann bei hohem Pipettieraufkommen mittlerweile auch von Robotstationen ubernommen werden. Die fertigen Ansatze werden dann in einen integrierten bzw. in einen externen Thermocycler uberfuhrt. Reaktionsansatz (25-200 pl) bestehend aus: DNA-Polymerase (2 U/100 pl) DNA-Matrize (> 1 pg genornische DNA) Primer (je 0,1-1,0 mM) dNTPs (je 200 pM,pH 7 ) 1 x Puffer (50 mM KCI, 10 rnM Tris-HCI pH 8,3, 1,5 rnM MgC12, 0,001% (w/v) Gelatine Bei Verwendung von Thermocyclern ohne beheizten Deckel ist eine Mineraloluberschichtung (40-100 pl) erforderlich, urn Kondensationsvorgange zu verhindern. Abb. 3. Typische Komponenten eines PCR-Ansatzes.
3.3 Optimierung von PCR-Reaktionen 3.3.1 Reaktionsparameter Die Optimierung einer PCR ist ausschlaggebend fur die Effizienz wie auch fur die Spezifitat der Reaktion. Im Verlauf des folgenden Abschnitts sollen daher zunachst die verschiedenen Parameter, die hierbei von Bedeutung sind, eingehend betrachtet werden. (1) DNA-Matrize
Die einzelnen Reaktionskomponenten eines PCR-Ansatzes und ihre typischen Konzentrationen sind in Abb. 3 zusammengefafit. Insbesondere bei der Herstellung langerer Amplifikate (> 5 kb) wird die Qualitat der DNA-Matrize zu einem wichtigen Faktor. Die Wahl Anwendung bestimmter organischen Losungsmittel
3 Die PCR als Grundlage in der molekularen DNA-Analyse
25
wahrend der DNA-Isolierung, oder schonender Methoden wie Dialyseverfahren zur Reduzierung der mechanischen Scherkrafte konnen hierbei hilfreich sein. Die DNA selbst kann aus den unterschiedlichsten Quellen stammen, so z. B. aus Viren, Mikroorganismen sowie Gewebe- und Zelltypen von verschiedensten Tier- und Pflanzenarten. (2) PCR-Primer Fur die richtige Auswahl von PCR-Primern gibt es einige Regeln, die im folgenden aufgefuhrt werden sollen. Mehrere unterstutzende Computerprogramme (OLIGO, National BioSciences; GeneWorks und PCGene, Intelligenetics) haben sich in diesem Zusammenhang ebenfalls als niitzlich erwiesen. Primer ab 18 nt Lange gewahrleisten bereits eine ausreichende Spezifitat der Reaktion. Ab ca. 28-30 nt Lange ist jedoch keine weitere Zunahme der Spezifitat zu verzeichnen. Die Lange der beiden Primer und ihre Basenzusammensetzung sollten moglichst identisch sein. Ihr GC-Gehalt liegt iiblicherweise zwischen 5040%. Die beiden Primer miissen so konstruiert werden, daB auch ihre Schmelztemperaturen T, ahnlich sind. Von der Vielzahl von Formeln zur Berechnung der T, lautet die einfachste T, = 2 (A+C) + 4 (G+C) -5 "C, wobei die Differenz von 5°C im Vergleich zur ursprunglichen Formel [6] nur einen Ausgangswert zur anschlieBenden experimentellen Optimierung der Annealing-Temperatur liefert. Kompliziertere Formeln [7, 81 beriicksichtigen auBerdem noch Salzkonzentrationen des Puffers sowie weitere thermodynamische Daten von Oligonukleotiden. SchlieBlich sollte noch beachtet werden, daB sich am 3'- bzw. am 5'-Ende der Primer keine Poly(T)-Bereiche befinden, da Thymidin-Reste zur Ausbildung unspezifischer Bindungen neigen. Insbesondere bei langeren Primern sollte beriicksichtigt werden, daB keine palindromischen Bereiche vorkommen, da diese zur Ausbildung von Haarnadelstrukturen aufgrund selbstkomplementarer Riickfaltung tendieren. Um der Entstehung von Primer-Dimeren vorzubeugen, ist es schlieBlich unerlaBlich, die Primer auf Intra- bzw. Inter-Primer-Komplementaritat zu iiberpriifen. (3) Desoxynukleosidtriphosphate Hochreine Desoxynukleosidtriphosphate werden von verschiedenen Herstellern, entweder als vier separate Stammlosungen oder bereits als Mischung derselben, angeboten. Sie sind zumeist bereits auf einen neutralen pH-Wert von 7,O eingestellt. Falls nicht, sollte dies nachgeholt werden. Obwohl die Tuq-DNA-Polymerase bei niedrigeren dNTP-Konzentrationen (10-50 pM) mit hoherer Genauigkeit arbeitet, werden iiblicherweise Konzentrationen von 20-200 pM je dNTP empfohlen.
(4)lox PCR-Puffer In der PCR werden zumeist zehnfach konzentrierte Puffer eingesetzt, die vor Gebrauch im Verhaltnis 1:lO (v/v) verdunnt werden miissen. Der Standard 1OxPuffer der AmpliTaq@DNA Polymerase ist folgendermanen zusammengesetzt:
26
Thomas Schild
M
1
2
3
4
5
6
Abb.4. EinfluR der Enzymkonzentration auf die Amplifikation (M: Langenstandard, Spuren 1-6 gleiche Aliquots von Proben mit lU, 2 U. 4 U, 7 U, 10 U und 15 U AmpliTaqO D N A Polymerase im Reaktionsansatz).
100 mM Tris-HC1, pH 8,3 bei Raumtemperatur 500mMKC1 15 mM MgCI2 0,01% (w/v) Gelatine
( 5 ) Enzymkonzentration Ein weiterer Parameter fur die Optimierung einer PCR ist die Enzymkonzentration. Fur einen 1 0 0 ~ PCR-Ansatz 1 liegt die einzusetzende Menge an Tuq-DNAPolymerase im Bereich von 1-2,5 U Enzym. Es empfiehlt sich fur das jeweilige PCR-System eine Titrierung von 0,5-5 U Tuq-DNA-Polymerase durchzufuhren. Wird zu vie1 Enzym eingesetzt, so fordert dies Unspezifitat. Zu wenig Enzym verschlechtert hingegen die Produktausbeute (s. Abb. 4).
3 Die PCR als Grundlage in der molekularen DNA-Analyse
27
(6) Magnesiumchlorid Die Tuq-DNA-Polymerase benotigt freies Magnesium als Kofaktor zum Einbau von Nukleotiden an das 3'-Ende der wachsenden Kette. Die Magnesiumionenkonzentration muB deshalb uber der dNTP-Konzentration liegen, da deren negative Ladungen Mg2'-Ionen binden. Ublicherweise liegt die Konzentration des freien Magnesiums etwa um 0,5-2,5 mM uber der dNTP-Konzentration: Befinden sich z. B. 0,8 mM (0,2 mM fur jedes dNTP) dNTPs im Ansatz, so ist eine MgKonzentration von ca. 1,5 mM (in Abhangigkeit vom verwendeten PCR-System) optimal. Deshalb sollte bei einer Reduzierung der dNTP-Konzentration ebenfalls die Magnesiumkonzentration verringert werden. Auch die Anwesenheit von Chelatbildnern in Puffern, wie z. B. EDTA in TE-Puffer, fuhrt zu einer Verrin e rung der Magnesiumkonzentration. Im allgemeinen fuhrt eine zu hohe Mg Konzentration zu unspezifischen Produkten, eine zu niedrige hingegen zu einer schlechten Produktausbeute.
9+:
(7) PCR-Forderer und -1nhibitoren AuBer den beschriebenen Standardkomponenten der PCR gibt es noch eine ganze Reihe von Additiven und Reagenzien, die einen fordernden bzw. einen hemmenden EinfluB auf den Verlauf der Reaktion ausuben konnen. Die Wirkungsweise von PCR-fordernden Substanzen ist zumeist nicht oder nur unbefriedigend aufgeklart. Daruber hinaus ist ihre Wirkung oftmals nicht garantiert, d. h. in vielen Fallen nicht auf die Bedingungen einer anderen PCR ubertragbar. Ein Beispiel fur einen kommerziell erwerblichen PCR-Forderer ist Perfect Match@ (Stratagene). Sehr gut untersucht ist hingegen der enzymstabilisierende EinfluB von Glycerin. So erhoht sich die Halbwertszeit von Tuq-DNA-Polymerase bei 95 "C in Gegenwart von 10% Glycerin von 40 min auf uber 60 min. DMSO wird oftmals zur Auflosung storender Sekundarstrukturen innerhalb der Matrize PCR-Ansatzen hinzugegeben. Sein leicht inhibierender EinfluB auf das Enzym sollte dabei berucksichtigt werden. So sinkt die Aktivitat der Tuq-DNA-Polymerase in Gegenwart von 10% DMSO auf 53% [9]. Fur die Isolierung von Nukleinsauren existieren eine Vielzahl unterschiedlicher Arbeitsprotokolle. Eines der am haufigsten verwendeten Ausgangsmaterialien zur DNA-Gewinnung ist Blut. Einige der dabei mit aufgereinigten SubstanZen wirken jedoch inhibierend auf die PCR, so z.B. Heparin, das oftmals zur Gerinnungshemmung frischem Blut zugesetzt wird [lo, 111. In manchen Entnahmerohrchen ist z. B. EDTA zur Koagulationshemmung enthalten. Bei ihrer Verwendung muB berucksichtgt werden, daB Chelatoren die Konzentration des freien Magnesiums im Reaktionsgemisch beeinflussen. SchlieBlich besitzt noch das Eisen der Ham-Gruppe aus den roten Blutkorperchen einen inhibierenden EinfluB, weshalb diese quantitativ aus dem Ansatz entfernt werden mussen. Nichtionische Detergenzien zur Zellyse und Denaturierung (Tween 20, Triton 100) hemmen im allgemeinen die PCR im Bereich von 0,l-3% (w/v) nicht. Ionische Detergenzien wie SDS hemmen hingegen die PCR bereits bei Konzen-
28
Thoinas Schilri
trationen von 0,01YO (w/v). Diese inhibierende Wirkung kann jedoch durch Zusatz nichtionischer Detergenzien (z. B. 0,5% Tween 20) aufgehoben werden.
3.3.2 Optimierungsstrategien Im folgenden sollen diese verschiedenen Parameter zu einer moglichst effizienten PCR-Optimierungsstrategie zusammengestellt werden: 0 0
0
Auswahl eines Primer-Paares nach den oben beschriebenen Parametern. Berechnung des ungefahren T,. Programmierung des Thermocyclers unter Berucksichtigung der Leistungswerte des verwendeten Thermocyclers sowie des eingesetzten Enzyms. Vorbereiten der PCR-Ansatze unter Einsatz der Hot-Start-Technik (s. 3.5.3). Etwa 1O4-lo5 Kopien der Matrize in die Reaktion einsetzen, Negativkontrollen nicht vergessen. Zunachst die Mg2'-Konzentration in 0,5 mM-Schritten im Bereich von 0,5-5 mM variieren. Reaktionsprodukte gelelektrophoretisch uberprufen. 1st das Ergebnis zufriedenstellend, die Mg2'-Konzentration in 0,2-mM-Schritten nach oben und unten weiter optimieren.
Haufig tritt jedoch eines der folgenden Probleme auf. Sie erfordern eine jeweils unterschiedliche Vorgehensweise: (1) Es wurde kein spezifisches Produkt amplifiziert. Statt dessen zeigt das Gelbild mehrere Banden bzw. einen Schmier.
0
0
0
Die Mg2'-Ionenkonzentration auswahlen, bei der die beste Spezifitat mit zufriedenstellender Ausbeute erzielt wurde. Erhohung der Annealing-Temperatur in 2 "C-Intervallen. Das Gelbild sollte jetzt einen deutlich verringerten Hintergrund zeigen, jedoch bei Uberschreiten der optimalen Annealing-Temperatur eine sinkende Produktausbeute. Die optimale Temperatur auswahlen und die Annealing-Temperatur nochmals um f 1 "C variieren. Variieren anderer Komponenten des Reaktionsansatzes, insbesondere Verwendung niedrigerer Enzymkonzentrationen. Immer nur jeweils eine Komponente variieren und genau dokumentieren! Praparatives Gel zur Aufreinigung der Gelbande, die der ProduktgroBe des gewunschten Amplifikates entspricht und Reamplifikation. Reamplifikation von 1: lo4- und l:lO'-Verdunnungen der unreinen ersten PCR uber eine Nested-PCR (s. 3.5.2). Noch einmal von vorne: Auswahl neuer Primer.
3 Die PCR als Grundlage in der molekularen DNA-Analyse
29
(2) Das Gelbild zeigt eine schwache Produktbande, bzw. es ist kein Amplifikat zu erkennen. 0
0
0
0
0
Die Mg2+-Ionenkonzentration auswahlen, bei der die beste Spezifitat bei zufriedenstellender Ausbeute erzielt wurde. Bei gleichem PCR-Programm 5-10 Zyklen addieren und Ergebnis uberprufen. Senken der Annealing-Temperatur in 2 “C-Intervallen. Das Gelbild sollte eine verbesserte Ausbeute zeigen, jedoch bei Unterschreiten der optimalen Annealing-Temperatur einen verstarkten Hintergrund aufweisen, z. B. durch Auftreten unspezifischer Banden. Hohere Matrizenzahl zu Beginn der PCR einsetzen, DNA-Aufreinigung auf PCR-Inhibitoren uberprufen (falls moglich Probenmaterial venvenden, das z. B. uber eine andere PCR garantiert amplifizierbar war). Erhohung der Denaturierungszeit bzw. -temperatur. Variieren anderer Komponenten des Reaktionsansatzes (Enzymkonzentration, dNTPs, Primer, pH-Wert). Anwendung von Additiven bei Pufferherstellung. Reamplifikation von 1:104- und l:105-Verdunnungen der mangelhaften ersten PCR uber eine Nested-PCR (s. 3.5.2). Noch einmal von vorne: Auswahl neuer Primer.
3.4 Optimierung der Amplifikationsprazision Die Prazision (engl. fidelity), rnit der eine definierte Sequenz ausgehend von einer vorgegebenen Matrize wahrend der PCR kopiert und vervielfaltigt wird, basiert prinzipiell auf zwei Parametern: Zum einen entscheidet die Wahl des thermostabilen Enzyms uber die Genauigkeit der Amplifikation, wobei insbesondere das Vorhandensein einer 3’-5’-Exonukleaseaktivitat zur Korrektur falsch inkorporierter Basen entscheidend ist (s. S. 12). Zum anderen ist jedoch der Grad der Optimierung der Reaktion von Bedeutung. Deshalb mussen Veroffentlichungen rnit Aussagen uber die Fehlerrate des verwendeten Enzyms stets im Zusammenhang rnit dem spezifischen experimentellen Ansatz gesehen werden. So schwanken die Berichte uber die Fehlerabschatzung der Taq-DNA-Polymerase zwischen 1/5600 und ca. 1/83000 Fehleinbauten pro eingebautem Nukleotid pro Zyklus [12]. Die Prazision von Enzymen rnit 3’-5’-Exonukleaseaktivitat liegt sogar noch um Faktor 5-15 hoher. Auch der pH-Wert der Reaktion beeinflufit die Prazision, rnit der das Enzym arbeitet. So arbeitet die Tuq -DNA-Polymerase bei einem pH-Wert von 5,7 rnit einer Fehlerrate von nur 1/180000. Jedoch sollte dabei berucksichtigt werden, dal3 ein niedrigerer pH-Wert auch das DNA-Matrizenmaterial schadigen kann. Fur die Optimierung der PCR auf Prazision mussen verschiedene Faktoren berucksichtigt werden. So haben Untersuchungen gezeigt, daB niedrigere balan-
30
Thotms Schild
cierte dNTP-Konzentrationen (10-50 pM) die Fehlerrate wahrend der PCR senken [ 131. Fehleinbauten, die wahrend der Extension auftreten, fordern prinzipiell den Kettenabbruch. Jedoch ist die Wahrscheinlichkeit, mit der ein Kettenabbruch erfolgt, abhangig von der Art der Fehlpaarung (s. Abb. 5 ) .
cc
AG c GA GG
AA <
Kettenabbruch sehr haufig
TC CT c< TT
AC cc CA
GT TG
Kettenabbruch sehr selten
Abb. 5. Haufigkeit des Kettenabbruchs in Abhangigkeit von der Art der Fehlpaarung.
Die Mg2'-Konzentration mu13 in Hinblick auf das im Ansatz vorliegende freie Magnesium entsprechend der niedrigeren Konzentration der dNTPs reduziert werden. Da die Wahrscheinlichkeit, mit der eine falsche Base eingebaut wird, sinkt, wenn weniger Enzymmolekule im Ansatz vorliegen, empfiehlt es sich, die Menge an eingesetztem Enzym auf niedrige Konzentrationen hin zu optimieren. Auch die Annealing- sowie die Extensionszeiten sollten deshalb reduziert werden. Wenn moglich, sollten die Primer so gewahlt werden, dalj auf einen separaten Annealing-Schritt verzichtet werden kann und die Primer-Anlagerung statt dessen mit der Extension kombiniert in einem Schritt durchgefuhrt wird (ZweiSchritt-PCR). Durch die hohere Annealing-Temperatur wird die Spezifitat der Reaktion deutlich erhoht. Ein sehr einfaches Mittel, um eine hohere Lesegenauigkeit zu erzielen, ist, die Zahl der Matrizenkopien zu Beginn der Reaktion zu erhohen. Entsprechend des exponentiellen Charakters der PCR konnen weniger Zyklen gefahren werden, und es werden entsprechend weniger Fehler akkumuliert. Um die DNA zu schonen, sollte die Dauer der Denaturierung schliefllich auf ein notwendiges Minimum reduziert werden.
3.5 Spezielle PCR-Verfahren 3.5.1 Touchdown-PCR Die Touchdown-PCR [14] ist keine Methode zum Ermitteln der optimalen PCRBedingungen im herkommlichen Sinne. Statt dessen ermoglicht ihre Anwendung mit extrem niedrigen Optimierungsaufwand, das gewunschte Amplifikat zu erhalten, sozusagen auf Anhieb ins Schwarze zu treffen. Optimiert wird dabei nur uber die Programmierung des Thermocyclers. Ein Beispiel: Die berechnete T, des verwendeten Primer-Paares sei 60 "C. Die PCR beginnt einige Grad Cel-
3 Die PCR als Grundlage in der molekularen DNA-Analyse
31
sius uber diesem berechneten Wert, z. B. mit 64 "C, und endet mit einer Annealing-Temperatur ca. 10°C unter der T,. Um dies zu erreichen, bieten moderne Thermocycler beim Programmieren die Option, die Annealing-Temperatur pro Zyklus z. B. um 1"C zu senken. 1st dann nach 15 Zyklen in unserem Beispiel die Annealing-Temperatur auf 50 "C gesenkt, so folgen 15 weitere Zyklen bei 50 "C. Da zunachst eine zu hohe Annealing-Temperatur gewahlt wird, wird sichergestellt, darj die ersten Primer-Matrizenhybride unter hochster Spezifitat gebildet werden. Bis eine Annealing-Temperatur erreicht wird, die unspezifische Hybridisierungen zulaflt, wird das spezifische Produkt bereits exponentiell amplifiziert und somit die unspezifischen Produkte, die in den spaten Zyklen entstehen konnen, vernachlassigbar. Da es das Ziel dieser PCR-Methode ist die AnnealingTemperatur zunachst sehr hoch anzusetzen, ist die Anwendung der Hot-StartTechnik (s. 3.5.3) unerlarjlich. Touchdown-PCR empfiehlt sich insbesondere bei der Amplifikation von Genabschnitten aus Multigen-Familien oder der Ubertragung von Primern zur Untersuchung homologer Genbereiche zwischen eng verwandten Spezies. Treten beim ersten Ma1 noch unspezifische Banden auf, so wird einfach durch eine z. B. um 3-4 "C hohere anfangliche Annealing-Temperatur optimiert, um die Herstellung von unspezifischen PCR-Produkten weiter zu reduzieren. Die entsprechende Anzahl der Zyklen mulj dann jedoch vom Ende des Programms abgezogen werden, um eine Amplifikation ins Plateau zu verhindern.
3.5.2 Nested-PCR Ziel einer Nested- bzw. der Seminested-PCR ist es, die Bildung unspezifischer Nebenprodukte signifikant zu verringern sowie die Sensitivitat der PCR um ein Vielfaches zu erhohen [13]. So gelang uber Nested-PCR der Nachweis einer einzigen Kopie eines viralen Gens bei einem Hintergrund von lo6 Genomen [15]. Hierzu wird zunachst mit einem ersten Primerpaar eine Amplifikation unter Standardbedingungen durchgefuhrt. Im Anschlulj an die Reaktion wird ein Aliquot des Ansatzes einer zweiten PCR zugefuhrt. Dabei wird ein weiteres Primerpaar eingesetzt, das intern in das Produkt der ersten Amplifikation hineinverschoben ist. Hierdurch wird die hohe Spezifitat dieser Methode begrundet: Da die zweiten Primer in das Produkt hineinverschoben sind, bieten ihnen unspezifische Produkte aus dem ersten Ansatz nicht mehr genugend komplementare Sequenzen zur Anlagerung. Sie fallen somit als Matrizen im zweiten Ansatz weg. Folge ist ein deutlich reduzierter Hintergrund. Bei einer Seminested-PCR stammt einer der beiden Primer noch aus der ersten Reaktion [16]. Die Anwendung der Methode ermoglicht aufgrund ihrer hohen Sensitivitat den Nachweis eines bestimmten PCR-Produkts selbst dann, wenn die entsprechende Bande im Anschlurj an die erste Amplifikation in einem ethidiumbromidgefarbten Gel nicht sichtbar war und statt dessen der Hintergrund sehr hoch ist. Um jedoch einen hochmolekularen Schmier zu verhindern, empfiehlt es sich,
32
Thomas Schild
die zweite Amplifikation bereits nach 20-25 Zyklen abzubrechen. Zu diagnostischen Zwecken sollte diese Form der PCR nur mit grorjer Vorsicht eingesetzt werden, da durch ihre Sensitivitat die Anfalligkeit gegenuber Kontaminationen wachst.
3.5.3 Hot-Start-Technik Eine Hot-Start-PCR ist spezifischer und effizienter als eine Standard-PCR. Dies wird besonders deutlich, wenn nur wenige DNA-Matrizen in die Reaktion eingesetzt werden. Da ein Teil der genomischen DNA - z. B. durch Ethanol-Fallungen wahrend der DNA-Aufreinigung - einzelstrangig bleibt, konnen sich die PCRPrimer unspezifisch an diese Matrizen anlagern. Tuq-DNA-Polymerase besitzt jedoch auch bei niedrigen Temperaturen eine betrachtliche Aktivitat (bei 22 "C ca. 0,25 Nukleotidek, bei 37°C ca. 1,5 Nukleotide pro Sekunde) [17], weshalb Inkubationen bei Raumtemperatur wahrend der Probenvorbereitung einen erhohten Hintergrund bewirken konnen. Bei der ursprunglichen Form der HotStart-Technik setzte man die Tuq-DNA-Polymerase dem Reaktionsansatz erst dann zu, wenn dieser eine Temperatur erreicht hatte, bei der die Primer nicht mehr unspezifisch an die Matrize binden bzw. sich Primer-Dimere bilden konnten. Das Offnen und Schlierjen der ReaktionsgefaBe fur diesen zusatzlichen Pipettierschritt bedeutete jedoch ein weiteres Kontaminationsrisiko, da es im TherPrimer 1
AmDliWaxTMPCRGem
!-U=LJ=LU Taq Polyrn. DNA Puffer
PCR
~
Reagenzien verrnischen sich
+ 2-35°C
+ AmpliWax PCR Gem +
0
Mikropipettenspitze zum Entfernen des Amplifikats
Wachs versiegelt Probe
Abb. 6. Schematische Darstellung der Hot-Start-Technik mit AmpliWaxTM.
3 Die PCR als Grundlage in der rnolekularen DNA-Analyse
33
mocycler erfolgte. AuBerdem war die Durchfuhrung vieler Reaktionen auf einma1 nur noch schwer zu handhaben. Eine Automatisierung der Hot-Start-Technik wurde erst mit der Einfuhrung von Wachskugelchen definierter GroBe und chemischer Zusammensetzung (AmpliWaxTMPCR Gems) moglich. Mit Hilfe dieser Wachskugelchen kann innerhalb des ReaktionsgefaBes eine Barriere aufgebaut werden, um die Reaktionskomponenten voneinander zu trennen. Die Reaktion startet in allen ReaktionsgefaBen weitgehend synchron, sobald das Wachs schmilzt (Abb. 6) und sich die Reaktionskomponenten aus beiden Phasen durchmischen konnen. Aurjerdem verhindert die Wachsbarriere ahnlich einer Mineraloliiberschichtung Verdunstung wahrend der PCR und versiegelt die Proben in Anschlurj an die Reaktion.
3.6 Thermostabile Enzyme Das Enzym Taq-DNA-Polymerase ist das Standard-Enzym der PCR. Es erfahrt eine so breite und erfolgreiche Anwendung, darj oftmals ein anderes thermostabiles Enzym bei der Etablierung einer Reaktion gar nicht erst in Betracht gezogen wird, obwohl es der eigentliche Spezialist fur diese Anwendung gewesen ware. In diesem Abschnitt sollen daher verschiedene thermostabile Enzyme vorgestellt und in ihren Eigenschaften verglichen werden (vgl. Tab. 2). Abbildung 7 zeigt ein typisches Enzymmolekul als schematisches Modell. Den DNA-abhangigen DNA-Polymerasen konnen prinzipiell drei funktionelle Domanen zugeordnet werden: Erstens die begehrte Synthese-Domane fur die DNAPolymeraseaktivitat, mit deren Hilfe das Molekul in der Lage ist, ausgehend von einem Primer an einem Matrizeneinzelstrang die Synthese eines neuen, komplementaren Stranges durchzufuhren. Dies geschieht in 5’ + 3’-Richtung, da die neuen Nukleotide an das 3‘-Ende der wachsenden Kette angefugt werden. Bei den beiden anderen Enzymfunktionen handelt es sich um Exonukleasefunktionen, mit deren Hilfe das Enzym terminale Nukleotide wieder entfernen kann. Zum einen handelt es sich dabei um die sogenannte 3’-nukleolytische Domane oder auch 3’-5’-Exonuklease- bzw. Proofreading-Aktivitat. Diese Funktion tragt wesentlich zu einer verbesserten Prazision der DNA-Synthese bei, da mit ihrer Hilfe am 3’-Ende angeknupfte falsche Bausteine wieder entfernt werden, so darj anschlieflend das korrekte Nukleotid eingebaut werden kann. Fur die PCR impliziert dies jedoch einen vorsichtigen Einsatz dieser Enzyme (Zugabe als letzte Reaktionskomponente), da ansonsten die Gefahr besteht, darj Primer und MatriZen abgebaut werden. Zum anderen handelt es sich um die 5’-nukleolytische Domane, die 5’-3’-Exonukleaseaktivitat des Enzyms. In vivo werden mit Hilfe dieser Enzymaktivitat die fur die semikonservative Replikation der DNA erforderlichen RNA-Primer wieder entfernt. Da diese Enzymfunktion Nukleotide vor der arbeitenden DNA-Polymerase abbauen kann, tragt sie insbesondere im Plateaubereich der PCR zum Hintergrund der Reaktion bei.
34
Thomas Schild 3’-Nukleolytische Domane 0 Prazision 0 Primer-Aufbau 0 Primer Mismatch Extension
Abb. 7. Schematisches Modell eines Enzymmolekuls und seiner Enzymfunktionen.
3.6.1 Tuq-DNA-Polymerase Das am haufigsten verwendete thermostabile Enzym ist die Tuq-DNA-Polymerase, die 1976 erstmals isoliert wurde [18]. Das Enzym stammt aus dem thermophilen Mikroorganismus Thermus thermophilus, der in einer heiBen Quelle des Yellowstone Nationalparks im Nordwesten der USA gefunden wurde. Es wird von einem 2 499 Nukleotide langen Gen kodiert, dessen Genprodukt ein 832 Aminosaurereste langes Protein mit einer Molekiilmasse von 94 kDa ist. Das Gen der Tuq-DNA-Polymerase wurde bereits 1989 in E. coli kloniert und exprimiert [19], so daB sich dieses Enzym mittlerweile relativ leicht und kostengiinstig in groBen Mengen herstellen lafit. Um auch bakterielle Sequenzen problemlos amplifizieren zu konnen, gibt es eine speziell aufgereinigte Form des rekombinanten Enzyms, die AmpliTaq@ DNA-Polymerase LD (Low DNA). Bei ihrer Verwendung konnen mogliche Kontaminationen mit bakterieller DNA aus dem HerstellungsprozeB praktisch ausgeschlossen werden (Perkin-Elmer). Tuq-DNAPolymerase besitzt eine 3’-5’-Exonuklease-,jedoch keine Proofreading-Aktivitat. Die Prozessivitat des Enzyms (Anzahl der am Stuck von einem Enzymmolekiil eingebauten Nukleotide, bevor es das 3’-OH-Ende der wachsenden Kette verlassen muB und die Arbeit an einem anderen freien 3’-OH-Ende fortsetzt) liegt bei 50-60 Basen. Die Einbaurate liegt bei ca. 150 Nukleotidenh und Enzymmolekiil bei einem Temperaturoptimum von 72-80 “C [9]. Seine Halbwertszeit bei 95 “C betragt 40 min.
3 Die PCR als Grundlage in der molekularen DNA-Analyse
35
Das Stoffel-Fragment der Tuq-DNA-Polymerase hingegen ist eine 61 kDaMutante der rekombinanten AmpliTaq DNA-Polymerase. Dieser Deletionsmutante fehlen 289 Aminosaurereste am N-Terminus. Dadurch ist es im Vergleich zum unmodifizierten Enzymmolekul in einigen wichtigen biochemischen Eigenschaften verandert: So hat das Stoffel-Fragment keine 5'-3'-Exonukleaseaktivitat und mit nur 5-10 Basen eine deutlich niedrigere Prozessivitat als die Taq-DNAPolymerase, weshalb es fur RAPD-PCRs das Enzym der Wahl ist [20]. RandomAmplified-Polymorphic-DNA-PCRist eine Technik zum Nachweis genetischer Polymorphismen, deren Basensequenz unbekannt ist. Diese konnen dann als genetische Marker oder auch zur Genkartierung venvendet werden. Dabei werden Zufalls-lOmere als Primer eingesetzt. Man erhalt als Ergebnis ein Gelbild wie von einem DNA-Fingerprint, wobei die Venvendung des Stoffel-Fragments zu einer verbesserten Reproduzierbarkeit insbesondere der kurzeren Amplifikationsprodukte fuhrt. Dariiber hinaus diskriminiert es besser bei fehlerhaften Extensionen als die Tuq-DNA-Polymerase und ist aufgrund seines breiteren MgC12-Optimums(2-10 mM im Vergleich zu 1-4 mM bei Tuq-DNA-Polymerase) insbesondere bei Multiplex-PCRs (zwei oder mehr Matrizen sollen in einem kombinierten Reaktionsansatz gleichzeitig amplifiziert werden) zu empfehlen. Seiner erhohten Thermostabilitat (Halbwertszeit von 80 min bei 95 "C) und dem Fehlen jeder Exonukleaseaktivitat wegen eignet sich das Stoffel-Fragment auch sehr gut fur die Amplifikation von G/C-reicher DNA mit Sekundarstrukturen oder zirkularer DNA.
3.6.2 rTth -DNA-Polymerase Fur eine RNA-PCR oder auch RT-PCR genannt - die Amplifikation einer RNAMatrize also - ist zunachst eine reverse Transkription notwendig, wahrend der die RNA in eine komplementare DNA (cDNA) bei iiblichenveise 42°C umgeschrieben werden mul3. Hierzu werden traditionell Reverse Transkriptasen verwendet, die aus Retroviren gewonnen werden. Diese Enzyme sind jedoch nicht thermostabil, weshalb die reverse Transkription sekundarstrukturreicher RNAVorlagen oftmals Probleme bereitet. Die rekombinante Form eines thermostabilen Enzyms aus dem Mikroorganismus Therrnus therrnophilus, die rTth, ist jedoch in der Lage, in Gegenwart von Mangan eine effektive reverse Transkription bei 70 "C durchzufuhren [21] und somit diese stabilen Sekundarstrukturen aufzulosen. Die anschlienende Amplifikation kann mit demselben Enzym im gleichen ReaktionsgefaB erfolgen, nachdem man mittels eines Chelators das Mangankation abfangt und die DNA-Polymeraseaktivitat des Enzyms durch Zusatz von Magnesium aktiviert. Bei Verwendung von Manganacetat und Bicin anstelle des herkommlichen Tris-HCI-Puffersystems lassen sich reverse Transkription und Amplifikation sogar ohne nochmaliges Offnen des Reaktionsgefanes zum Umpuffern durchfiihren, was eine zusatzliche Kontaminationsquelle ausschliel3t [22].
36
Thomas Schild
3.6.3 VentTMDNA-Polymerase Das in heiljen Quellen des Meeresgrundes lebende Archaebakterium Thermococcus litoralis ist der Ursprung der rekombinanten VentTMDNA-Polymerase (New England Biolabs). Die VentTMDNA-Polymerase ist mit einer Halbwertszeit von 400 min bei 95 “C thermostabiler als die Taq-DNA-Polymerase. Da das Enzym eine Proofreading-Aktivitat besitzt, empfiehlt sich seine Anwendung dann, wenn eine hohe Kopiergenauigkeit erforderlich ist. Auljerdem konnen die Produkte zu Blunt-end-Klonierungen eingesetzt werden, da die Amplifikate glatte Enden besitzen. Mit der modifizierten Vent (exo-)TMgibt es auljerdem eine exonukleasefreie Version des Enzyms fur normale PCR-Anwendungen.
3.6.4 Pfu-DNA-Polymerase Ursprunglich wurde die Pfu DNA-Polymerase (Stratagene) aus dem thermostabilen Archaebakterium Pyrococcus furiosus isoliert. Das Enzym besitzt wie auch die VentTMDNA-Polymeraseeine 3’-5’-Exonukleaseaktivitat, mit deren Hilfe das Molekul in der Lage ist, eingebaute falsche Basen zu erkennen und wieder zu entfernen. Die gentechnisch modifizierte Variante Pfu (exo-) besitzt keine Exonukleaseaktivitat, dafur jedoch eine zehnmal hohere DNA-Polymeraseaktivitat als die unveranderte Form des Enzyms. Da sie [a”S]dATP effizienter in die DNA einbaut als Tuq-DNA-Polymerase, kann dieses Enzym auch zur radioaktiven Cycle-Sequenzierung verwendet werden.
3.6.5 UITmaTMDNA-Polymerase Dieses Protein aus dem thermophilen marinen gramnegativen Eubakterium Thermotoga maritima [23] besteht in seiner gentechnisch veranderten, rekombinanten Form aus 610 Aminosaureresten. Das Enzym wurde in seiner Aktivitat dahingehend verandert, dalj eine Balance aus DNA-Polymeraseaktivitat und Proofreading-Aktivitat gefunden wurde. Die hergestellten Amplifikate der UITmaTMDNA Polymerase (Perkin-Elmer) besitzen glatte Enden und eignen sich somit zur Blunt-end-Klonierung. Zum Vergleich hierzu neigt Tuq-DNAPolymerase dazu, an die 3’-Enden der Amplifikate eine templateunabhangige Purin-Base anzuhangen, weshalb die Enden der PCR-Produkte vor Anwendung in der Blunt-end-Klonierung geglattet werden mussen.
3 Die PCR als Grundlage in der molekularen DNA-Analyse
31
3.7 PCR und Kontaminationen Wie wir festgestellt haben, handelt es sich bei der PCR um eine hochempfindliche Reaktion. Daher ist es von groBter Bedeutung, mogliche Kontaminationsquellen zu entdecken und zu entscharfen, bevor sie zu einem ernsten Problem werden konnen. Als Kontaminationsquelle kommen eine Vielzahl unterschiedlicher Ursachen in Frage, wie z.B. Klimaanlagen, Autoklaven [24], Filter in Abzugshauben, Pipetten und Pipettenspitzen sowie naturlich die Reagenzien selbst, um nur einige zu nennen. Strategien zur Vermeidung von Kontaminationen werden damit zum entscheidenden Schritt fur die erfolgreiche Arbeit eines PCR-Labors. Eine sinnvolle Antwort auf das hohe Kontaminationsrisiko in einem PCR-Labor ist die strikte raumliche Trennung der einzelnen Arbeitsschritte. Ein PCR-Labor sollte demnach aus drei gesonderten Arbeitsraumen bestehen. Der erste Raum ist fur die Isolierung, Uberprufung und Lagerung der DNA reserviert. In einem zweiten Raum werden die PCR-Ansatze pipettiert und die dafur benotigten Reagenzien gelagert. Der dritte Raum schlieBlich ist der Ort, an dem die Amplifikationen stattfinden. Hier befinden sich die Thermocycler. Die Amplifikate werden dort gelagert und weiteren Arbeitsschritten zugefuhrt. Diese Strategie der raumlichen Trennung versagt allerdings, sobald die FlieBrichtung der Reagenzien umgekehrt wird und somit hochkonzentrierte DNA in Bereiche mit niedrigen DNA-Konzentrationen gelangt. Dasselbe gilt selbstverstandlich auch fur Pipetten und andere benotigte Labormaterialien, von denen jeder Raum einen eigenen Satz benotigt. Eine gute Laborpraxis bedeutet auBerdem in diesem Zusammenhang, die Reagenzien vor Gebrauch zu aliquotieren, um die Zahl der Pipettierschritte zu minimieren. Es empfiehlt sich, uber die jeweiligen Lot-Nummern genau Buch zufiihren, so daB auftretende Kontaminationen einfacher zuruckverfolgt werden konnen. Zum Pipettieren sollten EinmalPipettenspitzen mit Aerosol-Filterschutz venvendet werden. Die regelmaBige Reinigung und Dekontamination der Arbeitsflachen in den Raumen sollte zur Laborroutine gehoren. Vor allem in Raum 3 des PCR-Labors mussen die enormen DNA-Konzentrationen im AnschluB an eine PCR berucksichtigt werden. Sie konnen sehr leicht zu einer Verschleppungskontamination (Carry-Over) fuhren. So befinden sich in einer 1OOyl PCR ausgehend von 10 Kopien nach 30 Zyklen bei einer Effizienz von 85% ca. lo9 Kopien der Zielsequenz. Werden davon nur 0,l p1 uber eine heruntergefallene Pipettenspitze auf die Arbeitsflache verschmiert, so sind darin noch ca. lo6 Kopien des PCR-Produkts ernthalten. Aerosole, wie sie beim Offnen des ReaktionsgefaBes entstehen konnen, enthalten noch bis zu 100 Kopien des Produkts, d. h. mehr als genug, um einen negativen Ansatz falschlicherweise positiv erscheinen zu lassen. Eine Behandlung der Oberflachen mit 70%igem Ethanol, wie sie in vielen Laboratorien routinemaflig durchgefuhrt wird, ist nicht ausreichend, um DNA zu zerstoren. Bewahrt hat sich in diesem Zusammenhang der Einsatz von wassrigem Natriumhypochlorid [25]. In vielen Laboratorien wird auch eine UV-Bestrahlung der Oberflachen bei 254 nm zur Dekontamination eingesetzt. Dabei sollte
38
Thomas Schild
berucksichtigt werden, daB einzelne Nukleotide und Primer wesentlich stabiler gegen eine Bestrahlung sind als lange DNA-Fragmente. Das gleiche gilt fur trokkene DNA im Vergleich zu geloster DNA [26]. Da die UV-Inaktivierung auf der Dimerisierung benachbarter Pyrimidine beruht, entscheidet der Anteil dimerisierbarer Stellen im DNA-Molekul daruber, ob eine DNA UV-resistent ist oder nicht. Fur eine Dekontamination der Laboroberflachen uber UV-Bestrahlung ist schlieBlich auch die Entfernung der Bestrahlungsquelle entscheidend. Gute Ergebnisse wurden bei einer Intensitat von 400 pW/cm2 auf der Arbeitsflache erzielt [27]. Die Effizienz der Bestrahlungsstrategie bei Reagenzien scheint hingegen nicht immer gewahrleistet zu sein [28]. Eine weitere Strategie zur Vermeidung dieser wohl gefahrlichsten Kontaminationsquelle in der PCR-Anwendung schliel3t chemische bzw. enzymatische Methoden ein. Eine chemische Methode basiert auf der Anwendung sogenannter ,,Psoralene". Im AnschluB an die PCR werden die Ansatze mit UV bestrahlt, wodurch die DNA-Doppelstrange kovalent miteinander verknupft werden. Verschleppte DNA-Molekule sind somit nicht mehr amplifizierbar [29]. Bei einer anderen Methode werden die PCR-Ansatze vor der Amplifikation enzymatisch mit dem Enzym Uracil-N-Glykosylase (UNG) dekontaminiert. Zu diesem Zweck wird in den Ansatzen das Nukleotid dTTP durch dUTP ersetzt. Die Amplifikate enthalten dadurch Uracil. Uracilhaltige Nukleinsauren sind jedoch das Substrat von UNG. Setzt man nachfolgende PCR-Ansatze vor der Amplifikation einem UNG-Verdau aus, so wird Uracil aus moglicherweise verschleppten Amplifikaten aus vorrangegangenen Amplifikationen entfernt, wahrend die DNA-Matrizen, die Thymidin als Base enthalten, nicht angegriffen werden. Die Vorbehandlung der PCR-Ansatze wird durch eine Inkubation bei 95 "C abgeschlossen, durch die UNG deaktiviert und die nun abasischen Verschleppungskontaminationen zerstort werden. Falsch-positive Ergebnisse konnen dadurch ausgeschlossen werden (s. Abb:8).
3.8 Analyse der Amplifikationsprodukte Im AnschluB an eine PCR lassen sich aus einer Analyse der DNA-Produkte vier Informationen ableiten:
0
Waren DNA-Matrizen vorhanden, an die die eingesetzten Primer anbinden konnten oder nicht? Die Lange der PCR-Produkte. Sequenzinformationen. Je nach PCR eine relative oder auch eine absolute quantitative Aussage.
Um diese Informationen zu gewinnen, sind verschiedene Analyseverfahren entwickelt der fur die PCR adaptiert worden, von denen einige nachfolgend vorgestellt werden.
3 Die PCR als Grundlage in der molekularen DNA-Analyse
39
3.8.1 Gelelektrophorese Die verbreitetste Methode ist wohl die Gelelektrophorese in einem Agarosebzw. Polyacrylamidgel. Je nach Agarosetyp und Elektrophoresetechnik lassen sich DNA-Fragmente in einern GroBenbereich von 10 bp-1000 kb auftrennen. Polyacrylamidgele werden insbesondere dann angewendet, wenn kleine Produkte analysiert bzw. sehr geringe GroBenunterschiede wie z. B. in der Fragmentanalyse oder DNA-Sequenzierung aufgetrennt werden sollen. Die DNA-Molekule lassen
-
DNA-Matrize
A G T C T A C T C A G A T G
t
PCR in Gegenwart von dUTP
dU-haltiges Ampliflkat
U C A G A U G
t
Ampllfikat wlrd nachfolgend in PCR-Reagenzlenverschleppt Neue PCR-Ansatze
/
Positive Negativkontrolle zeigt Kontamination an
\
Neue PCR-Ansatze
10 min Verdau bei RT in Gegenwarl von UNG
+Y
DNA Kontaminatlon
(UNG-lnaktivierung) 10 min be1 95 "C
G
7 G
Keine Ampllfikation kontaminierender DNA
t
Negativkontrolle bleibt negativ
Abb. 8. Prinzip der enzymatischen Dekontamination von PCR-Ansatzen vor Ablauf der Reaktion unter Anwendung von Uracil-N-Glykosylase (UNG) und dUTP anstelle von dTTP
40
Thomas Schild
sich z. B. mit Hilfe des interkalierenden Farbstoffs Ethidiumbromid anfarben und durch UV-Bestrahlung sichtbar machen. Es werden dafur jedoch 5-10 ng DNA benotigt. Die Nachweisgrenze laBt sich mit Hilfe einer Silberfarbung auf weniger als 0,5 ng DNA senken, bei radioaktiver Detektion sogar bis auf 1 pg DNA/ Bande. Bei der Anwendung moderner, vielseitig einsetzbarer DNA-Sequenzierautomaten, die auf eine laserangeregte Fluoreszenzdetektion der DNA-Fragmente beruhen, wird der hohe Probendurchsatz der Gelelektrophorese noch durch eine weitgehend automatisierte, computergestutzte Analyse der Resultate erganzt.
3.8.2 High Performance Liquid Chromatographie (HPLC) Eine sehr sensitive Technik zur qualitativen wie auch quantitativen Analyse von PCR-Produkten bietet die Anwendung der High Performance Liquid Chromatographie (HPLC) [30]. Die Auftrennung erfolgt aufgrund der unterschiedlichen Mobilitat der gelosten DNA-Fragmente zwischen einer stationaren und einer mobilen Phase. Hierzu wird die bewegliche Phase bei konstanter Temperatur und erhohtem Druck mit kontrollierter Geschwindigkeit durch eine rnit einem Anionenaustauschermaterial gefullten Saule gepumpt. Am Ende der Saule wird dann die aufgetrennte Probe UV-photometrisch bestimmt. Man benotigt hierzu zwei getrennte bzw. eine binare Pumpe, einen UVIVIS-Detektor fur die Detektion bei 259 nm, einen Computer fur die Datenanalyse sowie eine TSK@D E A E NPR Anionenaustauschersaule (35 mm Trennstrecke, 2,5-3,0 pm PartikelgroBe, pH 2-12) [31]. Die Proben werden per Hand oder automatisch aufgetragen. Es konnen DNA-Fragmente bis ca. 20 kb aufgetrennt [30] werden. Im Gegensatz zur Gelelektrophorese kann DNA mit Hilfe der HPLC auch praparativ gewonnen werden und ohne zusatzlichen Aufwand weiterbearbeitet werden. AuBerdem ist eine zusatzliche Markierung der Produkte nicht notwendig. Die Empfindlichkeit liegt bei etwa 0,2-0,4 ng. Nachteile dieser Technologie sind insbesondere der niedrige Probendurchsatz (10-20 midprobe) sowie die relativ hohen Kosten.
3.8.3 Kapillar-Elektrophorese(CE) Mit Hilfe der Kapillar-Elektrophorese (CE) ist ebenfalls eine sehr genaue qualitative wie auch quantitative Analyse von DNA-Fragmenten moglich. Der Trennmechanismus beruht auf der unterschiedlichen elektrophoretischen Mobilitat geloster Substanzen. Diese Mobilitat ist bei der CE eine Funktion der Nettoladung und der Grorje des Molekuls. Dadurch wandern die Analyte entsprechend ihrem Masse-zu-Ladungsverhaltnis im elektrischen Feld, wobei sie vom elektro-
3 Die PCR als Grundlage in der molekularen DNA-Analyse
41
osmotischen Flu13 unterstutzt werden, der durch die Wandladung der Kapillare hervorgerufen wird. Da jedoch alle DNA-Fragmente das gleiche Masse-zuLadungsverhaltnis besitzen, enthalt die Kapillare eine sogenannte Siebmatrix. Diese besteht aus viskosen Linearpolymer-Bausteinen, die im Gegensatz zu den quervernetzten polymerisierten konventionellen Gelen ein venvickeltes (entangled) Polymer bilden. Im Gegensatz zur Gelelektrophorese entfallt bei der CE wie auch bei der HPLC die Verwendung gesundheitsschadigender Substanzen wie Ethidiumbromid oder radioaktive Markierung. Vergleicht man CE und HPLC miteinander, so zeichnet sich die CE insbesondere durch eine bessere Trennleistung aus. Innovative Weiterentwicklungen dieser Technologie (ABI PRISMTM310 Genetic Analyzer) sind mittlerweile vollautomatisiert und ermoglichen eine DNASequenzierung.
3.8.4 TaqManTM-Assay zur Analyse von PCR-Produkten Die TaqManTM-Chemie(Perkin-Elmer) beruht auf dem bereits 1991 publizierten 5’-Nuklease-Assay [32]. Dabei wird neben den ublichen Komponenten noch eine sequenzspezifische Sonde zum PCR-Ansatz hinzugegeben, die mit zwei Fluoreszenzfarbstoffen markiert ist: Als sogenannter Reporter-Farbstoff wird ein Fluoresceinderivat an das 5’-Ende der Sonde gekoppelt. Bei der intakten Sonde ist eine Fluoreszenz dieses Reporters in einem Luminometer nicht nachweisbar, da das 3’-Ende der Sonde mit dem Quencher-Farbstoff TAMRA - einem Rhodaminderivat - markiert ist. TAMRA unterdruckt durch seine relative Nahe in der intakten Sonde die Reporter-Fluoreszenz (quenching). AuBerdem ist das 3’-OHEnde der Sonde iiber einen Phosphatrest blockiert, so da13 sie wahrend der Reaktion nicht als ein zusatzlicher Primer fungieren kann. Bindet die Sonde im Verlauf eines PCR-Zyklus spezifisch an die entsprechende Einzelstrang-DNA, so fuhrt die Tuq-DNA-Polymerase zunachst die Primer-Extension durch. Trifft sie jedoch auf die gebundene Sonde, so hebt sie diese einige Basen weit wieder von der Einzelstrang-DNA weg (strand displacement). Dadurch wird ein Substrat fur die 5’-3’-Exonukleaseaktivitatder Tuq-DNA-Polymerase geschaffen und die Sonde zwischen Reporter und Quencher verdaut, wahrend die ungebunden Sondenmolekule intakt bleiben. Wird die raumliche Nahe zwischen Reporter und Quencher aufgehoben, so fallt der QuenchingEffekt weg und die Emission des Reporters wird im Luminometer nachweisbar (Abb. 9). Mit jedem Zyklus werden also so viele Sondenmolekiile verdaut, wie Amplifikat gebildet wird. Am Ende der PCR ist daher das Verhaltnis der gemessenen Emission beider Farbstoffe dem gebildeten PCR-Produkt direkt proportional, weshalb sehr genaue quantitative Analysen moglich sind. Da zusatzliche Post-PCR-Schritte wie Hybridisierungsreaktionen oder Gelelektrophoresen zum spezifischen Nachweis des Amplifikats wegfallen, betragt die Standardabwei-
Thomas Schild
42
1. DNA Denaturierung
3’
5‘
+
3’
5’
2. Anlagerung der PCR-Primer und der Sonde
3’
5’3’
5’
+
35‘
5’ 3’
3. Verdau der Sonde wahrend der Primer-Extension
q-A &
5’-3‘+ 3’
P 3’ 5’
+
-3l-5’
3’
5‘
4. AbschluB des TaqManTMPCR-Zyklus
5‘ 3’
b
5’
+
4
5’
5’ 3
t n-Wiederholungen
Abb.9. Schematisierter Ablauf der TaqManTMPCR (R = Reporter, Q = Quencher, P = Phosphatrest ).
chung des Assays nur 2-5%. Die Messung erfolgt innerhalb weniger Minuten im Mikrotiterplattenformat in einem Luminometer, was in Kombination mit der computergestiitzten Auswertung des Ergebnisses einen sehr hohen Probendurchsatz ermoglicht. Durch die Anwendung verschiedener Reporterfarbstoffe ist die TaqManTM-Chemiemultiplexfahig, was den Probendurchsatz zusatzlich erhoht und die Anwendung interner Standards zur exakten Quantifizierung ermoglicht. Auljerdem konnen definierte Sequenzunterschiede (Punktmutationen, Deletionen etc.) nachgewiesen werden, wodurch die Routinearbeit z. B. in der Diagnostik zusatzlich automatisierbar wird.
3 Die PCR als Grundlage in der molekularen DNA-Analyse
43
Die neueste Generation von Thermocyclern erlaubt uber Glasfaseroptik sogar eine On-line-Messung nach jedem PCR-Zyklus, so dafi der Verlauf der PCR kontrolliert und analysiert werden kann. Das ABI PRISMTM7700 Sequence Detection System (SDS) besteht aus einem Thermocycler mit 96 Positionen im Mikrotiterplattenformat. Im Heizdeckel dieses Systems befinden sich eine Linse sowie ein optischer Leiter uber jeder einzelnen Position, wodurch der Thermocycler mit einem Detektionssystem verbunden wird. Kernstuck dieses Detektionssystems ist ein Spektrograph mit nachgeschalteter CCD-Kamera, die die Fluoreszenzemissionen im Bereich von 500-600 nm in Echtzeit detektiert. Als Lichtquelle dient ein Ar-Ionen-Laser (488 nm), dessen Lichtstrahl uber einen dichroidischen Spiegel und eine Linse an einen optischen Multiplexer (MUX) weitergeleitet wird. Der MUX verteilt das Anregungslicht iiber die optischen Leiter auf die 96 Reaktionen. Das emittierte Licht folgt dem gleichen Weg ruckwarts, wird jedoch vom dichroidischen Spiegel uber eine weitere Linse zum Spektrographen weitergeleitet und schlieBlich von der CCD-Kamera in ein digitales Signal umgewandelt. Die Analyse der Daten sowie die Steuerung des gesamten Systems erfolgen uber einen Power Macintosh Computer. Damit vereinigt der 7700 SDS die PCR, die Fluoreszenzdetektion und die applikationsspezifische Analyse in einem einzigen System. Vom Anwender ist nur noch die Probenvorbereitung durchzufiihren. Die Detektion des PCR-Signals im geschlossenen Reaktionsgefa13 (closed tube detection) minimiert jedoch nicht nur den Arbeitsaufwand, sondern auch das Kontaminationsrisiko. Durch die Erstellung von PCR-Wachstumskurven schlieBlich entfallen die gewohnten Post-PCR-Schritte wie Gelelektrophoresen oder Immobilisierungsreaktionen, aber auch die damit verbundenen Ungenauigkeiten in der quantitativen PCR.
3.9 Literatur Koshland, D.E., Science 246 (1989), 1541. Mullis, K.B., Spektrum d. Wissenschaft 6 (1990), 60-67. Wang, M., Doyle, M.V., Mark, D.F., Proc. Natl. Acad. Sci. USA 86 (1989), 9717-9721. Saiki, R.K., Scharf, S.J., Faloona, F., Mullis, K.B., Horn, G.T., Erlich, H.A., Arnheim, N., Science 230 (1985), 1350-1354. [5] Hqiushui, H., Viljanen, M.K., Mertsola, J., Mol. Cell. Probes 8 (1994), 155-160. [6] Thein, S.L. Wallace, R.B., (1986), The use of synthetic oligonucleotides as specific hybridization probes in the diagnosis of genetic disorders 33-50. In Human genetic diseases: a practical approach (Hrsg. K .E. Davis). IRL Press, Herndon, Virginia. [7] Baldino, F., Chesselet, M.F., Lewis, M.E., Methods in Enzymology 168 (1989), 761-777. [8] Rychlik, W., Spencer, W.J., Rhoads, R.E., Nucl. Acids Res. 18 (1990), 6409-6412. [9] Gelfand, D.H. (1989) Taq DNA Polymerase 17-22. In PCR technology: Principles and applications for DNA amplification (Hrsg. H.A. Erlich). Stockton Press, New York. [lo] Higuchi, R., Amplifications 2 (1989), 1-3. [11] Beutler, E., Gelbart, T., Kuhl, W., BioTechniques 9 (1990), 166. [12] Eckert, K.A., Kunkel, T.A., Nucl. Acids Res. 18 (1990), 3739-3744. [1] [2] [3] [4]
44
Thomas Schild
[13] Innis, M.A., Myambo, K.B., Gelfand, D.H., Brow, M.A.D., Proc. NatLAcad. Sci. USA 85 (1988), 9436-9440. [14] Don, R.H., Cox, P.T., Wainwright, B.J., Baker, K., Mattick, J.S., Nucl. Acids Res. 19 (1991), 4008.
[15] Porter-Jordan, K., Rosenberg, E.I., Keiser, J.F., Gross, J.D., Ross, A.M., Nasim, S., Garrett, C.T., J. Med. Virol. 30 (1990), 85-91. [16] Zhang, X.-Y., Ehrlich, M., BioTechniques 16 (1994), 502-507. [17] Gelfand, D.H. (1989), Polymerase Chain Reaction, 11-17. In Current Communications in Mol. Biol. (Hrsg. H.A. Erlich, Gibbs, R., Kazazian, H.H.), Cold Spring Harbor, New York. [18] Chien, A., Edgar, D.B., Trela, J.M., J. Bacteriol. 127 (1976), 155&1557. [19] Lawyer, F.C., Stoffel, S., Saiki, R.K., Myambo, K., Drummond, R., Gelfand, D.H., J. Biol. Chem. 264 (1989), 6427-6437. [20] Bruno, W., Sobral, S., Honeycutt, R.J., Theor. Appl. Genet. 86 (1993), 105-1 12. [21] Myers, T.W., Gelfand, D.H., Biochemistry 30 (1991), 7661-7666. [22] Myers, T.W., Sigua, C.L., Biomed. Products April (1994), 50. [23] Huber, R., Langworthy, T.A., Konig, H., Thomm, M., Woese, C.R., Sleytr, U.B., Stetter, K.O., Arch. Microbioll44 (1986), 324-333. [24] Dwyer, D.E., Saksena, N., Mol. Cell. Probes 6 (1992),87-88. [25] Prince, A.M., Andruq L., BioTechniques 12 (1992), 358-360. [26] Fairfax, M.R., Metcalf, M.A., Cone, R.W., PCR Methods and Applications 1 (1991), 142143. [27] Cone, R.W., Fairfax, M.R., PCR Methods and Applications 3 (1993), 15-17. [28] Fox, J.C., Ait-Khaled, M., Webster, A., Emery, V.C., J. Virol. Methods 33 (1991), 375-382. [29] Isaacs, S.T., Tessrnan, J.W., Metchette, K.C., Hearst, J.E., Cimino, G.D., Nucl. Acids Res. 19 ( 1990),1OY-116. [30] Kato, Y., Yamasaki, Y., Onaka, A,, Kitamura, T., Hashimoto, T., Murotsu, T., Fukushige, S., Matsubara, K., J. Chromatogr. 478 (1989), 264-268. [31] Katz, E.D., Dong, M.W., BioTechniques 8 (1990), 546-555. [32] Holland, P.M., Abrahamson, R.D., Watson, R., Gelfand, D.H., Proc. Natl. Acad. Sci. USA 88 (1991), 7276-7280.
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse Gerald Schmidt Die chemische Synthese von DNA-Fragmenten, auch Oligonukleotide genannt, hat sich in den letzten 10 Jahren zu einer aus der modernen Molekularbiologie nicht mehr wegzudenkenden Standardmethode etabliert. Aus einer zu Beginn der sechziger Jahre noch unter hohem experimentellem Aufwand hergestellten exotischen Spezies wurde - nach der Entwicklung der PCR-Technologie - ein Massenprodukt, das dennoch aufgrund seiner Basensequenz seine Individualitat bewahrt. Dieser individuelle Charakter eines Oligonukleotids wird wahrend der Synthese gebildet, zeigt sich erstmals in der Aufreinigung des Produkts wird anschlierjend in der Praxis fur die vielfaltigen Anwendungen im Rahmen molekularbiologischer Methoden bis hin zur medizinischen Diagnostik genutzt.
4.1 Entwicklung der DNA-Synthese Wahrend die PCR-Methode quasi uber Nacht entdeckt wurde [l], zog sich die Entwicklung der DNA-Synthese uber fast 3 Jahrzehnte hin. Die Initialzundung dazu war die Aufklarung der DNA-Struktur durch Watson und Crick [2]. Bei dem von Khorana entwickelten Phosphodiester-Verfahren [3] war die PhosphatInternukleotidgruppe noch nicht geschutzt. Zur Synthese lierjen sich daher keine organischen Losungsmittel venvenden, weil die Reaktionsprodukte mit steigender Kettenlange hochpolar wurden. Trotzdem gelangen mit dieser Methode die ersten Synthesen kompletter Gene (Alanin t-RNA). Durch die Entwicklung der Phosphotriester-Chemie konnten die beschriebenen Loslichkeitsprobleme eliminiert sowie Nebenreaktionen auf die Internukleotid-Bindung vermieden werden. Bei Anwendung dieses Verfahrens dauerte eine Monomeraddition noch Stunden, samtliche Zwischenprodukte murjten nach der jeweiligen Additionsreaktion chromatographisch aufgereinigt werden. Der Durchbruch der DNA-Synthese zu einer breit anwendbaren Technik erfolgte erst mit der Entwicklung der Phosphoramidit-Chemie [4].
4.2 Chemische Grundlagen der DNA-Synthese Diese Methode hat gegenuber den vorhergehenden den Vorteil, darj die hier verwendeten PI1'-Verbindungen eine hohe Reaktivitat aufweisen und die Synthesen durch den Einsatz vollstandig geschutzter Monomerbausteine in der gewunsch-
46
Gerald Schmidt
ten Weise fast ohne Nebenreaktionen ablaufen. Aber erst die Synthese an fester Phase analog der Merrifield-Synthese von Peptiden ermoglichte die Automatisierung des Reaktionsablaufs. Bei dieser Art der Reaktionsfuhrung entstehen keine Zwischenprodukte, die isoliert und aufgereinigt werden mufiten, bevor sie weiter umgesetzt werden. Start-, Zwischen- und Endprodukte befinden sich stets an einer festen Phase, alle ubrigen Reaktionskomponenten werden in flussiger Form zu- und abgefuhrt. Dadurch ist es moglich, die bei der Addition von Monomeren stets identische Abfolge von Reaktionen zyklisch und ohne Unterbrechung durchzufuhren.
OH +
OH
O
9
I
0-P-O
.
n2r. K U
d
I 0=P--0R3 I 0.
R 4
I
O
I 0 -P-OR3
R 4 Abb. 1. Monomer-Addition nach dem Phosphodiester- und dem Phosphotriester-Verfahren. B’, B’: Purin- bzw. Pyrimidin-Basen; R‘. R2. R’: Schutzgruppen.
Begonnen wird die Oligonukleotidsynthese mit dem 3’-Monomeren. Dieses ist als 3’-Nukleosid-Succinat uber einen Aminoalkyl-Spacer kovalent an ein polymeres Tragermaterial gebunden. Dieses besteht meistens aus Controlled Pore Glass (CPG, Glaskugeln mit definierter PorengroBe). Modifizierte Polystyrole gewinnen aufgrund ihres vollig
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse
n
47
II
n
0
n
Abb. 2. Chemische Struktur des Inhalts einer DNA-Synthesesaule. Das 3’-Monomere ist uber einen basenlabilen Linker kovalent mit dem polymeren Tragermaterial verkniipft.
inerten Charakters zunehmend an Bedeutung [5]. Die Beladung an Nukleosid betragt ca. 25 ymol/g fur CPG-Trager und ca. 8 ymol/g fur Polystyroltrager. Je niedriger die Tragerbeladung, um so weniger treten sterische Behinderungen benachbarter Nukleotidketten auf. Das Ziel der nun folgenden Addition von Monomeren ist der Aufbau einer entsprechenden Nukleotidkette ohne jegliche Verzweigung. Um die selektive Bildung von 3’-5’-Verknupfungen zu erreichen, mussen die per se multifunktionellen Nukleoside (auch das am polymeren Trager) an denjenigen Gruppen, die nicht an der Reaktion teilnehmen sollen, jeweils durch eine entsprechende Schutzgruppe blockiert werden. Nur der Einsatz eines orthogonalen Schutzgruppensystems, das unter Kondensationsbedingungen stabil bleibt und dem Verlauf der Oligonukleotidsynthese Rechnung tragt, kann eine hohe Spezifitat der gewunschten Reaktion garantieren. Orthogonal bedeutet in diesem Zusammenhang die Stabilitat von zwei Schutzgruppen wahrend der selektiven Abspaltung einer Dritten. Die Trageraufhangung bildet mittels der Succinat-Gruppe zugleich die 3’Schutzgruppe des ersten Nukleosids, sie ist alkalilabil. Die im Laborjargon als Monomere oder Amidite bezeichneten Nukleotide sind in Abb. 3 dargestellt. Die primaren Aminogruppen der Basen Adenin, Cytosin und Guanin sind ebenfalls alkalilabil blockiert. Dadurch wird eine Kettenverzweigung uber die Basen wahrend der Synthese vermieden. Die 5’-OH Gruppe ist durch die Dimethoxytrityl(DMTr)-Gruppe saurelabil geschutzt. Da sie als primarer Alkohol die reaktivere Seite eines Nukleosids darstellt, erfolgt die Phosphorylierung des Nukleosids an der weniger reaktiven 3’-OH-Gruppe zum P-Cyanoethylphosphoramidit. Der 3wertige Phosphor dieses Derivats bildet das reaktive Zentrum dieses Reagenz, das in der DNA-Synthese die zentrale Schlusselstellung einnimmt.
48
Gerald Schmidt
Abb.3. Struktur eines vollstandig geschiitzten Nukleosid-3’-Phosphoramidites 1) 5’-0-4,4‘-dianisyl-phenylmethyl- bzw 5’-0-Dimethoxytritylgruppe, 2) N‘-Benzoyl-Deoxyadenosin, 3) N4Benzoyl-Deoxy-cytidin, 4) N’-isobutyryI-Deoxyguanosin,5 ) P-Cyanoethylgruppe, 6) N,N-Diisopropylaminogruppe.
4.3 Chemischer Ablauf der DNA-Synthese Die Synthese eines Oligonukleotids der Lange n ist aber doch etwas komplexer als die simple Addition von Nukleotidbausteinen an ein erstes 3’-gebundene’s Nukleosid. Es handelt sich um eine Abfolge von Reaktionszyklen, die aus folgenden Schritten bestehen:
4.3.1 Detritylierung Nach dem Vorlegen eines entsprechend der Basensequenz ausgewahlten tragergebundenen Nukleosids I wird zur Freisetzung der 5’-OH-Funktion die DMTrGruppe mit Dichloressigsaure (1-3% w/w) in Dichlormethan abgespalten. Das dabei freiwerdende DMTr-Kation besitzt aufgrund seiner Mesomerie Stabilisierung eine orangerote Farbe, deren Intensitat in direkter Beziehung zur Effizienz der Abspaltung der DMTr-Gruppe steht.
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse
49
Abb. 4. Schematische Darstellung eines DNA-Synthesekreislaufs nach der Phosphittriestermethode: Detritylierung (1 -+ 2), Monomeraddition (2+3 + S), Capping (2 + 4), Oxidation (5 + 6).
4.3.2 Monomeraddition Die eigentliche Monomeraddition stellt an sich hohe experimentelle Anforderungen. Es geht darum, eine Kondensationsreaktion in einem heterogenen Phasensystem bei Raumtemperatur innerhalb weniger Sekunden mit Ausbeuten von > 98% durchzufuhren. Die Reaktivitat des oben beschriebenen Nukleosid-P-cyanoethyl-phospho-ramidits reicht dazu immer noch nicht aus. Vorher mulj dieses Reagenz nochmals aktiviert werden. Dies geschieht durch Zugabe von Tetrazol. Dabei entsteht durch nukleophile Substitution am P-Atom aus dem Nukleosid-Pcyanoethylphosphoamidit ein -tetrazolid 3, das so reaktiv ist, da13 es mit der zuvor freigesetzten 5'-OH-Gruppe des tragergebundenen Nukleosids 2 nahezu quantitativ reagiert [6]. Es versteht sich von selbst, dalj bei einer Kondensationsreaktion, die vom Typ her eine Gleichgewichtsreaktion ist, nur bei absolutem Wasserausschlul3 die Reaktion zu > 98% in die Produktrichtung verschoben werden kann.
50
Gertrlrl Sckniidt
4.3.3 Capping Da eine Kondensationsreaktion schon rein theoretisch nicht zu 100% quantitativ verlaufen kann, verbleibt neben der soeben verlangerten Nukleotidkette ein Rest von ca. 1-2% an nicht umgesetztem Ausgangsprodukt. Dieses eine Prozent Nebenprodukt kann sich aber rnit zunehmender Zahl an Additionsreaktionen ganz betrachtlich vergro13ern. So betragt z. B. nach 20 Monomeradditionen der Anteil an nicht verlangerten Nukleotidketten um die 20%. Wenn diese nicht umgesetzten Nukleotidketten den folgenden Additionsreaktionen zuganglich waren, konnte man wohl kaum mehr ein Zielprodukt aus dem entstandenen Oligonukleotidgemisch isolieren. Daher mussen die wahrend der Monomeraddition nicht umgesetzten 5'-OHGruppen 4 durch einen Cappingschritt" maskiert werden. Dies geschieht durch Acetylierung rnit Essigsaureanhydrid und N-Methylimidazol als nukleophiler Aktivator.
4.3.4 Oxidation Die soeben gebildete Phosphorigsaureester Internukleotidbrucke 5 ist instabil in saurem wie alkalischem Milieu. Daher mu13 eine Oxidation zu einem stabilen Swertigen Phosphorsaureester 6 erfolgen. Hierzu wird Iod als mildes Oxidationsmittel verwendet in basischem T H F und einer Spur Wasser als Sauerstofflieferant. Der Reaktionszyklus ist damit komplett und wird zur Addition weiterer Nukleotidbausteine wiederholt.
4.4 Automatisierung der DNA-Synthese Zu Beginn der achtziger Jahre wurde der Reaktionsablauf der DNA-Synthese zum ersten Ma1 technisch umgesetzt [7]: Es wurden Systeme entwickelt, in dem alle wahrend des Synthesezyklus benotigten Reagenzien RI und R2 in der richtigen Reihenfolge einer Synthesesaule SI zugeleitet werden, die den polymeren Trager rnit dem Startnukleosid enthalt. Ein typisches DNA-Synthesegerat ist rnit 12-15 Reagenzienpositionen ausgestattet, von denen 5-8 Positionen fur Amidite oder Analoga R1, die restlichen Positionen fur Tetrazol, Ammoniak, Essigsaureanhydrid, 1-Methyl-imidazol, Trichloressigsaure, Iod und Acetonitril R2 reserviert sind. Die Reservoirs rnit den benotigten Reagenzien sind durch ein Leitungssystem uber direktionale Ventilblockmodule VI und V2 rnit der Synthesesaule verbunden.
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse
51
CHICN
Abb. 5. Schematischer Aufbau eines DNA-Synthesizers Reservoirs fur Amidite oder Analoga R1 , Reservoirs fur Tetrazol (TET), Ammoniak, Essigsaureanhydrid (Ac.), 1-Methylimidazol (NMI), Trichloressigsaure (TCA), Iod und Acetonitril (CH3CN) R 2 , Ventilblocke V1 und V2 zur Regulierung des Reagenzienzulaufs zu den Synthesesaulen S1 (ggf. his S4), Ventilblock V3 zur Regulierung des Reagenzienablaufs.
Uber ein zweites Leitungsnetz werden die Reservoirs unter Argondruck gesetzt. Die Forderung der Reagenzien erfolgt nun mittels dieses definierten Argondrucks auf die Reagenzien, wenn die entsprechenden Leitungen im Ventilblock freigeschaltet sind. Diese Art der Reagenzienforderung ist verschleiB- und kontaminationsfrei, da keinerlei Pumpe eingesetzt wird. Wann welche Reagenzien wie lange und in welcher Reihenfolge der Synthesesaule zugefuhrt werden, wird von Computerprogrammen bestimmt. In diesen speziellen Programmen (Cycles) ist der zuvor beschriebene Ablauf chemischer Reaktionen in eine zeitliche Abfolge von Steuerbefehlen fur die Ventilblockmodule umgesetzt. Eine optimale FluBfuhrung der Ventilblocks sowie ein geringes Totvolumen sind die Grundlage fur einen sparsamen Reagenzienverbrauch. Die Stabilitat der beteiligten Reagenzien sowie der AusschluB von Wasser wird durch Argon als Schutzgas gewahrleistet. Die Kopplungseffizienz wird nach jedem Synthesezyklus anhand der Konzentration an Dimethoxytrityl-Kationen bestimmt, die in saurer Losung eine orange Farbe besitzen. Die Messung kann an solchen
52
Gerald Schmidt
Systemen ,,On-line" entweder photometrisch oder durch Leitfahigkeitsmessung der Reaktionslosung durchgefuhrt werden.
4.5 Optimierung der DNA-Synthese Das Grundprinzip dieser Methode hat sich seit nunmehr 15 Jahren erfolgreich bewahrt und wurde kontinuierlich weiterentwickelt. Zwischen den Spezifikationen der ersten Gerate und der zur Zeit aktuellen Systemgeneration liegen sozusagen ,,Welten". So verkurzten sich die Zyk1uszeitenz.B. von ca. 15 auf unter 5 min und der kleinstmogliche SynthesemaBstab schrumpfte auf ein Fiinfundzwanzigstel (40 nMol). Dies wurde durch die Entwicklung einer neuartigen Polystyrolmatrix ermoglicht [ 8 ] , die sich wesentlich hydrophober und pH-neutraler verhalt als das konventionelle Controlled Pore Glass (CPG). Eine Optimierung der Reaktionskinetik konnte durch eine deutlich prazisierte Ventilsteuerung im 0,l- statt im l,0-s-Modus erreicht werden; dadurch ist quasi ein Oszillieren der Reaktionslosung auf der Synthesesaule moglich. So konnen heute Oligonukleotide bis zu einer Lange von ca. 200 Basen synthetisiert werden. Einen weiteren Fortschritt in der DNA-Synthese bedeutet die Anwendung einer neuen Schutzgruppe fur das G-Amidit (GdmfFastphorTMAmidit, Perkin Elmer). Dadurch kann der Zeitaufwand fur die Abspaltung der Basenschutzgruppen von 8 h bei 55 "C auf 1 h bei 65 "C reduziert werden [9]. Dies ist moglich, da die neu eingefuhrte Dimethylformamidingruppe, wie die auch weiterhin fur A und C verwendete Benzoylschutzgruppe wesentlich basenlabiler ist als die konventionell fur das G-Amidit verwendete Isobutyrylgruppe.
4.6 Aufarbeitung von Oligonukleotiden Eine Ausbeute von 99% pro Synthesezyklus vorausgesetzt, kann die Gesamtausbeute eines 150 b-Fragments immerhin noch ca. 20% betragen. Bei einer Ausbeute von z. B. 97% pro Zyklus reicht es bei derselben Endausbeute lediglich zu einem ,,53mer". Sehr drastisch fallen die Ausbeuteverluste bei Kompromissen in der Qualitat der verwendeten Reagenzien auch schon bei Primern aus. Werden bei 98,5% Ausbeute pro Zyklus noch > 80% Endprodukt erhalten, so bleiben bei 97% gerade noch 60% Endprodukt iibrig. Diese Diskrepanz zwischen theoretischer und tatsachlicher Ausbeute kann sich durch triviale Aufarbeitungsverfahren wie Entsalzen und Fallen durchschleppen und zu falschen Primer-Konzentrationen in der spateren Anwendung fuhren. Die Art und der Umfang der Reinigung von Oligonukleotiden sollte auf die spatere Verwendung hin abgestimmt werden. Ausbeutebestimmungen durch Messen des
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse
53
Rohprodukts sind wenig aussagekraftig; seriose Mengenangaben sind nur vom isolierten Zielprodukt moglich. Nach dem Ende der Synthese wird das Oligonukleotid mit 25%igem Ammoniak ca. 45 min bei RT von der Tragermatrix abgespalten. AnschlieBend wird die ammoniakalische Losung zur Abspaltung der basenlabilen Schutzgrup en erhitzt (8 h bei 55 "C bzw. 1 h bei 65 "C bei Verwendung des FastPhor GdmyAmidits). Danach liegt folgendes Produktgemisch vor: 1. Gewunschtes Oligonukleotid als Hauptprodukt 2. durch ,,Capping" entstandene kurzere Oligonukleotide der Langen n-1, n-2 etc. 3. durch ,,Depurinierung" entstandene kurzere Fragmente 4. Schutzgruppenfragmente Zur Isolierung des Oligonukleotids aus diesem Rohgemisch haben sich drei gangige Verfahren etabliert [lo].
4.6.1 Gelelektrophorese Die Polyacrylamid-Gelelektrophorese(PAGE) ist eine weit verbreitete Methode zur Charakterisierung und Trennung von DNA-Fragmenten jeder Lange, da durch die Variation der Gelmatrix der optimale Trennbereich vorgewahlt werden kann. So lassen sich Primer < 25 b am besten mit 20%igen Polyacrylamidgelen trennen. Die Trennung erfolgt in etwa proportional zum Molekulargewicht. Das Zielprodukt Iauft am langsamsten, die ,,gecappten" kurzeren Sequenzen erscheinen als schwache Bandenleiter darunter. Etwas ausgepragtere Banden dieser Leiter sind Depurinierungsfragmente. Fur analytische Zwecke (0,005 O.D.) werden mit 32P radioaktiv markierte Oligonukleotide ublicherweise auf 0 , 1 4 2 mm dunnen Gelen getrennt. Die Beurteilung analytischer Gelbilder hangt von der Qualitat der Markierung (korrekte Menge an frischem 32PdATP) sowie der Belichtungszeit des Films ab. 1st die Expositionszeit des Films zu lang, werden schwachere Banden, wie kurzere Fehlsequenzen und Depurinierungsprodukte, im Verhaltnis zum Zielprodukt uberproportional stark dargestellt, da sie gegenuber starken Banden noch nachdunkeln. Eine zu kurze Belichtungszeit tauscht dagegen ein zu sauberes Produkt vor. Auch ein Gelscanner ubertragt diese eventuell falsche Proportionalitat zwischen Haupt- und Nebenprodukten auf die Intensitatsachse. Daher ist die analytische PAGE radioaktiv markierter Oligonukleotide nicht fur quantitative Ausssagen geeignet. Als sogenannte ,,Blau-Marker" zur Beurteilung des Verlaufs der PAGE werden Bromphenolblau und Xylene Cyanol verwendet, deren Laufverhalten je nach verwendeter Gelmatrix bestimmten Oligonukleotidlangen entsprechen.
54
Gerald Scliniirlt
Abb. 6. Autoradiogramm von Oligonukleotiden unterschiedlicher Lange.
Die mit einem bestimmten Gelmedium ideal zu trennenden Oligonukleotidlangen liegen zwischen den Eckwerten fur die beiden Blaumarker, von denen das Xylene Cyanol fur die groBtmogliche Kettenlange steht. Die fur die praparative PAGE von Oligonukleotiden gangigen Geldirnensionen sind wie folgt: Bis zu einer Basenlange von 50 reicht eine Laufstrecke von 15-20 cm, fur groBere Langen werden zur Erzielung einer Auflosung von 1 bp bis zu 40 cm lange Gele empfohlen. Bei einer Geldicke von z. B. 1,5 m m konnen pro Bahn ca. 10-12 O.D. eines Rohgemischs geladen werden. Die Visualisierung der Oligonukleotide erfolgt durch ,,UV Shadow"-Analyse. Dazu wird das Gel auf eine fluoreszierende TLC-Platte gelegt und kurzwelligem UV-Licht ausgesetzt. Die Elution des Zielprodukts aus der ausgeschnittenen Gelbande ist in der Regel mit einem 10-30% igen Produktverlust verbunden.
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse
--
.
- -__
55
_.__ ,
I--. ---I_-_ I_
Abb. 7. Praparative PAGE (15% Polyacrylamid) von Oligonukleotiden der Basenlangen 85, 75 und 65, links jeweils als Rohgemisch, rechts als Reinprodukt.
4.6.2 High Performance Liquid Chromatographie (HPLC) Die HPLC ist sowohl fur analytische als auch fur praparative Trennungen von Oligonukleotiden optimal geeignet. Sie erfordert keinerlei Probenvorbereitung und ist, je nach instrumenteller Ausstattung, fast automatisch durchfuhrbar. Die folgenden beiden Methoden haben sich als Standardroutinen zur Aufreinigung von Oligonukleotiden etabliert: Die ,,Trityl-Off" bzw. die ,,Trityl-On" Chromatographie [ll].Fur beide Methoden wird als feste Phase in der HPLC-Saule Reversed Phase Material mit Cg-Clg-gebUndenen Alkylketten und einer relativ grol3en Porenweite von 300 A eingesetzt. Als mobile Phase wird ein Gradient mit den Komponenten 0,l M Triethylammoniumacetat/Acetonitrilvenvendet. Der Acetonitril-Gehalt wird dabei von ca. 8% auf bis zu 35% gesteigert, bis das Zielprodukt eluiert wird. Die physikalische Basis der ,,Trityl-Off"-Methode liegt in der zunehmenden hydrophoben Wechselwirkung der Purin- und Pyrimidinringe der Nukleotidbasen mit den Alkylketten der Reversed-Phase-Saule. Langere Oligonukleotide werden also prinzipiell spater eluiert. Bei Sequenzen mit hohem GAnteil verschieben sich die Retentionszeiten oft zusatzlich nach hinten. Bei Primern mit selbst komplementaren Bereichen kann es zu Peak-Aufsplittungen und damit zu Schwierigkeiten bei der Identifizierung des Zielprodukts kommen. Die ,,Trityl-Off"-Chromatographiehat den Vorteil, dal3 das Produkt nach der Aufreinigung einsatzbereit vorliegt. Der Nachteil dieser Methode liegt aber darin, da13
56
Gerald Schmidt
Abb.8. HPLC-Chromatogramm eines Oligonukleotids mit und ohne Tritylgruppe. V.1.n.r.: Benzamid-Artefact, kurzerkettige ,,Trityl-Off" Nebenprodukte, ,,Trityi-Off" 22mer: kurzerkettige ,.Trityl-On" Nebenprodukte, ,,Trityl-On" 22-mer. Konditionen: Saule: AquaporeIMRP-300 (4,6 x 200 mm). Mobile Phase: A) 0.1 m TEAA. pH 7, B) Acetonitril. Gradient: 10-35% in 75 min. FluB: 0,s ml/min.
sich das Zielprodukt, physikalisch gesehen, nur geringfugig von kurzeren Nebenprodukten unterscheidet. Wesentlich selektiver kann ein Oligonukleotid mittels der ,,Trityl-On"Methode getrennt werden. Hierbei fuhrt die grofie Affinitat der aus drei aromatischen Ringen bestehenden DMTr-Gruppe zum Reversed-Phase-Saulenmaterial zu einer deutlichen Verzogerung der Elution des gewunschten Oligonukleotids gegenuber kurzeren Nebenprodukten, die diese Gruppe nicht tragen. Da nahezu nur das Zielprodukt die 5'-DMTr-Gruppe tragt, erhalt man bei abnehmender Polaritat des Laufmittels ein sehr einfaches Separationsprofil: Bei einem Gradientenstart von 20% Acetonitril werden nach dem Totvolumen die ,,gecappten" Rumpfsequenzen eluiert, kurz darauf folgt der typische ,,Benzoatpeak", und schliefilich als deutlicher Hauptpeak das Zielprodukt. Die Retentionszeit eines tritylierten Oligonukleotids in Abhangigkeit von seiner Lange verhalt sich umgekehrt wie die eines Oligonukleotids ohne Tritylgruppe. Die Ursache liegt darin, dalj die hydrophoben Wechselwirkungen der Tritylgruppe zum Reversed-PhaseMaterial wesentlich starker sind als diejenigen der Purin- und Pyrimidinbasen und zusammen mit den dadurch ebenfalls deutlich hydrophoberen Elutionsbedingungen die Wirkung der Basen nivellieren. Dagegen spielen nun die hydrophilen Wechselwirkungen der Phosphatgruppen der DNA zur mobilen Phase eine starkere Rolle. Ihr additiver Effekt fuhrt bei zunehmender Phosphatkettenlange zu einer Verkurzung der Retentionszeit tritylierter Oligonukleotide. Daher ist die ,,Trityl-On"-HPLC zur Routineaufarbeitung von Oligonukleotiden bis zu einer Lange von ca. 80 Basen optimal geeignet.
4 Die DNA-Synthese als grundlegendes Werkzeug in der rnolekuluren DNA-Anulyse
57
Die Trennung noch langerer Oligonukleotide von bis zu 150 Basen Lange ist unter Venvendung von alkylierten Tritylgruppen moglich [12]. Die Beladungskapazitat der HPLC-Saule hangt u.a. von den Saulendimensionen ab. Bei Saulenparametern von 4,6 x 20 mm konnen pro Lauf ca. 10 O.D. Rohgemisch aufgereinigt werden. Fur groBere Mengen sollten breitere und langere Saulen venvendet werden, um Verluste an Auflosung zu vermeiden. Mittels eines Probengebers, sowie eines Autosamplers, laBt sich die praparative HPLC von Oligonukleotiden nahezu vollstandig automatisieren. Dasselbe selektive Trennprinzip wird bei Anwendung der ,,Oligonucleotide Purification Cartridge" (OPC) genutzt: Beim Beladen der Chromatographiesaule mit dem Rohprodukt wird die Zielsequenz mittels seiner 5'-DMTr-Gruppe spezifisch immobilisiert, kiirzere Fragmente werden ausgewaschen. Nach Abspaltung der DMTr-Gruppe auf der Saule kann das Zielprodukt mittels Wasser/Acetonitril 80/20 direkt eluiert werden. Die Kapazitat einer OPC-Saule betragt ca. 5 O.D. Diese Art der Aufarbeitung ist die flexibelste, da sie unabhangig von groBeren Separationssystemen ist und drei Funktionen in einem Arbeitsgang verbindet: Isolieren, Entschutzen und Entsalzen des Zielprodukts [13].
'5
'10
'15
'20
'25 min.
Abb. 9. Elektropherogramm des DNA-Syntheserohgemischs eines 120mer Oligonukleotids. V.1.n.r.: Kiirzerkettige Nebenprodukte, Hauptpeak: 120mer. Konditionen: Trennmedium: MICRO-GELlm gelgefiillte Kapillare (ABI), 50pm i.D., 50 cm Lange. Spannung: 300 V/cm.; Detektion: 260 nm; Injektion:2,O s; Puffer: 75 mM Tris-Phosphat;pH 7,6; Temperatur:50 "C.
58
Gc~ralrlSchmidt
4.6.3 Kapillar-Elektrophorese Die MicroGel Kapillar-Elektrophorese ist eine neue und sehr effiziente Methode zur Analyse von Oligonukleotiden. Fur praparative Trennungen ist sic allerdings aufgrund der geringen Kapillardimensionen und der damit verbundenen geringen Beladungskapazitat nicht geeignet. Die Funktionsweise dieser Methode wurde schon in Abschnitt 3.8.3 erlautert. Die Siebmatrix des Gels aus verwickelten Linear-Polymerketten ist derart effizient, dalj sie eine Trennleistung von nur einem Nukleotid besitzt. Daher ist die Kapillar-Elektrophorese die Methode der Wahl zur Routineanalyse von Oligonukleotiden, zumal auch sic mittels eines Probengebers vollstandig automatisiert werden kann [14].
4.7 Mogliche Konsequenzen der Verwendung nichtgereinigter Oligonukleotide auf spatere Anwendungen Wie schon angemerkt, ist die Verwendung definierter Mengen des aufgereinigten Oligonukleotids essentiell fur den Erfolg der damit verbundenen Experimente. Generell sollte bei den meisten Anwendungen der molare UberschuB an Primer gegenuber der DNA-Matrize nicht mehr als Faktor lo7 betragen. Der Einsatz von Rohprodukten direkt aus der DNA-Synthese laBt eine quantitativ korrekte Verwendung nicht zu und kann negative Konsequenzen fur die Spezifitat von PCR-Produkten bzw. die Eindeutigkeit von Sequenzierungsergebnissen haben: Primer, dcren Basenschutzgruppen nach der Synthese nur unvollstandig entfernt wurden (durch Verwendung zu alten oder zu gering konzentrierten Ammoniaks) sind in der Basenpaarung gestort. Die Folge sind Annealing-Probleme. Nicht hinreichend entsalzte Primer verandern die Zusammensetzung von PCRoder Sequenzierungspuffern und konnen so das Milieu der Reaktionslosung negativ beeintrachtigen. Nicht abgetrennte ,,Capping“-Produkte fuhren hingegen zu unspezifischem Annealing dieser kiirzeren Primer-Fragmente. Dies kann nebst dem Hauptprodukt zur Bildung von PCR-Fragmenten verschiedener Loci und Lange fuhren, die Amplifizierung kurzerer PCR-Fragmente reduziert zudem die Ausbeute des Zielprodukts. Sind in einen PCR-Primer im 5’-Bereich funktionelle Elemente wie Restriktionsschnittstellen integriert, enthalten PCR-Amplifikate von am 5’-Bereich verkurzten Primern ggf. diese nur noch unvollstandig und damit inaktiv. Spatere Anwendungen werden damit unspezifisch bzw. nicht mehr durchfuhrbar.
4 Die DNA-Synthese als grundlegendes Werkzeug in der rnolekularen DNA-Analyse
59
4.8 Markierung von Oligonukleotiden Primer werden hauptsachlich fur drei Anwendungsbereiche markiert: zu ihrer Immobilisierung, Modifizierung oder Visualisierung.
4.8.1 Biotin-Markierung Die Immobilisierung von Primern wird in der Regel in PCR-Assays [15] bzw. im Rahmen der Festphasen-Sequenzierung von PCR-Produkten eingesetzt (Abschnitt 5.3.4). Dafur kann der entsprechende PCR-Primer nach der Addition der letzten Nukleotidbase und vor der Beendigung der Synthese am 5'-Ende mit einem Biotin-Amidit [16] versehen werden. Dabei handelt es sich de facto um eine ganz normale ,,Monomeraddition"; da das 3'-Ende des zu addierenden Monomeren denen der Nukleotid-Monomeren entspricht. Am DNA-Synthesizer ist lediglich eine weitere Reagenzienposition in Verbindung mit dem entsprechenden ,,Cyclus" zu venvenden [17].
0
DWT-N
K
NH H
A Abb. 10. Chemische Struktur des Biotin-Amidits.
Die Aufreinigung der Biotin markierten Primer kann analog der ,,Trityl-On"Chromatographie uber HPLC oder OPC erfolgen, da das Biotin-Monomer ebenfalls mit einer Tritylgruppe versehen ist. Durch die Biotin-Gruppe ist die Hydrophobie eines entsprechend markierten Primers zusatzlich erhoht. Daher wird dieser etwas spater eluiert als ein nur tritylmarkiertes Oligonukleotid gleicher Lange. Fur die Synthese eines Biotin markierten Primers (20mer) im 40-nM-Scale kann nach erfolgter Aufreinigung eine Menge von ca. 2 O.D. ( 60pg) erwartet werden.
60
Gerald Schmidt
4.8.2 Phosphorylierung Phosphorylierte Oligonukleotide finden in einer Reihe von molekularbiologischen Methoden Anwendung, so z. B. der Konstruktion von Genen, Klonierungsexperimenten, dem ,,Oligonucleotide Ligation Assay (OLA)"[18], der Ligase Chain Reaction (LCR) [19] und der cDNA-Sequenzierung. Die 3'-Phosphorylierung von Sonden ist z. B. notig, um eine unerwunschte Funktion als Primer zu unterbinden, wenn die Sonde wie bei der TaqMan'rMMethode als Marker verwendet wird oder um eine 3'-Exonuklease Resistenz zu generieren zum Einsatz von Sonden in Ligationsexperimenten. 5'-Phosphorylierte Oligonukleotide fungieren des weiteren oft als Zwischenprodukte bei der 5'-Markierung von Sonden mit nichtradioaktiven Reportergruppen [20]. Oligonukleotide konnen unter Verwendung von Polynukleotid Kinase auch enzymatisch am 5'-Ende phosphoryliert werden. Die Reaktion ist allerdings reversibel und schwierig zu kontrollieren. Daher empfiehlt sich fur Anwendungen, fur deren erfolgreiche Durchfuhrung eine quantitative Phosphorylierung absolut notwendig ist, die chemische Phosphorylierung. Die gewunschte Phosphatgruppe kann uber ein so genanntes Phosphalink Amidit am 5'- oder 3'-Ende eines Oligonukleotids addiert werden. Dabei handelt es sich wie bei der Biotinylierung um eine ganz normale ,,Monomeraddition". Im Falle der 5'-Phosphorylierung wird das Phosphalink Amidit nach Addition des letzten Nukleotidmonomeren zusatzlich addiert. Die freie Phosphatgruppe wird wahrend der nachfolgenden Ammonolyse des Oligonukleotids freigesetzt. Zur 3'-Phosphorylierung wird das Phosphalink Amidit an ein beliebiges polymergebundenes Monomer addiert, bevor die eigentliche Sequenz von Monomerbausteinen folgt. Wahrend der spateren Ammoniakbehandlung wird die Phosphatgruppe am 3'-Ende des ersten addierten Nukleotids freigesetzt. Die Aufreinigung der phosphorylierten Primer kann uber Reversed-PhaseHPLC oder PAGE erfolgen. Unterschiede im Retentions- oder Laufverhalten
Abb. 11. PhosphalinkThf-Reagenzzur chemischen Phosphorylierung von Oligonukleotiden.
4 Die DNA-Synthese als grundlegendes Werkzeug in der molekularen DNA-Analyse
61
machen sich nur bei nicht tritylierten Sonden bemerkbar. 3‘-Phosphorylierte Sonden eluieren in der Reversed-Phase-HPLC etwas fruher als ihre 3’-OH-Derivate; in der Polyacrylamid-Gelelektrophoreseist ihr Laufverhalten ebenfalls leicht verzogert.
4.8.3 Fluoreszenzmarkierung Die Markierung von Oligonukleotiden mit Fluoreszenzfarbstoffen gewinnt mit der deutlichen Verschiebung hin zu nichtradioaktiven DNA-Markierungsmethoden bei der DNA-Sequenzierung, insbesondere aber der PCR-Fragmentanalyse (s. Abschnitt 4.2), und auch der In-situ-Hybridisierung sowie der In-situ-PCR zunehmend an Bedeutung. Daher war die Entwicklung der entsprechenden Farbstoffamidite besonders wichtig [21]. Die chromophore Struktur der [F]-Amidite 6-FAM, TET und HEX besteht aus 6-Carboxyflourescein bzw. seinen tetra- und hexachlorierten Analogen. Die Farbstoffe sowie ihre Linker sind gegenuber den Standardkonditionen, die im Verlauf der DNA-Synthese auftreten, stabil. Daher konnen auch sie in Erganzung der Standard-Amidite im Verlauf der automatischen DNA-Synthese eingesetzt werden [22]. Die weitere Aufarbeitung fluoresceinmarkierter Oligonukleotide kann analog der von 5’-DMTr-Primern erfolgen; das chromophore
X = C l : HEX
X = H : TET 0
A Abb. 12. Chemische Struktur der Fluoreszenz-Amidite 6-FAM, TET und HEX (6-Carboxyflourescein bzw. seine tetra- und hexachlorierten Analogen).
62
Gerald Schniidr
Gerust der Fluoreszenzfarbstoffe ubt einen noch starkeren hydrophoben Effekt auf Reversed-Phase (RP)-Trennmedien aus als die Dimethoxytritylgruppe. Fluoresceinmarkierte Primer retardieren im Verlauf der RP-HPLC somit noch spater als ihre DMTr-Analogen. Die hohe Affinitat der Fluoreszenzfarbstoffe zu RP-Phasen lafit auch die OPC-Aufreinigung fluoresceinmarkierter Primer bei hoher Reinheit des Endprodukts zu. Ein [F].Amidit zur direkten Markierung von Prirnern rnit ROX (6-Carboxyrhodamin X) bzw. eines komplementaren Markers, wird z. Z. entwickelt. Bislang wird diese Markierung, wie fruher fur alle Fluoreszenzfarbstoffe, uber einen ZweistufenprozeB durchgefuhrt. Im ersten Schritt wird, ebenfalls als Amidit, ein sog. Amino(hexy1)-linker an das 5'-OH-Ende des Primers addiert [23]. Der Farbstoff selbst wird im 2. Schritt nach erfolgter Trager- und Schutzgruppenabspaltung des Primers als N-Hydroxysuccinimidester mit der soeben gebildeten 5'Aminofunktion umgesetzt. Diese Reaktion verlauft allerdings nicht quantitativ, die Ausbeute betragt ca. 60-70%. Eine Aufreinigung uber RP-HPLC ist somit zwingend.
4.9 Anwendungen von Oligonukleotiden Die Anwendungsmiiglichkeiten von Oligonukleotiden sind so vielfaltig, daB es den Rahmen dieses Kapitels uberschreiten wurde, sie aufzuzahlen. In der automatischen genetischen Analyse sind Oligonukleotide, sowohl in der Probenvorbereitung (PCR), als auch der DNA-Sequenzierung oder DNA-Fragmentanalyse, ein essentieller Bestandteil. Bei der Verwendung von unterschiedlich fluoreszenzrnarkierten Primern addiert sich zur Sequenzspezifitat der Primer zusatzlich eine Selektionsmoglichkeit uber die verschiedenen Farbmarker, was insbesondere in der DNA-Fragmentanalyse oder der Mutationsanalyse von PCR-Produkten mittels des TaqMan'rM-Prinzipsanschaulich demonstriert wird.
4.10 Literatur [ 11 [2] [3] [4] [5]
Mullis K. B., Faloona F.A.. Methods in Enzymology 155 (1987), 335-350. Watson J. D., Crick F. H.. Nature 171 (1953), 737-738. Khorana H. G. et. al., J. Am. Chem. SOC.85 (1963), 3821-3826. Beaucage S. L., Caruthers M.H., Tetrah. Lett. 22 (1981), 185942. Koster H., Biernat J., McManus J., Wolter A,, Stumpe A,, Narang C.K., Sinha N.D., Tetrahedron40(1984). 103-1 12; McCollum C., AndrusA.,Tetrahedron Letters32 (1991),40694072. [6] Dahl O., Phosphorus Sulfur 18 (1983), 201-203. [7] Hunkapiller M., Kent S.. Caruthers M.H., Dreyer W.. Firca J., Horvath S., Hunkapiller T., Hood L., Nature 3 (1984). 1C14.
4 Die DNA-Synthese als gritndlegendes Werkzeug in der molekularen DNA-Analyse
63
[8] Andrus A., McCollum C., presented at the Ninth Intl. Round Table: Nucleosides, Nucleotides and their Biol. Applic., Uppsala, Sweden, July 1990. [9] Theisen P., McCollum C., Andrus A,, Nucleosides & Nucleotides 12 (1993), 1033-1046. [ 101 Andrus A. et. al. Evaluating and Isolating Synthetic Oligonucleotides, 38X User Bulletin No. 13 (1992), revised Version. [ l l ] Ziske L.R., BioChromatography 3 (1988), 112-117. [12] Seliger H., Schmidt G., J. Chromatography 397 (1987), 141-151. [13] McBride L.J., McCollum C., Davidson S., Efcavitch J.W., Andrus A., Lombardi S., Biotechniques 6 (1988), 362-367. [14] Andrus A., Methods, A Companion to Methods in Enzymology 4 (1992), 213-226. [15] Scharf S.J., Proc. Natl. Acad. Sci. USA 86 (1989), 62154219. [16] Pon R.T., Tetrahedron Lett. 32 (1991), 1715-1718. [17] Applied Biosystems DNA Synthesis User Bulletin 70 (1992), 1-8. [18] Nickersin D.A., Kaiser R., Lappin S., Stewart J., Hood L., Landegren U., Proc. Natl. Acad. Sci. 87 (1990), 8923-8927. [19] Barany F., PCR Methods and Applications 1 (1991), 5-16. [20] Lee L.G., Connell C.R., Bloch W., Nucleic Acids Res. 17 (1989), 3761-3766. [21] Theisen P., McCollum C., Upadhya K., Jacobson K., Vu H., Andrus A., Tetrahedron Lett. 33 (1992), 5033-5036. [22] McCollum C., Chakerian V., Kaufman J., Wenz M., Andrus A,, Biomed. Peptides, Proteins & Nucleic Acids 1(1994) 25-30. [23] Smith L.M., Fung S., Hunkapiller M., Hood L.E., Nucleic Acids Res. 13 (1985), 2399-2412.
This page intentionally left blank
5 DNA-Sequenzanalyse Thomas Schafer
5.1 Einleitung Die Entschlusselung der DNA-Sequenz, d. h. die exakte Bestimmung der Reihenfolge der vier Nukleotide,’vereinfacht auch Basen genannt, begann 1968 rnit der Entdeckung von Restriktionsendonukleasen. Diese Enzyme konnen die DNA sequenzspezifisch schneiden und damit in kleine Untereinheiten, DNAFragmente, zerlegen. Die Entwicklung hochauflosender Polyacrylamidgele, welche die Trennung von zwei Untereinheiten zulassen, die sich nur um eine einzige Base voneinander unterscheiden, schuf schlieBlich die Grundlage fur alle heute gangigen Sequenzierverfahren.
5.2 Sequenzier-Techniken Um die Sequenz der DNA oder einzelner DNA-Fragmente bestimmen zu konnen, benotigt man ein Verfahren, das zum einen einzelstrangige DNA-Fragmente unterschiedlichster Lange entsprechend der Reihenfolge der zu analysierenden Basen Adenin (A), Cytosin (C), Guanin (G) oder Thymin (T) erzeugt, zum anderen eine Markierung dieser Molekule liefert, damit man sie spater detektieren und voneinander unterscheiden kann.
5.2.1 Maxam-Gilbert-Sequenzierung Die Methode nach Maxam und Gilbert [l]lost dieses Problem im Gegensatz zu allen anderen Methoden, die auf enzymatischen Reaktionen beruhen, durch eine Reihe von chemischen Reaktionen. Dabei wird die zu untersuchende DNA zunachst an einem Ende radioaktiv oder rnit einem Fluoreszenzfarbstoff markiert (s. Abschnitt 5.4). AnschlieSend wird sie in vier Aliquots unterteilt. Jedes Aliquot untenvirft man einer spezifischen Spaltreaktion und zwar: 0
rnit Dimethylsulfat, spezifisch fur die G-Reaktion; rnit Ameisensaure, spezifisch fur die G+A-Reaktion; rnit Hydrazin, spezifisch fur die T+C-Reaktion; rnit Hydrazin in Gegenwart von NaC1, spezifisch fur die C-Reaktion.
66
7'hotnu.c Schujtr
Diese Reagenzien fiihren zu einer basenspezifischen Modifikation der DNAMolekiile. Nach Zugabe von Piperidin erfolgt eine Spaltung der Phosphodiesterbindungen an den Stellen, an denen zuvor die modifizierten Basen abgespalten worden sind. Eine Sequenzierung wird dadurch ermoglicht, dal3 die Modifikationen an den Basen nicht quantitativ, sondern nur in geringer Ausbeute ablaufen. Damit werden nicht alle DNA-Molekiile an genau derselben Stelle gespalten, was zu einer gleichmafiigen Verteilung von Molekiilen mit identischen Enden aber unterschiedlicher Lange fiihrt. AnschlieBend werden die vier Reaktionsansatze nebeneinander auf einem Polyacrylamidgel analysiert (Abb. 1).
C
Sequenz
CTAATG ACTGGATTC CTAATGACTGGATT CTAATGACTGGAT CTAATG ACTGGA CTAATGACTGG CTAATGACTG CTAATGACT CTAATGAC CTAATGA CTAATG CTAAT CTAA CTA CT C
Abb. 1. Darstellung und Prinzip der chemischen DNA-Sequenzierung nach Maxam und Gilbert. Nach der Auftrennung auf einem Sequenziergel k6nnen die markierten DNA-Molekule sichtbar gemacht werden.
Wegen dcs hohen Zeitaufwandes und geringer Ausbeuten hat die chemische DNA-Sequenzierung heutzutage jedoch weitgehend an Bedeutung verloren.
5.2.2 Sequenzierung nach Sanger Grundlage der klassischen Methode nach Sanger [2] ist eine enzymatische Reaktion mit einer DNA-Polymerase. Zur Durchfuhrung seiner Reaktion hat Sanger das Klenow-Fragment der E. coli DNA-Polymerase I verwendet. Inzwischen haben sich jedoch zwei andere Polymerasearten als ideal herauskristallisiert, die allen Anforderungen gerecht werden (s. Abschnitt 5.5.3).
5 DNA-Sequenzanalyse
67
DNA-Polymerasen synthetisieren bei Vorlage eines Templates (auch Matrize genannt), das in diesem Fall ein DNA-Einzelstrang ist, einen basenkomplementaren Gegenstrang. Da die Ziel-DNA in den meisten Fallen als Doppelstrang vorliegt, mu13 sie in einem ersten Schritt denaturiert werden, d. h. der Doppelstrang wird in zwei Einzelstrange aufgeschmolzen (Abb. 2). Bei der klassischen Methode wird eine Denaturierung durch Zugabe von Alkali (NaOH) erreicht.
3‘ 5‘
lnlllllllllllllll
3’ 5’
5’
3‘
3’
5‘
Abb. 2. Denaturierung von DNA zur Erzeugung von Einzelstrangen.
Nach der Neutralisation des Reaktionsansatzes benotigt die Polymerase fur den Synthesestart ein kurzes, einzelstrangiges DNA-Stuck aus ca. 20 Basen, den Primer, welcher zu einem Bereich des Templates komplementar ist. Dieser Primer wird an das Template durch Wasserstoffbruckenbildung gebunden (Annealing) (Abb. 3).
Primer 5‘
3’
3’
5’
Abb. 3. Primer-Annealingan den DNA-Einzelstrang.
Das Primer-Template-Hybrid dient als Startmolekul fur die Polymerase, welche dann den Gegenstrang durch Einbau komplementarer Basen in Form von Desoxynukleosidtriphosphaten (dNTP’s) synthetisiert (Elongation) (Abb. 4). Dabei bilden jeweils die Basen A und T bzw. G und C ein komplementares Paar. 5’ Abb. 4. Kettenverlangerung (Elongation) durch Einbau komplementarerBasen.
68
Thoinns Schafer
Bietet man dem Enzym fur die Einbaureaktion ein definiertes Gemisch aus Desoxy- und Didesoxynukleosidtriphosphaten (ddNTP's) an, so wird die Kettenverlangerung an dem Primer immer dann abgebrochen, wenn ein Didesoxynukleotid eingebaut wird. Da dem Didesoxynukleotid die 3'-Hydroxylgruppe fehlt, kann die Synthese der komplementaren DNA-Kette an dieser Position nicht weiter fortgesetzt werden. Auf diese Art und Weise entsteht bei fortlaufender Reaktion ein Gemisch aus DNA-Molekulen, die alle an einem Ende rnit der Primersequenz beginnen, uber ihre jeweilige Lange eine Kopie des Templates darstellen und mit einem der vier verschiedenen Didesoxynukleotide A, C, G oder Tenden. In der Praxis wird das Primer-Template-Hybrid auf vier verschiedene Reaktionsansatze verteilt, die aul3erdem das Sequenzierenzym, einen Reaktionspuffer, alle vier dNTP's fur die Kettenverlangerung und je eines der vier ddNTP's enthalten. Nach Beendigung der Reaktion befinden sich in einem Ansatz DNA-Fragmente, die alle am 3'-Ende mit dem Didesoxynukleotid A enden, in den anderen Ansatzen entsprechende DNA-Fragmente, die rnit einem C, einem G bzw. rnit einem T enden. Die DNA-Fragmente in den verschiedenen Reaktionsansatzen werden anschliefiend unter Zugabe von Formamid 2 Minuten lang bei 90 "C hitzedenaturiert und nach Abkuhlung auf einem denaturierenden Sequenziergel analysiert. Dabei werden die vier Reaktionsansatze in nebeneinanderliegenden Spuren aufgetragen. Bei Verwendung eines Multifluorophorsystems [3] konnen hingegen aller vier Reaktionen nach ihrer Vereinigung in einer einzigen Spur aufgetragen werden (s. Kapitel 7).
5.2.3 ,,Cycle-Sequenzierung" Der ,,Cycle-Sequenzierung" liegt die Sanger-Methode zu Grunde, jedoch kann hierbei auf den kritischen Denaturierungsschritt mit Alkali verzichtet werden. Die Denaturierung der DNA erfolgt vielmehr durch Erhitzen des Reaktionsansatzes auf 96 "C. Eine ,,Cycle-Sequenzierung" kann deshalb nur rnit thermostabilen Polymerasen durchgefuhrt werden. Anders als bei der klassischen Sequenzierung, bei welcher der Template-Strang in nur einer Reaktionsfolge aus den drei Schritten: Denaturierung, Annealing und Kettenverlangerung kopiert wird, werden bei der ,,Cycle-Sequenzierung" die notwendigen Kopien durch mehrmalige Wiederholung (20-30mal) dieses Zyklus erzeugt (Abb. 5). Das gibt der Methode, welche iiblichenveise in einem Thermocycler durchgefuhrt wird, ihren Namen. Dabei weist ein typischer Zyklus folgendes Temperaturprofil auf: Denaturierung Annealing Kettenverlangerung
96°C 55°C 70 "C
15s 15s 1 min
5 DNA-Sequenzanalyse
69
Vorteile dieser Methode sind: 0
0 0
der Bedarf an Template-DNA betragt nur ca. ein Fiinftel von dem anderer Methoden; hohe Spezifitat des Primerannealings durch hohe Temperaturfuhrung; gute Auflosung von Sekundarstrukturen insbesondere bei problematischen Templates; geringe Fehlerrate beim Ansetzen und Durchfiihren der Reaktionen.
Reaktionsansatr
I. I OrigiPalTemplate
Abb. 5. Prinzip der ,,Cycle-Sequenzierung".
70
Tlionius Scha,fer
5.2.4 Multiplex-Sequenzierung Dem von Church und Kieffer-Higgins [4] entwickelten Verfahren der MultiplexSequenzierung liegt die oben schon erwahnte chemische DNA-Sequenzierung nach Maxam und Gilbert zugrunde. Dazu werden in einem ersten Schritt die zu analysierenden DNA-Fragmente in Plasmide einkloniert. Die Klonierungsstelle in den Plasmiden wird so eingerichtet, dafi die Fragmente von verschiedenen, aber eindeutig definierten Oligonukleotidsequenzen umgeben sind. Anschliefiend werden die rekombinanten Plasmide, die sich durch die insertierten Fragmente und die diese begrenzenden Primersequenzen unterscheiden, vereinigt und mit dem Restriktionsenzym Not1 behandelt. Dieses schneidet die Fragmente inklusive Primersequenz wieder aus den Plasmiden heraus. Danach wird die DNA den vier chemischen Reaktionen ausgesetzt. Im nachsten Schritt erfolgt die Auftrennung der Fragmente iiber ein Sequenziergel und die Ubertragung der DNA-Sequenzleitern auf Nylon-Filter. Mit Hilfe der Hybridisierungstechnik konnen dann die einzelnen DNA-Fragmente durch Anlagerung markierter Oligonukleotide, die zu den entsprechenden Primersequenzen komplementar sind, sichtbar gemacht werden. Die Sequenz der DNA laflt sich nun mit einer Autoradiographie sichtbar machen. Wascht man anschliefiend das markierte Oligonukleotid wieder vom Filter ab, kann das Filter erneut mit anderen markierten Oligonukleotiden hybridisiert werden, die zu anderen der im Ausgangsgemisch enthaltenen Fragmente homolog sind. Auf diese Art und Weise konnen weitere Sequenzen ermittelt werden. Ein einziges Filter kann mit diesem Verfahren bis zu 50mal wiederverwendet werden.
5.3 Templates Als Template bezeichnet man die zu sequenzierende Ausgangs- oder Ziel-DNA. Diese kann nach einer entsprechenden Praparation (s. Kapitel 2) einzel- oder doppelstrangig vorliegen. Fur eine erfolgreiche Sequenzierung sollte das Template salzfrei und frei von organischen Verbindungen sein. Eine vorhergehende Quantifizierung ist selbstverstandlich.
5.3.1 Phagen und Phagemide Die ersten Templates, die zur Sequenzierung eingesetzt wurden, waren Derivate des einzelstrangigen Bakteriophagen M13 [ 5 ] .Zur Erzeugung dieses einzelstrangigen Templates wird die Ziel-DNA zunachst in die doppelstrangige Form des Virus kloniert, dann in E. cofi transformiert und in Form von Phagen-Partikeln prapariert, welche die Einzelstrang-DNA enthalten.
5 DNA -Sequenzanafyse
71
Eine weitere Moglichkeit bietet der Einsatz von Hybrid-Vektoren, aus einzelund doppelstrangigen Vektoren, sogenannte Phagemide. Sie bestehen aus einem doppelstrangigen Plasmid, welches den Replikationsursprung eines einzelstrangigen Virus enthalt [6,7]. Wenn dann der Wirt, welcher das Plasmid tragt, rnit einem Helfervirus infiziert wird, vermehrt sich das Plasmid in einzelstrangiger Form und wird in Phagenpartikel eingepackt. Diese Partikel mussen dann nur noch prapariert werden. Einzelstrang-DNA stellt ein ideales Ausgangsmaterial fur die Sequenzierung dar, weil der Denaturierungsschritt entfallen kann und weil kein komplementarer Strang rnit dem Sequenzier-Primer bei der Anlagerung an die Ziel-DNA konkurriert. Jedoch kann diese Art des Templates immer nur in einer Richtung sequenziert werden, was bedingt, daB die Ziel-DNA fur eine vollstandige Sequenzierung in zwei verschiedene Vektoren, deren Inserierungsabschnitt spiegelbildlich gestaltet ist, kloniert werden muB.
5.3.2 Plasmide und Cosmide Doppelstrangige DNA-Molekule sind die gebrauchlichsten Templates bei der Sequenzierung. Die in der Regel aus E. coli praparierten, ringformigen Plasmide haben GroBen zwischen 3 und 7 kb. Sie tragen in ihrer ,,Multiple Cloning Site" die interessierende Zielsequenz als Insert. Dabei sind Insertlangen zwischen 1.50 und 2500 bp moglich. In den flankierenden Regionen enthalten die Plasmide bekannte Bindestellen fur universal einsetzbare Primer. Sequenziert man rnit Hilfe dieser Primer von beiden Seiten in das Insert hinein, kann man bei entsprechend kleinen Inserts rnit Langen bis zu 1,skb eine Uberlappung der Sequenzen erreichen. Je nach Wahl des Sequenzierenzyms benotigt man durchschnittlich 1pg Plasmid-DNA fur Taq- und 5 pg fur 'IT-Polymerase-Reaktionen. Cosmide sind doppelstrangige DNA-Molekule rnit GroBen zwischen 20 und 50 kb. Eine Sequenzierung dieser Templates rnit Leseweiten bis zu 550 Basen gelingt nur rnit T'q-DNA-Polymerase, da die hohe Arbeitstemperatur des Enzyms eine maximale Denaturierung der Cosmid-DNA bewirkt. AuBerdem benotigt man spezielle Sequenzierprimer, die von Cosmid zu Cosmid unterschiedlich sind. Die Gesamtsequenz eines Cosmids 1aBt sich nur durch ,,Primerwalking" ermitteln, was einen erheblichen Zeitaufwand bedeutet. Letztendlich mussen 2 pg reine Cosmid-DNA fur eine Taq-Polymerase- und 20 yg fur eine T7Polymerase-Reaktion prapariert werden.
72
Thomus Schiifcr
5.3.3 PCR-Produkte PCR-Produkte sind die idealen Templates fur die Sequenzierung. Sie lassen sich in der Regel schnell aus extrem geringen DNA-Ausgangsmengen generieren und machen damit eine langwierige Klonierung mit anschlierjender DNA-Praparation uberflussig (s. Kapitel 3). Besonders in der medizinischen Diagnostik, wo Zeit oftmals eine entscheidende Rolle spielt, hat die direkte Sequenzierung von PCR-Produkten ein weitverbreitetes Einsatzgebiet gefunden. Zur direkten Sequenzierung von PCR-Produkten entnimmt man ein Aliquot aus dem PCRReaktionsansatz und uberfuhrt es direkt in eine Sequenzierungs-Reaktion. Um das zu ermoglichen, gibt es zwei verschiedene Techniken, die symmetrische bzw. die asymmetrische PCR [S]. Der Unterschied zwischen den beiden Reaktionen besteht darin, darj in eine symmetrische PCR beide PCR-Primer in aquimolaren Mengen eingesetzt werden, wahrend fur eine asymmetrische PCR die Konzentration eines Primers SO bis lOOmal hoher als die des anderen gewahlt werden muB. Das genaue Verhaltnis variiert von PCR zu PCR und mu13 entsprechend den Bedurfnissen der Ausgangs-DNA in einer Reihe von Vorversuchen ausgelotet werden. Im Falle einer asymmetrischen PCR erhalt man uberwiegend einzelstrangige DNA-Produkte, welche sich zur direkten Sequenzierung mit T7-Polymerase eignen. Symmetrische PCR-Produkte konnen nur uber eine ,,Cycle-Sequenzierung" direkt sequenziert werden. Fur eine klassische Sequenzierung mussen die symmetrischen PCR-Produkte erst einzelstrangig gemacht werden, was uber eine Strangtrennung mit Magnetic Beads erreicht werden kann (s. Abschnitt 5.3.4). Ein kritischer Punkt bei der Verwendung von PCR-Produkten als Templates sind Fehler in diesen Fragmenten, die durch den Einbau falscher Nukleotide in den ersten Zyklen der PCR entstanden sind. Diese Fehler findet man haufig dann, wenn man von sehr wenig Template-Molekulen fur die PCR ausgeht. In der anschlieljenden Sequenzierung fallt der Fehler zunachst nicht auf und kann nur ausgeschlossen werden, wenn man Produkte aus zwei verschiedenen PCRAnsatzen sequenziert.
5.3.4 Magnetic Beads Der Einsatz von paramagnetischen Eisenoxid-Kugelchen (Magnetic Beads) zur Templategenerierung mit anschlieljender Sequenzierung [9] wird auch als Sequenzierung an der Festphase bezeichnet. Es handelt sich dabei um die Sequenzanalyse von einzelstrangiger DNA, die uber eine Biotin-StreptavidinBindung an die Beads gekoppelt ist. Um das zu erreichen, wird ein definierter DNA-Abschnitt zunachst uber PCR unter Verwendung eines biotinylierten und eines normalen Primers amplifiziert. Das biotinylierte 5'-Ende des doppelstrangigen PCR-Produktes wird an die mit Streptavidin beschichteten, magnetischen
5 DNA-Sequenzanalyse
73
Kugeln gebunden. AnschlieBend werden der Doppelstrang durch Zugabe von Natronlauge denaturiert und die dabei entstandenen Einzelstrange physikalisch voneinander getrennt (s. Kapitel2). Der an den Magnetkugeln zuriickgebliebene Einzelstrang kann nun mit dem normalen Primer aus der PCR sequenziert werden. Der zweite, in Losung verbliebene Einzelstrang kann nach einer EthanolFallung und Wiederaufnahme in Wasser ebenfalls sequenziert werden. Die Festphasenmethode wird unter anderem dann angewandt, wenn der Doppelstrang ein Template darstellt, welches sich fur eine Sequenzreaktion nicht vollstandig denaturieren laBt und komplizierte Sekundarstrukturen ausbildet.
5.4 Markierungs-Methoden Um die Sequenzleiter einer sequenzierten DNA-Probe sichtbar zu machen, mu13 die DNA vor, wahrend oder nach der Reaktion markiert werden. Dabei bestimmt die Art der Markierung und die anschlieaende Detektion die Empfindlichkeit des Verfahrens. Die zuerst entwickelten Markierungsverfahren basieren ausschlieljlich auf radioaktiven Methoden. Verwendung finden dabei hauptsachlich die Radioisotope 32P,33Pund 35S[lo]. Wegen des gesundheitlichen Risikos und der niedrigen Umweltvertraglichkeit, finden jedoch mehr und mehr nichtradioaktive Markierungsverfahren ihren Weg in die Laboratorien. Als besonders geeignet dafiir haben sich inzwischen eine Reihe von Fluoreszenz-Farbstoffen herausgestellt [ll].Bei den am haufigsten verwendeten Fluoreszenz-Farbstoffen handelt es sich um Fluorescein- bzw. Rhodamin-Derivate (s. Kapitel7). Aber auch die Chemilumineszenz bestimmter Marker kann zur Detektion eingesetzt werden. Im folgenden werden die verschiedenen Moglichkeiten der DNA-Markierung fur eine Sequenzierung dargestellt.
5.4.1 Sequenzierung mit markierten Primern Bei der Primermarkierung wird ein Sequenzierprimer eingesetzt, der am 5’-Ende eine Markierung tragt. Die 5’-Markierung des Primers erreicht man durch den enzymatischen Einbau eines Radioisotops mit T4-DNA-Kinase, oder chemisch durch den Einbau eines Fluoreszenz-Amidites. Die Fluoreszenzgruppe kann dabei entweder wahrend einer automatischen DNA-Synthese angekoppelt oder nachtraglich iiber eine chemische Reaktion eingefiihrt werden (s. Kapitel 4). Da dieser Primer dann das 5’-Ende aller DNA-Fragmente darstellt, tragen diese damit automatisch die entsprechende Markierung (Abb. 6). Einschrankungen bei einer Sequenzierung mit markierten Primern sind: Die Sequenzierungs-Reaktion muB in vier verschiedenen Ansatzen durchgefiihrt werden.
Abb. 6. Sequenzierung mit einem markierten Primer.
0
Unspezifische Abbruche durch Abfallen des Enzyms wahrend Kettenverlangerung ohne Einbau eines spezifischen Didesoxynukleotides, sogenannte ,,Termination-sites", sind sichtbar und erschweren damit die Sequenzinterpretation. Fur eine Sequenzanalyse mussen die Primer extra markiert werden.
5.4.2 Sequenzierung mit markierten Desoxynukleotiden Mochte man auf die Markierung von Primern verzichten und jeden beliebigen Primer in eine Sequenzierung einsetzen, kann man die Markierung der DNA wahrend der Reaktion durch den Einbau von markierten Desoxynukleotiden vornehmen (Abb. 7). Dabei wird dem entsprechenden Reaktionsansatz eines der vier dNTP's in markierter Form und geringer Konzentration beigemischt. Wiirde man im Fall einer Fluoreszenz-Markierung das markierte Nukleotid in groljen Mengen beigeben, so erhielten die DNA-Fragmente durch seinen Einbau entsprechend ihrer Sequenz sehr grolje Molekulargewichte, was das Wanderungsverhalten im Sequenzgel beeinflussen und damit die Auswertung erheblich erschweren wurdc. Beim radioaktiven Markierungsverfahren tritt dieser Nachteil nicht in Erscheinung und das Desoxynukleotid kann viele Male eingebaut werden, was einem positiven Signal-Rausch-Verhaltnis zugute kornmt. Auljerdem besitzt das System die hochste Empfindlichkeit, weil die Expositionsdauer bei der anschlieIjenden Detektion beliebig gewahlt werden kann.
Abb. 7. Markierung mit einem Desoxynukleotid wahrend d e r DNA-Synthese
Fur eine DNA-Sequenzierung kann jeder beliebige, unmarkierte Primer eingesetzt werden. Einschrankungen dieser Methode sind jedoch: 0
0
Die Sequenzierungs-Reaktion mulj in vier verschiedenen Ansatzen durchgefuhrt werden. Unspezifische Kettenabbruche erschweren die Sequenzinterpretation.
5 DNA-Sequenzanalyse
75
5.4.3 Sequenzierung mit markierten Didesoxynukleotiden (DyeTerminatoren) Die Markierung der DNA durch Didesoxynukleotide (Abb. 8) bietet gegenuber den oben erwahnten Markierungsverfahren einen entscheidenden Vorteil: unspezifische Kettenabbruche sind nicht mehr sichtbar. Das Enzym fallt zwar wahrend der Reaktion nach wie vor von dem Template ab, aber die daraus resultierenden, fehlerhaft terminierten Fragmente tragen keine Markierung, da kein Didesoxynukleotid eingebaut worden ist. Wahrend der nachfolgenden Analyse bleiben diese unspezifischen Produkte daher unsichtbar. Die Nukleotidkonzentrationen und Reaktionsbedingungen mussen jedoch bei dieser Form der Sequenzierung speziell auf die venvendete DNA-Polymerase abgestimmt werden, da die verschiedenen Enzyme die mit dem Farbstoff versehenen Didesoxynukleotide im Vergleich zu den nichtmarkierten Desoxynukleotiden unterschiedlich akzeptieren und einbauen.
I1 Abb. 8. Markierungsprinzip rnit DyeTerminatoren.
Bei Verwendung eines multifluorophoren Sequenziersystems konnen unterschiedlich markierte Terminatoren [12] eingesetzt werden, so darj die Reaktion sogar in einem einzigen, statt in vier verschiedenen Ansatzen durchgefuhrt werden kann. Die Moglichkeit von Pipettierfehlern wird auf ein Minimum reduziert.
5.4.4 Nachtragliche Sequenz-Markierung Eine Sequenzierung ohne Radioaktivitat oder ohne ein entsprechendes automatisches Fluoreszenzdetektionssystem kann mit der Chemilumineszenz-Methode [13] durchgefuhrt werden. Grundlage fur die Reaktion bildet wiederum die Sanger-Sequenzierung, wobei diesmal Sequenzierprimer eingesetzt werden, die am 5’-Ende eine Biotingruppe tragen. Nach der Sequenzierungsreaktion werden die vier Ansatze auf einem Polyacrylamidgel aufgetrennt und die DNA-Fragmente auf eine Nylonmembran ubertragen. Die Membran wird anschlierjend mit einer Losung inkubiert, welche ein Konjugat aus Streptavidin und Alkalischer Phosphatase enthalt. Uber das Streptavidin wird die Phosphatase an die Biotinseitengruppe der DNA gebunden. Fugt man nun eine Losung von CSPD@ [Dinatrium-3-(4-
76
Thonias Schafer
methoxy-spiro[1,2-dioxetan-3,2’-(5’-chloro)-tricyclo-[3.3.1.13,7]decan]-4-yl)phenyl-phosphatl zu [14], so wird das CSPDO durch das Enzym dephosphoryliert, und es entsteht ein instabiles Anion, welches Licht aussendet und rnit Hilfe eines entsprechenden Films detektiert werden kann. Die Halbwertszeit des Anions auf der Nylonmembran betragt 40 Minuten bei einem Emissionsmaximum von 460 nm. Wahlweise konnen fur eine Analyse auch rnit Digoxygenin, 2,4-Dinitrophenyl (DNP) oder Fluorescein markierte Primer in die Sequenzierungs-Reaktion eingesetzt werden. Die mit diesen Primern markierte DNA wird dann mit einer spezifischen, an einen Antikorper gebundenen Phosphatase zur Detektion umgesetzt.
5.5 Der Weg zur vollstandigen Sequenz Grolje Sequenzierungsprojekte dienen zur Entschlusselung von besonders langen DNA-Abschnitten oder grol3en Genomen. Dabei befindet sich die Lange der zu analysierenden DNA-Sequenz oftmals weit auljerhalb des Auflosungsbereiches von Polyacrylamidgelen (etwa 800 Basen). So liegen die Gesamtlangen der zu sequenzierenden DNA-Strange haufig im Bereich von 2 4 0 kb. Bevor man ein solches Projekt angeht, sollte man sich eine spezielle Strategie [15] zurechtlegen. Fur eine Bestimmung der Gesamtsequenz mu13 die mehrere kb grol3e Ziel-DNA in kleinere Teilstucke gespalten werden, die man dann individuell sequenzieren muB. Um letztendlich aus den vielen Einzelsequenzen die richtige Ausgangssequenz wieder herstellen zu konnen, bedarf es spezieller Auswerteprogramme (s. Kapitel8). Ausgangspunkt fur die Sequenzanalyse ist eine unbekannte, meist doppelstrangige DNA. Zur Bewaltigung des Sequenziervorhabens sollten folgende Aspekte Berucksichtigung finden: 0
0
geringer Aufwand fur die DNA-Praparation; kurze Analysezeiten mit hoher Genauigkeit; hohe Leseweiten; vergleichende Sequenzbestimmung.
Bei Betrachtung all dieser Punkte kommt man sehr schnell zu dern SchluB, daB der richtige Weg zur vollstandigen Sequenz nur aus einer geschickten Kombination von verschiedenen Techniken und Methoden bestehen kann. Die einzelnen Punkte sollen im Detail diskutiert werden, wobei jedoch kein Patentrezept fur jeden erdenklichen Fall existiert.
5 DNA -Sequenzanalyse
71
5.5.1 Geringer Aufwand fur die Probenvorbereitung Entscheidenden EinfluB auf den Erfolg eines Sequenzierprojektes hat der erste Schritt, namlich die Probenvorbereitung. Dabei spielen folgende Uberlegungen eine Rolle: Steht genugend Ausgangsmaterial zur Verfugung, wie oft mulj die DNA prapariert werden und welche Sequenzierprimer konnen Verwendung finden? AuBerdem ist zu uberlegen, wie das relativ groBe Ausgangsmolekul in analysierbare Untereinheiten zerlegt werden kann.
-
Wahl der Vorbereitungsmethode
Prinzipiell gibt es zwei Verfahren zur Zerlegung von grol3en DNA-Segmenten in kleinere Fragmente. Das gangigste Verfahren ist die Erzeugung kurzer Zufallsprodukte, die in Plasmide einkloniert werden (Shotgun-Klonierung) [16,17]. Dazu wird die Ziel-DNA mit Hilfe von Restriktions-Enzymen in kleine Segmente zerlegt. Bei dem ProzeB entsteht eine Vielzahl von Bruchstucken, deren Unterscheidung und Zuordnung nach der Klonierung und Praparation sehr schwierig ist. Besonders arbeitsintensiv wird der Prozel3, wenn eine Zuordnung uber die Sequenzierung erfolgen soll, da man haufig die gleiche Sequenz in verschiedenen Klonen wiederfindet, was zu einer sehr hohen Redundanz fuhrt. Die zweite Moglichkeit zur Zerlegung groljerer DNA-Segmente stellt die ,,Nested-Deletion-Methode" dar [18]. Diese Methode kann dann sinnvoll eingesetzt werden, wenn die DNA-Segmente nicht groBer als 10 kb sind. Als Vorarbeit mu13 jedoch eine Restriktionsanalyse des DNA-Segments erfolgen. Eine ,,Nested-Deletion" mit dem Enzym Exonuklease I11 setzt ein Target voraus, daB am 5'-Ende mit einem Enzym glatt oder uberhangend geschnitten wurde und am 3'-Ende ein uberhangendes Ende enthalt. Bei Behandlung mit Exonuklease I11 wird dann beginnend am 5'-Ende der komplementare Strang in 3'-5'-Richtung abgebaut, wobei das Enzym das uberhangende 3'-Ende auf der gegenuberliegenden Seite nicht erkennt. Wahrend des Exonuklease 111-Verdaus werden Proben in definierten Zeitabstanden (ausreichend fur den Verdau von jeweils 450-500 Basen) entnommen, das Enzym deaktiviert und das verkurzte DNA-Fragment an den Enden glatt geschnitten. Diese DNA-Fragmente werden dann zur Praparation in einen Vektor kloniert. Eine alternative Methode zu den zuvor beschriebenen Methoden ist die direkte PCR-Sequenzierung, die den Vorteil bietet, dal3 sie einfach und schnell durchzufuhren ist und die entstandenen Produkte ohne groljeren Praparationsaufwand direkt sequenziert werden konnen. Voraussetzung ist jedoch, daB flankierende Sequenzbereiche fur die Bindung der PCR-Primer bekannt sind und daB wahrend der PCR ein einheitliches Produkt entsteht.
-
Wahl des Sequenzierprimers
Der richtige Sequenzierprimer ist eine der wichtigsten Voraussetzungen fur den Erfolg der Reaktion. Wenn der Sequenzierprimer nur schlecht bzw. gar nicht an
78
Thornas Scliafer
das Template bindet, erhalt man nur ein unbefriedigendes Sequenzierergebnis. Deshalb sollte der Sequenzierprimer nach folgenden Regeln ausgewahlt werden: Je Ianger der Primer, desto hoher seine Annealingtemperatur, desto spezifischer seine Bindung an das Template (18-24mer ist ideal). Gleiche Anteile der Basen A, C, G und T fur hohe Spezifitat Die Base C oder G am 3'-Ende sorgt fur eine festere Bindung und damit bessere Startbedingungen fur die Polymerase Keine ,,Inverted Repeats" oder komplementare, homopolymere Bereiche, damit der Primer nicht rnit sich selbst binden kann Ein homogener Primer, der keine Verunreinigungen durch n-1 oder n-2 Nebenprodukte enthalt, damit Sequenzuberlagerungen ausgeschlossen werden konnen. Trotz Einhaltung dieser Regeln, Analyse des Primers rnit entsprechenden Designprogrammen oder Abgleich mit einer Datenbank kommt es immer wieder vor, darj ausgewahlte Sequenzierprimer nicht zu dem gewunschten Ergebnis fuhren. In solchen Fallen kann man sich damit behelfen, darj man den Primer neu synthetisiert, wobei man sich eine Sequenz auswahlt, die um zwei bis drei Basen zum 3'- oder 5'-Ende der ursprunglichen Sequenz verschoben ist. Manchmal hilft auch eine Verkurzung oder Verlangerung des Primers um eine Base am 3'-Ende. Eine erneute Umklonierung rnit anschlieljender DNA-Praparation kann man durch ,,Primerwalking" umgehen. Unter Primerwalking versteht man die Sequenzierung eines langen, unbekannten DNA-Bereiches, wobei in bestimmten Abschnitten immer wieder neue Sequenzierprimer synthetisiert werden, die aus einem Bereich der zuvor ermittelten Sequenz abgeleitet werden mussen. Dabei gilt: je langer der sequenzierte Bereich, um so weniger neue Sequenzierprimer mussen hergestellt werden. Trotzdem ist dieses Verfahren sehr zeitaufwendig, da man immer wieder warten mulj, bis die entsprechende Sequenzreaktion ausgewertet und der neue Primer synthetisiert ist. Deshalb kommt das Primerwalking hauptsachlich bei der SchlieBung von Sequenzlucken, bei der Sequenzierung uberlappender Bereiche und bei der Analyse schwieriger Sequenzabschnitte zum Einsatz [19].
5.5.2 Kurze Analysezeiten rnit hoher Genauigkeit Je groBer der zu bestimmende Sequenzabschnitt, desto wichtiger wird der Zeitfaktor. Hier helfen automatische Sequenziersysteme weiter. Der Automat iibernimmt die Aufnahme und Analyse des Sequenzgeles und liefert die Sequenzdaten. Zeitaufwendiges und oft rnit Fehlern behaftetes, manuelles Sequenzenlesen entfallt. Die Analysczeit larjt sich durch die Verwendung entsprechender, schneller Gelsysteme verkurzen (s. Abschnitt 5.5.3). Die Genauigkeit der ermittelten Sequenz hangt letztendlich vom Auflosungsvermogen des Trennmediums, der Qualitat der Ausgangs-DNA und von der jeweiligen Sequenziermethode ab.
5 DNA-Sequenzanalyse
79
5.5.3 Hohe Leseweiten Die Leseweiten werden in erster Linie von dem verwendeten Trennmedium bestimmt. Die bisher bekannten polymeren Gelsysteme fur die Elektrophorese zwischen Glasplatten (Acrylamid) oder Kapillaren (viskose Polymere) liefern Leseweiten bis zu maximal 800 Basen. Grundvoraussetzung fur eine hohe Leseweite ist auljerdem eine gleichmaaige Signalverteilung, die durch das SequenzierEnzym und die Reaktionsbedingungen bestimmt wird. Letztendlich spielt auch die Wahl der Markierungs-Methode eine entscheidende Rolle. Die Elektrophorese ist eine der wichtigsten analytischen Methoden zur Charakterisierung geladener Makromolekule. Auch DNA-Molekule besitzen Ladungen und konnen somit in einem elektrischen Feld wandern. Zur erfolgreichen Durchfuhrung der Elektrophorese mulj die DNA in ein Medium gebracht werden, das eine Durchmischung verhindert, die DNA im denaturierten Zustand halt, nicht mit der Probe reagiert und ihre selbstandige Bewegung behindert. Zwei unterschiedliche Trennverfahren erfullen diese Bedingungen: Die Polyacrylamid-Gelelektrophorese (PAGE) und die Kapillar-Elektrophorese.
- Polyacrylamid-Gelelektrophorese(PAGE) Das denaturierende Harnstoff-Polyacrylamidgel besteht aus Acrylamid, N,N’Methylenbisacrylamid, Tetramethylendiamin (TEMED) und Ammoniumperoxodisulfat (APS). In Wasser gelostes APS bildet dabei freie Radikale, die auf das Acrylamid-Molekul ubertragen werden. Das damit reaktive Acrylamid reagiert mit anderen Acrylamid-Molekulen unter Bildung langer Ketten weiter. Bisacrylamid bewirkt dabei eine Quervernetzung der Acrylamidketten, sodaB eine Gitternetz-Struktur entsteht. Die PorengroBe dieses Gitters wird dabei durch das Verhaltnis der Acrylamid-Menge pro Volumeneinheit zur Bisacrylamid-Menge bestimmt. TEMED dient als Katalysator fur die Gelbildung, da es in Form freier Radikale stabil ist. Die Losung fur ein typisches Sequenziergel besteht aus folgenden Komponenten: 4 7 % Acrylamid / Bisacrylamid (19:l) oder (29:l) 6-8 M Harnstoff 0,s-1,2 x Tris Borat EDTA-Puffer (TBE) TEMED lO%ige APS-Losung
Die Losung aus diesen Komponenten wird zwischen zwei Glasplatten polymerisiert, wobei das APS als letzte Komponente zugegeben wird, da es als Starter fur die Polymerisation fungiert. Die Starke der venvendeten Gele liegt dabei ublicherweise zwischen 0,l und 0,4 mm. Als Laufpuffer verwendet man 1 x TBE-Puffer bei konstanter Spannung zwischen 1400 und 3 000 Volt. Grundsatzlich gilt: Je dunner das Gel, je geringer die Harnstoffkonzentration und je geringer das Acrylamid-Bisacrylamid-Verhaltnis, um so hoher kann die angelegte Spannung gewahlt werden, d. h. um so schneller ist die Trennung beendet. Eine hohe elektrische Feldstarke
80
Thomas Schafer
wirkt sich allerdings nachteilig auf das Trennvermogen und damit die Leseweite aus [20]. Bei der Venvendung von ultradiinnen Gelen (50 pm) ist die Effizienz der Warmeiibertragung optimal. Dadurch kann eine hohere Spannung an das Gel angelegt werden, ohne daB dabei Temperaturunterschiede innerhalb des Gels das Laufverhalten der einzelnen DNA-Fragmente nachteilig beeinfluBen. Die Laufstrecke zwischen Probenauftrag und Detektion entscheidet iiber die Leseweite. Es gilt hier: Je groljer die Trennstrecke, desto hoher die Auflosung und damit die Leseweite. Ein einheitliches, elektrisches Feld wird dabei durch eine gleichmaljige Warmeverteilung in Form von Heiz- oder Temperierplatten gewahrleistet. Die Erwarmung des Gelsystems unterstiitzt auljerdem die denaturierende Wirkung des Harnstoffs und verhindert damit ebenfalls eine unerwiinschte Sekundarstrukturbildung der DNA.
- Kapillar-Elektrophorese (CE) Ein vollkommen anderes Trennmedium stellt eine mit Polymer gefiillte Glaskapillare dar, deren Innendurchmesser 75 pm betragt. Dabei kann einerseits cine ganz normale Glaskapillare verwendet werden, wobei diese Kapillare vor jeder Trennung mit Natronlauge aktiviert wird. Andererseits kann auch eine mit Teflon beschichtete Kapillare zum Einsatz kommen. Die Kapillaren werden vor jeder Trennung mit dem viskosen Trenn-Polymer gefiillt. Nach Aufnahme in einem Puffer, der die Denaturierung der DNA unterstutzt und verhindert, dalj hochmolekulare Verbindungen in die Kapillare eindringen und diese blockieren konnen, wird die sequenzierte DNA-Probe elektrokinetisch injeziert. Auf diese Weise konnen bis zu 750 Basen gelesen werden.
- Wahl des Sequenzier-Enzyms Zu den geeignetsten Sequenzier-Enzymen zahlen thermostabile Polymerasen [21]. Diese Enzyme sind bei Umgebungstemperaturen von bis zu 100°C stabil und arbeiten bei einem Temperaturoptimum von 70 "C-80 "C (s. Kapitel 3). Der bekannteste Vertreter dieser Art ist die AmpliTaq DNA-Polymerase, welche aus einem Bakterium (Thermus aquaticus) isoliert wird, das in heil3en Quellen zu Hause ist. Das Enzym erlaubt die bequemste und modernste Art der Sequenzierung, die .,Cycle-Sequenzierung" (s. Abschnitt 5.2.3). Ein anderes Sequenzier-Enzym ist eine Polymerase aus dem Bakteriophagen T7, die T7-Polymerase. Eine modifizierte Form dieser Polymerase, die T7 SequenaseTM,hat sich dabei als besonders geeignet herausgestellt [22]. T7 SequenaseTM ist eine gentechnisch veranderte T7-Polymerase, welche die gleiche Aktivitat wie die T7-Polymerase aufweist, aber keine 3'-5'Exonuklease Aktivitat mehr besitzt. Exonukleasefreie Enzyme fiihren zu den hochsten Leseweiten. Eine Weiterentwicklung der Sequenzier-Polymerasen stellen Enzyme dar, welche sowohl die Thermostabilitat der Taq-Polymerase als auch die hohe Prozessivitat der T7 SequenaseTMin einem Enzym vereinen. Zu diesen neuen Enzymversionen gehoren die Enzyme SequiThermTM,THERMOSequenaseTMund die AmpliTaq DNA-Polymerase-FS, wobei FS speziell fur die Fluoreszenz Sequen-
5 DNA-Sequenzanalyse
81
zierung steht. AmpliTaq DNA-Polymerase-FS ist eine rekombinante Doppelmutante der AmpliTaq DNA-Polymerase. Durch die erste Mutation verliert das Enzym seine 5'-3' Nuklease-Aktivitat, was in einem sehr geringem Hintergrundrauschen und einem niedrigen Anteil an ,,Termination-sites" zur Geltung kommt. Die zweite Mutation, eine Punktmutation im Bereich des aktiven Zentrums, erleichtert dem Enzym den Einbau von Didesoxynukleotiden. THERMOSequenaseTMist in Wirklichkeit eine Taq-Polymerase ohne 5'-3'-Exonukleaseaktivitat und mit einem Aminosaureaustausch im aktiven Zentrum [23]. Durch Zugabe von Pyrophosphatase wird die Polymerase-Reaktion irreversibel[24]. Die neuen Polymerasevarianten und Enzymmischungen fiihren auch im hinteren Sequenzbereich zu einem gleichmaljigen Signalbild. Ausschlaggebend fur die Enzymwahl ist die Art des Templates. So kann man generell sagen, dalj fur eine Sequenzierung von einzelstrangigen Templates die T7-Polymerase geeignet ist, wahrend fur doppelstrangige Templates die TaqPolymerase die bessere Wahl darstellt. DNA-Proben mit komplizierten Sekundarstrukturen und hohem GC-Gehalt lassen sich am besten mit Taq-FS-Polymerase auflosen, wahrend repetitive Bereiche oder lange Sequenzen aus einer der vier Basen wegen der hohen Prozessivitat besser mit TM-Polymerase analysiert werden konnen. T7-Polymerase-Rektionen fiihren bei Zugabe von Mn-Ionen zu einem einheitlichen Signalbild,wahrend die Taq-Polymerase in der Regel ein heterogenes Signalbild (Abb. 9) produziert. Dieses kann jedoch bei der Interpretation der Daten sehr hilfreich sein, da templateunabhangige, spezifische Sequenzmuster entstehen, die immer gleich ausfallen.
- Wahl der Reaktionsbedingungen Ublicherweise sind die Reaktionsbedingungen durch das Protokoll der Sequenzierungskits festgelegt. In besonderen Fallen kann jedoch eine Variation folgender Parameter zu deutlich besseren Ergebnissen fuhren: (1) Temperatur: Fur T7-DNA-Polymerase liegt die Standard-Reaktionstemperatur bei 37 "C. Eine Erhohung der Reaktionstemperatur auf 40 "C kann zu einer besseren Einbaurate und damit zu langeren Sequenzen fuhren. Aul3erdem bindet der Primer spezifischer bei dieser Temperatur. Das Optimum der T'q-DNA-Polymerase liegt bei 70°C. Die Reaktion mit DyeTerminatoren (s. Abschnitt 5.4.3) mul3 bei 60 "C durchgefiihrt werden, da das Enzym sonst die nichtmarkierten dNTP's bevorzugt einbaut. Das hatte eine zu geringe Markierungsausbeute zur Folge. Durch Vermindern der Reaktionsgeschwindigkeit des Enzyms und damit einhergehender Erhohung der Akzeptanz fur ddNTP's, wird die erforderliche Balance im Einbau zwischen den Nukleotiden erreicht. (2) Reaktionspuffer: Der pH-Wert des Reaktionspuffers ist entscheidend fur den Erfolg der Sequenzreaktion und sollte in keinem Fall variiert werden. Hingegen konnen bestimmte Ionen,
82
Thomas Schafer
die dem Reaktionsansatz beigefugt werden, das Verhalten der Enzyme beeinflussen. So lafit sich durch Zugabe von Mn2+-Ionen[25]bei Reaktionen mit T7-Polymerase ein homogenes Signalbild erzeugen. Mn2+-Ionenals Kofaktor verandern die relativen Reaktivitat des Enzyms gegenuber Desoxy- und Didesoxy-Nukleotiden. Im Fall von Taq-Polymerase-Reaktionen bestimmt die Mg2'-Konzentration den Erfolg, wahrend sich andere Ionen inhibierend auf das Enzym auswirken. In vielen Fallen hilft die Zugabe von maximal 10% Dimethylsulfoxid (DMSO) zum Reaktionsansatz, um uber schwierige DNA-Sequenzabschnitte mit hohem GC-Gehalt hinwegzukommen [26]. DMSO erniedrigt die Schmelztemperatur dieser DNA-Bereiche. A . T T C C T G T G T G R R R T T G T T A T C C G C T C R C R R T T C C R C FI[ 70 80 90 100
B CiGTGRG R C i T T C C R R R R C G R G R C i T T T C R C T G A C A C ' 100 110 I2D
Abb.9. Automatische Sequenzanalyse. Gegeniiberstellung von typischen Sequenzmustern. a: Einheitliche Signalstarken bei Sequenzierungen mit T7-DNA-Polymerase, b: Heterogenes Signalbild bei Sequenzierung mit Taq-DNA-Polymerase.
5 DNA-Sequenzanalyse
83
(3) Nukleotide: Das Verhaltnis von Desoxy- zu Didesoxynukleotiden ist entscheidend fur die Leseweite. Es mul3 auf das jeweilige Enzym-Puffer-System abgestimmt werden. 1st die Didesoxynukleotid-Konzentration zu hoch, erhalt man viele kurze Fragmente, die durch zu fruhe Kettenabbruche wahrend der Reaktion entstehen. Das Sequenzbild zeigt starke Signale im Anfangsbereich, welche nahe am Primer liegen und immer schwachere, je weiter die Sequenz vom Primer entfernt ist. Wahlt man hingegen eine zu hohe Desoxynukleotid-Konzentration, bekommt man schwache Signale nahe am Primer und immer starkere, je weiter man sich von ihm entfernt. Bei Verwendung von 2’-Desoxynukleotid-5’-0-( l-thiotriphosphaten) (dNTPaS) bzw. 2’-Desoxyinosin-5’-Triphosphat (d1TP)oder 7-Deaza-2’-Desoxyguanosin-5’-Triphosphat (c’dGTP) anstelle von normalen dGTP lassen sich Sequenzabschnitte, die einen hohen Gehalt an den Basen G und C aufweisen, besser auflosen. Der Einbau von ddG bzw. ddC wird in solchen Bereichen wegen der Bildung von Sekundarstrukturen des Templates erschwert. Dies fuhrt zu Kompressionen, welche eine anschlierjende Datenanalyse erschweren. Ferner bewirkt der Einsatz von dNTPaS-Nukleotiden in Verbindung mit T7-DNA-Polymerase und Mn2+ eine hohere Effizienz des Enzyms, was zu Iangeren Sequenzprodukten fuhrt.
5.5.4 Vergleichende Sequenzbestimmung Um eine Sequenz veroffentlichen zu konnen, mu13 man sich der Genauigkeit der Sequenz sehr sicher sein. Um diese Sicherheit zu erreichen, sollte die Sequenz nach allgemeiner Ubereinkunft zu ihrer Verifizierung mindestens zweimal bestimmt werden. Dazu hat man Strang und Gegenstrang zu sequenzieren und bei einem Vergleich eindeutig dasselbe Ergebnis zu erhalten. Bei groljeren Projekten kommt es darauf an, moglichst viele verschiedene Sequenzabschnitte in kurzer Zeit zu ermitteln. In diesem Fall liefert die ShotgunKlonierung (s. oben) eine gute Ausgangsbasis fur die Bestimmung erster Sequenzabschnitte. In einem fortgeschrittenen Stadium des Projektes hat diese Methode aber den Nachteil, dalj wiederholte Male identische Sequenzbereiche analysiert werden. Durch Primerwalking kann man dann aus bekannten Abschnitten nach beiden Richtungen heraussequenzieren und so Lucken zwischen benachbarten Bereichen schlierjen oder einen vollig neuen Sequenzabschnitt bestimmen.
5.5.5 Detektionsverfahren Den letzten Schritt im Sequenzierungsprozefl stellt die Detektion der markierten und voneinander getrennten DNA-Fragmente dar. Im Falle von radioaktivmar-
84
Thomas Schhfer
kierten Proben genugt nach der Elektrophorese das Auflegen eines Rontgenfilms (Autoradiographie) auf das getrocknete Polyacrylamidgel. Hierzu wird die Elektrophorese beendet, kurz bevor die ersten Fragmente das Gel am unteren Ende wieder verlassen. Die aus diesem Verfahren resultierenden Autoradiogramme mussen nach der Entwicklung des Films per Hand oder halbautomatisch unter Zuhilfenahme eines Gel-Lesesystems ausgewertet werden. Das Ergebnis ist eine Art ,,SchnappschuB" der Fragmente, die bis zum Ende der Elektrophorese in dem Gel aufgetrennt werden konnten. Hingegen arbeiten Sequenzierautomaten, die zur Detektion fluoreszenzmarkierter DNA eingesetzt werden, nach dem ,,ON-LINE"-Prinzip (s. Kapitel 7). Wahrend der Elektrophorese werden die markierten Fragmente mit Hilfe eines Lasers und eines optischen Systems detektiert und die Daten auf einem Computer fur eine automatische Auswertung gespeichert. Eine weitere Moglichkeit zur nichtradioaktiven Detektion ermoglicht das Verfahren nach Pohl und Beck [27]. Dabei werden die DNA-Fragmente, die am unteren Ende das Gel verlassen, direkt auf eine Membran ubertragen, welche wahrend der Elektrophorese langsam am Gel vorbeigefuhrt wird. Die aufgetrennten DNA-Fragmente konnen dann durch Anfarbung mit Digoxygenin (s. Abschnitt 5.4.4) nachgewiesen werden.
5.6 Datendarstellung Es gibt mehrere Arten der Datendarstellung, wobei die Prasentation der Daten von dem jeweiligen Detektionsverfahren und der Auswerte-Software abhangt (s. Kapitel8). Generell gibt es zwei Formen der Darstellung:
0
in Form eines Autoradiogrammes als Sequenzleiter bei Verwendung von Rontgenfilmen; als Chromatogramm bei der automatischen DNA-Sequenzierung mit einer ,,ON-LINE"-Detektion.
Abb. 10 zeigt ein typisches Autoradiogramm, bei welchem die Sequenzfolge, von unten nach oben gelesen, aus vier, nebeneinander aufgetragenen ReaktionsansatZen ermittelt wird. Die Reihenfolge des Auftrags der voneinander unabhangigen Reaktionen ergibt die Reihenfolge der Basen A, C, G und T. Automatische DNA-Sequenzanalyse-Systeme geben die entsprechenden Sequenzen in Form von Chromatogrammen wieder. Diese entsprechen den gemessenen FluoreszenzAusbeuten bzw. den durch ein Datenverarbeitungsprogramm konvertierten, eingelesenen Banden. Die Chromatogramme lassen auBerdem ein nachtragliches Editieren insbesondere von unsicheren Sequenzbereichen zu. Die fertige Sequenz kann dann in Buchstabenform zur weiteren Verarbeitung mit einem anderen Auswerteprogramm eingesetzt werden (Abb. 11).
5 DNA-Sequenzanalyse
85
Abb. 10. Ausschnitt aus dem Autoradiogramm eines typischen Sequenzierungsgels, welches die DNA-Sequenzin Form einer Leiter sichtbar macht.
I T A CG A G C C G G A A G C A T A A A G T
G T A A A G C C T G
Abb. 11. Ausschnitt aus einem Sequenzchromatogramm(Automatische Analyse).
GI
86
Thomas Schafer
5.7 Literatur [l] Maxam, A.M., Gilbert, W., Proc. Natl. Acad. Sci. USA 74 (1977). 560-564. [2] Sanger. F.. Nicklen. S.. Coulson, A.R., Proc. Natl. Acad. Sci. USA 74 (1977). 5463-5467. [3] Connell. C., Fung, S., Heiner, C., Bridgham. J., Chakerian. V., Heron, E., Jones, B.. Menchen. S.. Mordan, W.. Raff, M., Recknor, M., Smith, L., Springer, J., Woo. S.. Hunkapiller, M., BioTechniques 5 (IY87), 342-348. [4] Church, G.M., Kieffer-Higgins, S., Science 240 (I%%), 185. [S] Vieira. J.. Messing. J., Methods Enzymol. 153 (lY87), 3-11. [6] Messing. J.. Crea, R., Seeburg, P.H.. Nucl. Acids Res. 9 (1981), 309-321. [7] Short, J.M., Fernandez, J.M., Sorge, J.A., Huse, W.D., Nucl. Acids Res. 16 ( 19X8), 7583-7600. [XI Gyllensten, U.B., Erlich, H.A., Gene 21 (1983), 3 3 4 9 . [Y] Hultman. T., Stahl. S.,Homes, E., Uhlen, M., Nucl. Ac. Res. 17 (1989). 49374946. [ 101 Evans. M.R.. Read. C.A.. Nature 358 (1992), 520-521. [ I I ] Lee. L.G. Connell. C.W., Woo, S.L., Cheng, R.D., McArdle, B.F., Fuller, C.W.. Halloran. N.D., Wilson, R.K., Nucl. Acids Res. 20 (1992). 2471-2483. [ 121 Patent Corporation Treaty PCT/USY0/05565 (April 1991). [ 131 Beck, S.. O'Keeffe. T., Coull, J.M., Koster, H.. Nucl. Acids Res. 17 (19x9). 51 15-5123. [ 141 Martin. C., Bresnick. L.. Juo, R.R.. Voyta, J.C.. Bronstein, 1.. BioTechniques 11 (1991). 110113. [ 151 Moores, J.C., Anal. Biochem. 163 (lY87), 1-8. [ 161 Anderson. S., Nucl. Acids Res. 9 (IYXI), 3015-3027. [ 171 Bankier. A.T.. Weston. K.M.. Barrell. B.G., Methods Enzymol. 155 (1988). 52-93. 11x1 Henikoff, S., Methods Enzymol. 155 (1987). 156-165. [ 191 Sulston, J., Du, Z.. Thomas, K., Wilson, R., Hillier, L., Staden, R., Halloran, N., Green, P., Thierry-ieg. J., Qiu. L., Dear, S.,Coulson, A., Craxton, M., Durbin, R., Berks, M., Metzstein, M.. Hawkins. T., Ainscough, R., Waterson, R.. Nature 356 (1992), 3 7 4 1 . [20]Luckey. J.A.. Norris.T.B.. Smith. L.M., J. Phys. Chem. 97 (1993). 3067. 1211 Carothers. A.M.. IJrlaub, G., Mucha, J., Grunberger, D., Chasin, L.A., Biotechniques 7 (19x9). 494499. 1221 Fuller. C.W., Methods Enzymol. 216 (1992), 329-354. 1231 Tabor. S., Richardson, C.C., Proc. Natl. Acad. Sci. USA 92 (1905). 63394343. [24] Tabor. S., Richardson, C.C., J. Biol. Chem. 265 (IYYO), 8322-8328. [25] Tabor, S., Richardson, C.C., Proc. Nat. Acad. Sci. USA 86 (IYSY), 40764080. [26] Burgett, S.G., Rosteck, P.R., In: Automated DNA Sequencing and Analysis, Academic Press. New York (1994). 211-215. [27] Pohl. EM.. Beck, S.. Methods Enzymol. 155 (1987). 250.
6 DNA-Fragmentgrofienbestimmungund Quantifizierung Dagmar Schuster
6.1 Einfuhrung in die DNA-Fragmentanalyse Jedes Individuum hat in den Zellkernen seiner Zellen einen Satz von Makromolekulen, die als Chromosomen bekannt sind. Die Halfte der Chromosomen stammt von der Mutter, die andere Halfte vom Vater. Individuen, die zur gleichen Spezies gehoren, haben im allgemeinen die gleiche Anzahl und die gleiche Art von Chromosomen. Doch obwohl die Chromosomen bei Individuen einer Art gleich wirken, gibt es grol3e molekulare Unterschiede. Chromosomen bestehen im wesentlichen aus drei chemischen Substanzklassen: Protein, Desoxyribonukleinsure (DNA) und Ribonukleinsure (RNA). Dabei liegt der Schlussel fur die spezifische Rolle der Chromosomen nicht in ihrem Protein, sondern in der DNA. Die DNA besteht aus drei Grundbausteinen, die sich in einer langen Kette standig wiederholen: Pentose-Zuckermolekule, Phosphatgruppen und die Basen Adenin, Cytosin, Guanin und Thymin [Nukleotide]. Fr weite DNA-Abschnitte ist die Reihenfolge der Nukleotide innerhalb einer Spezies gleich. Daruber hinaus gibt es allerdings DNA-Bereiche, die ein unterschiedliches Nukleotidmuster aufweisen und als Polymorphismen bezeichnet werden. Die meisten Polymorphismen beeinflussen den Organismus nicht weiter. Treten jedoch Veranderungen in den kodierenden Bereichen von Genen auf, so kann das entscheidende Auswirkungen haben. Unterschiedliche Nukleotidsequenzen kodieren fur unterschiedliche Proteine, die wiederum andere Funktionen in der Zelle ausuben. Mutationen, die ein oder mehrere Gene betreffen, konnen zu neoplastischen Transformationen fuhren. Diploide Organismen, zu denen auch der Mensch zahlt, besitzen zwei Satze homologer Chromosomen im Zellkern. Das bedeutet, da fur jedes Merkmal zwei Gene vorhanden sind. In den meisten Fallen reicht jedoch eine einfache Kopie fur Funktion und Arterhaltung aus. Eine Mutation, die die Funktion eines essentiellen Gens zerstort, ist fur eine haploiden Organismus mit nur einem Chromosomensatz letal, wird jedoch fur einen diploiden harmlos bleiben, solange nur eine der beiden Kopien betroffen ist. Diploide Organismen haben im allgemeinen viele solcher rezessiven, letalen, mutierten Allele in ihrem Genom. Mutierte Gene, die nicht exprimiert werden, konnen aber weitervererbt werden. Sobald ein Individuum von beiden Elternteilen ein mutiertes Gen vererbt bekommt, ist es Merkmaltrager. Die Suche nach genetischen Polymorphismen innerhalb verschiedener Individuen sowie ganzer Populationen nimmt in der heutigen Zeit einen immer groBe-
88
Dagniar Schusrer
ren Stellenwert ein. Sie lassen sich durch eine Fragmentgrorjenbestimmung von bestimmten Genabschnitten oder deren Quantifizierung analysieren. Ihre Anwendung erlangt zunehmend Bedeutung in: Kopplungsanalysen Diagnose von genetischen Krankheiten/Mutationsscreening Agrarwissenschaften Rechtsmedizin Vaterschaftstest Genexpressionsstudien Im September 1971 war D. Nathans zuerst die elektrophoretische Auftrennung von SV40-DNA in 11 diskrete DNA-Fragmente auf Agarosegelen gelungen [l]. Damit war der Weg fur die Trennung von DNA nach Molekulmassen und die endgultige Verbreitung der gentechnologischen Methoden eingeleitet. Auf Agarose- oder Polyacrylamidgelen ist die Mobilitat eines DNA-Fragmentes proportional zum Logarithmus seiner Molmasse [2]. Diese lineare Beziehung, mit deren Hilfe uber graphische Darstellungen Molmassen ermittelt werden konnen, gilt jedoch nur fur bestimmte Molmassenbereiche. In der Praxis empfiehlt sich die Verwendung von Standardfragmenten mit bekanntem Molekulargewicht, die man im Gel mitlaufen larjt. Sie erlauben somit eine Langenbestimmung der zu untersuchenden Fragmente. Die Auftrennung von DNA-Molekulen der Grorjenordnung von 0,2-60 kb erfolgt mit Hilfe von Agarosegelen. Durch verschiedene Agarosekonzentrationen ist es moglich, einen grorjen Auflosungsbereich unterschiedlicher DNA-Fragmente abzudecken. Die Gele werden durch Erhitzen von Agarose in geeigneten Pufferlosungen hergestellt. Fur das Erhitzen haben sich Mikrowellenofen bestens bewahrt. Nach dem Abkuhlen der Losungen auf etwa 60 "C und dem Zusatz von Ethidiumbromid (0,spg/ml) konnen diese in Apparaturen gegossen werden. Dabei werden meistens horizontale Gelkammern benutzt. Als Puffer eignen sich vor allem SO-100 mM Tris-acetat und Tris-borat, pH 7,4, rnit einem Zusatz von 1 mM EDTA. Die Auftrennung der DNA-Fragmente erfolgt bei Feldstarken von 1-5 V/cm. Die DNA wird nach dem Lauf durch Bestrahlung rnit UV-Licht (254 nm) sichtbar gemacht und zur Dokumentation photographiert. 1st eine sehr hohe Auflosung der einzelnen Fragmente erforderlich, wird die Auftrennung der DNA-Fragmente in Polyacrylamidgelen durchgefuhrt. Bis zu 1 kb grorje Fragmente lassen sich so bestimmen [3]. Die Polyacrylamidkonzentrationen variieren von 3,s-20%. Je hoher die Konzentration, urn so besser die Auflosung im niedermolekularen Bereich. Die Laufstrecken reichen von 10-100 cm, abhangig von der erforderlichen Leseweite. Im Gegensatz zu den Agarosegelen laufen die Polyacrylamidgele in vertikaler Position. Zur Detektion der Strange konnen verschiedene Verfahren angewendet werden: Die DNA-Produkte werden durch die Zugabe von radioaktiv markierten 32P oder 3sS dCTP markiert. Das Anfarben der Gele: ,,Silver-Staining" und ,,Ethidiumbromid-Staining".
6 DNA-Fragmentgro~enbestimmungund Quantifizierung 0
89
Detektion der Banden rnit Hilfe der automatischen Laser-Scanning-Technologie und Fluoreszenzfarbstoffen [s. Kap. 51.
Automatische genetische Analysestationen gekoppelt rnit entsprechenden Softwarepaketen (,,Sequencing-Analysis", ,,GeneScanTMund ,,GenotyperTM"-Software) sind innovative Systeme, die die automatische Langenbestimmung und Quantifizierung von fluoreszenzmarkierten DNA-Fragmenten erlauben. Radioaktive Techniken und zeitaufwendige Gelbearbeitungen nach dem Lauf gehoren damit der Vergangenheit an. Zum einen konnen automatische Systeme eingesetzt werden, die fur die elektrophoretische Auftrennung der einzelnen Fragmente auf konventionelle Polyacryalmidgele zuruckgreifen [4,51. Zum anderen ist es aber auch moglich, eine Kapillare anstelle eines Gels fur die Elektrophorese einzusetzen [6]. Hierbei werden hohe Spannungen eingesetzt, um Molekule unterschiedlicher Ladung und Grorje zu trennen. Die Auftrennung resultiert aus einer Kombination von elektrophoretischer Migration, durch die Bewegung von beladenen Molekulen zu einer Elektrode rnit entgegengesetzter Polaritat und elektroosmotischem FluB, hervorgerufen durch die beladene innere Kapillanvand.
6.2 Markierung der DNA-Fragmente DNA-Fragmente konnen nach drei verschiedenen Methoden rnit Fluoreszenzfarbstoffen markiert werden. Diese sind: 0
0
Markierung von PCR-Produkten oder Restriktionsfragmenten rnit fluoreszenzmarkierten Primern (s. 6.2.1). Markierung rnit fluoreszenzmarkierten dNTPs (s. 6.2.2). Markierung von dsDNA rnit Fluoreszenzdimeren; Interkalatoren (s. 6.2.3).
6.2.1 Fluoreszenzmarkierte Primer Die 5'-Endmarkierungsmethode Diese Methode dient der Herstellung und Markierung von spezifischen DNABereichen, die uber eine PCR (s. Kap. 3) amplifiziert werden. Die PCR-Reaktion wird rnit einem Primer [7] durchgefuhrt, der am 5'-Ende rnit einem Fluoreszenzfarbstoff (Farbstoff-Amidit) markiert vorliegt (s. Kap. 4), wahrend der zweite Primer unmarkiert ist. Das resultierende PCR-Produkt ist anschlieflend am 5'-Ende rnit einem Fluorezenzfarbstoff versehen (Abb. 1). Da jeweils nur ein Farbstoffmolekul eingebaut wird, sind sehr genaue quantitative Untersuchungen moglich. Messungen der PCR-Produkt-Quantitat lassen Aussagen zur Genexpression zu und erlauben eine quantitative Bestimmung der mRNA-Transkripte. Zur Steige-
90
Dagninr Schitsrer
-5 f 3'
3' Farbstoffmarkierter ,,Forward"-Primer
[ - - I
5' Unmarkierter ,,Fieverse"-Primer
\
I
Farbstoffmarkiertes DNA-Produkt
Abb. 1. Die S'-Endmarkierung.
(1 a) Zwei unterschiedliche Primer werden beniitigt: (1) Ein ,,forward"-Primer, der am 5'-Ende mit einem Fluoreszenzfarbstoff versehen ist. und (2) ein ,.reverse"-Primer, der unmarkiert vorliegt. ( l b ) Nach der Denaturierung der ,,Target" (Ziel)-DNA konnen sich die beiden Primer an dieselbe anlagern (annealen). Mit Hilfe der PCR wird die ,,Target"-DNA amplifiziert. Das resultierende DNA-Produkt tragt am S'-Ende einem Fluoreszenzfarbstoff.
rung der Sensitivitat konnen auch beide Primer fluoreszenzmarkiert eingesetzt werden. Markierung von Restriktionsfragmenten mit markierten Primern (RestriktionsLigations-Methode) Die Restriktions-Ligations-Methode wird zur Herstellung von fluoreszenzmarkierten Langenstandards eingesetzt. Sowohl die Restriktion als auch die Ligation werden in einem Reaktionsgef durchgefuhrt. Zwei zueinander komplementare Oligonukleotide sorgen dafiir, da einerseits die Fragmente markiert, andererseits die Restriktionsschnittstellen zerstort werden. Zur Durchfuhrung der Reaktion benotigt man ein fluoreszenzmarkiertes Oligonukleotid sowie einen Primer, dessen 5'-Ende komplementar zum markierten Oligonukleotid und dessen 3'-Ende komplementar zur Restriktionsschnittstelle ist. Wahrend der Reaktion schneidet das Restriktionsenzym die DNA spezifisch. Die Oligonukleotide lagcrn sich zusammen und binden an die uberhangenden Enden. Dadurch wird die Restriktionsschnittstelle zerstort. Die Reaktion lauft solange ab, bis alle Fragmente markiert sind. Sollten einige Restriktionsfragmente zuruckligieren, werden sie erncut von dem Restriktionsenzym gespalten.
6 DNA-Fragmentgroflenbestimrnung und Quantifizierung
91
6.2.2 Markierung rnit fluoreszenzmarkierten dNTPs Zur Markierung von PCR-generierter DNA konnen ebenfalls markierte dNTPs oder ddNTPs eingesetzt werden [8]. Dabei baut ein Enzym, die Tuq-DNA-Polymerase, die Nukleotide wahrend der Kettenverlangerung ein. Zum Einsatz kommen dUTPs, die mit einem der drei folgenden Rhodamin-Farbstoffen markiert vorliegen: TAMRA [gelb] R6G [grun] RllO [blau] Der Farbstoff ist uber einen Linker-Arm mit dem entsprechenden Nukleosid verbunden (Abb. 2).
Fluoreszenzmarkiertes dUTP n
I
"N+
-DY6
KNHLinkerArm
Farbstoff
Nukleosid Abb. 2. Fluoreszenzmarkiertes dUTF? Gezeigt sind die 4 Grundbausteine: Triphosphat, Nukleosid, Linker-Arm und Farbstoff.
Durch den Einbau von mehreren Farbstoffen wird eine hohe Sensitivitat erreicht (Abb. 3). Allerdings sind beide DNA-Strange mit Fluoreszenzfarbstoffen markiert, so dal3 in denaturierenden Gelen zwei Banden zu sehen sind, da die komplementaren Strange leicht unterschiedlich laufen. Diese Methode ist ideal zum ,,Screening" eines bestimmten Locus auf dem Genom. 1st die Stelle identifiziert, kann fur weitere Analysen ein fluoreszenzmarkierter Primer synthetisiert werden. Der Einbau nur eines Fluoreszenzfarbstoffs produziert scharfere und damit etwas leichter zu interpretierende Banden. (F)dUTP wird rnit den anderen Komponenten zum PCR-Ansatz gegeben. Wahrend der Kettenverlangerung wird markiertes dUTP (R110) anstelle von unmarkiertem dTTP eingebaut.
92
Dagmar Schuster
dATP, dCTP, dGTP, dTTP
1
dUTP[R110] Farbstoffmarkiertes PCR-Produkt
P ?
DNA-Polymerase
dd
Abb.3. Markierung eines PCR-Fragments rnit dUTP (R110).
6.2.3 Markierung von dsDNA rnit Fluoreszenzdimeren (Interkalatoren) Diese Methode basiert auf dem Prinzip der Anlagerung von Substanzen an doppelstrangige DNA. Der interkalierende Farbstoff TOTO-1 [9] wird nach der PCR-Reaktion zum unmarkierten DNA-Amplifikat gegeben und farbt dieses nachtraglich an (Abb. 4). Die Reaktionsweise ist ahnlich wie die rnit Ethidiumbromid. Im Unterschied zu Ethidiumbromid sind die Fluoreszenzdimere wesentlich empfindlicher und reagieren rnit der DNA, unabhangig von deren Basenzusammensetzung. Im Vergleich zu den vorausgegangenen Techniken besteht das Besondere an der Methode darin, da jede dsDNA, unabhangig von ihrer GroBe, mit Farbstoffen nachtraglich markiert werden kann. Das PCR-Produkt wird nachtraglich rnit einem Fluoreszenzfarbstoff versehen. Zwei unmarkierte Primer konnen fur die PCR-Reaktion eingesetzt werden. Beim Vergleich der drei Methoden zeigen sich je nach Applikation Vor- und Nachteile [9]: Alle drei Methoden sind fur quantitative Untersuchungen einsetzbar, aber die Stoichiometrie der farbstoffmarkierten Primer ist unkomplizierter, da die Fluoreszenzintensitat unabhangig von der Fragmentlange und der Basenzusammensetzung ist. Sind markierte Primer vorhanden, ist ihre Handhabung am einfachsten, da keine langwierigen nachtraglichen Aufreinigungsprozesse notwendig sind. PCR-Produkte, die rnit markierten dNTPs oder Interkalatoren versehen sind, mussen vor dem Auftragen auf das Gel aufgereinigt werden (Saulenaufreinigung), um zu gewahrleisten, da ein sauberes Farbstoff-DNA-Gleichgewicht beste h t . Bei AT-reichen Sequenzen treten starke Banden rnit markierten dUTPs auf, da diese vermehrt eingebaut werden (Abb. 5).
6 DNA-Fragmentgropenbestimmung und Quantifizierung
93
Abb. 4. Markierung von PCR-Produkten rnit Interkalatoren.
Multiplex-PCR-Reaktionen sind nur rnit markierten Primern moglich. Drei verschiedenfarbig markierte Primer konnen innerhalb eines PCR-Ansatzes eingesetzt werden und sogar Fragmente gleicher Lange bilden.
A
PCR-Produkternit fluoreszenzmarkiertemPrimer (FAM) generiert
n IS
I
r\
3900 a400 1600
000
j
0
8.
i
Spur6: PCR-Produkte rnit TOTO-1 markiert
C
woo 1800 1200 600
0
..
Spur 9: PCR-Produkte mit (F)dUTP markiert
Abb. 5. Vergleich von drei Methoden zur Fluoreszenzmarkierung von PCR-Fragmenten.
94
Dngninr Scliiister
Die Chromatogramme zeigen die relativen Fluoreszenzintensitaten von 9 verschiedenen PCR-Fragmenten des Dystrophin-Gens. Auf der x-Achse befinden sich die exakten FragmentgroBen, die automatisch von der ,,GeneScanTM"Software rnit Hilfe eines internen Langenstandards bestimmt wurden. Die Reihe A zeigt die PCR-Produkte, die rnit einem fluoreszenzmarkierten Primer generiert wurden. Uber 23 Zyklen wurde eine Multiplex-PCR durchgefuhrt. Reihe B gibt das Fluoreszenzprofil von PCR-Fragmenten (20 Zyklen) wieder, die rnit TOTO1 markiert wurden. Die Peaks in Reihe C wurden rnit Hilfe der (F)dUTPs erstellt (20 Zyklen). Das Exon 48 rnit einer Lange von 506 bp zeigt einen verstarkten Peak mit der (F)dUTP Markierung (s. Pfeil). Dies kann rnit dem AT-Reichtum (78%) dieses Fragmentes erklart werden. Dadurch wird verstarkt (F)dUTP eingebaut.
6.3 Exakte Langenbestimmung mit Hilfe eines internen Langenstandards Die automatische Langenbestimmung von DNA-Fragmenten erfolgt rnit Hilfe eines internen Langenstandards [ 101. Der Standard ist farbstoffmarkiert und kann somit von Proben unterschieden werden, die in der gleichen Spur aufgetragen werden, aber rnit anderen Farbstoffen versehen sind. Die bekannten Fragmentlangen des Standards konnen von einer Fragmentanalyse-Software (,,GeneScan rM") zur Erzeugung einer Kalibrierungskurve herangezogen werden. Mit Hilfe dieser Kurve konnen die Langen unbekannter PCR-Produkte durch Extrapolation bestimmt werden. Dieser interne Standard fuhrt zu einem wesentlich hoheren Grad der Genauigkeit und Reproduzierbarkeit von DNA-Langenbestimmungen. da Artefakte wie Spur-zu-Spur-Variationen, ausgelost durch Gelinhomogenitaten, keine Rolle mehr spielen. Der interne Langenstandard und das zu analysierende Fragment unterliegen den gleichen elektrophoretischen Bedingungen. Unterschiedliche Gele (verschiedene Konzentrationen, denaturierend oder nativ) oder unterschiedliche Kapillaren sind nun miteinander vergleichbar, sogar zwischen verschiedenen Laboratorien austauschbar (s. Kap. 7). Arbeitet man nur rnit einem Farbstoff, mussen in der Regel externe Langenstandards eingesetzt werden. Sie erreichen allerdings nie die Exaktheit eines internen Langenstandards. Folgende mathematische Methoden konnen zur Fragmentlangenbestimmung eingesetzt werden: ,,Cubic Spline Interpolation", ,,Least Squares" (2nd and 3rd Order Least Squares), ,,Southern" (Local und Global). 0
Bei der ,,Cubic Spline Interpolation"-Methode wird eine Kalibrierungskurve durch alle existierenden Punkte der Standardfragmente gelegt. Bei Verwendung dieser Methode ergibt sich eine ungenaue Langenbestimmung fur den Fall, da ein Standardfragment anomal lauft, da Fehler nicht korrigiert werden (Abb.6).
6 DNA-Fragmentgrofienbestimmung und Quantifizierung
95
Elutionsprofil des GeneScan 2500 Rox
s o o ! .
,
300
400
.
I
500
.
I
600
I
.
700
,
1
800
.
900
MolekulargroOe (bp)
Abb. 6. ,,Cubic Spline Interpolation"-Methode.
Das Elutionsprofil des internen Langenstandards GeneScan 2500 Rox ist zu sehen. Bei der ,,Least Squares"-Methode werden DNA-Fragmente, die anomal laufen, automatisch angepal3t. Abweichungen konnen berechnet werden. Die ,,2nd Order Least Square"-Methode benutzt eine quadratische Funktion. Die ,,3rd Order Least Square"-Methode benutzt eine kubische Funktion zur Berechnung. Die ,,GeneScanTM"-Softwareerkennt vorprogrammierte Muster der bekannten Standardfragmente. Zur Berechnung einer Kurve werden alle Punkte durch multiple, lineare Regression beriicksichtigt (Abb. 7). Das Elutionsprofil des internen Langenstandards GeneScan 1000 Rox ist abgebildet. Bei der ,,Local Southern"-Methode wird zur Langenberechnung die reziproke Verwandtschaft zwischen Fragmentlange und Mobilitat, von E. M. Southern 1980 beschrieben, herangezogen [2]. Die Gleichung lautet: LP (c/[m-mo]) + Lo
m: Mobilitat Lo: Lange des Standardfragments Jeweils eine Gruppe von drei Standardpunkten, die in der Nachbarschaft des unbekannten Fragments liegen, werden zur Generierung einer Kalibrierungskurve herangezogen. Die Durchschnittswerte bestimmen dann die GroBe der zu
96
Dagninr Scliiistrr Elutionsprofildes GeneScan 1000 Rox
200
500
400
300
600
700
800
900
1(
)O
MolekulargroBe (bp)
Abb. 7. Die ,,Least Squares"-Methode.
berechnenden Bande. Somit wird zur Analyse nur ein bestimmter Bereich des internen Langenstandards benutzt. Bei der ,,Global Southern"-Methode werden im Gegensatz zur ,,Local Southern"-Methode alle Standardfragmente in die Analyse mit einbezogen. Die Prazision der Langenbestimmung ist in Abhangigkeit von der FragmentgroBe. Die durchschnittliche GroBenvariation im Bereich zwischen 50-350 bp liegt bei ca. 0,05 bp, mit einem maximalen Unterschied von 0,27 bp [ll]. Vier verschiedene Standards finden derzeit hauptsachlich ihren Einsatz mit Hilfe des automatischen DNA-Sequenzers 377 (PE Applied Biosystems). Sie werden entweder mit dem Farbstoff ROX (rot) oder TAMRA (gelb) verwendet. Die ,,GeneScanTM"-Software erkennt automatisch diese StandardgroBen. Standard ~
Optimaler GroBenbereich
~~
GeneScan 350 GeneScan 500 GeneScan 1000 GeneScan 2500
30-350 bp 30-500 bp 37-1 000 bp 37-2 500 bp
GeneScan 1000 beinhaltet einen Alu I-Verdau von pBr322; GeneScan 2500 setzt sich aus PST I-Fragmenten des Bakteriophagen Lambda zusammen. GeneScan 350 besteht aus 12 verschiedenen PCR-Fragmenten, GeneScan 500 aus 16 Banden.
6 DNA-Fragmentgroflenbestirnmung und Quantifizierung
91
6.4 Sensitivitat, Kapazitat und Reproduzierbarkeit der automatischen Fragmentlangenbestimmung Automatische genetische Analysestationen verbunden rnit FragmentanalyseSoftwarepaketen ermoglichen die Groljenbestimmungen und Quantifizierungen von DNA-Fragmenten mittels automatischer Fluoreszenzdetektion (s. Kap. 5). Zur Zeit konnen funf verschiedene Fluoreszenzfarbstoffe (HEX, TET, FAM, TAMRA und ROX) eingesetzt werden (377 DNA-Sequenzer und 310 GeneticAnalyzer). Die multiple Markierung erlaubt die Durchfuhrung einer multiplex PCR und das Beladen einer Spur rnit mehreren Proben. Damit wird ein deutlich erhohter Durchsatz erreicht [5,10,11,12]. 36 Spuren pro Gel konnen beladen werden (377 DNA-Sequenzer). Verschiedene Marker konnen in einer Spur aufgetragen werden, da uberlappende Fragmente rnit verschiedenen Farben markiert werden [12]. Setzt man eine Laufzeit des Gels von 90 min voraus (8 Gelemag) und eine Beladung von 15 Loci pro Spur, kann die Analyse von mehr als 6000 Genotypen pro Tag durchgefuhrt werden. Bei der Kapillarelektrophorese (310 Genetic-Analyzer) kann eine Probe in 20 min analysiert werden. Das erlaubt einen Tagesdurchsatz von 900 Genotypen. Hierbei mussen allerdings 15 Loci pro Lauf und 3 verschiedene Farbstoffe eingesetzt werden. Daruber hinaus wird die Reproduzierbarkeit der Analysen deutlich erhoht. Vergleichs- oder Kontrollproben, die in derselben Spur mit der unbekannten Probe untersucht werden, ermoglichen eine interne Standardisierung bezuglich der Genauigkeit von Fragmentgroljenbestimmungen sowie der DNA-Quantifizierungen. Daten zwischen verschiedenen Spuren, aber auch zwischen verschiedenen Gelen, sind miteinander vergleichbar [12,13]. Die Sensitivitat der vier verschiedenen Fluoreszenzfarbstoffe ist hoch. DNAMengen im Attomol-Bereich konnen nachgewiesen werden. Diese hohe Empfindlichkeit ist nur noch rnit radioaktiven Techniken zu erreichen. Die Silberfarbung oder der Einsatz von Ethidiumbromid ist unempfindlicher (um den Faktor 100). Die Sensitivitat spielt vor allem in der forensischen Spurenkunde (s. 6.7.7) eine wichtige Rolle [13]. Die Einfuhrung der automatischen DNA-Analytik fuhrte hier zu einer Steigerung des Nachweiserfolges. Vor allem die Analyse sogenannter Problemspuren rnit geringem DNA Ausgangsmaterial, wie z. B. Zigarettenkippen, Einzelhaare und Mikroblutspuren, wurde erleichert.
6.5 Automatische Datenanalyse Zu den automatischen genetischen Analysesystemen 377 oder 310 (s. Kap. 8) gehoren zwei Analysesoftwarepakete. Das erste ist die ,,GeneScanTM"-Software. Dieses Programm sammelt und analysiert die Daten, die von der Elektrophorese-
98
Dagmar Schuster
einheit generiert werden. Die Analyse der FragmentgroBen erfolgt aufgrund des internen Langenstandards. Die Software benutzt die bekannten Langen der Standardfragmente, um eine Kalibrierungskurve zu generieren. Die analysierten Daten konnen auf vielseitige Weise dargestellt werden. Zum einen gibt es die Moglichkeit, die verschiedenfarbigen Fragmente einer Spur in einem Chromatogramm abzubilden. Die Signale jeder Farbe konnen aber auch in einzelnen Chromatogrammen dargestellt werden. Des weiteren kann man sich die Ergebnisse in tabellarischer Form betrachten. Hierbei werden die Fragmentlangen, die Peakhohen, die Peakflachen und die Farbstoffarten angegeben. Markiert man einen Peak, so wird automatisch der korrespondierende tabellarische Wert angezeigt. Chromatogramme und tabellarische Daten konnen auf einem Drucker ausgedruckt werden. Die Ergebnisse konnen ebenfalls als Graphik oder Textdaten exportiert werden (Microsoft Word, Excel, Canvas). Die elektronischen GroBenangaben werden dann zur ,,GenotyperTM"-Software transferiert. Risiken von Transferfehlern sind auszuschlieflen. Die Software transformiert automatisch die ,,GeneScanTM"-Datenin markierte Allele und konvertiert die AllelgroBen in Allelnummern. Die Ergebnisse werden als elektronische Files gespeichert. Diese editierten Daten sind jederzeit leicht abrufbar und konnen fur weitere Analysen eingesetzt werden. Die ,,GenotyperTM"-Ergebnissewerden Marker fur Marker und Familie fur Familie in Form von tabellarischen Daten oder als mehrfarbige Elektropherogrammdaten angezeigt. Genotypisierungsfehler oder Ambiguities werden schnell und leicht in jedem Format korrigiert. Im informativen graphischen Druckfenster konnen die Daten editiert werden. Die editierten Ergebnisse werden in einem revidierten File abgelegt. Die tabellarischen und graphischen Berichte konnen jederzeit ausgedruckt werden. Daruber hinaus sind die tabellarischen Daten zur weiteren Auswertung exportierbar, z. B. in ,,Linkage-Analysen-Paketen" wie LINKAGE and CRIMAP.
6.6 Quantitative Anwendungen in der Fragmentanalyse Ein Merkmal lebender Zellen ist, da sie Proteine aufbauen und somit fur ihren eigenen Erhalt sorgen. Im vielzelligen Organismus haben sie zudem die Aufgabe, auch fur dessen Gesamtfunktion wichtige Proteine bereitzustellen. Eine prazise Steuerung der Proteinsynthese ist also unabdingbar, wenn die einzelne Zelle und der Organismus als Ganzes funktionieren sollen. Wird nur ein einziges Protein zuviel oder zuwenig produziert, kann dies schon verheerende Folgen haben. Im allgemeinen steigt die Rate, mit der ein Protein gebildet wird, proportional mit der Menge an zugehoriger mRNA. Der Umsatz der mRNA spielt eine bedeutende Rolle fur eine normale Vermehrung und Differenzierung von Zellen
6 DNA -FragmentgroJenbestimmung und Qiiantifiziening
99
[14]. Oncogene transkribieren vermehrt mRNAs, die zu anomaler Zellvermehrung und Krebswachstum fuhren [15]. Aus diesem Grund nimmt die Quantifizierung von mRNAs einen immer groljeren Stellenwert ein. Die automatische Quantifizierung von PCR-Produkten wird unter Zuhilfenahme eines internen Standards ermoglicht [16]. Dabei handelt es sich um die gleiche, aber gegenuber der zu untersuchenden um mindestens 10 Basen verkurzte Ziel-DNA. Die verkurzte DNA wird durch UV-Messung quantifiziert und der PCR-Reaktion beigefugt. Nach der Amplifikation werden beide Produkte, verkurztes und zu analysierendes PCR-Fragment, anhand ihrer Fluoreszenzintensitaten miteinander verglichen. Die Quantifizierung wird auch eingesetzt, um Trager (,,Carrier") einer Krankheit zu detektieren, wie z. B. im Fall der ,,Duchennesche Muskeldystrophie" (DMD). Ein Allel der betroffenen Personen zeigt die entsprechende Mutation, das zweite ist normal [17]. Ihr Phanotyp zeigt keine Krankheitssymptome, sie konnen allerdings die Krankheit vererben. Weiblichen ,,Carriern" von DMD fehlt nur auf einem von zwei X-Chromosomen ein Exon. Um ein eindeutiges Ergebnis zu erzielen, ist eine Genquantifizierung unerlaljlich. Tritt eine 50%ige Reduktion eines DMD-Exons auf, dann kann man von einem weiblichen ,,Carrier'' sprechen (s. 6.7.3) Mit Hilfe von Fluoreszenzfarbstoffen ist die Quantifizierung erheblich verbessert worden. Die Farbstoffe sind bis zu lOOfach sensitiver als rnit Ethidiumbromid gefarbte Gele. Dadurch kann die PCR-Zyklenzahl reduziert werden [14]. Das PCR-Produkt lafit sich nur exakt quantifizieren, wenn die Zyklenzahl niedrig, d. h. im linearen Bereich ist. Die Amplifikationsmenge pro Zyklus wird in spateren Runden immer geringer. Fuhrt man eine PCR mit nur wenigen Zyklen durch, ist die Menge pro Zyklus quantitativ am genausten [18]. Die Ausgangsmenge des Genfragments kann so exakt durch Extrapolation von der PCR-Menge bestimmt werden. Des weiteren treten auch weniger unspezifische Produkte auf, die in den letzten PCR-Runden erzeugt werden. Diese Artefakte werden durch unspezifische Primer-Hybridisierung oder durch Kontaminationen ausgelost. Sie konnen die Auswertung der eigentlichen Fragmente erschweren. Bei der quantitativen Detektion von HIV-1 ist das Ausgangsmaterial mRNA [19, 201. Blut wird von seropositven Individuen abgenommen und die virale RNA rnit Hilfe einer ,,Reversen Transkriptase" (Enzym) in cDNA umgeschrieben. Anschlieljend wird eine PCR-Reaktion durchgefuhrt, um die HIV-1-cDNA in detektierbare Mengen zu vervielfaltigen. Es sollten zwei HIV-Bereiche amplifiziert werden: DNA-Abschnitte, die das gag-Protein und das env-Protein reprasentieren. Falls Mutationen in einem DNA-Abschnitt auftreten, ist man mit zwei Amplifikationsbereichen auf der sicheren Seite. Der gag-spezifische Primer kann z. B. rnit dem blauen Farbstoff markiert sein, der env-spezifische Primer tragt den grunen Farbstoff. Des weiteren wird die Versuchsgenauigkeit noch gesteigert, wenn ein Kontrollgen (,,Housekeeping"-Gen) rnit amplifiziert wird, z. B. die mRNA des P-Globin-Gens. Damit sind Ungenauigkeiten durch den gesamten Versuchsablauf auszuschlieljen (Pipettierungsfehler, Beladen des Gels usw.). Die Amplifikate werden zusammen
100
Dagmar Schuster
mit einem internen Langenstandard elektrophoretisch aufgetrennt (Gel oder Polymer). Mit Hilfe der Software (,,GeneScanTM")wird die Peakhohe und die Peakflache berechnet. Beides kann zur Quantifizierung herangezogen werden (Abb.8). Die Chromatogramme veranschaulichen die Sensitivitat einer HIV-1-cDNADetektion. 1pg humane DNA wird in 32 Zyklen mit HIV spezifischen Primern amplifiziert. Sogar 1Kopie von HIV-1-cDNA ist erkennbar. Die Tabelle zeigt die Peakhohe und Peakflache, die fur die Quantifizierung herangezogen wird. Fragmentgrab (bp) ?SO
900
650
750
700
800
850
900
950
I
3 l o o-; -g
10 Kopien HIV-1-CDNA
200: 200
.-ii!! o o
i ..Spur15
"
1 200
1 Kopie HIV-1-CDNA
L
I ISpur 17 X : W
Y:SQ
Abb.8. Quantitative Detektion von HIV-1-cDNA.
6.7 Mutations-Detektions-Methoden 6.7.1 Die Identifizierung von Mutationen Mutationen verandern unser Erbgut und sind die Ausloser fur eine Vielzahl von Krankheiten. Die Identifizierung von Mutationen in DNA-Sequenzen nimmt daher einen immer groBeren Stellenwert in der humanen genetischen Forschung ein [21]. Mit der Entdeckung der PCR (,,Polymerase Chain Reaction") konnten mehrere brauchbare Mutations-Detektions-Techniken etabliert werden [22]. Die verschiedenen Techniken haben unterschiedliche Starken und konnen je nach Bedarf eingesetzt werden (s. 6.7.5).
6 DNA-Fragmentgroflenbestimmung und Quantifiz ierung
101
In der humanen Genetik werden diese Methoden benutzt, um Kandidatengene und ihre Phanotypen zu untersuchen und um neue Allele an bekannten Loci fur die Diagnostik, Populationsgenetik und Struktur-Funktions-Analyse zu bestimmen. Die Untersuchungen der verschiedenen Mutationen sind in zwei Gruppen unterteilbar. Die erste befaBt sich mit Techniken, die zur Identifizierung von bekannten Krankheitsallelen fuhrt. Hierzu zahlt das Screening von Populationen, um Mutationstrager von bestimmten Krankheiten, wie z. B. der Cystischen Fribose (CF) zu finden. Die zweite Gruppe beinhaltet Methoden, die der Auffindung unbekannter Mutationen dient und sich mit dem ,,Scannen" von Sequenzen beschaftigt. 1st ein Gen bekannt und kennt man auch seine genetischen Mutationen (defektes Gen), stellt die Mutationsanalyse andere Anspruche wie bei einem Kandidatengen, dessen Mutationssuche noch nicht abgeschlossen ist. Defekte Gene spielen in diagnostischen Untersuchungen eine groBe Rolle. Hier ist ein besonders hoher Grad an Genauigkeit erforderlich. Der gleiche Locus wird in einer groBen Anzahl von Patienten oder Populationen nach Mutationen hin untersucht. Hierbei ist es hilfreich, einen spezifischen und speziellen Primer fur die direkte Sequenzierung zu synthetisieren. Die Sequenzierung garantiert eine hohere Genauigkeit in ihren Ergebnissen als SSCP-(,,Single Stranded Conformational Polymorphism") und HMA-( ,,Heteroduplex Mobility Assay") Techniken (s. 6.7.4). Im Gegensatz dazu steht die Untersuchung von Kandidatengenen. Hier konnen verschiedene Loci Mutationen besitzen oder auch nicht. Spezielle Primer und Reagenzien sind weniger praktikabel. AuBerdem ist eine 100%ige Mutationssuche weniger kritisch, vorausgesetzt genugend Patientenproben sind vorhanden. Oft fehlen Details uber die Struktur dieser Gene. In diesem Fall konzentriert man sich zunachst nur auf die Untersuchung der Exons. So sollte hier die Mutationsmethode nach der GroBe der zu untersuchenden Fragmente festlegt werden. Mutationsanalysen lassen sich an zwei verschiedenen Templates durchfuhren: mRNA oder genomischer DNA. Mehrere Faktoren spielen bei der Entscheidung eine Rolle, welches Ausgangsmaterial das richtige ist. Liegt mRNA von Kulturzellen oder pathologischen Proben vor, ist es sicherlich das bessere Ausgangsmaterial, da groBe Bereiche der kodierenden Region ,,gescreent" werden konnen. Bei der Verwendung von speziellen PCR-Protokollen konnen geringste Mengen von mRNA amplifiziert werden [18]. Sogar Gewebematerial, in dem bestimmte Gene nur in sehr geringen Mengen exprimiert werden, ist analysierbar [23].Ausgehend von mRNA wird diese zuerst mit Hilfe des Enzyms ,,Reverse Transkriptase" in cDNA umgeschrieben und letztere anschlieljend zu 1-2 kb Fragmenten amplifiziert. Kleinere Fragmente werden iiberwiegend von genomischer DNA amplifiziert, da hier die kodierenden Bereiche (Exons) das Hauptinteresse bilden. Die verschiedenen Mutations-Detektions-Technikensind nicht fur beide Templates gleich gut geeignet. SSCP und HMA haben Vorteile bei der Untersuchung von kleinen Fragmenten (< 300 bp), und somit ist als Ausgangsmaterial genomische
102
Dagmur Schiisrer
DNA geeignet. Direkte Sequenzierung (s. Kap. 5 und 6.7.4) wird fur Fragmente bis zu 600 bp eingesetzt, und die CMC-Methode (,,Chemical Mismatch Cleavage") (s. 6.7.4) eignet sich fur Fragmente bis zu 1700 bp.
6.7.2 PCR-basierende Mutations-Detektions-Methoden Die Fahigkeit, DNA enzymatisch rnit Hilfe der PCR zu amplifizieren, ist die Voraussetzung fur die meisten Mutations-Detektions-Techniken. Die im folgenden beschriebenen Methoden setzen eine PCR-Reaktion vor der Analyse voraus.
6.7.3 Multiplex-PCR fur die Detektion von Deletionen Die genomische DNA-Sequenz eines Gens zeigt Deletionen, die es zu untersuchen gilt. Amplifiziert man mehrere verschiedene Bereiche (Exons) eines Gens rnit unterschiedlichen Primer-Paaren (Multiplex-PCR) und trennt die verschiedenen Fragmente rnit Hilfe eines 6% Polyacrylamidgels auf, kann sehr schnell und einfach eine Detektion durchgefuhrt werden. Deletionen werden durch die Abwesenheit bestimmter Banden im Muster der Multiplexanalyse angezeigt. Diese Methode findet ihren Einsatz in der Diagnose der ,,Duchenneschen Muskeldystrophie" (DMD). DMD ist eine mit dem X-Chromosom verbundene Krankheit [17, 231. 60% aller bekannten mannlichen Falle tragen Deletionen. Im Fall von Heterozygoten (weiblich) sieht man die Deletionen in Form einer 50%-igen Reduktion der Signalintensitaten. Hierbei werden die Multiplex-PCR-Reaktionen quantitativ untersucht (Abb. 9). Setzt man vier verschiedene Fluoreszenzfarbstoffe fur diese Untersuchungen ein, konnen mehrere Exonbereiche in einer Spur aufgetragen werden, da auch uberlappende Fragmente aufgrund der verschiedenen Farben sichtbar gemacht werden. So werden z. B. neun verschiedene Primer-Paare, die zu den Exonbereichen des DMD-Gens passen, in derselben PCR-Reaktion eingesetzt. Durch die erhohte Sensitivitat (Farbstoffe anstelle von Ethidiumbromid) kann die Zahl der PCR-Zyklen reduziert werden. Der PCR-ProzeB verlauft in den fruhen Amplifikationsschritten quantitativ (s. 6.6). Mutante und Wildtyp-DNA sind oben dargestellt. Nach der Denaturierung entstehen Einzelstrange, die je nach Basenzusammensetzung unterschiedliche Konformationen bilden. Verschiedene Einzelstrangkonformationen resultieren in einer unterschiedlichen Mobilitat durch das Gel. Die PCR-Primer wurden rnit verschiedenen Fluoreszenzfarbstoffen versehen. Die Exonlangen 331, 360, 416, 506 und 547 bp wurden rnit FAM (blau) markiert. Die Produkte 196, 268, 388 und 459 bp erhielten den grunen (HEX) Farbstoff. Vier DNA-Proben (100 ng) wurden amplifiziert. 1% des PCR-Ansatzes wurde elektrophoretisch aufgetrennt.
6 DNA-FragmentgroJlenbestimmung und Quantifizierung 1
2
3
103
4
-547 bp
Abb. 9. DMD-Multiplex-PCR-Assay-Gelbild.
Der interne Langenstandard ist rot (ROX). Spur 1: Patient mit einer 547 bp Deletion, Spur 2: Weiblicher Trager mit einer reduzierten 547 bp Bandenintensitat, Spur 3 und 4: normale Patientinnen.
6.7.4 Detektion von Punktmutationen Alterationen von einer Base sind die haufigsten Mutationen. Es gibt mittlerweile eine Anzahl von Methoden, um diese geringen Abweichungen im Genom festzustellen. SSCP-,,Single Stranded Conformational Analysis" 1989 wurde die SSCP-Methode zur Detektion von Punktmutationen zuerst von Orita et al. [24] beschrieben. Mittlerweile ist es die am haufigsten benutzte Technologie zum Auffinden von Mutationen. Mutante und Wildtyp-DNA werden mit Hilfe der PCR amplifiziert, denaturiert und auf ein nichtdenaturierendes Gel (nativ) aufgetragen und entsprechend ihrem Molekulargewicht elektrophoretisch aufgetrennt. Die Zugabe von 10% Glyzerin zum MDE-Gel (ein Acrylamid Substitut - AT Biochem) verbessert die Auflosung erheblich. Zur Auftrennung kann auch ein natives Polymer innerhalb der Kapillarelektrophorese benutzt werden. Die zwei denaturierten, einzelstran-
104
Dagmar Schuster
gigen DNA-Molekiile bilden je nach ihrer primaren Sequenz unterschiedliche dreidimensionale Konformationen [25,26]. Die DNA der Mutante wird aufgrund des Sequenzunterschiedes im Gel unterschiedlich zur DNA des Wildtyps laufen (Abb. 10). Die SSCP-Technik eignet sich hervorragend zur Detektion von Mutationen, zeigt aber nicht die Lokalisation der Mutation innerhalb des Fragments an. PCRProdukte, die ein unterschiedliches Migrationsmuster aufweisen, konnen dann sehr leicht durch die DNA-Sequenzierung (s. Kap. 5 ) analysiert werden, um somit die exakte Lokalisation der Alteration zu bestimmen. Der grolje Vorteil der SSCP-Analyse ist die einfache Handhabung und die hohe Sensitivitat. Es werden keine zusatzlichen Schritte nach der PCR-Reaktion benotigt, und das Gelsystem ist reproduzierbar. Die SSCP-Analyse erfaljt 90% aller Mutationen in PCR-Produkten, die bis zu 200 Nukleotide lang sind [27,28]. Je groBer das Fragment, um so schlechter wird auch die Erfolgsquote. Sie liegt nur noch bei 50%, wenn das PCR-Produkt > 400 bp ist. Die MolekiilgroBe allein bestimmt bei groBeren Fragmenten das Laufverhalten. Laufunterschiede, die aufgrund eines Basenaustauschs auftreten, sind somit schwer detektierbar. Diese Limitierungen konnen durch Multiplexen (die Analyse von mehreren Fragmenten in einer Spur) oder durch einen Restriktionsverdau von groljeren Fragmenten vor der Elektrophorese behoben werden [29]. Die SSCP-Methode wird z. B. zum Mutationsscreening des CF-Gens (Cystische Fibrose) eingesetzt [30]. Das Gen, das fur die CF (6100 bp codierende Region) verantwortlich ist, enthalt 27 Exons. Bisher wurden in diesem Genabschnitt 300 Mutationen beschrieben, von denen die meisten durch SSCP-Untersuchungen feststellbar sind. Hauptaufgabe ist es, zu potentiellen Erscheinungsbildern die
Abb. 10. Schernatische Darstellung der SSCP-Technik.
6 DNA-Fragmentgroflenbestimmung und Quantifizierung
105
entsprechenden Mutationen zu finden und nach weiteren unbekannten Mutationen des CF-Gens zu forschen. In den unten beschriebenen Genabschnitten wurden bisher die meisten Mutationen beschrieben: 0
NBFl [,,First Nucleotide Binding Fold"] - Exons 9-11: NBF2 [,,Second Nucleotide Binding Fold"] - Exons 19-22 CFTR [,,Transmembrane Spanning Regions"] - Exons 3,4 and 7
DeltaF508, in der NBF1-Region, ist die bisher bekannteste Mutation und tritt bei 67% aller Kranken auf. Die Suche nach Mutationen im CF-Gen ist eine wichtige Voraussetzung fur die genetische Beratung von Familien, die eine CF-Vergangenheit besitzen. Somit wird die pranatale Diagnose und die Korrelation zwischen Genotyp und Phanotyp immer bedeutender. HMA-,,Heteroduplex Mobility Analysis" Die PCR-Reaktionen von Wildtyp und Mutante werden gemischt. Um Heteroduplexe zwischen den verschiedenen DNA-Spezies zu generieren, werden die gemischten Ansatze durch Hitze denaturiert und langsam in Abwesenheit von Formamid auf Raumtemperatur abgekuhlt. Es entstehen drei Arten von DNAStrangen: Homoduplex, Heteroduplex und ssDNA (Abb. 11). Die Heteroduplexmolekule, die einen Basenunterschied aufweisen, zeigen in einem Polyacrylamidgel ein anderes Laufverhalten als Homoduplexmolekule [31]. Dieses Phanomen kann man sich durch sequenzbedingte Konformationsanderungen der dsDNA erklaren. Heteroduplexe laufen wegen der ,,offeneren" doppelstrangigen Konfiguration um die ,,Mismatch" Base etwas langsamer als die korrespondierenden Homoduplexe. Heteroduplexe mit 1 bp Deletionen sind leichter zu detektieren als Nukleotidsubstitutionen.
Abb. 11. Die HMA-Technik.
106
Dagmar Schuster
Neue Gelmatrizen (Hydrolink und MDE von AT Biochem) verbessern noch die Laufunterschiede zwischen den verschiedenen Strangen. Diese Gelmatrizen werden analog den Polyacrylamidgelen zwischen zwei Glasplatten gegossen, zwei Stunden polymerisiert und dann fur die Elektrophorese verwendet. Die PCRProdukte von Wildtyp und Mutante werden nebeneinander aufgetragen und die unterschiedlichen Laufstrecken miteinander verglichen. Die Detektionsrate liegt bei 85%. Die PCR-Produkte durfen nicht groBer als 300 bp sein [32,33]. Isotopische [33] und nichtisotopische [32] Detektionsmethoden wurden bisher beschrieben. Auch kann anstelle eines Gels eine Kapillarelektrophorese zur Auftrennung verwendet werden. Die HMA-Technik ist besonders beliebt wegen ihrer einfachen Handhabung und wurde schon bei einer Reihe von humanen genetischen Polymorphismen beschrieben [34]. ,,RNase A cleavage" Mit dieser Methode werden RNA-DNA-Heteroduplexmolekule zwischen einer radioaktiv markierten Wildtyp-RNA-Sonde und der mutierten DNA, generiert durch PCR, gebildet. Das Enzym RNase A erkennt und schneidet einzelstrangige RNA an den ,,Mismatch"-Stellen [35,36]. Die anschlieBende Elektrophorese und Autoradiographie macht die geschnittenen Fragmente sichtbar. Das Erkennen einer Mutation und die Bestimmung ihrer Lokalisation werden durch Banden einer bestimmten Lange angezeigt. Diese Methode ist limitiert durch die Notwendigkeit von radioaktiv markierter RNA und die Tatsache, da RNase A nur 50% aller ,,Mismatchs" detektieren kann. Deshalb wurde die Technik fast vollstandig durch eine ahnliche Methode ersetzt: ,,Chemical Mismatch Cleavage". CMC-,,Chemical Mismatch Cleavage" Ein Heteroduplex wird beim Erhitzen und ,,Reannealing" zwischen einem markierten Wildtyp-DNA-Molekul und der mutierten DNA (oder RNA) gebildet. Die Chemie der Maxam-Gilbert-Sequenzierung (s. 5.2.1) wird danach benutzt, um die ,,Mismatch" Basen in den DNA-DNA- oder DNA-RNA-Heteroduplexen zu modifizieren. Osmiumtetroxid wird fur die chemische Modifikation von ,,Thymin-Mismatchen" eingesetzt. Dagegen wird Hydroxylamin fur ,,Cytosin-Mismatchs" verwendet. Die markierte DNA wird durch Piperidin an der Stelle der Modifikation gespalten (Abb. 12). Die Langenbestimmung erfolgt anschlienend durch ein denaturierendes Polyacrylamidgel [37]. Die CMC-Technik ist sensitiv, und die Detektion liegt bei uber 95% aller ,,Mismatch" Basen, wenn nur die Wildtyp-DNA markiert ist, und bei loo%, wenn Wildtyp und Mutante markiert vorliegen [38]. PCR-Produkte bis zu einer Lange von 1,7 kb konnen erfolgreich analysiert werden. Die CMC-Methode hat somit die geringsten GroBenlimitierungen [39]. Des weiteren wird der Locus und die Natur der Punktmutation durch die GroBe der geschnittenen Banden und durch das Spaltungsreagenz angezeigt. Auch nichtradioaktive Techniken [40] und Multiplex-Verfahren [41] wurden bisher schon publiziert.
6 DNA-Fragmentgrooenbestimmung und Quantifizierung
107
Eine hochsensitive, fluoreszenzmarkierte Variation von CMC wurde von Haris beschrieben [42]. Die FAMA-(,,Fluorescence-Assisted Mismatch Analysis") Methode erlaubt die Markierung von beiden DNA-Strangen. Eine hohere Effizienz der Mutationssuche ist damit gewahrleistet (Abb. 12). Ein Heteroduplex zwischen FAM markierter Wildtyp-DNA (oberer Strang) und HEX markierter Mutanten-DNA ist zu sehen.
Abb. U.,,Chemical Cleavage" (CMC).
Direkte Sequenzierung Die bisherigen beschriebenen Methoden dienen der Detektion von Punktmutationen mit unterschiedlicher Effizienz, aber keine bestimmt die genaue Basenfolge der Mutationen. Durch eine DNA-Sequenzierung kann die Lokalisation und die genaue Basenfolge einer Sequenz ermittelt werden und ist somit der finale Schritt jeder Mutations-Detektions-Methode. Die DNA-Sequenzierung wird immer schneller, genauer und effizienter und reprasentiert somit die ideale Mutations-,,Scanning"-Technik. Direkte Sequenzierung (DS) erlaubt die Sequenzanalyse von PCR-Produkten ohne die Subklonierung in einen Sequenzvektor. Diese Methode wird effizienter durch den Einsatz eines automatischen DNA-Sequenzers und Fluoreszenz-Detektions-Technologien(ABI 377 DNASequenzer). Sie wird mehr und mehr die bevorzugte Methode fur die Mutationssuche. Die direkte Sequenzierung basiert auf der ,,Didesoxy"-Methode von Sanger, und sowohl isotopische als auch fluoreszenzbasierende Methoden wurden bereits in Kap. 5 beschrieben.
108
Dagmar Schuster
Methoden der Zukunft In den letzten Jahren wurden neue Mutations-Detektions-Methoden entwickelt und in vielen Labors getestet und optimiert. Zwei neue Methoden sollen hier beschrieben werden, die zukunftig von Bedeutung sein konnten:
ddF-,,Didesoxy Fingerprint" ddF reprasentiert eine Kombination zwischen der SSCP-Analyse und der direkten Sequenzierung. Nach der Amplifikation wird das PCR-Produkt mit Didesoxy-CTP (ddCTP) sequenziert, um eine C-Leiter (Fingerprint) von Banden zu generieren. Die Sequenzreaktionen von Wildtyp und Mutante werden auf ein nichtdenaturierendes Polyacrylamidgel aufgetragen und wie bei der SSCP-Technik elektrophoretisch aufgetrennt. Mutationen sind als ,,Shifts" von individuellen Banden in der Leiter erkennbar [43]. Diese Methode zeigt auch die Lokalisation der Sequenzalteration an. Enzyme E.coli ,,Mismatch Repair Enzyme" wurden fur die Detektion von bekannten Mutationen in Oncogenen eingesetzt [44]. Sind diese Enzyme in der Lage, auch ,,Mismatch"-Basen in grofleren Heteroduplexmolekulen zu detektieren, werden sie sicherlich haufiger fur die Mutationssuche verwendet werden.
6.7.5 Vergleich und Bewertung der verschiedenen MutationsDetektions-Methoden Verschiedene Kriterien bewerten die Wichtigkeit der verschiedenen MutationsDetektions-Methoden. Tabelle 1 faflt die Vor- und Nachteile der unterschiedlichen Prozeduren zusammen. Tab. 1. Vor- und Nachteile der verschiedenen Mutations-Detektions-Methoden
I Methode SSCP HMA CMC Sequenzierung
Fragmentlange
Erfolgsrate
250 300 1 700 700
80% 80% > 95% > 99%
Lokalisation
I
Die FragmentgroBe ist in bp angegeben. Wieviel Prozent der Mutationen detektierbar sind, gibt die Spalte Erfolgsrate an. O b die genaue Mutationsstelle bestimmt werden kann, zeigt die Lokalisationsspalte. Die Sensitivitat und die Genauigkeit der verschiedenen Methoden hangt stark von der GroBe der zu analysierenden Fragmente ab. SSCP- und HMA-Analysen
6 D NA-Fragrnentgroflenbestirnrnungund Quantifizierung
109
sind nicht so eindeutig wie CMC oder die direkte Sequenzierung, sogar im niedermolekularen Bereich. Nur durch die Sequenzierung und durch die CMCTechnik ist eine genaue Lokalisierung der Mutation moglich. Alle Prozeduren konnen radioaktiv, nichtradioaktiv oder rnit Hilfe von Fluoreszenzfarbstoffen durchgefuhrt werden. Bei den SSCP- und HMA-Analysen reicht ein Anfarben der Gele rnit Ethidiumbromid aus. Die hohere Empfindlichkeit ist allerdings rnit den Fluoreszenzfarbstoffen zu erreichen. Fur CMC und die direkte Sequenzierung empfiehlt sich der Einsatz von Fluoreszenzfarbstoffen. Von allen Techniken ist CMC die am meisten toxische, da die Chemikalien Osmiumtetroxid und Piperidin venvendet werden mussen. Sie sind daher nicht fur den klinischen Laborbetrieb geeignet. SSCP und HMA sind am einfachsten und schnellsten durchzufuhren, da diese Methoden direkt nach der PCR durchgefuhrt werden konnen. Eine Kombination von beiden Methoden gewahrleistet auBerdem eine hohes Ma8 an Genauigkeit, da manche Mutationen besser rnit der einen als mit der anderen Technik identifiziert werden konnen [30]. CMC und die direkte Sequenzierung sind zeitaufwendiger, da die PCR-Produkte entsprechend vorbehandelt werden mussen und somit fur das ,,Screening" von einer grol3en Anzahl an Proben ungeeignet. Die DyeTerminator-Sequenzierung in Verbindung rnit einem automatischen DNASequenzer beschleunigt diesen ProzeB. Die bisher beschriebenen Methoden detektieren Nukleinsaureveranderungen. Sie sagen aber nichts uber ihre biologische Signifikanz aus. Einige Sequenzveranderungen fuhren zu Funktionsveranderungen von Proteinen. Andere Veranderungen fuhren nur zu Aminosurensubstitutionen oder Basenaustauschen in Introns und untranslatierten Bereichen, die einen Sequenzpolymorphismus darstellen, der aber nicht funktionell relevant sein muB. Hier sind weitere Informationen von groBer Wichtigkeit: Kopplungsanalysen (Familien- und Populationsstudien) oder Funktionsuntersuchungen nach der In-vim-Expression. Nur dann sind die Wissenschaftler in der Lage, die Bedeutung einer Sequenzveranderung zu werten. Die Wichtigkeit der Kopplungsanalysen wird im nachsten Abschnitt behandelt.
6.8 Kopplungsanalysen Sowohl fur die Diagnose vieler Erbkrankheiten als auch fur die Entwicklung moglicher Heilverfahren sind detaillierte genetische Karten jedes Chromosoms unabdingbar [45,46]. Das als erstes kartierte menschliche Gen war jenes, das Farbenblindheit verursacht. Normalerweise ist eine genetische Krankheit schon lange vor dem Auffinden des genauen molekularen Defekts bekannt. Die Entwicklung von genetischen und physikalischen Karten der Chromosomen nimmt einen immer groBeren Stellenwert ein, um eine fruhe Diagnose bestimmter Krankheiten zu ermoglichen. Bei der genetischen Karte [47,48,49,50] wird die Entfernung der verschiedenen
1 10
Dagiizrrr Schuster
Gene zueinander auf den Chromosomen untersucht sowie ihre Distanz zu den sogenannten ,,genetkchen Markern". Genetische Marker sind polymorphe DNA-Sequenzen, deren Lokalisation auf dem Chromosom bekannt ist und die sogenannte Referenzpunkte darstellen. Polymorphe DNA-Sequenzen zeigen mehr als ein Sequenzallel innerhalb der Population und sind deshalb in verschiedenen Individuen leicht unterschiedlich. Je naher ein genetischer Marker an dem Gen von Interesse liegt, um so wahrscheinlicher ist es, da beide das gleiche Vererbungsmuster aufweisen. In der klassischen Genetik mit man die Rekombinationshaufigkeit zwischen Genpaaren oder Gengruppen wahrend der Meiose: Je dichter zwei Gene beieinander liegen, desto seltener tritt zwischen ihnen eine Rekombination auf und sie werden zusammen vererbt (Crossing over). Der genetische Marker ist mit dem Krankheitsgen gekoppelt (,,linked"). Die ,,Kopplungs"- (,,Linkage") oder genetische Karte sagt aber nichts uber die exakte Lokalisation des Gens auf dem Chromosom aus. Auch um welches Chromosom es sich handelt, ist nicht bekannt. Hierfur wurde eine neue Einheit geschaffen - centiMorgan (cM). cM beschreibt nicht die unmittelbare Nahe von zwei Genen, aber die Wahrscheinlichkeit, das beide wahrend der Meiose zusammenbleiben. Sind zwei Punkte durch eine Distanz von 1 cM getrennt, dann besteht eine Wahrscheinlichkeit von 1/100, da sic nach der Meiose in verschiedenen Gameten lokalisiert sind. Wenn zwei Gene eng miteinander verbunden sind, ist die Wahrscheinlichkeit sehr grol3, da beide zusammen auf die Nachkommen vererbt werden. Generationen von genetisch kranken Familien werden daraufhin untersucht, wie haufig ein Marker zusammen rnit dem mutierten Gen vererbt wird. Die Vererbung der Krankheit kann dann indirekt mit dem Auffinden des Markers verfolgt werden, sogar wenn die molekulare Struktur des Krankheitsgens noch unbekannt ist. Findet man den entsprechenden Marker, weil3 man mit hoher Wahrscheinlichkeit, da die entsprechende Person krank werden wird. Vor dem Ausbilden des Phanotyps konnten entsprechende MaBnahmen getroffen werden. Momentan ist das Auffinden von neuen genetischen Markern ein wichtiger Bereich in der Kopplungsanalyse [51, .52,53,54,55].Eine Klasse von Markern (s. a. 6.9) ist bekannt als ,,Restriction Fragment Length Polymorphism" oder RFLP [%I. Den Polymorphismus erkennt man daran, ob sich bestimmte DNA-Bereiche von Restriktionsenzymen schneiden lassen. Anhand der daraus resultierenden spezifischen Bandenmustern kann bestimmt werden, welche Form der RFLPs vererbt wurden. Bisher sind eine ganze Reihe von RFLPs bekannt, jedes verbunden mit einem korrespondierendem Restriktionsenzym. 1st das zu untersuchende Gen mit einem RFLP-Bereich verbunden (,,linked") oder enthalt ihn sogar, kann mit dem entsprechenden Restriktionsenzym nach ihm geforscht werden. Eine zweite Klasse von Markern basiert auf chromosomalen Eigenarten, die als Mikrosatelliten [.57,.58,59] bekannt sind. Es handelt sich hier um DNA-Bereiche, in denen bestimmte Nukleotidmuster permanent wiederholt werden. Die Lange dieser ,,Repeats" ist polymorph, z.B. kann ein Allel die Sequenz {ATCAA [GT]20ATGCT) besitzen, wahrend das zweite Allel die Sequenz { ATCAA [GTI2,ATGCT) tragt. Sind die beiden flankierenden Sequenzen des Mikrosatelli-
6 DNA-Frugmentgro/3enbestimrnung und Quuntifizierung
111
ten (z. B. hier ATCAA und ATGCT) bekannt, ist es leicht, mit Hilfe der entsprechenden Primer und der PCR Millionen von Kopien dieses Bereichs herzustellen. Nach der elektrophoretischen Auftrennung der Fragmente kann bestimmt werden, oh die lange oder die kurze Form des Mikrosatelliten auf die Nachkommen weitergegeben wurde. Damit ist auch eindeutig, welche Kopie des entsprechenden ,,gekoppelten" Gens vererbt wurde. Mikrosatelliten zeigen eine hohere Heterozygotie als RFLPs und werden in Zukunft eine immer grorjere Bedeutung gewinnen. Um einen neuen Marker zu finden, wird eine DNA-Genbank mit einem synthetischen Oligonukleotid, das eine spezifische Sonde (z. B. [CA]10) darstellt, untersucht. Von den positiven Klonen werden Kulturen angelegt und die daraus extrahierte DNA anschlierjend sequenziert [58]. Die flankierenden Sequenzen der Repeats werden als Template fur die Synthese von markierten Primern benutzt. Mit einer kleinen Gruppe von unverwandten Personen werden mit diesen Primern PCR-Reaktionen durchgefuhrt. Somit wird spezifisch der ,,Repeat"Bereich amplifiziert. 1st eine ausreichende allelische Variation vorhanden, spricht man von einem neuen genetischen Marker. Man nimmt an, da es his zu 500000 verschiedene Mikrosatelliten gibt, die uber das gesamte Genom verteilt sind. Der geschatzte Abstand zwischen zwei Mikrosatelliten betragt etwa 7000 bp. Die Wahrscheinlichkeit, da13 ein Gen von ungefahr 1000 000 bp mehrere polymorphe Marker enthalt, ist deshalb grol3 [60]. Um genetische Karten zu erstellen, mu13 das entsprechende genetische Ausgangsmaterial vorhanden sein. Man benotigt gute Referenzfamilien, d. h. Gruppen von miteinander verwandten, aber genetisch etwas unterschiedlichen Individuen. Die DNA von drei Generationen mu13 dabei vorliegen. Neben dem genetischen Material sollten Informationen uber den Verwandtschaftsgrad der einzelnen Individuen zur Verfugung stehen, um entsprechende Kartierungsstudien durchfuhren zu konnen. Des weiteren sind Angaben uber die Phanotypen von aul3erster Wichtigkeit. Nur dann sind die Vererbungen von bestimmten Merkmalen zu erkennen und die Identifizierungen der verantwortlichen Gene moglich. Das Erstellen einer genetischen Karte ist nur ein Ziel bei den Kartierungsarbeiten. Ein weiteres wichtiges Ziel ist die Entwicklung einer physikalischen Karte [61]. Diese Art von Karte zeigt die genaue Lokalisation von Genen und Markern auf den spezifischen Chromosomen und somit auch ihre chemische Struktur. Unter dem Mikroskop betrachtet sind physikalische Karten nichts weiter als ein Muster von hellen und dunklen Banden auf den Chromosomen. Die hochste Auflosungsstufe der physikalischen Karten zeigt die genaue Basenzusammensetzung der DNA. Techniken zum Erreichen beider Auflosungsstufen sind bekannt, aber beide sind limitiert, denn sie stellen zwei Extreme des Spektrums dar. Hierbei stellt sich folgender Vergleich: Die Aufgabe besteht darin, den Ort einer Festveranstaltung zu finden. Als Kartenmaterial stehen einem aber nur ein Satellitenphoto der Erde und der Grundrirj des Gastgeberhauses zu Verfugung. Glucklicherweise gibt es mittlerweile bestimmte Techniken, die es erlauben, die mittlere Auflosungsstufe zu erkennen, in dem obigen Beispiel Staaten- und Stadtkarten. Hierzu zahlt die ,,Zn-situ-Hybridisierung". Die DNA von Interesse
112
Dagmar Schuster
wird radioaktiv oder rnit Hilfe von Fluoreszenzfarbstoffen (FISH) markiert 162, 631. Sie dient als Sonde fur die Hybridisierung von Zellen, die so in der Mitose blockiert wurden, da jedes Chromosom im Lichtmikroskop einzeln erkennbar ist. Dann wendet man die Autoradiographie in Verbindung rnit der Chromosomenfarbung an, so dalj sich direkt erkennen laBt, rnit welcher Bande auf welchem Chromosom die Sonde hybridisiert hat. Diese Technik verrat nicht nur, auf welchem Chromosom ein Gen liegt, sondern bestimmt aurjerdem noch den genauen Ort. Wichtige Stellen der physikalischen Karten sind die RFLPs. Viele dieser Stellen wurden ebenfalls in den genetischen Karten identifiziert. Mit Hilfe der RFLPs kann somit eine Verbindung zwischen beiden Karten hergestellt werden, um zu einem detaillierten Gesamtbild zu kommen. Konventionelle Autoradiogramme haben ihre Limitierungen im Durchsatz und in der hohen Fehlerrate beim Lesen der Filme. Hunderttausende von Genotypen mussen bei ,,Linkage"-Projekten untersucht werden, so dalj die Automatisierung einen erheblichen Zeitvorteil gewahrleistet. Um ausgedehnte genetische Kartierungsarbeiten vom humanen Genom durchfuhren zu konnen, gibt es mittlerweile kommerziell erhaltliche MikrosatellitenMarker [64]. Das ,,ABI PRISM Linkage Mapping Set" enthalt uber 375 Marker, die in 28 ,,Panels" aufgeteilt sind. Mit diesem ,,Kit" ist es moglich geworden, innerhalb eines sehr kurzen Zeitabschnitts Gene, die fur gewisse Krankheiten codieren, zu lokalisieren [65, 66, 671. Die Halfte der Primer ist fluoreszenzmarkiert, so dal3 die Analyse mit Hilfe eines automatischen Sequenzers durchgefuhrt werden kann. Die Amplifikate entsprechen zum Teil der Kopplungskarte (,,Linkage map"), die von Genethon (Paris) entwickelt wurde [45, 501. Die Marker unterlagen folgenden Kriterien: Zuverlassigkeit in der PCR-Reaktion und hohe Heterozygotie. Alle 22 Autosome und das X-Chromosom werden durch die Marker abgedeckt. Die durchschnittliche Entfernung zwischen zwei benachbarten Markern liegt bei 10 cM. Damit ist eine sehr hohe Auflosung garantiert. Nur 4% des Genoms werden durch Marker abgedeckt, die 20 cM auseinander liegen. Jedes ,,Panel" besitzt 9 bis 17 fluoreszenzmarkierte Primer-Paare (Abb. 13). Die daraus resultierenden PCR-Produkte konnen in einer Spur auf dem Polyacrylamidgel aufgetragen werden. Uberlappende Fragmente konnen detektiert werden, da sie unterschiedliche Fluoreszenzfarbstoffe tragen: HEX (Gelb), TET (Grn) und FAM (blau). Der vierte Farbstoff TAMRA (rot) wird zur Markierung des internen Langenstandards eingesetzt. Mit Hilfe einer speziellen Software (672 GeneScanTM)kann eine exakte GroBenbestimmung der Allele durchgefuhrt werden. Panel 21 besitzt 13 Primer-Paare, die die Chromosomen 15 und 16 abdecken. 5Primer sind rnit dem blauen (FAM) Farbstoff und 4 jeweils rnit dem gelben (HEX) und grunen (TET) Farbstoff markiert. Die genomische DNA von CEPH 884 wurde amplifiziert. Die 13 verschiedenen Amplifikate wurden in einer Spur elektrophoretisch aufgetrennt und sind in einem Chromatogramm zu sehen. Als internen Langenstandard wurde GeneScan 350 (TAMRA) eingesetzt (rot). Aufgrund der verschiedenen Farben sind auch Fragmente gleicher GroBe auswertbar.
6 DNA-Fragmentgrofienbestimmung und Quantifizierung
113
Darstellung der Chromatogramme: Anstelle eines einzigen Chromatogramms kann auch jede Farbe in einem eigenen Chromatogramm dargestellt werden. Die PCR-Produkte aus einer Spur werden in die vier Farben bildlich zerlegt. Diese Darstellung vereinfacht die Auswertung.
I(FAM) markierte Primer (HEX) markierte Primer
I(TET) markierte Primer
Abb. 13. ,,Panel 21" des ABI PRISM Linkage Mapping Set.
6.9 STR-Analysen in der forensischen Spurenkunde Die Personenidentifizierung mit Hilfe der DNA-Analyse hat in den letzten neun Jahren immer mehr an Bedeutung hinzugewonnen. Die PCR-Technologie ermoglicht die Amplifizierung von Satelliten-DNA [68], die in unterschiedlichen Anzahlen sich wiederholender Basenreihenfolgen (repetitiver Motive) vorliegen und somit fur jeden Menschen einen genetischen Fingerabdruck darstellen [69, 701. Der genetische Fingerabdruck ist mittlerweile vor Gericht anerkannt. Ein groSer Abschnitt des humanen Genoms (ca. 25%) besteht aus repetitiven Sequenzen, deren eigener polymorpher Charakter die Genbanken mit Informationen fur die klinische Diagnose und die forensische Spurenkunde versorgt.
1 14
Dagrmr Schirster
Diese Abschnitte werden auch VNTR-Loci (,,Variable Number of Tandem Repeats") genannt. Sie zeichnen sich durch unterschiedliche Langen der Allele aus. Es gibt zwei Klassen von VNTR-Systemen: RFLP (,,Restriction Fragment Length Polymorphism") und AmpFLP [,,Amplified Fragment Length Polymorphism"]. RFLP-DNA 1711 umfaBt Fragrnente in einem Bereich von 1-20 kb. Die genomische DNA wird rnit spezifischen Restriktionsenzymen verdaut. Die einzelnen Fragmente werden elektrophoretisch rnit Hilfe von Agarosegelen aufgetrennt und dann auf Nylonmembranen 1721 transferiert (Southern Blot). AnschlieBend werden die Filter rnit locusspezifischen radioaktiv markierten DNA-Sonden hybridisiert. Obwohl diese Methode einen hohen Diskriminierungsgrad (Wahrscheinlichkeit, rnit der in einem gegebenen System zwei unverwandte Individuen unterschieden werden konnen) aufweist, sind doch erhebliche Limitierungen vorhanden. Relativ groBe Mengen (50-500 ng) von nichtdegradierter genomischer DNA sind notwendig. Des weiteren ist die Technologie sehr zeitaufwendig und laBt sich schlecht automatisieren. Aus diesem Grund wird die zweite Klasse von VNTR-Systemen AmpFLP immer wichtiger [73, 74, 7.5, 76,771. In dieser Klasse unterscheidet man zwischen den Mikrosatelliten oder STRs (Short Tandem Repeats) und den Minisatelliten oder AmpFLP (long repeats). Bei den STRs sind die Langen der repetitiven Motive sehr kurz (2-5 bp Monomere), bei den Minisatelliten liegen repetitive Sequenzen von 15-70 bp vor. Die bekanntesten STR-Systeme sind THOI, FES and SE33, die der AmpFLPs, DlS80 und ApoB [78]. Diese Art der DNA-Typisierung zeigt gegenuber der RFLP-Methode einige Vorteile. Es werden nur geringe Mengen an DNA benotigt, da rnit Hilfe der PCR der entsprechende Locus vervielfaltigt wird. Gleichzeitig sind auch Ergebnisse rnit degradierter DNA moglich, da die Fragmentlangen in der Regel zwischen 100400 bp liegen. Des weiteren sind sie gleichmaflig uber das gesamte Genom verteilt und haufig vorhanden 1791. Sie sind in der Anzahl ihrer Repeats hoch polyrnorph und somit informativ. Die Durchfuhrung der Analyse ist einfach, da nur spezifische Oligonukleotide fur die Amplifizierung der entsprechenden Loci hergestellt werden mussen. Somit steht auch einer automatischen Anwendung nichts entgegen. Dazu rnussen fluoreszenzmarkierte repetitive PCR-Produkte generiert werden. Durch den Einsatz von vier Fluoreszenzfarbstoffen konnen verschiedene STR-Systeme in einer einzelnen Spur untersucht werden (Multiplexanalyse). Eine Probe kann durch drei verschiedene STR-Systeme bestimmt werden, wobei jedes System durch eine andere Farbe reprasentiert wird (Abb. 14). Bis zu 15 Loci pro Spur sind moglich, wenn die Fragmente einer Farbe in ihrer Lange nicht uberlappend sind. Die Fragmentlangen unterschiedlicher Farben konnen allerdings uberlappend sein. Die vierte Farbe wird zur Markierung des internen Langenstandards eingesetzt. Daraus resultiert eine gesteigerte Genauigkeit der Langenbestimmung der verschiedenen Allele (Abb. 15) und ein erheblich erhohter Durchsatz [12, 13, 78, 791.
6 DNA-Frugmentgrofienbestirnmung und Quuntifizierung
115
Die ,,GeneScanTM"-Software erlaubt verschiedene Darstellungsmoglichkeiten (Gel, Chromatogramm, Tabelle). Das Gelbild zeigt Mikrosatelliten-Allele von sechs verschiedenen polymorphen Loci von 5 Personen. Sechs fluoreszenzmarkierte und sechs unmarkierte Primer wurden fur die spezifische Amplifikation der sechs Loci eingesetzt. TAMRA(ge1b)-markierte Primer wurden fur die Systeme APOA2, D17S250 und D4S174 benutzt, FAM(b1au)-markierte Primer fur die Loci D13S71 und HUMTNFAB und ein Hex (grun)-markierter Primer fur HUMTHOl . Ein fluoreszenzmarkierter (rot) interner Langenstandard Gelbild mtt 4 F a -
%
I
Abb. 14. Mikrosatelliten-Allele einer fiinfkopfigen Familie.
.
I-.."
116
Dagmar Schuster
(Genescan 2500 ROX) wurde in jeder Spur mitaufgetragen, um Spur-zu-SpurVariationen auszuschliel3en und ein prazises ,,Size Calling" zu garantieren. Die PCR wurde rnit 26 Zyklen durchgefuhrt. Die Amplifikate wurden auf ein 36 cm, 4,75 % denaturierendes Polyacrylamidgel aufgetragen und fur 3 Stunden bei 1200 V auf dem ABI DNA-Sequenzer elektrophoretisch aufgetrennt und rnit Hilfe der ,,672 GeneScanTM"-Analysesoftware automatisch analysiert. Darstellung der Chromatogramme: Die ,,GeneScanTM"-Softwarezeigt nur die selektierten TAMRA(ge1b)-markierten Mikrosatelliten an. Die Abbildung demonstriert, wie komplizierte Gelmuster aufgrund der Stotterbanden mit Hilfe der Software dargestellt werden konnen (markierten Bereiche des Gelbildes). Die Daten werden in Chromatogrammen gezeigt. Das Zoomen der einzelnen Bereiche ist moglich. X- und Y-Achse konnen entsprechend verandert werden. Die Allelpeaks sind markiert. Die kleineren Peaks sind Stotterbanden, die eine Interpretation erschweren. Die GroBen der Allelpeaks sind im Chromatogramm angezeigt. Das Bild in ,,lane 4" ist charakteristisch fur zwei Allele, die nur 2 bp auseinanderliegen. Der erste Allelpeak ist wesentlich hoher als der zweite Allelpeak. Die Stotterbande fur das Allel 188,63 bp wurde zum Allel 186,68 bp dazu addiert. Die Proben der drei Individuen wurden in separaten Spuren des gleichen Gels aufgetragen. Die Langenbestimmung jeder Bande erfolgt mit Hilfe des internen Langenstandards, der in jeder Spur mitlauft. Alle Fragmente wurden rnit dem grunen Farbstoff (HEX) markiert. Die Analysesoftware ist in der Lage jede einG r o k (bp) 18
85
88
0:
98
i0:
1
:
g
:i30
09
800
ii A00
3 Spur 5: Mutter - DlS103
H Spur& Vater - DlS103
H Spur 7: Sohn - DlS103 Abb. 15. Langenbestimmung der PCR-Produkte des DlS103 Locus einer Familie rnit einem Kind [12].
6 DNA-Fragrnentgroflenbestirnrnungund Quantifizierung
117
zelne Probe in einer anderen Farbe wiedergeben, so dal3 alle Fragmente in einem Chromatogramm dargestellt und miteinander verglichen werden konnen. Mutter - DlS103 rot, Vater - DlS103 grun und Sohn - DlS103 blau. Die Allelpeaks der Mutter zeigen eine Lange von 87 und 99 Nukleotiden. Davor liegen kleinere Peaks (83, 85,95,97 Nukleotide), die in der Signalintensitat um die Halfte reduziert sind. Die sogenannten Stotterbanden sind durch einen ,,Slippageeffekt" der Tuq-DNA-Polymerase bei den Dinukleotidrepeats zu erklaren (Verlust von Dinukleotiden wahrend der Amplifikation von Repeats). Beim Vater (griin) liegen die beiden Allelpeaks nur 2 bp voneinander entfernt, und somit ist der erste Allelpeak wesentlich hoher als der zweite. Die Stotterbande des zweiten Allelpeaks liegt unter dem ersten Allelpeak. Das Kind (blau) besitzt, wie erwartet, jeweils einen Allelpeak der Mutter und einen des Vaters. Die Langen sind 91 und 99 Nukleotide.
6.10 Automatische genetische Analyse in der Landwirtschaft Der standig steigende Bedarf an Nahrungsmitteln und anderen landwirtschaftlichen Produkten rechtfertigt eine aufwendige Forschung iiber die Anwendungsmoglichkeiten der genetischen Analyse in der Landwirtschaft. Mit Hilfe von Genkarten und DNA-Markern ist es moglich geworden, sehr fruhzeitig in der Tier- und Pflanzenzuchtung entsprechende Auswahlkriterien zu treffen [SO, 811 und die Zuchtung nunmehr nicht mehr anhand des Phanotyps, sondern gezielt iiber den Genotyp durchzufiihren. Dies sol1 am Beispiel der Tierzucht etwas naher erlautert werden: 1st das Gen, das zu bestimmten Krankheiten fuhrt, bekannt, konnen neugeborene Tiere daraufhin untersucht werden. Tragen sie die ungunstigen genetischen Merkmale, ohne da die phanotypischen Merkmale bisher sichtbar sind, ist eine Auswahl moglich. Diese Tiere werden fur die weitere Zucht nicht mehr verwendet. Damit ist eine effiziente und schnelle Selektion von guten Merkmalen moglich, wahrend die ungunstigen eliminiert werden. Damit kann erheblich an Kosten und Zeit gespart werden. WeiB man, wo die entsprechenden Gene zu finden sind, kennt man auch bald ihre Sequenzen und ihre Funktionen in der Zelle. Neue Techniken konnen entwickelt werden, um positive Merkmale zu fordern und negative zu reduzieren oder Wege zu finden, die entsprechenden genetischen Merkmale zu modifizieren. Detaillierte Kartierungsstudien von allen Zuchttieren wurde die Menschheit einem Ziel naherbringen: Die Verbesserung der Qualitat und Quantitat der globalen Nahrungsversorgung. Die Zuchter waren in der Lage, gesundere, hoherwertige Tiere zu einem niedrigeren Preis zu produzieren. Ein Ziel ist z.B., einen Bluttest fur Schweine zu entwickeln, in denen Gene identifiziert werden, die fur die Resistenz gegeniiber bestimmten Krankheiten
I 1X
Dagmar Scliitster
codieren. Zuerst muB der Phanotyp der kranken und der resistenten Tiere genaustens beschrieben sein. Danach legt man eine Population an. Die Verwandtschaftsverhaltnisse der Tiere mussen genaustens bekannt sein, und einige mussen das Resistenzgen besitzen. Die Population wird uber mehrere Generationen beobachtet. Jedes neue Tier wird untersucht. Tragt es das wunschenswerte Merkma1 oder nicht? Sobald ein adaquater ,,Familienstammbaum" vorliegt, der aussagt, welches Schwcin resistent gegenuber der Krankheit ist und welches nicht, beginnt die Suchc nach dem genetischen Marker, dessen Vererbungsmuster auf das entsprechende Merkmal pa13t. Bisher sind 100 Gene und 700 Mikrosatellitenmarker vom Gcnom des Schweins bekannt. Somit mu13 jedes Tier innerhalb der Population mit mehreren Hunderten von Markern getestet werden, um das Vererbungsmustcr der Marker zu verstehen. Findet man einen Marker, der das gleiche Vererbungsmuster wie das Resistenzmerkmal tragt, kann das als Basis fur weitere Labortests angesehen werden. Mit Hilfe einer einfachen Blut- oder Gewebsprobe kann dann bestimmt werden. ob das Tier das zu fordernde Merkmal tragt oder nicht. Dem Tierzuchter ermoglicht das eine fruhzeitige Auswahl. Die Tiere mit den gunstigen Merkmalen werden fur die weitere Zucht zuruckgehalten. Tiere mit den ungunstigen Merkmalen sind fur den Markt bestimmt. Es konnten schon erste Erfolgc gcerntet werden [82]. Ein Beispiel hierfur ist dcr Test auf das maligne Hyperthermie-Syndrom beim Schwein (MHS). Tiere, die unter MHS lciden, sterben haufig wahrend eines Tiertransports oder in der Schlachthalle, so daB sie fur den Markt nicht mehr verwendet werden konnen oder dic Qualitat des Fleischs stark herabgesetzt ist. Das bedeutet naturlich crhebliche Verluste fur den Zuchter. Bis vor kurzem konnte man MHS vor dem Auftauchen der ersten Symptome nur durch eine Narkose der Tiere feststcllen. Da die Krankheit abcr nur bei Tieren auftritt, die das MHS-Gen von beiden Eltcrnteilen vererbt bekommen haben. konnte man nicht diejenigen detektieren, die das defekte Gen auf nur einem Chromosom besitzen. Das macht es nahezu unmoglich, das Gen aus einer Zuchtpopulation zu eliminieren. In den letzten Jahren wurde von Wissenschaftlern der Universitaten von Minncsota und Canadian die genetische Mutation gefunden, die zu MHS fuhrt. Dadurch konnte ein Bluttest entwickelt werden, der es erlaubt, die Tiere, welche die Mutation tragen, zu detektieren. Seit 1990 wurden Tausende von Blutproben getcstct und somit der allgemeine Profit gesteigert. Zur Zeit versuchen Wissenschaftler, weitere Gene zu lokalisieren. Der Haupthistokompatibilitats-Komplex (,,MHC-Major Histocompatibility Complex") besteht aus einer Reihe von verwandten Genen. Die meisten T-Zellen erkennen fremde Antigene nur, wcnn diese auf der Oberflache einer anderen Zelle mit einem Membran-Glycoprotein assoziiert sind, das von Genen des MHC codiert wird. Sie helfen somit dem Korpcr, zwischen eigenen Zellen, die geschutzt werden mussen, und Fremdzellen (Bakterien usw.), die vernichtet werden sollen, zu unterscheiden. Dieser Genkomplex ist somit der Schlussel zur Steigerung der Resistenz gegenuber Krankheiten. Er liegt bei den Schweinen auf Chromosom 7. Durch die Identifizierung
6 DNA-Fragmentgro@nbestirnmung und Quanrifizierung
119
geeigneter Marker verspricht man sich eine genetische Verbesserung, um somit hochresistente Schweine zu zuchten. Das unmittelbare Ziel der Genomforscher (NAGRP - National Animal Genome Research Program; European Community PIGMaP - Mapping the Pig Genome und BovMap - Mapping the Bovine Genome) ist, eine detaillierte und komplette genetische und physikalische Karte fur okonomisch wichtige Gene zu besitzen. Damit besitzen die Zuchter die Moglichkeit, bestimmte Merkmale, die sie fur wichtig erachten, zu fordern und andere zu unterdrucken. Diese Karte wurde folgende Vorteile bieten:
0
Die Verwaltung der Tiere basierend auf der Kenntnis ihres unterschiedlichen genetischen Potentials. Die Auslese der Tiere in einem sehr jungen Alter. Das reduziert Produktionskosten und steigert die wirtschaftliche Profitabilitat. Genetische Krankheiten werden mehr und mehr aus den Populationen eliminiert. Der Einsatz von Medikamenten zur Steigerung der Resistenz gegenuber bestimmten Krankheiten wird reduziert. Der Gebrauch von exogenen Wachstumspromotoren wird reduziert.
Vom Standpunkt der Genkartierung wird ein ideales Merkmal nur von einem einzigen Gen ausgelost. Nur sieht die Realitat leider anders aus. Viele Charakteristika, wie z. B. Wachstum und Fleisch-Qualitat (z. B. Muskelfasern und Muskelmasse) werden durch das Zusammenspiel vieler Gene bestimmt. Diese Gene werden als QTL (,,Quantitative Trait Loci") bezeichnet, da sie die zur Vererbung wirtschaftlich bedeutsamen Merkmale beinhalten. Die Zukunft liegt in der Verknupfung dieser neuen Technologien mit traditionellen Zuchtungsmethoden und einem internationalem Datenubertragungssystem. Die genetischen Informationen werden weltweit signifikant ansteigen, so dal3 die Quantitat und auch Qualitat der Fleischproduktion wachsen wird. Man schutzt, in ca. 3 Jahren mehrere Bluttests anbieten zu konnen, die auf Kartierungsergebnissen aufbauen. Mittlerweile gibt es schon eine Reihe von kommerziell erhaltlichen Kits, die die Amplifizierung von bestimmten Mikrosatelliten-Loci garantieren. Damit lassen sich Vaterschaftstests bei den entsprechenden Tieren durchfuhren (Rinder, Pferde, Hunde). Vaterschaftstests sind die notwendige Voraussetzung, um genaue Stammbaumanalysen zu garantieren. Des weiteren konnen die Mikrosatelliten Referenzmarker darstellen und zum Auffinden von QTLs eingesetzt werden. ,,StockMarksTM"fur Rinder ist das erste kommerzielle PCR-Marker-Kit, das in Verbindung mit automatischen DNA-Technologien in der selektiven Tierzucht eingesetzt werden kann [83, 841. Der Kit enthalt 11 fluoreszenzmarkierte und 1 1 unmarkierte Primer (Tab. 6-2). Nach der Durchfuhrung einer PCR-Reaktion liegen als Marker Mikrosatelliten-Loci mit 2 bp ,,Repeats" vor. Die PCR-Bedingungen wurden so eingestellt, da eine Multiplex-PCR moglich ist (2 Quadruplex und 1 Triplex-Reaktion).
120
Dagrnar Schuster
Die Elektrophorese kann mit Hilfe von automatischen Systemen in einer Spur durchgefuhrt werden. Dadurch erhoht sich der tagliche Durchsatz enorm, was gerade bei groljen Kartierungsprojekten von Vorteil ist. Der Zusatz eines internen Langenstandards garantiert eine exakte Langenbestimmung. Die Analysesoftwarepakete ,,GeneScanTM"und ,,GenotyperTM"vereinfachen die Auswertung. Wahrend die ,,GeneScanTM"-Softwareeine exakte Langenbestimmung garantiert, ist mit Hilfe des Genotypers eine automatische Allelzuordnung moglich. Es werden drei unterschiedliche Fluoreszenzfarbstoffe fur die Primer-Markierung eingesetzt (Tab. 2): FAM (blau), HEX (gelb) und TET (grun). Die Mikrosatelliten-Loci wurden aufgrund ihrer Heterozygotie ausgewahlt. Die Auswertung der kombinierten Mikrosatelliten ergibt einen sehr hohen Genauigkeitsgrad. Tab. 2. Die Marker des ,,StockMarks" Kit
Marker
Farbstoff
Farbe
Allelgr6Be
Chromosom
Welche Moglichkeiten genetische Manipulationen an Pflanzenzellen eroffnen, wird durch die jungsten Erfolge, vor allem in Speziallabors, deutlich. Gegenwartig arbeiten mehrere Laboratorien an der Entwicklung landwirtschaftlich nutzbarer Mikroorganismen und an der gezielten Veranderung von Nutzpflanzen [85, 861. Wie revolutionar diese Forschung ist, kann man am besten daran erkennen, da diese Labors zum groljten Teil erst in den letzten zehn Jahren eingerichtet wurden. Wie lassen sich mikrobiologische Methoden in der traditionellen Landwirtschaft konkret anwenden? Hier gibt es im wesentlichen drei Verfahren. Erstens ware es moglich, Mikroorganismen, die sich fur bestimmte Pflanzen als nutzlich erweisen, in Fermentern zu zuchten und spater dem Boden zuzufuhren. Zum zweiten konnte man einzelne Pflanzenzellen isolieren, in einer Nahrlosung groljziehen und die Zellkulturen zur Mutationsbildung anregen. Unter den entstehenden Mutantenstammen wurde man die geeignetsten auswahlen und weiterverwenden. Eine dritte Strategie besteht darin, fremdes Erbmaterial auf Pflanzenzellen zu ubertragen.
6 DNA-FragmentgroJ3enbestimmung und Quantijizierung
121
Isogene Pflanzenarten unterscheiden sich haufig in komplexen und quantitativen Merkmalen, die durch das Zusammenspiel vieler Gene auftreten. Diese Polymorphismen lassen sich leicht durch die RAPD (,,Randomly Amplified Polymorphic DNA") PCR-Analyse detektieren (Abb. 16). Diese Technik setzt keine genauen Kenntnisse der zu untersuchenden genomischen DNA voraus. Kurze (10 bp) Primer mit willkurlichen Sequenzen binden an verschiedenen Stellen des Genoms [87]. Uberall dort, wo sich ein Paar der RAPD-Primer an den komplementaren Strangen anlagern kann, wird ein Amplifikat gebildet. Die Produkte werden auf ein Gel aufgetragen und elektrophoretisch aufgetrennt. Jede Pflanze zeigt ein ganz spezifisches Fragmentmuster, so darj man von einem Fingerabdruck des Genoms sprechen kann. Vergleicht man die verschiedenen Bandenmuster der einzelnen Pflanzen miteinander, so werden sie sich durch einige zusatzliche oder fehlende Banden unterscheiden. Der Polymorphismus zeigt sich durch das Fehlen oder das Vorhandensein von Banden, die in der Nahe des Gens liegen, das fur das zu untersuchende Merkmal von Bedeutung ist. RAPD-Polymorphismen erlauben somit wichtige Merkmale uber Generationen zu verfolgen, ohne da man die genaue Lokalisation oder Sequenz des entsprechenden Gens kennt. Mit Hilfe von DNA-Fingerabdrucken kann man aufgrund des Sequenzpolymorphismus zwischen sehr ahnlichen Genomen unterscheiden. Das Genom A hat eine Primer-Bindungsstelle (gekennzeichnet durch einen Stern) mehr als das Genom B. Im Genom A konnen beide RAPD-Primer binden, und ein Amplifikat entsteht. Im Genom B kann aufgrund einer genetischen Mutation nur ein Primer
Abb. 16. Die Zeichnung illustriert die RAPD-PCR-Analyse.
122
Dugrnur Schicsrer
binden, worauf kein PCR-Produkt gebildet werden kann. An anderen Stellen werden die gleichen PCR-Fragmente gebildet, da jeweils beide Primer binden konnen. Nach der PCR und Gelelektrophorese zeigt das Genom A ein Fragment mehr als das Genom B, und damit lassen sich die beiden Genome voneinander unterscheiden. Genome, die sich nur durch kleine Sequenzunterschiede voneinander differenzieren, konnen detektiert werden, selbst dann, wenn man die genauen Stellen im Genom nicht kennt. Zu den gefahrlichsten Krankheiten der Getreidesorten zahlt der Mehltau. Automatische RAPD-PCR-Analysen wurden mit Gerstensorten durchgefuhrt, die sich lediglich in ihrer Resistenz gegen Mehltau unterscheiden. Ein 610-bp-Fragment ist mit der Mehltauresistenz der Gerste gekoppelt. Tritt es auf, dann zeigt die Pflanze keine Resistenz gegenuber Mehltau. Fehlt es, dann ist die Pflanze resistent (Abb. 17). 8
128
248
368
480
b80
728
048
968
1888
1288
2888 2488 2808 1b88
12.0 888 488
8
w rn 9 p . s : Y I o p b . l l k k a b d * W 9 P . 1 3 : ~ S
Abb. 17. RAPD-Polymorphismus verbunden mit der Resistenz gegeniiber Mehltau
Ein Chromatogramm der ,,GeneScanTM"-Softwaregibt die einzelnen Banden als Peaks wieder. Die roten Signale (Farbstoff ROX) zeigen die positive Kontrolle. Ein 10mer-RAPD-Primer (Y-10 von Operon Technologies, Inc.) wurde zur Amplifizierung eines Plasmid-Inserts benutzt. Die genomische DNA von zwei Gerstensorten Algerian S (grun - HEX) und Algerian R (blau - FAM) wurden ebenfalls amplifiziert. Algerian S ist anfallig gegenuber Mehltau, wahrend Algerian R eine Resistenz zeigt. Algerian S zeigt zwei Hauptpeaks bei 480 und 610 nt sowie eine schwache Bande bei 825 nt. Die positive Kontrolle zeigt ebenfalls eine Bande bei 610 nt, wahrend sie bei Algerian R fehlt. Die Bande bei 610 nt ist somit ein Marker fur die Mehltauresistenz. Mit Hilfe der Software werden die einzelnen verschiedenfarbig markierten Bandenmuster direkt ubereinandergelegt, so daR unterschiedliche Polymorphismen sehr schnell und einfach erkannt werden konnen.
6 DNA-Fragmentgroflenbestimrnung und Quantifizierung
123
6.11 Literatur [1] Smith, H.O., Nathans, D., ,,A suggested nomenclature for bacterial host modification and restriction systems and their enzymes" J. Mol. Biol. 81 (1973). 419423. [2] Southern, E. ,,Gel Electrophoresis of restriction fragments" Methods Enzymol. 68 (1980), 152-191. [3] Maniatis, T. et al., ,,Chain length determination of small double- and single-stranded DNA molecules by polyacrylamide gel electrophoresis" Biochemistry 14 (1975), 3787-3794. [4] Connell, C. et al., ,,Automated DNA Sequence Analysis" Biotechniques 5 (1987), 342-348. [S] McBride, L.J., O'Neill, M.D., ,,Automated analysis of mutations responsible for genetic diseases in humans" American Laboratory (1991). [6] Hunkapiller, T. et al., ,,Chain length determination by capillary electrophoresis" Science 254 (1991), 59-67. [7] Theisen, P.et al., ,,Fluorescent Dye Labeling of Oligonucleotides via Phosphoramidite Chemistry'' Tetrahedron Lett. 33 ( 1992), 5033-5036. [8] Voss, H. et. al., ,,A new procedure for automated DNA sequencing with multiple internal labelling by fluorescent dUTP" Methods Mol. Cell Biol. 3 (1992), 30-34. [9] Mansfield E.S., Kronick M.N., ,,Alternative Labeling Techniques for Automated Fluorescence Based Analysis of PCR Products" BioTechniques 15 (1993), 20-22. [lo] Mayrand, P.E. et al., ,,The use of fluorescent detection and internal lane standards to size PCR products automatically" Appl. Theor. Electrophor. 3 (1992 ), 1-1 1. [ l l ] Reed, P.W. et al., ,,Chromosome-specific microsatellite sets for fluorescence-based, semiautomated genome mapping" Nature Genet. 7 (1994 ), 390-395. [12] Ziegle, J. S. et al., ,,Application of Automated DNA Sizing Technology for Genotyping Microsatellite Loci" Genomics 14 (1992), 1026-1031. [13] Holgersson, S. et al., ,,Fluorescent-based typing of the two short tandem repeat loci HUMTHO1 and HUMACTBP2: Reproducibility of size measurements and genetic variation in the Swedish population" Electrophoresis 15 (1994), 890-895. [14] Liang, P., Pardee, B.B., ,,Differential display of eukaryotic messenger RNA means of the polymerase chain reaction" Science 257 (1992), 967-971. [15] Frye, R.A. et al., ,,Detection of amplified oncogenes by differential polymerase chain reaction'' Oncogene 4 (1989), 1153-1157. [16] Lubin, M.B. et al., ,,Precise gene dosage determination by polymerase chain reaction: theory, methodology, and statistical approach" Molecular and Cellular Probes 5 ( 1991), 307-3 17. [17] Chamberlain, J.S. et al., ,,A Guide to Methods and Applications" Academic Press (1990). 272-281. [18] Fuqua, S.A.W. et al., ,,A simple polymerase chain reaction method for detection and cloning of low-abundance transcripts" BioTechniques 9 (1990), 206-21 1. [19] Kumar, R. et al., ,,On-line fluorescent detection of asymmetrically amplified HIV-1 DNA sequences" Technique-A Journal of Methods in Cell and Molecular Biology 2 ( 1990), 101108. [20] Ottmann, M. et al., ,,The polymerase chain reaction for the detection of HIV-1 genomic RNA in plasma from infected individuals" Journal of Virological Methods 31 (1991). 273284. [21] Grompe, M., ,,The rapid detection of unknown mutations in nucleic acids" Nature Genetics 15 (1993), 34.
124
Dagmar Schuster
[22] Chamberalain, J.S. et al, ,,PCR Protocols: A Guide to Methods and Amplifications" Academic Press (1988), 272-28 1. [23] Chelly, J. et al., ,,Illegitimate transcription. Application to the analysis of truncated transcripts of the dystrophin gene in nonmuscle cultured cells from Duchenne and Becker patients" J. din. Invest. 88 (1991), 1161-1166. [24] Orita, M. et al, ,,Detection of polymorphisms of human DNA by gel electrophoresis as single-trand conformation polymorphism" Proc. Natn.Acad. Sci. U.S.A. 86 (1989), 27662770. [25] Oinsworth, P.J. et al., ,,Diagnostic single strand conformational polymorphism, SSCP]: a simplified non-radioisotopic method as applied to a Tay-Sachs Blvariant" Nucl. Acids res. 19 (1991), 405-406. [26] Yap, E.P, McCee, J.O., ,,Nonisotopic SSCP detection in PCR products by ethidium bromide staining" Trends Genet. 8 (1992), 49. [27] Michaud, J. et al., ,,Strand-separating conformational polymorhism analysis: efficacy of detection of point mutations in the human ornithine delta-aminotransferase gene" Genomics 13 (1992), 389-394. [28] Sheffield, V.C. et al., ,,Analysis of the efficiency of single base substitution detection by SSCP 1-149" Cold Spring Harbor Laboratory, New York (1992). [29] Iwahana, H., et al., ,,Detection of point mutaions by SSCP of PCR-amplified DNA after endonuclease digestion" Biotechniques 12 (1992), 64. [30] Ravnik-Glavac, M. et al., ,,Sensitivity of single-strandconformation polymorphism and eteroduplex method for mutation detection in the cystic fibrosis gene" Human Molecular Genetics 3 (1994), 801-807. [31] Nagamine, C.M. et al., ,,A PCR artifact: Generation of heterodup1exes"Am. J. hum. Genet. 45 (1989), 337-339. [32] Perry, D.J. et al., ,,Hydrolink gels: A rapid and simple approach to the detection of DNA mutations in thromboembolic disease" J. clin. Pathol. 45 (1992), 158-160. [33] White, M.B. et al., ,,Detecting single base substitutions as heteroduplex polymorphism" Genomics 12 (1992), 301-306. [34] Artlich, A. et al., ,,Recurrent 3-bp deletion at codon 255/256 of the rhodopsin gene in a German pedigree with autosomal dominant retinitis pigmentosa" Am. J. hum. Genet. 50 (1992), 876-878. [35] Gibbs, R.A., Caskey, C.T., ,,Identification and localization of mutations at the Lesch-Nyhan locus by ribonuclease A cleavage" Science 236 (1987), 303-305. [36] Myers, R.M., Larin, Z., Maniatis, T., ,,Detection of Single base substitutions by ribonuclease cleavage as mismatches in RNA:DNA duplexes" Science 230 (1985), 1242-1246. [37] Cotton, R.G. et al., ,,Reactivity of cytosine and thymine in single-base-pair mismatches with hydroxylamine and osmium tetroxide and its application to the tudy of mutations" Proc. Natn. Acad. Sci. U.S.A. 85 (1988), 4397-4401. [38] Forrest, S.M. et al., ,,Mutation detection in phenylketonuria by using chemical cleavage of mismatch: importance of using probes from both normal and patient samples" Am. J. hum. Genet. 49 (1991), 175-183. [39] Zheng, H. et al., ,,Fidelity of targeted recombination in human fibroblasts and murine embryonic stem cells" Proc. Natn. Acad. Sci. U.S.A. 88 (1991), 806778071, [40] Saleeba, J.A. et al., ,,Complete mutation detection using unlabeled chemical cleavage" Hum. Mut. 1,63-69. [41] Kilimann, M.W. et al., ,,Point mutations and polymorphisms in the human dystrophin gene identified in genomic DNA sequences amplified by multiplex PCR" Hum. Genet. 89 (1992), 253-258. [42] Haris, 1.1. et al., ,,Mutation detection by fluorescent chemical cleavage: Application to hemophilia B" PCR Methods and Appl. 3 (1994), 286-271.
6 DNA-Fragmentgrofienbestimrnung und Quantifizierung
125
[43] Sarkar, G. et al., ,,Dideoxy fingerprinting [ddF]: a rapid and effcient screen for the presence of mutations" Genomics 13 (1992), 441443. [44] Lu, A.L., Hsu, I.C., ,,Detection of single DNA base mutations with mismatch repair enzymes" Genomics 14 (1992), 249-255. [45] Buetow, K.H. et al., ,,Integrated human genome-wide maps constructed using the CEPH reference panel" Nature Genet. 6 (1994), 384-390. [46] Shows, T.B., ,,Mapping the human genome, cloned genes, DNA polymorphisms, and inherited disease"Adv. Hum. Gen. Bd. 12 (1982), 341-452. [47] Lander, E.S., Green, P., ,,Construction of multilocus genetic linkage maps in humans" Proc. Natl. Acad. Sci. USA 84 (1987), 2363-2367. [48] Helms, C. et al., ,,A comprehensive genetic linkage map of the human genome" Science 258 (1992), 67-86. [49] Mishra, S.K. et al., ,,A 2-cm genetic linkage map of human chromosome 7p that includes 47 loci" Genomics 12 (1992), 326-334. [50] Weissenbach, J. et al., ,,A second generation linkage map of the human genome" Nature 359 (1992), 794-801. [51] Jeffreys, A.J. et al., ,,DNA ,,fingerprints" and segregation analysis of multiple markers in human pedigrees" Amer. J. Hum. Genet. 36 (1986), 11-24. [52] O'Connell, P. et al., ,, A primary genetic linkage map for human chromosome 12" Genomics 1 (1987), 93-102. [53] O'Connell, P. et al., ,,Twenty-Eight loci form a continuous linkage map of markers for human chromosome 1" Genomics 4 (1989), 12-20. [54] Nie, L. et al., ,,Automated genotyping of highly polymorphic human DNA markers: Progress in multiplexing and optimal locus combination strategies" Am. J. Hum. Genet. 49 (1991), 366-367. [55] Diehl, S.R. et al., ,,Automated genotyping of human DNA polymorphisms" Am. J. Hum. Genet. 47 (1990), 177-178. [56] Soller, M., Beckmann, J.S., ,,Restriction fragment length polymorphisms and genetic improvement" 2nd World Congr. Genet. Appl. Lives. Prod. (Madrid) 6 (1982), 396404. [57] Jeffreys, A.J. et al., ,,Spontaneous mutation rates to new length alleles at tandem-repetitive hypervariable loci in human DNA" Nature (London) 332 (1988), 278-280. [58] Weber, J.L., ,,Human DNA polymorphisms based on length variations in simple-sequence tandem repeats" Genetic and Physical Mapping 1 (1990), 159-181. [59] Callen, D.F. et al., ,,Incidence and origin of ,,null" alleles in the (AC)n microsatellite markers" Am. hum. Genet. 52 (1993), 922-927. [60] Human Gene Mapping, Oxford Conference, Update to the Tenth International Workshop on Human Gene Mapping, in Cytogenetics and Cell Genetics S. Karger Medical and Scientific Publishers) New York, NY (1990). [61] Gurrieri., F. et al., ,,Physical mapping of the holoprosencephaly critical region on chromosome 7 q 3 6 Nature Genetics 3 (1993), 247-251. [62] Zhang, F.R. et al., ,,A one-step efficient and specific non-radioactive non-fluorescent method for in situ hybridization of banded chromosomes" Chromosome 99 (1990), 436-439. [63] Baumann, H. et al., ,,Interphase cytogenetics by fluorescent in situ hybridization (FISH) for characterization of monosomy-7-associated myeloid disorders" Leukemia 7 (1993) , 384391. [64] Reed, P.W. et al., ,,Chromosome-specific microsatellite sets for fluorescence-based, semiautomated genome mapping" Nature Genet. 7 (1994), 390-395. [65] NIH/CEPH Collaborative Mapping Group, ,,A comprehensive genetic linkage map of the human genome" Science 258 (1992), 67-86.
126
Dagmar Schuster
[66] Gyapay, G. et al., ,,Genethon Human Genetic Linkage Map" Nature Genet. 7 (1994), 246248. [67] Matise, T. C. et al., ,,Automated construction of genetic linkage maps using an expert system (MultiMap): a human genome linkage map" Nature Genet. 6 (19Y4), 384-390. [68] Weber, J.L., ,,Human DNA polymorphisms based on length variations in simple-sequence tandem repeats" Genetic and Physical Mapping 1 (1990), 159-181. (691 Gill, P. et al., ,,Forensic Application of DNA fingerprints" Nature 316 (1985), 76-78. [70] Henke, J., Schmitter, H., ,,DNA-Polymorphismen in forenensischen Fragestellungen" MDR 5 (1989), 404-406. [71] Jeffreyy, A.J. et al., ,,Individual specific ,,fingerprints" of human DNA" Nature 316 (1985). 76-79. [72] Southern, E.M., ,,Detection of specific sequences among DNA fragments separated by gel elctrophoresis" J. Mol. Biol. 98 (1975), 503-517. [73] Beckmann, J.S., Weber. J.L., ,,Survey of human and rat microsatellites" Genomics 12 (1Y92), 627-631. [74] Edwards, A. et al., ,,DNA typing and genetic mapping with trimeric and tetrameric tandem repeats" Am. J. Hum. Genet. 49 (1991),746-756. [75] Morral, N., Estivill, X., ,,Multiplex PCR amplification of three microsatellites within the CFTR gene" Genomics 13 (1992), 1362-1364. [76] Weber, J.L., May, P.E., ,,Abundant class of human DNA polymorphisms which can be typed using the polymerase chain reaction" Am. J. Hum.Genet. 44 (1989), 388-396. [77] Gill, P. et al., ,,Short Tandem Repeat Loci" Forensic Sci. Int., Vol. 65 (1994), 51-59. [78] Kimpton, C.P. et al., ,,Automated DNA profiling employing Multiplex Amplification of Short Tandem Repeat Loci", PCR Methods and Applications 3 (1993), 13-22. [7Y] Fregeau, C.J. et al., ,,DNATyping with fluorescently tagged short tandem repeats: a sensitive and accurate approach to human identification" Biotechniques 15 (1993), 100-1 19. [80] Beckmann, J.S., Soller, M., ,,Molecular markers in the improvement of farm animals" Biotechnology 5 (1987), 573-576. [81J Georges, M. et at., ,,DNA fingerprinting in domestic animals using four different minisatellite probes" Cytogenetic. Cell Genet. 47 (1988), 127-131. [82] Schook, L. B., ,,Mapping the Pig Genome" Minnesota Report (IYYS), 324. [83] Bishop, E. et al., ,,The cattle genome" Genetics 136 (1994), 619-639. [84] Barendse, M. et al., ,.DNA fingerprinting in cattle" Nature Genetics 6 (1994), 227-35. [SS] Barton, K. A,, Brill, W.J., ,, Prospects in Plant Genetic Engineering" Science 219 (1983), 671-676. [86] Shepard, J. F., ,,Protoplasts as Sources of Disease Resistance in Plants" Annual Review of Phytopathology 19 (1981), 145-166. [87] Williams, J. G. K. et al., ,,Randomly Amplified Polymorphic DNA" Nucleic Acids Research 18 (1990), 6531-6535.
7 Grundlagen und Entwicklung der multifluorophoren Laser-ScanningTechnologie Giinter Mertes
7.1 Einleitung DNA ist ein Makromolekul, das an einem Zucker-(Desoxyribose)-PhosphatRuckgrat die vier Basen Adenin, Cytosin, Guanin, Thymin und einige Basenderivate (z. B. methylierte Formen) tragt. Die MolekulgroBe von DNA variiert sehr stark. Die kleinsten Fragmente stellen Oligonukleotide dar, die nur einige Basen lang sind (z. B. Okazaki-Fragmente, synthetische Oligonukleotide). GroBere Fragmente finden sich z. B. in Bakterien (Plasmide, Bakteriengenom) oder als gentechnisch hergestellte Produkte wie Cosmide oder YACs (Yeast Artificial Chromosomes, d. h. kunstliche Hefechromosomen) oder als ganze Genombausteine wie Chromosomen. Diese liegen im GroBenbereich von Megabasen (lo9). Die Notwendigkeit der qualitativen und quantitativen Analyse von DNA in unterschiedlichsten Untersuchungen fuhrte zur Entwicklung vieler Nachweisverfahren fur dieses Makromolekul. Abhangig von der jeweiligen MolekulgroBe, dem verfugbaren Nachweismedium (z. B. Gel, Losung, Kapillare), den Markierungsmethoden (s. 5.4) und den Detektionsverfahren unterscheiden sich die Analysetechniken sehr stark. Neuerungen auf einem der genannten Gebiete bringen wiederum neue Analyseansatze hervor. Im folgenden werden die wichtigsten Verfahren vorgestellt, die bei der Analyse von kleineren DNA-Fragmenten benutzt werden. Dabei sollen die historische Entwicklung der Methoden und die ,,State-of-the-Art"-DNA-Analyseverfahren sowie deren Perspektiven aufgezeigt werden.
7.2 Die Ausgangssituation: Monomarkersysteme auf der Basis radioaktiver Nuklide oder einzelner Fluorochrome zur Detektion von DNAFragmenten Die Entschlusselung der chemischen Struktur der DNA setzte cine ganze Kaskade von Untersuchungen in Gang, die die Organisation des Erbguts sowohl auf
128
Giinter Mertes
raumlicher Ebene (Spiralisierung, Euchromatin, Heterochromatin) als auch auf Regulationsniveau (Genstruktur, Genregulation etc.) darzustellen suchte. Die direkte Untersuchung der verschiedenen DNA-Molekule in bezug auf ihre Menge, GroBe (Fragmentanalyse) und Basenzusammensetzung (Sequenzierung) wurde zu Beginn dieser Forschung uber die Einfuhrung eines einzigen Markers durchgefuhrt. Dieser methodische Ansatz wird im folgenden ,,Monomarkersystem" genannt. Die Untersuchung der DNA aufgrund ihrer spektralen Eigenschaften (maximale Absorption bei 260 nm) wird in diesem Kapitel nicht weiter behandelt, da diese Methode ausschliefllich zur Quantifizierung und Reinheitsbestimmung der DNA eingesetzt wird. Die Reinheitsbestimmung der DNA ist die Voraussetzung fur die sich daran anschlieBenden DNA-analytischen Experimente, die im folgenden unter den Aspekten Markierung (s. 5.4) und Detektion besprochen werden.
7.2.1 Radioaktivitat Die ersten DNA-Analyseverfahren wurden in Anlehnung an die Erkenntnisse auf dem Gebiet der Nuklearforschung und der enzymatischen Modifizierbarkeit von Nukleinsauren entwickelt (Nick-Translation, Random-Labeling). Radioaktiv markierte Sonden konnten z. B. in Southern-Blot-Analysen eingesetzt werden. Ebenso fanden Radionuklide in der DNA-Sequenzierung eine Anwendung. Die physikalische Grundlage des Nachweises von Radioaktivitat sind emittierte Kernteilchen oder y-Strahlung. Im Falle der P-Strahler (verwendet werden [a"P]dATP, [TPldATP, [a3'PP]dATP, [q3P]dATP und [a"S]dATP) sind diese Teilchen emittierte Elektronen. Diese schwarzen (Rontgen-)Filme, und damit ist ein einfaches System zur Detektion der radioaktiv markierten DNA gegeben. Die sogenannten Autoradiogramme sind ein Abbild des untersuchten Gels, welches auf dem Rontgenfilm exponiert wurde. Eine Verbesserung der Detektion wird durch sogenannte Verstarkerfolien (CaW04-Phosphor-Platten) erreicht, die eine indirekte, ca. lOfache Verstarkung des Primarsignals (Elektronen) bewirken [l]. Ein P-Teilchen setzt bis zu 1000 Photonen in der Verstarkerfolie frei, die dann den groBten Teil der Filmschwarzung bewirken [2].
7.2.2 Chemilumineszenz Da die radioaktive Strahlung eine gesundheitliche Gefahr darstellt und grol3e Kosten fur die Herstellung, Lagerung, Arbeitsmittel und die Entsorgung des radioaktiven Materials anfallen, wurden alternative Techniken zur DNA-Markierung gesucht. Die Chemilumineszenz ist eine solche Alternative. Der chemische
7 Grundlagen und Entwicklung der multifluorophoren Laser-Scanning-Technologie
129
Zerfall eines Molekuls (beispielsweise CSPDO, Boehringer Mannheim) und die dabei gleichzeitig auftretende Emission von sichtbarem Licht (VIS) werden bei diesem Verfahren genutzt, markierte Molekule zu lokalisieren. Genau wie bei der Radioaktivitat werden Filme benutzt, um von den exponierten Gelen haltbare Abbilder, vergleichbar den Autoradiogrammen, zu schaffen (im folgenden als ,,Luminogramme" bezeichnet). Die Chemilumineszenz ,,erlischt" je nach Verfahren nach ca. 5-30 min. Die bei dem Verfahren angewandten Chemikalien und die Endprodukte des Zerfalls sind ungiftig. In der Nachweisgrenze unterscheiden sich Radioaktivitat und Chemilumineszenz nicht (Femtogrammbereich letztere tritt jedoch wesentlich schneller und uber einen kurzen Zeitraum in hoher Intensitat auf. Der entscheidende Nachteil der Chemilumineszenz ist jedoch, dal3 viele zeitbeanspruchende Behandlungsschritte notig sind, um die Fluoreszenz auszulosen. Der radioaktive Zerfall tritt im Vergleich dazu spontan auf, d. h. ohne manuelle Initialisierung durch den Experimentator.
7.2.3 Fluorescein- und Rhodaminderivate, Ethidiumbromid, TOTOTM Der Nachweis von DNA durch Markierungen, die sichtbares Licht aussenden und somit einfach zu detektieren sind, findet auch in fluoreszenzgestutzten Systemen statt (s. 4.4). Prinzipiell gibt es jedoch zwei unterschiedliche Arten der Assoziation von fluoreszierenden Molekulen an die DNA. Fluoreszierende Interkalatoren wie Ethidiumbromid [3,4] oder TOTOTM lagern sich bei doppelstrangiger DNA zwischen die Strangwindungen ein und markieren sie. Im Falle von Ethidiumbromid geschieht dies etwa alle 4-5 Nukleotide. Es wird ein Komplex aus DNA und Ethidiumbromid gebildet. Dieser ist erstens abhangig von der vorliegenden Salzkonzentration und zweitens reversibel. Durch Zugabe von Kationaustauscherharzen kann der Komplex wieder aufgelost werden [ 3 ] . Der relativ unsensitive Nachweis von DNA uber Interkalatoren ist nur fur Fragmente sinnvoll, die in groBer Menge verfugbar sind (NanogrammBereich, Gramm), da kleinere Mengen nur mit grol3em Aufwand (beispielsweise einer Restlichtkamera) detektiert werden konnen. In ausreichender Quantitat liegen in der Regel PCR-Fragmente, Plasmide, Cosmide, YACs und genomische DNAs vor. Bei einzelstrangiger DNA ist eine Einlagerung von Interkalatoren jedoch nicht moglich, da keine sterischen (raumlichen) Moglichkeiten bestehen. Bildet die Einzelstrang-DNA Sekundarstrukturen (Faltungen) aus, so ermoglichen diese geringe Einlagerungen. Der Nachweis kleiner Mengen einzelstrangiger DNA mit Interkalatoren ist daher nicht ratsam. Kovalent an die DNA gekoppelte Fluorochrome wie beispielsweise Derivate von Fluorescein und Rhodamin (z. B. Fluorescein-5 Isothiocyanat, CY5) konnen sowohl einzelstrangige als auch doppelstrangige DNA markieren (s. 4.4). Einzel-
I30
Giiriter Mertes
strangige DNA-Startermolekule (Primer) werden in entsprechenden Geraten wahrend der Synthese markiert (s. 3.3). Ihr Einsatz erfolgt beispielsweise zur DNA-Markierung in der PCR. Werden unmarkierte Primer benutzt, kann der Fluoreszenzfarbstoff uber fluoreszenzge koppelten Nukleotide (z. B. fluoreszenzmarkiertes dATP) auch erst wahrend des Experiments eingebaut werden. Die genannten Markierungsarten finden sich vor allem bei PCR-Fragmentmarkierungcn und bei Monomarker-DNA-Sequenzierungen. Die Nachweisgrenze liegt im Picogrammbereich (lo-'* g).
7.2.4 Detektion von Emissionsstrahlung bei nichtradioaktiven Monomarkersystemen Allen hier beschriebenen Detektionsverfahren ist die physikalische Basis des Nachweises gemeinsam: Die gezielte Anregung von Elektronen auf der aul3eren Schale der Fluorophore bei einer bestimmten Wellenlange und die Messung der definierten Emissionsstrahlung, die beim Ruckfall der Elektronen in ihren Ausgangszustand frei wird (s. 7.4). Je nach Markierungsstrategie und Menge des markicrten Materials wird das Emissionslicht jedoch unterschiedlich detektiert. Der Ethidiumbromid-DNA-Komplex wird bei 300 nm (ultraviolettes Licht [UV]) optimal angeregt. Die Fluoreszenz hat ihr Maximum bei bei 590 nm. Dies entspricht einer rot/orangen Farbe. Eine Anregung des Komplexes bei 254 nm ist ebenfalls moglich, beschadigt die DNA aber starker (Strangbruche) als bei 300 nm. Eine deutlich schwachere Fluoreszenz ohne Beschadigung der DNA liegt bei 366 nm vor [4]. (Zur Dokumentation der Ergebnisse s. Kap.3 und 7.2) Der Nachweis von kovalent gekoppelten Flitorophoren in Monomarkersystemen erfolgt je nach Hersteller von Chemie und Gerat nach einem anderen Verfahren. Gemeinsam ist allen, daB sie mit Laseranregung arbeiten. Laser bieten eine hohe Lichtdichte (hohe Energieubertragung) koharenten Lichts und konnen daher relativ geringe Mengen an Fluorophoren sehr effektiv zur Emission von Fluoreszenzlicht anregen. Die Sensitivitat der Systeme ist abhangig von der Wellenlange des Laserlichts. Je weiter das Anregungslicht im roten oder infraroten (langwelligeren) Licht liegt, desto hoher mussen die Fluorophormengen sein, um einen Nachweis zu ermoglichen. Der Grund dafur ist, daB rotes Licht weniger energiereich ist als das kurzwellige blaue Licht und daher bei Rotlichtfluoreszenz mehr Licht verfugbar sein muB, um eine Nachweisgrenze zu erreichen. Die heute gebrauchlichen Laser sind entweder Argon-Laser im Bereich zwischen 5 und 40 mW Leistung (ALF'", Vistral') oder Rotlicht-Laser (LI-COR Modelle 4000, ALFEx-pressTM). Zur Aufzeichnung der Emissionsstrahlung werden entweder feststehende Dioden ( ALF'", Pharmacia), Diodenarrays (Vistral", Molecular Dynamics) oder Scanner mit Kameras (Modelle 4000, LI-COR) eingesetzt. Dies hat jedoch entscheidenden EinfluB auf die Sicherheit. mit der die Daten erfaBt werden konnen.
7 Grundlagen und Entwicklung der rnultifluorophorenLaser-Scanning-Technologie
131
Die Detektion mit jeweils einer feststehenden Diode pro Bahn (z. B. ALFTM, Pharmacia) ist in Abb. 1 schematisch veranschaulicht. Die feststehenden Photodioden sind der Kernpunkt dieses Systems. Die Benutzung dieser Detektion setzt voraus, daB die Gelelektrophorese auf fast ideal geraden Bahnen verlauft. Dies ist besonders wichtig und schwierig zugleich, da schrage Laufbahnen sehr leicht durch unterschiedliche Einflusse entstehen konnen: z. B. nicht ganz planare Glasplatten (Herstellung und Lagerung sind kritisch), Unterschiede in der Geldicke eines einzelnen Gels oder unterschiedliche Salzkonzentrationen in den Proben. Undichtigkeiten an der Elektrophoreseapparatur (StromfluB zwischen Spacer und Gel), ungleichmaflige Geltemperatur und Spacer rnit leicht unterschiedlicher Dicke sind weitere Faktoren, die die Wanderungsbahnen der Proben im Gel beeinflussen konnen. Schrage Laufbahnen der Proben konnen dazu fuhren, daB die fluoreszierenden DNA-Fragmente die zur Laufbahn zugehorigen Detektoren nur teilweise oder gar nicht erreichen. Im Gegensatz dazu arbeitet das Scanning-Prinzip bei der Datenerfassung rnit der Abtastung des gesamten Gels uber ein mobiles Detektionssystem. Dieses bewegt sich auf einer zur Laufrichtung des Gels senkrechten Bahn am unteren Ende des Gels mit einer definierten Geschwindigkeit hin und her. So kann das gesamte Gel beobachtet werden. Diese Ergebnisse sind sicherer, da die Analyse entlang der tatsachlichen Laufbahn der Probe im Gel nach dem Lauf erfolgen kann (zur Laser-Scanning-Detektion von multifluorophoren Systemen s. 7.4).
7.2.5 Datenerfassung und -interpretation Die eigentliche Erfassung der MeBdaten, also der Schritt nach der FluoreszenzDetektion, erfolgt je nach Markierungs- und Detektionssystem sowie je nach Gerat und Chemie auf unterschiedliche Art und Weise. Die realisierten Moglichkeiten reichen von fotografischer Dokumentation bis zur elektronischen Datenerfassung. Bei der Detektion von Lichtsignalen durch Dioden werden elektromagnetische Lichtstrahlen in elektrische Strome umgewandelt. Ihre Aufzeichnung erfolgt im Computer in einer oder mehreren Dateien. Die Interpretation bzw. Analyse dieser Daten wird rnit entsprechender Software vorgenommen, die die einzelnen Hersteller rnit den Geraten ausliefern oder selbst von Benutzern geschrieben wird, wenn keine entsprechenden Programme von den Gerateherstellern angeboten werden (z. B. ,,ALP" Software (Automated Linkage Pre-Processor, von A.F. Brown et al., Medical Research Council Human Genetics Unit, Crewe Road, Edinburgh EH42XU). Dieses Programm wird im AnschluB an die Analyse der ALF-Daten mit dem Fragment ManagerTM(Pharmacia) zur automatischen GroBenbestimmung und Typisierung von Mikrosatelliten benutzt. Die gewonnenen Daten konnen im LinkageTMProgramm [5]weiterverarbeitet werden.
132
Giinter Mertes
Die Art der Daten- und Ergebnisdarstellung sowie die Nachvollziehbarkeit der automatischen Analysen sind vollstandig von der benutzten Software abhangig. Im Fall der Detektion mit Dioden mu13 der Experimentator von der Annahme ausgehen, dal3 die detektierten und dargestellten Daten ausschlieBlich von der Probe stammen, die theoretisch vor der Diode vorbeilaufen sollte. Es ist sehr schwierig, diesen Sachverhalt vor, wahrend oder nach einer Elektrophorese zu verifizieren. robenauftrag 1
I
Laserlicht
Photodiode (Detektor) Abb. 1. Schematische Darstellung der Detektion mit feststehenden Photodioden. Der Probenauftrag erfolgt am oberen Ende des Gels. Die Laufbahn der Proben mit moglichen Abweichungen von der ideal geraden Bahn ist durch Linien gekennzeichnet. Die Detektoren liegen hinter der Gelplatte und messen das Fluoreszenzlicht der markierten DNA-Fragmente, die genau vor dem Detektor laufen miissen. Die Anregung erfolgt iiber einen seitlich eingestrahltes Laserlicht.
Es kann der Fall auftreten, dal3 Fragmente einer Probe (aus Sequenzierung oder Fragmentanalyse) von zwei benachbarten Dioden gleichzeitig detektiert werden, weil die Probenbahn zufallig genau zwischen diesen beiden Dioden verlauft (Abb. 1).Dann werden Fragmente aus Nachbarbahnen so analysiert, als ob sie aus einer einzigen Probe stammen. Sequenzen und Quantifizierungen sind unter diesem Aspekt zu prufen und in Frage zu stellen. In Diodenarrays stehen die Detektionspunkte naher zusammen. Daher haben diese mit den beschriebenen
7 Grundlagen und Entwicklung der rnultifluorophoren Laser-Scanning-Technologie
133
Problemen nur dann zu rechnen, wenn die Software nahe beieinanderliegende Probenbahnen nicht eindeutig voneinander trennen kann.Das Lesen und Interpretieren von Autoradiogrammen, Luminogrammen oder sonstigen filmgestiitzten Darstellungsformen von Gelen kann manuell oder teilautomatisiert erfolgen. Scannersysteme wie z. B. der PhosphoImagerTModer der FluoImagerTM(beide Gerate von der Fa. Molecular Dynamics) konnen Filme oder Photographien einlesen und in einer Datei ablagern. Diese sind einer Analyse durch Softwareprogramme zuganglich, und die Daten konnen zu Ergebnissen verarbeitet werden. Die Grenze dieser Systeme ist durch folgende Parameter gegeben: 0 0
die realisierte Trennung der DNA-Fragmente im Gel, die Qualitat des Autoradiogramms, die Qualitat des Scanners und die Gute der Software (Darstellung der Ergebnisse; Hinweis auf Bereiche, die die Software nicht zweifelsfrei analysieren kann; Nachvollziehbarkeit der Computer-Auswertung durch den Benutzer).
Das Scanning-System FluoImagerTMist in der Lage, zwei unterschiedliche Fluorochrome zu detektieren. Es wird nicht fur die DNA-Sequenzierung eingesetzt. Die mitgelieferte Software unterstutzt nur Fragmentanalysen und Quantifizierungen (Fragment AnalysisTMsizing Software, ImageQuaNTTM).Dieses System und die dazugehorige Chemie stellen ein Bindeglied zwischen den Mono- und Multimarkersystemen dar.
7.3 Multimarkersysteme auf der Basis von Fluoreszenzfarbstoffen zur Detektion von DNA-Fragmenten Eine neuartige, auf Fluoreszenzfarbstoffen basierende Methode zur Markierung von DNA-Fragmenten und deren Verwendung bei der DNA-Sequenzierung wurde 1986 von Smith et al. vorgestellt [6]. Die Autoren verwendeten eine gelelektrophoretische Auftrennung mit fluoreszenzgekoppelter Detektion der markierten Sequenzierprodukte (s. Kap. 5). Die Auswertung der Detektionsdaten erfolgte nicht manuell, sondern automatisiert mit Hife eines Computers. Diese neuartige Konzeption der DNA-Sequenzierung baute auf den Erkenntnissen der 1985 von Smith et al. [7] publizierten Arbeit auf, die die Herstellung von 5’-farbstoffmarkierten Oligonukleotiden (s. Kap. 4)beschreibt.
134
Giititrr M u t e s
7.3.1 Das Systemkonzept Grundlegend neu bei dieser Methode war die Einfuhrung eines Multimarkersystems, das auf der Basis von vier unterschiedlichen Fluoreszenzfarbstoffen die Produkte der vier Sequenzierreaktionen einer DNA voneinander unterscheidbar macht (Abb. 2). Dabei bedient man sich der Tatsache, dalj unterschiedliche Fluorophore bei unterschiedlichen Wellenlangen emittieren und da13 dieses Emissionslicht durch ein entsprechendes Detektionssystem nach seiner spektralen Zusammensetzung untersucht werden kann. Die ermittelten Daten geben dann Auskunft daruber, welcher Fluoreszenzfarbstoff gerade detektiert wird. Da jeder Farbstoff kovalent an einem bestimmten DNA-Molekul hangt, kann man die Reihenfolge und den relativen Abstand der DNA-Molekule voneinander ermitteln (s. 7.4). Die Vorteile des Einsatzes eines Multimarkersystems bei der Trennung von Sequenzierprodukten in einem Gel sind vielfaltig und beruhen darauf, dalj fur eine DNA nur noch eine einzige Gelspur zur Analyse der Sequenzierprodukte benutzt wird. Damit treten erstens die Probleme der 4-Spurtechnik (s. 7.2.4) nicht mehr auf und zweitens eroffnet das Multimarkersystem prinzipiell neue MoglichZugabe von Enzyrn + Nukleotide
*
Gerneinsarne Analyse in einer Gelspur
I I I I ,
=b a %
3 .
Anlagerung
Verlangerung
Abb. 2. Dyeprimer-Sequenzierung. Die Grundlage der Dyeprimer-Sequenzierung ist die Verwendung von 5’-fluoreszenzmarkierten Sequenzierungs-Primern. Die entstehenden Sequenzierungsprodukte sind fluoreszenzmarkiert. Sie werden vor der Elektrophorese in einem Reaktionsgefal3 vereinigt und auf einer einzigen Bahn im Gel getrennt. Durch das unterschiedliche Emissionslicht der Fluorophore werden sie separat detektiert. (Zur Primer-Markierung s. Kap. 4)
7 Grundlagen und Entwicklung der rnultifluorophoren Laser-Scanning-Technologie
135
keiten der internen Kontrolle von Gelbedingungen in jeder einzelnen Analysebahn eines Gels (s. Kap. 6). Bei der Entwicklung der Multimarkermethode, die Smith et al. [7] in ihrer Arbeit von 1985 beschreiben, wurde im Detail so vorgegangen, daI3 zuerst vier Aliquots des Sequenzier-Primers mit vier unterschiedlichen Farbstoffen markiert wurden (s. Kap. 4). Die Sequenzierreaktion erfolgte nach dem klassischen Schema nach Sanger [8] in vier getrennten Reaktionsansatzen (Abb. 1). Diese wurden vereinigt (aufgrund der unterschiedlichen Farbmarkierung der Produkte) und in einer einzigen Bahn auf dem Gel aufgetragen. Alle DNA-Fragmente einer sequenzierten DNA wurden so einer ,,Co-Elektrophorese" unter identischen Bedingungen unterworfen. Die Detektion der DNA-Fragmente erfolgte wiihrend des Gellaufs (,,Real Time Detection, zu deutsch: Echtzeit-Detektion"): Ein 40 mW multiline-Argon-Laser regt die markierten DNA-Fragmente nach 40 cm Laufstrecke zur Fluoreszenz an. Das emittierte Licht wird uber zwei Linsen fokussiert und durch ein Filterrad in vier Signale mit definierten Wellenlangen aufgeteilt, die den Emissionsmaxima der Farbstoffe entsprechen. Das Fluoreszenzlicht wird dann uber einen Photoverstarker detektiert, uber eine im Gerat integrierte Elektronik digitalisiert und in einem Computer in eine Datei ubertragen. Diese enthalt alle Informationen des Gellaufs. Die Daten werden mit Hilfe einer auf diese Detektion zugeschnittenen Software auf dem angeschlossenen Computer mathematisch analysiert. Der Prototyp dieses Sequenzierautomaten (,,DNA sequenator", Abb. 3 ) benutzte ein Saulengel und konnte pro Lauf eine einzige Probe analysieren. Das beschriebene Gerat war das erste ,,4-dye-l-lane-"(4-Farben-l-Gelbahn-)Gerat zur Detektion von DNA-Fragmenten, die mit einem Multi-Marker-System mar-
I
Polyacrylamid SauI e ng e I
Computer Detektor
-h I
untere Pufferkammer
Abb.3. DNA sequenator nach Smith (1986). In dem Polyacrylamid-Saulengel werden fluoreszenzmarkierte DNA-Fragmente getrennt. Sie wandern nach einer definierten Trennstrecke an einem Detektor vorbei, der das emittierte Licht der laserangeregten Fluorophore aufzeichnet. Die Daten werden elektronisch gespeichert (Computer) und automatisch durch eine Analysesoftware ausgewertet.
136
Giinter Mertes
7.3.2 Chemische Struktur und physikalische Grundlagen der Fluorophore: Absorption, Emission und Empfindlichkeit Die Fluoreszenzfarbstoffe miissen bestimmten Anforderungen geniigen, um sie bei der Sequenzierung und Detektion durch Laseranregung und Fluoreszenzemission sinnvoll einsetzen zu konnen [7]: Ein hohes Ma13 an Fluoreszenzkapazitat der Farbstoffe zur Erzielung einer hohen Sensitivitat, minimales Streulicht und Fluoreszenzhintergrund durch optimale Lage des Absorptions- und Emissionsspektrums moglichst nahe dem Bereich des roten sichtbaren Lichts, maximales Auflosungsvermogen der einzelnen Emissionsmaxima untereinander durch minimale Uberlappung der Emissionsspektren, keine Behinderung des Hybridisierungsverhaltens der 5’-markierten Primer an der einzelstrangigen DNA-Matrize, minimale Beeinflussung der Mobilitat von markierten gegenuber unmarkierten DNA-Fragmenten im Gel oder gleichstarke Mobilitatsveranderung durch jeden der vier Farbstoffe. Tab. 1. Optische Eigenschaften der Farbstoffe der DyePrimerTMund DyeTerminatorenTMund ihre Charakteristika beim Gebrauch im 373A DNA SequencerTM(Perkin Elmer) F: Fluoresceinderivat, R: Rhodaminderivat Base bzw. ddNTP DyePrimer
I
I
I
A
JOE
griin
griin
525nm
C
FAM
blau
blau
495nm
G
TAMRA
gelbkhwarz
gelb
555 nm
1
T 1
ROX
I
A DyeTerminatoren C G Taq-DNAPolymerase
T
rot
I
LOU I
I
585 nm
I
605nm
R I
R
griin
griin
534nm
555nm
R
blau
rot
588nm
605 nm
R
gelbkhwarz
blau
502 nm
535nm
R
rot
DyeA Terminatoren
rot
580nm
562nm
gelb 1
I
I
1560nm
IF
lgriin
I gelb I
I
I-
I
1
R
580nm I
I
G
NAN
gelb/schwarz
rot
580nm
F
SequenaseTM T
FAM
rot
blau
531 nm
F
7 Grundlagen und Entwicklung der multifluorophoren Laser-Scanning-Technologie
137
Die chemischen Bezeichnungen der Fluoreszenz-Molekiile sind:
DyePrimer
Base Name bzw. ddNTP
chemische Bezeichnung
A
JOE
2’,7’-dimethoxy-4‘,5’-dichloro-6-carboxy-fluorescein
C
FAM
5-carboxy-fluorescein
G
TAMRA N,N,N’,N’-tetramethyl-6-carboxyrhodamin
T
Z X
1 5-carboxyrhodamin 6G
A DyeTerminatoren C
G Taq-DNAT Polymerase A DyeTerminatoren C
I 6-carboxyrhodamin X 6-carboxyrhodamin X 5-carboxyrhodamin 110
6-carboxytetramethylrhodamin 5-carboxy-4,7,4‘,5’-tetrachloro-2’,7’-dimethoxy-fluorescein ~~
ZOE
1 5-carboxy-2’,4‘,5’.7’-tetrachlorofluorescein
G
NAN
5-carboxy-4,7-dichloro-1’,2”,8’-dibenzofluorescein
SequenaseTM T
FAM
5-carboxy-fluorescein
Diese Kriterien erfullen Rhodamin- und Fluoresceinderivate [9]. Sie absorbieren bei Wellenlangen von 495-588 nm und emittieren zwischen 525 und 605 nm (Tab. 1). Die Emissionsintensitat der Farbstoffe liegt in einem Bereich, der die Detektion von markierten DNA-Fragmenten zwischen 10-’s-10-17 Mol(1-10 attomol) zulaBt. Damit liegt die Empfindlichkeit des Systems etwa bei der radioaktiven Markierung, bei welcher durch sehr lange Expositionszeiten jedoch noch geringere DNA-Mengen nachgewiesen werden konnen [6,10]. Anhand der DyePrimer-Farbstoffe sind in Abb.4 beispielhaft die Laseranregung und die Emissionsspektren gezeigt. Die Emissionsmaxima liegen jeweils 30 nm auseinander und konnen gut unterschieden werden. Die optischen Eigenschaften der Fluoreszenzfarbstoffe, die von den Detektionssystemen der Gerate der Produktlinie ABI PRISMTM(Perkin Elmer) detektiert werden sind in Tab. 1 aufgefuhrt.
Giinter Mertes
138
1' 388nm
1' 514nm
f
525nm bis 650nm Detektionsbereich
525nm
Abb.4. Laser-Anregung und Emissionsspektren der vier Fluorophore FAM (blau), JOE (griin), TAMRA (gelb) und ROX (rot). Die Anregung der Farbstoffe erfolgt iiber einen multiline Argonlaser bei 488 und 512 nm. Die Emissionsspektren sind farbig eingezeichnet. Ein ,,long pass filter" bewirkt, daB nur das Emissionslicht, nicht jedoch das Laserlicht die Detektionseinheit des Gerats erreicht (ABI PRISMtM377 DNA Sequencer; 310TM, ABI PRISMlM Personal Genetic Analyser'"; (beide Perkin Elmer; zur Detektion s. auch 7.4).
7.4 Laser-(Scanning-)Technologic als Grundlage eines Multimarker-Detektionssy stems Die Detektion von fluorochrommarkierten DNA-Fragmenten durch Anregung mit Laserlicht und Messung des Emissionslichts ist zur Zeit die effektivste Form der DNA-Fragmentanalyse. Bei genauerer Betrachtung der Moglichkeiten dieser Technologie wird deutlich, daB die simultane Detektion mehrerer Fluorochrome sowie die weitgehende Automatisierung des gesamten Prozesses (von der Probenvorbereitung bis zur softwaregestutzten Auswertung der ermittelten Daten) die am weitesten entwickelte Form der Laser-Scanning-Technologiedarstellt. Im Abschnitt 7.2 wurden die Grundlagen der Monomarkersysteme und deren Detektion aufgezeigt. Im folgenden wird erlautert, welche gewaltigen Fortschritte (1) die Multi-Marker-Technologie, (2) die Simultandetektion aller Marker und ( 3 ) die fortschreitende Automatisierung durch die Entwicklung neuer Gelsysteme mit sich gebracht hat. Insbesondere die Innovation auf dem Gebiet der Polymerchemie bei Gelsystemen und der automatisierten Gelpraparation bei der Kapillarelektrophorese stellen zukunftsweisende Verbesserungen auf dem Weg der vollautomatisierten DNA-Analyse dar.
7 Grundlagen und Entwicklung der multifluorophoren Laser-Scanning-Technologie
139
7.4.1 Grundlagen der ,,On-line"-Detektion von Multimarkersystemen Die optimale Detektion fluoreszierender Molekule in einem Gel oder einer Kapillaren ist von verschiedenen Parametern abhangig. Davon sind die folgenden besonders wichtig: 0
0 0
0
Die Ubereinstimmung der Wellenlange des Anregungslichts und des Absorptionsmaximums der Fluorophore, die (moglichst gleichbleibende) Intensitat des Anregungslichts am Anregungsort, die Intensitat des Emissionslichts am Detektionsort und damit direkt korrelierend die Empfindlichkeit des Detektionssystems bei der zu detektierenden Wellenlange, das spektrale Auflosungsvermogen des Detektionssystems.
Die Abstimmung und Optimierung der genannten Parameter entscheiden ma& geblich uber die Qualitiit eines Fluoreszenzmarker-Detektions-Systems. Im Vergleich zu Messungen in Losungen tritt in Gelsystemen ein erhohter Hintergrund und starkeres Streulicht auf. Zur Minimierung dieser negativen Einflusse und zur Maximierung der Sensitivitat des Systems erwies sich eine Anregung mit Laserlicht als besonders gunstig, da dieses monochromatisch sowie raumlich und zeitlich koharent ist. Es 1aBt sich durch eine Sammellinse auf den Durchmesser von ca. 1pm fokussieren und zeichnet sich durch eine extrem hohe Lichtintensitat aus. Zur gleichzeitigen Anregung von mehreren Fluorophoren in Gelen ist es daher sehr geeignet [6, s. 7.31. Zur Detektion eines Fluorophors finden mehrere Vorgange in einer definierten Reihenfolge statt: 1. Das Anregungslicht trifft auf das Fluorophor und regt die Elektronen der auBeren Schale des Molekuls an. 2. Die Elektronen springen unter Abstrahlung des Iangerwelligen Emissionslichts wieder auf ihre ursprungliche Position im Molekul zuruck. 3. Das emittierte Licht verbreitet sich gleichmaflig in alle drei Raumdimensionen. 4. Das in Richtung der Detektionseinheit emittierte Licht wird uber eine Linse moglichst groflflachig gesammelt und zur Detektion an ein lichtempfindliches System weitergeleitet. 5. Das Lichtsignal wird spektral aufgespalten und seine Intensitat bei einer definierten Wellenlange h gemessen. 6. Der analoge Merjwert wird in digitaler Form gespeichert und kann bei der Datenanalyse aufgerufen und weiterverarbeitet werden. Die genannten Schritte 1-6 finden in sehr hoher Geschwindigkeit statt, da es sich hier entweder um Elektronenubergange oder um die Messung eines Lichtsignals handelt.
Giinter Mertes
140
7.4.2 Das Systemkonzept der Laser-Scanning-Technologie: Der Aufbau einer Multimarker-DNA-Analysestation rnit hoher Kapazitat Das Hauptcharakteristikum einer DNA-Analysestation mit hoher Kapazitat ist der Durchsatz grol3er Mengen von Analysen in kurzer Zeit. In der praktischen Durchfuhrung einer solchen Station bewahrt sich vor allem die multifluorophore Detektionstechnologie (s. 7.3) in Verbindung mit der Benutzung eines mobilen Detektionsmoduls (s. unten) und hochauflosenden Gelsystemen mit vielen Analysebahnen. Gerate dieser Art sind beispielsweise der 373A und ABI PRISMTM 377 DNA Sequencer (Perkin Elmer). Die Messung der Fluoreszenzdaten im Gel wird bei den heute ublichen MultiMarkerfahigen Sequenzierautomaten uber zwei unterschiedliche methodische Ansatze vorgenommen: (1) Die spektrale Diskriminierung des Fluoreszenzlichts wird entweder uber ein Filterrad erreicht (373A DNA SequencerTM,Perkin Elmer) oder (2) uber ein Gitter, das das emittierte Licht in seine Spektralfarben zerlegt (377 ABI PRISMTMDNA Sequencer, Perkin Elmer). Die erste Methode analysiert das Licht sequenziell auf seine Bestandteile, die zweite ist durch eine simultane Detektion des gesamten Spektrums gekennzeichnet. Kernstuck der Detektionstechnologie ist in beiden Fallen ein bewegliches Laser-Scanning-Detektionsmodul. Durch dieses dehnt man die Fluoreszenzmessung uber die gesamte Gelbreite aus. So wird das Gel vollstandig - und nicht nur ausschnittsweise - erfal3t und dargestellt. Technisch wird dies besonders effektiv ereicht, indem man die Detektionseinheit auf einem Schlitten am Gel hin und herwandern laf3t (Abb. 5). Da die Fragmente mit einer bestimmten Geschwindig-
- Argon-Laser
&
I
Signalverstarkerrohre (PMT)
--
I
I
x
Antriebswelle des Scanners
c
.\
FokussierIinse
Bewegungsrichtungen ~ ~ ~ k u s s inse i e r l
\
Spiegel
uiaspiarre
Glasplatte \
LaserIicht
/
I
Ernissionslicht
Schutzbalkenvor Laserlicht
Abb. 5. (A) Mobiles Detektionsmodul im 373A DNA Sequencer (Aufsicht).
7 Grundlagen und Entwicklung der multifluorophoren Laser-Scanning-Technologie
141
keit durch den MeBbereich des Detektionssystems wandern, kann eine ausreichende Anzahl von Lichtintensitats- und Wellenlangendatenpunkten zur eindeutigen Charakterisierung aufgezeichnet werden. Durch diese Art der Detektion erhalt man, solange das Gel lauft und Fragmente die Detektionsstelle passieren, ein vollstandiges Gelbild mit allen DNA-Fragmenten (s. Abb. 1 in Kap. 14). Dieses Gelbild 1al3t (im Vergleich zu feststehenden Detektoren) eine Analyse auch nach einem schragen Verlauf der Elektrophoresebahn(en) zu, da die Analyselinien dem Lauf der Proben folgen. Die eigentliche Detektion des Lichts erfolgt beim 373A uber eine Signalverstarkerrohre (PhotomultiplierTube, PMT Abb. 5). Diese wandelt die Photonenenergie in elektrische Impulse um und verstarkt sie gleichzeitig. Der gemessene Strom wird an die eingebaute Elektronik weitergeleitet. Diese ubergibt die Mel3werte an einen Computer, der in einer Datei alle gemessenen Fluoreszenzdaten festhalt (s. 7.3). ...,.*._..___ ,.-.... . _. 7%-.: . L:*@&%l;m, . Projektion des Emissions-Spektrumsvom Gitter auf die CCD-Kamera
Potential-Barrie vertikaltransparente Polysilikon-Elektroden
lsolationsschicht
Leseregister (seriell) Profil eines angesammelten Potentials sparente Polysilikon-Elektroden Ladungspaket (Elektronen) Transportrichtungder Elektronen (Ladungspakete)
Abb. 6. Schema einer CCD-Kamera: Simultandetektion aller Farben eines Emissionsspektrums Das auf die CCD-Kamera projezierte Licht wird in Pixelreihen gesammelt. Circa 2,2 Pixel entsprechen einem Nanometer. Die Pixelreihen werden in Leseregister ausgelesen, welche dann wiederum sequentiell (entsprechend der gerade detektierten Wellenlange, d. h. Pixelreihe) ausgelesen werden. Der jeweils gemessene Strom ist als Ladungspaket (Elektronen) rot dargestellt. Dieser wird zu einem chipinternen Verstarker abgeleitet.
142
Giinter Mertes
Die Messung des Photonenstroms wird im 377 DNA Sequencer'IMgrundsatzlich anders gelost. Das Modul wird durch einen Elektromotor auf einer Antriebswelle hin- und herbewegt. Dadurch wird das gesamte Gel abgetastet, d. h. eine komplette Ansicht des Gels festgehalten. Das Laserlicht erreicht uber Spiegel das Gel und bewirkt dort die Emission von Fluoreszenzlicht. Das Emissionslicht wird uber ein Gitter in seine Spektralfarben aufgeteilt. Die Detektion des Spektrums findet dann auf mit einer CCD-Kamera (Charge Coupled Device) statt, deren Detektionseinheit ein hochauflosendes Pixel-(Bildpunkt-)feld ist (Abb. 6). Das selektive Auslesen der einzelnen Pixelreihen entspricht funktionell einem Filtern des Emissinnslichts uber physikalische Filter. Dieses Filterprinzip wird als ,,virtueller Filter" bezeichnet (Abb. 7). Der prinzipielle Vorteil der CCD-Kamera ist die simultane Detektion beliebig vieler Farben auf dem Pixelfeld gegenuber der sequentiellen Filterung und Detektion der gleichen Farben bei einem System mit physikalischen Filtern. Die Erfassung der Mepwerte und deren automatische Analyse erfolgen beim 373A und beim 377 DNA SequenceirMmittels Computer und Software. Die Kapazitat einer DNA-Analysestation steigt mit der Anzahl der Gelbahnen und detektierbaren Fluoreszenzfarbstoffe. Bei Sequenzierungen konnen heute schon bis zu 36 Proben gleichzeitig auf einem Gel analysiert werden, bei Fragmentanalysen sehr vie1 mehr: Mit 4 Fluorophoren konnen in einer Fragmentanalyse auf 36 Bahnen 144 gleichgrope Proben (36 x 4 unterschiedlich markierte DNAs) gleichzeitig analysiert werden. Untersucht man dazu noch DNA-Fragmente unterschiedlicher Grorje (z. B. 10 verschiedene GroBen: 80, 100, 130, 160, 200, 220, 240 250, 280, 300 Basen lange Fragmente), so erhoht sich die Anzahl der in einem Gel analysierbaren Fragmente auf 144 x 10, also 1440. (Die gleiche Kapazitat mit einem Monomarkersystem benotigt 144 Spuren. Dies entsprache ungefahr 4 Gelen auf den heute erhaltlichen Systemen, also dem 4fachen Zeitausgelesene Pixelreihen: \ "Virtuelle Filter" I
AusleseRichtung (64 Pixels)
>
V
Spektrale Achse ( 512 Pixels, 460nm - 660nm)
Auslese Register -
Abb. 7. Virtuelle Filter in der CCD-Kamera des ABI PRISMTM377 DNA Sequencers. Das Emissionsspektrum des Fluorophors wird auf das Pixelfeld (schwarzes Feld) der CCD-Kamera projiziert. Es liegen insgesamt 512 Register 5 64 Pixel vor. Durch gezieltes Auslesen dieser Register (weiRe Felder) werden bestimmte Wellenlangen detektiert. Das System filtert durch Simulation optischer Filter bestimmte Wellenlangen aus dem anliegenden Spektrum heraus.
7 Grundlagen und Entwicklung der rnultifluorophoren Laser-Scanning-Technologie
143
oder Gerateaufwand). Nur ein weiterer Farbstoff steigert die Kapazitat eines 4Farb-Multimarkersystems bereits um 25%, ohne das Gerat selbst zu verandern. Der Durchsatz einer solchen DNA-Analysestation liegt je nach Gelbedingungen z.B. bei ca. 75000 Basen pro Arbeitstag Sequenzierung (36 Bahnen, 6001000 Basen Leseweite, 4-10 Stunden pro Lauf) und bei ca. 1500 markierten Fragmenten (Loci, Genotypen) pro Arbeitstag Fragmentanalyse (36 Bahnen, 15 Loci, 4 Stunden pro Lauf). Beispiele sind in den Kapiteln 6 , 9 und 14 angegeben.
7.4.3 Das Systemkonzept der Laserdetektion bei der Multimarker-DNA- Analyse in Kapillaren Die Kapillarelektrophorese ist ein sehr wirkungsvolles System zur schnellen Trennung geringer Mengen organischer und anorganischer Molekule. Die grol3e Analysegeschwindigkeit, die sehr hohe Auflosung, die Quantifizierung der Proben und die Automatisierungsmoglichkeit sind die konzeptionell bedingten Eigenschaften des Kapillarelektrophoresesystems. Kapillaren zeichnen sich durch einen sehr geringen Innendurchmesser (im Mikrometerbereich) und stark variable Trennstrecken aus. Von entscheidender Wichtigkeit fur eine gute Auftrennung ist (neben der Temperaturkonstanz) die benutzte Gelmatrix und die Vermeidung von Elektroosmose. Letztere fuhrt zu einer Wanderung der Gelmatrix entgegen der Laufrichtung der zu analysierenden Molekule (diese erreichen dann nie die Detektionsstelle) und kann durch eine Beschichtung (Coating) der Innenseite der Kapillare vermieden werden. Aufgrund der unterschiedlichen elektrophoretischen Mobilitat der verschieden groBen DNA-Fragmente werden diese in der Kapillare nach ihrer GroBe aufgetrennt. Die Injektion der Molekule kann entweder uber ein Drucksystem oder durch eine Elektroinjektion erfolgen, welche vor allem zwei Vorteile hat: (1) Die Gelmatrix wird nicht mechanisch beansprucht und dadurch ungunstig verandert, (2) die Durchfuhrung und Kontrolle der Injektion kann uber die Regelung der elektrischen Injektionsparameter erfolgen und ist dadurch sehr einfach und automatisierbar. Die multifluorophore Detektion in einer Kapillare erfolgt uber einen externen feststehenden Detektor und eine CCD-Kamera, in der Regel rechtwinklig zur Kapillare, und erfaBt ihr gesamtes Innenlumen an der Detektionsstelle. Ein konfokales Linsensystem ist sehr gut geeignet, die Proben mit Laserlicht anzuregen und das emittierte Fluoreszenzlicht wieder zur Aufzeichnung und Analyse auf eine CCD-Kamera abzuleiten (Abb. 6 und 7). Durch die Multimarkertechnologie ist die Durchfuhrung von Sequenzierungen in einem Kapillarsystem mit nur einer einzigen Kapillare sehr einfach: Die unterschiedlich markierten Sequenzierprodukte konnen in der Kapillare unabhangig voneinander detektiert werden. Ein Mono-Marker-System hatte ungleich groBere Probleme bei der Zusammenfuhrung der Daten aus vier parallel laufenden
144
f'
Giinter Mertes
__
T
dichroitischer Spiegel
Spiegel
Kapillare Fokussier-Linse
Linse Abb. 8. Spektralapparat des 310TM(ABI PRISM 310 Genetic AnalyserTM).Das Laserlicht erreicht iiber ein Linsen- und Filtersystern die Kapillare. Dort erfolgt die Anregung der Fluorophore. Das Ernissionslicht verlaBt iiber den gleichen Weg wie das einfallende Laserlicht die Kapillare (konfokales Linsensystern). Uber einen dichroitischen Spiegel werden Laser- und Emissionslicht getrennt. Ein Gitter zerlegt das emittierte Licht in seine Spektralfarben, welche von dort auf die CCD-Kamera projiziert und detektiert werden (Abb. 6).
Kapillaren. Dabei muaten zudem noch vollkommen identische Laufbedingungen in allen vier Kapillaren herrschen. Dies stellt ganz besonders hohe, in der Praxis stark storanfallige Anspriiche an das Monomarkerkapillarsystem. Das einzige derzeitig erhaltliche vollautomatisierte Gerat, das eine Multimarker-Analyse von DNA-Molekiilen ermoglicht, wurde auf der Grundlage der oben genannten Spezifikationen gebaut. Es handelt sich um den ,,ABI PRISM 310 Genetic AnalyserTM"(,,310TM")von Perkin Elmer. Die Charakteristika dieses Gerates sind (1) voll automatisierte Beschickung der Kapillare mit der Gelmatrix (ungiftige Polymere (,,entangled Poymers"), (2) voll automatisierte Proben-Elektroinjektion, (3) schnelle Trennung von DNA-Fragmenten unterschiedlicher Markierung [15-35 min bei der Fragmentanalyse, 2,5 h bei der Sequenzierung Zeiten incl. (1) und (2)], (4) computergestiitztes Sammeln und Auswerten der Daten (Abb. 8). Bei diesem System verhindert ein spezieller Probenpuffer (TSRTM,Template Suppresing Reagent) das Eindringen sehr grol3er Molekiile (> ca. 3000 Basen) in
7 Grundlagen und Entwicklung der multifluorophoren Laser-Scanning-Technologie
145
die Kapillare, was einer Verstopfung und damit unkontrollierten Gelbedingungen vorbeugt. Gleichzeitig ermoglicht dieser Puffer die stabile Lagerung der Proben bis zur Analyse im Gerat uber mehr als 48 h. Die Temperierung der Kapillare erfolgt uber einen regelbaren Ofen, in dem sie sich befindet. Die Kontrolle des Systems wird mit einem Computer vorgenommen. Dieser ermoglicht eine einfache Programmierung des Analyseablaufs und der Datenauswertung vor und wahrend des Laufs sowie die Ansicht der Ergebnisse.
7.5 Variable Medien und Gellangen: Die vielseitigen Moglichkeiten der Elektrophorese mit ,,On-line"Detektion Die beschriebenen (multifluorophoren) DNA-Analysen werden in Abhangigkeit vom Untersuchungsziel unter verschiedenen Bedingungen durchgefuhrt. Diese Analysen unterscheiden sich z. B. in der Genauigkeit der Groflenbestimmung eines Fragments oder in der gewunschten Leseweite der Sequenzierung oder in der Anzahl der zu untersuchenden DNA-Proben oder Loci. Sowohl die Kapillargerate als auch die Systeme mit Gelen bieten eine Vielfalt von Moglichkeiten, sich auf die Bedurfnisse des Experimentators einzustellen (Tab. 2). Die Variationen belaufen sich in der Regel auf die Lange der Trennstrecke, die Zusammensetzung des Trennmediums und die Elektrophoresebedingungen. Auch die Anzahl der gleichzeitig nutzbaren Farbstoffe stellt eine wichtige Variable dar. In Kapillaren, die wie im Fall des 310TMselbsttatig im Gerat befullt werden, kann der Versuchsaufbau nicht nur in der stufenlos veranderbaren Kapillarenlange, sondern auch in der Beschaffenheit und Temperatur des Gelmediums variieren. Die Bandbreite der Variationen ist sehr groB, z. B. native oder denaturierende Gele in verschiedenen Zusammensetzungen(Harnstoff, Glycerin, Puffer etc.), variable Elektrophorese- und Injektionsparameter. Zur Zeit konnen zwischen 1 und 4 Fluorophore gleichzeitg detektiert werden, in Zukunft werden es mehr sein. In Gelsystemen sind prinzipiell die gleichen Variationen wie in Kapillaren moglich. Es werden unterschiedliche PlattengroBen und Gelzusammensetzungen und -dicken angeboten, um unterschiedlichen Anwendungen gerecht zu werden. Die MaBe liegen beispielsweise zwischen 0,2 und 0,4 mm Dicke und 6, 12,24, 34, 48 cm Lange (373A DNA Sequencer, Perkin Elmer) sowie 12,36,48 cm Lange (ABI PRISMTM377 DNA SequencerTM,Perkin Elmer). Je unterschiedlicher die Veranderungen an einem Gerat durch den Experimentator gewahlt werden konnen, desto groBer ist die Palette der moglichen Anwendungen auf diesem Gerat. Beispiele hierzu aus den Bereichen Grundlagenforschung, Medizin, Forensik und Agrarwissenschaften finden Sie in den Kapiteln 6 und 9-14. Die vom Hersteller angebotene Hardware-Variationsbreiteist von Gerat zu Gerat sehr unterschied-
I46
Giinter Mertes
lich (Tab. 2). Der Standardlieferumfang von Glasplatten und Software im Grundsystem variiert ebenfalls stark. Tab. 2. Variabilitat der DNA-Sequenzierer Elektrophoresegerate-Hardware, Sequenzierungsleistung pro Stunde (Angaben entnommem aus den aktuellen Informationsmaterialien der Firmen, wenn nicht anders ausgewiesen. *: mussen laut Hersteller separat geordert werden.) Anzahl insgesamt max. der mogliche Anzahl detekAnzahl an tierten detektier- Sequenbarer zierFarben Farben probed Gel ABI PRISM 310 Gemetic Analyser Ihl
4
12
1
ABI PRISM 377 DNA SequencerTM
4
12
36
ABI 373A DNA SequencerrM
4
4
36
ALFIM
1
1
ALFexpressIM Vers. 2
lo
LI-COR 4000'"
16
LI-COR 4000Llhf
I
Vistra DNA Sequencer 72YM
1 I
I
+
I
lo
Trennstrecken vom Slot zum Detektor [cml (Die Lange der Glasplatten ist grol3er.)
LasedDetektor
I
Argon/CCDKamera, Scanner
variabel
Argon/CCDKamera, Scanner
12,36,48
Argon/Photomultiplier-Tube, Scanner
6, 12.24,34,48
Argon/ 40 fixierte Dioden
I
24
Helium-Neon/ 40 fixierte Dioden
r
Laser Diode, Diode
8*, 15*, 31.5
12 (56cm), 16
Laser Diode, Diode
8*, 15*. 31.5,56
8
Helium-Neon/ Diodenarray (512 Dioden)
7 Grundlagen und Entwicklung der multifluorophoren Laser-Scanning-Technologie
141
7.6 Perspektiven in der Detektionstechnologie Die Entwicklung der Detektionstechnologie hat einen klaren Verlauf von Monomarkersystemen in verschiedenen Auspragungen hin zu den Multimarkersystemen mit simultaner Detektion aller Fluorophore genommen. Letztere ist mit Sicherheit als die ,,State of the art"-Technik der DNA-Analyse zu bezeichenen. Der momentane Stand der Technik ist aber sicherlich nicht der Endpunkt der Entwicklung dieser Technologie. Eine ganze Reihe von Weiterentwicklungen sind moglich. Die genauere Betrachtung der Systeme zeigt, dal3 sich mehrere Punkte fur Verbesserungen anbieten: 0
0 0
0 0
0
0
0
Entscheidung, ob mit Gelsystemen oder Kapillaren (Mikrochannel-Platten) weitergearbeitet wird, neue Gelchemien, neue Kapillarmedienchemien (z. B. verbesserte ungiftige, vernetzte Polymere), Herabsetzung der Nachweisgrenze fur Fluorophore, Neuentwicklung von Fluorophoren, langere Haltbarkeit von Fluorophoren (z. B. ist TexasRed (IRD40, IR-144) an Primern nur ca. 6 Monate stabil), Weiterentwicklung Lasertechnologie (z. B. Dioden und Feststofflaser fur weitere Farben), Ausweitung der Anzahl simultan detektierbarer Fluorophore, Ausweitung der Anzahl der Spuren pro Gel, Automatisierung bei der Beschickung von Gelen, Automatiserung bei der Verarbeitung der gewonnen Daten.
Die genannten Punkte fuhren zu einer weiteren Vereinfachung der Gerate und gleichzeitig zu einer Ausweitung des Anwendungsspektrums. So sind beispielsweise Multiplex-Sequenzierungen [12] auf Multimarkersystemen durch die simultane Aufzeichnung und Auswertung weiterer vier Farben aus dem detektierten Spektrum moglich. Methodische und quantitative Erweiterungen der Fragmentanalyse sind auf dem gleichen Weg realisierbar. Die Laser-Scanning-Technologiebesitzt vor allem in Verbindung mit der Detektion von Multimarkersystemen ein enormes Potential zur Weiterentwicklung und Ausweitung ihres Einsatzes bei weiteren Anwendungen. Dies stellt einen klaren Vorteil fur den Benutzer dieser Systeme dar, da die Weiterentwicklung auf der Basis der bestehenden Systeme stattfindet und dadurch jedem Anwender ohne Anderung der Gerate sofort verfugbar ist.
148
Giinter Mertes
7.7 Literatur [ l ] Laskea R.A., Mills A.D., ,,Enhanced autoradiographic detection of '*P and "'1 using intensifying screens and hypersensitized film" FEBS Letter 82 (1977), 314-316. [2] Swanstrom R., Shank P.R., X-ray identifying screens greatly enhance the detection by autoradiography of the radioactive isotopes 32Pand Iz5I Anal Biochem 86 (1978), 184-192. [3] Waring M.J., Complex formation between Ehtidium bromide and nucleic acids, J. Mol. Biol. 13 (1965), 269-282. [4] Recombinant DNA methology, eds. J.A.R. Dillon, A. Nasim, E.R. Nestmann, 1985, John Wiley & Sons, New York, 1985. [5] Lathrop et al., ,,Strategies for multilocus linkage analysis in humans" Proc.Natl.Acad.Sci. USA 81 (1984), 3443-3446. [6] Smith L.M., Jane Z.S., Kaiser R.K., Hughes P., Dodd C., Connell C.R., Heiner C., Kent B.H.K., Hood L.E., Fluorescence detection in automated DNA sequence analysis, Nature 321, No. 6071 (1986), 674-679. [7] Smith L.M., Fung S., Hunkerpillar M.W., Hunkerpillar T.J., Hood L.E., ,,The synthesis of oligonucleo tides containing an aliphatic amino group at the 5' terminus: synthesis of fluorescent DNA primers for use in DNA sequence analysis" Nucleic Acids Res. 13 (1985), 2399-241 2. [8] Sanger F., Nicklen S., Coulson A.R., ,,DNA Sequencing with chain-terminating inhibitors" Proc.Natl.Acad.Sci. USA 74( 12) (1977), 5463-5467. [9] Lee L.G., Connell C.R., Woo S.L., Cheng R.D., McArdle B.F., Fuller C.W., Halloran N.D., Wilson R.K., ,,DNA sequencing with dye-labeled terminators and T7 DNA polymerase: effects of dyes and dNTPs on incorporation of dye-terminators and probability analysis of termiantion fragments" Nucl. Acid. Res. 20 (1992), 2471-2483. [lo] Forster A.C., McInnes J.L., Skingle D.C., Symmons R.H., ,,Non-radioactive hybridisation probes prepared by the chemical labelling of DNA and RNA with a novel reagent, photobiotin" Nucleic Acids Res. 13 (1985), 745-761. [ l l ] Brumbaugh J., Middendorf L., Roemers S., Crone D., Steffens D., Sutter S., Gartide B., Humphrey P., Sorensen D., Miihlegger K., ,,Recent Advances in Infrared Fluoresecance DNA Sequencing" Refinded Mapping and Sequencing Techniques, Commercial Implications of the Human Genome Projekt, San Francisco, March 6-8, (1995). [ 121 Church G.M., Kieffer-Higgins S., ,,Multiplex DNA Sequencing" Science 240 (1988), 185188.
8 Datenverarbeitung in der genetischen Analyse Jorg vom Stein Die Automatisierung in der genetischen Analyse und deren Anwendung in der Routine erzeugt eine immer groBer werdende Datenflut. In der DNA-Sequenzierung lafit sich dies an dem exponentiellen Wachstum der weltweiten Datenbanken ablesen. Auch durch die zunehmenden Anwendungen der DNA-Fragmentanalyse und DNA-Sequenzierung in der Diagnostik und bei der generellen Typisierung von Genomen entstehen immer grofier werdende Datenmengen, die analysiert, organisiert und venvaltet werden mussen. Das folgende Kapitel stellt die wichtigsten Anforderungen und Arbeitsprozesse der Datenverarbeitung in der automatischen genetischen Analyse zusammen. Es geht dabei nicht um eine vollstandige und detaillierte Auflistung aller Verfahren und Methoden zur Auswertung von DNA-Sequenz- und Fragmentdaten. Es kann bei diesem Uberblick auch nicht auf den mathematischen Hintergrund der einzelnen Verfahren und Prozesse eingegangen werden. Ziel dieses Kapitels sol1 vielmehr sein, zusammenfassend und im Uberblick deutlich zu machen, welche Arbeitsprozesse bei der Auswertung von Daten aus der automatischen DNA-Sequenzierung und DNA-Fragmentanalyse zu berucksichtigen sind und welche spezifischen Anforderungen daraus resultieren. Weiterfuhrende Literatur findet sich im Rahmen der gezeigten Beispiele in den anderen Kapiteln.
8.1 Grundanforderungen: Integration, Automatisierung und Flexibilitat Bevor auf die einzelnen Teilprozesse der Analyse und Verarbeitung der Daten eingegangen wird, sollen zunachst einmal die wichtigsten Grundanforderungen kurz skizziert werden.
8.1.1 Integration In den vorhergehenden Kapiteln wurde mehrfach darauf hingewiesen, wie wichtig es ist, die Teilprozesse in der automatischen genetischen Analyse aufeinander abzustimmen und in den GesamtprozeB zu integrieren. Gleiches gilt auch fur die Verarbeitung und Analyse der Daten. Die im folgenden naher dargestellten Teil-
150
Jiirg voni Stein
bereiche der Datenverarbeitung wie z. B. Datenvisualisierung, Dateneditierung oder Datenanalyse sollten fur den Anwender zwar klar strukturiert und getrennt sein, aber der Anwender mu13 auch zu jedem Zeitpunkt auf die spezifischen Daten und Ergebnisse aller Teilbereiche zuruckgreifen konnen. So kann es zum Beispiel notwendig und sinnvoll sein, bei einem Vergleich verschiedener Sequenzen die Homologie (Ubereinstimmung zweier oder mehrerer Sequenzen) dadurch zu uberprufen, da13 man in kritischen Bereichen zuruck zu den Rohdaten (die ursprunglich von DNA-Sequenzern generierten DNA-Sequenzdaten) springt, um deren Qualitat und Eindeutigkeit zu uberprufen. Durch diese Integration der Rohdaten in eine sekundare Datenanalyse (z. B. Sequenzhomologieanalyse) kann man sehr effektiv und einfach die Qualitat dieser Analysen verbessern.
8.1.2 Automatisierung Gerade bei der Verarbeitung von groljeren Datenmengen kommen spezifische Abfolgen von Auswerteschritten (Auswerteroutinen) immer ofter vor. Diese immer wiederkehrenden Arbeitsschritte sollten durch den Anwender definierbar und damit als Auswerteroutine zu automatisieren sein. Die Definition dieser Auswerteroutinen sollte durch eine verstandliche und flexible Makrosprache moglich sein. Zum Beispiel ist ein groljer Teil der ermittelten DNA-Sequenzund DNA-Fragmentdaten fur die eigentliche Ergebnisanalyse nicht von Bedeutung. So ist es eine grolje Arbeitserleichterung und Effektivitatssteigerung, wenn man durch die Verwendung definierbare Datenfilter nur die Daten als Basis fur die weitergehenden Analysen zulant, die fur die zu erwartenden Ergebnisse relevant sind.
8.1.3 Flexibilitat Auch wenn die Grundprozesse in der Analyse und Verarbeitung von DNASequenz- und DNA-Fragmentdaten meistens sehr ahnlich sind, erfordern die immer breiteren Anwendungsbereiche der genetischen Analyse spezifische Anpassungen bzw. eine ausreichende Flexibilitat der Hard- und Software. Fur die Typisierung von Genomen mittels spezifischer kurzer DNA-Sequenzmuster (Sequenzmotive) und deren Vergleich mit spezifischen Datenbanken ist zum fur eine effektive Datenverarbeitung eine auf diese Anwendung spezialisierte Auswertungssoftware sehr hilfreich, die bereits die notwendigen Auswerteroutinen implementiert hat. Diese Software macht keinen generellen DNA-Sequenzhomologievergleich, sondern sucht spezifisch nur nach in einer Referenzdatenbank abgelegten kurzen Sequenzmotiven und zeigt die gefundenen Kombinationen an.
8 Datenverarbeitung in der genetischen Analyse
151
8.2 Einzelne Arbeitsprozesse der Datenverarbeitung in der genetischen Analyse Am Beispiel der automatischen DNA-Sequenzierung sollen die einzelnen Arbeitsprozesse der Datenverarbeitung kurz skizziert werden. Dabei wird davon ausgegangen, dal3 mit Hilfe eines multifluorophoren automatischen DNA-Sequenzierungssystems wie z. B. der ABI PrismTM 377 die Proben analysiert wurden.
8.2.1 Datenvisualisierung Generell konnen die Daten in drei Formaten visualisiert werden: 0 0
Gelbild, Chromatogramm, Sequenzcode.
Nach der Aufnahme der MeBwerte durch den Computer konnen die gewonnenen Daten im Uberblick betrachtet werden. Dies geschieht in der Form des sogenannten Gelbildes (Abb. 1).
Abb. 1. Darstellung der aufgenommenen MeRwerte in Form eines Gelbildes. Die abgebildeten Banden entsprechen der Farbmarkierung und Intensitat einzelner DNA-Bruchstiicke.
152
Jorg vorn Stein
Es dient dazu, eine erste Bewertung des Analyselaufs (Gelelektrophorese) vorzunehmen und zunachst die Qualitat der Daten visuell abzuschatzen. Bei aller aktuellen und auch zukunftigen Automatisierung der Datenanalyse ist diese erste manuelle Datenvisualisierung immer noch in einigen Fallen ein sinnvolles und wichtiges Hilfsmittel. So konnen wichtige Informationen uber mogliche Artefakte in der Gelelektrophorese nachvollzogen werden. AuBerdem 1aBt sich uberprufen und darstellen, welche MeBpunkte das System fur die anschlieBende Datenanalyse verwendet (Lane Tracking) und ob sie im Maximum der aufgetrennten DNA-Banden liegen. Die Datenvisualisierung fur die anschlieBende Editierung und Analyse findet in Form der Sequenzchromatogramme (Abb. 2) statt. Die Sequenzchromatogramme stellen die primaren analysierten Daten dar. Das Analysesystem hat durch spezifische Auswertung der MeBwerte die Basen den einzelnen Signalen zugeordnet und entsprechend im Chromatogramm-Stil dargestellt. Bei der Darstellung der einzelnen Datenpeaks sind bereits vom Analysesystem Korrekturen und Normalisierungen vorgenommen worden, um z. B.
1 1
I
A A C A T A C G AG C C G G A RG C A T A A A G TG T R A A G C C T G G G G T G C C T A A T 150 170 180 190 t 60
Abb. 2. Darstellung der aufgenommenen Daten in Form eines Sequenzchromatogramms Die MeBwerte fur die einzelnen DNA-Bruchstucke entsprechen in Farbmarkierung und Intensitat dem dargestellten Peakmuster.
8 Datenverarbeitung in der genetischen Analyse
153
Intensitatsunterschiede der verwendeten Fluoreszensfarbstoffe auszugleichen oder den Abstand der MeBsignale zu normalisieren und somit die Basenzuordnung genau und zuverlassig durchfuhren zu konnen. Vorhandene Signalstarkeunterschiede (Peakhohe) geben das relative Verhaltnis der Signale zueinander wieder, ohne eine genaue Quantifizierung zu ermoglichen. Die Datenvisualisierung in Form der Sequenzcodes stellt lediglich die Daten in Form der Buchstabencodes fur die einzelnen Basen dar. Dieses Datenformat kann z. B. auch Plattformubergreifend in andere Hard- und Softwaresysteme fur weitere Analysen exportiert werden.
8.2.2 Dateneditierung Das Editieren der von dem System analysierten Daten beschrankt sich bei der DNA-Sequenzierung im wesentlichen auf die Editierung der Basenzuordnung (Base Calling). Es ware mit einem automatischen Sequenzierungssystem allerdings kaum vereinbar, wenn jede Basenzuordnung des Systems manuell uberpruft werden muate. Demzufolge sollte das System Hilfen anbieten und nur die Sequenzbereiche fur eine Editierung anzeigen, die vorrangig editiert werden sollten. Ein Kriterium fur die Auswahl solcher Bereiche ware eine zu niedrige Signalhohe, die keine sichere Basenzuordnung durch das System ermoglicht, oder iiberlappende Signale, die ebenfalls eine sichere Zuordnung durch das System erschweren. Ferner sind auch manchmal solche Bereiche zu editieren, wo das automatische Base Calling durch spezifische ,,Problemsequenzen" erschwert wird. Das sind, wie bereits in den vorhergehenden Kapiteln beschrieben, z. B. GC-reiche Sequenzabschnitte und verschiedene ,,Repeat-Strukturen". Solche ,,problematischen" Bereiche konnen z. B. bei dem automatischen DNA-Sequenzierungssystem 377A angezeigt und vergleichend editiert werden. Bei der automatischen Anzeige dieser Stellen macht man sich die Eigenschaft des automatischen Base Callings zunutze, dalj nicht eindeutig zuzuordnende Basen von der Software mit einem ,,N" markiert werden. Diese ,,N" konnen nun von der Software gesucht und angezeigt werden . Bei der Editierung solcher Sequenzbereiche ist es von Vorteil, Vergleichssequenzen als Referenz zur Verfiigung zu haben. Diese Vergleichssequenzen sind z. B. ,,Gegenstrangsequenzierungen" oder andere vergleichende Sequenzierungen der gleichen Sequenz von verschiedenen Proben. Die Software erleichtert die Editierung dadurch, dalj alle entsprechenden Chromatogramme synchronisiert dargestellt werden konnen (Abb.3). Der Anwender kann nun auf einen Blick den gleichen Sequenzbereich bei verschiedenen Analyseproben betrachten und dadurch Entscheidungshilfen fur die endgiiltige Basenzuordnung in problematischen Bereichen erhalten. Das System bietet auch die Moglichkeit, die editierten Sequenzen von den ursprunglich analysierten Sequenzen getrennt abzuspeichern, so dalj der Zugriff auf die urspriinglichen Daten immer erhalten.
Jorg vom Stein
154
8.2.3 Datenanalyse Nach der ersten Datenvisualisierung und Dateneditierung ist nun die eigentliche Analyse der nachste Schritt auf dem Weg von den Daten zum Ergebnis. Sie lafit sich wiederum in verschiedene Teilschritte untergliedern: 0 0 0
Auswahl und Filterung der Daten, Spezifische Analyse, Dokumentation der Ergebnisse.
Durch die bereits beschriebene Dateneditierung wurde eine erste Optimierung der Daten fur die eigentlich spatere Analyse durchgefuhrt. Viele Daten sind aber fur diese Analyse gar nicht notwendig und somit uberflussig. Der Arbeits- bzw. Rechenaufwand wurde mit diesem ,,Datenballast" unnotig erhoht bzw. teilweise
-
-L
EIA
File- -Edit Seouences Find Uiew Alion -7 - -
-a-2. I
\
untitled 190
180
7
i l
-
?
-
. 210
200
220
230
I
1
C C A G G T C C A G
A T G
A W G C T C C C A G
A A T G C /
i 0,
3
I
"I
C
C
A
C
G
C
G
G
G
G
A
G
C
A
G
C
C
?A57
Abb. 3. Vergleichende Editierung von Sequenzdaten mit Hilfe der untereinander gelegten und abgeglichenen Sequenzchromatogramme einzelner Proben. Bei Markierung der gewunschten Sequenzabschnitte oben werden die entsprechenden Chromatogramme untereinander dargestellt, um die Dateneditierung zu erleichtern.
8 Datenverarbeitung in der genetischen Analyse
155
sogar die Analysequalitat gefahrdet. Beispiele sind Vektorsequenzen auBerhalb der ,,Cloning Sites" oder auch Sequenzen im 5'- und 3'-Endbereich, wo das Base Calling nicht mehr zuverlassig durchgefuhrt werden konnte. Die Software ,,Sequence NavigatorTM"fur das Sequenzierungssystem 377 bietet z. B. ein automatisches ,,Batch Processing" fur die automatische Datenfilterung. Der Anwender kann damit verschiedene Struktur- und Qualitatsparameter in Form eines Datenfilters festlegen und beliebig viele Sequenzen entsprechend automatisch bearbeiten lassen (Abb. 4).
4
File
Fdit
library
Sequence
Worksheet
Window
...I.*. ............................................................................................................................ H13HP18 Smal H13-21 i 801 i 701 1/20/101 1/450 *... ......................................................... i............................... .../ M13HP18 / Smal M13-21 / 801 / 1/20/101 / 1/450 70% ................................................................................................. :............................................................................................................................ .................. GREL 3 ...I M13MP18 ./ . . ................. Smal / M13-21 / 801 / 1/20/101 / .................... 1/450 / 701 ............................................................... *... ........................................................................................... .l.. ........................ GREL 4 .../ H13MP18 j Smal I M13-21 :I....................................................... 801 / 1/20/101 :.......................... I 70% 1/450 ........................................................................... :................................ :............................... GREL r 5 ...I n13MP18 Smal / ....................................................................................................................... H13-21 / 801 / 1/20/10X / 1/450 f.../ ..................... 701 .............................. *............................... *............................... GREL r 6 ...! n13HP18 i Smal H13-21 I 801 j 1/20/10% / 1/450 I .................... 701 ................................................................................................. ...................... .:................................................................................................. GREL r 7 ...: H13HP18 ! Smal ni3-21 j 804 1/20/10~ j 11450 701 ..................................................... *............................... *...................................................... *............................................................................................. GREL r 8 ...i M13HP18 ! Smal i H13-21 i 801 i 1 20 10% 1 450 I 701 GREL 1 ........................... GREL 2
...
i
~
f... i..
i..
~
-- -* H13HP18 Srnal H13-21 ~~
GREL 1 6R79 GREL 6R80 GREL GREL GREL 6R82 GREL GREL ~
~~
GREL GREL GREL GREL GREL GREL
Vs2F+Rb/M13 2 Us2F+Rb/M13 3 03 4 Vs2F+Rb/H13 r5 r5 r6 r6 r7 r? r8 r8
H13HP18 Smal
H13-21
M13MP18 Smal
H 13-2 1
M13MP18 Smal
M13-21
* * *
H13HP18 Srnal
H13-21
*
n13MP18 Smal
H13-21
*
M13HP18 Smal
M13-21
1-7
M13HP18 Smal
M13-21
*
~
1-28 432-45 1 1-32 440-45 1 1-41 44 1-447 1-35 1-19 430-468 1-13 453-464 1-19 424-469 1-38
1-450
-29-431
403
1-450
33-439
407
45 1 45 1
1-44?
42-440
399
447
1-448
36-448
413
448
1-450
20-429
410
468
1-450
14-450
437
464
1-450
20-423
404
469
1-450
39-450
412
469
4S6-460
Abb. 4. Prozessierung und Filterung von Sequenzdaten mit Hilfe eines automatisierten Verfahrens. Die Kriterien fur die Filterung der Daten konnen tabellarisch eingegeben werden (oben). Nach diesen Kriterien werden alle vorgesehenen Daten nacheinander prozessiert. Das Ergebnis dieser Datenfilterung wird in einem tabellarischen Bericht zusammenfassend dargestellt.
Die durch diesen Arbeitsgang ,,bereinigten" Sequenzen stellen dann die essentielle und optimierte Datenmenge fur die eigentlichen Analysen dar. Die am haufigsten durchgefuhrten Sequenzanalysen lassen sich in folgende Rubriken einteilen: Sequenzalignment und Homologieanalysen, Sequenzassembling und Konsensussequenzgenerierung, Datenbanksuche,
156
Jorg vorn Stein
Sequenzstruktur und Motiv-Analyse, Analyse des Informationsgehalts von DNA-Sequenzen. Bei allen aufgefuhrten Analysemethoden ist die vorher erwahnte Dateneditierung und Filterung hilfreich, weil sie bei den grol3en Datenmengen in der automatischen DNA-Sequenzierung den Arbeitsaufwand reduziert und die Eindeutigkeit der Ergebnisse verbessert. Die standige Zugriffsmoglichkeit auf die ursprunglich vom System analysierten Daten durch eine geeignete Software ist dabei besonders wichtig und hilfreich. Im folgenden sollen die einzelnen Analysemethoden nur kurz beschrieben werden. Einzelne Methoden werden im Zusammenhang der in Kap. 9-14 beschriebenen Praxisbeispiele ausfuhrlicher dargestellt.
8.2.3.1 Sequenzalignment und Homologieanalysen Sol1 die Ahnlichkeit zweier oder mehrerer Sequenzen analysiert werden, so kann sie in Prozent-Homologie ausgegeben werden oder in verschiedenen graphischen Darstellungsformen. Unter dem Sequenzalignment versteht man die parallele Angleichung zweier Sequenzen bzw. beim ,,multiple Alignment" von mehreren Sequenzen. Ziel ist es wiederum, die Ahnlichkeit der verglichenen Sequenzen zu analysieren. Besonders hilfreich beim ,,multiplen" Alignment ist die graphische Darstellung der verschiedenen Sequenzen untereinander und der dabei mogliche Zugriff auf die entsprechenden Chromatogrammdaten von DNA-Sequencern (Abb. 5 ) .
-L
File
Edit
I
I
1
I
Sequences
100
Find
View
110
Rlign
120
130
140
150
I 1
AGCCCAGACG G M C C G T A G C X C C C T C G T AGGlTlTCTG GGAAGGGACA GAAGATGACA 160
170
180
190
~;AACAA& ACCCAGGTC: AGATGA~GC+ TGAACMTGG TKACTGAAG ACCCAGGTCC AGATGAAGCT CICCCCCArXIA GCCCGCTCGT GCAGGGGCCG CCGGTCTAGG G-XGCCArAA GGGGGCTCGT GCACXCCCCG CCGGTGTACXI
I
I
I
I
290
2! 0
C C C A G A A T ~ CAGAGGCTG? CCCAGAA'DGC CACAGGC'DGC AGC'IchTCGT GCACGGGCCA AGCTGCTCGT GCAGGGGCCA
220 230 24 0 25 0 26 0 270 I 1 I I I I TCCCC-CGTG GCCCCTGCAC CAGCAGCTCC TACACCGGCb LvNCCCTGCAI CAGCCCCCTC X C C C G C G T G GCCCCTGCAC CAGCAGCTCC TACACCGGCG GCCCCTL-AC C A G C C C C C X CG-GGGGAGC A G C C X W K A'TKTGGGAG C'TTCATCTGG A C C X G G T C T T C A C T C M C C CGCGCCCAGC AGCiTC'lljCX A'TKTGGCAG C'TTCATCTGG ACCTGGGTCT TCACTGAACC 28 0
29 0
300
31 0
320
Abb. 5. Darstellung der Daten nach Sequenzalignment durch die Software.
330
I I I I I I
8 Datenverarbeitung in der genetischen Analyse
157
Dadurch lassen sich an ,,kritischen" Stellen, wo die Homologie oder Inhomologie uberpruft werden soll, die entsprechenden Ursprungsdaten zur endgultigen Aussage heranziehen. Auf die genauen und auch unterschiedlichen mathematischen Verfahren zur Homologieanalyse soll an dieser Stelle nicht eingegangen werden. Es wird am Ende des Kapitels auf die weiterfuhrende Literatur hingewiesen.
8.2.3.2 Sequenzassembling und Konsensussequenz-Generierung Unter Assemblierung versteht man die Analyse und Suche nach Uberlappungen von Einzelsequenzen am 5'- und 3'-Ende zu Bildung einer sogenannten ,,Konsensussequenz". Fur die Analyse der Uberlappungen von zwei Sequenzen kann man Parameter benennen, die z. B. ein MindestmaB an Homologie zwischen dem 3'Ende der ersten und dem 5'-Ende der zweiten Sequenz festlegen. So kann man sich mit verschiedenen Parametern dem optimalen Ergebnis nahern. Grundsatzlich gibt es auch bei der Assemblierung unterschiedliche mathematische Verfahren, die auf verschiedenen Algorithmen beruhen. Es wird hier ebenfalls auf die weiterfuhrende Literatur am Ende des Kapitels hingewiesen. Die Ergebnisse der Assemblierung konnen meist sowohl graphisch als auch in Form der beteiligten Sequenzcodes dargestellt werden. In den Uberlappungsregionen ist es wiederum hilfreich, wenn zur Klarung kritischer Sequenzhomologien auf die vom DNASequencer ursprunglich analysierten Sequenzchromatogramme zuruckgegriffen werden kann. Wie am Beispiel der MacAssemblerTMSoftware
8.2.3.3 Datenbanksuche Eine der haufigsten Sequenzanalysen ist sicherlich die Datenbanksuche: ,,Ist die analysierte Sequenz schon in der Datenbank enthalten?" ,,Zeigt die analysierte Sequenz signifikante Homologien zu bereits anderen analysierten und sequenzierten Genen oder regulatorischen Sequenzen?" Das sind die gangigsten Fragen bei der Datenbanksuche. Umfangreiche Sequenzhomologieanalysen gegen die gesamten bisher analysierten DNA-Sequenzen geben einen sehr guten AufschluB iiber den moglichen Informationsgehalt und eventuellen Ursprung einer bisher unbekannten Sequenz. Um diese sehr haufigen Analysen so einfach und effektiv wie moglich zu machen, mussen die Daten aus der automatischen DNA-Sequenzierung zwei wesentliche Voraussetzungen erfiillen. Zum einen miissen die Daten so editiert und von ,,unspezifischen" Sequenzen befreit sein, daB nur die gewiinschte spezifische und eindeutige Sequenz zur Datenbankanalyse verwendet wird. Zum anderen sollten die Daten nach der Editierung und Filterung in einem Datenformat abgelegt werden, daB sie direkt zu den Formaten der gangigsten Datenbanken kompatibel sind. Dies betrifft nicht nur die reine Sequenzinformation, sondern auch die in jeder Datenbank zu einer Sequenz gehorigen Sekundarinformationen, wie Art, Herkunft und Urheber der Sequenz, die auch ,,Annotations" genannt werden. Gerade im Zusammenspiel der automatischen DNA-Sequenzierung und der Datenbankanalyse ist die Automatisierung der einzelnen Analysen von groBer
158
Jiirg v ~ n Stein i
Bedeutung. Die serielle Abarbeitung von Datenbankabfragen im sogenannten ,,Batchmode" (serielle Bearbeitung einzelner Datenanalysen hintereinander) ist ein wichtiges Kriterium fur eine automatisierte Datenverarbeitung in der genetischen Analyse. Daruber hinaus ist nicht nur die Arbeit rnit den grol3en offentlichen Datenbanken von Bedeutung. Auch der Aufbau und die Verwendung von eigenen spezifischen Datenbanken kann von Bedeutung sein. Ein komplettes Hard- und Softwaresystem zur Datenbankanalyse sollte gerade im Zusammenhang rnit den verschiedenen Einsatzmoglichkeiten der automatischen Sequenzierung solche Optionen beinhalten.
8.2.3.4 Sequenzstruktur- und Motivanalyse Nicht nur der Vergleich der gesamten Sequenzinformation rnit dem Inhalt einer Datenbank kann von Interesse sein, sondern auch die Suche nach bestimmten Sequenzstrukturen bzw. Sequenzmotiven. Findet man z. B. einen kurzen Sequenzabschnitt von 2-30 Basen, der sich mehrfach wiederholt, so spricht man von einer ,,Sequenzwiederholung" oder von einem ,,Repeat". Von bestimmten Repeat-Strukturen weiR man, dalj sie entweder eine regulatorische Funktion haben oder charakteristisch fur bestimmte Genome und Genotypen sind. Mit diesem Hintergrund ist es dementsprechend interessant, solchen neu oder leicht modifizierten Strukturen auf ihr Vorkommen in oder in der Nahe von anderen Genen zu suchen. Um diese Sequenzmotive bei einer Datenbankabfrage moglichst eindeutig, aber trotzdem rnit einer gewissen Variabilitat definieren zu konnen, ist es vorteilhaft, nicht nur einfach einen kurzen Sequenzabschnitt als Suchkriterium fur die Datenbankabfrage angeben zu konnen, sondern zusatzlich auch verschiedene andere Parameter in Form von Variablen oder Makros. Mit Hilfe dieser Makrosprache lassen sich sehr einfach auch kompliziertere Datenbankabfragen formulieren.
8.2.3.5 Analyse des Informationsgehalts von DNA-Sequenzen Die biologische Information einer DNA-Sequenz bzw. eines Gens wird erst durch die Ubersetzung in die Aminosauresequenz deutlich. Deswegen ist die Suche nach solchen kodierenden Abschnitten (Genen) innerhalb groljerer Sequenzdatenmengen ebenfalls ein zentraler Bestandteil der Datenverarbeitung. Die Suche beginnt ublicherweise mit der Analyse von potentiellen ,,offenen Leserastern" (ORF: Open Reading Frames) innerhalb der zu analysierenden Sequenz. Sie zeigt Sequenzbereiche, die mit einem potentiellen Startcodon beginnen und rnit einem Stopcodon enden, also die minimalen Kriterien fur eine kodierende DNASequenz. Daruber hinaus kann gezielt auch nach regulatorischen Sequenzen gesucht werden, die fur ein funktionstuchtiges Gen ebenfalls ein notwendiges Kriterium darstellen. Die Ubersetzung der O R F rnit allen moglichen Leserastern in eine Aminosauresequenz erlaubt dann die Datenbankabfrage dieser Proteinsequenz in einer Proteindatenbank.
8 Datenverarbeitung in der genetischen Analyse
159
8.2.4 Datenarchivierunflatenbanken Die Datenarchivierung oder das Anlegen von eigenen, spezifischen Datenbanken richtet sich nach den spezifischen Erfordernissen der durchgefuhrten genetischen Analysen. Das betrifft sowohl die Art der archivierten Daten als auch die Art der Archivierung selber. Wie bereits am Beginn dieses Kapitels dargestellt, unterscheidet man bei der automatischen genetischen Analyse grundsatzlich drei verschiedene Datentypen: Gelbild: entspricht den vom Analysesystem aufgenommenen MeBwerten, Chromatogramme: entspricht den vom Analysesystem aus den MeBwerten analysierten Daten, Sequenz- bzw. Fragmentdaten: entspricht den vom Analysesystem aus den Chromatogrammen analysierten Enddaten, wie z. B. die Basensequenz oder die FragmentgroBen. Je nach Anwendungsgebiet der genetischen Analyse ist es sinnvoll, nur eine bestimmte Art der beschriebenen Daten zu archivieren oder aber mehrere. Aus okonomischen und Effektivitatsgrunden sollte grundsatzlich nach der Datenvisualisierung und Dateneditierung nur die eigentlichen und demnach abgesicherten Sequenz- oder Fragmentdaten archiviert werden. Die Gelbilder und Chromatogramme waren gunstigerweise, auch wegen ihres hohen Speicherbedarfs, zu loschen. Es gibt aber Anwendungsgebiete, wo die Daten besonders sicherheitsrelevant oder von entscheidender Bedeutung fur z. B. einen Patienten sind. Ein solches Anwendungsgebiet ist die Forensik, wo bestimmte genetische Analysen groBe Konsequenzen fur ein Strafverfahren haben konnen. Ergebnisse mussen in diesen Fallen auch noch in Jahren reproduzierbar nachzuvollziehen sein. Daher kann es Sinn machen, bei diesen Proben auch die Gelbilder zu analysieren, um in Zweifelsfallen den ProzeB von den MeBdaten zum analysierten Ergebnis jederzeit reproduzieren zu konnen. In einem anderen Anwendungsgebiet, der medizinischen Diagnostik, kann von einer analysierten Sequenz ein bedeutungsvoller Befund fur einen Patienten abhangen. Im Falle der zugrundeliegenden DNASequenzierungen ist es zwar nicht sinnvoll, die Gelbilder zu archivieren, aber doch die Sequenzierungschromatogramme. Gegenuber den reinen Sequenzdaten (Buchstabencode) laBt sich anhand der Chromatogramme in Zweifelsfallen die Eindeutigkeit einzelner Ergebnisse uberpriifen oder eine erneute Analyse zur Klarung ableiten. So wird also die Frage, welche Datenart zu archivieren ist, in erster Linie von den Notwendigkeiten des spezifischen Anwendungsgebietes bestimmt und in zweiter Linie erst von Kriterien der Okonomie und Effektivitat. Bei der Art der Archivierung stehen allerdings Effektivitat und Flexibilitat im Vordergrund. Sollen eigene Datenbanken angelegt werden, ist die Wahl des Datenformats von wesentlicher Bedeutung. So muB insbesondere die Kompatibilitat zu den wichtigsten offentlichen Datenbankanbietern gewahrleistet sein.
160
Jorg vom Stein
8.3 Spezifische Anforderungen bei der Analyse von DNA-Fragmentdaten Die in Abschnitt 8.2 dargestellten Teilbereiche und Anforderungen der Datenanalyse fur die automatische DNA-Sequenzierung gelten grundsatzlich auch fur die Analyse von DNA-Fragmentdaten. Es gibt aber auch spezifische Anforderungen, die in der Natur dieser DNA-Fragmentdaten liegen. Die Detektion von DNA-Fragmentdaten mit den in diesem Buch beschriebenen automatischen Analysesystemen liefert z. B. bei einem multifluorophoren System ABI PRISM'" DNA-Sequenzer 377 mit der GeneScan-Analyse Software folgende Informationen: Farbmarkierung des DNA-Fragments, FragmentgroBe, relative Quantifizierung durch die Peakflache und Peakhohe des detektierten Fragments. Der Informationsgehalt von DNA-Fragmentdaten ist ebenfalls sehr komplex, da es bei der Analyse von Proben um die Betrachtung des gesamten Fragmentmusters (GroBenverteilung aller in einer Probe vorhandenen DNA-Fragmente) geht (Abb. 7). Damit wird die Mustererkennung bzw. die Musteranalyse verschiedener Proben zu einer zentralen Aufgabe fur die Datenanalyse von DNA-Fragmentdaten.
Abb. 6. Darstellung der bei der Fragmentanalyse aufgemommenen Daten in Form eines Gelbildes.
8 Datenverarbeitung in der genetischen Analyse
161
Die primare Datenanalyse mit den bereits beschriebenen Teilbereichen Datenvisualisierung, Dateneditierung und Datenfilterung ahnelt prinzipiell der beschriebenen Durchfuhrung bei der DNA-Sequenzierung. Erst die vergleichende Analyse von Fragmentmustern bringt aufgrund der Komplexitat des Informationsgehaltes neue Anforderungen an die Analyse dieser Daten. Die Software GenotyperTMvereinigt z. B. die notwendigen Werkzeuge fur die Verarbeitung und Analyse von DNA-Fragmentdaten. Zunachst ubernimmt die Software Daten von den automatischen Analysesystemen und ermoglicht die multiple und vergleichende Editierung der einzelnen Fragmentmuster verschiedener Proben (Abb. 7). Die Dateneditierung fiihrt dann zu einer Filterung der Daten. Wie bei der DNA-Sequenzanalyse kann auch hierbei die Datenanalyse durch eine integrierte Makrosprache automatisiert werden. So kann der Anwender definieren, welche DNA-Fragmente (Muster) in welchem Grofienbereich, mit welcher Farbstoffmarkierung und welcher Signalhohe ihn interessieren. Die Software arbeitet dann die ausgewahlten Datensatze nach diesen Kriterien ab und zeigt dem Anwender die ,,bereinigten" Daten zu einem Fragmentmustervergleich an (Abb. 8). Dieser Fragmentmustervergleich kann nun in einem zweiten Schritt ebenfalls weiter automatisiert durchgefiihrt werden, indem nach vorher-
-._._
R .
c
t-'W
,-.
Abb. 7. Softwareunterstiitzte vergleichende Auswertung von Fragmentmustern: Die Peaks entsprechenden einzelnen analysierten DNA-Fragmenten. Die Software gleicht die einzelnen Fragmentmuster nach der GroRe ab, um die vergleichende Analyse zu erleichtern.
162
Jorg vorn Stein
Abb. 8. Softwareunterstutzte Auswertung der Fragmentmuster: Aus der vergleichenden Analyse (Abb. 7) werden die Ergebnisse so tabellarisch zusammengestellt, da sie fur weitergehende Analysen verwendbar sind. Hier sind die Informationen uber die relevanten DNA-Fragmente zusammenfassend dargestellt.
gehender Definition bestimmte Fragmentmustercharakteristika tabellarisch und vergleichend dargestellt werden und z. B. auch fur weitergehende Analysen mit zusatzlicher Software exportiert werden konnen.
8.4 Kriterien fur die Auswahl der Hard- und Software Es sol1 an dieser Stelle abschlieljend auf drei grundsatzliche Kriterien fur die Auswahl der entsprechenden Hard- und Software eingegangen werden.
8 Datenverarbeitung in der genetischen Analyse
163
8.4.1 Plattformiibergreifendes Arbeiten Die Computer-Hardware ist leider teilweise noch immer technisch sehr unterschiedlich und nur eingeschrankt kompatibel. Es setzen sich aber zunehmend neue Standards durch, die ein plattforrnubergreifendes Arbeiten in der Datenanalyse ermoglichen. Diese Standards berucksichtigen neueste Entwicklungen der Hardware wie auch des weltweiten Datentransfers mit elektronischen MailNetzwerksystemen. Diese Aspekte sollten bei der Auswahl von Hard- und Software berucksichtigt werden, um auch langerfristig weltweit in der Datenanalyse kompatibel zu sein.
8.4.2 Erweiterbarkeit Ein Kriterium bei der Einrichtung eines Arbeitsplatzes mit Hard- und Software fur die Datenanalyse ist die Datenmenge, die verarbeitet werden muB. Der Zuwachs der Datenmenge und die spezifischen Anforderungen der Einsatzgebiete sind ein sehr dynamischer ProzeB, auf den entsprechend reagiert werden muB. So ist bei der Hard- und Software zu berucksichtigen, dal3 sie gewachsenen Datenmengen und geanderten Anforderungen entsprechend anpassungsfahig ist. Am Anfang kann z. B ein Einzelplatzrechner mit der entsprechenden Software vollkommen ausreichend sein. Bei gewachsenem Bedarf ware es dann aber sinnvoll, auf ein ,,Client-Server"-Netzwerk zu erweitern, wo ein leistungsfahiger Server die wesentliche Rechenarbeit ubernimmt und die ,,Clients" (Einzelplatzrechner) als Bedienungsoberflache und fur kleinere Rechenarbeiten zur Verfugung stehen. Die entsprechende Software fur die Datenanalyse sollte bereits so konzipiert sein, daB fur die Server-Client-Erweiterung nur ein entsprechender Update notwendig ist. Die nachste Wachstumsstufe ist dann notwendig, wenn entweder noch mehr Anwender in einem Netzwerk arbeiten mochten oder die Datenmengen so angewachsen sind, dal3 selbst eine leistungsstarke Workstation nicht mehr ausreicht. Dann ist es sinnvoll, die Hauptrechenarbeit an einen Zentralrechner mit Parallel-Prozessor-Technologieauszulagern, wobei die grundsatzliche ClientServer-Architektur dabei aber erhalten bleibt. Bei einem entsprechenden Hardund Softwaresystem fur die Datenanalyse ware dazu auch nur ein SoftwareUpdate und die entsprechende Hardware notwendig. Das Konzept der Erweiterbarkeit mit minimalen Neuinvestionen ist ein wichtiges Kriterium bei der Auswahl der Hard- und Software fur die Datenanalyse in der automatischen genetischen Analyse.
164
Jiirg vonz Stein
8.4.3 Netzwerkfahigkeit Die Netzwerkfahigkeit eines Hard- und Softwaresystems ist unter dem Kriterium Erweiterbarkeit bereits angesprochen worden. Sie ist ein wesentliches Kriterium fur die Auswahl der Hard- und Software. Fur ein effektives und bedienungsfreundliches Arbeiten in der Datenanalyse ist ein kleineres bis mittleres Netzwerk fast schon eine zwingende Voraussetzung, da in den seltensten Fallen automatische Analysesysteme nur von einem Anwender in Anspruch genommen werden. Auch die Dezentralisierung von Systemsteuerung, Analyse und Datenauswertung in einem Labor bzw. lnstitut ermoglicht eine effizientere und flexiblere Arbeitsorganisation.
8.5 Sicherheit der Datenverarbeitung Wie schon bereits bei der Datenarchivierung angesprochen, gibt es Anwendungsgebiete der automatischen genetischen Analyse, deren Daten besonders sicherheitsrelevant sind. Dabei wurden die Bereiche der Forensik und medizinischen Diagnostik bereit kurz erwahnt. Generell mu13 der Datenschutz und damit auch die Datensicherheit im Gesamtzusammenhang der ganzen Labororganisation und Probenbehandlung gesehen werden. Gerade in dem noch jungen Anwendungsbereich der molekularen automatischen DNA-Analyse besteht sicher in diesem Bereich noch Nachholbedarf, um z. B. auch in der Entwicklung von Analysesystemen mit der entsprechenden Software diese Aspekte ausreichend mit zu berucksichtigen. Dabei sollte die kodierte Proben- und Datenkennung ebenso eingearbeitet werden wie ein auf Zugangscodes beruhendes Sicherheitssystem beim Datenzugriff.
9 Identifizierung von Genen und Markern Norbert Speich, Karl-Heinz Grzeschik
Die medizinische Genetik erlebt auf dem Gebiet der Forschung eine Revolution, deren Auswirkungen stark genug sein werden, die Medizin insgesamt auf eine neue Grundlage zuruckzufuhren: Eine wilde Genjagd durchstreift auf breiter Front alle Chromosomen rnit dem Ziel, in kurzer Zeit alle Gene des Menschen zu finden, ihre Sequenz zu lesen und daraus Information sowie Material fur die funktionelle Analyse bereitzustellen. Ein wesentliches Moment dieses Aufbruchs resultiert aus der Erkenntnis, da die natiirlich vorkommende Variation der DNA-Sequenzen beim Menschen (wie bei allen Lebewesen) ein schier unerschopfliches Reservoir an genetischen Markern liefert. Dieses macht es moglich, Gene des Menschen ohne biologischen Hinweis auf ihre Funktion zu entdecken, indem in der genetischen Kartierung Vererbungsmuster von Merkmalen bei Verwandten systematisch rnit dem Vererbungsmuster einzelner Chromosomenregionen verglichen werden. Zunachst gelang es so, die wichtigsten Gene aufzufinden, deren Veranderungen unmittelbar fur Erkrankungen verantwortlich sind und deren Erbgang den Mendelschen Regeln folgt. Inzwischen wagt man sich erfolgreich an die Analyse komplexer Erbeigenschaften, die durch das Zusammenwirken mehrerer Gene bestimmt werden, und von denen viele Erkrankungen rnit besonderer medizinischer Relevanz mitbedingt werden, wie Pradisposition fur Herzkrankheiten, Bluthochdruck, Diabetes, Krebs und Infektionen. Die Strategien und Ergebnisse dieser Forschung gewinnen Bedeutung nicht nur fur die medizinische Genetik, sondern zum Beispiel auch fur grundlegende Untersuchungen der Saugetierentwicklung und fur bedeutende angewandte Forschungsarbeiten rnit dem Ziel von Verbesserungen im landwirtschaftlichen Bereich. Die Erfolge bei der Genjagd sind untrennbar verbunden mit der Entwicklung revolutionarer Methoden, wie der molekularbiologischen Klonierung und der Polymerase-Kettenreaktion (PCR), sowie von Geraten, die die Laborarbeit rnit diesen Methoden automatisieren. Besonders apparative Entwicklungen zur Automation von Probenvorbereitung und Analyse haben kurzlich zu einer Explosion im Angebot hochinformativer genetischer Marker gefuhrt. Mehrere Gruppen sind dabei, das vor kurzem noch fast unvorstellbare Vorgehen Routine werden zu lassen, in wenigen Tagen alle Chromosomen auf ein Gen hin abzusuchen. Wir wollen im folgenden beschreiben, wie die Markerpunkte fur das zur Genjagd notwendige genetische Raster gefunden und definiert werden, und beispielhaft das Vorgehen bei der Suche nach Genen darstellen.
166
Norbert Speich, Karl-Heinz Grzeschik
9.1 Genetische Kartierung Die DNA im Kern einer menschlichen Korperzelle ist unterteilt in 46 Chromosomen, 22 gleichartige Paare, die Autosomen, sowie die Geschlechtschromosomen, das X-Chromosom und das davon weitgehend verschiedene Y-Chromosom. Manner besitzen ein X-Chromosom und ein Y-Chromosom (XU), Frauen hingegen haben zwei X-Chromosomen (XX) in jeder Zelle. Jeder Mensch tragt in allen kernhaltigen Korperzellen also zwei Kopien eines Chromosoms (mit Ausnahme der mannlichen XY-Konstellation), von denen er jeweils eine von jedem Elternteil erhalt. Bei der Bildung der Keimzellen verdoppeln und paaren sich die homologen Chromosomen in der Meiose und werden dann auf die entstehenden Tochterzellen verteilt. So entwickelt sich aus dem ursprunglich doppelten (diploiden) Chromosomensatz der Korperzellen der einfache (haploide) Chromosomensatz der Keimzellen. Die miitterlichen oder vaterlichen Chromosomen jeder Zelle werden dabei zufallig auf die Gameten (Ei- oder Samenzellen) verteilt. Die Vererbung von Erbanlagen, die vom GroBvater oder der GroBmutter stammen, uber Vater oder Mutter auf Enkelkinder erfolgt also gekoppelt, ,,im Paket" gemeinsam mit den anderen Anlagen eines bestimmten Chromosoms. Zusatzlich lauft wahrend der Meiose der Proze13 des Crossover ab, ein Austauschvorgang von Material der Chromosomen eines Chromosomenpaares. Bei diesem Rekombination genannten Vorgang tauschen das maternale Chromosom und das danebenliegende paternale Chromosom einander entsprechende Bereiche aus and kombinieren die Chromosomen so neu. Diese Rekombination bricht die ursprungliche Anordnung in einheitlich vaterliche und mutterliche Reihen von Erbanlagen auf, arbeitet also gegensinnig zur gekoppelten Weitergabe. Beide Vorgange, die gekoppelte Vererbung und das Aufbrechen der Kopplung durch Crossover, bilden die Grundlage der Kopplungsanalyse zur Lokalisierung von Genen. Insgesamt ist es das haufigere Ereignis, da Gene, die gemeinsam auf einem Chromosom liegen, gemeinsam weitergegeben werden. Demgegenuber ist das Unterbrechen der urspriinglich linearen Aufreihung durch die Rekombination selten, und zwar um so seltener, je enger zwei Gene in der Reihe benachbart sind. Liegen Gene auf einem Chromsom aber weit voneinander entfernt, kann die Rekombination zwischen ihnen so haufig sein, da sie als ungekoppelt erscheinen. Kann man vaterliche und mutterliche Gene unterscheiden und bei den Nachkommen wiedererkennen, erlaubt das Auszahlen dieser unterschiedlichen Merkmale bei den Nachkommen die Feststellung, welche Gene gemeinsam zu einem ,,Chromosomenpaket" gehoren, also gekoppelt sind, und dariiber hinaus, wie eng die Kopplung auf einem Chromosom ist. Die Haufigkeit der Rekombination zwischen zwei Genorten wird als Ma13 zur Bestimmung der genetischen Distanz auf dem Chromosom genutzt. Eine Rekombinationshaufigkeit von 1% der Meiosen entspricht der Einheit eines Centimorgan (cM). Eine Aussage zur Zuverlassigkeit
9 Identifizierung von Genen und Markern
167
der Kopplungsberechnungen erlaubt der Lod-Wert (Logarithm of the odds), zu dessen Bestimmung die Annahme der Kopplung der Annahme ,,nichtgekoppelt" gegenubergesetzt wird. Eine Einfuhrung in die Theorie dieser Berechnung findet sich in [l]. Um die Vorgange der Auswahl des vaterlichen oder mutterlichen Chromosoms jedes einzelnen Chromosomenpaares und die Neukombination der ursprunglichen Reihenfolgen durch Untersuchung der Nachkommen nachvollziehen zu konnen, ist es gunstig, die jeweils vier Chromosomen (zwei vorn Vater, zwei von der Mutter), aus denen zwei ausgewahlt und vererbt werden, in ihrer gesamten Lange voneinander unterscheiden zu konnen, als waren sie unterschiedlich angefarbt. Der Durchbruch bei der Jagd nach Genen im menschlichen Erbgut wurde moglich, als dieser Wunsch in Erfullung ging. Die naturlich vorkommenden Basensequenzunterschiede in Abschnitten der DNA der Chromosomen sind so vielfaltig, da die Chromosomen eines Chromsomenpaares jeder Zelle sowohl in ihrer gesamten Lange als auch innerhalb kleiner Abschnitte unterscheidbar sind [2]. Die unterschiedlichen Folgen der Sequenz, die an den einander entsprechenden Orten (homologen Loci) eines Chromosomenpaares vorkommen, nennt man Allele. Solche unterscheidbaren Chromosomenabschnitte werden als genetische Marker verwendet, wenn sie polymorph sind, d. h. wenn mindestens zwei Allele vorkommen, von denen das seltenere in einer Stichprobe der Bevolkerung mindestens einmal unter 100 Chromosomen vorkommt. Jedoch sind erst hochinformative Marker, bei denen zahlreiche Allele mit etwa gleicher Haufigkeit in der Bevolkerung gefunden werden, fur die zuverlassige Unterscheidung von Chromosomen eines Paares geeignet. Der Informationsgehalt des polymorphen Markerabschnitts eines Chromosoms ergibt sich aus der Heterozygositiit, in deren Bestimmung die Parameter Allelanzahl und -haufigkeit eingehen. Die Variabilitat in allelen Bereichen der Chromosornen ist besonders hoch an Orten, an denen Wiederholungen von 2-, 3-, oder 4-Basenpaarenfolgen, zum Beispiel (CA),, (CAA), oder (GAAA),, auftreten. Diese Mikrosatelliten oder STR (Short Interspersed Tandem Repeats) genannten Bereiche sind relativ gleichmaBig uber das Genorn hin verteilt, sehr haufig hochpolymorph und einer sehr schnellen Analyse mittels PCR zuganglich. Man schutzt, da es im menschlichen Genom mehr als 100000 solcher Abschnitte gibt. Mit Ausnahme der (A),- bzw. (T),-Multimere sind die Dinukleotidrepetitionen (CA), bzw. (GT), die haufigsten Mikrosatelliten, die im menschlichen Genom gefunden werden. Die Variabilitat eines bestimmten Mikrosatelliten-Locus innerhalb der Bevolkerung steigt mit dem Faktor n, d. h. je grol3er die Anzahl der Wiederholungen eines Motivs, desto hoher ist die Wahrscheinlichkeit, da viele unterschiedliche Allele an einem Locus gefunden werden [3]. Die Allele unterscheiden sich in der Anzahl (n) der Wiederholungen der einzelnen Motive, wobei n beispielsweise zwischen 5 und 60 variieren kann. Die Zusammenstellung der jeweils 2 Allele eines Chromsomenpaares auf einem Locus ist der Genotyp. Die Reihenfolge einzelner Allele benachbarter Loci auf einem Chromosom nennt man einen Haplotyp.
168
Norbert Speich, Karl-Heinz Grzeschik
9.2 Kartierung von genetischen Markern Damit ein Mikrosatellit als genetischer Marker verwendet werden kann, mu6 sein Informationsgehalt (Heterozygositiit), seine Lage auf einem bestimmten Chromsomenabschnitt und sein genetischer Abstand in cM von den nachsten Markerpunkten des Rasters bestimmt werden. Zur Bezeichnung der Marker hat man sich auf ein Nomenklatursystem mit DNummern (DNA-Elementnummern) geeinigt: Jeder Marker erhalt nach dem Buchstaben D die Nummer des Chromosoms, auf dem er liegt, ein S, wenn das Segment einmal im Genom vorkommt, und eine fortlaufende Nummer, die von der Genome Database (GDB) an der Johns Hopkins Universitat vergeben wird (z. B. D7S484). Diese Datenbank stellt der wissenschaftlichen Gemeinschaft auch Information uber die Charakteristika des Markers, PCR-Primersequenzen fur seine Amplifikation, PCR-Bedingungen und erklarende Literaturzitate zur Verfugung (zu erreichen z. B. uber WWW (World Wide Web) unter der Adresse http:// gdbwww.gdb.org). Zahlreiche Forscher haben in den letzten Jahren eine Fulle solcher Polymorphismen beschrieben. Die umfangreichsten Beitrage stammen vom franzosischen Genethon, einem Forschungsinstitut, das aus Spendenmitteln der franzosischen Gesellschaft zur Bekampfung der Muskelkrankheiten (AFM) getragen wird, und vom CHLC (Cooperative Human Linkage Centre) des amerikanischen Genomproj ekts. Wahrend Genithon 1996 uber 5 000 informative (CA)n-Mikrosatelliten beschrieben hat [ 5 ] , hat das CHLC bisher ca. 1000 Tri- und Tetranukleotidmarker identifiziert. Diese Fulle an Markern konnte nur durch weitgehende Rationalisierung und Automatisierung der Arbeitsvorgange gefunden und untersucht werden. Zur Markersuche wird im wesentlichen folgende Technik verwendet: Menschliche DNA wird zunachst mit haufig schneidenden Restriktionsendonukleasen, wie z. B. AluI (Erkennungssequenz AGCT) oder HaeIII (Erkennungssequenz GGCC), vollstandig verdaut. DNA-Fragmente von einer Grofie zwischen 300 und 500 Basenpaaren werden in einen Vektor, z.B. in das Plasmid pUC18 ligiert. Nach der Transformation der rekombinanten Plasmide in einen Escherichia coli-Wirtsstamm wird die so entstandene Genbank ausplattiert und rnit einer fur Mikrosatelliten spezifischen DNA-Sonde, wie z. B. (CA)8, hybridisiert. Die Plasmid-DNA von positiven Klonen wird anschliefiend prapariert und sequenziert (Abb. l a x ) . Auf beiden Seiten der Di-, Tri- oder Tetranuleotidrepetitionen werden dann mit Hilfe eines Computerprogramms Primer fur die PCR ausgewahlt. Mit diesen Primern wird schliefilich zunachst eine PCR mit der DNA einer kleinen Anzahl (5-10) unverwandter Personen durchgefuhrt. Wird dabei eine ausreichende allelische Variation (mehr als 2 Allele) festgestellt, so wird der Marker genetisch kartiert. Dies geschieht durch Kopplungsanalyse des Mikrosatelliten anhand von acht grofien 3-Generationen-Familien.
9 Identifizierung von Genen und Markern
169
Abb. 1. Sequenzaussschnittedes menschlichen Chromosoms7, die (CA)-, (ITG)- und (AAAG)Mikrosatelliten enthalten. Die Sequenzen wurden aus Subklonen mit dem 373A-Sequenzierer von Applied Biosystems unter Verwendung der Taq-Dye-Terminator-Methode bestimmt.
Weltweit werden hierzu die Referenzfamilien des franzosischen CEPH (Centre d’Etude du Polymorphisme Humain) verwendet. Diese acht Familien bestehen aus insgesamt 91 Kindern, 16 Eltern und 26 GroBeltern. Es miissen also pro Marker insgesamt 133 PCR-Reaktionen durchgefiihrt werden. Danach miissen die Produkte auf Acrylamid-Sequenzgelen auf ihre Lange hin analysiert werden. Durch anschliel3ende statistische Kopplungsberechnung kann der neu identifi-
170
Norbert Speich. Karl- Heiriz Grzeschik
zierte Marker in Nachbarschaft zu bereits bekannten Loci gesetzt und so zumindest grob in die genetische Karte integriert werden. Fur die 1996 veroffentlichte genetische Karte des G i n i t h o n rnit 5 264 Mikrosatelliten-Markern muten also mehr als 700 000 PCR-Reaktionen durchgefuhrt werden. Eine genauere Kartierung von Markern rnit der geforderten Sicherheit der hussage von 1000: 1 fur Kopplung (Lod-Wert +3) erfordert meist noch vie1 umfangreichere Untersuchungen, teilweise an 40 statt nur an 8 groljen 3-Generationen-Familien der CEPH-Sammlung [6].
9.3 Automatisierung der Genotypisierung Zur Definition der Genotypen an einem Genort mussen die Fragmentlangen der Allele bestimmt werden. Diese Fragmentlangen der Mikrosatelliten-PCR-Produkte liegen im Durchschnitt zwischen 100 und 300 Basenpaaren. Da sich die Grol3e zweier Allele eines Locus um nur zwei Basenpaare unterscheiden kann, ist zu ihrer Analyse eine gelelektrophoretische Auftrennung in einer hochauflosenden denaturierenden Acrylamidmatrix notwendig. In der Vergangenheit wurde dazu haufig zunachst einer der Primer an seinem S-Terminus rnit radioaktivem Phosphat markiert. Nach der PCR wurden die Produkte elektrophoretisch getrennt und das Gel einer Autoradiographie unterworfen. Fur die umfangreiche Aufgabe der Charakterisierung genetischer Markerpunkte in Familienstudien und die Jagd nach Genen in diesem Markernetz war diese Methode zu unergiebig, denn neben den bekannten Nachteilen der radioaktiven Laborarbeit, wie der Strahlenbelastung der Mitarbeiter und den hohcn Kosten zur Entsorgung der Abfalle, war die Methode recht zeitaufwendig. Eine wesentlich effizientere Analyse von PCR-Fragmenten kann heute durch nichtradioaktive Markierung, z. B. rnit Fluoreszenzfarbstoffen, erreicht werden. Man kann in der PCR Primer einsetzen, die am 5’-Ende eine Fluoreszenzmarkierung enthalten, welche bereits bei ihrer Synthese eingefugt wurde. Der entscheidende Vorteil dieser Methodik liegt in der Moglichkeit zur automatischen Langenbestimmung der PCR-Produkte in DNA-Sequenzierautomaten und dem damit verbundenen wesentlich hoheren Probendurchsatz. Die Firma Applied Biosystems bietet ein System an, bei dem dem Anwender vier unterschiedliche Fluoreszenzfarbstoffe (FAM:blau, TET:grun, HEX:gelb, TAMRA:rot) rnit unterschiedlichen Emissionsspektren zur Markierung der PCR-Primer zur Verfugung stehen. Der PCR-Reaktionsansatz enthalt neben der genomischen Template-DNA, den 4 Desoxynukleotiden und der thermophilen DNA-Polymerase jeweils einen fluoreszenzmarkierten und einen unmarkierten Primer. Nach der PCR werden die entstandenen Produkte zusammen mit einem internen Langenstandard elektrophoretisch in einem automatischen DNA-Sequenziergerat (373A, 377 oder 310 Sequencer, Applied Biosystems) getrennt. Anschlieljend erfolgt die exakte Bestimmung der Pro-
9 Identifizierung von Genen iind Markern
171
dukt-Fragmentlangen durch ein entsprechendes Computerprogramm (GenotyperTM- und GenescanTM-Software,Applied Biosystems) (Abb. 2). I""
230
I " " l ~ ~
235
240
8
8
1
'
~
245
~
'
'
I
'
250
'I I
255
I
I '
260
# ' I
265
I
'
' 1 , 270
1
8
275
Person 3
I!, ,,
.___-
..--.-
! \,pi ! <'
........
,y.>
.-.-
Person 4
......................................
*............
Person 5
.ii.
Person 6
2000
[;g
,J p-! I!
il.
.+
,,!i
:
-..-..-..-..-..-..-
-
.~ .-
_..-..-.
i,
a
--.- ._
250.60
252.40
Person 7
ri
1500
...
-.-..,
Person 8
..........^..
Abb.2. Automatische Bestimmung der Allel-Fragmentlangen des Markers D7S657 in Basenpaaren in einer Familie mit 4 Kindern mit Hilfe der GenotyperTM-Software.Die Software unterscheidet anhand der Bandenintensitat (Skalierung rechts) automatisch zwischen Allelfragmenten der richtigen Lange und PCR-Artefakten. Um methodisch bedingte Unterschiede in der Bestimmung der Allellangen auszugleichen, wird zu jedem Marker die Lange der Allele einer bestimmten Person aus der Sammlung der CEPH-Familien als Eichwert beschrieben (Tab. 1).
D8S258
0.70
138-154
Gelb
148,152
D7S669
0.80
172-190
Gelb
182,188
D8S272
0.81
208-256
Gelb
238,248
D7S510
0.79
78-98
Griin
86,88
D7S640
0.85
113-147
Griin
123,143
D7S513
0.83
165-193
Griin
183, 189
D8S514
0.77
209-227
Griin
224,224
D7S657
0.81
245-265
Griin
249,251
D7S516
0.76
300-320
Grun
308,314
Da fur die Markierung der PCR-Primer drei Farbstoffe zur Verfugung stehen (die vierte Farbe wird fur den internen Langenstandard benotigt), konnen zunachst auch die Produkte dreier verschiedener PCR-Reaktionen innerhalb einer Gelspur identifiziert werden. Dies wird als Multiplex-Analyse bezeichnet. Die allelische Variation jedes Dinukleotidmikrosatelliten schwankt in einem definierten GroBenbereich. Es ist daher durch eine geschickte Kombination von Markern, deren Allelgrenzbereiche ausreichend differieren, moglich, noch deutlich mehr als nur drei verschiedene PCR-Produkte in einer Spur gemeinsam aufzutrennen und zu identifizieren. Durch die zur Verfugung stehende Zahl von vier Fluoreszenzfarbstoffen (fur die Zukunft ist die Entwicklung weiterer Farbstoffe geplant) liegt die Obergrenze der Multiplex-Analyse momentan bei etwa 18-20 Markern pro Spur. Bei einer Kapazitat des Gelsystems von 36 Spuren ist es also moglich, bis zu 720 Genotypanalysen in einem Lauf durchzufuhren. Da die elektrophoretische Auftrennung lediglich drei Stunden dauert und damit auf jedem Sequenziergerat bis zu vier
9 Identifizierung von Genen und Markern
173
Gellaufe pro Tag moglich sind, kann der Durchsatz auf bis zu 2860 Analysen in 24 Stunden gesteigert werden. Fur die Bewaltigung einer solch hohen Anzahl von Proben mussen im Labor neben dem Vorhandensein eines automatischen Sequenzierers noch drei weitere Voraussetzungen erfullt sein: 1. Fur die Vorbereitung und Durchfuhrung der notwendigen PCR-Reaktionen mussen geeignete Pipettier-Robotstationen (z. B. KatalystTM,Applied Biosystems; Biomek 2000TM,Beckman Instruments) vorhanden sein, und die PCR mu13 im Mikrotiter-Format durchgefuhrt werden. 2. Weiterhin mu13 eine entsprechende Software (z. B. GenotyperTM,Applied Biosystems) die Ergebnisse der Gellaufe automatisch analysieren und die Daten der nachgeordneten Kopplungsanalyse-Software, z. B. LINKAGE [7] und CRIMAP [8], zur Verfugung stellen. Genotyper unterscheidet darber hinaus automatisch zwischen Allelfragmenten der richtigen Lange und PCR-Artefakten. 3. Fur ein Multiplex-Projekt ist ein intelligentes Primerdesign entscheidend.
9.4 Perspektiven der genetischen Kartierung Das umfangreiche Spektrum genetischer Mikrosatellitenmarker, das alle Chromosomen mit einem engen Raster uberzieht, kann eingesetzt werden, die Gene vieler Erkrankungen, auch solcher, an deren Entstehung zahlreiche Gene beteiligt sind, zwischen Rasterpunkten zu lokalisieren (Ubersicht in [4]). In der Strategie der sogenannten Positionsklonierung ist dies der erste Schritt, dem dann die Suche nach der Gensequenz im Interval1 zwischen genetischen Markerpunkten durch Methoden der sogenannten physikalischen Kartierung folgt. Fur diesen Ansatz ist also die Kenntnis der Funktion des Genproduktes nicht erforderlich. Falls fur die genetische Kartierung keine Vorstellung existiert, welche Kandidatengene eventuell fur ein Merkmal verantwortlich sein konnen, mu13 das gesamte menschliche Genom systematisch abgesucht werden. Erst die weitgehend automatische Multiplex-Analyse von Mikrosatellitenmarkern genugt den Erfordernissen, in vertretbarer Zeit die notwendige Zahl von Untersuchungen zu bewaltigen. Neben dem englischen Medical Research Council (MRC), fur das Dr. J. Todd ein solches Primersystem entwickelt hat [9, 101, wird eine entsprechende Sammlung markierter Primer auch kommerziell als ,,Human Linkage Set" von Perkin Elmer angeboten. Dieser Primersatz (ABI PRISMTM)besteht aus 28 Panels von Primerpaaren, die benutzt werden, ausgewahlte Loci in einer durchschnittlichen genetischen Distanz von 10 cM zu amplifizieren. Es handelt sich dabei ausschlieBlich um hochinformative Dinukleotidmarker aus der vom GCnCthon beschriebenen genetischen Karte [ 5 ] . Panel 11 z.B. uberdeckt mit insgesamt 16 Primerpaaren die
Norbert Speich, Karl-Heinz Grzeschik
174
Chromosomen 7 und 8 (Tab. 1 und Abb.3). Am Beispiel einer Familie, in der eine autosomal dominante Muskelerkrankung vererbt wird, stellt Abb. 4 einen Multiplex-Ansatz fur Kopplungsuntersuchungen auf diesen beiden Chromosomen dar. Dabei sind die Primer so ausgewahlt, da die PCR-Reaktionen unter gleichen Bedingungen durchgefuhrt werden und die Produkte immer zusammen in einer Gelspur analysiert werden konnen. Die in der Elektrophorese bestimmten Fragmentlangen werden automatisch bestimmt und mit geeigneten statistischen Verfahren [7,8] ausgewertet. Die Auswertung der Ergebnisse in der Kopplungsanalyse geht von einem Model1 aus, das
7 22
-
D7S517
21
-
D7S513
M 15.1
8 233 232 231
14
- D7S516
13
22 21 3 21 2 21 1
-
U1b484
12
-
D7S510
112 11 1
12
iii
U8bLb8
1123 12
11.23 -
D7S669
-
D7S657
13
21.1 21 1
- D8S260
21 2
22
21 3
31 31
221 22 2 223
31
-
111 1 1221
11.21 11.22
21.2 21.3
- D8S504
-
UIbSJU
-
D7S640
23
32 33 34 35
-
U8bbbb
-
085514
24 1 24 2 24 3
- D8S272
36
IlOcM Abb.3. Schematische Darstellung der menschlichen Chromosomen 7 und 8 mit zytogenetischen Banden sowie von genetischen Karten dieser Chromosomen aus Mikrosatellitenmarkern des Human Linkage Set Panels 1 1 von Perkin Elmer.
9 Identifizierung von Genen und Markern
I
175
4
Abb. 4. Multiplex-Ansatz zur Untersuchung der Kopplung eines Gens mit Mikrosatellitenmarkern der menschlichen Chromosomen 7 und 8 aus dem Human Linkage Set Panel 11 von Perkin Elmer. In diesem Lauf wurden 128 PCR-Produkte analysiert.
das Vererbungsmuster der im vorliegenden Stammbaum beobachteten Phanotypen und Genotypen erklart. Dieser Ansatz ist die Methode der Wahl fur Merkmale, die einem einfachen Mendelschen Erbgang folgen, weil es da nur wenige zulassige Modelle zur Erklarung gibt, die leicht zu testen sind. Formal besteht die Kopplungsanalyse in der Suche nach einer Hypothese fur die Lage eines Gens in der Nahe eines Markers, die aufgrund der Daten vie1 wahrscheinlicher ist als die Nullhypothese, da namlich keine Kopplung zwischen Gen und dem Marker besteht. Der gunstigste Fall fur solche Untersuchungen sind grol3e Familien, in denen einfache monogene Merkmale vererbt werden und in denen unmittelbar
176
Norbert Speich, Karl-Heinz Grzeschik
ein Lod-Wert von mindestens +3 die Kopplung mit einem Marker sicher anzeigt. Bei geeigneter Auswahl des Familienmaterials lassen sich aber auch kornplexere Phanotypen in Kopplungsuntersuchungen einbeziehen. Mit dieser Suchstrategie kann die Lage eines Gens in Familienuntersuchungen im typischen Fall auf einen Bereich von rnehreren Megabasen eingeengt werden, ipmer noch eine Strecke, in der die Suche nach der Gensequenz langwierig sein kann. Mitunter konnen zytogenetisch entdeckbare Anomalien die Suche beschleunigen, wie im Fall der Neurofibromatose Typ 1 oder der Duchenneschen Muskeldystrophie. Kandidatengene bieten eine weitere Abkurzung der Suche, ebenso deuten mitunter verlangerte Trinukleotidrepeats auf die Lage eines Gens fur eine Krankheit hin. In der Regel liegen aber solche gunstigen Voraussetzungen nicht vor, und weitere genetische Kartierungsmethoden rnussen den abzusuchenden Bereich einengen. Analyse des Kopplungsungleichgewichts,der nichtzufalligen Assoziation von Allelen eng gekoppelter Loci, konnen helfen, weitere Rekombinanten zu finden, die den Genbereich genauer definieren. In einem solchen Ansatz versucht man zu beweisen, da das Vererbungsmuster einer Chromsomenregion nicht rnit einer zufalligen Mendelschen Segregation vereinbar ist, indem man zeigt, da von der Krankheit betroffene Verwandte haufiger identische Kopien der Region aufweisen, als dem Zufall nach zu erwarten ist. Hier fur ist kein Vererbungsmodell fur das gesuchte Gen erforderlich. Probleme wie unvollstandige Penetranz, Phanokopien, genetische Heterogenitat und haufige krankheitsbedingende Allele storen die Berechnung, anders als bei Kopplungsstudien, nicht. Die positive Assoziation kann zum einen dadurch entstehen, da die DNA-Variante eines Allels selbst die Krankheit bedingt. Zurn anderen kann ein Chrornsomenbereich, der das gesuchte Krankheitsgen tragt, weitgehend unverandert durch Crossover von einem gemeinsamen Vorfahren ererbt sein, bei dem die Mutation entstanden ist (identical by descent, IBD). Das Kopplungsungleichgewicht hangt von mindestens zwei Faktoren ab, von der Rekombinationsfrequenz und der Anzahl von Generationen, seit die Mutation in die Population eingefuhrt wurde. Besonders giinstig fur solche Analysen sind Gebiete, in denen die heutige Bevolkerung von einer kleinen Zahl gemeinsarner Vorfahren abstammt. Auf die Bevolkerung in Finnland, die intensiv von de la Chapelle und Kollegen untersucht wird, treffen diese Voraussetzungen in besonderem MaBe zu (Ubersicht in [111). Die Orte, an denen die Gene nach dieser weiterfuhrenden Analyse gesucht werden mussen, liegen oft nur noch wenige Kilobasen von einem genetischen Marker entfernt und sind dann relativ leicht zu finden. Der zunachst verwirrenden Vielzahl genetischer Modelle und Berechnungsweisen liegt auf der experimentellen Ebene der Markeranalyse stets der gleiche Ansatz des Erkennens und Unterscheidens moglichst hochinformativer Marker zugrunde. Die hochentwikkelte und weitgehend automatisierte Methodik der Mikrosatellitenanalyse ist also fur alle Pfade der Genjagd gleicherrnaBen gut geeignet. Die breite kommerzielle Verfugbarkeit von Primerkits und Analysesystemen hat zudem die metho-
9 Identifizierung von Genen und Markern
177
dische Schwelle beseitigt, die bisher kleinere, klinisch orientierte Laboratorien von diesen Untersuchungen ausschlol3. Diese Entwicklung ist auf dem Weg, eine Flutwelle neuentdeckter Gene auszulosen, deren Kenntnis und Analyse die Diagnose, Prognose und Therapie nicht nur der erblichen Krankheiten revolutionieren wird.
9.5 Literatur Tenvilliger, J.G., Ott, J. (1994), Handbook of human genetic linkage. The Johns Hopkins University Press, Baltimore, London. Botstein, D., White, R.L., Skolnick, M., Davis, R.W. (1980): Construction of a genetic linkage map in man using restriction fragment length polymorphisms. Am. J. Hum. Genet. 32, 314-33 1. Weber, J.L., May, P.E. (1989), Abundant class of human DNA polymorphisms which can be typed using the polymerase chain reaction. Am. J. Hum. Genet. 44,338-396. Lander, E.S., Schork, N.J. (1994), Genetic dissection of complex traits. Science 265, 20372048. Dib, C., Faure, C., Fizames, D., Samson, D., Drouot, N., Vignal, A., Millasseau, P., Marc, S., Hazan, J.,Seboun, E., Lathrop, M., Gyapay, G., Morissette, J., Weissenbach, J. (1996), A comprehensive genetic map of the human genome based on 5,264 microsatellites. Nature 380,152-154. Spurr, N.K., Bryant, S.P., Attwood, J., Nyberg, K., Cox, S.A., Mills, A., Bains, R., Warne, D., Cullin, L., Povey, S., Sebaoun, J.-M., Weissenbach, J., C a m , H.M., Lathrop, M., Dausset, J., Marcadet-Troton, A.,Cohen, D. (1994), European gene mapping project (EUROGEM): Genetic maps based on the CEPH reference families. Eur. J. Hum. Genet. 2,193-252. Lathrop, G.M., Lalouel, J.M., Julier, C., Ott, J. (1984), Strategies for multilocus linkage analysis in humans. Proc. Natl. Acad. Sci. USA 81,3443-3446. Green, P., Falls, K., Crooks, S. (1989), Documentation for CRI-MAP, version 2.4. Erhltlich von P. Green, Washington University, St. Louis. Reed, PW., Davies, J.L., Copeman, J.B., Bennett, S.T., Palmer, S.M., Pritchard, L.E., Gough, S.C.L., Kawaguchi, Y., Cordell, H.J. Balfour, K.M., Jenkins, S.C., Powell, E.E., Vignal, A,, Todd, J.A. (1994), Chromosome-specific microsatellite sets for fluorescence-based, semiautomated genome mapping. .. - Nature Genetics 7,390-395. [lo] Pritchard, L.E., Kawaguchi, Y., Reed, P.W., Copeman, J.B., Davies, J.L., Barnett, A.H., Bain, S.C., Todd, J.A. (1995), Analysis of the CD3 gene region and type 1 diabetes: application of fluorescencebased technology to linkage disequilibrium mapping. Hum. Mol. Genet. 4,197202. [ll]Jorde, L.B (1995),-Linkage disequilibrium as a gene-mapping tool. Am. J. Hum. Genet. 56, 11-14.
This page intentionally left blank
10 Polymorphismus-und Mutationsanalyse Dietmar Lohmann Der Fortschritt molekulargenetischer Analyseverfahren hat zur Identifizierung zahlreicher Gene gefuhrt, die in mutierter Form erbliche Erkrankungen verursachen konnen. Einige Erkrankungen, insbesondere solche mit rezessivem Erbgang, werden durch ein mehr oder weniger grol3es Repertoire verschiedener mutanter Allele verursacht. Eine genetische Analyse dieser Erkankungen ist oftmals durch den gezielten Nachweis einer der bereits bekannten Mutationen moglich. Bei vielen Genen ist jedoch sowohl die Art der Mutation als auch ihre Lokalisation im Gen von Patient zu Patient verschieden (,,private" Mutationen). Durch diese Verschiedenheit der Mutationen (Heterogenitat) wird die Identifikation der krankheitsverursachenden Genveranderung bei einem Patienten erschwert. Zur genetischen Analyse von Genen mit heterogenem Mutationsspektrum werden oft Methoden verwendet, die ein rasches Durchmustern (sog. Screening) des betreffenden Gens auf Sequenzveranderungen ermoglichen. Genbereiche, die im Screening mutationsverdachtige Auffalligkeiten zeigen, konnen dann gezielt durch Sequenzierung analysiert werden. Insbesondere bei Genen mit komplexem Aufbau ist ein Mutationsscreening nicht immer erfolgreich. Durch die Analyse der Segregation gekoppelter polymorpher Marker kann jedoch auch ohne Mutationsnachweis in einigen Fallen bestimmt werden, ob ein Geschwister oder Kind eines Patienten ebenfalls Trager der krankheitsverursachenden Mutation ist. Im folgenden wird am Beispiel der Analyse einer erblichen Tumordisposition, dem hereditaren Retinoblastom, die Anwendung der automatisierten Analyse fluoreszenzmarkierter DNA-Fragmente fur das Mutationsscreening und die Segregationsanalyse dargestellt. Das Retinoblastom ist ein seltener bosartiger Augentumor des Kindesalters (Ubersicht s. [l]). Bei einem Teil der Patienten besteht eine autosomal dominant erbliche Veranlagung zu Entwicklung dieser Tumore (hereditares Retinoblastom). Dabei kommt es meist zur Ausbildung mehrerer Retinoblastome, und daher sind oft beide Augen betroffen. Die erbliche Disposition zur Entwicklung von Retinoblastomen wird durch eine mutationsbedingte Inaktivierung einer der beiden Kopien des sog. Retinoblastomgens (RB1) verursacht. Mutierte RB1Allele konnen entweder von einem der Eltern vererbt worden sein, oder sie sind durch Neumutationen (de-novo) in der mutterlichen oder vaterlichen Keimbahn entstanden. Die Entstehung eines Tumorherdes wird durch den Verlust des zweiten, nichtmutierten Allels in einer Vorlauferzelle des Retinoblastoms ausgelost. Die Identifikation der krankheitsverursachenden RB1-Gen-Mutation bei einem Patienten mit hereditarem Retinoblastom ermoglicht eine genaue Risikoprognose fur Geschwister und Kinder dieses Patienten. Die zu Tumorbildung pradisponierenden Mutationen sind jedoch von Patient zu Patient verschieden und zei-
180
Dietmnr Lohrnann
gen uberdies keine Haufung in bestimmten Genbereichen (sog. Hot-spots). Die Mutationsfindung wird des weiteren durch die Grolje (180 kb) und Komplexitat (27 Exons) des RB1 -Gens erschwert. Fur die Bestirnrnung genetischer Pradisposition bei hereditarem Retinoblastom kornrnen daher Methoden zum Mutationsscreening und zur Segregationsanalyse gekoppelter Polymorphisrnen zum Einsatz.
10.1 Segregationsanalyse gekoppelter polymorpher Marker Zahlreiche Orte im Genom weisen eine mehr oder weniger ausgepragte Variabilitat in ihrer Sequenz auf. Einige dieser Sequenzpolymorphismen betreffen Erkennungssequenzen von Restriktionsendonuklease und fuhren daher nach Restriktionsverdauung zu Langenunterschieden in den resultierenden DNAFragmenten (Restriktions-Fragment-Langen-Polymorphismen,RFLP). Die Sequenzvariabilitat einer weiteren Klasse von Polyrnorphismen beruht auf einer unterschiedlichen Zahl an Wiederholungen eines Sequenzrnotivs (Variable Number of Tandem Repeats, VNTR-Polyrnorphismus). Wahrend RFLP-Loci oft nur zwei unterscheidbare Zustandsformen (Allele) aufweisen, sind an VNTR-Loci haufig mehrere Allele nachweisbar. Grundlage der Segregationsanalyse ist die genetische Kopplung, die zwischen genetischen Loci zu beobachten ist, die einander benachbart auf einem Chromosom liegen. Je naher die Loci beieinander liegen, desto geringer ist die Wahrscheinlichkeit, dalj eine meiotische Rekombination zwischen diesen Loci stattfindet. Daher werden die jeweils auf dernselben Chromosom liegenden Allele physikalisch benachbarter Loci haufig gemeinsam vererbt (Haplotyp). Die Segregationsanalyse kann durch die Bestimmung der Abweichung von der unabhangigen Segregation fur die Kartierung unbekannter Genorte eingesetzt werden (Kopplungsanalyse). 1st das krankheitsverursachende Gen bekannt, so ermoglicht sie die Identifizierung von Mutationstragern. Ein Allel eines gekoppelten polymorphen Locus, das mit einer Mutation zusammen auf dernselben Chromosom liegt (in Phase), wird gemeinsam mit der Mutation vererbt und kann daher als Marker fur die Mutation verwendet werden, auch wenn diese nicht bekannt ist. Erst wenn eine Rekombination zwischen dem Markerallel und der Mutation stattfindet, wird diese Phasenbeziehung aufgehoben. Fur die pradiktive Analyse sind daher insbesondere polyrnorphe Loci geeignet, die eine enge Kopplung zum Krankheitsgen, d. h. eine geringe Rekombinationsfrequenz, aufweisen. Es gibt mehrere polymorphe Loci, die eng mit dem RB1-Gen gekoppelt sind. Fur eine automatisierte Analyse eignen sich besonders VNTR-Loci, deren repetitive Sequenzmotive kurz sind (sog. Mikrosatelliten). Bei der PCR-Analyse von Polymorphismen mit langen Sequenzrnotiven (sog. Minisatelliten) hingegen kann es durch bevorzugte Amplifikation des kurzeren Allels zu fehlerhaften Typisie-
I0 Polymorphismus- und Mutationsanalyse
181
rungen kommen, und daher sind diese Loci nur bedingt fur eine automatisierte Analyse geeignet. Ein weiteres Gutekriterium fur die Eignung eines polymorphen Locus zur Segregationsanalyse ist sein Informationsgehalt, der Polymorphic Information Content (PIC). Er wird von der Anzahl an Allelen an diesem Locus und ihrer relativen Haufigkeit in der untersuchten Population bestimmt.
5’
RBi2 RB1.20
Abb. 1. Fur die Segregationsanalyse bei Retinoblastom werden zwei mit dem RB1-Gen gekoppeke Loci typisiert. Der Locus RBi2, ein polymorpher [CAI,-VNTR, ist im Intron 2 des RB1Gens gelegen. Der Polymorphismus RB1.20, ein [CTIT(T)],-VNTR, liegt im Intron 20 des Gens. Aufgrund ihrer Lage im 5’- bzw. 3’-Bereich des Gens sind Rekombinationen zwischen Markerallelen und Mutationen im Gen nur selten zu erwarten.
Fur die Segregationsanalyse bei Retinoblastom werden zwei mit dem RB1-Gen gekoppelte Mikrosatelliten typisiert (Abb. 1). Da beide Loci in Intronabschnitten des RB1-Gens lokalisiert sind, also von den Orten moglicher krankheitsverursachender Genveranderungen umgeben sind, ist die Gefahr der Rekombination zu einer Mutation im RB1-Gen sehr gering. Beide Loci weisen zahlreiche Allele mit unterschiedlicher Lange auf, die durch PCR mit fluoreszenzmarkierten Primern und nachfolgender automatisierter Bestimmung der Produktlange eindeutig typisiert werden konnen. Produktanalyse in einem denaturierenden Polyacrylamidgel auf einem Abi373A DNA-Sequencer (Perkin Elmer). Durch gleichzeitige Auftrennung eines fluoreszenzmarkierten DNA-Langenstandards (2500-ROX, Perkin Elmer) und Auswertung durch das Genescan-Programm (Perkin Elmer) ist eine genaue Bestimmung der Produktlange moglich. Zur einfacheren Auswertung sind den Allelen an den jeweiligen Loci ihrer GroBe nach Zahlen zugeordnet. In den Stammbaum der Familie (B) sind die Allele des RBi2 und RB1.20 nach Haplotypen geordnet eingetragen. Die verschieden ausgefullten Balken stellen die unterscheidbaren Allele des RB1-Gens dar.
182
Dietmar Lohniann
1-1 1-2
11-1 11-2 11-3
111-1
111-2
A
111 B Abb. 2. Ergebnis einer Segregationsanalyse bei familiarem Retinoblastom. Die polymorphen
Loci RBi2 und RBI .20 wurden unter Verwendung fluoreszenzmarkierter Primer durch PCR amplifiziert. Das Elektropherogramm (A) zeigt das Ergebnis der Produktanalyse in einem denaturierenden Polyacrylamidgel auf einem Abi373A DNA-Sequencer (Perkin Elmer). Durch gleichzeitige Auftrennung eines fluoreszenzmarkierten DNA-Langenstandards (2500-ROX, Perkin Elmer) und Auswertung durch das Genescan-Programm (Perkin Elmer) ist eine genaue Bestimmung der Produktlange moglich. Zur einfacheren Auswertung sind den Allelen an den jeweiligen Loci ihrer GroRe nach Zahlen zugeordnet. In den Stammbaum der Familie (B) sind die Allele des RBi2 und RB1.20 nach Haplotypen geordnet eingetragen. Die verschieden ausgefiillten Balken stellen die unterscheidbaren Allele des RBI-Gens dar.
I0 Polyrnorphismus- und Mututionsanulyse
183
Das Ergebnis einer Segregationsanalyse bei hereditarem Retinoblastom ist in Abb. 2 gezeigt. Das zweite Kind eines Vaters mit Retinoblastom entwickelte ebenfalls Tumore in beiden Augen. Die Genotypisierung von RBi2 zeigte die Allele 1 und 4 beim Vater (11-2) sowie 1und 2 bei der erkrankten Tochter (111-2). Das Allel 1 ist also vaterlichen Ursprungs. Die Typisierung des Locus RB1.20 zeigte, daB das Allel 3 vaterlicher Herkunft ist. Das mutierte RBI-Gen, das fur die Erkrankung bei Vater und Tochter verantwortlich ist, liegt also auf demselben Chromosom wie die Allele 1 und 3 der Loci RBi2 bzw. RB1.20. Da der Bruder (111-1) ebenfalls den Haplotyp 1,3 aufweist, hat er auch das mutierte RB1-Gen vom Vater geerbt. Zur fruhen Erkennung und Behandlung der Tumore mu13 daher sein Augenhintergrund regelmaBig untersucht werden. Durch die Segregationsanalyse kann nicht geklart werden, ob diese Mutation bereits bei der GroBmutter (1-2) vorliegt. Da der Bruder (11-1) des Vaters jedoch nicht Haplotyp 1,3 geerbt hat, ist er in jedem Fall nicht Trager der hier segregierenden RBl-Mutation. Eine Bestimmung der Kopplungsphase durch Kosegregation von Markerallelen mit einem Phanotyp ist bei autosomal dominant erblichen Erkrankungen mit unvollstandiger Penetranz meist von der Verfugbarkeit von mindestens zwei von dieser Erkrankung betroffenen Personen abhangig. Beim hereditaren Retinoblastom kann jedoch die Kopplungsphase oft auch durch die Untersuchung von Tumorgewebe bestimmt werden, da die zweite Mutation, welche durch Verlust des konstitutionell nicht mutierten RBl-Allels zur Entstehung eines Tumorherdes fuhrt, haufig auch mit einem Verlust konstitutioneller Heterozygotie gekoppelter polymorpher Loci (sog. Loss of Heterozygosity, LOH) einhergeht. Im Tumor verbleiben dann als Marker die polymorphen Allele, welche in Phase mit dem konstitutionell mutierten RB1-Allel stehen. Eine Bestimmung der Kopplungsphase durch die Untersuchung von Tumormaterial ist in Abb. 3 A dargestellt. Durch die Untersuchung von formalinfixiertem, in Paraffin eigebettetem Retinoblastomgewebe (Thmor, T) wurde das Allel 2 des Locus RB1.20 als Marker fur das in der Keimbahn mutierte RB1-Gen bei der Patientin (1-2) identifiziert. Unter der Voraussetzung, daB keine Rekombination zwischen dem Allel 2 und der Mutation stattgefunden hat, ist das Kind (11-1) nicht von dieser Mutation betroffen.
10.2 Mutationsanalyse Im Mutationsspektrum vieler Gene sind kleine Langenveranderungen (Deletionen und Insertionen) sowie Substitutionen einzelner Basen vorherrschend. Diese Mutationen konnen durch direkte Sequenzierung von PCR-Produkten, die den Mutationsort uberspannen, bestimmt werden. Bei groBen und komplex aufgebauten Genen ist eine Sequenzierung aller in Frage kommenden Genbereiche zur Mutationssuche jedoch haufig nicht praktikabel.
184
Dietmar Lohmann
Daher wurden Screeningverfahren entwickelt, die mit im Vergleich zu einer Sequenzierung geringem Aufwand einen Hinweis auf die Lokalisation einer mutationsverdachtigen Sequenzabweichunggeben konnen. Die so auf einen Bereich eingegrenzte Mutation kann dann gezielt durch Sequenzierung naher bestimmt werden. Kleine Langenveranderungen konnen durch eine hochauflosende Gelelektrophorese sicher identifiziert werden. Etablierte Screeningverfahren zur Identifikation von Einzelbasensubstitutionen beruhen auf verschiedenen Prinzipen: a) Konformationsunterschiede zwischen mutierten und nichtmutierten DNA-Fragmenten konnen unter Venvendung spezieller Elektrophoresebedingungen zu einem Mobilitatsunterschied fuhren. Zu diesen Verfahren zahlt die SSCP (Single-
170
210
190
bP
1-1 1-2
T 11-1
A
1 234 RB1.20-Allele 1
3004
2
~
1812 1 2
1 1
Abb. 3. Ergebnis einer Kopplungsphasenbestimmungdurch Genotypisierung von Tumormaterial (T). Die Tumorprobe zeigt einen Verlust konstitutioneller Heterozygotie des Locus RB1.20. Das im Tumor verbliebene Allel markiert daher das mutierte RB1-Allel. (Zur Methode s. Legende zu Abb. 2)
10 Polymorphismus- und Mutationsanalyse
185
Strand DNA Conformation Polymorphism [2]), die Heteroduplexanalyse [3] und die DGGE (Denaturant Gradient Gel Electrophoresis [4]); b) Nichtgepaarte Basen in Heteroduplexen von mutierter und nichtmutierter Sequenz konnen chemisch (Chemical Mismatch Cleavage [5]) oder enzymatisch (RNaseA Mismatch Cleavage [6]) erkannt und gespalten werden. Fur die automatische genetische Analyse sind die Fragmentlangenanalyse und die Heteroduplexanalyse gut geeignet. Durch simultane Untersuchung mehrerer Fragmente in einer Elektrophoresespur kann, insbesondere bei Venvendung verschiedener Fluoreszenzfarbmarkierungen, die Mutationssuche erheblich beschleunigt werden. Daher eignen sich diese Methoden besonders fur ein Mutationsscreening in Genen, die durch komplexe genomische Organisation die Untersuchung zahlreicher Bereiche erforderlich machen. Etwa 30% der Keimbahnmutationen im RB1-Gen sind Deletionen und Insertionen, die eine Ausdehnung von 1 20 bp haben. Diese Mutationen konnen sowohl exprimierte Sequenzen (Exons) als auch regulatorische Bereiche des Gens (z. B. Promoter und Splice-sites) mit umfassen. Die Verteilung dieser Mutationen zeigt keine Hot-spots, und daher mussen alle in Frage kommenden Bereiche untersucht werden (Abb. 4 A). Nach PCR-Amplifikation dieser Regionen ist eine Identifikation von Langenmutationen durch eine Fragmentlangenanalyse in einem denaturierenden Polyacrylamidgel, wie es auch fur die Typisierung von VNTR-Mikrosatelliten verwendet wird, moglich. Die hohe Auflosung der automatischen Fragmentanalyse erlaubt eine prazise Bestimmung von Langenveranderungen bis zu einem Basenpaar GroiSe. Die spurinterne Auftrennung von DNA-Fragmenten bekannter Grolje (Langenstandard) rnit unterscheidbarer Fluoreszenzmarkierung (ROX) erlaubt zudem eine absolute Langenbestimmung. Durch Venvendung von PCR-Primern, die rnit verschiedenen Fluoreszenzfarbstoffen markiert wurden (FAM, HEX, TAMRA/TET), konnen PCR-Produkte gleicher oder ahnlicher Lange simultan analysiert werden. Das Ergebnis einer solchen Multiplex-Fragmentlangenanalyseist in Abb. 4 B dargestellt. In zwei Multiplex-PCR Ansatzen wurden sechs bzw. sieben verschiedene Regionen des RB1-Gens simultan amplifiziert. Die PCR-Produkte beider Reaktionen - acht Produkte rnit FAM-, drei Produkte rnit TAMRA- sowie zwei Produkte rnit HEX-Markierung - wurden zusammengegeben und in einer Analysespur aufgetrennt. Die Fragmentlangenbestimmung der einzelnen Signale durch Genescan-Auswertung des rnit aufgetrennten ROX-2500 Langenstandards ermoglicht die Zuordnung der einzelnen Signale zu den Produkten der jeweils amplifizierten Genbereiche. In Abb. 5 ist das Ergebnis einer solchen Analyse dargestellt. Zusatzlich zu dem Signal des Exon 23 PCR-Produkts rnit einer erwarteten Lange von 269 bp ist hier ein weiterer Peak von ahnlicher Intensitat mit einer Lange von 268 bp zu erkennen. Durch Sequenzierung wurde diese Veranderung als Heterozygotie fur eine 1-bp-Deletion im Exon 23 bestatigt. Das Mutationsscreening durch die Kombination von Multiplex-PCR und Fragmentlangenanalyse ermoglicht eine effiziente Identifikation von Langenmutationen. Die 28 mutationsrelavanten Bereiche des RB1-Gens konnen so mit nur vier Analysen auf kleine Langenmutationen hin uberpriift werden [7].
186
12
3 6 7
17
5
27
18
’
lntron 6
t
1 3’
H 10 kb
Exon 7
lntron 7
I ..+
+
5’-Primer
3’-Primer
Fluoreszenzmarkiert
A
H 100 bp
175
200 1 185 bp
225
250
L
275 bp
I
201 bp 219 bp 236 bp 4241 bp
269 bt>
I \ (3
hl
B
C
s
W
c
0
x
w
s c c
s s s w w w
cc
S
0 0
0
ww
W
xx
X
Abb.4. ( A ) Bereiche des RBI-Gens, die jeweils ein Exon und die flankierenden Intronabschnitte umfassen. wcrden mittels PCR amplifiziert. Einer der Primer ist am 5’-Ende mit einem Fluoreszenzfarbstoff markiert. Zur Differenzierung von Produkten ahnlicher oder gleicher erwarteter Lange k(innen unterschiedliche Farbmarkierungen (FAM, TAMRA. HEX) eingesetzt werden. (B) Elektropherogramm einer Multiplex-Fragmentlangenanalyse FAM-markierter PCR-Produkte (Methode s. Legende zu Abb.2). Die Produkte wurden vor der Elektrophorese mit T4DNA-Polymerase behandelt. um das durch die Taq-Polymerase angefiigte 3’4berhangende Nukleotid zu entfernen. Die Produktlangenbestimmung durch Genescan-Auswertung erlaubt die Identifzierung der einzelnen Produkte. Eine 1-bp-Deletion im Exon 23 ist als zusatzliches Signal mit einer Lange von 268 bp zu erkennen.
10 Polymorphismus- und Mutationsanalyse normale Sequenz
187
mutierte Sequenz
--
* + L *+c-
1G I
denaturieren und renaturieren
4
A
Exon 23
Exon 19
3900
4000
I
I
4100
4200 I
~
~
: Homoduplex
tHeteroduplexe t
Homoduplex
t
Heteroduplex
Abb. 5. (A) Schematische Darstellung der Heteroduplexbildung. PCR-Produkte einer mutierten und einer normalen Sequenz werden durch Denaturierung in DNA-Einzelstrange uberfuhrt. Nach Renaturierung bildet sich sowohl Homoduplex- als auch Heteroduplex-DNA. (B) Das Elektropherogramm zeigt Ergebnisse einer Heteroduplexanalyse in einem lx MDE-Gel auf einem Abi373A DNA-Sequencer (Perkin Elmer). Die FAM-markierten PCR-Produkte wurden vor der Auftrennung durch Aufkochen (90 "C) denaturiert und durch langsames Abkuhlen auf 40 "C renaturiert. Zur Identifizierung der jeweiligen Homoduplexbanden wurden PCR-Produkte mit normaler Sequenz mit aufgetragen (oben). Das PCR-Produkt des Exon 19 (links) zeigt zwei Heteroduplexbanden, die nach Sequenzierung auf Heterozygotie fur eine Basensubstitution zuruckgefuhrt werden konnten. Die Analyse des Exon 23 PCR-Produktes (rechts) zeigt nur eine Heteroduplexbande, die durch eine C-nach-T-Transition hervorgerufen wird.
188
Dietrnar Lohmann
Einzelbasensubstitutionen machen etwa 40% der Keimbahnmutationen im RB1Gen aus. Diese Mutationen treten ohne ausgepragte lokale Haufung sowohl in exprimierten wie auch in regulatorischen Bereichen des Gens auf. Bei der Auswahl eines Verfahrens zum Screening auf Mutationen rnit autosomal dominanter Auspragung muB beriicksichtigt werden, daB diese Mutationen konstitutionell heterozygot vorliegen. Da durch eine Einzelbasensubstitution eine nur geringe Sequenzanderung bewirkt wird, konnen sich zwischen Einzelstrangen der PCRProdukte rnit mutanter und normaler Sequenz Heteroduplexe ausbilden (Abb. 5 A). Dabei entstehen durch die verschiedenen Kombinationen von Strang und Gegenstrang zwei Formen von Heteroduplex-DNA. Die Heteroduplexanalyse beruht auf dem Konformationsunterschied zwischen DNA-Hetero- und Homoduplexen, der in einer Elektrophorese als Mobilitatsunterschied dargestellt werden kann. Eine Mutation wird durch diese Methode als zusatzlich zu dem Signal der Homoduplex-DNA auftretende, einzelne oder doppelte Bande auffallig. Zur Erhohung des Laufunterschiedes zwischen Homo- und Heteroduplexen werden fur die Heteroduplexanalyse besondere Elektrophoresebedingungen gewahlt. Besonderes geeignet sind Polyacrylamidgele mit geringer Quervernetzung (2-1 % C) oder spezielle Gelmatrices (z. B. MDE-Gel, AT-Biochem). Eine weitere Steigerung der Sensitivitat kann durch Auftrennung unter leicht denaturierenden Bedingungen, z.B. durch Zugabe von 1,2 M Harnstoff zum Gel, erreicht werden. Die Verwendung der automatischen Fragmentbestimmung zur Heteroduplexanalyse ermoglicht mittels verschiedener Fluoreszenzfarbstoffe ein simultanes Screening mehrerer PCR-Produkte rnit gleicher oder ahnlicher Wanderungsgeschwindigkeit. Ergebnisse von Heteroduplexanalysen fluoreszenzmarkierter DNA-Fragmente sind in Abb. 5 B dargestellt. Zur Identifizierung des Signals der HomoduplexDNA werden PCR-Produkte rnit nichtmutierter Sequenz rnit aufgetragen. Die hohe Auflosung und quantitative Darstellung der Signale lafit eine Abgrenzung der Heteroduplexbanden auch bei nur gering unterschiedlicher Mobilitat im Vergleich zur Homoduplex-DNA zu. So sind bei der Basensubstitution im Exon 19 beide Heteroduplexe zu erkennen. Die unterschiedlichen Formen der Heteroduplex-DNA sind jedoch nicht immer als zwei distinkte Signale von der Homoduplexbande abgrenzbar. So ist bei der hier dargestellten Basensubstitution im Exon 23 nur eine Heteroduplexbande rnit deutlich verringerter Mobilitat zu erkennen. Durch die Heteroduplexanalyse konnen etwa 50 75 % der Basensubstitutionen in einem PCR Produkt erfal3t werden. Durch die klare Abgrenzbarkeit auftretender Heteroduplexbanden ist jedoch die Rate falsch positiver Resultate gering. Die hohe Spezifitat der Heteroduplexanalyse wiegt in der Praxis den Nachteil der nicht vollstandigen Erfassung der Mutationen auf.
10 Polymorphismus- und Mutationsanalyse
189
10.3 Zusammenfassung Am Beispiel des hereditaren Retinoblastoms wurde die Anwendung der automatisierten Analyse einer erblichen Erkrankung mit heterogenem Mutationsspektrum dargestellt. In einem mehrstufigen Untersuchungskonzept kommen verschiedene Verfahren zur Anwendung. Die Analyse polymorpher Mikrosatelliten durch PCR und automatische Fragmentlangenanalyse erlaubt eine genaue Bestimmung der segregierenden Allele und damit die eindeutige Erkennung von Markerallelen. Zur Identifizierung der krankheitsverursachenden Mutation im RB1-Gen werden angesichts der komplexen Organisation dieses Locus Verfahren zum simultanen Mutationsscreening eingesetzt. Als zuverlassige Verfahren haben sich hier die Multiplex-Fragmentlangenanaylse und Heteroduplexanalyse bewahrt.
10.4 Literatur [1] [2] [3] [4] [5] [6] [7]
Horsthemke, B., Cancer Genet. Cytogenet. 63 (1992) 1-7. Orita, M., Genomics 8 (1990) 217-278. White, M., Genomics 12 (1992) 301-306. Myers, R.H., Nature 313 (1985) 495497. Cotton, R.G.H. et al., Proc. Natl. Acad. Sci. USA 85 (1988) 43974401. Myers, R.M., Science 230 (1985) 1242-1246. Lohmann, D.R., Hum. Mol. Genet. 3 (1994) 2187-2193.
This page intentionally left blank
11 DNA-Analytik in der Forensik Hermann Schmitter
Bestimmungen erblicher Merkmale, insbesondere auf der Ebene der DNA, konnen vor Gericht bedeutsame Beweismittel liefern [l].Im wesentlichen sind hier zwei Anwendungsbereiche zu nennen: 0
In der Abstammungsbegutachtung (im ZivilprozeB) werden Falle strittiger Vaterschaften untersucht. Hier stehen die aus den phanotypischen Konstellationen von Mutter-Kind-Paaren resultierenden vaterlichen Allele auf dem Prufstand. Die Spurenanalyse (im StrafprozeB) befaBt sich mit der Frage, ob ein in einer Strafsache relevantes Spurenmaterial von einer bestimmten Person stammt, indem die Phanotypen der untersuchten Merkmalssysteme verglichen werden.
Die folgende Abhandlung wird sich ausschlieBlich mit der DNA-Analytik in der Spurenuntersuchung, also dem Aspekt der Anwendung im Strafverfahren, befassen. Aufgrund der Vielfalt moglicher Anwendungen und Verfahren ist es unmoglich, auf Einzelheiten methodischer Natur einzugehen, da dies mehrerer Kapitel bedurfte. Es wird aber versucht, alle derzeit fur die Forensik relevanten Methoden anzusprechen und auf jeweils wichtig erscheinende Literatur hinzuweisen.
11.1 Spurenmaterial in Kriminalfallen Das in Kriminalfallen als beweisrelevant anzusehende Material und die sich aus den jeweils vorliegenden Tatgeschehen ergebenden Untersuchungserfordernisse stellen sich auBerst heterogen dar. 0
0
In einem Mordfall kann es entscheidend sein zu wissen, ob die an der Kleidung eines Tatverdachtigen festgestellte Blutspur von dem Opfer stammt. In einem Vergewaltigungsfall ist zu prufen, ob die im Vaginalabstrich der Geschadigten gefundene Spermabeimengung von dem Tatverdachtigen stammen kann. Im Falle eines Bankraubes kann die Speichelanhaftung an einem Zigarettenrest, der in einem vom Tater benutzten Fluchtfahrzeug gefunden wurde, ein entscheidendes Beweismittel darstellen.
Neben diesen Beispielen fur die haufigsten Spurenarten im kriminaltechnischen Alltag sind aber auch immer wieder andere Proben menschlicher Herkunft (z. B. Hautreste, Haare, Knochenteile) in Einzelfallen von ausschlaggebender Bedeutung.
192
Hermann Schmitter
Eine Besonderheit forensischen Spurenmaterials ist darin zu sehen, daB Verunreinigungen aller erdenklichen Arten (mikrobielle, organische und anorganische) bei der Auswahl der jeweils anzuwendenden Methoden sowie der Durchfuhrung von Analysen und der Bewertung erzielter Ergebnisse zu berucksichtigen sind [2]. Hinzu kommen die Moglichkeiten der Mischungen von Zellen unterschiedlicher Personen (Mischspuren) und die in der Regel geringen Mengen an Ausgangsmaterial (z. B. winzige Blutspritzer). Qualitat und Quantitat des jeweiligen Untersuchungsgutes bestimmen daher wesentlich die Auswahl der jeweils anzuwendenden Untersuchungsmethoden. Die Materialkritik ist daher notwendige Voraussetzung jeder Analyse forensischen Spurenmaterials.
11.2 Aussagekraft bei Ubereinstimmungen von Erbmerkmalen Es liegt auf der Hand, da die untersuchte Spur nicht von der in Frage stehenden Vergleichsperson stammt, wenn sich in einem gegebenen System die Merkmale unterscheiden. Bei ubereinstimmenden Merkmalen mu13 jedoch gepruft werden, wie stark dies darauf hinweist, da die Vergleichsperson Spurenverursacher ist [ 3 ] . Einem in der Bevolkerung haufig auftretenden Merkmal kommt sicher eine geringere Beweiskraft zu als einem seltenen. Die forensische Wertigkeit eines Merkmalssystems ist maBgeblich abhangig von der Anzahl seiner Merkmale und deren Verteilung in der Bevolkerung. Daten aus Populationsstudien sind daher wesentliche Grundlagen fur die Bewertung von in der Spurenuntersuchung erhobenen Befunden. Als MaBzahlen fur die Aussagekraft eines Merkmalssystems konnen Anzahl und Verteilung der Allele, Heterozygotenrate sowie vor allem die sogenannte ,,Matching Probability" P, angesehen werden [4]. P, bezeichnet die Wahrscheinlichkeit, mit der in einem gegebenen System zwei unverwandte Individuen gleiche Merkmale aufweisen. Der Wert errechnet sich aus der Summe der quadrierten Haufigkeiten der in dem System gegebenen Phanotypen. Haufig wird auch die ,,Diskrimination Power" D p als Wert fur die Wahrscheinlichkeit, mit der in einem gegebenen System zwei unverwandte Individuen unterschieden werden konnen, angegeben. Beide Werte stehen durch D p = 1 - P,, zueinander in Beziehung.
11.3 Forensisch bedeutsame Polymorphismen Aus den Bemerkungen uber Aufgabenstellung forensischer Untersuchungen, Natur des zu analysierenden Materials und Aussagekraft von Ergebnissen sind die Anforderungen abzuleiten, die an forensisch brauchbare Analysenverfahren
I1 DNA-Analytik in der Forensik
193
und Merkmalssysteme gestellt werden mussen. Robustheit der Analysenmethode, zuverlassige Bestimmbarkeit in Spurenmaterial, Erkennbarkeit von Mischspuren und Nachweisempfindlichkeit sind die Hauptkriterien, nach denen ein System fur die Anwendung ausgewahlt werden kann. Weist ein diese Kriterien erfullendes System daruber hinaus auch noch einen aussagekraftigen Polymorphismus auf, kann es im Sinne der kriminaltechnischen Brauchbarkeit als optimal angesehen werden. Die Anforderungen werden in unterschiedlichen MaBen von einer Vielzahl polymorpher Loci in der menschlichen DNA erfullt. Hier konnen unter den derzeit fur forensische Anwendungen tauglichen Systemen aufgrund ihrer Natur zwei Gruppen unterschieden werden: 0
0
Sequenzspezifische Polymorphismen stellen Abschnitte aus codierenden Bereichen dar, deren Produkte auf der Proteinebene bereits als polymorph bekannt sind. Entsprechende Detektionssysteme werden in Form von Kits im Handel angeboten.Unter Einsatz der PCR-Technik und Nachweis der Reaktionsprodukte durch Hybridisierung mit sequenzspezifischen Oligonukleotiden werden in der forensischen Praxis Allele aus dem HLA-Bereich (DQ-alphaKit) und einigen anderen Polymorphismen (Polymarker-Kit) nachgewiesen. Die uberragende Bedeutung kommt jedoch den VNTR-Loci (Variable Number of Tandem Repeats) zu. Die Merkmale derartiger Systeme sind dadurch charakterisiert, da an den entsprechenden Loci unterschiedliche Anzahlen sich wiederholender Basenreihenfolgen (repetitiver Motive) vorliegen konnen. Die Allele dieser Systeme unterscheiden sich somit in ihren Langen voneinander.
VNTR-Systeme, die nicht zuletzt hinsichtlich der Aussagekraft ihrer Polymorphismen den vorgenannten weit uberlegen sind, sollen im folgenden eingehender betrachtet werden. Tabelle 1 gibt eine Ubersicht uber die in der forensischen Anwendung beschriebenen VNTR-Typen, wobei zu jedem Typ charakteristische Beispiele angefuhrt sind. Tab. 1. Uberblick iiber VNTR-Systeme in forensischen Anwendungen TYP
Art
Beispiele
Bereich (kB)
Literatur
MLS
33.15 33.6
1-20
~ ~ 7 1
SLS
MS 1 YNH 24
1-20
PI
LRM
Apo B DlS80
0,5-1
[I01 [I11
STR
THO1 SE33
0,1-0,4
~ 5 1 ~ 9 1
RFLP
AmpFLP
[91
1Y4
Hertnann Schrnitter
11.4 Methoden der VNTR-Typisierung Die DNA-Analytik stellt der forensischen Untersuchung von VNTR-Loci zur Zeit vcrschiedene Instrumentarien zur Verfugung, die teils bereits in die Anwendung in der Fallbearbeitung einbezogen, teils im Erprobungsstadium sind. Analysentechnisch konnen zwei Grundprinzipien unterschieden werden, die nach der Art der jeweils nachweisbaren polymorphen Systeme untergliedert werden konnen:
11.4.1 Southern-Analyse Die von Southern [5] beschriebene Methode zum Nachweis von DNA-Fragmenten unterschiedlicher Langen eignet sich zum Nachweis von Merkmalen der Restriktionsfragment-Langen-Polymorphismen(RFLP). Prinzip: Genomische DNA wird mit Hilfe von schnittstellenspezifischen Restriktionsenzymen geschnitten. Nach elektrophoretischer Trennung in Agarosegelen, Denaturierung und Fixierung auf geeigneten Membranen werden die unterschiedlich groljen Fragmente der jeweiligen Loci mit locusspezifischen Sonden nachgewiesen. Prinzipiell ist es dabei unerheblich, ob hierzu aus dem Genom clonierte, meist recht lange (> 1000 Bp) Sonden oder synthetisierte Oligonukleotidsonden verwendet werden. Fur die forensische Praxis ist lediglich von Bedeutung, da die nachweisbaren Loci human- oder zumindest primatenspezifisch sind, da Spurenmaterial sehr oft durch Mikroorganismen unterschiedlichster Arten oder auch durch Material tierischen Ursprungs verunreinigt ist. Sonden, die zu Sequenzen komplementar sind, die auch bei anderen Spezies vorkommen, sind fur die Spurenuntersuchung unbrauchbar. Nach der Anzahl der Loci, die eine Sonde in einem Genom erkennt, werden zwei Arten unterschieden: I n Multi-Locus-Systemen ( M L S ) werden gleichzeitig mehrere, iiber das gesamte Genom verteilte Loci mit Abschnitten identischer Sequenzen detektiert. Bci der Analyse der DNA einer Person wird ein Bandenmuster erstellt, das nach allen bisherigen Erkenntnissen individualcharakteristisch ist [6]. Diese Tatsache schlagt sich in der Bezeichnung ,,DNA fingerprinting" [7] nieder. Das Verfahren stellt jedoch hohe Anforderungen an die Quantitat und vor allem an die Qualitat der zu analysierenden DNA und konnte sich daher in der forensischen Spurenuntersuchung nicht durchsetzten, obwohl die DNA-Analytik durch diese Methode und ihre Anwendung in spektakularen Fallen in der Mitte der achtziger Jahre in das besondere Interesse der Offentlichkeit geruckt ist. In Single-Locus-Systemen ( S L S ) werden Sonden eingesetzt, deren komplementare Sequenzen nur einmal im Genom auftreten und damit die Detektion von Einzelloci ermoglichen. Die Ergebnisse eines einzigen Merkmalssystems errei-
11 DNA-Analytik in der Forensik
195
chen nicht die Aussagekraft einer MLS-Analyse. Die Kombination der Merkmale mehrerer derartiger Systeme (,,DNA profiling") kann jedoch ebenfalls als individualcharakteristisch angesehen werden [8], da die Wahrscheinlichkeit, dal3 zwei unverwandte Individuen gleiche DNA-Profile aufweisen, derart gering ist, dal3 dies praktisch auszuschliel3en ist. Die SLS-Analyse hat in der Spurenuntersuchung seit ihrer Einfuhrung in die forensische Praxis sehr schnell eine herausragende Bedeutung erlangt. Die Systeme erfullen in hohem Malje die oben aufgefuhrten Anforderungen. Insbesondere die Erkennbarkeit von Mischspuren, die sich als Mehrbandenmuster darstellen, ist gerade fur die Untersuchung von Spuren in Vergewaltigungsfallen, in denen naturgemarj meist Gemische von Sperma und Vaginalsekret vorliegen, von Bedeutung.
11.4.2 Polymerase Chain Reaktion (PCR) Unter Einsatz der PCR-Technik lassen die unterschiedlich langen Abschnitte zahlreicher VNTR-Loci in menschlicher DNA typisieren. Die nach Amplifikation darstellbaren Fragmentlangen-Polymorphismen (Amplified Fragment Length Polymorphisms, AmpFLPs) gewinnen zunehmende Bedeutung fur die kriminaltechnische Auswertung von relevantem Spurenmaterial. Es ist zu erwarten, da diese Technologie die RFLP-Analyse in Zukunft vollig verdrangen wird. Prinzip: Die merkmalstragenden DNA-Abschnitte werden mit Hilfe locusspezifischer Primer amplifiziert. Je nach Erfordernissen werden die Produkte in Agarose- oder Acrylamidgelen aufgetrennt und durch geeignete Visualisierungstechniken detektiert. Selbstverstandlich gilt auch bei diesem Verfahren aus den oben bereits genannten Grunden die Forderung, da die eingesetzten Primer human- oder zumindest primatenspezifisch sind. Die durch den Einsatz von PCR-Techniken nachweisbaren, in der forensischen Praxis brauchbaren Merkmalssysteme sind mit den bei den RFLPs beschriebenen SLS vergleichbar, einschlierjlich des Vorteils der Erkennbarkeit von Mischspuren. Sie lassen sich anhand der unterschiedlichen Langen der jeweils repetitiven Motive in zwei Grundtypen einordnen. Die Gruppe, der hier die Bezeichnung lange repetitive Motive (LRM) gegeben wird, wurde im forensischen Bereich unter der Bezeichnung AmpFLPs bekannt. Aus Grunden der Systematik dieses Artikels wird hier aber die Bezeichnung LRM eingefuhrt, da alle mit Hilfe der PCR analysierbaren VNTR-Systeme als amplifizierte Fragmentlangen-Polymorphismen angesehen werden mussen. Die Langen der repetitiven Einheiten dieser Systeme liegen im Bereich zwischen 1040 und mehr Basenpaaren. Fur die bedeutendsten Systeme dieser Gruppe (Tab. 2) liegen umfangreiche Populationsstudien sowie Berichte uber Evaluierungsstudien in der forensischen Anwendung vor. Zumindest die Loci Apo B [lo] und DlS80 (MCT 118) [ l l ] sind
196
Hermann Schmitter
weltweit in die Anwendung in der Fallbearbeitung aufgenommen. Fur das letztere der beiden Systeme ist ein auf die Forensik adaptiertes Reaktionskit im Handel erhaltlich. Zur Typisierung der Amplifikationsprodukte werden Agarosegele (Visualisierung mit Ethidiumbromid) oder Acrylamidgele (Visualisierung durch Silberfarbung) verwendet. In den entsprechenden Gelen werden jeweils Gemische, die die bekannten Allele enthalten (Allel-Leitern), mitgefuhrt, urn die Merkmale der zu typisierenden Proben eindeutig bestimmen zu konnen. Tab. 2. AmpFLP-Systeme in der forensischen Nutzung Locus
TYP
Allelea) (Anzahl)
Heterozygotiea) Pma)
Literatur
Apo B
LRM
20
0,71
0,08
[lo1
DlS80
LRM
Col A
LRM
VWA
STR
0,79
0,06
~ 4 1
THO1
STR
0,76
0,07
[I51
F13A1
FES
STR
6
0,62
0,lS
~ 7 1
D21Sll
STR
13
0,86
0,04
1181
SE 33
STR
36
0,98
0,Ol
~ 9 1
a)
Daten aus eigenenen Populationsstudien mit 150-350 Individuen in den einzelnen Systemen.
Eine nahezu unuberschaubare Anzahl polymorpher Loci ist dadurch charakterisiert, da die Langen ihrer repetitiven Motive sehr kurz sind, und daher werden sie als Short Tandem Repeats (STR) bezeichnet. Systeme mit 2-6 Basen je Motiv sind beschrieben. In forensicher Evaluierung befinden sich derzeit mehrere, uberwiegend tetramere (Motivlangen 4 Bp) Loci (Tab. 2). Einige dieser Loci wurden u. a. bereits in umfangreiche Validierungsstudien [13] einbezogen. Die aufgrund der kurzen repetitiven Motive geringen Langenunterschiede der Allele stellen erhohte Anforderungen an die Trennfahigkeit eingesetzter Elektrophoreseverfahren. Hinzu kommt, da aufgrund von Deletionen oder Insertionen in einzelnen Repeat-Einheiten oder in flankierenden Bereichen auch Allele auftreten konnen, die sich in ihren Langen urn weniger Basen als durch die Repeatlange vorgegeben unterscheiden [20]. Gelsysteme und Elektrophoresebedingungen, die Fragmente mit nur einer Base Unterschied trennen, sind fur die Typisierung einiger STR-Systeme unabdingbar. In der Analyse der STR-Loci bewahrt sich vor allem eine Methodik, bei der nach Amplifikation rnit fluoreszenzmarkierten Primern die Produkte unter denaturierenden Bedingungen elektrophoretisch getrennt und durch laserangeregte Fluoreszenz detektiert werden [21].
11 DNA-Analytik in der Forensik
197
Grundsatzlich erlaubt diese Methodik die direkte Bestimmung der Lange eines Fragmentes, die auf der Basis eines in jeder Spur mitgefiihrten Langenstandards rnit Hilfe der von Elder und Southern [22] beschriebenen Verfahren errechnet wird. Eigene Messungen und Vergleiche rnit veroffentlichten Daten anderer Labors zeigen jedoch z.T. erhebliche Unterschiede in den Langenangaben, so daB die FragmentgroBen nicht direkt zur Bezeichnung der Allele herangezogen werden konnen. In der Anwendung wird daher wie bei der LRM-Typisierung in jedem Gel eine Spur rnit einer Allel-Leiter beschickt, die eine eindeutige Zuordnung unbekannter Proben ermoglicht. Durch iibereinanderlegen der Elektropherogramme einer Probenspur und der Leiterspur konnen die Allele zweifelsfrei eingeordnet werden (Abb. 1).
Fragmentlange (Bp) Abb.l. Elektropherogramm der Allel-Leiter des Locus THO1 rnit den Allelen 3'bis ,,ll". In die Leiter wurde das Elektropherogramm einer Probe mit dem Phanotyp 9.3/10 (31.1131.2) eingeblendet.
Anhand der Systeme HUMTHO1 und HUMACBP2 seien beispielhaft einige Aspekte der STR-Typisierung dargestellt. Hinsichtlich methodischer Details, wie Primersequenzen, Amplifikations- und Elektrophoresebedingungen, wird dabei auf die Publikationen von Gill et al. [13] und Kimpton et al. [21] verwiesen. Im System THO1, das rnit P, = 0,07 zu den weniger aussagekraftigen STRSystemen zahlt, wird die oben angesprochene Problematik der Allele rnit nicht zu erwartenden Langen deutlich. Das in diesem System bei Kaukasiern haufigste Allel (Abb. 2) wird nach einer weitgehend akzeptierten Nomenklatur, die auf der Angabe der Anzahl der Wiederholungen der Repeatsequenzen basiert, mit 9.3 bezeichnet (in Abb. 2 entspricht dies dem Allel 31.1 nach einer im eigenen Labor angewendeten, vorlaufigen Nomenklatur [23]).
198
Hermunn Schmitter 030
6
8
7
0,25
N
0,20
e a2
a
w
0.15
a2 L
Lrr
0,lO
0.05
0.00
1
pi
R
10
1
II x
--m
10,3
~
I --
-
,
m N
m
Allele
Abb. 2. Allelfrequenzen im System THO1 N=150 Individuen; die Bezeichnungen der Allele sind entsprechend den beiden hier angesprochenen Nomenklaturregeln unter der x-Achse bzw. oberhalb der Saulen eingetragen. Das entsprechende Fragment ist um nur 3 Bp (in dem tetrameren System werden 4-Bp-Abstande erwartet) Ianger als das nachst kurzere. In nichtdenaturierenden Gelsystemen wird es mit dem seltener vorkommenden Allel 10 (31.2), das um ein Repeat (4Bp) groBer als das Allel 9 (30.2) ist, zusammen typisiert. Der in Abb. 1 dargestellte heterozygote Typ 9.3110 (31.U31.2 ) wird in Gelsystemen mit geringerer Auflosung als homozygoter Phanotyp (10/10) erkannt.
O'O 0.04
I=
I
I 9 D
9 Z
Abb. 3. Allelfrequenzen im System SE 33 (N=300 Individuen).
LL,
I1 DNA-Analytik in der Forensik
199
Der Locus HUMACBP2 (SE 33) beinhaltet einen aul3erst aussagekraftigen (P, = 0,Ol) Polymorphismus, der aufgrund der Vielzahl bisher nachgewiesener Allele und deren Frequenzen (Abb. 3) als hochvariabel angesehen werden kann. Insbesondere in Fallen, in denen zahlreiche Einzelspuren darauf uberpruft werden mussen, ob unterschiedliche Spurenleger beteiligt sind, kann dieser Polymorphismus als System der Wahl angesehen werden. Derzeit mu13 allerdings noch als nachteilig angesehen werden, da eine einheitliche Nomenklatur fur dieses System noch nicht existiert. Die Allelbezeichnungen in Abb. 3 ergeben sich aus der bereits oben erwahnten Nomenklaturregel [23].
11.5 Aussichten der VNTR-Typisierung Einige Besonderheiten der STR-Loci lassen es als wahrscheinlich erscheinen, da die STR-Typisierung in Zukunft in der forensischen Nutzung von VNTR-Polymorphismen eine dominierende Rolle spielen wird, wobei die oben genannte Technik der Detektion nach Amplifikation mit fluoreszenzmarkierten Primern die bevorzugte Methode sein durfte. Die Fragmentlangen der Allele von STR-Systemen werden in recht engen Groflenbereichen dargestellt. Beispielsweise umspannen die Allele des Systems THO1 einen Bereich von nur ca. 30 Bp. Diese Eigenschaft verringert die Gefahr, da bei zwei weit auseinanderliegenden Allelen selektiv das kleinere Allel amplifiziert wird. Der Effekt (,,allelk dropout") kann bei der LRM-Typisierung dazu fuhren, da ein heterozygoter Phanotyp falschlich als homozygot typisiert wird. Wegen der Kiirze der Allele besteht aul3erdem auch bei stark degradierter DNA die Aussicht, mit STR-Analysen noch auswertbare Egebnisse zu erzielen. Somit besteht hier die Moglichkeit, Spurenmaterial auszuwerten, das aufgrund der Gegebenheiten des Falles unter ungunstigen Bedingungen gelagert war. Mehrere Publikationen (u. a. auch [21]) zeigen, da mehrere STR-Loci nach Amplifikation in einem einzigen Ansatz (Multiplex-PCR) gleichzeitig ausgewertet werden konnen. Besonders fur die Fallbearbeitung, in der haufig nur geringe Mengen an Ausgangsmaterial vorliegen oder im Zuge von Ermittlungen aussagekraftige Ergebnisse in kurzer Zeit benotigt werden, ist diese Moglichkeit von besonderem Interesse. Allein die in Tab. 2 aufgefuhrten STR-Loci ergeben in ihrer Kombination Das bedeutet, da schon mit diesen wenigen einen Wert fur P, von ca. 3 x Loci bei ubereinstimmenden Merkmalen eine an Individualisierung heranreichende Zuordnungswahrscheinlichkeit erreicht werden kann. Es ist hierbei darauf hinzuweisen, da die diesem Wert zugrundeliegenden Populationsdaten auf Alleldefinitionen basieren, die allein auf der elektrophoretischen Mobilitat der Amplifikationsprodukte unter denaturierenden Bedingungen beruhen. Mogliche Sequenzunterschiede gleichlanger Fragmente, die u. U. noch weitergehende Differenzierungen zulassen konnten, sind hier nicht berucksichtigt. Wegen der hohen Aussagekraft der Systeme erscheint aber eine ,,Subtypisierung" durch
200
Herrnann Schniitter
Sequenzierung nicht erforderlich, da der damit verbundene analytische Aufwand in keinem Verhaltnis zur erwarteten Verbesserung der Aussage stande. Bei Anwendung mehrerer Loci ist aufgrund der geringen P,-Werte der einzelnen Systeme in jedem Falle eine Unterscheidung zweier Individuen zu erwarten, selbst wenn sie in einem gegebenen System gleichgrol3e Fragmente aufweisen, die sich nur in ihren Sequenzen unterscheiden, und daher allein auf der Basis der elektrophoretischen Mobilitat der Amplifikationsprodukte als Individuen mit gleichem Phanotyp in diesem System angesehen werden mussen.
11.6 Weitere Aspekte der DNA-Analyse in der Forensik In dem vorliegenden Kapitel wurde versucht, den derzeitigen Stand mit den wichtigsten Aspekten der DNA-Analytik in der kriminaltechnischen Anwendung darzustellen. Die Ausfuhrungen konnen allerdings nur als eine Momentaufnahme verstanden werden. Die bisherige Entwicklung seit etwa Mitte der achtziger Jahre zeigt ein deutliches Ubergewicht der VNTR-Loci, wobei sich der Trend von RFLP- zu AmpFLP-Systemen und dort zu STR-Loci abzeichnet. Inwieweit die Typisierung der oben erwahnten sequenzspezifischen Polymorphismen in codierenden Bereichen der DNA groljere Bedeutung in der Forensik erlangen werden, mulj abgewartet werden. Grundsatzlich aber durften naturgema13 derartige Merkmalssysteme kaum die Aussagekraft der VNTR-Polymorphismen erreichen. In der jungeren Literatur wird auch die Analyse von Ah-Elementen als Moglichkeit fur die Differenzierung von Individuen diskutiert [24]. Auch hier wird die zukunftige Entwicklung zeigen mussen, ob diese Anwendungsmoglichkeit Eingang in die forensische Analytik finden wird. Neben der Analyse genomischer DNA wurde in Einzelfallen, in denen die Besonderheit des Spurenmaterials DNA-Typisierung im hier besprochenen Sinne zuliel3, die Variabilitat der der mitochondrialen DNA (mtDNA) in die vergleichenden Analysen einbezogen [25].Die entsprechenden Varianten werden durch Sequenzierung der variablen Abschnitte der dLoop-Region dargestellt. Das Thema DNA-Analytik in der Forensik wurde hier ausschlieljlich auf die Anwendungen im humanen Bereich behandelt. Hier liegt die Hauptanwendung gentechnischer Methoden, da die Zuordnung von Spurenmaterial menschlicher Herkunft einen hohen Stellenwert im Sachbeweis vor Gericht einnimmt. Es darf aber nicht ubersehen werden, da auch der Ausschlulj falschlicherweise angenommener Spurenleger, der oftmals den Lauf von Ermittlungen entscheidend beeinfluat, eine wichtige Komponente der Fallbearbeitung darstellt. NaturgemaB werden derartige Erkenntnisse kaum in der Offentlichkeit bekannt, da sie selten in die Beweisfuhrung vor Gericht einflieljen.
11 DNA-Analytik in der Forensik
201
Neben der Auswertung von Spurenmaterial menschlicher Herkunft wird die DNA-Analytik aber auch zur Begutachtung von Spuren anderer biologischer Herkunft eingesetzt. Bei tierischen Spuren ist hier an Falle von Jagdwilderei oder VerstoBen gegen den Artenschutz zu denken. Aufsehen hat ein Fall in Kalifornien erregt, in dem ein Pflanzenteil einem Baum eindeutig zugeordnet wurde, unter dem eine Leiche abgelegt worden war.
11.7 Literatur [l] Henke, J., H. Schmitter, DNA-Polymorphismen in forensischen Fragestellungen, MDR 5 (1989), 400406. [2] McLaughlin, C.M., Budowle, B., Giusti, A.M., Smerick, J.B., Baechtel, F.S.: Deoxyribonucleic acid (DNA) analysis by restriction fragment length polymorphisms of blood and other body fluid stains subjected to contamination and environmental insults, J. Forensic Sci., JFSCA 36 (5) (1991), 12861298. [3] Evett, I.W., Buckleton, J.S., What is the probability that this blood came from that person? A meaningful question? J. Forensic Sci. SOC.23 (1983), 35-39. [4] Selvin S. Statistical analysis of blood genetic evidence, in Handbook for Forensic Individualization of Human Blood and Bloodstains, Ed. Grunbaum, B.W., Chapter 7, pp. 177 (1981). [5] Southern, E.M., Detection of specific sequences among DNA fragments separated by gel electrophoresis, J. Mol. Biol. 98 (1975), 503-517. [6] Jeffreys, A.J. et al., Individual specific ,,fingerprints" of human DNA, Nature 316 (1985), 76-79. [7] Gill P., Jeffreys, A.J., Werret, D.J., Forensic application of DNA fingerprints, Nature 318 (1985), 577-579. [8] Wong, Z. et al.: Characterisation of a panel of highly variable minisatellites cloned from human DNA, Ann. of Hum. Genet. 51 (1987), 269-288. [9] Wyman, A.R., White, R., A highly polymorphic locus in human DNA, Proc. Natl. Acad. Sci. USA 77 (1980), 6754-6758. [lo] Boerwinkle, E., Xiong, W., Fourest, E., Chan, L., Rapid typing of tandemly repeated hypervariable loci by the polymerase chain reaction: application to the Apolipoprotein B region. Proc. Natl. Acad. Sci. USA 86, (1989) 212-216. [11] K. Kasai, Nakamura, Y.,White, R., Amplification of a variable number of tandem repeats (VNTR) locus (pMCT 118) by the polymerase chain reaction (PCR) and its application to forensic science, J. Forensic Sci. 35 (1990), 1196-1200. [12] Wu, S., Seino, S., Bell, GI., Human collagen, type 11, alpha 21. (COL2A1) gene: VNTR polymorphism detected by gene amplification, Nucleic Acids Res. 18 (1990), 3102. [13] Gill, P., Kimpton, C., D'Aloja, E.,. Andersen, J.F, Br, W., Brinkmann, B., Holgersson, S., Johnson, V., Kloosterman, A.D., Lareu, M.V., Nellemann, L., Pfitzinger, H., Phillips, C.P., Schmitter, H., Schneider, P.M., Stenersen, M., Report of the European DNA Working Group (EDNAP) - Towards standardisation of short tandem repeat (STR) loci, Forensic Sci. Int. 65 (1994), 51-59. [14] Kimpton, C.€?, Walton, A., Gill, P., A further tetranucleotide repeat polymorphism in the vWF gene, Hum. Mol. Genet. 1 (1992), 287. [15] Poymeropoulos, M.H., Rath, D.S., Xiao, H., Merril, C.R, Tetranucleotide repeat polymorphism at the human tyrosine hydrolase gene (TH), Nucleic Acids Res. 19 (1991), 3753.
202
Herninnn Schmittrr
[ 16) Poymeropoulos. M.H.. Rath, D.S., Xiao, H., Merril, C.R., Tetranucleotide repeat polymorphism at the human coagulation factor XI11 A subunit gene (F13A1), Nucleic Acids Res. 19 (IYYI). 4036. [ 171 Poymeropoulos M.H., Rath. D.S.. Xiao, H.. Merril, C.R.,Tetranucleotide repeat polymorphism at the human c-fes/fps proto-oncogene (FES), Nucleic Acids Res. 19, (1991) 4018. [ 181 Sharma, V., Litt, M., Tetranucleotide repeat polymorphism at the D21Sll locus, Hum. Mol. ’ Genet. l(1) (1992). 67. [ 191 Poymeropoulos, M.H., Rath, D.S., Xiao. H., Merril, C.R.,Tetranucleotide repeat polymorphism at the human beta-actin related pseudogene H-beta-Ac-psi-(ACTB2), Nucleic Acids Res. 20 (1YY2), 1432. [20] Mller, A., Brinkmann, B., Locus ACTBP2 (SE33) - Sequencing data reveal considerable polymorphism, Int. J. Leg. Med. 106 (IYY4), 262-267. [21] Kimpton, C., Fisher, D., Watson, S., Adams, M., Urquhart, A,, Lygo, J., Gill, P., Evaluation of an automated DNA profiling system imploying multiplex amplification of four tetrameric STR loci, Int. J. Leg. Med. 106 (1YY4), 302-31 1. [22] Elder. J.K.. Southern, E.M. (1983) Computer-aided analysis of one-dimensional restriction fragment gels. in: Nucleic Acid and Protein Sequence Analysis - A Practical Approach., Chapter 7 (Bishop M.J.. Rawlings, C.J. Eds. IRL Press, Oxford, (1987)). [23] Schmitter, H., Sonntag, M.-L.. Proposal for general rules for the determinations of alleles of STR loci based on the electrophoretic mobilities of their fragments, Klin. Lab. 41 (IY95). 173- 176. (241 Perna, N.T., Batzer, M.A., Deininger, P.L., Stoneking, M., Alu insertion polymorphism - A new type of marker for human population studies, Hum. Biol. 64 (5) (1Y92), 641-648. [2S] Sullivan, K.M., Hopgood, R., Gill, P., Identification of human remains by amplification and automated sequencing of human mitochondria1 DNA, Electrophoresis 12 (1992), 17-21,
12 DNA-Sequenzierung in der medizinischen Mikrobiologie Albrecht von Brunn
12.1 Einfuhrung Die Entwicklung von Methoden zur Bestimmung von Nukleotidsequenzen hat in den letzten Jahren einen auOerst wichtigen Beitrag zur Erweiterung des Kenntnisstandes um molekularbiologische Grundprozesse geleistet. Die hohe Zuverlassigkeit und Schnelligkeit der DNA-Sequenzierung hat einen rasanten Aufschwung der Molekularbiologie und Biotechnologie ausgelost. Die Sequenzierung von DNA gehort heute zu den Standardmethoden der meisten molekularbiologisch arbeitenden Labors. Sequenzanalysen sind fur die Losung grundlagenorientierter Fragestellungen unentbehrlich geworden. Sie wirken sich aber auch auf verschiedenste Lebensbereiche, insbesondere auf den Bereich der Medizin, aus: Durch die Akkumulation von Sequenzdaten konnen Mutationen in bestimmten Genen leichter erkannt und die resultierenden Defekte besser behandelt werden. Krankheiten, welche durch bakterielle, virale oder parasitare Erreger verursacht werden, konnen besser diagnostiziert und bekampft werden. Das Immunsystem des Patienten selbst ubt einen Selektionsdruck im Hinblick auf uberlebensfahige mikrobielle Varianten aus: es erkennt bestimmte Antigenstrukturen des eingedrungenen Erregers aufgrund komplizierter Identifizierungsmechanismen als fremd und setzt humorale (Antikorper) und/oder zellulare Mechanismen zur Eliminierung des Pathogens in Gang. Aufgrund von Mutationen uberleben aber einige Erreger und ermoglichen so den Fortbestand der Spezies. So hat sich bei vielen Pathogenen im Verlauf der inter- und intrapersonellen Evolution bezuglich der Gesamtpopulation ein breites Spektrum an Isolaten entwickelt, welche aufgrund der Sequenzanalyse in Klassen, Gruppen, Subtypen usw. eingeteilt werden konnen. Durch die Entwicklung neuartiger Therapeutika wird die Lebensqualitat von Patienten verbessert. Langerfristige Anwendung von Medikamenten gegen pathogene Erreger lost jedoch haufig die Entwicklung von Resistenzen gegen diese aus. Resistenzen sind meist die Folge von Mutationen im mikrobiellen Genom und konnen durch die Sequenzanalyse identifiziert bzw. vorhergesagt werden. Durch Umstellung auf andere Medikamente konnen die mikrobiellen Ausweichtricks - zumindest zeitweise - gemildert oder unwirksam gemacht werden. Anhand einiger Beispiele, insbesondere des humanen Immundefizienz Virus (HIV), wird im folgenden die Bedeutung der DNA-Sequenzierung fur medizinisch mikrobiologische Anwendungsbereiche aufgezeigt.
204
Alhrecht von Brunn
12.2 Theoretische Grundlagen Das Erbgut lebender Organismen ist im genetischen Code fixiert. E r basiert auf einer Triplettverschlusselung der vier Nukleotidgrundbausteine (Guanin, Adenin, Thymin, Cytosin) der Desoxyribonukleinsaure (DNA). Diese wird im Rahmen der Proteinbiosynthese uber bestimmte Zwischenmolekule, den Botenribonukleinsauren (mRNAs), in Aminosauren bzw. Proteine ubersetzt, wobei erstere von einem oder mehreren Tripletts kodiert werden. Aufgrund dieser Degeneration des genetischen Codes konnen Basenaustausche an der zweiten oder dritten Position mancher Tripletts erfolgen, welche keinen Austausch der Aminosaure zur Folge hat. Ein DNA Abschnitt, welcher ein Protein bestimmt, wird als Gen bezeichnet. Der Beginn und das Ende eines Gens wird jeweils durch ein Startund ein Stopkodon definiert. Dazwischen befindet sich ein offenes Leseraster, welches nicht durch Stop- oder ,,Nonsens"-Kodons unterbrochen sein darf. Die spezifische Aneinanderreihung der Nukleotide im Nukleinsauremolekul bestimmt die Abfolge der Aminosauren im Protein. Dieses besitzt aufgrund seiner Aminosaurekomposition eine dreidimensionale Struktur. Hiermit sind wiederum strukturelle oder enzymatische Funktionen im Organismus verbunden, welche fur dessen Existenz unabdingbar sind. Durch das Auftreten von Mutationen in der Nukleinsaure konnen Veranderungen in der Aminosaureabfolge bzw. -struktur eines Proteins erfolgen. Solche Mutationen konnen als Substitutionen, Insertionen oder Deletionen einzelner Basen oder groBerer Nukleinsaureabschnitte auftreten. Die Folgen sind der Einbau von ,,falschen" Aminosauren, Rasterverschiebungen oder vorzeitiger Abbruch der Aminosaurekette des jeweiligen Proteins. Erfolgen solche Veranderungen an wichtigen Stellen wie z. B. im aktiven Zentrum eines Enzyms oder einer die Struktur bestimmenden Position, so kann die Funktionsfahigkeit des Proteins eingeschrankt oder vollig aul3er Kraft gesetzt werden. Diese Regeln gelten sowohl fur einfache prokaryotische als auch fur hochkomplexe eukaryotische Lebewesen. Durch die DNA Sequenzanalyse hat man vor allem bei mikrobiologischen Keimen ein enormes Spektrum an Sequenzvariation gefunden, welches es diesen ermoglicht, auf verschiedenste Selektionsdrucke zu reagieren und zu uberleben.
12.3 Humanes Immundefizienzvirus Die Infektion mit HIV-1 fuhrt im Mittel innerhalb von acht his zehn Jahren zur Ausbildung von AIDS. Initial ist das Immunsystem infizierter Patienten in der Lage, die primare Infektion unter Kontrolle zu bringen. Jedoch halt das Virus eine Replikation auf geringem Niveau aufrecht, his es zur Aktivierung und massiven Ausbreitung kommt. Parallel hierzu werden allmahlich verschiedene Aste des Immunsystems zerstort. Bei den einzelnen Patienten gibt es grol3e Unterschiede in dem Zeitraum zwischen der Infektion und der Entwicklung von AIDS.
12 DNA-Sequenzierung in der rnedizinischen Mikrobiologie
205
Einige wenige Patienten entwickeln bereits innerhalb eines Jahres, andere nach bisher 15 Jahren keine Krankheitssymptome. Diese Unterschiede werden rnit beeinflufit von unterschiedlichen Antworten des Immunsystems auf die HIV Infektion und die Aggressivitat von HIV selbst. Detailliertere Kenntnisse uber Nukleinsaurezusammensetzung der viralen Genome im infizierten Patienten rnit unterschiedlichen zeitlichen Prognosen sollten in Zukunft Ruckschlusse auf bessere medikamentose Behandlung und auf die Entwicklung von optimierteren HIV Vakzinen zulassen, da die Variabilitat direkt rnit der Eigenschaft korreliert, das Immunsystem beziehungsweise die Wirkung von Medikamenten zu umgehen. In den ersten vier bis sechs Wochen nach Infektion ( p i ) mit HIV repliziert das Virus weitgehend ungehindert, bis das Immunsystem spezifische Antworten ausbildet. Neben einem cytotoxischen T-Zell (CTL) Angriff auf virusproduzierende Zellen werden Antikorper gegen virale Proteine gebildet. Zunachst kommt es zur Ausbildung von isolatspezifischen, virusneutralisierenden Antikorpern (NTAk), welche haufig gegen lineare Epitope der Krone der V3-Schleife (V3Region, PND) des aufieren Hullproteins von gp120 gerichtet sind. Aufgrund der fehlenden ,,Proofreading"-Aktivitat der reversen Transkriptase mutieren bei jeder reversen Transkription eines Virusgenomes zur proviralen DNA-Kopie statistisch eine bis mehrere Nukleotidpositionen im Vergleich zur Ausgangs-RNA. So entsteht wahrend der Initialphase ein Vorrat von Virusvarianten, in dem sich alle Nachkommen einer klonalen, infizierenden Viruspopulation nach einer Replikationsrunde bereits unterscheiden. Nach dem starken Ansteigen der Virusproduktion in den ersten Wochen und Monaten p.i. kann rnit der Entwicklung von neuen biolgischen Virusvarianten die Diversifizierung stark beschleunigt werden. Aus jeder rnit einer replikationskompetenten Virusmutante infizierten Zelle wird wieder eine (pro Zelle) homogene Virusgeneration freigesetzt, welche neue Zellen infiziert. In diesen wiederum werden jeweils neue Mutanten erzeugt und selektiert. Eine erneute Immunantwort gegen weitere, NT-AK-resistente Viruspopulationen fuhrt zur ,,Boosterung" der Ak-Antwort gegen konservierte Virusanteile und der Bildung neuer NT-Aks [l].In weiteren iterativen Zyklen von a) Vermehrung einer jeweils nicht unterdruckten Viruspopulation und b) Aufbau einer spezifischen Immunantwort dagegen, kommt es zur Bildung extrem hoher AK-Titer gegen konservierte Virusbestandteile und zu immer geringeren NTAKs gegen die linearen Epitope spaterer Virusvarianten. Die Entwicklung von kreuzreaktiven, gruppenspezifischen Antikorpern gegen diskontinuierliche, konformationelle Epitope ist meist rnit der CD4-bindenden Region des gp120 assoziiert [12]. Solche Antikorper werden bei langanhaltendem, stabilem Krankheitszustand gefunden, gehen aber rnit zunehmender Verschlechterung der Krankheitssymptome verloren [3]. Wahrend der Zyklen kommt es zur standigen Aktivierung von Zielzellen, die in stimuliertem Zustand besonders empfanglich fur die Infektion sind und durch diese zerstort werden konnen. In der Folge erschopft sich das Immunsystem. Die Sequenzvariabilitat stellt so einen wichtigen Faktor beim Kollaps des Immun-
206
Alhrecht von Rriinn
systems dar. Schnell replizierende Virusmutanten konnen sich im fortgeschrittenen Erkrankungsstadium ohne wesentlichen neuen Selektionsdruck seitens des Immunsystems vermehren. Die Viramie erhoht sich ahnlich wie in der Anfangsphase der Infektion.
12.3.1 Sequenzvariation von HIV-Subtypen Das breite Spektrum der genetischen Variation ist Ergebnis der schnellen evolutionaren Entwicklung des HIV-1 Genoms. Auf der Basis des fur das virale Hullprotein kodierenden Gens (env) werden weltweit neun phylogenetische Nukleotidsequenztypen (Subtyp A bis I) unterschieden [13]. Kurzlich kam die hochdivergente Gruppe des Subtyps 0 aus Westafrika hinzu [4]. Auf Nukleotidebene sind die Hauptsubtypen bezuglich der gag und env Gene etwa gleich weit voneinander entfernt [ 131. Berechnungen der Divergenzraten von HIV-1 env Sequenzen zwischen infizierten Individuen innerhalb einer Population gehen von Veranderungen bis zu 1 % pro Jahr aus [14]. Nimmt man solche Berechnungen als Grundlage fur eine retrospektive, zeitliche Entstehung der neun Subtypen aus einem gemeinsamen Vorganger, so ergibt sich ein gemeinsamer Ursprung in einer GroBenordnung von Jahrzehnten.
12.3.2 Sequenzvariation in der PND des HIV-Ugpl20Oberflachenproteins Neben der geographischen HIV Variabilitat spielen individuelle Unterschiede im Virusgenom innerhalb cines Patienten eine sehr wichtige Rolle. Besonders betroffen von dieser Variation ist die biologisch auBerst wichtige Domane der V3-Schleife auf dem envlgpl20. Gegen sie ist eine humorale und zellulare Immunantwort gerichtet. Die wichtigsten neutralisierenden B-Zellepitope, aber auch TZellepitope konzentrieren sich auf die Krone der Schlaufe. Die tetrameren Sequenzfolgen GPGR (Nordamerika, Europa) bzw. GPGQ und GLGQ (Afrika) sind innerhalb der meisten HIV-1 Isolate die konserviertesten Motive. Jedoch werden auch hier immer mehr Abweichungen gefunden, welche die Spezifitat von anti-V3 neutralisierenden Antikorpern gegen proximal zur Krone liegende Aminosauresequenzen beeinflussen konnen [21]. AuBerdem spielt sie eine sehr wichtige Rolle bezuglich der viralen Infektiositat, des Zelltropismus und der Syncytiumbildung [9]. Als Folge des Selektionsdruckes wahrend der primaren und kontinuierlichen Immunantwort konnen sich Virusvarianten vermehren, welche sich in der PND des ursprunglichen Virus unterscheiden (Quasispezies, [15]). So konnen einzelne Punktmutationen in der V3-Schleife zu einem Monozyten- oder Makrophagen-
12 DNA-Sequenzierung in der medizinischen Mikrobiologie
207
spezifischen Tropismus [5] oder zur veranderten Erkennung durch zytotoxische T-Zellen fuhren [17]. Aufgrund der hohen Variabilitat wird die Nukleotidabfolge der V3-Region inzwischen fur die Genotypisierung von Untergruppen der bereits erwahnten Subtypen herangezogen. Die Automatisierung der Sequenzanalyse und die Moglichkeit der direkten Sequenzierung von PCR(Po1ymerasekettenreaktion)-Produkten fuhrte zu einem sprunghaften Anstieg der Sequenzinformation dieser Region aus verschiedenen Virusisolaten. Daruber hinaus ist es moglich, dynamische Ubergange in der Viruspopulation eines einzelnen Patienten bzw. das Vorhandensein mehrerer Viruspopulationen zu einem bestimmten Zeitpunkt nachzuweisen. In Abb. 1 ist ein Beispiel fur einen ,,SchnappschuB" der Populationsdynamik von mindestens zwei Viruspopulationen eines HIV-infizierten Patienten im AIDS Stadium gezeigt. Das Auftreten von Doppelpeaks an den identischen Stellen der Chromatogramme des kodierenden (+) und nichtkodierenden (-) DNA Stranges (Mitte) erlaubt den Ruckschlurj auf das Vorhandensein von zwei Viruspopulationen an dieser spezifischen Stelle. Im obersten Teil der Abbildung sind Punktmutationen der beiden Strange mit den entsprechenden Aminosaureaustauschen im Vergleich zum HIV-1 MN-Isolat, welches in Europa und Nordamerika am weitesten verbreitet ist, gezeigt. So hat die Mutation von CAG nach CAC den Austausch von Glutamin nach Histidin zur Folge, wahrend die stille Mutation von CTG nach ZTG die Aminosaure Leucin nicht beeinflufit. Innerhalb des V3-loops (unten) befinden sich drei, in den flankierenden Sequenzen sieben Positionen mit zwei Aminosauren (schwarz). Im Vergleich hierzu sind die Sequenzunterschiede (rot) der Viruspopulation gezeigt, nachdem das isolierte Virus auf HUT-78 Zellen in Kultur propagiert wurde. Die riesige Anzahl von veroffentlichten V3-Sequenzen hat inzwischen gezeigt, darj die allgemein anerkannte Notwendigkeit der Einbeziehung der PND in einen moglichen Anti-HIV-Impfstoff nicht so einfach ist wie ursprunglich angenommen. Die Entscheidung uber die Auswahl der ,,richtigen" Sequenzen ist sehr schwierig. Deshalb erscheint es sinnvoll, auf der Basis der enormen Mengen an Sequenzdaten solche Sequenzen auszuwahlen, welche aufgrund ahnlicher Proteinstrukturen die verschiedenen V3 Formen mit den wichtigen biologischen Eigenschaften reprasentieren.
12.3.3 Bestimmung antiretroviraler Resistenzen gegen HIV-Therapeutika Die Infektion mit dem humanen Immundefizienzvirus (HIV) ist ein chronischer Prozerj mit langanhaltenden, hohen Replikationsraten. Das Virus zeigt im Laufe der Infektionszeit hohe Mutationsraten sowohl intra- als auch interpersonell. Deshalb ist es nicht verwunderlich, darj durch gezielte, lang andauernde Chemo-
208
Albrecht von Brunn
Abb. 1. SchnappschuR der viralen Populationsdynamik eines HIV-1-infizierten Patienten im AIDS Stadium. Durch das Auftreten von Doppel-,,Peaks" konnen bei der Sequenzierung von PCR Fragmenten aus den PBLs des Patienten Punktmutationen direkt auf kodierendem und nichtkodierendem Strang nachgewiesen werden. Die DNA Sequenzierung wurde mit dem 373A System von Applied Biosystems durchgefuhrt. Oben: Sequenzvergleich von (+) und (-) Strang mit dem HIV-1 MN Isolat. Mitte: Chromatogramme der beiden Strange. Unten: Perlenschnurmodel1 der beiden Strange (schwarz) im Vergleich zur Aminosauresequenz desselben Virusisolates nach Kultivierung auf HUT-78 Zellen (rot). Nicht aufgefuhrte Aminosauren sind mit dem (+) Strang aus PBL DNA identisch. Blau unterlegt sind Aminosauren aus der Zellkultur DNA, welche mit mindestens einer Aminosaure der beiden Strange aus der PBL DNA identisch sind.
12 DNA-Sequenzierung in der medizinischen Mikrobiologie
209
therapie ein Selektionsdruck ausgeubt wird, welcher resistente HIV Mutanten hervorruft. Solche Phanomene sind auch fur andere Viren wie Herpes Simplex Virus, Varicella Zoster Virus, Cytomegalievirus, Influenza A Virus oder Rhinovirus bekannt [16]. HIV hat drei Enzyme, welche fur eine therapeutische Intervention in Frage kommen: die reverse Transkriptase (RT), die Integrase und die Protease. Die RT schreibt das virale RNA Genom nach Eintritt in die Zelle in DNA um, welche anschlieBend von der Integrase in das menschliche Genom eingebaut wird. Die Protease wird fur den Aufbau des Viruskerns, bevor das Partikel aus der infizierten Zelle austritt, benotigt. Da die menschliche Zelle keine RT besitzt, konzentrierten sich die ersten Therapieansatze ab 1986 auf RT-Hemmsubstanzen [ll]. Den Prototyp einer solchen Substanz stellt das Nukleosidanalogon Azidothymidin (AZT) dar, welches seine Wirksamkeit bei manchen Patienten bereits nach sechs Monaten, bei anderen nach einigen Jahren verliert. Larder und Kemp [7] zeigten bereits 1989, daB die Resistenzentwicklung gegen AZT als Folge von Punktmutationen im viralen Genom auf den Austausch von funf einzelnen Aminosauren im Protein der viralen RT zuruckzufuhren ist. Jeder einzelne Austausch tragt unterschiedlich zum Grad der Resistenz bei. Die funf Austausche schaukeln im Verlauf der Therapie die Selektion hochresistenter Viren hoch. Verantwortlich fur die schnelle Resistenzentwicklung ist die oben bereits besprochene Variabilitat des HIV-Genoms: der therapeutische Selektionsdruck reichert die resistenten Varianten an. Trotzdem kann AZT bei langzeitbehandelten HIV-infizierten Patienten durchaus eine das Leben verbessernde und verlangernde Wirkung haben. Auch bei der Verwendung der Nukleosidanaloga ddI und ddC treten Resistenzmutationen im Gen der RT auf. Da zellulare DNA Polymerasen ebenfalls durch Nukleosidanaloga beeinflufit werden konnen, werden inzwischen auch RTspezifische Inhibitoren eingesetzt. Resistenzentwicklungen werden ublicherweise anhand von zell- und/oder molekularbiologischen Methoden bestimmt. Bei ersterer wird Virus aus dem Patienten in Kultur genommen und in Parallelansatzen bei steigenden Inhibitorkonzentrationen auf Uberlebensfahigkeit getestet. Bei der molekularen Methode werden spezifische Resistenzmutationen direkt bei den Viren der therapierten Patienten nachgewiesen. Hierzu wird aus peripheren Blutlymphozyten (PBL) der Patienten in das Wirtsgenom integrierte doppelstrangige virale DNA oder in v i m revers transkribierte genomische RNA aus im Plasma vorhandenen Viruspartikeln verwendet. Uber eine verschachtelte (,,nested") PCR wird das entsprechende DNA Fragment der RT amplifiziert und mittels automatischer DNA Analysemethoden direkt sequenziert. Werden die entsprechenden Mutationen im RT Gen mit den jeweiligen Aminosaureaustauschen gefunden, konnen Ruckschlusse auf das zu erwartende Muster der Resistenzausbildung gezogen werden. Eine Zusammenfassung spezifischer Resistenzmutationen einiger RT Inhibitoren ist in Tabelle 1 gezeigt. Die Existenz verschiedener Therapeutika eroffnet die Moglichkeit, diese in Kombination anzuwenden. Es hat sich jedoch auch hier gezeigt, daB bestimmte
210
Albrecht von Britnn
Kombinationen die Sensitivitat erniedrigen, aber auch erhohen konnen. Leider ist auch die Verwendung dreier Substanzen nicht ausreichend, um die Viruspopulation durch ,,Sich-tot-mutieren" des RT Gens vollstandig zu eliminieren (8). Ahnliche Probleme ergeben sich bei der Verwendung von Proteaseinhibitoren. Bei ersten klinischen Anwendungen stellte sich heraus, dalj eine schnell auftretende Mutation der Aminosaure 48 zur Resistenz gegenuber den Inhibitoren Ro31-8959 oder A-77003 fuhrt. Durch im menschlichen Korper vorkommende, dem HIV Enzym ahnliche Proteasen kann es zu Komplikationen bei Gabe von Inhibitoren kommen. Die Entwicklung von Hemmern der Integrase steht aufgrund der schwierigen Messung der Enzymaktivitat noch in den Anfangen. Die besten Chancen fur eine antiretrovirale Therapie sind zur Zeit wohl in der Kombination von Substanzen zu sehen, welche auf alle drei Enzyme gleichzeitig wirken. Tab. 1. Auswahl mutationsbedingter Aminosaureaustausche in der reversen Trankriptase fur verschiedene Hemmsubstanzen. Bestimmung durch DNA Sequenzierung Nukleosidanaloga AZT
ddI
I
ddC
Nevirapine
TIBO
A98 + G Ll00 + I K103 + N V106 + A V108 + I Y181 + c YlXl + I Y188-c
K103 + N V106 + A Y181 + c
~~
M4l+ L D67 + N K70 + R TZIS + Y T215 -+ F K219 + Q
L74 + v V75 -+ T M184 + V
L74 -+ v v75 + T MIX4 + V
r
HIV-spezifische RT Inhibitoren:
KlOl + E K103 + N K103 -+ Q V108 + I V17Y + D V179 + E Y181 + c
El38 + K
12.4 Hepatitis B-Virus Als weitere Beispiele fur die Uner FiBlichkeit der DN Sequenzierung in der medizinischen Forschung und Diagnostik konnen die Hepatitis Viren aufgefuhrt werden. Im Falle des Hepatitis B Virus wurden eine Reihe von ,,Escape"- Mutanten im praCore/Core Bereich beschrieben. PraCore Mutationen wurden mit der Effizienz der Interferontherapie von anti-HBe-positiven, viramischen Patienten assoziiert (18). Bestimmte Kombinationen von Aminosaureaustauschen werden mit schwerem, progressivem Verlauf in Verbindung gebracht. Jedoch gibt es weltweit verschiedenste Berichte von Arbeitsgruppen, welche in den Virusisolaten ihrer Patientenkollektive unterschiedlichste Mutationen finden. Da die jeweiligen Patientengruppen nicht immer vergleichbar sind, ist es schwierig, aus den teilweise entgegengesetzten Ergebnissen allgemeingultige Schlusse auf die Assoziation von Mutationen mit bestimmten Krankheitsbildern zu schlieBen.
12 DNA-Sequenzierung in der medizinischen Mikrobiologie
21 1
Die Genotypen von HBV sind aufgrund von Sequenzunterschieden im auBeren Hullprotein (HBsAg) definiert. Vor dem Einzug der Molekularbiologie in die medizinische Mikrobiologie wurde aufgrund serologischer Reaktivitaten eine hauptantigene, gruppenspezifische Determinante a und zwei sich wechselseitig ausschliefiende Subtypdeterminanten d/y und w/r unterschieden. Heute geschieht dies vie1 detaillierter durch die Bestimmung der DNA Sequenzen. Im Bereich der a Determinante wurden auf Punktmutationen (Arginin 145) beruhende antiHBS ,,Escape"-Mutanten beschrieben: in einem Fall wurde das Baby einer HBeAg-positiven Mutter mehrmals vakziniert. Trotzdem wurde das Kind aufgrund des Aminosaureaustausches von Glyzin (145) nach Arginin (145) infiziert (2). In einem anderen Fall wurde einem Lebertransplantierten menschliche monoklonale Anti-HBS-Antikorper gegeben, um eine Infektion des Transplantates zu verhindern. Jedoch wurde auch hier festgestellt, daB eine Punktmutation zu einer Virus ,,escape" Mutante fuhrte (10).
12.5 Resistenzentwicklungen bei bakteriellen Erregern Bei der antibakteriellen Therapie spielt die Resistenzentwicklung gegen Antibiotika eine immer grol3ere Rolle. Die bakteriellen Genome verandern sich aufgrund des Selektionsdrucks durch Austausch von genetischem Material mittels Plasmiden und Transposons. Mitglieder der Streptokokken- und Staphylokokkenfamilien, welche Atemwegs- und Hautinfektionen verursachen und Vertreter der Enterobacteriaceae und Pseudomonas-Familien, welche Durchfall, Sepsis und Harnwegsinfektionen zur Folge haben, konnen gegen nahezu alle alteren Antibiotika Resistenz entwickeln. Drei Hauptmechanismen sind hierfur verantwortlich: die Inaktivierung des Antibiotikums durch Zerstorung oder Modifikation, Verhindern des Erreichens des Zielortes und Veranderung der Zielstruktur. So wurden die Inaktivierung der PLactamase und Aminoglykoside durch Enzyme und die Herabsetzung der Permeabilitat der Zellwand fur PLactam, Aminoglykoside oder Tetrazykline beschrieben. Einzelne Aminosaureaustausche in den Zielstrukturen wurden jeweils fur die Veranderung der Sensitiviat gegen P-Lactame, Makrolide oder Antagonisten der Folatsynthese verantwortlich gemacht. AuBerst interessante Mutationen wurden fur Mycobacteriurn tuberculosis, induziert durch Rifampicin beschrieben. Rifampicin ist eines der Haupttherapeutika zur Bekampfung der Tuberkulose. Die Entwicklung der sehr hohen Resistenz gegen dieses Antibiotikum erfolgt in einem Ein-Schritt-Muster. Isolate, welche zuvor nie dem Rifampicin ausgesetzt waren, entwickeln spontane Mutationen mit einer Rate von einer Mutation pro bis lo-' Bakterien. Die Mutationen der resistenten Stamme wurden auf einer 23 Aminosaure langen Region der RNA Polymerase lokalisiert. In dieser Sequenz sind acht konservierte Aminosauren ausgetauscht [19]. Hierdurch entstehen konformationelle Veranderun-
212
Albrecht von Brunn
gen in der RNA Polymerase. Die Rifampicinmolekule konnen nicht mehr an die verschiedenen Untereinheiten des Enzyms binden und haben so keine Wirkung mehr auf die Transkription bzw. Elongation der RNA [ 6 ] .Bisherige Resistenztestungen von Mycobacterium tuberculosis dauerten drei Wochen bis zwei Monate. Die Identifizierung dieser Mutationen fuhrte zu einer wesentlich schnelleren Bestimmung mittels eines Schnelltestes auf der Basis der PCR Technologie.
12.6 Ausblick Die DNA Sequenzierung tragt zur Aufklarung molekularer Grundlagen der Resistenzentwicklung und der genetischen Drift pathogener Organismen bei. Dies ist Basis fur die Entstehung neuer, schneller diagnostischer Methoden sowie fur die Entwicklung chemischer und rekombianter Therapeutika und Impfstoffe. Die Vorraussage von Krankheitsverlaufen und die Behandlungsmoglichkeiten mikrobieller Erreger wird immer mehr von der Kenntnis der entsprechenden Nukleinsauresequenz beeinfluSt. Die DNA Sequenzierung wird in Verbindung mit weiteren molekularbiologischen Methoden wie der PCR Technik in Zukunft immer starkeren Einzug auch in medizinische Labors halten. Die zunehmende Automatisierung der Nukleinsaurepraparation und der Sequenzanalyse wird diesen ProzeB stark beschleunigen.
12.7 Literatur [1] Arendrup, M. et al. (1992). J. Acquired Immune Def. Syndr. 5,303-307. [2] Carman, W.F. et al. (1990). Lancet 336,325-329. [3] Cavacini, L.A. et al. (1993). J. Acquir. Immune Defic. Syndr. 6, 1093-1 102. [4] Giirtler, L .(1994). J. Virol. 68,1581-1585. [5] Hwang, S.S. et al. (1991). Science 253,71-74. [6] Jin, D. and Gross, C. (1988). J. Mol. Biol. 202,45-58. [7] Larder, B.A. and Kemp, S.D. (1989). Science 246,1155-1158. [8] Larder, B.A. et al. (1993). Nature 365,451-453. [9] Levy, J. (1993). Microbiol. Rev. 57,183-289. [lo] MacMahon, G. et al. (1991). In: Hollinger, FB, Lemnon, SM, Margolis, HS (eds) Viral hepatitis and liver disease. Williams & Wilkins, Baltimore, 219-221. [ll]Mitsuya, H. and Broder, S. (1986). PNAS 83,1911-1915. [12] Moore, J.P. and Ho, D.D. (1993). J. Virol. 67,863-874. [13] Myers, G. et al. (1994). Human Retroviruses and AIDS. Theoretical Biology and Biophysics, Los Alamos, NM,USA. [14] Myers, G. and Korber, B. (1994). In Morse, S.S. (ed) Evolutionary biology of viruses. Raven Press New York. [15] Nara, P. et al. (1990). J. Virol. 64,3779-3791. [16] Richman, D.D. (1990). Curr. Opinion Infect. Des. 3,819-823.
12 DNA Sequenzierung in der medizinischen Mikrobiologie
213
[17] Takahashi,H. et al. (1989). Science 246,118-121. [18] Takeda, K. et al. (1990). Hepatology 12,1284-1289. [19] Telenti, A. et al. (1993). Lancet 341,647450. [20] von Brunn, A. et al. (1994). In: 24. Hamophilie-Symposion, eds. I. Scharrer and W. Schramm, Springer Verlag, 36-40. [21] von Brunn, A. et al. (1995). AIDS Res. Hum. Retrovir. 11,183-184.
This page intentionally left blank
13 Anwendung molekularbiologischer Methoden im Agrarbereich Jurgen Weber, Gunter Mertes
13.1 Einleitung Durch intensive Zuchtarbeit konnten in der Tier- und Pflanzenzuchtung in der Vergangenheit grolje Fortschritte erzielt werden. Dabei basiert die klassische Zuchtung auf der Auswertung quantitativer Merkmale, wie der taglichen Zunahme, der Milchmenge oder dem Rohproteingehalt von Kornern. Die Entwicklung moderner molekularbiologischer Methoden eroffnete auch im Agrarbereich neue Moglichkeiten. So entwickelte sich die Genkartierung zu einem neuen Schwerpunkt in der Zuchtforschung. Das Ziel ist hierbei, Gene bzw. Marker fur Gene zu finden, die zur Vererbung wirtschaftlich bedeutsamer Merkmale (Quantitative Trait Loci, QTL) [l]beitragen. Damit wird es moglich, gezielt Tiere oder Pflanzen zur Zucht einzusetzen, die die gewunschten Genvarianten aufweisen. Ebenso konnen Ubertrager rezessiv vererbter Erkrankungen fruhzeitig erkannt werden. Besonders die Entwicklung der Polymerasekettenreaktion (Polymerase Chain Reaktion, PCR) [2] ermoglichte eine Vielzahl neuer diagnostischer Ansatze in der DNA-Analytik. Dies sol1 im folgenden anhand einiger Beispiele demonstriert werden.
13.2 Malignes Hyperthermie-Syndrom beim Schwein (MHS) Die Selektion auf Tiere mit groBer Fleischfulle brachte als Nebeneffekt eine erhohte StreBempfindlichkeit vieler moderner Schweinerassen mit sich. Das Fleisch streBanfalliger Schlachttiere ist von schlechterer Qualitat als das streBresistenter Tiere (pale, soft, exudative, PSE-Fleisch). Die StreBanfalligkeit auBert sich in einer geringen Toleranz betroffener Tiere gegenuber der Einwirkung auBerer StreBfaktoren wie hohe Umgebungstemperaturen, Kampfe oder Transporte. Sie reagieren darauf mit schnellem Herzschlag, Muskelkrampfen und einer schnell ansteigenden Korpertemperatur (maligne Hyperthermie). Die StreBanfalligkeit wurde zunachst mit dem Halothantest ermittelt. Schweine, die beim Einatmen des Narkosemittels keine Muskelkrampfe zeigten, galten als strel3resistent. Der Halothantest ist allerdings nicht immer zuverlassig und erlaubt keine
216
Jiirgen Weher, Giinter Mertes
Unterscheidung zwischen heterozygot und homozygot gesunden Tieren. Dadurch wird der Aufbau von homozygot streBresistenten Zuchtlinien erschwert. Im Jahr 1991 gelang kanadischen Forschergruppen die Aufklarung der molekularen Grundlagen des MHS-Syndroms [3,4]. Sie konnten eine kausale Abhangigkeit der Halothanernpfindlichkeit vom Auftreten einer Mutation im RyanodinRezeptor-Gen nachweisen. Bei dessen Genprodukt, dem Ryanodin-RezeptorProtein, handelt es sich urn ein Ca2'-Ionenkanalmembranprotein. Die durch die Mutation (C + T Transition) hervorgerufene Anderung der Aminosauresequenz fuhrt zu einer Storung der Regulation des Ca2'-Ionenflusses. Bei streBempfindlichen Tieren ist die Schwelle der Ca2'-Freisetzung infolge von StreBeinwirkung stark erniedrigt. Bei unzureichender Energiegewinnung aus dem intrazellularen, anaeroben Glykogenabbau wird der energieabhangige Ca2'-RuckfluB aus dem Aktin-Myosin-Komplex des kontrahierten Muskels gehemmt. Dies erklart, weshalb die Auswirkung der Mutation vor allem in Muskelzellen sichtbar wird, die histologische Veranderungen aufweisen, obwohl die Mutation in allen Zellen vorhanden ist. Die grol3ere Fleischmenge streBempfindlicher Tiere wird hervorgerufen durch eine Muskelhypertrophie. Sie ist gekennzeichnet durch eine Vergrofierung der Muskelzelldurchrnesser und der Erhohung des Anteils weil3er I1 B-Muskelfasertypen. Deren intrazellulare Energiegewinnung ist aufgrund einer geringen Anzahl von Mitochondrien wesentlich ineffizienter als die der roten Muskelzellen. Die hohe Laktatbildung fuhrt zu einer Senkung des pH-Werts, welche eine Denaturierung von Membranproteinen bewirkt. Dies fuhrt zu der bereits beschriebenen schlechten Fleischqualitat. Mit Hilfe rnolekularbiologischer Methoden lafit sich der MHS-Genotyp eindeutig bestimmen. Grundlage des Tests ist die genomische DNA des zu untersuchenden Tieres. Somit wird das Testergebnis nicht von unterschiedlichen Merkmalsauspragungen beeinflufit, und es konnen die heterozygoten, klinisch gesunden Anlagetrager sicher diagnostiziert werden. Grundlage des molekularbiologischen MHS-Tests ist die Polymerasekettenreaktion (PCR), die es ermoglicht, einen allelspezifischen Restriktionsfragmentlangenpolymorphismu (RFLP) zu erkennen. Dazu wird ein 138-Basenpaare groBes Segment der DNA amplifiziert, welches den Mutationsort iiberspannt. AnschlieBend wird das PCR-Produkt mit dern Restriktionsenzyrn Cfo I inkubiert. Liegt keine Mutation vor (strefiresistent, Genotyp NN), wird das PCR-Produkt in zwei 84 und 54 Basenpaare grofie Fragmente geschnitten. 1st das zu untersuchende Tier heterozygot (strefiresistent, Genotyp NP), wird nur der Teil des PCR-Produktes geschnitten, der von dem nicht von der Mutation betroffenen Chromosom stammt, wahrend die andere Halfte die veranderte Basensequenz des mutierten Allels tragt und daher nicht geschnitten wird. Bei homozygotem Auftreten der Mutation (streBanfallig, Genotyp PP) wird das PCR-Produkt nicht geschnitten, da die Nukleotidsequenz beider homologer Chromosomen verandert ist und daher von dem Restriktionsenzym nicht erkannt wird.
13 Anwendung molekularbiologischer Methoden im Agrarbereich
211
13.3 Bovine Leukozyten-Adhasions-Defizienz (BLAD) Auch beim Rind sind inzwischen die molekularen Grundlagen einiger erblicher Erkrankungen geklart worden, so dafi eine molekularbiologische Diagnostik moglich ist. Als Beispiel sei hier die bovine Leukozyten-Adhasions-Defizienz (BLAD) genannt. Es handelt sich hierbei um eine autosomal-rezessiv vererbte Erkrankung, die bei schwarz-bunten Rindern auftritt. Sie tritt innerhalb der ersten Lebensmonate klinisch in Erscheinung und verlauft todlich. BLAD-Merkmalstrager zeigen gegenuber gesunden Tieren einen deutlichen Entwicklungsruckstand. Es treten Maulhohlenveranderungen sowie pathologische Veranderungen des Atmungsapparates auf. Aurjerdem sind betroffene Tiere infektionsanfallig und zeigen in der Regel eine Leukozytose. Der der BLAD-Erkrankung zugrundeliegende Defekt wurde 1992 entdeckt [5]. Es handelt sich um eine Punktmutation im CD 18-Gen, das eine Vorstufe von Zelloberflachenproteinen kodiert, die normalenveise auch auf der Oberflache der Leukozyten zu finden und fur die Zelladhasion wichtig sind. 1st deren Aminosauresequenz aufgrund der Mutation verandert, verlieren die Leukozyten ihre Fahigkeit, die Blutbahn zu verlassen und in mit Erregern infizierte Gewebe einzudringen. Die Bekampfung der Infektion unterbleibt und bewirkt, darj im Knochenmark noch mehr Leukozyten gebildet werden. Letztlich fuhrt die reduzierte Immunabwehr zum Tod des betroffenen Rinds innerhalb seiner ersten Lebensjahre. Eine derartige Erkrankung hat naturlich wirtschaftliche Aspekte fur die Rinderzuchtbetriebe. Insbesondere ist die Erkennung der klinisch gesunden Anlagetrager von Bedeutung, um nur diese Tiere fur die Zucht heranzuziehen. Dies kann durch einen molekularbiologischen Test zweifelsfrei geschehen. Ahnlich wie beim MHS-Test wird auch beim BLAD-Test ein Restriktionsfragmentlangenpolymorphismus zur Identifizierung der Mutation venvendet. Mit der PCR wird ein DNA-Fragment amplifiziert und anschliefiend mit einem Restriktionsenzym behandelt. Die Fragmente werden mit einer Gelelektrophorese getrennt, je nach der Grofie der Restriktionsfragmente kann die Mutation identifiziert werden. Eine entsprechende Diagnosemoglichkeit besteht auch fur eine weitere autosomal-rezessiv vererbte Krankheit, die Uridinmonophosphat-Synthase-Defizienz (DUMPS) [6]. Fur eine weitere genetische Erkrankung, die vor allem beim Braunvieh auftritt, die progressiv degenerative Myeloencephalopathie (Weaver Disease), gibt es eine Diagnosemoglichkeit mittels eines eng gekoppelten DNAMarkers [7]. Bei Pferden kann die hyperkaliamische periodische Paralyse (HYPP), eine autosomal dominant vererbte Krankheit, die vor allem bei Quarter Horses auftritt, durch einen Gentest direkt bestimmt werden [8]. Aus wirtschaftlicher Sicht ebenso bedeutsam wie die Vermeidung des Ausbruchs genetisch bedingter Erkrankungen durch gezielte Auswahl der Zuchttiere ist das Anstreben von Genotypen, die mit gunstigen Eigenschaften einhergehen. Als Beispiel konnen hier die Milchproteine angefuhrt werden. Sie bestehen im wesentlichen aus zwei Gruppen, den Caseinen und den Molkeproteinen. Die
218
Jiirgen Weher, Giinter Mertes
Caseine machen etwa 78% der Milchproteine aus. Es ist eine heterogene Gruppe aus Phosphorproteinen, die als Grundstoff fur die Kaseherstellung dienen. Die Molkeproteine bestehen im wesentlichen aus a-Laktalbumin und P-Lactoglobulin sowie Immunglobulinen und Serumalbumin. Jedes der Milchproteine kann in verschiedenen Varianten vorkommen, wobei jede Variante auf einen DNASequenzpolymorphismus zuruckzufuhren ist. D a jede Anderung der Sequenz letztlich zu einer Veranderung der physikalisch-chemischen Eigenschaften der Molekule fuhrt, besteht ein direkter EinfluB auf die Verarbeitungseigenschaften der Milch.
13.4 Molekularbiologische Bestimmung der Milchproteinvarianten Die Bestimmung der K- und p-Casein- sowie der PLaktoglobulinvarianten gestaltet sich auch rnit molekularbiologischen Methoden aufwendig, da eine Vielzahl verschiedener Methoden verwendet werden mul3. Wahrend die K-Caseinvarianten mit Hilfe von PCR und RFLP-Analyse bestimmt werden konnen, ist dies bei den p-Casein nicht moglich, da keine geeignete Restriktionsschnittstelle vorhanden ist. Diese mul3 wahrend der PCR-Amplifikation erst eingefuhrt werden (amplification-created restriction site, ACRS), oder die Bestimmung der Varianten geschieht mit allelspezifischen Primern (COP, competitive oligonucleotide priming [9]; LLA, long linker arm). Eine weitere Moglichkeit zur Unterscheidung besteht in der Verwendung von allelspezifischen Primern unterschiedlicher Lange (allele discrimination by primer length, ADPL [lo]). Diese Methode in Verbindung mit fluoreszenzmarkierten Primern und einer automatischen Fragmentdetektion eignet sich zur simultanen Bestimmung der K-Casein-, p-Caseinund P-Laktoglobulinvarianten [ll].Insgesamt 7 Punktmutationen konnen gleichzeitig untersucht werden. Fur jede Punktmutation werden zwei allelspezifische Primer eingesetzt, die am 3’-Ende jeweils rnit der variablen Base enden. Zusatzlich unterscheiden sich die beiden Primer in der Lange um vier Basen. Der beiden allelspezifischen Primern gemeinsame dritte Primer ist fluoreszenzmarkiert. Somit unterscheiden sich die allelspezifischen PCR-Produkte um vier Basen und konnen auf einem automatischen DNA-Sequenzierer detektiert werden. Um alle 7 Mutationen gleichzeitig analysieren zu konnen, werden die Primer so gewahlt, dal3 sich die in den Multiplex-PCR-Reaktionen gebildeten Fragmente nicht uberlappen. Denkbar ist aber auch, die Primer rnit unterschiedlichen Fluoreszenzfarbstoffen zu markieren. Auf diese Weise entsteht ein Verfahren, dal3 ein schnelles Screening der Milchproteinvarianten erlaubt. Alle bisher genannten Moglichkeiten, defekte Allele zu eliminieren und gunstige Genotypvarianten zu begunstigen machen innerhalb der Tierzucht nur dann Sinn, wenn die Abstammung der zur Zucht eingesetzten Tiere eindeutig nachgewiesen werden kann. Diese Identitats- und Abstammungskontrollen werden zur
13 Anwendung molekularbiologischer Methoden im Agrarbereich
219
Zeit uberwiegend mit Hilfe der Blutgruppenserologie durchgefuhrt. Allerdings kann dieses System nur Ausschlusse von einer zu klarenden Vaterschaft erbringen, die Identifizierung eines Individuums ist dagegen nicht moglich. Mit zunehmender Inzuchtrate sinkt aul3erdem die Anzahl der losbaren Falle. Um diesen Problemen entgegenzuwirken, werden molekularbiologische Verfahren zur Abstammungssicherung eingesetzt.
13.5 DNA-Fingerprinting Ein DNA-Fingerprint besteht aus einem hochvariablen, individualspezifischen Bandenmuster. Die Banden werden kodominant vererbt. Bei korrekter Vaterschaft setzt sich das Bandenmuster des Nachkommen aus den Banden der Eltern zusammen. Dargestellt werden die Banden mit Hilfe von DNA-Sonden oder Oligonukleotiden, die gegen eine mit einem Restriktionsenzym geschnittene genomische DNA hybridisiert werden. Als Sonden konnen z. B. menschliche Minisatelliten-Sequenzen venvendet werden, die in vielen Spezies informative Fingerprints erzeugen [12]. Vorteilhaft ist die Unabhangigkeit des Verfahrens vom Vorhandensein von Blutproben. Gewebe oder Spermaproben kommen ebenso als Quelle fur die Isolierung genomischer DNA in Betracht. In der Praxis erweist sich das DNA-Fingerprinting mit Hilfe der Sondenhybridisierung in vielen Fallen als zu aufwendig. Dies liegt zum einen an der aufwendigen Herstellung der Fingerprints, die neben der Isolierung hochmolekularer DNA einen Restriktionsverdau, eine Gelelektrophorese, einen Southern Blot und eine Hybridisierung erfordern, und zum andern an der Auswertung der komplexen Bandenmuster. Je hoher der Venvandtschaftsgrad der zu untersuchenden Tiere ist, desto hoher ist die Anzahl der Banden, die beiden Eltern gemeinsam sind (Band-sharing) und desto schwieriger wird es, eine ausreichende Anzahl informativer Banden zu ermitteln. Aus den genannten Grunden setzt sich fur die Abstammungssicherung die DNA-Mikrosatelliten-Analyse immer starker durch.
13.6 DNA-Mikrosatelliten-Analyse DNA-Mikrosatelliten sind in den Genomen der meisten Spezies weit verbreitet. Sie bestehen aus kurzen Sequenzwiederholungen (z. B. CA-Repeats), wobei die Anzahl der Wiederholungseinheiten fur ein Individuum konstant ist, zwischen verschiedenen Individuen aber variiert. Die Loci konnen mit Hilfe der PCR amplifiziert werden, wobei die Allele eines Markers durch die Anzahl der Repeat-Einheiten definiert werden. Die DNA-Mikrosatelliten-Analyse besitzt gegenuber allen anderen Verfahren zur Abstammungssicherung entscheidende Vorteile. Wie beim Fingerprinting,
220
Jiirgen Weber, Giinter Mertes
-3940
-3560
-
-2800
-
-2420
-
Abb. 1. DNA-Mikrosatelliten-Analyse mit fluoreszenzmarkiertenPrimern. a) Gelbild: rechts: 13 Multiplexanalysen mit 11 Markersystemen pro DNA (4 blaue, 4 grune, 3 gelbe Markersysteme, Stockmarks KitTM, Perkin Elmer). Mitte: Scan-Anzahl bei der Aufzeichnung des Analysegels. links: Elektropherogramm aus Bahn 12. Die Intensitat der Banden wird entlang der weiBen Linie gemessen und im linken Bildteil dargestellt.
221
13 Anwendung molekularbiologischer Methoden im Agrarbereich I
I
I
I
I
~
I
I
I
I
~
I
I~ I 1 I 1
1
1
~
1
1
1
1
~
I1 I 1 I 1I
I I I I I I I
I ' l l I l l
10 120 130 140 150 160 170 180 190 200 I, win- 19 ...lts all 1 Blue Bulle
win- 19 ...lts all 2 Blue
Kuh
win- 19 ...lts all 3 Blue
Kal b
I,
I l l
1 ' '
210
b) Elektropherogramme: Eine Rinderfamilie (Bulle, Kuh, Kalb) wurden mit insgesamt 11 Markern (Loci) untersucht. Davon sind 2 Loci,TGLA73 und MGTG4B, hier dargestellt. Das horizontale Lineal gibt die GroBe in Basen an. Die Allelpeaks sind mit farbigen Kastchen gekennzeichnet, die die GroBe der Peaks in Basen angeben. Die Kurvenmaxima stellen die unterschiedlichen Allele der einzelnen Marker dar. Deren Position wird durch die Anzahl von Wiederholungseinheiten bestimmt. Obere Kurve: Allelverteilung des Bullen, mittlere Kurve: Allelverteilung der Kuh, untere Kurve: Allelverteilung des Kalbs. Die Allelverteilung des Nachkommen ist eine Kombination der elterlichen Allele. Umrandung Locus schwarz TGLA73 rot MGTG4B
222
Jiirgrri Wrhrr, Giintrr Mrrrrs
kommen auch fur die Mikrosatelliten-Analyse im Prinzip alle kernhaltigen Zellen als Quelle fur die DNA-Isolierung in Frage, wobei die benotigte DNA-Menge methodisch bedingt wesentlich geringer ist als beim Fingerprinting, das auf Hybridisierung beruht (ca. Faktor 100). Es stehen eine groBe Anzahl bekannter Loci zur Verfugung, die einen hohen Polymorphiegrad aufweisen. Die kombinierte Anwendung einiger dieser Marker in Form von Multiplexreaktionen macht eine Ausschlul3wahrscheinlichkeit von mehr als 99,999% moglich. Werden fluoreszenzmarkierte Primer zur Amplifikation der Mikrosatelliten verwendet, konnen die Fragmente automatisch analysiert werden (Abb. 1). Die gemessenen FragmentgroBen stellen absolute Werte (Anzahl Basen pro Fragment) dar. Sie werden mit einem in jeder Bahn mitlaufenden internen Langenstandard ermittelt. Dadurch wird die Auswertung objektiviert, das Verfahren laBt sich gut standardisieren, und die gewonnenen Daten konnen direkt in Datenbanken abgelegt werden. Die Anwendungsmoglichkeiten des DNA-Fingerprintings und der DNAMikrosatelliten-Analyse beschranken sich nicht nur auf die Abstammungssicherung von Zuchttieren. In zunehmendem MaBe werden diese Methoden auch dazu verwendet, die Einhaltung von [13]. Artenschutz- und Jagdbestimmungen zu uberwachen und Falle von Wilderei nachzuweisen. So kann das Bandenmuster aus DNA, die aus sichergestellten Blutspuren und Geweberesten isoliert wurde, mit Bandenmustern von DNA verglichen werden, die z. B. aus Kadavern gewilderter Tiere stammt. Gerade bei der Bearbeitung von Spurenmaterial bietet die Mikrosatelliten-Analyse Vorteile, da sie nur geringe DNA-Mengen erfordert und nicht auf hochmolekulare DNA angewiesen ist.
13.7 Zusammenfassung Die Entwicklung molekularbiologischer Diagnoseverfahren eroffnet neue Moglichkeiten in der Zuchtung. Von besonderer Bedeutung ist die eindeutige Identifizierung klinisch gesunder Anlagetrager rezessiver Erkrankungen, da die Paarung zweier Anlagetrager vermieden und damit das Auftreten des homozygotrezessiven Genotyps verhindert werden kann, ohne dalj die Anlagetrager ganzlich von der Zucht ausgeschlossen werden mussen. Andererseits besteht die Moglichkeit, durch gezielte Paarungen solche Genotypvarianten zu bevorzugen, die sich z. B. im Hinblick auf Leistungsmerkmale als gunstig erwiesen haben. Als ein weiterer Punkt ist die Verbesserung der Abstammungssicherung durch die DNATypisierung zu nennen, die mit neuen multifluorophoren molekulargenetischen Methoden (in Verbindung mit der PCR) eine sehr sichere Methode darstellt, um schnell groBe Individuenzahlen eindeutig zu charakterisieren, denn nur eine korrekte Abstammungsbestimmung kann als Grundlage fur Zuchtprogramme dienen.
13 Anwendung molekularbiologischer Methoden im Agrarbereich
223
13.8 Literatur [l] Ron, M., Band, M., Yanai,A., Weller,J.I., Mapping quantitative trait loci with DNA microsatellites in a commercial dairy cattle population, Animal Genetics 25 (1994), 259-264. [2] Saiki,R.K., Gelfand,D.H., Stoffel$., Higuchi, R., Horn,G.T., Mullis, K.B., Erlich, H.A., Primer-directed enzymatic amplification of DNA with a thermostable DNA polymerase, Science 239 (1988), 487-491. [3] Fuji, J., Otsu, K., Zorzato,F., Deleon, S., Khanna, V.K., Weiler,J.E., O'Brien, P.J., McLennan, D.H., Identification of a mutation in porcine Ryanodine receptor associated with malignant hyperthermia, Science 253 (1991), 448451. [4] Otsu,K., Khanna, V.K., Archibald, L., MacLennan D.H., Cosegregation of porcine malignant hyperthermia and a probable causal mutation in the skeletal muscle ryanodine receptor gene in backcross families, Genomics, 11 (1991), 744. [S] Shuster, D.E., Kehrli, M.E., Ackermann, M.R., Gilbert, R.O., Identification and prevalence of a genetic defekt that causes leucocyte adhesion deficiency in Holstein cattle, Proc. Natl. Acad. Sci. USA, 89 (1992), 9225-9229. [6] Schwenger,B., Tammen, I., Aurich,C, Detection of the homozygous recessive genotype for deficiency of uridine monophosphate synthase by DNA typing among bovine embryos produced in vitro, Journal of Reproduction and Fertility, 100 (1994), 511-514. [7] Georges, M., Dietz, A.B., Mishra, A., Nielsen, D., Sargeant,L.S., Sorensen, A., Steele, M.R., Zhao, X., Leipold, H., Womack, J.E., Lathrop, M., Microsatellite mapping of the gene causing weaver disease in cattle will allow the study of an associated quantitative trait locus, Proc. Natl. Acad. Sci. USA, 90 (1993), 1058-1062. [8] Spier, S.J., Blood test available for hyperkalemic periodic paralysis in Quarter Horses, J. Equine Vet. Scie, 13 (1993), 140-142. [9] Gibbs, R.A., Nguyen, P., Caskey C.T. Detection of single DNA base differences by competitive oligonucleotide priming, Nucleic Acids Res. 17 (1989), 2437-2448. [lo] Li, H., Cui, X., Arnheim, N., Direct electrophoretic detection of the allelic state of single DNA molecules in human sperm by using the polymerase chain reaction, Proc. Natl. Acad. Sci. USA, 87 (1990), 4580-4584. [ l l ] Lindersson, M., Lunden, A,, Anderson, L., Genotyping bovine milk proteins using allele discrimination by primer length and automated DNA sizing technology, Animal Genetics, 26 (1995), 67-72. [12] Signer, E.N., Jeffreys, A.J., Application of human minisatellite probes to the development of informative DNA fingerprints and the isolation of locus-specific markers in amnimals, DNA Fingerprinting: State of the Science (1993), Birkhauser Verlag, Basel, Switzerland [13] Guglich, E.A., Wilson P.J., White B.N., Forensi Application of repetetive DNA Markers to the Species Identification of Animal Tissues, Journal of Forensic Sciences, 39 (1994), No.2, 353-361
This page intentionally left blank
Allel: Eine von zwei verschiedenen Varianten eines Gens, die eine alternative Realisation desselben Charakters oder Phanotyps erlauben. Annealing: Anlagerung zweier DNA-Fragmente aneinander unter bestimmten Bedingungen. Catalyst: Molekularbiologische Arbeitsstation. CentiMorgan (cM): MaBeinheit, die die Entfernung von zwei Punkten auf einem Chromosom angibt. Wie haufig werden zwei Gene durch das Crossing-over wahrend der Meiose getrennt (1 cM entspricht 1% Rekombination). Thomas Hunt Morgan hat als erster das Crossing-over-Phanomenbeschrieben. Chemilumineszenz: Energie, welche bei einer chemischen Reaktion entsteht und zur Aussendung von Licht fuhrt. Chromosom: Fadenahnliches, aus Chromatin aufgebautes Partikel, das das gesamte oder auch nur Teile des genetischen Materials eines Organismus enthalt. Beim Menschen sind es 23 Chromosomen, die eine haploide Zelle und 46 Chromosomen, die eine diploide Zelle ausmachen. Cosmid Ein Plasmid, das die sog. ,,cod'-Stelle aus dem Lambda-Phagen tragt sehr groBes, doppelstrangiges DNA-Molekul(40-50 kb).
-
Crossing-over: ProzeB des Austauschs von genetischem Material zwischen zwei Chromosomen. Deletion: Verlust eines DNA-Abschnitts. Diploide Zelle: Zelle mit einem doppelten Chromosomensatz, wie sie ihn sog. somatische Zellen aufweisen. Elektrophorese: Ein LaborprozeB, der Molekule aufgrund ihrer elektrischen Ladung trennt. Elongation: Kettenverlangerung. Anhangen von Nukleotiden durch eine Polymerase an einen DNA-Einzelstrang. Endonuklease: Enzym, welches DNA mittig schneidet. Esterbindung: Bindung, die zwischen einer alkoholischen Hydroxylgruppe und einer Sauregruppe ausgebildet wird (z. B. die Bindung zwischen Zucker und Phosphatgruppe in den Oligonukleotiden bzw. der Desoxyribonukleinsaure DNA). Exon: Bereich eines eukaryotischen Gens, der in der mRNA reprasentiert ist und die Information fur das Genprodukt (Protein) enthalt. Verschiedene Exons sind durch sog. Introns unterbrochen. Erst auf der Stufe der mRNA-Bildung werden die verschiedenen Exons durch den SpleiBvorgang miteinander verschmolzen.
226
Glossur
Exonuklease: Enzym, welches DNA-Fragmente von den Enden her abbaut. Gen: Abschnitt auf einem Chromosom, der fiir die Bildung eines Proteins benotigt wird. Neben den kodierenden Bereichen enthalt er noch eine Reihe anderer Regionen, wie z. B. Promotoren, Introns und Terminatoren. Genbank: Sammlung klonierter DNA-Fragmente, die ein gesamtes Genom reprasentieren. Genbanken werden ublicherweise in Phagen-Vektoren oder Cosmiden angelegt. Genom: Das gesamte genetische Material, die Erbsubstanz eines Organismus. Genotyp: Die fur einen Organismus charakteristische Ausstattung mit Genen und genetischen Elementen. Genotypisierung: Der ProzeB zur Identifizierung von Allelen, die bestimmte Merkmalstrager darstellen. Haploide Zelle: Zelle mit dem halben Chromosomensatz, wie sie ihn die Geschlechtszellen aufweisen.
Haupthistokompatibilitats-Komplex (MHC): Ein Komplex von Genen, der die Gewebevertraglichkeit zwischen Spender und Empfanger bestimmt. Sie setzen die Oberflachenantigenstruktur der Korperzellen fest. Heterozygote: Ein Individuum mit einem Paar verschiedener Allele eines bestimmten Gens. Verschiedene Allele konnen durch Mutation in einem der beiden Allele entstehen. Homozygote: Ein Individuum mit einem Paar identischer Allele eines Gens. Hot-Start-PCR: Methode zur Steigerung der Spezifitat sowie der Effizienz einer PCR. Hierzu wird eine fur den Beginn der Reaktion essentielle Reaktionskomponente erst bei einer hohen Temperatur von 75 "C dem Ansatz zugegeben, so da13 bereits der erste Zyklus der Reaktion mit sehr hoher Spezifitat startet. Insert: Fremdes DNA-Fragment, welches in ein Plasmid eingebaut ist. Insertion: Einschub eines DNA-Abschnitts. Intron: Abschnitt auf einem eukaryotischen Gen, der einen kodierenden Bereich (Exon) unterbricht. Klenow-Fragment: 75 kDa-Fragment aus einer Proteolyse der DNA-Polymerase I von E. coli. Linkage Map: Die Karte beschreibt den Abstand zwischen verschiedenen Genen. Sie gibt jedoch nicht den genauen Ort der Gene auf den verschiedenen Chromosomen an. Locus (Loci): Der Ort eine speziellen DNA Segments auf dem Chromosom.
M13: Bakteriophage.
Glossar
227
Marker: Ein Abschnitt auf der DNA, der in mehr als einer Form innerhalb einer Population auftritt. Die Variationen konnen im Labor bestimmt werden und werden zur Identifizierung von Vererbungsmuster herangezogen. Spezifische. bekannte DNA-Sequenz, welche zur Erkennung bestimmter Bereiche auf einem DNA-Strang verwendet wird. Meiose: Bezeichnung fur den Kernteilungsmodus bei den Reifeteilungen der Keimzellen. In der Prophase paaren sich die homologen vaterlichen und mutterlichen Chromosomen. Die Meta- und Anaphase ist charakterisiert durch die Trennung der homologen Partner. In den 2 rasch aufeinanderfolgenden Reifeteilungen wird die Chromosomenzahl auf die Halfte reduziert. Mikrosatelliten: Ein Abschnitt auf der DNA, der sich wiederholende Nukleotidmuster (Repeats) besitzt. Die Lange dieser Wiederholungen ist polymorph. Mikrosatelliten werden als Marker benutzt. Mutation: Veranderung an einem Gen, die in einem Basenaustausch, aber auch im Verlust oder der Addition von Basensequenzen bestehen kann. Bleibende Veranderung des genetischen Materials. Nested-PCR Reamplifikation eines Aliquots aus einer vorangegangenen PCR unter Verwendung eines nach innen in das Produkt hineinversetzten zweiten Primer-Paares zur Erhohung der Sensitivitat einer PCR. Nukleinsauren: Polymere Molekulketten, aufgebaut aus Nukleotiden. Nukleotide (nt): Sie bestehen aus Purin oder Pyrimidin, Ribose und Phosphorsaure. Vier ahnliche Molekule (Basen A, C, G, T) ergeben miteinander verbunden die DNA. Oligonukleotid Kurzer DNA-Einzelstrang (4 bis 150 Nukleotide). Oncogene: Klasse von Genen, deren Gegenwart und Expression Zellen einen Tumorphanotyp verleiht. Sie kommen in normalen Zellen als c-onc-Gene, in Retroviren als v-onc-Gene vor. P C R Polymerasekettenreaktion. Phage: Bakterienvirus; es gibt einzelstrangige DNA-Phagen, z. B. M13 und doppelstrangige DNA-Phagen, wie z. B. Lambda. Phagemid: Bakterielle Virus-DNA die als Klonierungsvektor dient. Phanotyp: Die nach aul3en hin in Erscheinung tretende genetische Ausstattung eines Organismus. Phosphodiesterbriicke: Verbindung zwischen zwei Nukleotiden in einer Nukleinsaure. Die beiden Zuckermolekiile sind uber ein Phosphatmolekul miteinander verbunden. Phosphodiester-, Phosphotriester-, Phosphoramidit-Verfahren : Methoden zur chemischen Synthese von Oligonukleotiden.
228
Glossar
Plasmid Ringformiges DNA-Molekul; es besitzt genetische Elemente, die zur autonomen Vermehrung in einer Bakterien- oder Hefezelle befahigen. Ein doppelstrangiges DNA-Molekul von verhaltnismal3ig geringer Grol3e (2,5-7 kb). Plateau-Effekt: Abnahme in der exponentiellen Amplifikation der Zielsequenz in den spaten PCR-Zyklen bis hin zu einem Produkt-Plateau und zunehmende preferentielle Vervielfaltigung unspezifischer Nebenprodukte.
Polyacrylamidgelelektrophorese: Verfahren, bei dem Nukleinsauren aufgrund ihrer elektrischen Ladung sowie ihrer GroSe getrennt werden. Polymerase Chain Reaction (PCR): Eine biochemische Technik, die es erlaubt von einem genetischen Abschnitt Millionen von Kopien zu erzeugen. Es ist somit sehr einfach zu erkennen, welches Allel von einem Mikrosatelliten Marker in einer Blut- oder Gewebsprobe prasent ist. Polymerase: Enzym, welches durch Aneinanderhangen von einzelnen Desoxynukleotiden DNA-Einzelstrange synthetisiert. Polymorphismus: Die Eigenschaft der Gene, in verschiedenen Formen aufzutreten. Primer: Oligonukleotid, das mit einer Matrize einen Doppelstrang ausbildet. Der Primer wird dann (wahrend der PCR oder der DNA Sequenzierung) verlangert, bis der Doppelstrang vollstandig ist. Primerwalking: Methode in der Sequenzierung, um unbekannte DNA-Bereiche zu analysieren. Man leitet einen Sequenzierprimer aus einem bekannten DNAAbschnitt ab und sequenziert mit Hilfe dieses Primers in den unbekannten Bereich hinein. Aus der daraus resultierenden Sequenz lal3t sich erneut ein Sequenzierprimer ableiten. PSS (,,Porcine Stress Syndrome"): Schweinekrankheit, die durch Stressituationen ausgelost wird und zu verminderter Fleischqualitat fuhrt. Random Amplified Polymorphic DNA (RAPD): Technik zum Nachweis genetischer Polymorphismen, deren Basensequenz unbekannt ist. Referenzfamilien: Gruppen von verwandten, aber genetisch verschiedenen Individuen (normalerweise 3 Generationen), die von Genomforschern benutzt werden, um ein Linkage-Map (cM) zu entwickeln. Rekombinante DNA: Ein DNA-Molekul, das aus Anteilen verschiedener DNAMolekiile besteht, die in v i m miteinander verknupft sind. Rekombination: Eine durch Crossing-over wahrend der Meiose neu entstehende Kombination von Genen. Replikationsursprung: Ort auf dem DNA-Strang, an welchem die DNA-Verdopplung beginnt.
Glossar
229
Restriktionsenzyme: Enzyme, die die DNA an bestimmten Stellen schneiden. Da sie nur bei bestimmten Nukleotidfolgen arbeiten, konnen sie zur Identifizierung von polymorphen DNA Segmenten herangezogen werden. Reverse Ranskription: Synthese einer DNA ausgehend von einer RNA-Matrize mit Hilfe einer Reversen Transkriptase. RFLP (,,Restriction kagment Length Polymorphismus"): Polymorphe DNA Fragmente, die bei der Behandlung mit einem Restriktionsenzym unterschiedlich geschnitten werden. RFLPs werden als Marker benutzt. Schutzgruppen: Molekule, die bei der chemischen Synthese von Oligonukleotiden zum Schutz der reaktiven Gruppen von Basen und Zuckern venvendet werden. Sie verhindern, dal3 diese Gruppen ungewollt Reaktionen eingehen. Segregation: Die Trennung von allelen Paaren eines Genorts bei der Meiose und Verteilung auf verschiedene Gameten. Semi-nested-PCR s. Nested-PCR, jedoch wird nur ein neuer interner Primer zugegeben, wahrend der zweite Primer aus der ersten PCR stammt. Solid-Phase: Festphasen-DNA, die mit Hilfe der ,,Magnetic Beads" generiert wird. Sonde: Markiertes Oligonukleotid definierter Sequenz zur Suche nach einem Gen. TaqManTM-PCRUrsprunglich 5'-Nuklease-Assay; ein homogenes PCR-Assay, das unter Verwendung fluoreszenzmarkierter DNA-Sonden simultan den Nachweis der PCR-Produkte ermoglicht. Template: DNA, die fur weitere Applikationen eingesetzt wird (DNA-Sequenzierung). Thermocyeler: Gerat zur Automatisierung der sich periodisch wiederholenden Heiz- und Kuhlvorgange wahrend einer PCR. Touchdown-PCR Methode zur schnellen Optimierung einer PCR, ohne empirisch die optimale Primer-Anlagerungstemperatur bestimmen zu miissen. Hierzu wird die PCR bei einer sehr hohen Annealing-Temperatur gestartet und mit jedem Zyklus um einen definierten Temperaturschritt gesenkt, bis sie im unspezifischen Bereich liegt. Bei der abschliel3enden Vervielfaltigung bei dieser Temperatur wird das spezifische Produkt bereits exponentiell vervielfaltigt, wahrend unspezifische Nebenprodukte vernachlassigbar bleiben. Trager: hier: festes polymeres Material, das bei der Oligonukleotidsynthese verwendet wird. An den Trager wird der erste Baustein gebunden, ansonsten ist das Tragermaterial inert. Ransformation: Ubertragung gereinigter, auch rekombinanter DNA, auf Bakterien- oder auch hohere Zellen.
230
Glossar
Vektor: Empfanger-DNA-Molekul fur fremde DNA; meist ein Plasmid oder Phagen-DNA-Molekul. Tragt einen Ursprung der DNA-Replikation sowie genetische Marker, um seine Anwesenheit in den Wirtszellen erkennbar zu machen.
Zyklus: Teil der chemischen Oligonukleotidsynthese, die aus einer Abfolge von sich zyklisch wiederholenden Reaktionsschritten besteht.
Sachverzeichnis Absorption 136f, 139 ACRS 218 ADPL 218 Agrarwissenschaften 88,117 ff, 145, 215 ff Allel 87,101 f, 110,115 ff, 120,167, 170ff, l79,191,197,216,22Of, 225f Allel discrimination by primer length 218 AmpFLP 114,195,200 Amplification-created restriction site 219 Amplifikat 9,22 ff, 28 ff, 38 ff, 58, 92, 99,112,195 ff, 218 ff Amplifikation 22 ff, 28 ff, 99,101 ff, 108, 112 ff, 168, 180, 185, 195ff, 218 ff Annealing 19,23,25,28ff, 58,67 ff, 78, 225,229 Aufreinigung 7,lO ff, 17,28f, 32,45, 55,59 ff, 92 Automatisierung 1 ff, 22 ff, 50 ff, 58, 112,149ff, 152ff, 165,170ff Autoradiogramm 54,84 f, 112,128 f, 131 AZT 209 Bakterien 8,17, 118,127,211,228 Biotin 12,59,72,75 BLAD 217f Bovine Leukozyten-AdhasionsDefizienz 217 Capping 49 f, 53,58 CCD-Kamera 43,141 ff cDNA 35,60,99 ff Chemical Cleavage 106f Chemilumineszenz 73,75,128 f, 225 Chromatogramm 56,84 f, 94,98,100, 112f, 115f, 122,151ff, 159,207 f Chromosom 87,99,102,109 ff, 118, 127,165 ff, 173ff, 225 f
competitive oligonucleotide priming (COP) 219 Cosmid 7,71,127,129,225 f CycleSequenzierung 36,68 f, 72,77,80 Cystische Fibrose 101,104 f Datenanalyse 4 f, 83,97 f, 150,152, 154ff, 160ff Datenarchivierung 159 Datenbank 2,4,78,49, 155, 157ff, 168, 222 Dateneditierung 84,98,150,153 ff, 161 Datenerfassung 131 Datenverarbeitung 84,98,150,153 ff, 161 Deletion 102f, 183ff, 196,204,225 Denaturierung 9,19 ff, 27,29 f, 68 f, 71, 90,187 Detektion 3,43,73 f, 80,83 f, 88, looff, 107 f, 127 ff, 133ff Diagnostik 19,42,45,76,101,159,164, 177,210,222 Dioden 131f, 146 DNA-Analyse 45 ff, 113,127 f, 138ff, 147,165,200f DNA-Analyse-Station 142 DNA-Fingerprinting 2 19 DNA-Fragmentanalyse 1f, 4,6,39 ff, 62,87 ff, 127ff, 142, 147, 149, 160ff DNA-Praparation 7 ff DNA-Quantifizierung 1,87ff, 97 DNA-Sequenzierung 1 , 4 , 8f, 14,17, 39f, 62,65ff, 74,84f, 96f, 101,104, 107,109,111,128,149 ff, 153,156f, 159ff, 203 ff, 212,218 DNA-Sonden 219 DNA-Synthese 4,33,45 ff, 58,61,73 f, Duchennesche Muskeldystrophie 99, 102,176 DUMPS 217 DyePrimer 134,136 f DyeTerminatoren 75,81,109,136f
232
Sachverzeichnis
Elektrophorese 39,57,79 f, 84,88 f, 104, 122,131, 134f, 143ff, 174, 184ff, 196f, 225 Emission 76, 130, 134 ff Empfindlichkeit 136ff Enzym 12, 14, 19,26,28ff, 33 ff, 80 ff, 108,209 Epitop 205 ff Ethidiumbromid 31,40 f, 88,99,102, l09,129f, 196 Exon 99,101 f, 185f, 225 Exonuklease 14,22,29,33ff, 41,60, 77,80,226 Expression 109 (F)dUTP 91 f, 94,98 Fleischfulle 215 Flexibilitat 3,23,149 f, 164 Fluorescein 129,137 Fluoreszenz 40 f, 43,61 f, 73 ff, 80,84, 89 ff, 107f, 114, 129 ff Fluroeszenz-Farbstoff 73,89 ff, 97,102, 109,112,133f, 170ff, 218 Fluoreszenzmarkierung 61 f, 73 f, 89 ff, 170,179 ff, 185 f, 199 Fluorochrom 127 ff, 131,138 Fluorophor 130,134,136,138 f, 142 ff, 147 Forensik 19,97, 113ff, 145,159, 164, 191ff Fragmentlangenbestimmung 87 ff, 94, 97,185 Fragmentmuster 121,160 ff Gelbild 28 f, 53 ff, 116,141,151f, 159f Gelelektrophorese 28,39 ff, 53 ff, 61, 79 f, 122,151 f, 184,219 Gelmatrix 106, 142f GeneScan 89,94,97f, 112,116,120, 122 genetische Marker 35, I l O f f , l l S f , 165 ff, 168ff, 227 Genkartierung 35,109 ff, 117 ff, 165 ff, 173,215
Genotyp 89,98,105,117, 143, 158, 167,17Of, 175,215f, 222 Genotyper 120,171 Halothantest 215 f Hepatitis B-Virus 210 f Heteroduplex 101,105 ff, 185,187 ff Heterozygotie 102,167 f, 172,187f, 192,198 HIV 99,203 ff Homologie 150,156 f Hot-Start-Technik 28,32 f, 226 HPLC 40,55 ff Hybridisierung 31,70,168, 193,219 ff Hyperkaliamische Periodische Paralyse 217 HYPP 217 In-situ-Hybridisierung 61,111 Integration 5,149f Interkalatoren 89,92 ff, 129 Intron 114,181,186,226 Kandidatengen 101,173,176 Kapazitat 97,148,182 Kapillare 79 f, 143ff Kapillar-Elektrophorese 40 f, 58,79 f, 106,138,143 Kettenabbriiche 30,74 f, 83 Klonierung 36,60,70 ff, 77, 165,173 Konsensussequenz 155,157 Kontamination 32,37 f Kopplung 88,109 ff, 166f, 169f, 174ff, 180,183f Langenstandard 26,94ff, 98,103,112, 114,116,170,172,181 f, 185 Laser 130ff, 135ff Laser-Scanning 127ff, 138ff Laufzeit 97 Leseweite 17,71,76,79ff, 83,88, 145 Linkage 98,110,112f, 131,226 long linker arm (LLA) 218 Luminogramm 129,133 Lyse, alkalische 9 f
Sachverzeichnis
Magnetic Beads 12f, 72 f, 229 Malignes Hyperthermie Syndrom (MHS) 118,215 f Mapping 111f, 117ff Markierung 59 ff, 73 ff, 79,89 ff, 97, 106f, ll5,127ff, 168ff Matrize 19 f, 22,24 f, 29 ff, 58,67,136, 228 Maxam-Gilbert-Sequenzierung65 f, 70,106 Mehltau 122 Mikrosatelliten IlOff, 114ff, 118ff, 131,167 ff, 172ff, 180f, 189,219ff, 227 Mikrotiterplatte 16,24,42f Milchproteine 217 ff, 218 Monomarkersysteme 127ff, 130,133, 142f, 147 Monomeraddition 46 ff, 59 f Multifluorophor 3,68 multifluorophore Detektion 140,143 Multi-Marker-Systeme 133ff, 138ff, 143,147 Multiplex 35,42 f, 70,93 f, 102ff, 114, 172ff, 174,185 f, 218 Mutation 68,85,87,100 ff, 126,127, 131f, 186,188f, 190,192,194,197, 211 f, 216 ff, 221 ff, 231 f Myeloencephalopathie 217 Nested deletion 77 Nested-PCR 31 f Netzwerk 163f Nukleosidanaloga 209 f Oligonukleotidsynthese 45 ff, 227 Optimierung 28 ff, 52,139,155 PCR-Labor 37 f PCR-Produkte 12ff, 22,31,41ff, 58, 72, 92 f, 99, 105f, 170ff, 183ff, 216 ff PCR-Reaktion 1,9,14,19ff, 92,99, 102 Peak 55 f, 94,98,117,122,152 f, 160f, 221
233
Pflanzenzuchtung 19,117,215 Phagen 7 ff, 70,227 Pipettierfehler 16,75,99 Plasmid 7,17,70,77,128f, 168,211, 225 ff Plateau-Effekt 21 f, 33,228 PMT 140f Polyacrylamid 39,59,61,67,70f, 80 f, 83f, 88,93,107, llOf, 113,118,120, 144,19Of, 194,197,233 polymorpher Marker 167,179f Primer 4,9 f, 14 ff, 19ff, 25,28 f, 42, 52f,59ff, 67ff, 89f,92f, 102, l l l f , 121f, 134ff, 168,174 f, 181f, 218 Primerwalking 71,78,83 Probenvorbereitung 4,12 ff, 32,5577 f Proteaseinhibitoren 210 PSE-Fleisch 215 Puffer 10,25 ff, 29,35,73,79,81ff, 88, 144 f Punktmutation 103ff Quantitative Trait Loci 215 quantitative Merkmale 215 Quencher 41 f RAPD 23,35,121 f, 228 Reaktionsbedingungen 75,79,81 Reaktionsparameter 24 ff Rechtsmedizin 88 Reproduzierbarkeit 23,35,94,97 Restriktionsanalyse 77 Restriktionsfragmentlangenpolymorphismus (RFLP) 110ff, 180,193 ff, 200,216 f, 218,229 Restriktions-Ligations-Methode90 Retinoblastom 179ff Rhodamin 129,136f Rifampicin 211 f RNA 9f, 17,33,35,45,87,89,9Sf, 101, 106,204 f, 209,211 f, 225,229 RT-PCR 35 Saulenaufreinigung 10ff Scanning 131,133,138ff, 147
234
Sachverzeichnis
Screening 88,91, 109, 179f, 184f Segregationsanalyse 180 ff Sequenzalignment 155 f Sequenzanalyse 74 f, 82,84,107,158, 161,206 ff Sequenzassembling 155,157 Sequenzcode 151ff, 157 Sequenzierprimer 71,73,75,77 f, 228 Sequenziertechniken 65 ff Sequenzierung nach Sanger 66 ff, 75 Sequenzierungsprojekt 76 ff SequenzierungsprozeR 83 Shotgun-Klonierung 77,83 SLS-Analyse 194 f Solid-Phase-DNA-Praparation 12 f Southern-Blot 114,128,194f, 219 Spurenuntersuchung 191 ff SSCP 101,103 f, 108 f, 184 STR 113ff, 167,196ff StreBanfalligkeit 118,215 f Systemkonzept 134 f, 140,143 T7-Polymerase 71 f, 80 ff Taq 8, 11f, 20 ff, 25 ff, 32 ff, 41 ff, 71, SOff, 91, 117, 168, 186,229 TaqMan 34,41 ff, 60
Temperatur 16, 19 ff, 25,28 f, 34,68 f, 80 f, 144,226,229 Template 7 f, 12, 17,67 ff, 70 ff, 101, 111,229 Terminatoren 14,17,75,81,136f Thermocycler 8 f, 12 ff, 23, 28,30 f, 37, 43,68,229 Tierzuchtung 19,216 ff Touchdown-PCR 30 f Trenn-Polymer 80 Typisierung 114, 149 f, 180,194 ff ultraviolettes Licht 37 f, 53,130 Uridinmonophosphat-synthaseDefizienz 217 V3-Region 205 ff Vaterschaftstest 88, 191,219 Vektor 7 ff, 71,77,155,230 virtueller Filter 142 Virus 7 f, 70,204 ff, 227 VNTR 114,180 f, 185,193 ff, 199 ff Weaver Disease 217 Wildtyp 102 ff