Stavros Kromidas
Handbuch Validierung in der Analytik
Handbuch Validierung in der Analytik Stavros Kromidas mit Beitragen von J. Ermer, K.-P. Gerbling, J. Hauswald, L. Huber, J. Kleiner, S. Kiippers, H.-J. Kuss, J. S. Morkowski, H.-S. Noack, W. Ockels, G. Papke, J. Peters, M. Rieth, R. Staal, M. Ulmschneider
@wI LEYVCH Weinheim . New York . Chichester . Brisbane . Singapore . Toronto
Dr. Stavros Kromidaa NOVIA GmbH Rosenstrak I6 661 25 Saarbrucken Das vorlicgcnde Werk wurde sorgfdtig erarbeitet. Dennoch ubernehmen Autor und Verlag fur die Richtigkcit von Angaben, Hinweisen und Ratschlagen sowie fur eventuelle Druckfehler keine Haltung.
1. Nachdruck 200 1 2. Nachdruck 2003 3 . Nachdruck 2008
Die Deutsche Bihliothek - CIP-Einheitsaufnahme Ein Titeldatensati f'ur diesc Publikation ist bei der Deutschen Bibliothek erhiiltlich. ISBN 978-3-527-2981 1-2
0WILEY-VCH Verlag GmbH, D-69169 Weinheim (Federal Republic of Germany), 2000 Gedruckt auf' saurelreiem Papier. Alle Rcchtc, insbesondere die der Ubersetzung in andere Sprachen, vorbehalten. Kein Teil diescs Buches darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form - durch Photokopie, Mikroverfilmung oder irgendein anderes Verfahren - reproduziert oder in eine von Maschinen, insbesondere von Datenverarheitungsmaschinen, verwendbare Sprache ubertragen oder ubersetzt werden. Die Wiedergabe von Warenbezeichnungen, Handelsnamen oder sonstigen Kennzeichen in diesem Buch berechtigt nicht zu der Annahme, daR diese von jedermann frei benutzt werden durfen. Vielmehr kann es sich auch dann um eingetragene Warenzeichen oder sonstige gesetzlich geschiitzte Kennzeichen handeln, wenn sie nicht eigens als solche markiert sind. All rights reserved (including those of translation into other languages). No part of this book may be reproduced in any form by photoprinting, microfilm, or any other means - nor transmitted or translated into a machine language without written permission from the publishers. Registered names, trademarks, etc. used in this book, even when not specifically marked as such, are not to be considered unprotected by law. Satz: Text- und Software-Service Manuela Treindl, D-93059 Rcgensburg Druck: Strauss Offsetdruck, D-69509 Morlenbach Bindunp: GroBbuchhinderei J. Schaffer, D-67269 Gninstsdt Umschlagge\taltung: Wolfgang Scheftler, D-55 128 Mainz Printed i n the Federal Republic of Gennany.
Vorwort
Wenn man sich intensiv mit dem Thema ,,Validierung" beschaftigt, gerat man leicht in das Philosophische oder aber man diskutiert lange uber Kommastellen. Beides kann wichtig sein - solange das Eine nicht den Blick fur das Andere versperrt. Ich denke, das Hinterfragen von Allem und die klare Zielsetzung machen eine zeitgemaBe Validierung aus. Im vorliegenden Buch wird versucht, sich mit grundsatzlichen Fragen zur Validierung in der Analytik auseinanderzusetzen. Aber im gleichen MaBe geht es auch und vor allem um den Validierungsalltag. So haben wir uns bemuht, moglichst viele Praxisbeispiele, Anregungen und Vorschlage vorzustellen und zu diskutieren. Die Ausfuhrungen sollen Anregung und Hilfe sowohl fur den Praktiker vor Ort sein als auch fur den Planer uber das ,,wieviel" an Validierung. Das Ziel des Buches ist es, einen Beitrag fur eine zweckgerichtete, bezahlbare Validierung zu leisten. Mein Dank gilt den Kollegen, die ihr Wissen und ihre Erfahrung uber die Validierung in Spezialgebieten zur Verfugung gestellt haben. Cornelia Reinemuth, Peter Biel und Steffen Pauly von Wiley-VCH danke ich fur die stete Kooperationsbereitschaft und ihre Flexibilitat. Saarbrucken. Januar 2000
Stavros Kromidas
Verzeichnis der Autoren
Dr. Joachim E m e r Aventis Pharma Deutschland Global Pharmaceutical Development Analytical Sciences Gebaude H 790 Industriepark Hochst 65926 Frankfurt Tel: 069/305- 16574 Fax: 069/305-8392 1 Email:
[email protected] Dr. Klaus-Peter Gerbling Schering AG Biological Quality Control 13342 Berlin Tel: 030/468- 12293 Fax: 030/468- I8034 Email: klauspeter.gerbling@ schering.de Joachim Hauswald Bayer AG Abteilung PH-OP-ELB-QW Gebaude 302 42096 Wuppertal-El berfeld Tel: 0202/36-7654 Fax: 0202/36/2633 Email:
[email protected] Dr. Ludwig Huber Agilent Technologies Deutschland GmbH Produkt Marketing Hewlett-Packard-Str. 8 76337 Waldbronn Tel: 07243/602-209 Fax: 07243/602-50 1 Email:
[email protected]
VIII
Verzeichnis der Autoren
Dr. Joachim Kleiner Perkin Elmer Verkauf und Service Abteilung Technische Schule Rengoldshauser Str. 11 88662 Uberlingen Tel: 075511919-132 Fax: 0755 11919-139 Email:
[email protected]
Dr. Stavros Kromidas NOVIA Chromatographie und MeBverfahrens GmbH Rosenstr. 16 661 25 Saarbriicken Tel: 0489719754-0 Fax: 0689719754- 15 Email:
[email protected] Dr. Stephan Kuppers Schering AG Abteilung InprozeB-Analytik 13342 Berlin Tel: 0301468- 17819 Fax: 030/468-978 19 Email:
[email protected] Dr. Hans-Joachim Kuss
Psychiatrische Universitiitsklinik Neurochemische Abteilung NuBbaumstr. 7 80336Miinchen Tel: 08915 1602731 Fax: 08915 1605853 Email:
[email protected] Janusz S. Morkowski Fohrliweg 8 CH-8600 Dubendorf Tel: 0041/1/8211466 Fax: 004 I 11/82 12207 Email:
[email protected] ehemals EMPA (EidgenossischeMaterialpriifungs- und Forschungsanstalt),Leiter Qualitatswesen
Verzeichnis drr Autoren
Dr. Siegfried Noack BAM Bundesanstalt fur Materialforschung und -prufung Abteilung I13 Unter den Eichen 87 12205 Berlin Tel: 03018 104-4 I36 Fax: 030/8 104- 1 I 17 Email : s .noack @ bam .de Dr. Werner Ockels Spectral Service Laboratorium fur Auftragsanalytik GmbH Geschaftsleitung Vogelsanger Str. 250 50825 Koln Tel: 022 1/54 147 1 Fax: 0221/541921 Email:
[email protected] Dr. Gunter Papke Hessisches Landesamt fur Umwelt und Geologie HLUG Abteilung Umweltanalytik Rheingaustr. 186 65203 Wiesbaden Tel: 061 116939-357 Fax: 061 1/6939-333 Email:
[email protected] Dr. Jurgen Peters Schott Gerate GmbH Abteilung AG-Applikation Im Langgewann 5 657 19 Hofheim Tel: 06 I92/209 1- 168 Fax: 06 19212091-222 Email:
[email protected]
Ix
Dr. Michael Rieth Merck KGaA Abteilung Pha Prod AL-QB Frankfurter Str. 250 64293 Darmstadt Tel: 06 15 I /72-4448 Fax: 06 1 5 1 /72-65 13 Email: michael .rieth (3merck.de Dipl.-lng. Rolf Staal Aventis Pharma AG Director Process Excellence Industrial Technologies Theodor-Heuss-Allee 2 60486 Frankfurt Tel: 069/305-7943 Fax: 069/305-83882 Email:
[email protected] Dr. Michel Ulmschneider Hoffmann - La Roche AG Abteilung POBQ Bau 62, Biiro I25 CH-4070 Basel Tel: 004 I /6 1 /688-8700 Fax: 004 I /6 1/688-3006 Email:
[email protected]
Zum Aufbau des Buches
Das Buch besteht aus vier Teilen. Teil A und B sowie der Anhang stellen die aktualisierte und teilweise erweiterte Version von ,,Validierung in der Analytik" dar, das im Juni 1999 im gleichen Verlag erschienen ist. Vor allem die Kapitel ,,Richtigkeit" (Abschnitt 3.4), ,,Linearitat" (Abschnitt 3.7) und ,,Haufige Fragen zur Validierung" (Kap. 4) sind stark erweitert worden. Teil A (Kromidas, Morkowski) umfal3t eine Einfuhrung in die Thematik, einen Schwerpunkt bilden formale Aspekte. Validierung und verwandte Begriffe werden definiert, anhand von Beispielen erlautert und kommentiert. AnschlieBend werden Methoden vorgestellt, wie ,,Validierung" prinzipiell angegangen werden kann. Dieser Teil ist allgemein gehalten, es geht hier um Grundsatzliches und um eine ganzheitliche Betrachtung. Im Teil B (Kromidas) werden wir uns mit der Praxis der Validierung beschaftigen: In den ersten Kapiteln werden die Themen ,,Voraussetzungen der Validierung", ,,Dokumentation" und ,,Qualifizierung von Geraten" behandelt. Die Validierungsparameter werden anschlieBend einzeln erlautert und deren Ermittlung im Detail beschrieben. Dazu werden zahlreiche Beispiele benutzt. Neben den Jdassischen" Validierungsparametem werden auch Aspekte, die erst in letzter Zeit in den Vordergrund rucken, ausfuhrlich besprochen: Methodenfahigkeit, MeBunsicherheit und erweiterte Unsicherheit. SchlieBlich wird auf haufige Fragen zur Validierung und auf typische Fehler eingegangen. Die Chromatographie als haufige analytische Methode wird immer wieder als Beispiel verwendet, um in diesem Teil die Validierungsparameter und den Gang einer Validierung zu erlautem. Teil C ist der Validierung in einzelnen Techniken bzw. in einem bestimmten Umfeld gewidmet. Der Leser findet hier z. T. sehr detaillierte Anweisungen zur Durchfuhrung sowie Hinweise auf Spezifika der Validierung in der Spektroskopie (Ockels), Emissionsspektralanalyse ICP-OES (Noack), Mikrobiologie (Rieth), Titrimetrie (Peters) und bei Computeranwendungen (Huber) sowie Chemometrie (Ulmschneider). Der spezielle Teil wird mit Vorschlagen fur die Validierungspraxis im behordlichen Umfeld und bei Normverfahren (Papke) sowie in der Pharma gemaB den ICH-Richtlinien (Ermer, Hauswald) abgeschlossen. Teil D betrifft die Okonomie bei Validierungen: Notwendiger Umfang, Durchfuhrungsmodus und Ansatze einer ,,intelligenten" Validierung, die ein Minimum an Aufwand moglich machen. Dem einfuhrenden Abschnitt uber Grundsatzliches zur Validierungsokonomie (Kromidas) folgt die Vorstellung zweier Werkzeuge, die als komplementar zu der ,,klassischen" Validierung gelten konnen: Statistische ProzeBkontrolle, SPC (Staal) und Schatzen der MeBunsicherheit (Kuppers). Im Anhang finden sich neben statistischen Tabellen, Register von deutschen und englischen Begriffen und Definitionen weitere Informationen rund um die Validierung. Das Buch mu13 nicht unbedingt linear gelesen werden, man kann problemlos hin und her ,,springen". Dazu wurden die einzelnen Kapitel so verfafit, daB sie abgeschlossene Module
XI1
Zum Aujbau des Buches
darstellen. Damit wurde versucht, dem Charakter des Buches als Nachschlagewerk gerecht zu werden. Verweise geben die Stellen im Buch wieder, wo bestimmte Begriffe noch einma1 und/oder ausfuhrlicher erklart werden. Validierung ist eine individuelle Angelegenheit. Es ist auch gut so. Aus diesem Grunde wurde bewuljt nicht auf ,,Vereinheitlichung" getrimmt, unterschiedliche Auffassungen der Autoren oder gar abweichende Definitionen blieben stehen. Auch wurde manche Wiederholung in Kauf genommen, um die Harmonie im textlichen Kontext nicht zu beeintrachtigen. SchlieDlich werden einige wichtige Begriffe von mehreren Autoren, die naturgemaD unterschiedliche Akzente setzen, diskutiert. So beispielsweise ,,MeBunsicherheit" (Morkowski, Kromidas, Papke, Kuppers), ein Begriff, der - zumindest was die praktische Umsetzung anbelangt - voll im Flulj ist. Der Leser moge davon profitieren.
Inhalt
Teil A Grundlagen Stuvros Kromidas und Janusz S. Morkowski
Vorwort V Verzeichnis der Autoren
VII
Zum Aufbau des Buches
XI I
1
Grundsatze der Validierung in der Analytik und im Prufwesen
1.1 1.2
Einfuhrung 1 Definition, Erlauterung und Kommentierung von Begriffen der Qualitatssicherung 3 Validierung 4 Verifizierung 11 Qualifizierung bzw. Qualifikation 1 1 Charakterisierung 12 Messen, Prufen, Justieren, Kalibrieren, Eichen 13 Grundvoraussetzungen fur die Validierung einer analytischen Methode 15 Die Unsicherheit der Ergebnisse von Messungen, Priifungen und Analysen Methoden zur Charakterisierung von analytischen Methoden 17 Die Charakterisierungsmethoden 18 Erste Charakterisierungsmethode 19 Zweite Charakterisierungsmethode 19 Dritte Charakterisierungsmethode 20 Vierte Charakterisierungsmethode 22 Funfte Charakterisierungsmethode 23 Kombination der funf Charakterisierungsmethoden 26 Weitere Methoden vom Typ B 27
1.2.1 1.2.2 1.2.3 1.2.4 1.2.5 1.3 1.4 1.5 1.5.1 1.5.1.1 1.5.1.2 1.5.1.3 1.5.1.4 1.5.1.5 1.5.1.6 1.5.1.7
16
1.6 1.7 1.8
Charakterisierung (Qualifizierung) von Methoden als letzter Schritt einer Validierungsprozedur 27 Freigabe von Methoden, Dokumentation 28 SchluBbemerkungen 28
2
Vor Beginn der Validierungsarbeiten: Voraussetzungen, Dokumentation, Geratequalifizierung 3 1
2.1 2.2 2.3 2.3.1 2.3.2
Voraussetzungen 3 1 Dokumentation 33 Geratequalifizierung 34 Das ,,V"-Modell 37 Empfehlungen fur die Praxis
40
Teil B Die Praxis der Validierung Stuvros Kmmidus 3
3.1 3.2 3.3 3.3.1 3.3.2 3.3.2.1 3.3.2.2 3.3.2.3 3.3.2.4 3.3.3 3.3.4 3.3.4.1 3.3.4.2 3.3.4.3 3.3.5
Die Validierungsparameter (oder nach IS0 17025: Verfahrensmerkmale)
41
Literaturuberblick 4 1 Die Validierungsparameter einer analytischen Methode 43 Prazision 46 Definitionen und Erlauterungen 46 Prazisionsarten 49 Wiederholprazision, Wiederholbarkeit (friiher: Wiederholgenauigkeit) 49 Vergleichsprazision, Vergleichbarkeit (haufig auch: Reproduzierbarkeit, selten Ubertragbarkeit) 49 Laborprazision oder laborinterne Vergleichsprazision 49 Weitere Prazisionen 50 MeB- und Methodenprlzision 5 1 Rechenbeispiele 52 Vergleich von Mittelwerten und Variationskoeffizienten 52 Vergleich von MeBwertreihen 53 Vergleich von Methoden, die aus stochastisch unabhangigen Schritten bestehen 56 Angaben zur Prazision und deren Deutungsmoglichkeiten 58
lnhalt
3.3.6 3.3.6.1 3.3.6.2 3.3.6.3 3.3.6.4 3.3.6.5 3.3.7 3.3.7.1 3.3.7.2 3.3.7.3 3.4 3.4.1 3.4.2 3.4.2.1 3.4.2.2 3.4.2.3 3.4.2.4 3.4.2.5 3.4.2.6 3.4.3 3.4.4 3.4.5 3.5 3.5.1 3.5.2 3.5.2.1 3.5.2.2 3.5.2.3 3.5.3 3.5.4 3.5.5 3.6 3.6.1 3.6.2 3.6.3 3.6.4 3.6.5 3.6.6 3.7 3.7.1 3.7.2
XV
Umgang mit Zahlen und Moglichkeiten zu deren Beurteilung 60 Ausreinertests oder Verlafilichkeitstests 60 Trendtest nach Neumann 64 Ermittlung der Wiederholgrenze 65 F- und Cochran-Test 65 Zusammenfassung der Tests und abschlierjendes Beispiel 68 Abschlierjende Fragen zur Prazision 71 Welche Prazision kann noch akzeptiert werden? 71 Wie kann ich die Prazision erhohen? 74 Was sind die Vor- und Nachteile bei grol3er Prazision? 75 Richtigkeit 77 Definitionen und Erlauterungen 77 Priifung auf Richtigkeit 78 Vergleich mit einem (oder mehreren) Referenz- oder Arbeitsstandard(s) 78 Vergleich mit einer unabhangigen, moglichst validierten Methode bekannter Richtigkeit 83 Wiederfindungsexperimente nach Zusatz bekannter Menge an Analyt (Referenzsubstanz!) 85 Elementbilanzierung 86 Indirekte Uberpriifung uber Massenbilanzen 86 Plausibilitatsbetrachtung 87 Merjunsicherheit, Ergebnisunsicherheit und Vertrauensbereich 87 Zusammenfassung von Tests zum Vergleich und zur Beurteilung von Zahien und Zahlenreihen 97 Wie sol1 ich nun die Richtigkeit uberpriifen? 99 Robustheit 101 Definition und Erlauterungen 101 Priifung auf Robustheit 102 Methodenrobustheit, Robustheit I: friihes Stadium 102 Verfahrensstabilitat 103 Anwendbarkeit, Robustheit I1 105 Zeitlicher Ablauf der Robustheitstests 107 Kommentare, Hinweise 110 Robustheit in der HPLC 110 Selektivitat und Spezifitat 116 Definitionen und Erlauterungen 116 Grundsatzliches zur Priifung auf Selektivitat 117 Prufung auf Selektivitat von bekannten Proben in der HPLC 1 17 Priifung auf Selektivitiit in der HPLC bei Proben unbekannter Zusammensetzung 118 Uberprufung der Selektivitat in der HPLC - Schnellmethoden 126 Zusammenfassung 131 Linearitat 133 Einleitung und Definitionen 133 Durchfiihrung der Linearitatstests 136
3.7.2.1 3.7.2.2 3.7.2.3 3.7.2.4 3.7.2.5 3.7.2.6 3.7.2.7 3.7.2.8 3.8 3.8.1 3.8.2 3.8.3 3.9 3.9.1 3.9.2 3.9.3 3.9.4 3.10 3.1 1 3.11.1 3.1 1.2 3.11.3 3.1 1.4
Grundsatzliches 136 Priifung auf Linearitat 138 Beurteilung der Ergebnisse 143 Welche MethodenkenndatenAnformationen konnen aus einer linearen Kalibrierfunktion gewonnen werden? 147 FlieBschema zur Kalibrierung und zur Ermittlung der Linearitat 1.57 Beispiel zur Prufung auf Linearitat 163 Eine kritische Betrachtung der Kriterien fur Linearitat 176 Gewichtete lineare Regression 179 Wiederfindung oder Wiederfindungsrate 184 Definitionen und Erlauterungen 184 Ermittlung der Wiederfindungsrate 18.5 Praktische Hinweise und Bemerkungen 186 Nachweis-, Bestimmungs- und Erfassungsgrenze 187 Definitionen und Erlauterungen 188 Ermittlung der Nachweis-, Bestimmungs- und Erfassungsgrenze 189 Kommentare und Hinweise 19 1 AbschluObemerkungen und Empfehlungen 192 Arbeitsbereich 19.5 Prozefi- und Methodenfahigkeit 19.5 Definitionen und Erlauterungen 195 Beispiele 198 Akzeptanzkriterien, Bewertung von Prozessen und Methoden 200 Mafinahmen bei unzureichender Methodenfahigkeit - zu kleine cMK’s 204
4
Haufige Fragen zur Validierung
4.1 4.2
Ermittlung der interessantesten Fragen 20.5 Antworten auf die sieben wichtigsten Fragenkomplexe
5
Haufige Fehler bei der Validierung analytischer Methoden
5.1 5.2
Allgemeine Fehler und Interpretationsfehler 223 Fehler im Zusammenhang mit der praktischen Durchfuhrung der Validierung 230
205 206 223
Znhalt
XVII
Teil C Zur Validierung einzelner Techniken und Gebiete Agilent, Aventis, BAM, Bayel; Hessische Landesanstalt fur Umwelt, HofSmann - La Roche, Merck, Schering, Schott, Spectral Service
6
Techniken und Gebiete 239
6.1
Validierung in der Spektroskopie 239
Werner Ockels, Spectral Service, Koln 6.1.1 6.1.2 6.1.3 6.1.4 6.1.5
Einleitung 239 Infrarot-Spektroskopie 240 UVIVIS-Spektroskopie 240 Massenspektroskopie 240 NMR-Spektroskopie 241
6.2
Validierung von Analysenverfahren mit ICP-OES
245
Siegfried Noack, BAM Berlin 6.2.1 6.2.2 6.2.2.1 6.2.2.2 6.2.2.3 6.2.3 6.2.3.1 6.2.3.2 6.2.3.3
Einleitung 245 Beschreibung methodenbedingter Leistungsmerkmale der ICP-OES 246 Spektrale und nicht spektrale Storungen 246 Untergrundermittlung 247 Kurzzeit- und Langzeitstabilitat (Drift) 247 Optimierung methodenbedingter Leistungsmerkmale der ICP-OES 248 Spektrale und nicht spektrale Storungen 250 Untergrundermittlung 25 1 Kurzzeit- und Langzeitstabilitat (Drift) 252
6.3
Validierungsaspekte bei Arbeiten in mikrobiologischen Labors
254
Michael Rieth, Merck KGaA, Darmstadt Klaus-Peter Gerbling, Schering AG, Berlin 6.3.1 6.3.1.1 6.3.1.2 6.3.1.3 6.3.2
Priifung auf Sterilitat (flussige und filtrierbare Arzneimittel) 254 Validierungsplan fur die Durchfuhrung der Sterilitatspriifung 254 Beschreibung der Durchfuhrung 255 Validierungsbericht 256 Mikrobiologische Dichtigkeitspriifung (Closure Integrity Test) von Primarbehaltern eines aseptisch hergestellten Wirkstoffs unter Worst Case Bedingungen des VerschluBsystems 251 6.3.2.1 Validierungsplan 257 6.3.2.2 Beschreibung der Priifflaschen und Stopfen 258
XVIII
In hult
6.3.2.3 Testmikroorganismus, Herstellung der Tauchsuspension und Keimzahlbestimmung 259 Mikrobiologische Integritatsprufung 259 6.3.3 6.3.3.1 Dichtigkeitspriifung 259 6.3.3.2 Wachstumsprufung nach der Dichtigkeitspriifung 260 6.3.3.3 Ergebnisse 260 Qualifizierung eines Anal ysesystems am Beispiel Mikrotiterplatten6.3.4 photometer 262 6.3.4.1 Qualifizierungsplan fur das computergestutztes System Mikrotiterplattenphotometer 262 6.3.4.2 Betrieb des computergestutzten Systems 263 6.3.4.3 Testprogramme fur die Systemeignung, Qualifizierung und Requalifizierung 265 6.3.4.4 Nachweis der korrekten Installation und Funktionalitat des computergestutzten Systems sowie der umgebenden Raumeinrichtung 267 6.3.4.5 Raumeinrichtungen 268 Qualifizierungsbericht fur das System Mikrotiterplattenphotometer 269 6.3.5 6.4
Validierung einer Titrationsmethode
270
Jiirgen Peters, Schott Gerate GmbH, Hofheim
6.4.1 6.4.2 6.4.3 6.4.4 6.4.5 6.4.6 6.4.7 6.4.8 6.4.9
Einleitung 270 Ubersicht Validierungsmerkmale 270 Voraussetzungen fur eine Titration 270 Prufmitteluberwachung 273 Praktisches Vorgehen 274 Validieren einer Saure-Base-Titration 27.5 Validieren einer Karl Fischer Titration 281 Ubertragen auf andere Titrationen 284 Zusammenfassung 285
6.5
Validierung von Software und computerisierten Analysensystemen
286
Ludwig Huber; Agilenr GrnbH, W ~ ~ d b r o n n
6.5.1 6.5.2 6.5.3 6.5.4 6.5.4.1 6.5.4.2 6.5.4.3 6.5.5 6.5.6
Einleitung 286 Definition von computerisierten Systemen und Softwarekategorien 286 Ubersicht einer Gesamtvalidierung 288 Beitrag des Gerateherstellers bzw. Softwarelieferanten zur Validierung 290 Installation 29 I Testen des Gesamtsystems vor der Inbetriebnahme 292 Ausgeubte Softwarefunktionen und Darstellung der Ergebnisse 292 Automatischer Test des Computersystems ohne Geratehardwaretest 294 Validierung von Anwendungsprogrammen, die vom Benutzer erstellt wurden 296
Inhalt
6.5.7 6.5.8 6.6
XIX
Nachtragliche Untersuchung und Validierung von existierenden Systemen 299 Zusammenfassung 300 Validierung von chemometrischen Methoden am Beispiel multivariater Datenanalyse in der Nah-Infrarot Spektroskopie 302
Michel Ulmschneider; Hofmann - La Roche AG, Basel 6.6.1 6.6.2 6.6.3 6.6.3.1 6.6.3.2 6.6.3.3 6.6.4
Einleitung 302 Allgemeines zur multivariaten Datenanalyse 302 Praktisches Beispiel aus der Nah-Infrarot Spektroskopie 304 Grundlagen 304 Methode 305 Kalibrierung und Validierung 306 Fazit 306
6.7
Basisvalidierung -primary validation verfahren 308
-
in der Normung von Analysen-
Giinter Papke, Hessisches Landesamt fur Umwettschutz, Wiesbaden
6.7.4.4 6.7.4.5
Einleitung 308 MeBunsicherheit in der Normung 3 10 Modelle zur Abschatzung von MeBunsicherheiten 31 1 Unprazisionsangaben aus laborinternen Messungen 3 1 1 Unprazisionsangaben aus Ringversuchsergebnissen 3 1 1 Probleme bei der Anwendung des DIN-Basisvalidierungspapieres 312 Praxisbeispiele zur Ableitung von Schatzwerten fur die MeBunsicherheit aus Prazionswerten 3 12 Praxisbeispiel zur Ableitung von Schatzwerten fur die MeBunsicherheit aus Nachweis-, Erfassungs- und Bestimmungsgrenzwerten nach DIN 32645 3 15 Praxisbeispiel zur Ableitung von Schatzwerten fur die MeBunsicherheit aus Prazisionswerten von Kontrollkarten 316 SchluBbemerkungen 3 16 Anhang und Erlauterungen 3 18
6.8
Validierung in der pharmazeutischen Analytik
6.7.1 6.7.2 6.7.3 6.7.3.1 6.7.3.2 6.7.4 6.7.4.1 6.7.4.2 6.7.4.3
320
Joachim Ermer; Aventis, Frankfurt
6.8.1 6.8.2 6.8.2. I 6.8.2.2 6.8.2.3 6.8.2.4 6.8.2.5
Einleitung 320 Regulatorische Anforderungen zur analytischen Validierung 320 Deutschland [84] 321 Europaische Gemeinschaft [85] 32 1 USA 322 Kanada [89] 323 Good Manufacturing Practice [90] 325
xx
Inhalr
6.8.2.6 International Conference on the Harmonization of Technical Requirements for the Registration of Pharmaceuticals for Human Use (ICH) 325 6.8.3 Planung, Durchfiihrung und Bewertung von Validierungsstudien 332 6.8.3.1 Spezifitat 332 6.8.3.2 Linearitat und Arbeitsbereich 339 6.8.3.3 Richtigkeit 347 6.8.3.4 Prazision 348 6.8.3.5 Nachweis- und Bestimmungsgrenze 35 I 6.8.3.6 Robustheit 356 6.8.3.7 Systemeignungstest 356 6.8.3.8 Rationelle Validierung 357 6.8.3.9 Validierungskonzept wahrend der Arzneimittelentwic klung und -herstellung 358 6.8.3.10 Validierung als integraler Teil der Qualitatssicherung 359 6.9
Forderungen der ICH zur Validierung in der Pharmaindustrie am Beispiel der HPLC 360
Joachim Hauswald, Bayer AG, Wuppertal
6.9. I 6.9. .1 6.9. .2 6.9. .3 6.9. .4 6.9. .5 6.9. .6 6.9.1.7 6.9. I .8 6.9.1.9 6.9.2 6.9.3
Praktische Durchfuhrung 360 Spezifitat 360 Linearitat 361 Arbeitsbereich 362 Prazision 362 Richtigkeit 363 Nachweisgrenze 364 Bestimmungsgrenze 364 Robustheit 364 Systemeignungstest (System Suitability Testing) Dokumentation 366 AbschlieBende Bemerkungen 366
365
Teil D Okonomie bei Validierungen Aventis, NOVIA, Schering 7
Umfang, Ablaufschema, zeitlicher Ablauf und Kosten der Validierung 367
Stuvros Kromidus, NOVIA GrnbH, Saarbrucken
7.1 7.1.1 7.1.2 7.1.3 7.2 7.2.1 7.2.2 7.3 7.3.1 7.3.2 7.4 8
Umfang einer Validierung 367 Validierungsumfang in Abhangigkeit von dem Analysenverfahred dem MeBprinzip 369 Validierungsumfang in Abhangigkeit vom Analysenziel 372 Valdierungsumfang abhangig von der Haufigkeit und Wichtigkeit der Probe 375 Vorgehensweise bei der Validierung 376 FlieBschema und zeitlicher Ablauf 376 Kommentare zum FlieBschema 376 Kosten der Validierung und Ansatze fur deren Senkung 384 Senkung der Validierungskosten 384 Fazit 39 1 Wie geht es weiter? 393 Uber die Einsatzmoglichkeit der statistischen ProzeBkontrolle, SPC, in der Analytik 403
Rolf Stual, Aventis, Frankfurt
8.1 8.1.1 8.1.2 8.1.3 8.2 8.3
Validierung - und was kommt danach? 403 Konsequenzen - das Werkzeug statistische ProzeBkontrolle, SPC 405 Vorteile durch die Anwendung der statistischen ProzeBkontrolle 412 Schwierigkeiten bei der Anwendung der statistischen ProzeBkontrolle 413 Analysenergebnisse an Spezifikationsgrenzen 4 15 Die Gefahren der Uberjustierung in der Analytik und deren Beseitigung 4 18
9
Schatzen der MeBunsicherheiVErgebnisunsicherheit 423
Stephan Kuppers, Schering AG, Berlin
9.1 9.2 9.3 9.3.1 9.3.2 9.3.3
Ergebnisunsicherheit - eine Einleitung 423 Grundlagen 424 Beispiele 429 Beispiel aus der Chromatographie 429 Beispiel aus der Spektroskopie 43 1 Beispiel eines physikalischen Messverfahrens (Karl-Fischer-Wassertitration) 433
XXIl 9.4 9.5
Zusarnrnenfassung und Empfehlung Statistische ProzeBkontrolle 436
10
SchluBwort 439
A
Anhang
A1 A2
Abkiirzungen (Auswahl) 441 Definitionen und Erlauterungen von Begriffen aus den Bereichen ,,Validierung" und ,,Qualitatssicherung" 444 Englische Ubersetzung einiger wichtiger Begriffe zurn Kornplex ,,Validierung" (Auswahl) 462 Register der Rechenbeispiele 464 Statistische Tabellen 466 Softwareprograrnrne zur Methodenvalidierung und Qualitatssicherung (Auswahl) 475 Niitzliche Adressen (Auswahl) 479 Publikationen zum Thema Validierung in der Analytik (Auswahl) 483 Weiterbildung 490
A3 A4 A5 A6 A7 A8 A9 Literatur
441
493
Sachwortregister
434
501
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Teil A Grundlagen Stavros Kromidas, NOVIA GmbH, Saarbriicken Janusz S. Morkowski, Dubendoe Schweiz
1
Grundsatze der Validierung in der Analytik und im Priifwesen
1.1
Einfuhrung
Validierung bedeutet, auf die Frage zu antworten, ob ein Priifverfahren, eine analytische Methode oder eine MeS-Priifeinrichtung fur die Erfullung einer ganz bestimmten Aufgabe geeignet ist. Um auf diese Frage antworten zu konnen, muS man dreierlei wissen: - Wie lautet die bestimmte Aufgabe, die gelost werden soll? - Durch welche charakteristischen Leistungsmerkmale kann das fur die Losung der Auf-
gabe vorgesehene Verfahren auf Eignung getestet werden? Wie lauten die experimentell ermittelten Werte der ausgesuchten Merkmale?
Somit konnen die von der Aufgabenstellung her geforderten Fahigkeiten des Verfahrenst der Methode/der Prufeinrichtung mit den tatsachlichen Leistungsmerkmalen verglichen werden und die eigentliche Validierungsfrage auf Eignung beantwortet werden. Stellt der Validierer anschlieBend auch noch formal fest, daR das vorgesehene Verfahren tatsachlich imstande ist, die gestellten Forderungen zu erfullen, so sind alle Schritte der Validierungsprozedur normgerecht ausgefuhrt. Bemerkung: Der Einfachheit halber wird im folgenden nicht von dem Verfahren/der Methode/der Priifeinrichtung sondern stellvertretend von der Methode die Rede sein.
2
I Grundsiitze der Validierung in der Analytik und im Prufiesen
Tab. 1-1 Ablauf einer Validierungsprozedur (allgerneines Schema) Der Auftraggeber
Das Labor
benotigt Informationen, damit er eine bestimrnte Aufgabe erfullen oder losen kann. Er uberlegt sich, um welche konkrete Informationen es sich handeln sol1 und beschreibt diese moglichst genau.
bestimrnt eine Methode, mit deren Hilfe es den Auftrag des Aufgabenstellers bearbeiten will. Eventuell wird die Methode vorgegeben. Es definiert samtliche KenngroRen (Leistungsoder Verfahrensmerkmale) der vorgesehenen Methode, deren Prufung zur Losung der Aufgabe erforderlich sind.
Spezifikation
Charakteristische KenngroSen von Methoden sind z. B.
Die fur die Aufgabenlosung benotigten Informationen werden in dem an das Labor vergebenen Auftrag als (Qualitatits-)Forderungen spezifiziert. Genannt werden die zulassigen Werte der charakteristischen KenngroBen des verwendeten Verfahrens; insbesondere die zulassige Gesamtunsicherheit der Ergebnisse der Prufung. Gegebenenfalls werden die Forderungen erst nach klarenden Gesprachen init dem Labor spezifiziert.
-
-
Wiederholbarkeit Vergleichbarkeit Nachweis- und Bestimmungsgrenze Anwendungsbereich Selektivitat Robustheit Linearitat Gesamtunsicherheit der Ergebnisse
Vergleich Im AnschluR an die obigen Schritte werden die (Qualitats-)Forderungen des Aufgabenstellers mit den Werten der charakteristischen KenngroOen der Methode verglichen. ~
7
Qualifizierung der Methode Methode modifizieren bzw. AlternativMethode suchen Aufgabenstellung andern
1 (
nein
d. h. Feststellung der Eignung Die Validierungsprozedur endet mit der formalen Feststellung des Labors, daB die vorgesehene Methode fur die Losung der spezifischen Aufgabe geeignet oder eben nicht geeignet ist, d. h. da13 sie sich qualifiziert hat oder nicht.
ja
1.2 Dejinition, Erlauterung und Kommentierung
3
Zusammenfassend bedeutet das Gesagte folgendes: Methodenvalidierung bedeutet, die Absicht des Auftraggebers zu kennen und anschlieknd herauszufinden, ob eine Methode fur den vorgesehenen Verwendungszweck geeignet ist. Die Validierung betrifft immer zwei Parteien: 1. Der Aufgabensteller Zunachst mu13 jemand da sein, der eine Aufgabe stellt. Die zu losende Aufgabe kann sich auch aus den Interessen der Offentlichkeit ergeben oder sie kann aus den Forderungen von Gesetzen, Verordnungen oder normativen Dokumenten resultieren. Es ist letztlich belanglos, wer die Aufgabe formuliert; dies kann ein externer oder interner Kunde sein, ebenso gut kann das Labor selbst jene Forderungen formulieren, welche die Methode erfullen rnulj.
2. Der Aufgabenloser Der Aufgabensteller benotigt jemanden, der fur ihn die Aufgabe lost, also ein Labor. Um eine vollstandige Validierung durchzufuhren, mu13 das beauftragte Labor nun folgendes tun: - Es mulj die Aufgabe, und allenfalls auch das Problem des Auftraggebers, verstehen und - es mul3 abklaren, ob die fur die Aufgabenlosung vorgesehene Methode imstande ist, Ergebnisse zu liefern, die fur die Aufgabenlosung nutzlich sein werden; oder mit anderen Worten, ob sie fur den vorgesehenen Verwendungszweck geeignet ist. Gegebenenfalls mulj es eine Alternativmethode vorschlagen. - Es wird dem Aufgabensteller mitteilen, dalj es im Stand ist, die gestellte Aufgabe zu losen. - Im Zweifelsfall wird es die Eignung der Methode zu uberprufen haben, d. h. es hat zu priifen, ob die ermittelten Zahlenwerte der Merkmale von einer leistungsfahigen, sprich von einer fur die konkrete Aufgabenstellung geeigneten Methode zeugen. Die Validierungsprozedur laljt sich am besten in einem Ablaufschema darstellen. Dieses zeigt, dalj sowohl der Auftraggeber in seiner Funktion als Aufgabensteller, wie auch das Labor als Auftragnehmer und Aufgabenloser bei der Validierung eine wichtige Rolle zu ubernehmen haben, siehe Tab. 1- 1. In der Praxis kommt es oft vor, dalj das Labor die Fragestellung des Kunden so gut versteht, dalj es sehr wohl im Stand ist, stellvertretend fur den Kunden selbst die geplante Vorgehensweise zu definieren und dann mit ihm abzusprechen.
1.2
Definition, Erlauterung und Kommentierung von Begriffen der Qualitatssicherung
Trotz klarer Vorstellungen bezuglich des Begriffs Validierung, wie sie in der obigen Einfuhrung dargelegt wurde, und trotz vieler Diskussionen daruber, besteht bis heute immer noch eine gewisse Verwinung bezuglich venvandter Begriffe wie Validierung, Zertifizierung,
4
I Grutdtiitze der Wrlidierung in der Antilytik
itnd
inr Pri{tweseti
Charakterisierung, Verifizierung und Qualitizierung. Diese Konfusion hat weit mehr als nur linguistische oder semantische Bedeutung. Die Autoren pliidieren keinesfalls fur die Beibehaltung oder gar zwingende Verwendung all dieser Begriffe. Es zeigt sich jedoch, dal3 dadurch eher Probleme auftreten als daCj deren Verwendung der Klarung dient. Leider existieren sie und werden in der Praxis immer noch in eigenwilliger und zugleich arbitrarer Weise verwendet, was die Verstandigung zwischen den betroffenen Parteien nicht gerade erleichtert: Wollte man die heutige Situation in der Analytik charakterisieren, so durfte folgendes - aul3er in der Pharmaindustrie, wo der Validierungsgedanke sehr weit fortgeschritten und strukturiert ist - wohl haufig zutreffen: Viele der Betroffenen wissen heute ganz genau, was fur sie selbst Validierung, Verifizierung und Qualifizierung bedeutet; nur meinen leider andere Leute unter diesen Begriffen nicht genau das gleiche und manchmal sogar etwas recht Unterschiedliches. Oft werden auch die klaren Auslegungen der Begriffe Validierung, Verifizierung und Qualifizierung aus Regelwerken wie IS0 8402: 1994 und DIN EN IS0 17025:2000, siehe unten, ignoriert. Ein Beispiel: In dem Dokument der ILAC ,,Guideline for validating test methods'' 3rd draft of ILAC WG6: 1994-05- 13 wird der Begriff Validierung, wie in der IS0 8402 definiert, nicht beachtet und fur den eigenen Gebrauch eine Umschreibung verwendet, die gemaB der Norm auf den Begriff Verifizierung zutrifft. Was notwendig ist, ist einerseits eine Verstlndigung unter den Betroffenen bezuglich der Begrifflichkeiten, andererseits sollte eine pragmatische, dem Laboralltag dienende Auslegung angestrebt werden. Diesem Zweck sollen die nachfolgenden Definitionen und Erlauterungen dienen.
1.2.1 Validierung Mit Validierung verbindet jeder Analytiker die Uberprufung einer Methode auf Brauchbarkeit. Der Begriff Validierung taucht offiziell erst in den 70er Jahren auf: 1975 in Europa: 1978 in den USA:
Richtlinie des Rates 75/3 18 (EWG) FDA, im Zusammenhang mit der Produktion von Arzneimittel
Nachfolgend eine Auswahl von Definitionen aus der Literatur. -
-
Dertinger, Giinshirt, Steinigen in ,,GAP Praxisgerechtes Arbeiten in pharmazeutischanalytischen Laboratorien", Wissenschaftliche Verlagsgesellschaft mbH. Stuttgart 1984: ,,Kilidiesiing ist der Nuchrr~eisund rlie Dokurnentution der Ziivesliissigkeit eirier M e thode.'' H. Bosshardt, F. Schorderet, H. Feltkamp, P. Fuchs und H. Sucker, Pharmazeutische Qualitatskontrolle, Georg Thieme Verlag, Stuttgart 1983: .,Unter klidierirng \iersteht man rlie Gesamtheit aller sich iiber Planung, Aiisfiihriirig wid Dokiirnrritrrtiorr rrstsekkenden MaJnuhmen, die die Giiltigkeit einer ctnulytischen Methotle hewriseri. ller Prilfuujivund richtet sich riuch der Methoclik, der Appircitiir Litid den Ar~forulPriiri~~eri ( i n die Giite des Resulttits."
1.2 Definition, Erluuterung und Kommentierung
5
Chapmann, 1985: ,,Validierung he@ nichts Anderes als gesunder Menschenverstand gut organisiert und gut dokumentiert. '' - FDA, 1986 (im Hinblick auf Produktion): ,,Validierung ist der dokumentierte Nachweis, daJ ein bestimmter ProzeJ mit einem hohen Grad an Sicherheit kontinuierlich ein Produkt erzeugt, dus vorher dejinierte Spezifikationen und Qualitatsmerkmale erfiillt. - Inspectorate for Health Protection, Food Inspection Service, Niederland: ,,Vulidierung ist die Prozedur; die sicherstellt, daJ eine Testmethode so zuverlassig ist wie miiglich. Dieser ProzeJ besteht aus einem (Test)Programm, das zur Beantwortung folgender Fragen fiihrt: ,,Wierichtig ist es? und ,,Wieprazise ist die Methode in den Handen des Routineanwenders? - Rompp Chemie Lexikon, 1992 (ebenfalls auf die Produktion bezogen): ,, Vufidienwg umfaJt (nach dern verbindlichen Code von ,,Good Validation Practices '' in der Pharmazeutischen Industrie, Anm. der Autoren) die systematische Uberpriifung der wesentlichen Arbeitsschritte und Einrichtungen in Entwicklung und Produktion einschlieJlich der Kontrolle von pharmazeutischen Produkten mit dem Ziel, sicherzustellen, daJ die hergestellten Produkte bei Innehaltung der festgelegten Produktions- und Kontrollverfahren zuverlassig und reproduzierbar in der gewiinschten Qualitat hergestellt werden konnen. - USP<1225>: ,,Validierung ist der ProzeJ, durch den mittels Laborexperimenten gezeigt wird, daJ die Leistungsmerkmale (Charakteristika) einer Methode den Forderungen fiir eine beabsichtigte Anwendung geniigen. '' - ICH, 1995: ,,Das Ziel bei der Validierung einer analytischen Methode ist zu zeigen, daJ sie f u r den beabsichtigten Zweck geeignet ist - I S 0 8402, 1994 0 2.18: Jestatigen aufgrund einer Untersuchung und durch Bereitstellung eines objektivenNachweises, daJ die besonderen Forderungen f u r einen speziellen beabsichtigten Gebrauch erfiillt worden sind." (objektiver Nachweis: nachweisbare Informationen basierend auf Tatsachen, die man durch Beobachtung, Messung, einen Test oder auf eine andere Art und Weise (other means!) erhalt) -
"
"
"
I'
I'.
Jungst wurde ein Schritt vollzogen, der Beachtung verdient: Aus dem I S 0 Guide 25 und der EN 45001 (1989) wurde eine neue internationale Norm, die I S 0 17025 (Allgmeine Anfordemngen an die Kompetenz von Pruf- und Kalibrierlaboratorien). Mit der neuen Norm wird dem Vorschlag der DIN Rechnung getragen, eine Gleichstellung der Wertigkeit des ISO-Standards mit der europaischen Norm EN 45001: 1997-06 zu erreichen. Die EN ISO/IEC 17025: 2000 hat den Status einer Deutschen Norm und ist seit Dezember 1999 in Kraft. Seit April 2000 existiert eine dreisprachfige Fassung (deutsch, englisch, franzosisch) (zu beziehen bei: Beuth Verlag GmbH, 10772 Berlin). I S 0 17025 kann als ein wichtiger Bezugspunkt fur analytische Laboratorien (Pruf- und Kalibrierlaboratorien) angesehen werden. Daher lohnt es sich, die fur uns interessanten Textpassagen der Norm im Wortlaut zu verfolgen. Bemerkenswertenveise erscheinen fur die Verfasser die ,,Validierung von Verfahren" und die ,,Schatzung der MeBunsicherheit" gleichwertige Werkzeuge der Qualitatssicherung zu sein. Jedenfalls erhalten im Text beide Verfahren eine gleichwertige Stellung in der Hierarchieebene (Punkt 5.4.5 und 5.4.6).
6
1 Grundsatze der Vulidierung in der Analytik und im Prufiesen
,,5.4.5 Validierung von Verfahren
5.1.5.1 Die Validierung ist die Bestatigung durch Untersuchung und Bereitstellung cines Nachweisec, daR die besonderen Anforderungen fur einen speziellen beabsichtigten Gebrauch erfullt werden. 5.4.5.2 Das Laboratoriurn rnuR nicht in norrnativen Dokurnenten festgelegtc Verfahren, sclbstentwickclte Verfahren, Verfahren nach normativen Dokurnenten, die aufierhalb ihres vorgesehenen Anwendungsbereiches angewendet werden, und Erweiterungen von Verfahren nach norrnaliven Dokurnenten validieren, urn zu bestatigen, daB die Verfahren fur den beabsichtigten Gebrauch geeignet sind. Die Validierung mu8 in dem Umfang durchgcfuhfl werden, der zur Erfullung der Erfordernisse der beabsichtigten Anwendung oder des betreffenden Anwendungsgebiets notwendig ist. Das Laboratoriurn rnuR die erhaltenen Ergebnisse und das fur die Validierung verwendete Verfahren aufzeichnen und festlegen, oh das Vcrfahrcn fur den beabsichtigten Gebrauch geeignet ist. Anmerkung 1: Validierung kann Verfahren fur Probenahrne, Handhabung und Transport urnfassen. Anmerkung 2: Zur Bestirnrnung der Verfahrensrnerkrnale sollte eine der folgenden Methoden oder eine Kombination davon verwendet werden: Kalibrierung rnit Bezugsnormalen oder Referenzrnaterialien; Vergleich rnit Ergebnissen, die rnit anderen Verfahren erzielt wurdcn; - Vergleiche zwischen Laboratorien; systernatische Beurteilung der Faktoren, die das Ergebnis beeinflusscn; Beurteilung der Ergebnisunsicherheit auf der Grundlage wissenschaftlichen Verstehens der theoretischen Grundlagen des Verfahrens und praktischer Erfahrung. Anmerkung 3; Wenn einige Anderungen in den validierten nicht genorrnten Verfahren vorgenomrnen werden, sollte der EinfluR solcher Anderungen dokumentiert werden und, sofern angernessen, sollte eine neue Validierung vorgenornnien werden.
5.4.5.3 Der Bereich und die Genauigkeit der rnit validierten Verfahren erreichbaren Werte (z. B. Ergebnisunsicherheit, Nachweisgrenze, Selektivitat des Verfahrens, Linearitat, Wiederholgrenze und/oder Vergleichsgrenze, Robustheit gegen aufiere Einflusse und/oder Querempfindlichkeit gcgenuber Beeinflussungen durch die von der Matrix der Probe/des Prufgegenstandes), wie sie fur die beabsichtigte Anwendung beurteilt werden, rnussen den Erfordernissen des Kunden entspree hen. Anmerkung I: Validierung schlieBt Beschreibung der Anfordemngen, Bestirnrnung der Verfahrensrnerkrnale, eine Priifung, dab die Anforderungen durch Anwendung der Methode erfiillt werden, und eine Aussage zu ihrer Gultigkeit ein. Anmerkung 2: Bei weiterer Entwicklung des Verfahrens sind regelrnaRige Prufungen erforderlich, die sicherstellen sollen, daR die Erfordernisse des Kunden weiterhin erfullt werden. Jede Anderungen dcr Anforderungen, die Modifizierungen des Entwicklungsprogramrns erfordern, rnussen gepruft und genehrnigt werden. Anmerkung 3: Bei der Validierung sind irnrner die Kosten, Risiken und technischen Moglichkeiten abzuwagen. In viclen Fallen konnen der Bereich und die Unsicherheit der Werte (1.B. fur Genauigkeit, Nachweisgrenze, Selektivitat, Linearitat, Wiedcrholprazision, Reproduzierbarkeit,
1.2 Dejinition, Erliiuterung und Kommentierung
7
Robustheit, Querempfindlichkeit) mangels Information nur in vereinfachter Weise angegeben werden. 5.4.6 Schatzung der MeSunsicherheit 5.4.6. I Ein Kalibrierlaboratorium oder ein Priiflaboratorium, das interne Kalibrierungen durchfuhrt, mu8 uber ein Verfahren zur Schatzung der MeBunsicherheit fur alle Kalibrierungen und alle Arten von Kalibrierungen verfugen und dieses anwenden. 5.4.6.2 Priiflahoratorien mussen uber Verfahren fur die Schatzung der MeBunsicherheit vcrfugen und diese anwenden. In bestimmten Fallen kann die Art der Priifmethode eine strenge metrologische und statistisch gultige Schatzung der MeBunsicherheit ausschlieljen. Das Laboratorium mu8 in solchen Fallen mindestens versuchen, alfe Komponenten der MeRunsicherheit zu ermitteln, und eine vernunftige Schatzung der MeBunsicherheit vornehmen und sicherstellen, daB der Prutbericht keinen falschen Eindruck bezuglich der Unsicherheit erweckt. Eine vernunftige Schatzung mu6 auf der Kenntnis der Durchfuhrung des Verfahrens und auf der Art der Messung basieren und z. B. von vorhergehender Erfahrung und von Validierungsdaten Gebrauch machen. Anmerkung I : Der Grad der Strenge, die bei der Schatzung der MeBunsicherheit erforderlich ist, hangt von Faktoren ah wie z. B. - die Anforderungen der Prufmethode; die Anforderungen des Kunden; das Vorhandensein enger Grenzen fiir die Entscheidung bezuglich der Einhaltung einer Spezifikation. Anmerkung 2: In den Fallen, wo ein bekanntes Priifverfahren die Grenzwerte der Hauptquellen der MeRunsicherheit und die Form der Darlegung des berechneten Ergebnisses festgelegt hat, wird angenommen, daB das Laboratorium diesen Abschnitt der Internationalen Norm durch Befolgen der Festlegungen fur die Priifmethode und die Form des Prufberichtes erfullt hat (siehe 5.10).
5.4.6.3 Bei der Schatzung der MeBunsicherheit mussen alle Unsicherheitskomponenten, die fiir den betreffenden Fall von Bedeutung sind, in Betracht gezogen werden, wobei angemessene Auswertungsverfahren zu verwenden sind. Anmerkung I : Zu den Quellen, die zur Unsicherheit beitragen, gehoren unter anderem die verwendeten Bezugsnormale und das venvendete Referenmmterial, benutzte Verfahren und Einrichtungen, Umgebungsbedingungen, Eigenschaften und Zustand des zu priifenden oder zu kalibrierenden Gegenstandes und das Bedienungspersonal. Anmerkung 2: Das voraussichtliche Langzeitverhalten des zu prufenden undoder zu kalibrierenden Gegenstandes wird ublicherweise bei der Schatzung der MeRunsicherheit nicht berucksichtigt. Anmerkung 3: Weitere Informationen sind in den Normen der Reihe I S 0 5725 und in dem ,,Guide to the expression of uncertainty in measurement" enthalten (siehe Literaturhinweise)." Kommentare zum Entwurf - Die fur diese Textlange relativ haufige Anzahl von Passagen zurn Therna zielgerichtete
Validierung
8
I Griiridsiit,-e der kilidierung in dc,r Antrlytik itrid ini Priifivesen ,, . . . fur einen
speziellen beabsichtigten Gebrauch ..."
,. . .. mussen den Erfordernissen des Kunden entsprechen . .."
., . . . da13 die Erfordernisse des Kunden noch immer erfullt werden
. . ."
zeugen von einer Praxisniihe und einer wesentlich stLkeren Kundenorientierung im Vergleich zu alteren Texten. Das ist eine erfreuliche Entwicklung. Es gilt jetzt diesen Geist im Alltag zu leben. - Folgende, eindeutige Aussage schafft Klarheit: Genormte Verfahren mussen nicht validiert werden. Ob allerdings stets darauf verzichtet werden kann, wenn es tatskhlich um Wahrheitsfindung geht, sollte individuell entschieden werden. - Die Schritte einer Validierung sollten folgende sein: Beschreibung der Anforderungen Findung und Bestimmung von aussagefiihigen Verfahrensmerkmalen Vergleich der Anforderungen mit den erhaltenen Werten der Verfahrensmerkmale JdNein-Aussage uber die Eignung der Methode fur den vorgesehenen Gebrauch. Folgende Passage zeugt von einer Kenntnis der Situation im Labor und kann als Entgegenkommen gegenuber den analytischen Laboratorien bewertet werden: ,,In vielen Fiilen konnen der Bereich und die Unsicherheit der Werte (. . .) mangels Information nur in wreinjuchter Weise angegeben werden." Erfreulicherweise erfahren durch die Erwiihnung erstmals in dieser Norm und in diesem Zusammenhang die Probenahme und der Transport den ihnen gebuhrenden Stellenwert. Die Anforderung, da13 das Laboratorium die Ergebnisse und verwendeten Verfahren aufzeichnen md3, bekraftigt das tatsachliche Ziel bei einer Validierung: Der Validierer mu13 Aussagen machen und nicht lediglich Zahlen/Daten erzeugen. Dem erfahrenen Leser fallt beim Aufzlhlen von erreichbaren Werten zweierlei auf: Die klassischen, wichtigen Elemente ,,Richtigkeit" und ,,Prazision" fehlen, dafur taucht ,,Ergebnisunsicherheit" auf. Hier wird die Auffassung der Verfasser offenkundig: Es ist ein Pliidoyer fur die Ermittlung bzw. Schiitzung der ,,Ergebnisunsicherheit" als ubergeordnetes Merkmal, das geeignet ist, die tatsachliche Streuung von Werten (zufiillige Abweichungen = Prazision, systematische Abweichungen = Richtigkeit) zu beschreiben und einen realen Vertrauensbereich anzugeben (siehe Ausfuhrungen weiter unten und in Abschnitt 3.4.3).Systematische und zufallige Fehler sind nur Beitrage zur Gesamtunsicherheit der Ergebnisse. Eine Unterscheidung in systematischen und zufiilligen Fehlern ist nicht notwendig. Es wird die ,,Nachweisgrenze", nicht jedoch die ,,Bestimmungsgrenze" erwiihnt. Auf Anfrage von S. Kromidas wurde folgendes als plausibler Grund fur den Verzicht genannt: Ein Nicht-Naturwissenschaftler kann mit dem Begriff Nachweisgrenze umgehen, eine klare Abgrenzung zur Bestimmungsgrenze ist nicht trivial. Dies wurde in einer Reihe von juristischen Auseinandersetzungen deutlich. Der Verzicht auf ,,Bestimmungsgrenze" kann fachlich wie folgt begrundet werden: Bestimmungsgrenze ist letzten Endes nichts mehr als eine erweiterte MeBunsicherhheit.
-
I .2 Definition, Erlauterung und Komrnentierung
9
Deswegen ist - ubrigens in Ubereinstimmung mit IS0 1 1843- 1, siehe Abschnitt 3.2. I die Benutzung des Begriffes ,,Bestimmungsgrenze" expressis verbis nicht notwendig. Die Ausfuhrungen im Entwurf von IS0 17025 kommen der Praxis sehr nahe und sind daher praktikabel. Zwei wichtige Forderungen werden leider nicht envahnt: Die Methodenstabilitat und die Methodenfahigkeit. Die Methodenstabilitat beschreibt die Abhangigkeit eines Ergebnisses von der Zeit bei Anwendung der konkreten Methode unter realen Bedingungen. Es geht um die Streuung von Ergebnissen, wenn alle relevanten Faktoren im realen Routinealltag wirksam sind und nicht nur wahrend der relativ kurzen Zeit der Validierungstatigkeit. Die Praxis zeigt immer wieder, dall die Nichtbeachtung dieses Aspektes zu unnotigen Differenzen zwischen Validierer und Routineanwender und zu erheblichen Kosten fuhrt. Das Wort ,,kontinuierlich" aus der FDA-Definition wurde hier schon ausreichen, um die Aufmerksamkeit auf diesen wichtigen Punkt zu lenken. Es ist zu hoffen, daB in einer kommenden Revision die Methodenstabilitat als gleichwertiger Validierungsparameter Zugang in den Normentext findet. Auch die Methodenfahigkeit verdient mehr Beachtung. Nur so besteht die Chance, daB bei der Festlegung von Spezifikationen analytische Realitaten beriicksichtigt werden, s. Abschnitt 3.11 und 5.2. Vor dem Versuch einer Zusammenfassung werden sieben Validierungsthesen fur die Analytik vorgestellt. Diese lehnen sich an die sieben Validierungsthesen fur die Herstellpraxis nach Sucker [ 11 an: -
-
-
Validierung ist ein Arbeitsinstrument zur Qualitatssicherung neben anderen wie z. B. SPC (Statistische ProzeBkontrolle). Validierung ist produkt- und zweckspezifisch auszufuhren. Die Verantwortung uber AusmaB und Art liegt beim Analytiker. Validierung heiBt, das Notwendige zu tun, aber eine Eskalation zu vermeiden. Alle kritischen KenngroBen der Methode mussen validiert werden, aber nicht wahl- und kritiklos alle. Methodenvalidierung beginnt am besten beim Endergebnis und geht im Analysenablauf bis zum ersten Schritt zuruck. Validierung kann nicht durch Abhaken von Resultaten mittels Checkliste erfolgen. Eine fehlerfreie Analytik (,,wahrer Wert") gibt es nicht. Nach Moglichkeit sind die statistische Relevanz und damit die MeBunsicherheit zu ermitteln. Fur validierte Methoden sind Art und Haufigkeit der notwendigen Kontrollen festzulegen mit dem Ziel, den Gesamtanalysenaufwand zu minimieren, aber dennoch die erforderliche Ergebnissicherheit zu erzielen.
Resume' und Kommentar Die Definition der I S 0 Norm 17025: 2000 la& dem Analytiker nahezu alle Freiheiten, wenn er nur erstens weil3, was er will (,,besonderen Forderungen fur einen speziellen, beabsichtigten Gebrauch") und zweitens in der Lage ist, eine fachgerechte Durchfuhrung zu garantieren, d. h. wenn er einen ,,objektiven Nachweis" liefert.
10
I tirirticl.tiit:e di>r Kilidierung in der Anulytik und
itn
Prufwsen
Betnerkung: In der Norm 17025 fehlt im Vergleich zu IS0 8402 das Wort ,,objektiv".
Die drei wichtigen Elemente der ISO-Definition sind: -
Untersuchung: Nachweis: beabsichtigter Gebrauch:
Es sind Fakten gefragt Es geht um nachvollziehbare Kriterien Validierung ist eine zielgerichtete Prufung
Wird n u n die ISO-Definition 8402 bzw. die neue aus der Norm 17025 zu Grunde gelegt, so wird dem Validierer - jedenfalls aus analytischer Sicht - kaum ein grober Fehler unterlaufen, wenn er folgende Voraussetzungen erfiillt: Eindeutig detinieren, was mit der Methode beabsichtigt ist. Festlegen, was und wie gepruft werden SOH. Aus den ermittelten Zahlen Aussagen beziiglich Methodeneignung treffen. - Alle Daten, die zu den gemachten Aussagen fiihren, dokumentieren. -
-
Die Realitat sieht manchmal allerdings so aus, daB der Kontrollierende einer Institution/ Behiirde stur nach einer Validierungs-Checkliste vorgeht. Sind vom Validierer die in der Liste aufgefuhrten Validierungselemente abgearbeitet, so ist die Validierung erfolgt, ansonsten nicht. Zu diesem Handicap siehe Abschnitt 7. Wir schliel3en die Diskussion uber das, was unter Validierung manchmal verstanden wird, mit einigen Zitaten ab. Diese stammen aus Schriften fiihrender Gerltehersteller und zeigen, daB immer wieder meist unwissentlich viillig verzerrte Bilder von der Validierung gegeben werden. I . Aus einer Produktmitteilung eines Geriiteherstellers A: ,,Ein GroJteil der HPLC-Anwendrr ist heute den sogenunnten GLP-Richtlinien untemwfen. Behiirden wie BGA oder FDA verlungen die Vulidierung einer Analysenrnethode. Zusiitzlich miissen ulle Anu!\senrrgehni.s.se permunent uufEi~ihultungder Vufidierungsgrenzen iiherpruft werden. 2. Aus einer Kundenschrift eines Gerateherstellers B: ,,Unter Validierung wird die (regelrnusige) Uherprufurig der Grnauigkrit eines MeJgerates wrstanden ... '* 3. Aus einer Produktmitteilung eines Gerlteherstellers C: ,,Die Beurteilung des Dosiergeriitt1.s ... Nur rrmn ulle clrei Werte innerhalb der fe.stgelegten Bereiche liegen, hut dus Dosiersystetn die Kilidierung erfolgreich hestanden. "
"
Kornrnenture Zu 1 : a) Nur ca. 5 c/o der HPLC-Bestimmungen sind GLP-pflichtig.
b) Validierung ist keine GLP-Forderung. c) Es gibt keine .,Validierungsgrenzen" sondern Spezifikationsgrenzen bzw. Methodenfihigkeitsindices,siehe Abschnitt 3.1 1. Zu 2: Beschriebenes Procedere entspricht nicht einer Validierung sondern (vermutlich) der Uberpriifung der MeBprazision und eventuell einer Kalibrierung. Zu 3: Beim Dosiersystem handelt es sich nicht um Validierung sondern um Verifizierung, siehe unten.
1.2 Definition,Erliiirterunq
irnd
Kotiiriieritir~irr~,q
II
I .2.2 Verifizierung Definition gemaB IS0 8402: 1994, (i 2.17: ,,Bostiitigen uufgrund einer Untersuchung und durch Bereitstc~llungeines obiektiwi Nuchweises. rluJ festgelegte Forderungen erjiiillt worden sind." Die Normenbegriffe fur Validierung und Verifizierung unterscheiden sich nur geringfugig. Die ,,besonderen Forderungen fur einen speziellen beabsichtigten Gebrauch" in der Definition der Vahdierung werden bei der Verifizierung durch die ,,festgelegten Forderungen" ercetzt. Auf diesen Unterschied werden wir weiter unten noch einmal eingehen.
1.2.3 Qualifizierung bzw. Qualifikation Dieser Begriff wird leider fur zwei unterschiedliche Tatbestiinde benutzt: I . Nach dem Deutschen Arzneibuch: DAB 9, Band I , 1992, S. 747-748 ,,Validierung von Sterilisationsprozessen" wird folgende Definition verwendet: Als Qualifikation vvircljener Trilabschnitt der Kilidierirng he=eichtiet, der sich, ohne Beriicksichtigung des Sterilisiergutes. nur mit der Fiinktionstiic.htigkeit des Sterilisutors be$lfit. Hierzu gehiiren w r mlleni Eichung und Koritrolle drrpli~.~ikulischet~ M<Ji'iristrirtnente vvie z. B. Tlierrnorneter; Tlierniofiihler; Matiorneter 11. u. '' und 2. GemiiR IS0 8402,1994, (i 2.13, ,,Qualifizierungsprozess" und IS0 8402, 1994, (i 2.14 ,,Qualifizierung" bzw. ,,qualifiziert: Der Begriff QualifizierungsprozeR gema0 I S 0 8402, 1994, 5 2.13 wird beschrieben als ,,ProzeB zur Darlegung, ob eine Einheit zur Erfullung der festgelegten Qualitltsforderung fiihig ist." Der Begriff Qualifizierung gem80 IS0 8402,1994, (i 2.14 lautet: ,,Stutir.s einer Einh~it, bt*erFriihre Fiihigkeit :ur Eijiillung der-festgelegtm Qiitilitiit.s#~)rderiiiig durgelegt vvirr& ". 1,
Kotnmo i i tu r Im Labor handelt es sich bei der Qualifizierung um die formale Feststehng, daR das f u r eine bestimmte Messung vorgesehene Verfahren voraussichtlich geeignet ist, den Qualitiitsforderungen des Auftraggebers zu genugen. Aus der Sicht der Qualitatssicherung erfolgt der Qualitizierungsprozess im Rahmen der Vertragsprufung. Dieser sol1 dem Auftraggeber bestiitigen, dal3 das Labor uber ein Prufverfahren verfugt und es entsprechend beherrscht und so seine Erwartungen erfullen kann.
Be isp ie Ie Nachfolgend wird versucht, die Begriffe Validierung, Verifizierung und Qualifizierung (nach DAB) am Beispiel der HPLC zu erliiutern: QualifiLierung:
Uberpriifung der Geratespezifikationen - ohne Eluent und Probe Erreicht die Lampenenergie de\ Detektors einen beatimmten Wert? - 1st im gexamten MeBbereich des Siiulenofen\ die vom Hersteller atigegebene Temperaturkonstanz von 0. I ' C erreichbar?
-
Veriti;lierung:
Prufung auf HPLC typische Forderungen Erreicht der Detektor mit MeOH 31s Eluent bei einer Durchlaufgeschwindigkeit von 1 ml/min und einer Detehtionwellenl~ingevon 254 nm ein fur die HPLC ubliches Basislinienrauschen 0.04 inAU? - 1st die Systempriizision, gemessen mit MeOH als Eluent iind eineni unkritischen Testgemisch, kleiner 1 %'? -
Validieriing:
Eignung der vorliegenden HPLC-Methode f u r ein bestiinmtes Trennproblem - Tensidanalytik mit lonenaustauscher: wird mit vet-diinnter SchwefelsYure (eine andere Viskositiit als der fur Geriitetests ubliche Eluent MeOH!) und realen Feuerloschmittel-Proben die geforderte PrYzisio n von 2 5% erreicht'? - Trennung von Phosphorlipiden: welche Nachweisgren/.e wird erreicht bei einer Detektionswellenlange von 200 nm mit einer Diolphase und einem Chloroform/Methanol Eluenten?"
Zusainmenfassend ist festzuhalten, dal3 bei der Veritizieriing die Anlage auf die voin Hersteller angegebenen bzw. von der HPLC-Gemeinschaft erwarteten SpeLitikationen gepruft wird. D. h., es handelt sich um eine Uberprufung einer allgemein formulierten Qualitiitsforderung. Bei der Qualitiyierung (nach DAB) geht es um die Uberprufung technischer Werte. also letrten Endes uin das Ablesen von Widerstinden und Spannungswerten der nicht in Betrieb befi nd I ic hen An 1age. Bei der Validierung liegt der Schwerpunkt auf der Frage. ob eine Trennung init dieser Apparatur den von dein Kunden bzw. der Behiirde festgelegten/erwarteten Q u 1', I 'Ititsmerkmalen entspricht. D. h., hier handelt es sich um eine anwendungsbezogene Prufung. In der Praxis wird oft zwischen Verifizierung und Qualitizierung einer Anlage nicht iinterschieden. eine Tatsache, die sicherlich nicht ins Gewicht fYllt. Ziir Qualifizierung einer Anlage siehe Abschnitt 2.3. DaO die Verwendung mehrerer, iihnlicher Begriffe offensichtlich eher fiir Verwirrung denn fiir KlYrung sorgt x i g t folgende Tatsache: Beim DAR (Deutscher Akkreditierungs Rat) wurde im AusschuB Technische Fragen (ATF) erwogen, den Begriff .,verification" generell ails nllen Punkten zu entfernen, urn MiBverstiindnissen vorzubeugen.
1.2.4 Charakterisierung In der Norm IS0 8402: 1994 wird dieser Begriff nicht genannt. Charakteriaiert wird eine Methode, indem man die Werte fiir ihre charakteristischen Kenngriissen ermittelt. Die Werte dieser Kenngrossen sind die Leistunga- oder Verfahrens~nerkmalswerteder untersuchten Methode. Sie dienen zur AbschYtmng der Unaicherheiten von Ergebnissen. die mit dieser Methode erzielt werden kiinnen. Die Charakterisierung erfal3t allerdings nicht nur die spezifischen Eigenheiten der Methode selber, sondern auch alle wesentlichen spezifischen Eintluase, die in .jeneiii Labor
1.2 Definition, Erliiuterirng und Kommentierrtng
13
wirksam sind und zur Unsicherheit des Ergebnisses beitragen konnen. Diese Einfliisse sind z. B.: Die Eigenheiten jener Personen, welche die Methode im gegebenen Labor anwenden; d. h. die praktische Erfahrung und Fertigkeit dieser Personen im Umgang mit der Methode, ebenso ihr theoretisches Wissen uber die Hintergrunde der Methode, aber auch ,,ihre Tagesform" bei der Durchfuhrung der Arbeiten. - Die aul3eren laborspezifischen Einflusse wie z. B.: Temperatur, Feuchtigkeit, Luftdruck, Erschutterungen. Verunreinigungen von Wasser, Luft und technischen Gasen etc., verursacht durch Partikel, Bakterien, Sporen, Pilze und andere Fremdsubstanzen, elektromagnetische Felder, Strahlungen jeglicher Art, Spannungsschwankungen im elektrischen Versorgungsnetz. - Die inneren fur das Versuchsobjekt spezifischen Einfliisse, d. h. Einflusse der Matrix wie z. B. Kornigkeit und Inhomogenitat, die chemische Zusammensetzung von Gemischen, die physikalisch-chemische Aktivitat von Beimengungen in den untersuchten Proben, z. B. auf die Oberflachenaktivitat. -
Als wesentlich sollten jene Einflusse gelten, welche das Ergebnis der Messung iiber das tolerierbare Ma13 hinaus beeinflussen konnen, insbesondere jene, welche die Unsicherheit der Gesamtergebnisse uber die zulassigen Grenzen des Vertrauensbereiches einer bestimmten Kenngrosse vergroBern kiinnen. Falls sich die Frage stellt, wie reprasentativ die Ergebnisse der im Labor untersuchten Proben fur jene Gesamtheit sind, so mussen bei der Charakterisierung der Methode weitere Einflusse auf das Gesamtergebnis untersucht bzw. abgeschatzt werden, namlich: Die laborexternen Einflusse auf das Gesamtergebnis wie z. B. die Reprasentativitat des Probenahmeortes, des Probenumfangs, der Probenahmedauer, der Probenmenge. Zu berucksichtigen ist ebenfalls die Moglichkeit wesentlicher Probenveranderung wlhrend des Transportes ins Labor. Um eine Methode genau charakterisieren zu konnen, miissen die ermittelten Ergebnisse uber einen llngeren Zeitraum verfolgt werden (Methodenstabil itat).
1.2.5 Messen, Prufen, Justieren, Kalibrieren, Eichen In der analytischen Qualitatssicherung bzw. generell im Priifwesen sind eine Reihe von Tiitigkeiten notwendig. Diese werden vor (Eichen, Justieren, Kalibrieren), wuhrend (Messen) und nuch Ende dervalidierung (Priifen) ausgefuhrt. Tabelle 1-2 gibt die DIN-Definitionen und zur Veranschaulichung je ein Beispiel wieder [ 21.
14
I Grundsatze der Vulidierung in der Anulytik und im Pruffivesen
Tab. 1-2 Grundbegriffe der MeBtechnik. Begriff
Definition nach DIN 13 19 T. 1
Beispiel (Chromatographie)
Messen
Messen ist der experimentelle Vorgang, durch den ein spezieller Wert einer physikalischen GroBe als Vielfaches cincr Einheit oder eincs Bezugswertes ermittclt wird.
Die Retentionszeit eines Peaks wird mit 8 min gemessen.
Prufen
Prufen heiRt feststellen, ob der Priifgegenstand cine oder mehrere vorgcgebene Bedingungcn erfullt.Mit dem Prufen ist daher immer der Vergleich mit vorgcgebenen Bedingungen verbunden. Anmerkung: Prufgegenstund knnn sowohl die Probe a1.y uuc/z dci,y Mejjgeruf sein!
Funktionsprufung des Chromatographen durch Auftrennung ciner Testmischung und Freigabe odcr Sperrung oder
Justieren (Abgleichcn)
Justieren im Bereich der MeBtechnik heiBt. ein MeRgerat so einstellen oder abgleichen, daB die MeBabweichungen moglichst klcin werden oder daR die Betrage der MeBabweichungen die Fehlergrenzen nicht uberschreiten. Das Justieren erfordert also einen Eingriff, der das MeBgerat oder die MaRverkorperung meist bleibend verandert
Abgleichen der FluBrate mittels Potentiometer, so daR die cingestclltc FluBrate mit der gemessenen ubereinstimmt.
Kalibrieren (Einmessen)
im Bereich der MeBtechnik heist, die MeBabweichungen am fertigen MeBgerat feststcllen. Beim Kalibricrcn erfolgt kcin technischer Eingriff am MeBgerat. Anmerkung: Kulibrieren kann sich s o wohl uufdie Festlegung des Mejkusummenhangs als uuch czufdessen Uberpriifung beziehen.
Fcststellen des MeBzusammenhangs zwischen Signal und Konzentration (Aufstellen dcr Kalibrierfunktion)
Das Eichen eines MeBgerates umfaBt die von der zustandigen Eichbehorde nach den Eichvorschriften vorzunehmenden Prufungen und die Stcmpelung. Anmerkung: An die Stelle der Eichbehiirde kunri (iuch eine Stelle treten, der die Eichhefiignis iibertrcigen wurde.
Eichung der fur die Substanzeinwaage verwendeten Analysenwaage
Eichen
Prufung einer Charge auf k e n Wirkstoffgehalt und Vergleich mit Spezifikationsforderungen.
oder Uberprufung, ob der zuvor fcstgclegte MeBzusanimenhang noch gultig ist (Uberprufen dcr Kalibrierfunktion)
1.3 Gritndvoruusset,-rtrlgenf u r die Vrrlidierung einer cinciljtisdien Methock
1.3
15
Grundvoraussetzungen fur die Validierung einer analytischen Methode
Es ist unbestritten, daD nur fachlich kompetente Laboratorien imstande sind, analytische Methoden zu validieren. Wichtig ist dabei, dalj das Verstandnis fur die Validierung, die Auslegung der Normenbegriffe und fur die sich daraus ergebenden Forderungen in der Laborpraxis vereinheitlicht, harmonisiert und pragmatisch angelegt werden. Aus der oben formulierten Auslegung des Begriffes Validierung ergeben sich fur die Laborpraxis folgende Forderungen: 1. Der vom Labor zu erfiillende Auftrag mu13 so weit beschrieben sein, daR sich daraus die an die analytische Methode zu stellenden Leistungsforderungen klar und eindeutig ableiten lassen. 2. Die ublichen Leistungsmerkmalswerte der analytischen Methode mussen als Werte der benotigten charakteristischen KenngroDen bekannt oder zu ermitteln sein. Die Methode mu8 schriftlich fixiert vorliegen; sie sollte neben Angaben wie Methoden- und Einstellparameter, Art und Giite der eingesetzten Chemikalien usw. bei Bedarf auch folgende Angaben enthalten: Probenahme, Probenkonservierung, Probentransport, Probenvorbereitung, Sequenzaufbau bei der Messung, Arbeitsbereich usw. 1st eine der beiden Forderungen nicht erfullt, so ist die Durchfuhrung einer Validierung nicht moglich. 3. In einem Labor mit einem Qualitatsmanagement-System sollte die Erfullung der in den Punkten 1 und 2 genannten Voraussetzungen und die Uberprufung der Machbarkeit zwingender Bestandteil der Vertragsuberprufung sein. Damit die obigen Forderungen erfullt werden konnen, mu8 das Labor zumindest ein fur die Auftragserfullung genugend zahlreiches, fachlich qualifiziertes Personal zur Verfugung stellen, eine Leitung haben, welche die Fuhrungsaufgaben verantwortlich wahrnimmt, uber angemessene Raumlichkeiten, Infrastruktur und Hilfsmittel und uber die benotigten Einrichtungen zur Messung, Analyse undloder Priifung verfugen. Weiterhin mulj es die fur den Auftrag erforderlichen Verfahren und Methoden so weit beherrschen, daB das dem Auftraggeber zugesicherte Qualititsniveau der vereinbarten Dienstleistung sichergestellt ist. Nach bisherigen Erfahrungen ist es uberdies vorteilhaft, wenn das Labor ein zweckmaRiges( !) Qualitltsmanagement und ein angemessenes Qualitatssicherungs-System betreibt, welches gewlhrleistet, daR die Qualifikation des Personals, die Laborausrustung und Verfahrensbeherrschung laufend den jeweiligen Bedingungen angepaBt werden. Fragen der ausreichenden Personalqualifikation undoder der angemessenen und zweckm3Digen Ausrustung von Laboratorien, die bei der Durchfuhrung von Validierungen in jedem Fall bedeutsam sind, werden in diesem Buch weiter nicht behandelt (siehe dazu 13,411.
1.4
Die Unsicherheit der Ergebnisse von Messungen, Prufungen und Analysen
Jeder MeClwert ist mit einer M~~~~rtri.sic.hrrhrit behaftet. Obwohl trivial. werfen wir nun doch einen Blick aufden Unterschied zwischen physikalischen und chemischen Messungen. Bei physikalischen Messungen ist der MeDwert unabhiingig vom MeBobjekt: Ich messe eine Strecke von 2,5 m, egal ob es sich um eine Latte handelt. einen Baum oder die lichte Hiihe in meinem Buro. Die MeBunsicherheit beschriinkt sich auf den Mel.(vorgang/die Messung selbst. Bei chemischen Verfahren stellt die Probe die .,Materialisierung" des analytischen Problems dar. Sie selbst ist die grol3e Unbekannte: Von der Probenahme bis zur Auswertung niit Hilfe von ReferenLen kiinnen eine Reihe MeRunsicherheiten das Ergebnis beeinflussen. Bereits jetzt kiinnen wir folgendes festhalten: -
-
Je mehr ,,Chemie" eine Methode enthiilt, um so aufwendiger ist die Vnlidierung. 1st .,Physik" dominant, reicht oft eine Kalibrierung ;IUS. Es ist eminent wichtig fur ISK (in statistischer Kontrolle) -Prozesse 7 u sorgen, bei denen der unbekannte Anteil der Menunsicherheit xu vernachlassigen ist.
N u n zu den Definitionen: Im I S 0 ,,Guide to the Expression of Uncertainty in Measurement" (GUM) von 199.3 sowie in der Revision von 1995 heiRt es zur Unsicherheit: ,.Die Unsicherheit des Ergebnisses einer Messung reflektiert den Mangel an einem genauen Wissen uber den Wert der MeRgriiOe. Das Ergebnis einer Messung 1st auch nach der Korrektur einer erkannten systematischen Einwirkung (effect) immer noch eine Schiitmng des Wertes der Mel3groRe infolge der Unsicherheit. die sich aus der Beeintlussung durch zufiillige Einwirkungen und aus der unvollstiindigen Korrektur des Ergebnisses bezuglich der systematischen Einwirkung ergibt.
Hinweis Das Ergebnis einer Messung kann (nach Korrektur) unwissentlich sehr nahe beiin Wert der MeBgriiRe liegen (und dem zufolge einen vernachliissigbaren Fehler beinhalten) und dennoch kann es eine groCje Unsicherheit haben; daher sollte die Unsicherheit einer Messung nicht mit dem verbleibenden Fehler verwechselt werden". Mit .,verbleibender Fehler" ist wohl die verbleibende systematische Abweichung des MePergebnisses gemeint. Im GUM heiMt es weiter:
..In der Praxis sind viele Ursachen der MeRunsicherheit miiglich, dazu gehoren: a ) Fehlerhafte Annahme des Analyten (solvatisiert, Dissoziationsgrad. als Hydrochlorid vorliegend? usw.) b) Cross-Kontamination oder kontaminierte Reagenzien bzw. kontaininierte Leerproben. c) N icht repriisentative Probenahme; d) Ungenugendes Wissen uber die Auswirkungen der Umweltbedingungen auf die Messung oder eine ungenugende Messung der Umweltbedingungen,
1.5 Methoden Zur Chnrrrkterisierung voii cmcilytischen Metliockn
17
e) Ablesefehler einer analogen Anzeige durch die messende Person, f) begrenzte Auflosung oder Nachweisgrenze des Instruments, g) ungenaue Werte der Meastandards und des Referenzmaterials, h ) ungenaue Werte von Konstanten und anderen Parametern, die aus externen Quellen stammen und in den Algorithmen zur MeBwert-Reduktion verwendet wurden, i) Annlherungen und Annahmen, die in die MeBmethode bzw. -prozedur aufgenommen wurden, J ) Schwankungen bei den wiederholten Beobachtungen der MeBgroBe bei scheinbar konstanten Bedingungen. Diese Ursachen sind nicht unbedingt unabhlngig von einander, einige der Ursachen von a) his i ) konnen die Ursache J ) beeinflussen. Eine nicht erkannte systematische Einwirkung kann bei der Abschatzung der Unsicherheit des MeBergebnisses natiirlich nicht berucksichtigt werden, obwohl sie zu dessen Fehler beitriigt". Eine Reihe von Dokumenten (BIPM, IEC/IFCC/ISO/uPAC/IUPAP,OIML) definieren MeRunsicherheit als: ,,Parameter, der die Streuung der Werte kennzeichnet, die eigentlich der MeRgroBe zugeordnet werden konnten.
Anmerkungen I . Der Parameter kann beispielsweise eine Standardabweichung (oder ein gegebenes Vielfaches davon), oder die halbe Weite eines Bereiches sein, der ein festgelegtes Vertrauensniveau hat. 2. MeBunsicherheit enthalt im allgemeinen viele Komponenten. Einige dieser Komponenten konnen aus der statistischen Verteilung der Ergebnisse einer MeBreihe ermittelt und durch empirische Standardabweichungen charakterisiert werden. Die anderen Komponenten, die ebenfalls durch Standardabweichungen charakterisiert werden konnen, werden aus angenommenen Wahrscheinlichkeitsverteilungenermittelt, die sich auf Erfahrung oder andere Informationen grunden. 3. Es wird vorausgesetzt, daB das Meaergebnis der beste Schiitzwert fur den Wert der MeBgroBe ist, und daB alle Komponenten der Unsicherheit zur Streuung beitragen, eingeschlossen diejenigen, welche von systematischen Einwirkungen herriihren, z. B. solche, die von Korrektionen und Bezugsnormalen stammen". Naheres zur Me& und Ergebnisunsicherheit findet sich in Abschnitt 3.4.3.
1.5
Methoden zur Charakterisierung von analytischen Methoden
Die Forderung, dab Laboratorien nur solche Verfahren anwenden durfen, die fur den vorgesehenen Gebrauch tatsachlich geeignet sind, bedeutet, daB der vorgesehene Gebrauch klar
18
I Grundsatze der klidierung in der Analytik und im Prufwesen
beschrieben sein muB und die sich aus der beabsichtigten Anwendung ergebenden besonderen Forderungen spezifizieit sind. Erst an solchen Spezifikationen la& sich ermessen, wie weit die Eignungspriifung (Validiemng) gehen muB, damit der Aufwand in einer zweckmarjigen Relation zu den Bedurfnissen des Auftraggebers steht. Fur die Laborpraxis ist dabei bedeutsam, darj es dem Labor freigestellt bleibt, die fur einen bestimmten Anwendungsbereich typischen Forderungen und Spezifikationen auf Gmnd der eigenen Erkenntnisse und Erfahrungen nach bisherigen Kundenwunschen zu formulieren, womit eine Validierung a priori moglich wird, d. h. schon bevor ein neuer Kunde auftritt. Bei einem solchen Vorgehen bleibt dem Labor die Aufgabe zu uberpriifen, ob das (vorvalidierte) Verfahren auch fur den ganz konkreten Auftrag ebenfalls geeignet ist. Die nachfolgenden Beispiele zeigen, wie die Charakterisierung eines Priif- bzw. Kalibrierverfahrens durchgefiihrt werden kann, sofern die oben genannten Vorbedingungen erfullt sind. Die bei der Charaktersierung eines Pruf- bzw. Kalibrierverfahrens ermittelten Daten sind statistisch zu bearbeiten gemaB den Empfehlungen des I S 0 ,,Guide to the Expression of Uncertainty in Measurement", second version, 1995. In dieser ISO-Richtlinie wird zwischen zwei Methoden zur Bestimmung der Unsicherheit von Prufergebnissen wie folgt unterschieden: -
-
Methoden des Typs A stutzen sich auf die Schiitzung der Unsicherheit von Messungen mit Hilfe statistischer Verfahren auf der Grundlage experimentell ermittelter Daten. Methoden des Typs B sind Schatzverfahren auf der Grundlage anderweitiger Informationen, 2. B. von Erfahrungswerten.
Die fur die verschiedenen Verfahrensstufen geschatzten MeBunsicherheiten werden gemlB den Regeln des Gesetzes uber die Fehlerfortpflanzung als Varianzen kombiniert. Bei Priifungen darf man erfahrungsgemao in den meisten Flllen die individuellen Beitrage der einzelnen Verfahrensstufen an die Gesamtunsicherheit als unabhlngig voneinander und als normalverteilt betrachten. Nur in Ausnahmefallen. wenn namlich eine Korrelation zwischen zwei oder mehreren Verfahrensstufen vorliegen sollte, ist gemas den Regeln der Kovarianzanalyse zu verfahren.
1.5.1 Die Charakterisierungsmethoden Es lassen sich mehrere Methoden zur Charakterisierung von Pruf- bzw. MeBverfahren anwenden . Sie unterscheiden sich durch die anzuwendende Verfahrensweise, durch die Art (zufallige Abweichungen, systematische Abweichungen, Gesamtabweichungen) und den Erfassungsgrad (Vollstandigkeitsgrad mit dem das Verfahren bei der Schiitzung erfaBt wird) der geschatzten Unsicherheit der Ergebnisse. Alle hier vorgestellten Methoden der Char&terisierung haben ihren praktischen Wert und sollten dem gegebenen Sachverhalt und den Moglichkeiten entsprechend und unter Berucksichtigung der spezifischen Bedurfnisse gewahlt werden.
1.5 Metliodrri ;.ur Chitrctktrri.sirriiri,~1'on iinrilytischcri Mrthoden
19
1.5.1.1 Erste Charakterisierungsmethode Systematische Beurteilung der Faktoren, die das analytische Ergebnis beeinflussen konnen Bei dieser Methode werden alle relevante Parameter (Einfluljgroljen) der Methode systematisch variiert und deren EinfluB auf das Ergebnis quantifiziert. Diese Charaktersisierungsmethode ist immer dann zweckmaljig oder einzig rnoglich, wenn dem Messenden gesicherte Referenzen nicht zur Verfugung stehen. Dies ist oft bei der Analyse von unbekannten Proben und bei der Anwendung von Prufverfahren der Fall. die sich lediglich auf Meljkonventionen (,,Kochrezepte") stutzen. Zu typischen iiuljeren Einflussen, welche analytischen Pruf- bzw. Meljergebnisse beeintlussen konnen, gehoren beispielsweise: Temperatur, Strahlungen, Luftfeuchte, Luftdruck, Luftfremdstoffe, Spannung des elektrischen Stroms, Magnetfelder oder mechanische Erschutterungen. Zu inneren Einflussen gehoren z. B. Inhomogenitlt, bzw. Verunreinigungen des MeRobjekts oder Bestandteile einer untersuchten Substanz, die ein Gemisch aus verschiedenen Stoffen darstellt (Matrixeffekte).
Kommentur Diese Charakterisierungsmethode kann praktisch unbegrenzt, d. h. in allen Bereichen des Priifwesens, verwendet werden und hat insoweit eine nahezu universelle Anwendungsmoglichkeit. Zu den Ergehnissen der ersten Churakterisierungsmethode
Die mit Hilfe der ersten Charakterisierungsmethode erhaltenen Ergebnisse sind Schitzwerte fur die zufiilligen Abweichungen der Unsicherheiten der Ergebnisse von Analysen bzw. Messungen. Sie sind fur das untersuchte analytische Verfahren charakteristisch und sind bei Einhaltung gleichbleibender Wiederholbedingungen als eine VerfahrenskenngriiOe des validierenden Labors anzusehen. Die so ermittelten Kenngroljen besagen indessen nichts uber die Richtigkeit der mit diesem analytischen Verfahren gewonnenen Ergebnisse, d. h. dalj in diesem Fall die systematische Abweichung vom richtigen Ergebnis unbekannt bleibt.
1.5.1.2 Zweite Charakterisierungsmethode Kalibrierung mit Referenznormalen/Referenzmaterialienund gleichzeitige Untersuchung der EinfluRgroljen Wird eine Kalibrierung zugleich zur Charakterisierung eines MeRverfahrens verwendet, so mulj sie durch eine systematische Untersuchung der Einflusse auf das Kalibrier- bzw. Me& ergebnis - gem213 der oben geschilderte ersten Charakterisierungsmethode - erganzt werden. Die zur Kalibrierung verwendeten Referenzen mussen dabei bezuglich Art und Grolje der durch sie dargestellten Merkmalswerte den zu messenden Prufobjekten entsprechen. AuRerdem sind die Werte jener Einflusse systematisch zu untersuchen, welche das Kalibrierbzw. Meljergebnis merklich, d. h. uber das zulassige Ma13 hinaus, beeinflussen konnen.
KonimrritorWi rd beisp ie I s we ise de r Ei n tl u B de r A i i Ren tern peratur fur eine n best i in in ten Te in pera t urbereich untersucht, so sind MeBergebnisse, die bei Temperaturen gewonnen wurden. die auBerhalb dieses Bereichs liegen, als nicht gesichert bzw. nicht vertrauenswurdig zu betrnchten. Aus diesem Crund sollten Ergebnisse von Messungen beispielsweise wie folgt priisentiert werden: ,.Die charakteristischen KenngroBen X, Y, Z dieses MeBverfahrens wurden fur den Temperaturbereich rwischen 18 "C und 24 "C ermittelt".
Er,yd~rri.s.srrider- :n,vitrri Chcir-trX.trrisirrirri~~.sriirthodr Die tnit der zweiten Charakterisierungsmethode erhaltenen Ergebnisse sind zuniichst iihnlich wie bei der ersten Charaktersisierungsmethode - Schatzwerte fur die zufiilligen Abweichungen der Unsicherheiten von MeBergebnissen. Bei Einhaltung gleichbleibender Wiederholbedingungen sind sie als eine VerfahrenskenngroRe des untersuchten MeOverfiihrens anzusehen. Dank der Verwendung gesicherter Referenfen ermiiglicht diese Charakterisierutigsmethode zusiitzlich eine Aussage uber die systematische Abweichung der init diesem MeMverfahren gewonnenen Ergebnisse, also die Uberprufung der Richtigkeit. Die Unsicherheit dieser zweiten Aussage hlngt im wesentlichen n u r noch von der Qualitiit der Referenz - oder genauer genommen von der Unsicherheit derdurch die Refercnz verkijrperten Merkmalswerte ab.
Zii dtw
KomrnentrirDie Unsicherheit der verwendeten Referenzen mu8 den Spezitikationen des MeRverfahrens entsprechen oder besser als die Forderungen sein. Die Unsicherheit der Referenj. sollte dem Gebrauchszweck ebenso angemessen sein, wie der Kostenaufwand fur die Referenz. welcher die Gesamtmessung nicht mehr belasten sollte als unbedingt notig. I 3.1.3 Drittc Charakterisierungsmethode Vergleich der Ergebnisse, die mit einem weiteren Verfahren ermittelt wurden In dieser Charuhterisierungsmethode werden die tnit dein zu charakterisierenden Meljvertahren erhaltenen Ergebnisse mit den Ergebnissen eines (oder mehrerer) underen iiniibhiingigen Me6verI:ihrens (Vergleichs- oder Referenzverfahren) verglichen. Dabei werden in beiden Mei.lvcrfohren die gleichen Me8objekte unter Wicderholbedingungen verwendet. Es kann vorkommen. dal3 das Vergleichsverfahren ein Refcrenmerfiihren ist. d. h. did3 die ni i t i h m e rm i t t e 1ten Erge bn i \ \e au f g es i c hert e Refere n / e ti zii rue kg etii h rt u erde II hii11 tie n . Die drittc Cti~irakterisict-tingsmethodeist dann niitzlich, wenn einerseits keine gcsicherten Referenzcn iinmittelbar verfugbar sind und anderseits dcr Aufwand fiir eine \ystematische Untcrsuchung der Einfliisse aufdie MeBgrijRen mittel\ der er\ten Charakterisieriingsmcthode ;iu\ /citlichen und/oder aus Kostengriinden nicht i n Frage kommt.
1.5 Methoden zur Chariikterisirrurig von iinciljtischrn Mettiodi~n
21
Kommentar Die Wahl des Vergleichsverfahrens sollte dem Verwendungszweck des untersuchten MeRverfahrens entsprechen, insbesondere beziiglich der zulassigen Ergebnisunsicherheit. ebenso sollte bei dessen Wahl beriicksichtigt werden, daR der rnit dem Vergleichsverfahren verbundene Aufwand und die damit verbundenen Kosten in einem akzeptablen Verhiiltnis zu den Bedurfnissen des Auftraggebers stehen. Zu den Ergebnissen der dritten Charakterisierungsmethode
Die Unsicherheit der mit dem zu charakterisierenden MeRverfahren ermittelten Ergebnisse ist unmittelbar davon abhangig, wie groR die Unsicherheit der rnit dem Vergleichsverfahren gefundenen Ergebnisse ist. Je kleiner der Unterschied zwischen den Ergebnissen der verglichenen Verfahren, um so starker die Vermutung, daR sich die charakteristische Unsicherheit des untersuchten MeBverfahrens nur geringfiigig von jener des Vergleichsverfahrens unterscheidet. Wir schlagen vor, den Unterschied zwischen den mit zwei unabhiingigen Meherfahren ermittelten Ergebnissen - bei Einhaltung von Wiederholbedingungen der Ergebnisunsicherheit jedes der beiden Verfahren gleichzusetzen. Verwendet man bei dieser Untersuchung mehrere MeBobjekte rnit unterschiedlichen Werten des gleichen Merkmals, so erhalt man im Resultat eine ganze Reihe von Unsicherheiten, die nach statistischen Regeln bearbeitet werden konnen. Je nach Art des Vergleichsverfahrens sind die Unsicherheiten der rnit der dritten Charakterisierungsmethode ermittelten Ergebnisse charakteristisch fur: 1. die zufilligen Abweichungen der Unsicherheiten, wenn niimlich das Vergleichsverfahren auf eine Referenz nicht zuriickgefuhrt werden kann; 2. die zufalligen Abweichungen der Unsicherheiten, zugleich aber auch fur die systematischen Abweichungen der Unsicherheiten, wenn namlich das Vergleichsverfahren ein Referenzverfahren ist und auf eine gesicherte Referenz zuruckgefiihrt werden kann. Wurde das zum Vergleich verwendete Referenzverfahren gernii0 der zweiten Methode bereits charakterisiert, so liegen Angaben iiber die charakteristische Ergebnisunsicherheit dieses Verfahrens schon vor. In diesem Fall ist auch eine Aussage iiber den Vertrauensgrad der Ergebnisunsicherheit des untersuchten MeBverfahrens moglich.
Kommentar Die Wahl des Vergleichsverfahrens sollte dem Verwendungszweck des untersuchten MeRverfahrens entsprechen, insbesondere bezuglich der zulassigen Ergebnisunsicherheit, ebenso sollte bei dessen Wahl berucksichtigt werden, daB der rnit dem Vergleichsverfahren verbundene Aufwand und die damit verbundenen Kosten in einem akzeptablen Verhiiltnis zu den Bediirfnissen des Auftraggebers stehen.
1.5. I .4 Vierte ChnrakterisierungsInethode
VergleichsrnessungeIi zwischen Laboratorien (Laborvergleichsversuche, Ringversiiche) In dieser Methode wird das untersuchte MeRverfahren mittels der Ergebnisse von Vergleichsmessungen zwischen mehreren Laboratorien charakterisiert. Die am Vergleichsversuch teilnehmenden Laboratorien verwenden alle das gleiche MeBverfahren und Lintersuchen alle die gleichen Priifobjekte unter den fur ihr Labor spezitischen Gegebenheiten (Vergleichsbedingungen). Das untersuchte MeBverfahren wird charakterisiert, indem die Ergebnisse der Vergleichsmessungen mit statistischen Mitteln bearbeitet und dargestellt werden. Kotiiiiiuittir
ZLIVergleichsniecsLingen zwischen rnehreren Laboratorien, deren Zweck die Charakterisieriing eines Meaverfahrens ist', sollten nur solche Laboratorien eingeladen werden. welche das LU charakterisierende Verfahren in vertrauenswurdiger Weise bezuglich Wissen, Erfithrung und Ausrustung beherrschen. Vergleichsmessungen zwischen Laboratorien mussen gut geplant, kompetent begleitet und mit statistischen Mitteln ausgewertet und dargestellt werden. Die Teilnahinebedingungen und der Durchfiihrungsniodus mussen schon im voraus bekannt sein. Das Verfahren selber ist bis ins Detail schriftlich niederzulegen: insbesondere bezuglich solcher Verfahrenselemente, die auf das Endergebnis einen inerklichen Eintlufi haben kiinnen. Eine Vergleichsmessung mu13 von einem besonders kompetenten Labor (Referenzlabor). welches das untersuchte Verfahren hervorragend beherrscht. geleitet und betreut werden. tlcw Ergehriissrri tler lierteti Clicirtikterisirr-irri~~.stiirtliode Mit Hilfe dieser Charnkterisierungsrnethode wird pro Prufobjekt von jedem der teilnehmenden Laboratorien ein (oder mehrere) Ergebnis(se) geliefert. Diese Reihe von Ergebnissen ist die Grundlage fur die Schltzung der zufdligen Abweichung der Unsicherheit des MeOergebnisses fur das gegebene MeOobjekt. Werden i m Vergleichsversuch mehrere Prufobjekte mit verschieden groRen Werten des gleichen Merkmals untersucht, so ergibt sich eine Reihe von Ergebnissen, aus denen fur das untersuchte MeRverfahren die Unsicherheit der Ergebnisse unter Vergleichsbedingungen als eine charakteristische VerfahrenskenngrBRe, die .,Standardunsicherheit" berechnet werden kann. Sie gilt furjenen Bereich, welcher der Spanne der Merkmalswerte der untersuchten Priifobjekte entspricht. Die so ermittelte Kenngrii1.k besagt indessen nichts uber die Richtigkeit der mit diesem Meliverfithren gewonnenen Ergebnisse, d. h. daR die systematische Abweichung vom richtigen Ergebnis weiterhin unbekannt bleibt. Die Vertrauenswurdigkeit der Standardunsicherheit hiingt im wesentlichen von der Vertrauenswurdigkeit der teilnehmenden Laboratorien ab. Je kleiner die Unterschiede zwischen den Ergebnissen der Laboratorien, um so stlrker die Vermutung, dal3 Zir
1
Vcrglcichsverauchc /wisehen Lahoratoricn werden fur vcrschicdene Aulgahcn eingesetlt. n i n lich: .,mr Charaktcriaicrung von McBvcrfahren" odcr ,,mr Charakterisicrung der Eigcnschalicn. d. h. dcr Merkrnalswcrte von Stoflcn" (Marerialzer1ili;ricrung) oder ,,mr Uhcrprufung dcr lcchnischen Leiqtungsfihigkcir von Lahoratorien" (prolicicncy testing)
die rnit dem untersuchten Verfahren erzielen Werte eine verhaltnismiiljig geringe Unsicherheit haben. Fur eine detaillierte Auseinandersetzung rnit dem Thema ,,Ringversuche" siehe G. Gorlitz in [3]. I S.1.5 Funfte Charakterisierungsmethode
Geordnete Schatzung der Ergebnisunsicherheit auf der Grundlage von Wissen und Erfahrung (Ein Schiitzverfahren vom Typ B) Das Vorgehen bei der .,Schatzung" von U, sieht in kurzester Darstellung wie folgt aus: 1. Der gesamte Meovorgang wird Schritt um Schritt, d. h. von der MeRplanung uber die
Festlegung der Probenahmeorte, Probenahmedauer. Probenzahl, der Messung der Hilfsparameter (Temperatur, Wasserdampfgehalt, Zusamniensetzung der Case usw.), der eigentlichen Probenahme und dem Probentransport usw. bis zur allerletzten Auswertung und Berechnung, ohne irgendeine Auslassung einer Verfahrensstufe, aufgelistet. Bei jeder Verfahrensstufe wird abgeschiitzt, welchen Einflul3 die Unsicherheit dieses Schritts (Ui) auf die Unsicherheit des Endergebnisses (U,-Wert) haben konnte. 2. Die so aufgelisteten einzelnen Schritte werden nun zu griifieren Verfahrensmodulen zusammengefaBt, wie z. B. Probenahme, Probentransport, Probenvorbereitung, Anreicherung oder Verdunnung der Probe, Messung der gesuchten Merkmalswerte, Auswertung und Berechnung der Ergebnisse. 3 . Fur jedes Verfahrensmodul wird nun die Unsicherheit des Moduls U, anhand der fur die einzelnen Verfahrensstufe geschatzten Unsicherheiten U, (gemal3 der Regel fur die Fehlerfortpflanzung nach GauB) als prozentualer Beitrag des Moduls an die Gesamtunsicherheit U, berechnet. Aufgrund einer breit abgestutzten Erfahrung wird dabei angenommen, daR sich die Einzelunsicherheiten normal verteilen und daR sie in den allermeisten Fallen untereinander nicht korrelieren. 4. Aus den prozentualen Unsicherheiten der Module U, wird schlieljlich die Gesamtunsicherheit U, des Endergebnisses der Messung (ebenfalls nach GauR) ermittelt. Alle soeben beschriebenen Schatzungen werden fur zwei Situationen gemacht, ngmlich fur: a) Unsicherheiten. die sich bei Standardsituationen (S-Fall) ergeben haben, d. h. bei Situationen, wie sie in der Praxis beim Schiitzenden in etwa 2/3 aller Fiille bei Anwendung des geschiitzten Verfahrens vorgelegen haben; angegeben wird die obere Grenze dieses Streubereichs und b) Unsicherheiten, welche bei Anwendung des geschatzten Verfahrens in ungunstigen Situationen (X-Fall) beim Schiitzenden nur selten angefallen sind, d. h. rnit einer Hiiufigkeit von einmal pro 20 Standardsituationen bis zu einmal pro 100 Standardsituationen (d. h. mit einer Wahrscheinlichkeit von 95 bis 99 %). Nicht gemeint sind damit die denkbar schlimmsten Fiille iiberhaupt (worst cases), die in der Praxis selten Relevanz haben. Angegeben wird hier die obere Grenze dieses Streubereichs. Das hier beschriebene ,,Verfahren zur geordneten Schiitzung der U,-Werte von Prufungen", das auf einen Vorschlag von J. S. Morkowski 15-71 zuruck geht, wurde in die neue
IS0 Norm 17025 aufgenommen (s. Abschnitt 1.2. I ) . Die bisher mit diesem Schatzverfahren gesammelten Erfahrungen bestiitigen ohne Ausnahme die Vermutung. da8 es Ergebnisse ( U ,.-Werte) liefert, welche den Erwartungen versierter Praktiker sehr nahe kommen.
Vorbedingungen fur die Teilnahme an der Schatzung sind: Ein gutes Verstiindnis des MeBprinzips, insbesondere der wissenschaftlich-theoretischen Hintergrunde, aufdenen es aufbaut, und ein Verstiindnis fur die Bedeutung der miiglichen EinfluUgroBen - ein haufiger und schon liinger dauernder Umgang mit dem betreffenden (oder init einem sehr iihnlichen) MeBverfahren einschliefllich der Fiihigkeit zur Beurteilung der Plausibilitiit der Ergebnisse von Messungen bzw. Analysen und last but not least der Mut, um die vorhandenen Unsicherheiten LU benennen und zu quantifizieren. -
lnfolge der Schiitzung der Unsicherheiten fur zwei verschiedene ..Betriebssituritionen" bei der anwendung des Verfahrens ergeben sich zwei Zahlenreihen. aus denen zwei U,Werte berechnet werden. Der erste U,-Wert (S-Fall) wird einer einfachen Standardunsicherheit gleichgesetzt. Der zweite Wert (X-Fall) betriigt in vielen Bereichen des Prufwesens erfahrungsgemifl das zwei- bis dreifache dieser Standardunsicherheit (bei sehr unsicheren Verfrihren allerdings noch mehr). Die von einzelnen erfahrenen Messenden ( u . U. bei mehreren Personen aus dem gleichen Labor) geschiitzten U,-Werte werden wie die EinAergebnisse aus einer Vergleichsmessung zwischen Laboratorien (Ringversuch) behandelt. Die Anwendung der funften Charakterisierungsmethode bedeutet in der Praxis: -
-
-
Es ist moglich. die charakteristische KenngriiBe U, des Meflvert'ahrens unter Vergleichsbedingungen zu schgtzen. Diese wird ausgedruckt als Grenze des Vertrauensbereichs (mit 2/3 und I/,,,-Wahrscheinlichkeit) fur die Unsicherheit der Einzelwerte. Die Schwachpunkte der Verfahrensstufen, die den groaten Beitrag zur Gesamtunsicherheit des Gesamtverfahrens liefem, konnen identifiziert werden. Es ist dadurch miiglich, das Verfahren hinsichtlich der Gesamtunsicherheit zu verbessern. Insbesondere durch gezielte MalJnahmen zur Verminderung der Unsicherheit jenes Verfahrensschrittes, welcher erkanntermaBen den gro13ten Beitrag an die Gesamunsicherheit liefert. Bei der Berechnung der Gesamtunsicherheit U, des Verfahrens aus den Unsicherheiten der Verfahrensmodule U, istjeweils zu prufen. ob die Module sich hinsichtlich der Unsicherheit gegenseitig beeinflussen, d. h. oh sie miteinander korrelieren.
Erg&iiisseii derfiii!fttw Chcircrktc~ri.sirriiri~.sriirtlioilr Das Ergebnis einer Schatzung init der funften Charakterisierungsmethode kann hvispirlscceise wie folgt angegeben werden: ,.Fur 2/3 aller Fiille betriigt im S-Fall die Standardunsicherheit des Gesamtergebnisses U, dieses Prufverfahrens rund Ki c/r (Sch3t7wert fur Standardsituationen. d. h. bei Anwendung des Verfahrens unter gunstigen bzw. normgerechten Bedingungen). Im X-Fall. d. h. in 95 8 aller Fille ist die Unsicherheit des Gesamtergebnisses U, nicht groBer als ?7 r/o
Zir &ii
1.5 Methoden zur Chrtrukteri.rierungvon unulytisc~henMethodm
25
(Schatzwert fur den Fall, dalj das Verfahren unter ungunstigen Bedingungen durchgefuhrt werden mulj). - Diese Schatzwerte gelten fur Raumtemperaturen zwischen 20 "C und 25 "C und Luftfeuchtigkeiten zwischen 45-55 % r. F. Die Nachweisgrenze dieses Prufverfahrens liegt bei 2 mg Prufsubstanzkg Probe im Trockenzustand." Die Cute der mittels der funften Charakterisierungsmethode gefundenen Schatzergebnisse ist zunachst ein Spiegelbild des Wissens und der Erfahrung des Schiitzers betreffend des geschiitzten Verfahrens. Zugleich sind sie aber auch ein Ausdruck seines Konnens zur realistischen Darstellung jener Fehler, die (scheinbar nur) in seinem Labor schon aufgetreten sind und ein Zeichen seines kritischen Sinnes, der Unsicherheitsquellen erkennt, was den Schatzer uberaus ehrt. Man darf ohne zu zogern vermuten, dalj die Ergebnisse solcher Schatzungen durch wissende, erfahrene und der Wahrheit mutig ins Auge schauende Praktiker nicht schlechter (und nicht schockierender!) sind, als die oft ,,unglaublichen" Ergebnisse von Vergleichsversuchen zwischen Laboratorien (gemalj der vierten Charakterisierungsmethode),bei denen sich die Ergebnisse untereinander oft ganz wesentlich unterscheiden. In beiden Fallen werden die groljen Streuungen der Ergebnisse durch die gleichen Ursachen bewirkt, namlich durch die vielfaltigen und oft bedeutsamen Einflusse auf die einzelnen Schritte des Verfahrens, die in den Laboratorien in unterschiedlicher Weise wirksam werden, die aber in der Laborpraxis allzu oft aus Unwissenheit unbeachtet oder als untergeordnet unerwahnt bleiben. Sind die Problematik und Tucken eines Verfahrensmoduls dem Schiitzenden nicht gut gelaufig, so kann er schwerlich dessen Unsicherheit U, schatzen. Damit ist er auch auljer Stand, die Gesamtunsicherheit U, des Verfahrens zu schatzen. Tut er es dennoch, darf dies nur unter dem Vorbehalt geschehen, dalj die fehlende Erfahrung sobald wie moglich gewonnen und der provisorische Schatzwert allenfalls korrigiert wird. Dies bedeutet, daO das unbekannte Modul so schnell wie nur moglich nach einer der 0. g. vier ersten Methoden charakterisiert wird oder, sofern dies experimentell nicht moglich ist, statt dessen erfahrene Praktiker befragt werden, mit deren Hilfe eine Schitzung der Unsicherheit des besagten Moduls U, durchgefuhrt wird 181. Die Vorteile und die Nutzlichkeit der funften Methode zur Charakterisierung der Unsicherheit der Ergebnisse sind evident. Oft stellt sie die einzige praktikable Moglichkeit dar, um eine erste Abschiitzung der Gesamtunsicherheit U, eines quasi neuen Verfahrens zu erlangen; z. B. dort, wo Priif-, Melj- oder Analysenergebnisse schnellstens benotigt werden und wo das ,,neue" Verfahren aus an sich wohl bekannten, erprobten und gut beherrschten Verfahrensmodulen ad hoe zusammengebaut wird. In einem solchen Fall wird die Gesamtunsicherheit U-, ails den schon von fruher her bekannten Unsicherheiten U, der verwendeten Verfiihrensniodule abgeschatzt. Bei diesem Vorgehen sollte klar sein, daB die verwendeten U,-Werte nach verschiedenen Charakterisierungsmethoden ertnittelt wurden. Die einen kiinnen eine experimentelle Grundlage haben und andere auf der Basis von Erfahrung und dem wissenschaftlichen Verstandnis des verwendeten PrinTips geschiitlt worden sein. Die soeben geschilderte Situation kommt bei F+E-Arbeiten ofter vor. Nicht immer kann hiei- schon im voraus gesagt werden, BUS welchen Verfahrensmodulen das jeweils benotigte Verfahren zusatnmengebaut werden wird. Eine schnelle Schatzung des U,-Wer-
26
I Grundsutze der W i d i e r u n g in der Anulytik und im Priifwesen
tes ist nur ein Notbehelf. dem mit einer systematischen Untersuchung der EinfluBgroBen oder durch Vergleich der Ergebnisse mit einem anderen unabhangigen Verfahren oder dem Vergleich mit anderen Laboratorien so bald wie moglich abgeholfen wird. Diese Charakterisierungsmethode, die quasi eine Alternative zur klassischen Validierung darstellt, gewinnt stets an Bedeutung. So ist sie bereits mehrfach Gegenstand von Publikationen gewesen. GemaB ihrer wachsenden Bedeutung wird in Abschnitt 3.2 und in Kapitel9 ausfuhrlich auf deren praktische Anwendung eingegangen. Es kann vorkommen, daB die schon bestehende Charakterisierung eines Verfahrens oder eines Verfahrensmoduls, welche bereits nach einer Charakterisierungsmethode vom Typ A (d. h. Methoden 1-4) erfolgte, um eine Charakterisierungsmethode vom Typ B erweitert werden muB. Am besten geeignet scheint hierfur die Charakterisierungsmethode 5. 1 .S.1.6 Kombination der funf Charakterisierungsrnethoden
Das Wissen eines Labors um die Unsicherheiten der verschiedenen Verfahrensstufen basiert auf recht unterschiedlichen Erfahrungen. Die das Verfahren anwendende Person mag die eine Verfahrensstufe recht gut im Griff haben; uber eine andere Verfahrensstufe wurde sie gerne etwas mehr wissen; schliefilich weiB sie uber eine weitere Verfahrensstufe nur soviel, daB sie recht unzuverlassig ist und verrnutlich erhebliche Unsicherheiten in sich birgt. Dieses ungenugende Wissen um die Unsicherheit bestimmter Verfahrensstufen spiegelt das realistische Problem wider, rnit dem sich der Validierende oft konfrontiert sieht. Aus diesem Grund setzt sich in der Praxis die Charakterisierung eines komplexen Verfahrens oft aus mehreren Charakterisierungsmethoden zusammen, d. h. daB sie eine Kombination von mehreren der 0. g. funf Charakterisierungsmethoden ist.
Beispiel Basiert eine Verfahrensstufe auf einer Messung mit dem Ziel, physikalische Merkmalswerte eines MeBobjekts festzustellen, so wird man zu dessen Charakterisierung die zweite Charakterisierungsmethode verwenden (Kalibrierung mit systematischer Untersuchung der wesentlichen EinfluBgroBen). Fur die Abschatzung der Unsicherheiten, die sich aus der Probenvorbereitung ergeben konnen, wird man oft die erste Charakterisierungsmethode nehmen (systematische Untersuchung der EinfluBgroBen). Sollen indessen die Unsicherheiten abgeschatzt werden, die sich in einem bestimmten Verfahren bei der Probenahme und dem Probentransport ergeben konnen, so ist eine gute Kenntnis der wissenschaftlichen Zusammenhange und eine ausgiebige praktische Erfahrung im Umgang rnit diesem Verfahren die einzige realistische Grundlage fur die Ermittlung realistischer Werte von U, gemal3 den Regeln der funften Charakterisierungsmethode. Die gesuchte Gesamtunsicherheit des Ergebnisses U, kann in diesern Fall nur dank einer Kombination der 0.g. drei Charakterisierungsmethoden (fur die gesuchten drei U,Werte) ermittelt werden.
1.6 Chrirtiktc.risieriing (Qualififizieruns)von Methodm
27
1.5.1.7 Weitere Methoden vom Typ B
In FHllen, da eine Verwendung einer der 0. g. funf Charakterisierungsmethoden nicht moglich oder nicht zweckmHSig ist, bleibt manchmal die Moglichkeit, eine weitere Charakterisierungsmethode vom Typ B einzusetzen, so 2. B.: 1. Charakterisierung eines Verfahrens durch Sirnulotion, d. h. Untersuchung analoger Prufobjekte mit bekannten Merkmalswerten. Diese Methode ermittelt die zur Charakterisierung des untersuchten Verfahrens bendtigten Informationen (insbesondere den Wert von U,) durch Messung von gut bekannten. d. h. kalibrierten MeSobjekten, welche dem zu prufenden Original bezuglich der maBgebenden Merkmalswerte sehr Hhnlich sind. Zu beachten ist dabei, daf3 das durch Simulation charakterisierte MeSverfahren den Bedurfnissen des Auftraggebers ZLI genugen verrnag. Diese Simulationsmethode konnte man als eine Ableitung der zweiten Charakterisierungsmethode mit einer ..Quasi-Kalibrierung" bezeichnen. 2. Charakterisierung eines Verfahrens durch Ber-echnungen,die sich aufverifizierte Rechenmodelle stutzen.
Diese Charakterisierungsmethodeermittelt die benotigten Informationen (insbesondere den Wert von U,) durch Berechnungen, die von reellen Prufergebnissen ausgehen und diese in ein veritiziertes Rechenmodell einbringen. Dies berucksichtigt zugleich die wissenschaftlichen Zusammenhlnge des untersuchten Verfahrens ebenso wie die anderweits untersuchten Einflusse auf das Gesamtergebnis. Bedingung fur die Verwendung dieser Methode ist einerseits, daR das verwendete Rechenmodell durch plausible Rechenergebnisse verifiziert wurden und dem neuesten Stand der Erkenntnisse/der Technik entspricht und daR es anderseits den Bedurfnissen des Auftraggebers genugt.
1.6
Charakterisierung (Qualifizierung) von Methoden als letzter Schritt einer Validierungsprozedur
Letzter Schritt der Validierungsprozedur ist der Vergleich der gefundenen charakteristischen Merkmalswerte der untersuchten Methode mit den Forderungen, wie sie sich aus einem Auftrag oder aus Spezifikationen ergeben, urn eine bestimmte Aufgabe angemessen losen zu konnen. 1st das Ergebnis des Vergleichs positiv, d. h. dal3 die fur den Auftrag vorgesehene Methode geeignet ist, so hat das Labor dies formell durch eine schriftliche Erkllrung festzustellen. In der Praxis wird man sagen: die Methode ist validiert und fur einen bestimmten Verwendungszweck qualifiziert. Fur Akkreditierstellen stellt sich die Frage, wie diese Forderungen der IS0 17025 praxisnah zu uberprufen sind. Im Sinne des Qualitatsmanagements (ISO-9000 ff.) fordert die Norm vom Labor eine Dienstleistung, die der Aufgabe des Kunden angemessen ist und eine dementsprechende Prufung des Vertrages erfordert. Die fur die Aufgabe vorgesehene Methode ist darauthin zu uberprufen, ob sie fur die Losung des konkreten Kundenpro-
blems tatsiichlich geeignet ist, d. h. daB. die Methode zu validieren ist. 1st die Eignung uberpriift und gewiihrleistet, so hat das Labor diese Tatsache xu bestiitigen. Gemiil!, den vorausgegangenen Ausfuhrungen wird die vorgesehene Methode fur den konkreten Kundenauftrag qualitiriert. Es kann vorkommen, dal!, das Labor irn Vertrag einschrankend feststellen muR, d.'1.I< es einige Forderungen nicht oder nur teilweise erfullen kann (weil es z. B. fur die Messung eines bestiinmten Merkmalswertes nicht eingerichtet ist). SchlieBlich ist zu beachten. dal!, die vollstindige Vertragsprufung nicht nur die Beherrschung des Meaverfahrens behandelt (d. h . Personalqualifikation, Merkmalswerte der Methode, angemessene Einrichtungen u. 2. m.) sondern auch andere Aspekte wie z. B. rechtliche Gesichtspunkte, Terminfragen, die Verfugharkeit von geeignetem Personal und Einrichtungen und nicht zuletzt die Kostenfrage.
1.7
Freigabe von Methoden, Dokumentation
Der Laborleiter ist dnfur verantwortlich, dal3 alle in seinein Labor verwendeten Methoden (vorrangig die nicht genormten) charakterisiert werden in einein Umfang, welcher den1 beabsichtigten Verwendungszweck angemessen ist. Bevor eine Methode in einem Labor routincmiil3ig eingcsetzt wird, muB sie vom Laborleiter fur den Gebrauch ausdrucklich freigegeben werden. Aus Erfahrung wissen wir. dal3 genormte Verfahren oft ohne eine kritische Uberprufung in die laufende Laborpraxis ubernommen werden. Das kann sich riichen, geht es bei der Methode tatsachlich um Wahrheitsfindung und nicht nur um eine formale Konformitlitsprufung. Der Zeitpunkt der Freigabe einer Methode sollte aus deren Dokumentation klar ersichtlich sein. Die init der Anwendung einer Methode betraute Person sollte den Laborleiter dariii~fai~frnerks;iin machen. wenn bei deren Anwcndung Bedingungen von jenen abweichen, die geinliB Dokumentation fur ihrc Charakterisierung mnOgebend waren (definierter Anwendungsbereich). Die Durchfuhrung und die Ergebnisse der Charaktei-isierung einer Methode miissen LILISreichend tiokumentiert und anschlieSend nrchiviert werden, siehe Abschnitt 2.2.
I .8
SchluBbemerkungen
Die ISO-Definition ;itis den1 Juhre I994 iind der nahc/ii woitgleiche Test der IS0 17025:2000 schafl'ten Klarheit be/iiglich des Begriffes Validierung. Es sind gutc Definitionen: Der Analytiker hcwahrt weiterhin seine Frriheit -.jedenfnlls l i i t i t Definition. Die Vcrwirrung. was Validiei-tins sein sollte. diirite somit spiirhar nachl;i\\cn. Es geht ,jet/t iii tlcr Vrilidic.ruiig\praxis tin1 Inhalte. Durchfiihriingsmodiis u n r l den Umg;ing niit Zahlcn. Datiiit \vcrden v,ir tins i n den nichsten Knpiteln heschliftigen. Abhzngig von dci- konkietcn Fr;igestellung abrr auch von dcn :thtiiellcn Mijglichkciten gibt es unterschiedliche Wege. eine Validierung durch/ufuhren.
1.8 Schluj’hernerkungen
29
Einen Ansatz stellen die vorgestellten Charakterisierungsmethoden dar. Deren Anwendungsbereich erstreckt sich uber alle zu validierenden Verfahren. Diese Methoden zeigen dem Labor einen Weg, wie es den Nachweis fuhren kann, daB eine bestimmte Methode fur den vorgesehenen Verwendungszweck geeignet ist, bzw. ob es den Forderungen eines Auftraggebers entspricht. Dem Fachbegutachter einer Akkreditierstelle konnen sie helfen, auf die Frage zu antworten, ob das Labor die Fiihigkeit besitzt, geeignete Verfahren einzusetzen, d. h. solche, die geeignet sind, die vom Auftraggeber gestellten Aufgaben in angemessener Weise zu Iosen.
In der Praxis konnte die Anwendung der einzelnen Charakterisierungsmethoden wie folgt aussehen: Die erste Charakterisierungsmethode ist fur Konventionsmethoden geeignet. Hier ist die Untersuchung der EinfluBprarameter wichtig, es geht um Vergleichbarkeit von Ergebnissen. Kalibrierung ist eine hervorragende Moglichkeit (zweite Charakterisierungsmethode) wenn Normale, zertifizierte Referenzmaterialien oder sehr gut charakterisierte Standards vorhanden sind. Ergebnisvalidierung durch Vergleich ist sicher und schnell. 1st eine der genannten Moglichkeiten nicht gegeben, und ist weiterhin das Wissen um Richtigkeit wichtig, kann man sich der dritten Charakterisierungsmethode bedienen, namlich des Methodenvergleichs.
In der Praxis werden diese drei Methoden oft kombiniert: Kalibrierung mit Standards, gefolgt von der Untersuchung der spezifischen EinfluBparameter auf das Ergebnis oder Prufung auf Richtigkeit durch Methodenvergleich und parallele Untersuchung der EinfluBparameter. Die dritte Charakterisierungsmethode sollte nur bei Mangel an Referenzsubstanzen eingesetzt werden. Die vierte Charakterisierungsmethode (Ringversuche) wird immer seltener zu Validierungszwecken von Methoden eingesetzt. - Das Schiitzen der MeRunsicherheit, funfte Charakterisierungsmethode, sollte in F+EBereichen kunftig mehr eingesetzt werden. Tatsachlich erfreut sie sich einer wachsenden Beliebtheit. -
Eine weitere Charakterisierungsmethode ist die Uberprufung der Mrrhodrnsrubilitiit, d. h. die Verfolgung eines Ergebnissesrnertes in Abhangigkeit von der Zeit mit Hilfe der statistischen ProzeBkontrolle, SPC (s. Kapitel 8 und 9). Die unbestrittenen Erfolge der SPC in der Produktion verschaffte ihr Gehor auch in der Analytik. Ein erster Hinweis dafur: Neuerdings verlangen immer mehr FDA-Inspektoren den Beweis, daB die Prozesse in statistischer Kontrolle, ISK, sind [8]. Die Beweisfuhrung, daR die zu untersuchende Methode einen 1SK-Prozel!,darstellt, wird bereits als eigenstandiger Punkt im Rahmen der Validierung angesehen [9].
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
2
Vor Beginn der Validierungsarbeiten: Voraussetzungen, Dokumentation, Geratequali fizierung
2.1
Voraussetzungen
Vahdierung ist Nachweis der Qualitiit; Qualitiit bedeutet Eignung fur einen bestimmten Gebrauch, .,fitness for use'' [3]. Folglich ist Validierung eine zweckgebundene Priifung auf Eignung, ein Eignungsnachweis. Und ein Eignungsnnchweis bedarf eines grrigneten Umfeldes. Die Faktoren, die die Qualitiit einer analytischen Tiitigkeit - also auch einer Vahdierung - bestimmen, sind jene bekannten 5 M's: Mensch, Maschine, Methode, Material, Milieu. Man konnte hier ein sechstes ,,M" hinzufugen: Management. Auf die Validierung bezogen bedeutet das folgendes (s. Abb. 2-1): Weiterhin sollte vom Management die Bereitschaft bestehen, mit allen Beteiligten das Validierungsziel gemeinsam zu formulieren oder wenigstens unniiljverstandlich mitzuteilen. Schlieljlich sollten wichtige Daten iiber die Probe, wie Ort, Art und Zeitpunkt der Entnahme, Transport, Konservierung usw. bekannt sein. Das Wissen um die Historie der Probe kann bei spater auftretenden Fragen von entscheidender Bedeutung sein.
Mensch
_ _ _ _ _ ~ ~
+
qualifiziertes Personal, das die Methode beherrscht ~~~
~~
Maschine
+
qualifiziert, kalibriert, robust
Methode
eindeutig charakterisiert, geeignet
Material
+ +
Milieu
+
Das (analytische) Umfeld und mogliche Einflusse sind bekannt, z. B. Feuchtigkeit, Temperatur, Strahlen, Schwingungen
Management
+
Das Labormanagement steht hinter dem Validierer, ausreichende Zeit und notwendige Mittel sind gewahrt, inhaltliche Differenzen uber Urnfang und Modus der Validierung sind zu diesem Zeitpunkt bereits beige-
Qualitat der eingesetzten Materialien bekannt und f u r die konkrete Aufgabe ausreichend
legt. Das hei0t zusammengefa0t: Das Management sorgt f u r eine reibungslose Ausfuhrung der Validierung. ~~
Ahh. 2-1 Faktoren. die die Oualitat von Ergehniswm heeinfluscen
1. Zielsetzung genau definieren, bei Auftragen von auOerhalb des Labors rnit dern Auftraggeber die Ziele unrnil3verstandlichfestlegen (Was will ich/der Kunde wissen und warum?). 2. Daraus abgeleitet: Leistungsrnerkrnale und Akzeptanzkriterien (Was muB ich rnessen/welche Daten brauche ich, urn die gestellte(n) Frage(n) beantworten zu konnen?) 3. Methode, soweit sie nicht festgelegt ist, rnit geeigneten Leistungsrnerkrnalen wahlen (Mit welcher Methode kann ich die benotigten Daten ermitteln?'). 4. Prufer bestirnrnen, evtl. Validierungstearn bilden (Die (der) Verantwortliche verfugt uber
fachliche und soziale Kompetenz). 5. Zusarnrnen rnit dern (der) Prufer(in) bzw. Validierungstearn detaillierten Validierungsplan rnit genauen Anweisungen zu folgenden Punkten erstellen: Art, Durchfuhrungsrnodus und Haufigkeit der Experirnente fur die einzelnen Prufpunkte inkl. statistischer Berechnungen Spezifikationsgrenzen, Arbeitsbereich und MaBnahmen bei Abweichungen (rf - then, Umgang rnit Zahlen, AusreiBertests) Qualitatskriterien und Art der Prufung fur Geratschaften und Reagenzien -
Kontrollen und Plausibilitatsbetrachtungen Vorgehensweise zurn Herausfinden der kritischen Punkte der Methode (siehe auch Robustheit, Abschnitt 3.4)
Die kritischen Punkte der Methode stellen gleichzeitig Kriterien fur einen spateren Systerneignungstest dar. Weiterhin dienen sie als Basis fur zukunftige Entscheidungen, wann eine Revalidierung notwendig ist2. 6. Methode auf Basis der experirnentell errnittelten Ergebnisse und den Anforderungen charakterisieren (Ja, sie ist aufgrund dieser Ergebnisse fur den und den Konzentrationsbereich/fur diese Matridnach den Forderungen der Behorde X usw. geeignet - oder nicht geeignet) . 7. Ernpfehlungen, wie in der Laborroutine rnit dern rninirnalsten Aufwand die relevanten Charakteristika der Methode uberpruft werden sollen, z. B. durch das Fuhren einer Regelkarte rnit einer Qualitatsprobe.
8. Dokurnentation und Archivierung.
2
Es wird auch die Meinung vertreten, dan die Methodenauswahl eigentlich vor der Validierung abgeschlossen 1st In diesem Fall beginnt die Validierung rnit Punkt 4 Der klassische Systemeignungstest - Gfache Messung eines Standards vor und am Ende einer Menserie - kann in vielen Fallen ohne Verlust an Information entfallen bzw in groneren Zeitabstanden erfolgen Voraussetzung dafur 1st ein robustes Gesamtverfahren Dies kann mit Hilfe der SPC uberpruft werden (s Kapitel 8)
Abh. 2-2 Schrirrc cincr Mcthodcnvalidierung
2.2 Dokumentution
33
Sind diese Voraussetzungen gegeben oder konnen sie geschaffen werden, so folgt anschlieRend eine genaue Planung des Vorhabens. Abbildung 2-2 ist als Checkliste gedacht, die fur den eigenen Fall modifiziert werden kann.
2.2
Dokumentation
D i e Validierung wird in der Regel m i t der Erstellung eines Berichtes beendet. Er basiert auf dem Validierungsprotokoll, das wlhrend der Messungen sukzessiv erstellt wird. Wie zu erwarten, gibt es unterschiedliche Auffassungen uber Umfang, Tiefe und Form des Validierungsberichtes. Abbildung 2-3 gibt einen Uberblick uber wesentliche Inhalte eines Validierungsberichtes wieder. In Zusammenhang mit Dokumenten zu Validierung wird auch der Vulidution Muster P l m , VMP, genannt. Dieser kommt aus der Pharmaindustrie und bezieht sich - Shnlich
Kurze Zusammenfassung mit kommentierter Stellungnahme Zielsetzung und Anwendungsbereich der Methode, evtl. Angabe von Spezifikationsgrenzen Prinzip und Charakteristika der Methode, ggf. rnit Literaturangaben und Hinweis auf Standardwerke
-
Genaue Beschreibung der untersuchten Muster mit Angaben uber Probenahme, -konservierung und -transport, Probenvorbereitung, Arbeitsbereich und Matrix Eingesetzte Gerate und Chemikalien inkl. Tests zur Qualitatskontrolle bzw. Hinweis auf Qualitatsdaten (z. B. zertifizierte Referenzmaterialien, Kalibrierung) Detaillierte Beschreibung der Messungen mit Angaben uber samtliche experimentelle Bedingungen. Es ist fur den Leser hilfreich, wenn im Validierungsbericht bei den entsprechenden Validierungsparametern je ein Rechenbeispiel enthalten ist, z. 6. F- und &Test bei der Richtigkeitsprufung durch Methodenvergleich oder Berechnung der V i s bei zwei Konzentrationsniveaus (s. Abschnitt 3.2 und 3.3).
-
Optische Hilfen sind sehr einpragsam: Chromatogramme, Tabellen, Spektren, Kalibrationskurven, Regelkarten usw. Zu den Ergebnissen gehoren neben ermittelten Zahlen auch: - Akzeptanzkriterien Spezifikationsgrenzen Angaben zur Methodenfahigkeit - Angaben zur MeOunsicherheit - Tests fur die Routine und Kriterien fur Revalidierungen Name des Validierers und des Gegenprufers
Abb. 2-3 Miigliche lnhalrc cincs Validicrungsberichtcs.
dem Regelwerk GMP - im wesentlichen auf die Produktion (Herstellung). Die Analytik spielt in diesein Zusammenhang eine untergeordnete Rolle. Daher wird hier nur k u r r darauf eingegangen. VMP ist ein Dokument mit Informationen uber die Firmenphilosophie z u m Validierungsprograrnm der Firina. d. h. wie die Firma ihrc Vtilidierungsaufgabcn erledigt. Die Intention eines VMP ist:
- eine Beschreibung zu besitzen fur: warum, von wem, wie und wann die Validierung zu -
-
erfolgen hat, Infomiationen uber aktiielle Regelwerke, Anordnungen, Hinweise bwiiglich Validierung LLI liefern. sowie die Kompetenz der Firma fur adiiquate Validierungen zu deinonstrirren,
Die Ziele eines VMP in1 Einzelnen sind: in einem GMP-Dokument den Umfang der geplanten Validierungsaktivitiiten zu detinieren, - die einzelnen Aktivitiiten zu strukturieren und zii Prioritiiten/ReiherifoIgen festrulegen, - die ~ ~ I L notwendigen L I Arbeitsgrundlagen festzulegen (z. B. durch Vcrweis auf gultige SOP'S oder interne oder externe Richtlinien). die Verantwortlichkeiteii innerhalb der Aktivitliren dcs VMP abzugrenxn, Pliine uber den notwendigen Zeit- und Kaparitiitsbedarf aufzustellen und damit die Gcsaintkosten der im VMP zusammengefaDten Validierungsprolekte transparent zu machcn. -
~
Die Zielset/iing und Gliederung cines VMP konnen nach Scheidmeir [ I01 wie folgt rusammengefiiDt werden. siehe Abb. 2-4.
2.3
Geratequalifizierung
Eine wichtige Voraussetzung fiir eine korrekte Validierung von instrumentellen Methoden ist ein qiialitij.iertes Geriit. Die Eignungsprufung des Geriites erfolgt durch die Geriitequalifizierung, die auf vertraglich vereinbarten Spezitikationen rwischen Anwender und Hersteller fuOt. Dieses Konzept basiert auf dem sogenannten Lebenszyklus-Model1 und hat seinen Ursprung in der pharmazeutischen Industrie. s o wird es u. a. von der FDA, PMA und PIC (zu den Abkurzungen siehe Anhang) vorgeschlagen. Interessierten Lesern sei auf die detaillierten Ausfuhrungen in [ I 1-13] verwiesen. Die funf Lebenszyklus-Phasen sind: -
.,Tender-Enquiry Phase": ,.Pre-Qualification": ,,Qualification": ,,Validation": ,,On-Going-Evaluation'~:
Lastenheft mit projektbezogenen Forderungen Entscheidung fur ein Design Funktionstest Priifung auf zweckgebundene Eignung Erhaltung des validierten Zustands fur die gesamte Lebensdauer des Geriites
-
Einleitung, Zielsetzung des betreffenden VMP's ~~~~~
.
~
Definieren des Geltungsbereichs Kurzbeschreibung des Umfeldes, in dem die Validierungsprojekte geplant sind, z. B.: Produktionsstatten, Produkte, Anlagen Liste aller Validierungsprojekte, z. B. Betriebsmittel, Prufmittel, Verfahren
-
Validierungsaktivitaten, z. B. Kalibrierung, IQ, OQ (s. Text), Computetvalidierung, Prozek-/Methodenvalidierung, Reinigungsvalidierung Festlegungen zu folgenden Punkten, z. B. Dokumentation und Archivierung, Aktionsplan fur ,,out of spec"-Situationen, Verantwortlichkeiten fur jedes Projekt Zeitplan aller Validierungsaktivitaten und Priorisierung Verweise auf die gultigen Richtlinien und Standardarbeitsanweisungen (SOP'S) zu folgenden Punkten: - Organisation Genehmigungsverfahren - Archivierung - Formatvorlagen - Abweichungs- und Anderungskontrolle (,,change control management") - Anlagen, die bei Bedarf aktualisiert werden - Auflistung aller zitierten Dokumente, hierhin gehoren einzelne SOP's fur Methodenvalidierungen - Auflistung aller zu validierenden Objekte (Einrichtungen, Produkte) rnit den jeweiligen Validierungsverantwortlichen
Abb. 2-4 Glicdcrung eines Validalion-Master-plans (VMP).
Nachfolgend w i r d dieses Konzept auf die Geritequalifizierung bezogen, vorgestellt und kurz erliutert. Allgerneingultige Leistungscharakteristika und MelJbereiche, die fur den Einsatz gefordert werden und durch den Kaufvertrag zwischen Anwender und Lieferant vereinbart werden, (operational spezification, Leistungsspezifikation). fallen unter die W i r d der Forderungskatalog urn fur den konkreten Einsatz (besondere Umweltbedingungen, Ausbildungsstand des Personals) relevante Punkte erweitert, spricht man von einer FS (functional spezijiication, funktionale Spezifikation). D i e allgemeinen Leistungscharakteristika sowie die speziellen Forderungen fuhren zu den schlufiendlichen Anforderungen des Kunden. A u f Basis der funktionalen Spezifikationen werden nun die technischen Spezifikationen festgelegt. Sie werden auch Ausfuhrungs-Spezifikationen genannt. Das so erstellte Lastenheft bildet die Basis fur die Auswahl des Gerites. Dieser Part mit den detaillierten Anforderungen des Kunden w i r d als design qual$iicarion, DQ (,,Designqualifizierung") bezeichnet.
0s
Die oben beschriebenen Aktivitiiten gehoren zeitlich in ein fruhes Stadium, niimlich wiihrend der Entscheidungstindung fur eine Methode bzw. bei den Kaufverhandlungen f u r ein Geriit nachdem die Methode entschieden worden ist (5. ersten Punkt des Lebenszyklus). Es kann an dieser Stelle diskutiert werden, ob solche Festlegungen und Vereinbarungen als Teil der Validierung angesehen werden sollten oder ob Validierung mit dem physischen Eintreffen von Geriit, Probe und Chemikalien im Labor beginnt. Betrachtet man die Validierung vom tiiglichen Geschehen etwas IosgelW so fangen die ersten Gedanken zur Validierung praktisch zeitgleich mit den ersten Losungsansiitzen fur ein analytisches Problem an. ja sie sind ein Teil davon. Andererseits wird der Praktiker vor Ort die Erstellung eines Lastenheftes kauin als Teil einer Validierung auffassen. Der Leser miige diese Frage fur sich entscheiden, das weitere Vorgehen wird davon kaurn beeinfluBt. Nachdeni n u n das Geriit bestellt und geliefert ist. beginnt die Gerstequalifizierung EQ (04~ripmwt~ ~ ~ ~ / ~ ~Das ~ ist ; ~der , ~Prozefi / t ; zur ~ ~Sicherstellung, ~ ? ~ . daO das Geriit fur den
beabsichtigten Gebrauch geeignet ist und dalj es gem20 den zwischen Anwender und Lieferanten vereinbarten Spezifikationen arbeitet. Die Geriitequalifizierung erfolgt in drei Stufen: -
IQ (installation qualification, Installationsqualifizierung)
-
OQ (operational qualification, funktionale Qualifizierung)
-
PQ (performance qualification, Leistungsqualifizierung)
In der Literatur wird die design qualification oft als der erste Schritt der Geriitequalitizierung angesehen. Die Argumentation lautet, dalj eine erste ..Qualifizierung" bereits eine richtige Entccheidung fur Design und Hersteller ist. In diesem Fall stellt Ger~itequali~i~ierung eine nicht ;ius drei, sondern iius vier Stufen bestehende Mafinahme dar: DQ. IQ, OQ, PQ. -
Unmittelbar nach der Lieferung erfolgt die IQ (installation qualification. Installationsqua1i tizierung).
-
Bei der IQ wird festgestellt, ob das Geriit wie bestellt und spezitiziert geliefert wurde und oh es ordnungsgemii0 am fur die vorgesehene Aufgabe geeigneten Ort installiert worden ist. Das ist der formale Abnahmetest des Geriites vor Ort. Dieser beinhaltet den Check aller installierten Teile und Vergleich init den Herstellerspezifikationen bzw. Vereinbarungen z. B. Berucksichtigung der Sicherheitsaspekte,Vollstiindigkeit der Zubehiirteile, korrekte Installation der Anschl e, Vorhandensein aller Handbucher (wenn tereinbart, in Deuthch!). korrekte Anzeige der Dia,onosewerte. An zweiter Stelle erfolgt die OQ (operational qualification, funktionale Qualifizierung). Bei der OQ wird festgestellt, ob das Geriit ,,hier und jetzt" entsprechend den Funktionsspezitikationen ( h w . zusatzlich vereinbarten ,,funktionalen" Spezitikationen) arbeitet. OQ wird direkt nach der IQ durchgefuhrt, aber auch nach grokren Austauschaktionen. Standortwechseln brw. Reparaturarbeiten. Die korrekte Funktion des Geriites kann ggf. init Hilfe von Testmischungen uberpruft werden. Beispiele einer OQ in der HPLC sind Flufirichtigkeit, Mischungsqualitiit beim Gradienten. Wellenliingengenauigkeit,Temperaturkonstanz. Man kann durchaus die Auffassung vertreten, dal.3 die Kalibrierung des Geriites bereits in diesen Schritt gehiirt.
Es sei noch angemerkt, daB bei der OQ gerade die kritischen Gerateparameter identifiziert und uberpruft werden sollten. Das heifit konkret, daR eine OQ erst nach Uberprufung der Funktionsfihigkeit an der unteren und oberen Spezifikationsgrenze also unter ,,worst-case"-Bedingungenerfolgreich beendet ist ! - Als letzter Schritt folgt die PQ (performance quulijcation, Leistungsquuli~~ienrng). Bei der PQ wird mittels einer typischen Applikation die Leistungsfahigkeit des GeAtes fur den vorgeschlagenen Routinegebrauch festgestellt. Diese Uberprufung erfolgt sinnvollerweise unter Verwendung von Anwenderproben, es wird beispielsweise getestet, oh ein gewunschter oder erwarteter Prlzisionswert rnit dem Gerat erreicht wird. Ein bewlhrtes Werkzeug fur die Routine stellen hier die Regelkarten (statistische ProzeBkontrolle, SPC) dar. Um MiRverstiindnisse zwischen den beiden Begriffen ,,Systemtest" und ,,Systemeignungstest" zu vermeiden, sollte man klarstellen, daB der Systemtest (oder Geratetest) rnit einfachen Testmischungen durchgefuhrt wird. Es werden keine individuellen Proben verwendet, weil es ja hier um die Qualifizierung des Gerates und nicht um die der Methode geht; mogliche Fehler durch die Methode (z. B. Proben rnit komplexer Matrix) sollen auBen vor bleiben. Fur den Geriitetest wird haufig der weniger gliickliche Begriff ,,Gerute~~alidierurIg" verwendet. Der Gerltetest ist die Voraussetzung, der erste Schritt, allenfalls ein Teil der Methodenvalidierung. Abhangig von der Art der Anlage konnen naturgema8 Gerltetests sehr unterschiedlich ausfallen [ 14, 151. Der Systemeignungstest (system suitability test, SST) umfaBt Gerlt, Methode, Probe und Rechner als ,,integrales System". Die Durchfuhrung m u j rnit realen Proben erfolgen und zwar dringend. Selbstverstandlich kann man auch den pragmatischen Weg gehen und nur den Systemeignungstest durchfuhren: Wird ein kleiner Wert fur den Variationskoeffizienten V , (s. Kapitel 3) ermittelt, so gewinnt man die Erkenntnis, daB der Fehler (Streuung) durch das Gerat und die Methode unterhalb der vorgegebenen bzw. tolerierten Grenze liegt. Der Nachteil hierbei ist, daB die einzelnen Beitrlge von Gerat und Methode zur Gesamtstreuung im Verborgenen bleiben. Die mogliche Antwort eines Pragmatikers ware: ,,Solange der V , unter den geforderten 1,5 % liegt, interessiert mich nicht, wo der Fehler herkommt." Diese Antwort wlre unter Umstanden auch zu akzeptieren.
2.3.1 Das ,,V"-Model1 Eine ubersichtliche Darstellung der einzelnen Schritte einer Geriitequalifizierung gelingt rnit dem ,,V"-Modell. Der linke Schenkel eines ,,V" reprlsentiert die Aktivitiiten vor der Realisierung eines Projektes, der rechte Schenkel vom ,,V" die Testaktivitaten, d. h. die Prufung nach der Lieferung. Dieser Ansatz sei nachfolgend kurz erlautert. Am Anfang steht die Idee. Daraus ergeben sich Forderungen der Anwender an das Produkt. Es schliel3t sich die Entscheidung fur ein Design entsprechend den Forderungen an. Nun wird bestellt und geliefert. Nach der Lieferung erfolgt der Test, oh technisch alles in Ordnung ist. Der nlchste Schritt ist die Qualifizierung d. h. der Check, ob die Kundenanforderungen erfullt sind. Der Lebenszyklus schlient rnit dem Routineeinsatz, der auch Modifizierungen und Wartung beinhaltet, siehe Abb. 2-5.
Kunde
Lieferant. eventuell zusamrnen mit dern Kunden
Forderung
Qualifizierung
( Design ) KonzeDtion
Abnahmetest
U
V
Realisierung
Abb. 2-5 Das P r i w i p des ..V"-Modclls tur einen Produkt-Lchens/.yklus
Auf die Geriitequalifizierung ubertragen siihe das .,V"-Modell wie folgt aus: Auf der linken Seite stehen die Spezifikationen entsprechend den Wunschen des Anwenders. Nach Auswahl von Geriit und Lieferant erfolgt die Bestellung des Geriites mit dem gewunschten Design, es folgt n u n die Geriitelieferung in der erhofften Ausfuhrung. Ex schlieot sich jetzt die Qualifizierung an, das ist die Uberpriifung, ob die Spezifikationen und/oder Sonderwiinsche i n der gelieferten Ware entsprechend den Vereinbarungen realisiert wurden. Diese Tests machen den rechten Schenkel vom ,,V" aus, siehe Abb. 2-6. Dieses Modell ist allgemein anwendbar. So konnte nach Maldener [ 161 das ,.V"-Modell fur einen Computer wie in Abb. 2-7 dargestellt ausaehen: Der linke Schenkel beschreibt die Aktivitiiten fur die Zeit vor und der rechte Schenkel fur die Zeit nach Lieferung, also die Test ze i t . Ein Ztrhlrrihei.s~iie1sol1 die Notwendigkeit eines strukturierten Vorgehens, wie oben dargestellt, zumindest fur computergestutzte Anlagen unterstreichen [ 171: Es geht um neun Softwareprojekte der US-Regierung aus den 80er Jahren im Wert von 6.750.000 Mio. US-$. Eine Analyse ergab folgendes: Bestellte aber nicht gelieferte Software: Gelieferte aber nie benutzte Software: Nirgends belegbare Software: Software anwendbar erst nach Modifizierung: Software anwendbar wie geliefert:
2.900.000 $ 3.200.000 $ 350.000 9; 200.000 $
IOO.OOO $ (entspricht 2 % des Gesamtwertea)
LeistungsQualifizierung
Leistungsspezifikationen
V
U
Funktionale Spezifikationen
Funktionale Qualifizierung
Technische Spezifikationen
U
lnstallationsqualifizierung
Bestellung und Ausfuhrung
V
Abb. 2-6 Das ,,V"-Modell fur ein Gcriit incl. Geratequalilizicrung.
Lastenheft
Anwendertests
Funktionale Qualifizierung
Pflichtenheft
Installationsqualifizierung
Detailspezifikationen
Definition von Modulen
U
-
Modultest
lmplementierung ( Hard- und Soflware )
Abh. 2-7 Dai, ,.V"-Modell tiir einen Computer, LIMS odcr cine compuicr-isicrte Anlagc.
Die Uberpriifung ergab a l s Grunde fehlende oder miljverstandene Forderungen der Kunden, Unflexibilitiit des Lieferanten, um new bzw. erst spgter verstandene Kundenanforderungen umzusetzen und fehlerhafte oder fehlende Dokuinentation seitens der Kunden. Den Lowenanteil, niirnlich 65 % macht der erstgenannte Grund BUS. niinilich fehlende oder nicht exakt formulierte Forderungen der Kunden. Auch wenn fur diesen konkreten Fall ein Schinunzeln aus europiiischem Munde durchaus verstandlich ist. stellt sich dieses allgemeine Problem nach den Erfahrungen des Autors auch hierzulande nicht rninder wichtig dar.
2.3.2 Empfehlungen fur die Praxis Neben der IQ sollte auch die OQ vemunftigerweise von Mitarbeitern des Lieteranten durchgefuhrt werden. Bei griiljeren und komplexen Installationen, wie LIMS, ist von Vorteil, wenn ein Fachrnann auf Anwenderseite den Tests beiwohnt. OQ-Tests sollten auch und gerade an den Spezitikationsgrenzen des Gerztes durchgefiihrt werden und nicht im mittleren iiblichen Bereich sei es, dal3 diese GI-enzen fur die geplante Anwendung viillig irrelevant sind. Die einzelnen Schritte IQ, OQ, PQ sind als eigenstiindige Schritte LU behandeln. Das bedeutet, es sollen tatsiichlich drei verschiedene Pliine mit genau definiertem Leistungsumfang existieren. Alle Tests inkl. Rohdaten und Testergebnisse sind zu dokumentieren und ZLI archivieren. Uber den Archivierungsumfang von Systerneignungstests in der Routine mu8 konform mit dein bestehenden Qualitlits-Management (QM-System) individuell entschieden werden.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Teil B Die Praxis der Validierung Stavros Kromidas, NOVIA GmbH, Saarbrucken
3
Die Validierungsparameter (oder nach IS0 17025: Verfahrensmerkmale)
3.1
Literaturiiberblick
Es wurde eine Literaturrecherche fur die Jahre vor I990 und 1990-1999 mit den key-words ,,Methode" und ,,Validierung" durchgefuhrt. Das Ziel war, einen Uberblick uber die verschiedenen Facetten der Validierung in der Analytik zu erhalten -jedenfalls was publizistische Aktivitat betrifft. Hier das Ergebnis in Kurze: Die Zahl der Publikationen zum Thema Validierung mit analytischem Hintergrund steigt standig. Die meist untersuchten Parameter sind: Prazision, Richtigkeit und Linearitat. An zweiter Stelle treffen wir auf Nachweis- und Bestimmungsgrenze, Selektivitat und Robustheit. Als Letzte werden Vertrauensbereich, MeOunsicherheit und Methodenfahigkeit genannt. Die wichtigsten Kriterien f u r den Validierungsumfang sind die Art der Probe, Entwicklungsstufe des Produkts und das Ziel der Validierung. Bei biologischen Proben und allgemein bei Proben mit ,,schwieriger" Matrix (Milch, Lebensmittel) wird neben den anderen Parametern erwartungsgemal3 stets die Wiederfindungsrate uberpruft. In solchen Proben wird weiterhin die Sicherheit durch die sogenannte cross- Vulidierung erhoht, im einfachsten Fall durch Vergleich der Kalibrationskurven bei zwei Methoden, z. B . Anwendung von LC-MS, urn eine RIA-Methode zu ,,crossvalidieren" oder Einsatz von GC-MS oder Immunoassay, um eine HPLC-Methode zu ,,crossvalidieren".
Entsprechend ihrer Wichtigkeit wird bei den analytischen Verfahren an erster Stelle von Validieruiigen chromntographischer Methoden berichtet, gefolgt von denen spektroskopischer Methoden. Bei chroinatographischen Verfahren konxntrieren sich die Untersuchungen aiifdie Methode. wiihrend in der Spektroskopie das Testen des Geriites im Vordergrund steht. So geht es bei der ..technical validation" ausschlieBlich iim die Kalibrieriing (AAS. NIR, FTIR, NMR), bei der quantitativen UV-Spektroskopie spielen Priizision. Richtigkeit, Robustheit und Linenritiit ebenfalls eine wichtige Rolle. Die nieisten Publikutionen stammen aus den1 Bereich ..life science" und spexiell ails der Phariiia. S o treffen wir fiir die Zeit vor 1990 prakticch niir auf Publikationen uber Validieriingen chromntogruphischer Methoden von Pharmaka und Wirkstoffsiibstanzen. Neben dem Abchecken der ublichen Validierungsparameter, siehe unten, kann Validierung auch ein sehr spezieller Test sein.
Beispicllo -
-
-
~
~
Vdidierungstests in einer ..strengen" GLP-Umgebung kann gleich bedeutenti sein mit Tests zur Uberprufung der Sicherheit: Richtigkeit des Integrationsalgorithmus. des Kalibrationsmodells, der Berechnungsformel und der exportierten Daten I 1 XI. VLiIidierungsexperirnente zum Regenerierungsgrad von lonenaustauscher aiif Cellulose-Basis 1191. Validierung von toxikologischen Testa 120.2 I I. Validierung von alternativen Methoden xu toxikologischen Tests 1221. Die SpeLifika von bestimmten Substanxklassen bzw. Produkten fiihren d a m . dal.3 i n Greinien Validierungsrichtlinien speziell fur diese Bereiche erarbeitet wcrden: z. B. Europiiisches Diskussionsforum fur die Validierung von Bioaerosolen 1231, Konferenz zum Thema Methodenvalidierung von bioanalytischen Methoden: Bioverfugbarkeit, Bioiquivalenz und Pharmakokinetik 1241, und ICH. i n der Richtlinien iiber die Validierung in der Pharmaindustrie ausgearbeitet werdcn [ 25 I. Im europiiischen Forschungszentrum in Ispra, Italien, existiert schlieDlich seit kurzem ein European Centre for the Validation of Alternative Methods. Seit 1998 hat auch in den USA das Interagency Coordinating Committee o n the Validation o f Alternative Methods (ICCVAM) a l s behordliche Stelle die Arbeit aufgenommen.
Eine aktuelle Recherche kurz vor Fertigstellung des Buches ergab folgende Trends: -
Wenn eine neue Methode oder eine neue Applikation p u b l i k r t wird, gehiirt hlufig inindestens eine ..Mini"-Validierung einfach dazu.
-
Dac tleilJige Abarbeiten eines ,,Validierungskatalogs" wird immer seltencr angetroffen. das Befascen mit den kritischen Schritten einer Methode ruckt mehr i n den Vordergrund. Stark in der Di\ku\sion sind zur Zeit folgende Themen: OOS (Out Of Spec)-Situationen und die Folgen Melhinsicherheit
3.2 Die ~ilidierun~spcrrcinieter riner rrrirrlytisc~henMethoclr
43
Variabilitiit von Analysenmethoden, ,,Adjustment" vs. Revalidierung, Methodentransfer. -
Von den Validierungsparametern genieljen hochste Aufmerksamkeit nach wie vor die Linearitit (eher die ,,Kalibrierfunktion") sowie die Erfassungs- und Bestimmungsgrenze.
- Generell wird eine vorsichtige, Analytik(er)-freundlichere Stiinmung seitens der Be-
horden beobachtet. Diese wird in der neuen ISO-Norm 17025 sichtbar, es folgen einige Beispiele aus dem Pharmabereich, der als stark reglementiert gilt [26, 27 I: ,,Die Mittelwertbildung aus Mehrfachbestimmungen oder Mehrfachinjektionen wird von der FDA voll akzeptiert und nur das aus diesen Mehrfachbestimmungen hervorgehende Analysenresultat mulj gegen die Spezifikation abgeglichen werden. Schon auf der Stufe des Labors ist es moglich, anhand von Checklisten Werte aus fehlerhaften Tests zu eliminieren und diese durch das Ergebnis dann nur einer einzigen Wiederholanalyse zu ersetzen. Folgende Forderungen werden zur Zeit mit guter Aussicht auf Erfolg diskutiert: Verzicht auf die verbindliche Vorgabe, einen zweiten Analytiker mit einem Revalidierungs-Test zu beauftragen, da dies eine weitere Quelle von Variabilitiit darstellen kann und teilweise nicht umzusetzen ist. Einzelwerte von Mehrfachbestimmungen mussen nicht den Spezifikationen entsprechen, sondern nur das aus ihnen abgeleitete Analysenresultat. Verzicht auf die Forderung, schon im Falle von noch spezifikations-konformen, aber eng an den Grenzen liegenden Analysenergebnissen (,,Borderline Results") zusiitzliche Untersuchungen bis hin zu Stabilitatsuntersuchungen der betreffenden Charge vorzugeben. Kann ein Labor belegen, daR die eingesetzten Prozesse ISK (In Statistischere Kontrolle) sind, so kann auf Revalidierung verzichtet werden."
3.2
Die Validierungsparameter einer analytischen Methode
Auflistungen der in Frage kommenden Validierungsparameter (auch: Verfahrensmerkmale, ValidierungskenngroBen, Validierungsmerkmale, Validierungselemente) sind vielfach in Publikationen erschienen. In den einzelnen Literaturzitaten gibt es nur geringe DifferenZen. In Tab. 3- 1 sind diese Validierungsparameter sowie weitere Begriffe aufgefuhrt, die im Rahmen einer Validierung von Relevanz sein konnen.
Knmrnen tcr r Richtigkeit his einschlieRlich Robustheit sind die Priifpunkte, die fast ausnahmslos immer genannt werden, oft auch der Arbeitsbereich. Selten werden Empfindlichkeit und Stabilitat von Losungen als eigenstiindige Validierungselemente aufgefuhrt. Erstere meist im Zusammenhang mit der Linearitat, Letztere im Zusammenhang mit Robustheit. Der Begriff Erfassungsgrenze gewinnt international - allerdings noch sehr zogernd - zu Lasten der Bestimmungsgrenze an Gewicht. Es sind Bestrebungen im Gange, nur noch von
Tab. 3-1 Miigliche Prufpunktc hci cincr Mcthodcnvnlidicrung in dcr Annlytik rung!
~
Maxiinaltordc-
Pru fpu nkt
Englischc Be/cichnung
Aussage uhcr _ . _
Richtigkeil
trucnes, accuracy 0 1 the mean oder einlach: accuracy
systcmatische Fchlcr
precision
zulilligc Fchlcr
Wicdcrholpriizision odcr Wiederholharkeit
repeatability
Priiiision unter Wicdcrholhcdingungcn: I Prohc, 1 Prufcr. I Gcriit. identische Rcagcniien. kur/c Zeilabstiinde
Lnhorprii/ision
intermediate precision
~
Priirision
-
~
~
~~
Einc Probe, sonst rnchrcrc Variablen. B. 2. Prufcr und/odcr 3. Gcriit undloder 2. Tag uhw. L.
-
Vcrglcichsprii/ision odcr Vcrgleichbarkeit
reproducibility
Priiiision unter Vcrglcich4xdingungcn:
I Prohc. 2. Priilcr. 2. (ieriit. 2. Labor (Messung in jcdcm Lahor unter Wiederholhcdingungcn )
Linearitiir
linearity. selten: annlytical response
mathematischer Zusammcnhang Lwischen Mel.lwcrt(Signal) und Konicntration oder Mcngc
Selektivitiir
wlccrivity
Fiihigkcit. allc intcrc\sicrcndc Analytcn nebeneinander ohne gcgenaeitige Stcirung xu bestimmcn
Wiederfindung oder Wiederfindungsratc
recovery
Ausbcute nach allcn Schritten der Analysc
Nachwcisgrenzc oder sclten: Detcktionsgrcnre
limit o f detection, LOD
klcinste nachwcisharc Mcnge (odcr KonLcntration 1
Besliriiniting\grcnie
limit of quantification. LOQ odcr limit of detcrmi nation
klcinste quantifiiicrharc Menge (odcr Konzcntration)
Rohusthcil
robustness/ ruggedness
Stiiranlalligkcit dcs Ergchnisses durch variicrcndc Bcdingungcn
rohustncss
Stiiranlalligkcit durch vcriindcrte Mcthodcnpararnctcr / . B. pH. Temperatur
~
Mcthodcnrohustheit
-
Vcrf~ihrcn\\tahilitat
-
Anwcndharkcit oder scltcn: Uhcrtragbarkcit
Stahilitiit der Ergchni\w fur die Daucr dcr Analyscnscric ruggedness
Stiiranliilligkeit durch Wechwl von Anwcndcr, Lahor. Cicriit
3.2 Die &ilidierungspurumeter einer unulytischen Methodc
45
Priifpunkt
Englische Bczeichnung
Aussage uber . ..
Arhcitshcreich odcr (dynamischer) MeRbcrcich
range
Konzentralionshereich iiir akzcptahlcl hestatigte Angahcn iihcr Richtigkcit, Prazision, Sclektivitiit, Lincaritat und Robustheit
Empfindlichkeit
scnsitivity
Fahigkeit, kleine Kon7~ntration~diflerenzen noch zu hestimmen: Stcigung der Kalibriergerade
Stabilitat
stability
Stabilitat von cingcsctztcn Liisungcn, Chemikalien usw.
Erfassungsgrcnze odcr Entscheidungsgrcnzc
limit of decision
Geringster Gehalt, der hei tatsichlichcr Anwesenhcit identifiziert wcrden kann; liegt zwischen Nachweis- und Bestimmungsgrenzc
Gcnauigkcit
accuracy
systematische und zutllligc Fchlcr, Genauigkeit ist kein eigenstandigcr Priifpunkt sondern sinngciniil!, dcr Oberbegriff fur Richtigkeit und PrYzision
Spezifitiit (wird oft h y n onym mit ,,Sclcktivitat"
spccificity
Fahigkeit, rinr Substanz (odcr Suhstanzklasse) ohne St(irung durch andcrc Komponenten zu hestimmen
Mehnsichcrhci t
uncertainty of the measurcment
Schwankungdw-cich dcs Mcliwcrtc9
Methoden fahigkeit
method capability
Fahigkeit, Ergebnisse xu liclcrn, dic innerhalb der Spezifikationsgrcnzcn liegen
MethodenstabilitSt/ ProzeBstabilitiit
mcthod stability/ process stability
Stabilitat dcs analytischcn Prozcsses/der Methode i n AbhSngigkcit von der Zeit
~~~~
verwendct )
~~
Erwcitertc Unsicherheit
~
Bereich, in dem ein Wert mit eincr gegebenen Wahrscheinlichkeit xu finden sein wird. Dieser wird durch ,,allc" realistischen, zufalligen und systcmatischen Fehler vorgegebcn.
Nachweisgrenze zu sprechen. Die Argumentation: ,,Nachweisgrenze" kann man auch einem Nicht-Naturwissenschaftler erklaren, ,,Bestimmungsgrenze" sei etwas schwieriger. Im Ubrigen ist Bestimmungsgrenzeja nichts Anderes als eine erweiterte MeBunsicherheit, der Zahlenwert ist individuell festzulegen (s. Abschnitt 3.9). Genauigkeit wurde fruher haufig synonym mit Richtigkeit benutzt. Sie urnfafit jedoch sowohl systematische als auch Zufallsfehler und als Oberbegriff fur Richtigkeit und Prlzi-
sion stellt sie keinen eigenstiindigen Prufpunkt dar. Um MiRverstiindnisae 7,u vertneiden. sollte dieser Begriff im Rahmen der Validierung nicht rnehr benutzt werden. Zwischen Selektivitnt und Spezifitiit wird oft kein Unterschied gemacht. Dieser Usus verhindert, daR man sich gerade dem Unterschied zwischen selektiven und spezitischen Messungen bewuBt w i d , siehe Abschnitt 3.6.1. Das Schiitzen der MeBunsicherheit gewinnt in Bereichen, in denen ex schnell uni einen ersten Eindruck von der Methode geht. an Bedeutung, wird allerdings allgemein nicht als Validierungselement angesehen - eher als Alternative zur Validierung. Methodenfihigkeit ist zweifelsohne ein sehr wichtiges Kriterium fur die Eignung einer Methode in der Produktanalytik. Es geht um die biniire Entscheidung: Produkt innerhalb der Spezifikation jdnein? Um so tnehr erstaunt es, daO dieses Element - was ja ein Urteil uber eine Ermittlung von Zahlen hinaus darstellt - relativ selten genannt wird, gerade in Fiillen, in denen Spezifikationsgrenxn vorgegeben sind. Ein weiteres wichtiges Kriterium ist die Stabilitiit des analytischen Prozesses. Das ist die Abhiingigkeit eines Ergebnisses von der Zeit bei Anwendung unter realen Bedingungen. Obwohl dieser Punkt ebenfalls ein erninentes Kriterium fur die Eignung einer Methode ist, wird man erst in jungster Zeit stiirker darauf aufmerksam. In Kapitel 8 und 9 wird auf dieses Kriterium niiher eingegangen. Es ist wichtig, sich ein ganzheitliches Urteil iiber die Eignung einer Methode xu bilden. Aus diesem Grunde werden nachfolgend neben den klassischen Validierungsparamctern auch das Schatmi der MeBunsicherheit und die erweiterte Unsicherheit (5. Abschnitte 4.3. 6.7 und Kapitel 9) sowie die MethodenMhigkeit (s. Abschnitt 3. I 1 ) ausfuhrlich behandelt.
3.3
Prazision
3.3.1
Definitionen und Erlauterungen
Priizision ist das Ma8 fur die Ubereinstimmung unabhiingiger Analysenergebnisse untereinander oder einfach ausgedruckt: das Ma8 fur die Streuung von Analysenergebnissen. Als Streuungsmalj und damit als PriizisionsmaB wird die Standardabweichung .Y. die relative Standardabweichung srCI.die identisch ist mit dem Variationskoeftizient V,, und etwas seltener die Varianz s2, verwendet.
,y
=
(x,
-
I7 -
mit:
-
EinLelwert
.I- Mittelwert
1
TI-
n s V $ s-
Anzahl der Messungen Standardabweichung Vdriationskoeffizient (relative Standardabweichung) . Vananz
Es gelten folgende Analogien: Priizision =
Streuparameter
Statistische GroOe: Standardabweichung Information: Grad der Streuung einzelner Werte um den Mittelwert, die Streuung ist das Ergebnis von zufalligen Fehlern
Richtigkeit =
Lageparameter
Statistische GroBe: Mittelwert Information: Abstand des Mittelwertes vom richtigen (,,wahren") Wert; dieser Abstand wird durch systematische Fehler (bias) bestimmt. Dem Sinne nach sollte er eigentlich ,,Unrichtigkeit" heiOen!
Genauigkeit = Streu- plus Lageparameter
Information: Abstand eines einzelnen Wertes vom richtigen (,,wahren") Wert, hervorgerufen durch systematische plus zufallige Fehler.
In Abb. 3- 1 werden die Unterschiede dieser drei verwandten Begriffe graphisch dargestellt.
Priizision,Streuung einzelner Werte urn den Mittelwert, Man : Standardabweichung
9.
............
richtiger Wert
t
+
Mittelwert Einzelwert Richtigkeit
( dern Sinne nach sollte es eigentlich " Unrichtigkeit " heinen! )
richtiger Wert
4
Einzelwert Genauiakeit des Wertes "x"
4
Abb. 3-1 Graphischc Darstcllung der Begriffe Prazision, Richtigkeit und Gcnauigkeit.
Siimtliche statistische Vergleiche und Ruckschlusse gelten unter der Annuhme einer repriiaentativen Probe. Gegebenenfalls ist diese Annahine ru veritirieren. Eine Standardabweichung kann grundsiitzlich fur jede statistische Verteilung von Werten verwendet werden. Wenn allerdings der Standardabweichung eine Wahrscheinlichkeit zugeordnet werden soll. so inuR von einer Norinalverteilung der Werte ausgegangen werden kiinnen. Zur Prufung auf Normalverteilung eignen sich mehrere Tests wie der Kolmogorov-Test, x'-Anpassungstest, Shapiro-Wiek-Test oder das Eintragen der Werte in ein Wahrscheinlichkeitsnetz. Diese Tests werden in den einschliigigen Buchern uber Statistik beschrieben. Hier wird der Schnelltest auf Normalverteilung nach David vorgestellt, der sich gerade fur eine kleine Stichprobe ( N < 10) eignet. Ein schsrferer Test ist der Chi-Quadrat-Test 12x1: Die Werte sind mit einer vorgegebenen Wahrscheinlichkeit (meist P = 99 %) normalverteilt, wenn der Quotient aus Spannweite R und Standardabweichung .s innerhalb der von David vorgegebenen GrenLwerte befindet. siehe Tabelle nach David, Abschnitt A.6. PG =
GroDter Wert Kleinater Wert Standardabweichung ~
R
- -
,\
Be ispic1 / 281
27 Einxlwerte werden aufAusreil3er bei der Bestinimung des Nitrat-Gehaltea einer Wasserprobe gepruft: Die MeBwerte: 0.5 1
0.5 I
0.49
0.5 1
0.5 I
0.53
0.38
0.5 1
0.43
0.53
0.52
0.48
0.52
0.50
0.53
0.49
0.37
0.53
0.54
0.55
0.52
0.43
0.52
0.5 1
0.52
0.50
0.4v
Sortierung der Daten nach der GroOe: 0.42
0.46
0.47
0.3X
0.48
0.49
0.49
0.40
0.49
0.50
0.50
0.5 I
0.5 I
0,s I
0.5 1
0.5 1
0.5 I
0.52
0.53
0.52
0.52
O,S2
0.52
0,53
0.53
0,53
0,55
Berechnung der PrufgriiBe nach David: Die Spannweite betriigt: R = 0.55
-
,\
= 0.0292
I1
= 27
0-42 = 0.13
3.3 Priizision
pG
R s
=-=
49
0 13 = 4,45 0,0296
Aus der Tabelle nach David werden die folgenden Werte g, und goentnommen ( P = 99 %, P: Signifikanzniveau, Wahrscheinlichkeit, P von propability): Da die Zahl27 in der Tabelle nicht aufgefuhrt wird, werden die nlchst benachbarten Zahlen, ngmlich 25 und 30 zur Prufung herangezogen. g , = 3,15
go = 5.06 (fur n = 25 und P = 99 %)
go = 5,26 gu = 3,27 (fur n = 30 und P = 99 %)
4,39 liegt zwischen der unteren und oberen Grenze. Es kann eine Normalverteilung der MeBwerte angenommen werden. ,.Unabhlngige" Ergebnisse konnen auf unterschiedliche Art und Weise gewonnen werden. Nachfolgend werden die unterschiedlichen Prazisionsarten besprochen.
3.3.2 Prazisionsarten 3.3.2. I Wiederholprazision, Wiederholbarkeit (fruher: Wiederholgenauigkeit) Damit ist die Prazision unter Wiederholbedingungen gemeint. Wiederholbedin~lrrigeii(DIN 5 1848, I S 0 5725) sind Bedingungen, unter denen voneinander unabhangige Ermittlungsergebnisse in kurzen Zeitabstgnden erhalten werden; und zwar mit rlernselben Verfahren. an identischen Objekten (selbe Probe), in dernselhen Labor, durch den selhen Bearbeiter und mit derselhen Gerateausrustung.
3.3.2.2 Vergleichsprazision, Vergleichbarkeit (hlufig auch: Reproduzierbarkeit, selten Ubertragbarkeit) Damit ist die Priizision unter VergleichsbedingunXengemeint. Vergleichsbedingungen (DIN 5 1848, I S 0 5725) sind Bedingungen, unter denen Ermittlungsergebnisse mit rlernselhen Verfahren, an identischern Material (selbe Probe), aber in ivrschiedenen Labors, von verschiedenen Bearbeitern und mit verschiedener Gerateausrustung erhalten werden.
3.3.2.3 Laborprazision oder laborinterne Vergleichsprlzision Man versteht darunter die Prlzision von Ermittlungsergebnissen derselben Probe innerhalb eines Labors bei bewuBter Anderung eines Parameters. Bei der Ermittlung kann beispielsweise ein anderer Bearbeiter und/oder ein anderes GerBt beteiligt sein, die Analyse wird an
unterschiedlichen Tagen durchgefuhrt, eventuell durch EinsatL von Reagenyien anderer Charge usw. Was genau und in welchem Ausmal!, variiert werden sollte, hiingt von der konkreten Fragestellung und der konkreten personellen und apparativen Laborsituation ah. Das bedeutet zweierlei. Zuniichst gilt zu uberlegen, was sich bei der Routineanwendung der betreffenden Methode realistischerweise indern kbnnte. AnschlieRend ist zu prufen, inwieweit diese Variablen das Ergebnis beeinflussen, das he& nichts anderes als die Priizision der Methode unter realen Bedingungen zu bestimmen.
3.3.2.4 Weitere PriiLi sionen Recht selten wird von der ,,Priizision LWZ Srrie ,711 Scrir" (between-run precision oder ,,within day" oder ,,intra day") berichtet. Es handelt sich dabei um die Ubereinstimnung zwischen voneinander unabhiingigen Ermittlungsergebnissen, die mit tferi?.selhrriVerfahren, an ic/e/7ti.~c/7riii Material (selbe Probe). in drnisr//~rn Labor. durch tlerise/brri Bearbeiter. aber in i , e / : ~ ~ . h i r r / eSerien / i ~ r i erhalten werden. Ebenso spricht man auch von einer ,,frii:isio/i im 7ug ; I ( 7iig". .,day to day" oder ,,interday". Das ist nichts Anderes, als die Wiederholpriilision, allerdings nicht ..in liurl.cn Zeitabstiinden" sondern eben an z. B. 6 darauffolgenden Tagen. Die Wiederholpriizision wird praktisch in jedem Labor uberpruft. Eine Prufung aut' Laborpriizision empfiehlt sich immer, sobald die Methode iius irgendeinem Grund als .,kritisch" einzustufen ist: z. B. Methode zur Gehaltsbestiminung, quantitative Bestimmung von Verunreinigungen, neue Methode im Labor. Die Vergleichsprii~isionkann von den ublichen Validierungsarbeiten abgekoppelt betrachtet werden. Deren Uberprufung wird notwendig, wenn mehrere Labors tnit der betreffenden Methode arbeiten sollen. So wird richtigerweise immer wieder angernerkt, daR Vergleichspriizision eigentlich kein Validierungsparameter einer Methode darstellt. Gleichauf ist sie ein wichtiges Kriterium fur die VerliilJlichkeit der Ergebnisse der betreffenden Methode, wenn sie i n verschiedenen Labors eingesetzt wird. So stellen Ringversuche vor allem iin nicht reglementierten Bereich (Pharma), wie Untersuchungsiimter, Auftragslabors, Institute usw. ein wichtiges Werkzeug der Qualitiitssicherung. Priizision gilt generell als quantitatives Ma13 f u r die Robustheit einer Methode, siehe Abb. 3-2 und Abschnitt 3.5.2.3. Bei Vorgabe von Spezifikationsgrenzen (sind sie gerechtfertigt?) ist eine priizise Methode stets eine robuste Methode und damit eine .,gute" Methode. Bei vorgegebenen SpeTifikationsgrenzen wiire in Abb. 3-2 die priizise Methode I fur die Routine vorzuziehen. Auch wenn es zu einer stiirkeren Streuung der Werte durch allerlei Eintlusse kiime, wiirden sich die Werte dennoch innerhalb der Spe7ifikationsgrenzen befi nden.
3.3 Prii:i.sion
e- Spezifikationen
51
--+
A
.4-4
a
Y 0
F 3
:m
I I
Charakteristik
I
Abb. 3-2 Zu Spe~itikarionsgrenzenund Prazision von Methoden. 1 prilzise, 2 weniger prlLise.
3.3.3 Me& und Methodenprazision In der instrumentellen Analytik gibt es prinzipiell zwei unterschiedliche Grunde fur eine Streuung von Ergebnissen, namlich das Analysengerat selbst und die Methode. Die einzelnen Beitrage hangen von dem MeBprinzip und der Komplexitat des Analysengerates ab, sowie der Anzahl und dem Schwierigkeitsgrad der Schritte einer Methode, der Konzentration, der Matrix usw. Somit ist zwischen MeB- und Methodenprazision zu unterschieden. Die MeJprazision (Geriitepruzision, Systemprazision) ist ein Ma13 fur die Schwankungen, die durch das Analysengerat selbst verursacht werden. Erinittlung Ein Standard oder eine stabile, homogene Probe wird sechsfach (manchmal zehnfach) gemessen und der Variationskoeffizient bestimmt. In der HPLC z. B. geschieht dies, indem man eine Standardlosung sechsfach injiziert und den Variationskoeffizienten uber die Peakflachen bestimmt. Die Methodenpra:ision ist ein Ma8 fur die Schwankungen der Ergebnisse, die durch alle Schritte der Methode verursacht werden, z. B. Probenahme, Wiegen, Probenvorbereitung, Extraktion, Filtration, Messung, Auswertung. Ermittlung Sechs unabhangige Einwaagen (bzw. sechs Muster, wenn die Probenahme ein Teil der zu validierenden Methode ist) werden analysiert und der Variationskoeffizient bestimrnt.
3.3.4 Rechenbeispiele 3.3.4.1 Vergleich von Mittelwerten und Variationskoeftiirienten Der ledigliche Vergleich von Mittelwerten liefert ein verxrrtes Bild der Realitlit. Zur Beurteilung eines Ergebnisses gehart auch das Wissen uni die Streuung der Werte. die zu diesem Ergebnis fuhrten.
Brispicl Zwei Labormitarbeiter analysieren den Cehalt eines Wirkstoffs in einer neuen Forniulierung (mg/Kapsel). Die erhaltenen Ergebnisse lauten:
-
1. Anwcnder
2. Anwender
30.3
30.5
30.3
30.4
30.3
30.5
30.2
30.7
30.0
30.2
30.3
29.1 -
= 30,23
.Y
= 30,23
.Y
= 0.12
s
= 0.58
V,,
= 0,40
v,,
= 1,92
.I-
ObwohI der Mittelwert in beiden Mel3aerien identisch ist (30,23),ist die Streuung der Werte im zweiten Fall groBer (VK2 = 1.92 gegenuber V,, = 0.40). Das konnte miiglicherweise a n der Arbeitsweise des zweiten Anwenders oder an deaaen Apparatur oder an einer fehlerhaften Waage liegen.
Bciticrkirii~g: Der Mittelwert und die Standardabweichung kijnnen heute nahezu von jedern Taschenrechner berechnet werden. NichtsdestotrotL sollen Ihnen hier zwei empirische Formeln nicht vorenthalten werden: .\
=
.\
=
griiBter Wert
+ kleinster Wcrt 1
grd3ter Wert
-
.Y
kleinster Wert
3.3 Priizisiori J''
53
ist abhangig von der Anzahl der Werte und kann folgender Tabelle entnommen werden: n
X
2
I ,4
3
I ,9
5 6
2.6
2.1 3,3
10
20
3.9
50
4,h
Fur obige Beispiele erhalten wir:
x
=
30,3 + 30,O 2
=:
30,15
(errechneter Wert: 30,23)
(errechneter Wert: 0.58)
s=
30,3 - 30,O = 0,l 1 2.7
(errechneter Wert: 0,I2)
3.3.4.2 Vergleich von Meljwertreihen Zum Vergleich der Prazision zweier MeBwertreihen eignet sich der Variationskoeffizient (relative Standardabweichung) und nicht die Standardabweichung.
Beispiel Eine HPLC-Methode, die in zwei Labors routinemiiljig Iiiuft, rnacht Problerne. Die Retentionszeiten schwanken stark. Da die Bedingungen in beiden Labors vollig identisch sind (sogar die Charge der stationLen Phase und auch der ,,Packer" der Saule) wurden die Pumpen verdachtigt. Darauthin wurde die Fluljkonstanz der zwei Pumpen uber die Prizision der Retentionszeit verglichen. Bei beiden Pumpen wurde ein s-Wert von 0,12 festgestellt; ausschlieljlich diese Information wurde weitergegeben und diskutiert. Sind also beide Pumpen gleich ,,gut"? Das mu13 nicht sein. Der erste Anwender wollte den Test schnell durchfuhren und verwendete Substanz A, die schnell eluiert. Der zweite Anwender nahm dafur Substanz B, die in der Probe als letzte eluiert. Nach sechsmaliger lnjektion der Substanz A in Anlage A und der Substanz B in Anlage B erhllt man folgende Retentionszeiten [min]:
Anlagc A
Anlage B
2.3
10.1
2.2
9.9
2.3
10.2
2.4
10.0
2.1
I0.0
2.4
9.9
.s
= 0. I2
.P
= 0.12
v,
= 5.26 %
v,
= 1,20 %
Bei gleicher Standardabweichung (hier: s = 0,12) und unterschiedlicher Absolutwerte kann der Variationskoeffizient zweier MeDreihen recht unterschiedlich sein. In diesem Beispiel arbeitet die zweite Pumpe wesentlich priiziser als die erste. Man kann bei einer kleinen Stichprobe ( N < 12) eine Sicherheit einbauen, in dem der Wert der Standardabweichung mit einem sogenannten Vertrauensfaktor multipliziert wird. Die untere V e r t r f i i 4 ~ ~ n . s ~ s r e i ~ ~ ~ ~ fiir die Standardabweichung kann n u n wie folgt berechnet werden:
mit:
.xu
Standardabweichung fur die untere Vertrauensgrenze
K , einseitiger Vertrauensfaktor fur P = 0,95 und f = ti-l
Sein Wert kann fiir eine Anzahl von MeBwerten zwischen 5 und 13 nachfolgender Tabelle en t n o mme n we rde n : ./= I!
-
I
Kf 2.372
2,089 1.915
1,797 X
1.71 I
9
1.645
I0
1.593
II
I .5s I
12
1.515
3.3 Prii:isioii
55
Fur unser Beispiel mit n = 6 Werten ergibt sich: f =6-1=5 K f = 2,089
In der Analytik sind Doppelbestimmungen iiblich. In diesem Fall wird die Standardabweichung wie folgt berechnet:
und in einer MeRreihe mit n-Werten:
mit:
n = Anzahl der Werte
Nehmen wir an, daR beim obigen Beispiel die Retentionszeiten der Substanz A in der Anlage A durch Doppelinjektion ermittelt wurden. 1. Injektion
2. Injektion
Wie grol3 ist nun die resultierende Standardabweichung?
I 2.6
s = &(2.3
~
2,2)*+ (2.2- 2.2)' + (2,3- 2.4)' + (2.4- 2,s)' + (2,l- 2.3)'
+ (2.4- 2,s)'
=
.\
\i
0.0 1 + 0 f 0.0 1 + 0.0 1 + 0.04 + 0.0 I 12
=
0,082
Der Gesamtmittelwert aus I I = 2 . 6 = 12 MeBwerten betragt 2,32. sornit ergibt sich als Variationskoeffkient fiir alle I2 MeRwerte:
v, =-.
2.32
100 = 552
%I
Es inu1.5 individuell entschieden werden, ob der Vorteil der Abnahine des Variationskoeftkienten von 5,26 % auf 3 3 2 % den Mehraufwand durch die Doppelbestirninung ausgleicht (s. auch Abschnitt 3.4.3).
3.3.4.3 Vergleich von Methoden. die aus stochastisch unabhiingigen Schritten bestehen Stoc~Iici.sti,sc~k 1~17uhlziingige Pro:esse sind Prozesse, bei denen die einzelnen Schritte sich gegenseitig nicht beeinflussen. I n der Analytik bedeutet dies, daR ein Fehler, der in Schritt A einer Methode gemacht wurde, den Fehler, der miiglicherweise wiihrend des Schrittes B passiert. nicht beeinflufit. Wenn eine Probe falsch eingewogen wurde, hat dies keinen EintluB auf die Richtigkeit bei der Wellenliingeneinstellung eines Photometers (stochastisch unabhiingiger ProzeB). Ein Fehler bei der Extraktion dagegen kann die Linearitiit und die Selektivitiit in der HPLC beeintriichtigen (stochastisch abhiingiger ProzeD). Bei stochastisch unabhangigen Prozessen, wie sie in der Analytik oft vorkommen, gilt die Additivitat der Varianzen:
rnit:
\lc, Ge5amtvarianz der Methode \f
7
Varianz von Schritt I
5.
Varianz von Schritt 2
5;
Varianz von Schritt 3 u\w.
Was kann ein Anwender n u n in der Praxis mit dieser Aussage anfangen? Betrachten wir ein fiktives Beispiel: Be isp ie 1 Zwei Methoden sollen aus je drei Schritten bestehen; niimlich Einwaage inkl. Aliquotieren. Festphasenextraktion und Messung. Die Streuung der Werte in den einzelnen Schritten (Beitrag zur Gesamtstreuung) ist unterschiedlich. siehe Tab. 3-2. Bei Methode I 1st der Fehler bei den einzelnen Schritten gleich gro0 (.s = 3 ) , bei Methode 2
~
57
3.3 Priizisiori
Tab. 3-2 Vergleich zweier Methoden anhand der Streuung der Wcrte in den einzelnen Tcilachrit-
ten.
Methode 2
Methodc 1 ~~
Einwiegcn incl. Ahquotieren
3
9
6
36
Fcstphasenextraktion
3
9
2
4
Messung
3
9
1
I
Standardabwcichunglvarianz
1 Sge5
=
9
C
sics = 27
1 "ges
=
9
C
sic, = 4 1
ist das Wiegen und Aliquotieren mit einem groRen Fehler (s = 6), dafur aber die Festphasenextraktion und die Messung mit einem kleineren Fehler behaftet (s = 2 und s = 1 ). Welche Methode ist ,,besser"? Methode 1 ist vorteilhafter, denn obwohl die Summe der drei Standardabweichungen in beiden Fallen 9 ergibt, ist die Summe der Varianzen (das Quadrat der Standardabweichung) im ersten Fall 27, im zweiten 41. Durch Wurzelziehen ergibt sich als Gesamtstreuung (Gesamtstandardabweichung) im ersten Fall ein Wert von 5,2, im zweiten Fall ein Wert von 6,4. Das bedeutet, daB Methode 1 priiziser ist. -
Nehmen wir jetzt weiterhin an, dab durch Automatisierung des Extraktionsschrittes mittels eines Roboters die Streuung der Werte bei der zweiten Methode auf einen Wert von 0,5 herabgesetzt wird. Die zweite Methode wird dadurch vielleicht schneller, jedoch nicht praziser als die erste, denn 36 + 0,25 + 1 = 37,25. Und J37,25 = 6.1
ist immer noch groBer als der Wert 5,2 bei der ersten Methode. Als Konsequenzen fur die Praxis ergeben sich erstens, daB es sich lohnt, das Gesamtverfahren genauestens zu analysieren, um die kritischen Schritte ausfindig zu machen. Diese miissen zuerst und ausfuhrlich validiert werden, urn sie gegebenenfalls anschlieBend zu optimieren. In der Praxis wird Schritten, die ohnehin recht unkritisch sind und dazu gehort z. B. der MeBvorgang - oft eine unverhlltnismaBig groBe Aufmerksamkeit geschenkt! Zweitens muB bei Investitionen, die das Ziel haben. eine ,,bessere" Analytik zu ermoglichen, eine kritische Beurteilung des PreisLeistungsverhiiltnisses unerlaBlich sein. Wie soeben gezeigt, ist simple Mathematik dabei hilfreich. -
Noch ein weiteres fiktives Beispiel dazu: Ein HPLC-Verfahren weist eine Standardabweichung aller Schritte bis auf die Messung von s = 2 auf, die MeBprazision des 10 Jahre alten HPLC-Gerates betragt s = 030. Lohnt sich eine Investition von ca. 80.000 DM fur ein HPLC-Gerat der neuesten Generation mit einer MeBprazision von s = 0,15? Wegen der sicherlich exzellenten Prszision bestimmt nicht, der Gewinn ist vernachlassigbar:
Streuung aktuell:
sic\= 2' sgc, =
Streuung zukunftig:
+ 0,SO'
44,250
.sics = 2'
=
+ 0,IS'
=
4.250.
2,062 ! =
4,022,
spe, = 44,022 = 2,006!
Selbstverstandlich stellt ,,Priizision" nicht das einzige Kriterium fur oder gegen eine Neuanschaffung dar. Sol1 allerdings die Prazision verbessert werden, so mu13 man an dem kritischen Schritt ansetzen, im besprochenen Beispiel an dem Geschehen I W der Messung. z. B . Probenvorbereitung: Es gilt, den Term ,,2'" zu verkleinern. ResuriiP Ein Ma13 fur die Streuung eines Mittelwertes ist die S t t i r i r l r i r ~ ~ t i h r r , f / [ , ~ ? i ~ / ~ , s . Fur den Vergleich der Priizision von MeBwertreihen eignet sich der Vtiricitiori.skoc:'~;tfi,-iPnt. Ein Ma8 fur die Streuung der einzelnen Schritte eines Prozesses ist die Vtiritiri: in diesen Schritten. -
3.3.5
Angaben zur Priizision und deren Deutungsmiiglichkeiten
Wiederholtests sind eine Selbstversthndlichkeit in allen Bereichen, in denen Znhlen ermittelt werden. So auch bei der Validierung. Priizision stellt ein wichtiges Verfahrensmerkmal dar. Deren Uberprufung, sowie die Uberprufung der Richtigkeit wird sogar als Minimalvalidierung bezeichnet: 6fach Bestimmung einer Probe und Vergleich mit einem Referen/.standard. Gleichauf ist Priizision neben Robustheit und Linearitat das Vrilidierungselement mit der hochsten Quote an MiOverstSndnissen, wenn es um die praktische Durchfuhrung geht. Das durfte zum einen durch unterschiedliche Interpretation von xu vielen, ungliicklichen oder ungenauen Formulierungen herruhren. Zum Anderen herrscht kein einheitlicher Umgang mit gewonnenen Zahlen. Nachfolgend wird kurz auf die lnterpretationsbandbreite von Angaben eingegangen. AnschlieBend werden wir uns etwas ausfuhrlicher mit dem Urngang mit Zahlen beschhftigen (s. Abschnitt 3.3.6).
Beispiclc 1st ,,Bestimmung" gleich Messung oder umfal3t eine .,BestimmLing" mehr? Zitat aus einer SOP: .,Bestimmung: Einwaage und Aufarbeitung je einer Probe und eines Standards. Doppelinjektion . . .'* Wie ist die Aussage ... .. Die Anzahl der Werte zur Ermittlung der Prii7ision betrug I2 '' LU deuten? 6 Einwaagen. Doppelbestimmung = I 2 Werte 4 Einwaagen, 3fach Bestimmung = 12 Werte 12 Einwaagen. Einfachbestimmung = 12 Werte I 2 Einwaagen. Doppelbestimmung, daraus Mittelwert = 12 Werte Drei Konzentrationen (z. B. 80 %, 100 %. 120 'k des erwarteten Gehaltes). zwei Einwaagen, Doppelbestimmung = 12 Werte. -
3.3 Prii5sion
59
Tab. 3-3 Priizisionsdaten eines HPLC-Experimentesunter Wiederholbedingungen.
RetentionsLeit rminl
-
X Y
VK
Flache
Flache/RetentionsLeit
6,52
4325
663,34
6,49
4290
66 1,02
6,50
4330
666, I5
0,53
4288
656,66
6,49
4335
667,95
6,48
4315
665,90
6,50
43 14
663,50
0,O I9
20,35
4.14
0,29 % !
0,47 %!
0,62 %!
- Wurden Standards vermessen oder reale Proben, wie ist der EinfluR der Matrix? - 1st der Ausgangsstatus der Probe gleich gewesen? z. B.: 1st die Temperatur der Probe zwischen der ersten und der letzten Einwaage kon-
stant gewesen?
- Wurden Verdampfungsprobleme des Losungsmittels berucksichtigt, vor allem, wenn
Probedstandards unterschiedlich lang benutzt wurden? Wurden bei StreRtests die Bedingungen konstant gehalten? - 1st der Zeitabstand zwischen den einzelnen Messungen konstant gewesen? - 1st bekannt, auf welche Konzentration die angegebenen Prlzisionswerte sich beziehen? - Wurde zur Ermittlung des Variationskoeffizienten bei einer chromatographischen Trennung die Absolutfllche der Peaks, der daraus errechnete Gehalt oder womoglich das Verhlltnis aus Flache und Retentionszeit verwendet? (siehe d a m Beispiel in Tab. 3-3). -
Wird nicht eindeutig definiert, welche Zahlen zum Vergleich genommen werden, ist Vergleichbarkeit von Ergebnissen nicht gegeben. Deswegen ist die Aufnahme von Rechenbeispielen in Validierungsberichten und Priifvorschriften eine gute Praxis. Zur Vergleichbarkeit von Ergebnissen siehe auch weiter unten. - Wurden die Messungen mit einer - im Vergleich zum Laboralltag - besonderen Sorgfalt durchgefuhrt? Wurden beispielsweise die verwendeten Hilfsmittel (Waage, Pipetten, Detektor) unmittelbar davor kalibriert? - Handelt es sich bei der angegebenen Standardabweichung um die ,,iibliche" Standardabweichung, z. B. 6 Werte pro MeRserie, 6 MeRserien, also Standardabweichung aus 36 MeRwerten oder vielleicht um die Standardabweichung der Mittelwerte: 6 Mittelwerte aus den 6 MeRserien und Standardabweichung der 6 Mittelwerte?
3 Die ~ilidirncngspar.umeter
60
3.3.6 Umgang mit Zahlen und Moglichkeiten zu deren Beurteilung Es liegt in der Natur der Sache, daB MeBwerte streuen. Das kann man problemlos auch akzeptieren. Man sollte sich allerdings auf objektive Kriterien verstiindigen, wenn es urn die Entscheidung geht, welche Abweichungen nicht mehr akzeptiert werden und wie beim Auftreten eines solchen Falles weiter verfahren werden soll. Gelten keine objektiven Kriterien fur alle rnit der Methode Arbeitenden, so ist eine wichtige Voraussetzung fur eine Vergleichbarkeit von Ergebnissen nicht gegeben. Es ist nahezu zweitrangig welche Kriterien gelten. Sind sie einrnal festgelegt, kann nun deren Einhaltung rnit Hilfe von Tests gepruft werden. Allen Tests gemeinsarn ist die Berechnung bestimmter Zahlen (PrufgroRe oder Prufwert) und anschliefiend der Vergleich rnit Tabellenwerten. Fur diese Berechnung sind sehr einfache rnathernatische Operationen notwendig, benotigt werden lediglich der Mittelwert und die Standardabweichung. Beurteilung von Werten einer MeBserie bedeutet nun die Beantwortung folgender Fragen: 1. Gibt es AusreiRer? 2. Liegt ein Trend vor? 3. 1st in der Routine die Differenz zweier Werte, unter Wiederholbedingungen gewonnen, noch akzeptabel? 4. 1st es statthaft, diese zwei MeBreihen zu vergleichen?
Dazu eignen sich folgende Tests: -
AusreiBertests Trendtest nach Neumann Errnittlung der kritischen Wiederholgrenze F- und Cochran-Test
Fur den Vergleich zweier Werte, z. B. Soll-/Istwert (Richtigkeitsprufung), eignet sich der tTest und der Wilcoxon-Test. Diese werden in Abschnitt 3.4.2.1 besprochen. Nachfolgend werden oben genannte Tests kurz erliiutert. 3.3.6.1 AusreiBertests oder Verlablichkeitstests
Zweck:
Uberprufung, ob es sich bei einem Wert, der von den anderen auffallend stark abweicht, urn einen AusreiBer oder um eine zufdlige Abweichung handelt.
Vorteil:
Die Entscheidungsgrenze wird innerhalb des Labors/Abteilung ,,norrniert", es gelten objektive Entscheidungskriterien.
Nachteil: Es entsteht ein zusitzlicher Aufwand. Wichtig: Es mu6 f u r den Fall einea AusreiRers geklLt sein, wie weiter verfahren wird. In der Literatur herrscht keine allgerneine Meinung vor. Die Moglichkeiten rei-
3.3 Priizision
61
chen von: .,der Wert wird ersatzlos gestrichen" bis ,,der Wert wird durch zwei (drei) neue Werte ersetzt". SchlieBlich gilt ebenfalls zu klaren, ab welcher Haufigkeit und welcher Abweichung welche MaBnahrnen ergriffen werden rnussen. Werden laut SOP Ausreiljer lediglich eliminiert ohne Hiiutigkeit und Anzahl weiterzumelden oder zu dokumentieren, wird von Nichtbeteiligten die Prazision und die Robustheit der Methode uberschatzt. Die zwei bekanntesten Tests sind der Dixon- und der Grubbs-Test. Dixon-Test Vorgehen: Man bilde die GroBe Q nach der Gleichung
mit:
x, ausreifierverdachtiger Wert x2 benachbarter Wert
R Spannweite (Abstand zwischen kleinstem und groBtem Wert)
und vergleiche diese mit einem Tabellenwert, siehe Dixon-Tabelle, Abschnitt A.6. Der Wert gilt als AusreiBer, wenn die berechnete GroBe Q groljer als der entsprechende Tabellenwert bei einem Signifikanzniveau von P = 99 % ist, d. h. wenn die Wahrscheinlichkeit fur die Richtigkeit dieser Aussage 99 % betrlgt.
Beispirl I Es werden folgende Werte ermittelt: 7,0, 7.8, 5,0, 8,3,9,0, 6,9, 14,O ausreiflerverdachtiger Wert: 14
Uberprufung: Q =
~
114-91 5 = - = 036 9 9
0,56 ist kleiner als 0,64, laut Dixon-Test ist der Wert 14 kein AusreiBer. Das bedeutet nicht, daR der Wert richtig ist! Der Test sagt lediglich aus, daB die Wahrscheinlichkeit, daR dieser Wert ein AusreiBer ist, im vorliegenden Fall ,,nur" ca. 94 % betriigt. In der Analytik hat sich eingeburgert, einen Wert als AusreiBer anzusehen, wenn die Wahrscheinlichkeit dafur 99 % betragt.
Begt-iirzdung Aufgrund der in der Regel geringen Anzahl der ermittelten Werte sollten statistische Tests vorsichtig interpretiert und deshalb nur signifikante (99 %) und nicht lediglich wahrschein-
liche (95 %) Unterschiede berucksichtigt werden [29]. Man kann sich naturlich - wenn strengere Kriterien sinnvoll erscheinen - auf ein Wahrscheinlichkeitsniveau von 95 % oder gar 90 c/o verstiindigen.
Beispiel2 Es geht noch einmal um die oben angegebene Reihe mit dem Unterschied, daO der Wert ,,5,0" durch den Wert ,,6,5" ersetzt wird. 7,0, 7 3 , 6,5, 6 3 , 8,3, 9,0, 6,9, 14,O ausreiflerverdiichtigter Wert: 14
Uberprufung: Q
=
~
114-91 7,s
5 73
= -=
0,67
0,67 ist groRer als 0,64, laut Dixon-Test ist der Wert ,,14" ein AusreiOer. Je weniger die Werte in einer Reihe streuen, d. h. je prlziser eine Messung ist, um so eher werden AusreiOer erkannt. Uberspitzt ausgedruckt: Je unprlziser eine Methode ist, urn so geringer ist die Gefahr, auf AusreiOer zu treffen. Oder anders formuliert: Bei einer auf Priizision ,,getrimmten" Methode werden auch kleine Abweichungen als AusreiRer .,entlarvt". Die Anwendung einer solchen Methode in der Routine ist erschwert, s. auch ,,Robustheit", Abschnitt 3.5. Der Test nach Dixon ist generell relativ unscharf, fuhrt jedoch in geringerem MaRe zu falsch positiven Ergebnissen. Dem koinmt der Test nach Grubbs entgegen, da er nur deutlich abweichende Werte erkennt [29]. Grubbs-Test Dieser hat die gleiche Zielsetzung wie der Dixon-Test. Auch hier wird gepruft, ob ein Wert mit einer starken Abweichung ein AusreiOer ist oder nicht. Vorgehen: Man bildet die PrufgriiBe Q nach der Gleichung:
mit:
xI ausreil3erverdachtigter Wert
X Mittelwert s
Standardabweichung
und vergleiche diese mit einem Tabellenwert, siehe Grubbs-Tabelle Abschn. A.6. Der Wert gilt als AusreiBer, wenn die berechnete GroBe Q grol3er ist als der entsprechende Tabellenwert bei einem Signifikanzniveau P = 0,99.
3.3 Priizision
63
Beispiel Bei einer Gehaltbestimmung wurden folgende Werte ermittelt: 50,48, 52,47, 53, 61, X : 51,84, s : 5,04 ausreifierverdiichtiger Wert: 61
Uberprufung: Q =
61 - 5 l,84 5,04
=
1,817
I ,8 I7 ist kleiner als 1,944 ( P : 99 %) und sogar kleiner als 1,822 ( P : 95 %). Laut GrubbsTest kann der Wert ,,6 I nicht als AusreiBer deklariert werden. "
Bei dem Dixon-Test werden fur die Berechnung nur drei Werte benotigt: der ausreiserverdlchtige Wert, der Nachbarwert und der kleinste bzw. groljte Wert der Serie (zur Ermittlung der Spannweite). Die Anzahl der Werte dazwischen ist fur die Berechnung nicht relevant. Je groBer die Anzahl der MeBwerte ist, um so weniger aussagekrlftig wird der DixonTest. Die Empfehlungen in der Literatur fur einen Dixon-Test schwanken zwischen 5 und 8 Werten. Bei dern Grubbs-Test werden durch die Einbeziehung von X und s in die Berechnungsformel alle Werte berucksichtigt. Er eignet sich ab 6 bis 8 Werten. Eine Schwlche des Grubbs-Tests sollte nicht verschwiegen werden: Sind in einer Reihe zwei extreme Werte vorhanden, so heben sie sich gegenseitig auf. Das Ergebnis nach dem Grubbs-Test wurde lauten: ,,kein AusreiBer". Eine Abhilfe bietet der sogenannte ,,paired Grubbs-Test", auf den hier nicht eingegangen wird, siehe dazu [30]. Es folgen nun zwei Tests, die selten erwahnt werden, die aber nicht minder praktikabel sind. Henning-Test Vorgehen: Man bilde die GriiBe Q nach der Gleichung:
Q
= Ix, - XI
und uberpruft, ob
3 s 2. Q ist mit:
x, AusreiBerverdlchtiger Wert
X Mittelwert Ein AusreiBer liegt vor, wenn Q groBer ist als die dreifache Standardabweichung.
Beispiel Eine Kapillar-GC-Methode liefert folgende Retentionszeiten: 14,38, 14,40 , 14,38, 14,36, 14,37, 14,38, 14,38, 14,39, 14,39, 14,38, 14,41 ausreifierverdlchtigter Wert: 14,41
s = 0.01 I IXI -
x-1 = 14.41
-
14,M = 0,030
3 s = 0,033 > 0,030 Ausaage: Der Wert ,,41" ist ein AufJreilJer Mittelwertabweichung Viele Labors gehen einen einfachen pragmatischen Weg: Ein Wert gilt als AusreiOer, wenn er um mehr als *I0 56 von dem Mittelwert abweicht. Der AusreiOertest nach Nalimov pruft den groBten und den kleinsten Wert auf Ausreifler, niiheres s. [2X].
Brmrrkittig Es sei noch einmal betont: In der Analytik geht es u. a. urn Vcrpleichbarkeit. eine Voraussetzung dafiir ist die Existenz objektiver Kriterien. Auch folgende Empfehlung einiger Organisationen (z. B. FDA) entspricht einer objektiven Vorgehensweise - obschon mancher Analytiker evtl. daniit P r o b l e m hiitte: Es gibt prinzipiell keine AuareiBer. es werden siimtliche ermittelte Werte bei den Bercchnungen z. B. von V , beriicksichtigt.
3.3.6.2 Trendtest nach Neumann Zielsetzung: Priifen, ob die MeRwerte im zeitlichen Verlauf fallen oder ansteipen Br ispiele,f l i t - Twt i d s Werte fallen, wenn die Probe sich zersetzt. Werte steigen an bei anfiinglicher Adsorption der Probe an der Oberfliiche einer Stahlkapillare in einem Fliissigkeitastrom und allmiihlicher Siittigung der selbigen. Vorgehen:
mit:
ti
.t-,, \
Man bildet die GriiRe Q nach der Gleichung:
Anrahl der Mel3werte x,,, MeBwerte. Die Werte werden nach ihrer chronologixhen Reihenfolge ge-
ordnet Standardabweichung
3.3 Prii,-i.rion
65
Diese GroBe Q wird mit einem entsprechenden Tabellenwert, siehe Neumann-Tabelle, Abschnitt A.6, bei einem Signifikanzniveau P = 95 % verglichen. 1st Q grol3er als der Tabellenwert, liegt mit einer Wahrscheinlichkeit von 95 % ein Trend nicht vor. Wiihrend bei den AusreiBertests sich ein Signifikanzniveau von P = 99 % (99 % Wahrscheinlichkeit) eingeburgert hat, ist jenes bei den anderen Tests meist P = 95 %. Der Trendtest nach Neumann wird nicht so oft durchgefuhrt, da eine Drift von Zahlen auch ohne diesen Test leicht erkannt wird. Werden Kontrollkarten gefuhrt, ist das Erkennen einer Drift nicht nur leichter sondern man erhalt noch weitere zusatzliche Informationen. 3.3.6.3 Errnittlung der Wiederholgrenze Bei Anwendung von Routinemethoden lautet im Falle von Doppelbestimmungen eine hiiufige Frage im Alltag: Welche Differenz zwischen den Einzelwerten sollte noch akzeptiert werden? Diese Differenz, die kritische Wiederholdifferenz r; ist
mit:
.s
f
Standardabweichung aus Validierungsdaten empirisch ermittelter Zahlenwert, der von dem gewahlten Signifikanzniveau und der Verteilung der Werte abhangt [30].
Fur ein Signifikanzniveau P = 95 % (s. oben) und unter der Annahme einer Normalverteilung ist der Wert v o n f = 1,96 und somit r r =
1,96. h . s = 2,77 . s
= 2,8 . s
Das heifit, es wird akzeptiert, wenn in 5 Fiillen von 100 (95 %!)die Differenz zweier Einzelwerte bis ca. die dreifache Standardabweichung betragt. Fur ein Signifikanzniveau von 90 % ergibt sich ein Faktor von 2,3 und fur ein Signifikanzniveau von 99 % ein Faktor von 3,65. Der Test Lur Ermittlung der Wiederholgrenze erinnert an den Henning-Test. Ob Henning-Test, kritische Wiederholgrenze oder Methodenf&higkeit (siehe Abschnitt 3.1 1 ), das Prinzip der Gaukistatistik dringt durch. Eine Streuung von +3 s urn einen MeBwert, also eine Spanne von insgesamt 6 s, wird hiiufig als Konvention akzeptiert. Die Wahrscheinlichkeit niimlich, daR der Wert bei der n2chsten Messung sich innerhalb eines Streufensters von 6 s befindet, ist ca. 99,73 %. 3.3.6.4 F- und Cochran-Test
Vorhrrnerkung Sowohl fur den F- (nach dem Autor Fisher) als auch fur den Cochran-Test gelten folgende Voraussetzungen: I . beide Datenreihen sind normalverteilt, 2. beide Datenreihen sind frei von AusreiBern.
F-Test, Test auf Varianzenhomogenitiit Zweck:
Priifen, ob die Standardabweichungen aus zwei unterschiedlichen MeOreihen vergleichbar sind, ob also Varianzenhomogenitat herrscht (Test auf Gleichheit der Varianzen). 1st das der Fall, so stammen die Werte aus einer Grundgesamtheit. Dabei mussen die zwei Meljreihen nicht gleich groB sein.
Vorgehen:
Man bildet die Prufgrolje F nach der Gleichung:
F
t,wobei s I> s2 ist SL
=
.y>
mit: s,,.s2 Standardabweichungen der zwei MeBreihen Der erhaltene Wert wird mit einem Tabellenwert F ( P , f l , f 2 ) siehe , F-Tabelle, Abschnitt A.6 verglichen. Dabei bedeuten: ji Zahl der Freiheitsgerade, es gilt: f = n - 1 n Anzahl der Meljwerte 1st F groljer als der Tabellenwert, so gilt ein Unterschied der Standardabweichungen mit einer vorgegebenen Wahrscheinlichkeit als erwiesen, z. B. fur n , = n2 = 6 und P = 95 % gilt: F = 5,OS; fur n 1 = 6, n2 = 10 und P = 99 % gilt: F = 6,O6
Beispiel Es sollen die Gehalte des Wirkstoffs NOVIALIN aus den Produktionschargen A und B auf Varianzenhomogenitlt getestet werden. 18,3 18,l 18,6 17,9 18,O X = 18,22, s = O , 3 O 24,2 24,0 25,l 23,9 23,8 X = 24,30, s = O,55
Produktionscharge A: Produktionscharge B:
0SS2
F = -= 534 0,302
Aus der Tabelle wird ein Wert F (95 %,fl und f2 = 5 - 1 = 4) von 6,39 entnommen. Weil F < F (95 %, 4, 4) ist, nlmlich 3 3 4 < 6,39, besteht Varianzenhomogenitat (die korrekte Formulierung lautet: ,,Varianzeninhomogenitat kann nicht nachgewiesen werden"). Bitte beachten Sie dabei, daR die Mittelwerte recht unterschiedlich sind. Als zusammengefaljte Standardabweichung ergibt sich: Sgcs
=
s,
+ s, 2
-
0,30 + O,S5 2
=
O,43
3.3 Priizision
67
Brmrrkung: Der Variationskoeffizient ist ein strengeres und aussagekraftigeres Vergleichskriterium fur Prlzision als der F-Test. Letzter stellt lediglich ein grobes MaB fur die Gleichartigkeit von Streuungen dar. Im oberen Beispiel betriigt der V , fur die Produktionscharge A 1,65 c/o, fur die Produktionscharge B 2,26 %. Cochran-Test Zweck:
Priifen, ob Standardabweichungen aus mehreren unterschiedlichen Meljreihen zusammengefaljt werden durfen, ob also Varianzenhomogenitat herrscht.
Im Unterschied zum F-Test gilt der Cochran-Test fur identische Proben und gleich grolje Mefireihen. Vorgehen:
Die Priifgrolje C ist der Quotient aus grol3ter zu vergleichender Varianz und der Summe aller Varianzen.
mit:
grol3te Standardabweichung Zahl der Mefireihen Standardabweichung der i-ten Meljreihe
,,s
k s,
Der erhaltene Wert wird mit einem Tabellenwert C ( P , n, k ) , siehe Cochran-Tabelle, Abschnitt A.6, verglichen. 1st C griiljer als der Tabellenwert, so ist die Standardabweichung C,,, mit der vorgegebenen Wahrscheinlichkeit P unterschiedlich von den ubrigen Standardabweichungen (z. B. fur P = 9.5 c/o, n = 5 und k = 5 gilt: C (9.5,5,.5) = 0,505).
Beispirl Nach betrlchtlichen Bemuhungen kann endlich bei der Valin GmbH das neue Produkt Validol in Produktion gehen. Der Gehalt sol1 von nun an von den drei Mitarbeitern, Herrn Quant, Frau Chrom und Frau Peak-Schmal bestimmt werden. Folgende Zahlen wurden ermittelt: -
2
4
5
6
X
F
93,4
1.0
91.9
92,n
92.20
0.72
0.52
913
92.0
91.5
92,9
91,24
0,84
0.71
91,2
90.2
91.4
91.7
90,76
039
0,3S
1
2
3
Herr Quant:
92,2
91s
Frau Chrom: Frau Peak-Schmal:
91,O
89,9
90.1
90,9
MclJwcrtc
C=
0,842 0,72'
+ 0,844 + 0,59'
-
0,7 1 0 3 + 0,71 + 0 3
=
0,449
Aus der Tabelle wird ein Wert fur C (95 %, 6,6) von 0,445 entnommen. Da C > C (95 %,6, 6) ist, kann nicht von einer Varianzenhomogenitat ausgegangen werden. Aussage:
Die Variabilitgt der Arbeitsweise von Frau Chrom ubersteigt etwas die der anderen Anwender - jedenfalls fur die gegebene Methode und Probe (Frau Chrom Jefert" eine Varianz von 0,7 I , das fuhrt zu 0,449 > 0,445). Bei den strengen Kriterien von P = 95 % sollte ein(e) erfahrene(r) Kollege(in) die Bestimmung ubernehmen, oder Frau Chrom mul3te geschult werden. Sind weniger strenge Kriterien vertretbar ( P = 99 %), so kann Frau Chrom weiterhin im Team arbeiten, denn trotz der gleichen Varianz von 0,7 1 ergibt sich jetzt: 0,449 < 0,520 (C fur 99 96,6, 6 = 0,520), siehe Cochran-Tabelle, Abschnitt A.6.
3.3.6.5 Zusammenfassung der Tests und abschlieoendes Beispiel Wenn i n einein Labor Werte erzeugt werden, sind moglicherweise folgende Fragen von Interesse. Diese Fragen werden um so wichtiger, je weniger bekannt die angewandte Methode ist, siehe nachfolgende Tab. 3-4. In Abb. 3-3 ist die Vorgehensweise bei der Bewertung von MeRreihen als FlieBschema dargestellt. Tab. 3-4 Fragen und Liisungsmiiglichkeiten.
Fragc:
Antwort durch:
Sind die Werte normalverteilt?
David-Test
Gibt es AusrciBcr?
AusreiDertests Trendtest nach Neumann
Streucn sic ,,normal" oder driften sie? Wie groB darl die Differen/ iwischen zwci cinzclnen Werten sein (z. B. bci Doppclbestimmung)'?
Wicdcrholgrenze
Wie gro8 ist die Unsicherheit des Mittclwcrtes (MeBwertes)in Zahlen au5gcdruckt (Erliiutcrung und Berechnung siehe ,,Richtig-
MclJunsicherheit
Wie groB ist der Schwankungsbercicheines Werles, d. h. inncrhalh welcher Grenzen kann der ,,wahrc" Wcrt sich hefinden (Erlauterung und Berechnung siehe ,,Richtigkcit", Ahschnitt 3.4)?
Erweiterle Unsichcrhcit (Vcrtrauensbereich)
kcit", Ahschnitt 3.3)?
Zum Vergleich von Zahlen zweier MeBwertreihen siehe Abschnitt 3.4.4. Eben besprochene Punkte werden im nachfolgenden Beispiel zusammengefaBt.
MeRwertreihe DAVID - Test
I
Werte normal verteilt
NElN
Ursachenforschung
Mittelwertab-
+
I
AusreiRer gefunden '?
JA
AusreiRer mit 2 oder 3
+ neuen Werten ersetzen und Test wiederholen
I
JA
Trendtest oder v
I
Neumann
d
er
Beurteilung
c
ENDE
Abb. 3-3 Tcsts zur Bewertung von Zahlen cincr Mel3wcrtreihe.
Ursachenforschung Dokumentation mit folgenden Angaben: - Mittelwert mit Ergebnisunsicherheit und Vertrauensbereich - Standardabweichung und Variationskoeffizient - Angaben zu den Bedingungen wie: Anzahl der Werte, Doppelbestimmung? Konzentration etc.
Brispiel In der Zentralen Analytik der Valikrom GmbH wurden im Rahmen von Stabilitiitsuntersuchungen des neuen Pflanzenschutzmittels ,,VAL1DAN" folgende Gehalte des Wirkstoffs ,,NOVIALOL" gefunden ( 76): 90,l 91,2 93,l 89,s 89,9 90,2 -
x = 90,67 s
= 132
V , = 1.46 % -
David-Test:
R
pG=-= s
93,l - 89,9 = 2,42 1,32
Fur n = 6 und P = 99 % erhalt man aus der Tabelle die Werte g, = 2,15 und g , = 3,14. Das bedeutet: 2,42 liegt zwischen 2,lS und 3,14. Mit einer Wahrscheinlichkeit von 99 96 sind die Werte normalverteilt. -
AusreiRertest nach Dixon: AusreiRerverdiichtiger Wert: 93,l
Die berechnete PrufgroRe (Q = 0,528) ist niedriger als die aus der Tabelle entnommene (Q = 0,698). Damit ist mit einer Wahrscheinlichkeit von 99 % kein AusreiRer festzustellen. -
Trendtest nach Neumann:
(90,l - 91,2)? + (91,2 -%,I)*
+ (93,l - 893)' + (89.5 (6 - I ) . 1,32*
~
89,9)'
+ (X9,9 - 90,2)'
=
2,07
Die berechnete PrufgroBe (Q = 2,07) ist deutlich groBer als die aus der Tabelle entnommene (Q = 0,89). Deshalb ist rnit einer Wahrscheinlichkeit von 05 5% kein Trend feststel I bar.
3.3 Pruzision -
71
Wiederholgrenze: r = 2.8 . .Y = 2.8 . 1,32 = 3,696 = 3,70 Statistisch gesehen wird die Differenz zwischen zwei gemessenen Werten (ermittelt unter Wiederholbedingungen) nur alle 20 ma1 groBer sein als ca. 3,70. Im vorliegenden Beispiel und den 6 Zahlenwerten betragt die grol3te Differenz 3,6 (93,l - 89,s = 3,6).
Die MeBunsicherheit und der Vertrauensbereich werden ausfuhrlich in Abschnitt 3.4.3 behandelt. Um jedoch vorliegendes Beispiel vollstandig darzustellen, werden auch diese GroBen hier ermittelt.
mit:
Ef
t II
MeBunsicherheit t- oder Studentfaktor (Tabellenwert) Anzahl der MeBwerte
Vertrauensbereich: x + u : Obergrenze und x - II : Untergrenze, d. h.: 90,67 k 1,39, also 90,67 - I ,39 = 89.28 und 90,67 + 1,39 = 92,06 Aussage:
Mit einer Wahrscheinlichkeit von 95 o/o liegt der ,,wahre" Wert zwischen 89,28 und 92.06.
3.3.7 AbschlieBende Fragen zur Prazision 3.3.7. I Welche Prazision kann noch akzeptiert werden? Hier sollte zuniichst zwischen MeB- und Methodenprazision unterschieden werden. -
MeBprlzision: Nachfolgend sind beispielhaft typische Werte fur die MeBprazision in der instrumentellen Analytik angegeben. Diese Werte sind im Normalfall bei fehlerfreien Instrumenten zu erreichen. VK Fcuchtcmcssung
Ti tration Viskosimctric
<2% < 0,05 7c <0.I %
pH-Mcssung
<0,15 96 (im stark alkalischen wesentlich hiiher)
Pholoinctric
< I %
Chromatographic (HPLC, GC)
< I %
Kapil larclcktrophorc\c/ Elektrochromatographie
<2%
-
Methodenpriizision: Die noch zu akzeptierende Methodenpriizision ist natiirlich abhiingig von der Komplexitiit der Methode, der Matrix und der Konzentration. Sind beispielsweise in der Pharma-Qualit2tskontrolle Vk-Werte zwischen 1 bis 2 % ublich, so waren in der Umweltanalytik VK-Werte von 10 5% oder gar 1.5 % ' durchaus akzeptabel. Ein Zahlenbeispiel sol1 demonstrieren, daR ein VK-Wert von 10 % fur eine Nebenkomponente mit einem Gehalt von 0,5 % gar kein so schlechtes Ergebnis ist. Fur X = 0,5 und VK= 10 %I 12l3t sich die Standardabweichung wie folgt ausrechnen:
Die MeRunsicherheit fur 6 Werte und P = 95 % ergibt sich wie folgt (ausfiihrliche Erliiuterung siehe Abschnitt 3. I):
Der Vertrauensbereich betragt 0,5 k 0,05. Der ,,wahre" Wert befindet sich in einem Bereich zwischen 0,45 und 0,55 - ein Ergebnis, mit dem sich sicherlich ,,leben" liil3t. Was ist nun die zuliissige Obergrenze des VK-Wertes einer Methode bei der Gehaltsbestimmung? Als Forderung gilt, daB der Vertrauensbereich (die zweifache MeBunsicherheit) fur den Gehaltwert nicht grol3er sein sollte als der halbe Toleranzbereich nus den vorgegebenen Spezifikationsgrenzen:
2 s 2.u=t.-< '
JT;
Es gilt: s =
v,
(OSG - USG) 2
.x
100
vK.x
.
einsetzen, nach VK auflosen und man erhiilt 100 den maximal ,,.mliissigen" V,-Wert fur die konkreten Spezitikationaanforderungen. Man kann nun in obiger Formel furs,
v,
<
Fur t (95 %,,f-
(OSG - USG) . 4.t.x 00)
'
100
= 1,96 (t-Tabelle, siehe Abschnitt A.6) lautet die Ungleichung:
3.3 Priizision
K'
mit:
<
73
(OSG - USG) & 100 4 . 1,96 . X '
'
OSG obere Spezifikationsgrenze USG untere Spezifikationsgrenze
Beispiel Vorgegebene Spezitikationsgrenze: 98 % - 102 % Mittelwert: 100 Anzahl der Werte: 6
K'
<
(102 - 98). & . 100 4.1,96.100
-
4 . 2 , 4 5 . 100 = 1,25 4 . 1,96 . 100
Der Variationskoeffizient V , sollte im vorliegenden Beispiel hochstens 1,25 betragen. 1st er groBer, so ist die Streuung der Ergebnisse dieser Methode unverhaltnismal3ig stark im Vergleich zu den Spezifikationsforderungen. Zu dieser Problematik siehe Abschnitt 3.1 1. Fur den Pharmabereich sind folgende Forderungen ublich: Gchalt dcr Nehen- und Abbauprodukte hemgcn a u i die Hauptkomponente
Richtwert fur zulassigen V K
> 10%
3%
10%- I r/c
I %-O,I
c/r
5% 10 R
Tabelle 3-5 gibt fur eine Reihe von Analytkonzentrationen in der Probe die veranschlagte bzw. akzeptierte Variationskoeffizienten unter Wiederhol- ( VKr) und Vergleichbedingungen ( VKR) wieder. Diese Tabelle basiert auf einer grundlegenden Arbeit von Horwitz aus dem Jahre 1982 [ 3 1 1. Horwitz entwickelte an Hand von zahlreichen Ringversuchen (ca. 3.000) uber mehrere Jahre eine empirische Gleichung fur die maximal akzeptierte/erwartete Streuung in Abhangigkeit von dem Anteil Analyt in o/o in der Probe. -
vK,ll,,x
mit:
c
2' 1-0.s Igr)
-
Konzentration des Analyten in der Probe (Decimal)
Bei einer reinen, 100 c/o Probe gilt c = 1 und entsprechend Igc = 0:
Tab. 3-5 Analytkonr.cntration und erwartetc/ublichc relative Standardabweichung unter Wiederhol- und VcrEleichsbedingungen. VKr
VKR
100
1,34
2
50
1.49
2,22
20
1.71
235
I0
I ,90
2.83
5
2.10
3.14
2
2.4 I
3,60
I
2.68
4,00
0.50
2,97
4.44
0.1
3,7Y
5.66
0,0 1
5,30
7,9 1
0.00 I
7.30
10,90
'% Analyt
Anteil
0.000 1
11
16.42
0,00001
IS
2239
0.00000 1
21
3 1.34
0,000000 I
30
44,78
Weiterhin stellte Horwitz ebenfalls empirisch fest, daB VK,-Werte unter Wiederholbedingungen meist u m einen Faktor 0,5 bis 0,75 kleiner sind als die entsprechenden VKRWerte bei den Ringversuchen, also unter Vergleichsbedingungen. Daraus resultiert als Vorschlag folgende Gleichung:
mit:
VK,Variationskoeffizient unter Wiederholbedingungen V K R Variationskoeffizient unter Vergleichsbedingungen
3.3.7.2 Wie kann ich die Prazision erhohen? Am einfachsten erhoht man die Prazision durch mehr Messungen - ein vollig legitimer, jedoch aufwendiger Weg! Die Standardabweichung ist der Wurzel aus der Anzahl der Messungen indirekt proportional, siehe Abb. 3-4.
3.3 Priizision
1
5
10
15
75
20 n
Abb. 3-4 EinfluB der Anzahl von Wiederholmessungen ( u ) auf die GraRe der Standardahweichung (s) des Mittelwertes [32].
3.3.7.3 Was sind die Vor- und Nachteile bei groBer Prazision? Vorteile Je groljer die Prazision d. h. je kleiner die Standardabweichung und j e geringer die Streuung der Werte ist, urn so eher werden Verschiebungen des zu uberwachenden Prozesses erkannt, siehe Abb. 3-5 [32]. Ein Labor hat die Aufgabe, einen Produktionsprozelj zu uberwachen. Es SOH, sobald sich gemessene Werte auljerhalb der Kontrollgrenze (+3 s) befinden, Alarm geben. Wenn nun das zu messende Merkmal des Produktes sich aufgrund einer Verschiebung des Produktionsprozesses um e verschiebt, wird sich auch der Zahlenwert (Mittelwert), der im Labor errnittelt wird, urn diesen Betrag e verschieben. Aufgrund der aktuellen Streuung der Analysenwerte wird in ca. 16 % der FIlle diese Verschiebung registriert (siehe Abb. 3-5). Gelingt es eine prazisere Methode einzufuhren, wird irn selben Fall bereits in 84 5% der Falle diese Verschiebung registriert. Wenn keine prazisere Methode zur Uberwachung des Prozesses zur Verfiigung steht, sollte die Anzahl der Messungen erhoht werden. So kann die in Abb. 3-5 gezeigte empfindlichere Anzeige der Mittelwertverschiebung auch dadurch erreicht werden, daB man viermal so viele Messungen durchfuhrt (s. auch Abschnitt 3.4.3). Nachteile Bei einer ,,zu" groljen Prazision der Methode werden leicht etwas abweichende Werte als AusreilJer gedeutet, siehe Beispiel beirn Dixon-Test. Weiterhin ist eine ,,zu" prazise Methode unter Routinebedingungen nicht robust genug. Eine jede kleine Anderung in den Bedingungen wurde zu einem groBeren Wert fur V , fiihren, der dann moglicherweise nicht akzeptiert werden kann.
3 Die Vulidieritngspammeter
76
Sind Spezifikationsgrenzen vorgegeben, wie z. B. in der Produktanalytik, so kann das Ziel nur heisen: moglichst prazise Methode. Wird eine Methode neu validiert, so sollten aufgrund der Ergebnisse am den Experimenten zur Prazision erst dann die Spezifikationsgrenzen realistisch festgelegt werden.
I
,e e+
J
verschobene Haufigkeitsverteilung
Wahrscheinlichkeit, daR ein Einzelwert KO 1st = 16%
>
X
OriginaldesMittepl aus 4 werts Verteilung
,+e
I
Wahrscheinlichkeit, daB ein Mittelwert >KO ist = 84%
verschobene
Abb. 3-5 Emptindlichere Anzcigc cincr Mittelwertverschiebung mit einer prlriseren Methode bzw. einer Vierfachmessung im Vcrgleich LU Einzelmessungen.
3.4 Richrigkeit
3.4
77
Richtigkeit
3.4.1 Definitionen und Erlauterungen Richtigkeit ist das Man der Ubereinstimmung zwischen dem ermittelten Wert und einem als richtig angesehenen Wert. Man bezieht sich demnach auf einen Wert, der konventionell als fehlerfrei und somit als richtig gilt - z. B. ein zertitiziertes Referenzmaterial -, da der wahre Wert prinzipiell nicht bekannt sein kann. In der Literatur wird jedoch oft nicht zwischen ,,wahrem" und ,,richtigem" Wert unterschieden. Als quantitatives MaB fur die Richtigkeit (eigentlich fur die ,,Unrichtigkeit") gilt die systematische Ergebnisabweichung (engl.: bias). Mit unrichtigen Ergebnissen ist u. a. in folgenden Fallen zu rechnen: Mangelhafte Selektivitat der Methode Beispiel: Bei einer HPLC-Methode liegt unter dem Peak eines Wirkstoffes ein nicht abgetrennter Peak eines Metaboliten, die Gehaltsangabe des Wirkstoffes ist mit einem konstanten, systematischen Fehler behaftet. Wiederfindungsrate kleiner als I00 % Beispiel: Bei der Reinigung von Proteinen wird abhangig von der Konzentration ein bestimmter Anteil irreversibel an der Glasoberflache der Reinigungssaule sorbiert. Hier handelt es sich um einen konzentrationsabhangigen, sprich proportional systematischen Fe h I er. Falsch angenommener Gehalt eines Referenzstandards aufgrund von Zersetzung Beispiel: Man bezieht sich bei einem in-vitro-Experiment auf den angegebenen Gehalt von 99,8 % des zertifizierten Referenzmaterials. Durch Unterbrechung der Kuhlkette und beschleunigte Zersetzung betragt jedoch der tatskhliche Gehalt im Moment des Vergleichs nur 99,l %. Die Konsequenz ist ein unrichtiges Ergebnis: Es handelt sich um einen proportional systematischer Fehler, das AusmaB hangt vom Zeitpunkt der Bestimmung ab. Falsch gefundener Gehalt wegen unterschiedlicher Matrix Beispiel: Ein Freigabelabor verwendet ein gut charakterisiertes Muster als Standard. Die Produktion variiert geringfugig die Rezeptur ohne diese ,,kleine" Anderung der Qualitatskontrolle mitzuteilen. Das Labor arbeitet weiterhin mit dem alten Standard. Wegen der veranderten Matrix und deren EinfluB auf die Selektivitat ergibt sich womoglich ein konstanter systematischer Fehler. Bei Trennmethoden sind die zwei unabdingbaren Voraussetzungen fur Richtigkeit das Vorhandensein von Selektivitat und eine bekannte Wiederfindung. Dazu muB man anmerken, daB zwar eine richtige Methode immer eine selektive Methode ist, aber eine selektive Methode nicht automatisch ein richtiges Ergebnis liefert. Es gibt noch weitere Ursachen fur einen systematischen Fehler, namlich wenn keine konstante Ausbeute bei der Extraktion erreicht wird, oder eine Zersetzung des Analyten stattfindet oder ein systematischer Fehler bei der Messung z. B. Detektion, Injektion usw. auftritt.
3.4.2
Prufung auf Richtigkeit
Nachfolgend werden die eimelnen Methoden anhand von Beispielen dargestellt und kommen t iert .
3.4.2. I
Vergleich rnit einem (oder mehreren) Referenz- oder Arbeitsstandard(s)
Der K&r-mz.stuIidurd ist im idealen Fall ein zertitkiartes Referenzmuteriul, dessen Gehalt als bekannt und richtig gilt (Sollwert). 1st ein solches nicht erhiiltlich, kann ein sehr gut charakterisierter synthetischer Standard verwendet werden. Bestehen Zweifel an der Qualitiit des Standards, so kann uber die Massenbilanzen sein tiitsgchlicher Gehalt uberpruft werden. Beispielsweise wird von einem neuen Lieferanten ein Standard mit einem deklarierten Wirkstoffgehalt von 95 5% geliefert. Die restlichen 5 '3- sollen aus 2 %- Wasser, 1 '3Restliisemittel und 2 7c Natriumchlorid bestehen. N u n werden diese Restbestandteile quantitativ analysiert. Die Analysenmethoden kijnnen sein: Wasser mittels Karl-Fischer, Restliisemittel mittels Kapillar-GC und Natriumchlorid mittels ionenselektiver Elektroden oder Photometrie. Ergibt sich ein Anteil der Nebenbestandteile von groRer/kleiner als 5 56, so besteht ein berechtigter Verdacht auf falsch deklarierten Gehalt des Wirkstoffs. Vergleich einer Probe unbekannten Gehaltes mit einem Standard bekannten Gehaltes Zur Prufung auf Richtigkeit gibt es zwei Miiglichkeiten. Zum einen einen Soll/lst-Vergleich und Uberprufung mit dem t- (otler Stuclent-)Test, zum zweiten eine vereinfachte Richtigkeitskontrolle nach Doerffel. Der [-Test ist mit Abstand der am weitesten Verbreitete. a ) Sollwert-t-Test Zuniichst wird der 1st-Wert durch 6-fach-Bestinimung unter Wiederholbedingungen erinittelt (Mittelwert), anschlieliend wird die Standardabweichung berechnet. N u n wird uberpruft, oh der Sollwert mit einer gegebenen Wahrscheinlichkeit innerhalb des ~ ~ r t r r r ~ r r r z s h r r r i c des h e . ~Analysenergebnisses liegt, d. h. ob die Methode fur diesen bekannten Wert (Sollwert) einen ,,Richtigkeitsbereich" abdeckt.
mit:
.? ermittelter Mittelwert P Sollwert (Standard) IT - pl = I I MeBunsicherheit odervertnluensintervall, 11. MaB fur die MeBwertS
I7
abweichung (systematischer Fehler, bias) Standardabweichung Zahl der Wiederholmessungen, oft 17 = 6
3.4 Richtigkeit
79
Mit diesem Test konnen generell zwei Mittelwerte verglichen werden und zwar auch dann, wenn die Anzahl der MeBwerte unterschiedlich ist. In diesern Fall gilt folgende Gleichung:
r
mit:
x,
'
s
Mittelwert I
X2 Mittelwert 2 nl n2
Anzahl der Werte bei der Ermittlung von x, Anzahl der Werte bei der Ermittlung von x2
Der resultierende Wert f wird mit dem Wert aus der r-Tabelle verglichen (s. r-Tabelle, Abschnitt AS). 1st rgefs rTahelle so liegt der Sollwert rnit der vorgegebenen Wdhrscheinlichkeit innerhalb des Vertrauensbereichs des Analysenergebnisses. Fur eine 6-fachBestimmung ( n = 6) und einer Wahrscheinlichkeit von 95 % ( P = 95 %, f (Freiheitsgrad) = n - 1 ) ist t = 2,57 1 , d. h. tgef.sollte kleinedgleich 2,57 1 sein. Der r-Test setzt Varianzenhomogenitat voraus, d. h., es wird Normalverteilung angenommen. Stimmt diese Voraussetzung nicht, so konnen die effektiven Freiheitsgrade nach Welch errechnet werden [33].
Kommentar: Der Sollwert-t-Test birgt, obschon sehr verbreitet, eine Gefahr: Der Wert fur p wird in die Formel eingesetzt ohne genaue Kenntnis dartiber zu haben, wie prazise die Methode ist, d. h. wie die aktuelle Streuung von p ist. Es wird in jedem Fall empfohlen, den Sollwert ,u mit der zu validierenden Methode zu messen. Erst namlich die Differenz zwischen dem bekannten, ,,richtigen" Wert p und dem unter Wiederholbedingungen tatsachlich ermittelten Wert p ergibt die Summe der systernatischen und der zufalligen Fehler wieder. Eine Einschrankung ist, dal3 das Ergebnis nur fur diesen Standard gultig ist. b) Doerffel-Test Der gefundene Wert kann auch nach dern Ansatz von Doerffel beurteilt werden: Solange IX - pl < 1,5 . s / & ist, besteht kein Grund zur Annahme eines systematischen Fehlers. mit:
x errnittelter Mittelwert p Sollwert (Standard) s Standardabweichung
Betragt die Differenz IX - pi 2 2 s / & , ist ein systematischer Fehler der Methode wahrscheinlich. Bei kleinen Werten von n (n < 10) sollte anstelle des Faktors 2 der Wert aus der r-Tabelle fur n - 1 Freiheitsgraden und P = 95 % verwendet werden.
W i I cox on-Te \ t Neben der Richtigkeitsprufung kann zusiitzlich gepruft werden. o b die crinittelten Werte uin den Mittelwert symmetrisch verteilt sind (Wilco.uon-72.st). Zuniichst werden die Differenzen der einzelnen MeBwerte vom Mittelweit ermittelt und anschlieknd diese Differenzen dem Betrag nach geordnet. Sie erhalten Rangzahlen, d. h., die kleinste Differem Ax, = .~~",,,\\~"-MitteIwert erhiilt die Rangzahl 1. die Lweitkleinste 2 usw. Bci gleichern Differenzbetrag werden die Rangzahlen gernittelt. Die Rangzahlen werden addiert und der erhaltene Wert wird mit einem Tabellenwert verglichen, der der Wilcoxon-Tabelle (s. Abschnitt A.6) entnommen wird. 1st Wfcl < WT,,hcllc,,~cr,, so sind die ermittelten Werte mit einer gegebenen Wahrscheinlichkeit asymmetrisch urn den Mittelwert verteilt. Fur I I = 6 und P = 95 % ist W,ah = 17, d. h., Wgcl.solltekleiner/gleich 17 sein. Der Wilcoxoii-Test wird nicht oft angewandt. Br ispie I I n einem Labor sol1 die Richtigkeit einer neuen inhouse-Methode fur eine Gehaltsbestiinmung durch Soll-/lst-Vergleich mit einem zertifizierten Rei'erenzstandard uberpruft werden.
SoI I wert : Gemessene Werte: Mi t te I we i t : Standardnbweichunf:
95,90 96,20 96,4O 96,lO 96,OO 95,9O 96-50 96, I8 0.23
t-Test
E\ wurde ein 4gnitikanter Unterschied zwischen Sollwert und gefundenem Mittelwert fe\tge\ te I It .
Doerffcl-Tat (Prufung auf signifikante Abweichung) Gilt t'iir vorliegenden Fall die Ungleichung
3.4 Richtigkeir
81
Da n = 6, wird statt dem Faktor 2 der Wert 2,57 I aus der r-Tabelle verwendet: 96,18 - 95,90 >
237 1 . 0,23 2,45
0,28 > 0.24 Es wurde ein signifikanter Unterschied zwischen Sollwert und gefundenem Mittelwert festgestellt. Das Ergebnis ist mit folgender MeBunsicherheit verbunden:
*
Das bedeutet, daB der Mittelwert um X u , d. h. 96,18 k 0,241 schwanken kann, also zwischen 95,94 und 96,42. Genaueres zur MeB- und Ergebnisunsicherheit siehe weiter unten. -
Wilcoxon-Test Die Ermittlung der MeBwertdifferenzen 95,9 - 96,2 = 0,3; 95,9 - 96,4 = 0,5 usw. ergibt folgende Rangliste: Differenzen
Rangzahlen
0,30
3
0.50
4
0.20
2
0.10
I
0.00
0
0.60
5
Da Wgc, = 15 kleiner ist als Wtab = 17,liegt eine symmetrische Verteilung der erhaltenen Werte um den Mittelwert vor.
Ergrhnis Die gefundenen Werte sind zwar um den Mittelwert symmetrisch angeordnet, es kann aber keine Ubereinstimmung zwischen Sollwert und ermitteltem Mittelwert angenommen werden. Brmerkutig Die Validierungsparameter ,,Richtigkeit" und ,,Priizision" sind keine voneinander unabhangige Charakteristika einer Methode. Liegt eine Methode mit einer geringen Prazision vor, so wird man bei der Uberpriifung der Richtigkeit moglicherweise dafur ,,belohnt".
Wiirden beispielsweise im o. a. Beispiel die Werte bei gleichem Mittelwert starker streuen und ergibt sich dadurch eine Standardabweichung z. B. von 0,30 statt von 0.23, so betriigt tfcF= 2.287 und ist folglich kleiner als 2,571. Das Ergebnis muBte als richtig angesehen werden. Umgekehrt kann bei einer groBen Prazision einer Methode der t-Test - trotz akzeptabler Selektivitiit und Wiederfindungsrate - zu der Aussage fuhren: .,Ergebnis unrichtig". Dies wird in Abb. 3-6 schematisch dargestellt. Eine ,,zu" priizise Methode kiinnte auch Schwierigkeiten in der Routineanwendung bereiten (s. auch Priizision, Abschnitt 3.3 und Robustheit, Abschnitt 3.5). Vergleich mehrerer Proben (oft 6) unterschiedlichen Gehaltes, die idealerweise den erwarteten Arbeitsbereich abdecken, mit Referenzstandardproben bekannten Gehaltes Dieser Test ist xu empfehlen, wenn die Richtigkeit der Methode uber einen griifieren Konzentrationsbereich uberpruft werden SOH. Es werden die 6 Gehalte durch Doppelbestimmung sowie die GriifJen a und b aus der linearen Regression ermittelt. .T<;c,l,
mit:
+ h.r,
.r(;cm Gemessener Wert, hier: Gehalt (I
h .t-,
r
= Ll
Konstanter, systematischer Fehler Proportionalitiitskonstante,Ma13 fur einen miiglichen. proportionalen Fehler Sollwert. hier: Gehalt der Standardprobe. er gilt als fehlerfrei
Sollwert I
Gehalt
Sollweri
Gehalt Abb. 3-6 Der Mirrclwert cincr .,xu" prHLisen Methode (unteres Bild) erscheinr hei den1 t-Test ala .,zignilikant" entlernt vom Sollwert [34].
3.4 Richrigkeit
83
AnschlieSend wird (qualitativ: jalnein oder quantitativ: mittels t-Test) gepriift, ob die erhaltenen Werte fur a und h sich von den Idealwerten a = 0 und h = 1 unterscheiden. Tun sie es (a = 0, h = I), so ist xGem=x,und man erhalt eine Winkelhalbierende. Ansonsten bedeutet a # 0 daS ein konstanter, und b # 1, daB ein proportionaler systematischer Fehler vorliegt. Bei zu groBer Extrapolation kann ein konstant systematischer Fehler (a f 0) vorgetauscht werden.
mit:
Ordinatenabschnitt der Regressionsgerade Steigung s, Standardabweichung von a s,, Standardabweichung von h a b
1st t, bzw. th groBer als der Wert der t-Tabelle f u r f = n - 2, so liegt fur die vorgegebene Wahrscheinlichkeit ein konstant systematischer (t,) bzw. ein proportional (t,,) systematischer Fehler vor. Wird ein konstant systematischer Fehler festgestellt, so ist dieser unabhangig von Konzentration bzw. Gehalt des zu bestimmenden Stoffes. Bei einem proportional systematischen Fehler liegt eine Abhangigkeit von der Konzentration vor. Auch hier hangt die Aussage uber die Richtigkeit von der Korrelation der MeRwertpaare ab: 1st die Standardabweichung sehr klein, so ergeben sich grol3e t-Werte und damit besteht die Gefahr, daS trotz ,,ausreichend" richtiger Methode systematische Fehler ,,erkannt" werden. 3.4.2.2 Vergleich mit einer unabhangigen, moglichst validierten Methode bekannter Richtigkeit Ein Vergleich zweier gleichwertiger Methoden macht naturlich dann Sinn, wenn beide Methoden vergleichbare Selektivitaten aufweisen. Die eine Methode ist die zu validierende Methode, die zweite eine bekannte, gut charakterisierte Methode (Referenzmethode). Nacheinander fuhrt man folgende Schritte durch: Bildung der Differenzen der erhaltenen Werte aus den beiden Methoden Bildung des Mittelwertes dieser Differenzen - Bildung der Standardabweichung der Differenzen - Errechnen des t-Wertes (DifSerenzen-t-Test) -
AY,= . I , (Methode 1 j - x , (Methode 2)
AT
-
=
;[ j Ayf
I1
\i
s ~ \ = (,I
mit:
-
l)-'z ,"
(AT, - AT):
AY Mittelwert der Differenzen .sA Standardabweichung der Differenzen
1st der erhaltene t-Wert g r i i k r als der tabellierte r-Wert (95 % . f = IZ - 1 ). so gilt mit der vorgegebenen Wahrscheinlichkeit als erwiesen, dab es einen Unterschied lwischen beiden Methoden gibt. Somit sind beide Methoden nicht gleichwertig. Gilt eine der zwei Methoden als konventionell richtig, so liefert die zweite Methode mit der vorgegebenen Wahrscheinlichkeit unrichtigc Ergebnisse.
Beispiel Der Gehalt einer Nebenkomponente des Wirkstoffs .,Validol" sol1 in Zukunft mittels einer schnellen elektrochromatographischen Methode bestimmt werden. Die Ergebnisse nicht identischer Ruckstandsproben sollen mit den Ergebnissen nach der altbewzhrten und validierten HPLC-Methode verglichen werden. Wcrtc ncuc Mcthodc [pglkg]
32
2x
18
3Y
II
20
Wcrk alte Methode [pglkg]
21
24
16
30
I0
13
5
4
2
9
I
7
Diflcrcnz
KT
Mittelwert der Differenren: = 4.67 Standardabweichung der Differenzen: .sA = 3.0 I
t = 4.67 3,0 1
'
Ji = 3.80
TestgroBe t: Tabellenwert fur T I = 6 fur ein Signitikanmiveau 9.5 %. t (95 %. 5 ) = 2 5 7
3.4 Richti,qkr,it
85
Richtigkeit durch Methodenvergleich Ergebnis nach Methode II ( zu validieren )
t
;-.
:.- - * ''
B
A : beide Methoden gleichwertig
Bei Einpunktvergleich kann Fall D unerkannt bleiben
Abb. 3-7 Prufung auf Richtigkeit durch Methodenvergleich 135, 361.
Weil tgef> ttah,namlich 3,SO > 2,57, ist ein systematischer Unterschied der zwei MeBreihen mit einer Wahrscheinlichkeit von 95 5% erkennbar. Mit einer Wahrscheinlichkeit von 95 o/o liefert die neue Methode fur diese Proben (fur diesen Konzentrationsbereich und diese Matrix usw.) unrichtige Ergebnisse. Der nlchste Schritt wlre die Suche nach systematischen Fehlern bei der neuen Methode. Beim Vergleich zweier Methoden konnen vier Falle auftreten, siehe Abb. 3-7. Aus Abb. 3-7 wird ersichtlich, welches Risiko eingegangen wird, wenn zur Prufung auf Richtigkeit durch Methodenvergleich Proben nur einer Konzentration vermessen werden: Wenn die zwei Geraden sich wie im Fall D schneiden - das ist der Fall bei konstantem und proportionalem Fehler - und man zufallig genau diese Konzentration fur die Prufung gewahlt hat, so wird falschlicherweise Richtigkeit vorgetauscht. Oder es wird eine kleine ,,Unrichtigkeit" akzeptiert (Punkt x), wenn die Differenz zwischen gefundenem und Sollwert gerade bei dieser Konzentration als vernachlassigbar erscheint. Die Richtigkeitsprufung durch Methodenvergleich sollte bei mindestens drei Konzentrationen erfolgen.
3.4.2.3 Wiederfindungsexperimente nach Zusatz bekannter Menge an Analyt (Referenzsubstanz!) H h f i g e Namen fur dieses Verfahren sind: Aufstockverfahren, Additionsmethode, ,,Spiken" einer Probe. Wiederfhdungsexperimente sind besonders dann empfehlenswert, wenn auf Grund komplexer Matrix eine Auswirkung selbiger auf die Richtigkeit zu erwarten ist.
Folgende Varianten sind hier denkbar: Dem Analyt werden synthetische Proben (Muster) zugegeben. Dem Analyt werden reale Proben (Muster) zugegeben. Dem Analyt werden Placebos zugegeben. -
Fur eine ausfuhrliche Beschreibung, siehe Abschnitt 3.7.2.5 und 3.8.
3.4.2.4 Elementbilanzierung Man fuhrt eine Elementanalyse (C,N) sowie z. B. eine HPLC-Analyse der Komponenten durch. berechnet die sich aus den HPLC-Gehalten der Komponenten ergebenden Mengen an C, N (Summierung der Peakfliichen, 100 C/r Normierung) und vergleicht die sich aus der Addition der Einzelwerte ergebende Summe C, N mit dem aus der Elementanalyxe ermittelten Wert.
Beispiel Eine Probe bestehe HUS den Bestandteilen NaCI. Wasser, Hauptkomponente und Nebenkomponente. In der nachfolgenden Tabelle ist der aus den Gehalten der Komponente umgerechnete % C sowie der aus der Elementanalyse gemessene angegeben. Gchalt
%C
NaCl
2.0 fi
-
Wawx
2.0
-
ci
Wcrt (i C rlu\ Elemcntanal y\c
HPIX: Hauptkomponcnte
Nehcnkomponente I Surnrne
90.0 fk
30.0 %
6.0 %
2,0 '?c
100,o
70
32,O %
31,s Yc
Mit diesem Verfahren lafit sich z. B. prufen, ob die HPLC-Methode die organischen Komponenten komplett erfafit. Diese Methode funktioniert zuverlassig nur fur die Hauptkomponente und bei einem hohen Anteil an Wasser, Salz, Placebo usw. in der Probe. Weiterhin mussen die Molekulargewichte, Struktur und Responsefaktoren aller Komponenten bekannt sein. Die Anwendung dieses Verfahrens hat sich bisher noch nicht durchgesetzt.
3.4.2.5 Indirekte Uberpriifung uber Massenbilanzen Die quantitative Analyse s2mtlicher Inhaltsstoffe einer Probe mu8 theoretisch 100 r/r ergeben. Beispielsweise ergibt sich fur die Hauptkomponente einer Probe durch Abziehen der Gehalte aller Begleitstoffe ein Gehalt von 94 56.
100 ?h Probe Wasser Sulfatasche Anorganische Salze Losungsmittel Placebobestandteile Rest: 94 ?h Dieser Gehalt wird nun mit Hilfe eines Standards bestltigt. 1st das nicht der Fall, so bedeutet das - unter der Annahme, daB die Bestimmung der oben aufgefiihrten Stoffe ,,im Griff' ist - zweierlei: Es wird bei der Bestimmung der Hauptkomponente ein systematischer Fehler gemacht oder der Gehalt des Standards ist falsch deklariert. Die Methode der Massenbilanzierung hat sich in der Praxis bewahrt und wird oft zur Uberpriifung der Gehalte von Standards eingesetzt (Info: Dr. Martin Jungheim, Bayer AG, Leverkusen). 3.4.2.6 Plausibilitltsbetrachtung Wenn keines der 0.a. Verfahren angewandt werden kann bzw. der Aufwand nicht gerechtfertigt erscheint, kann eine Aussage zur Richtigkeit uber eine Plausibilitat erfolgen: Ein Ergebnis ist wahrscheinlich richtig, wenn die Selektivitat und die Linearitat der Methode bewiesen wurden und die Regressionsgerade durch den 0-Punkt verlluft.
3.4.3 MeBunsicherheit, Ergebnisunsicherheit und Vertrauensbereich Jeder Zahlenwert ist mit einer MeBunsicherheit verbunden. Bei komplexen analytischen Verfahren mit mehreren Schritten sollte vielleicht von ,,Ergebnisunsicherheit" gesprochen werden. Damit ware der Tatsache Rechnung getragen, daB es um mehr als lediglich um die Unsicherheit des MeBvorganges geht. Der Terminus ,,MeOunsicherheit" scheint sich jedoch generell durchzusetzen, so erscheint er auch in der neuen I S 0 17025. In Tab. 3-6 ist eine detaillierte Auflistung von haufig vorkommenden Unsicherheitsquellen zu sehen (Quelle: BAM QMH-P-10.2, Anlage 3). Eine ahnlich hilfreiche Auflistung findet sich in 1371. Tab. 3-6 Aufzahlung haufig vorkommender Unsicherheitsquellen.
Unsicherheiten I.
Unsicherheiten,
die mit der Pro-
bcnahrndProbenautbereitung - zusamrnenhangen
Quellcn
a) Nahrne von Proben, die das Untersuchungsobjekt nur eingcschrankt reprasentieren (Typ A', Typ B') h ) KontaminationNeranderung von Proben bei ihrer Nahrne (Typ B)
c) KontarninationNeranderung von Proben bei ihrcr physikalischen Auibereitung (Typ B)
Tab. 3-6 Forlscinmg ~
Unsichcrhcitcn
~
~
Qucllen d ) Homogcnisierung (Unvollstiindigkeit) (Typ B )
e ) Kontamination/Veranderung von Proben hci ihrer Lagerung (Typ B ) 1 1 Au1schlul.l (Unvollstandigkcit. Kontarnination. Intcrfcrcn/,cn) (Typ B ) g) Chemisehe Prohcnvorberci~ung/rennungs~cchnikcn (Unvollstiindigkeit, Kontarnination) (Typ B) 2. Unsichcrhcitsheitriige. die i n i t den Eigcnschaftcn dcs untcrsuchlcn Ohjekts /iis;iinrncnh2ingcn
a ) Rauschcn. lnstabilitiit dcs unkrsuchten Objekls (Lcitl. Anderung dcr Kennwcrte) (Typ A, Typ B ) b ) Vcriindcrung oder Alterung dcs untersuchten Oh.jckts (Leiti. Andcrung der Kennwcrtc) (Typ A, Typ B ) c) Inhomogcni tiit/Ungleichliirmigkcit des untcrsuchtcn 0h.jckts
(iirtl. Andcrung der Kennwcrtc) (Typ A, Typ B )
Matrixclfckte/Wechsclwirkunpcn (Typ B) 3. Unsicherheirsheitragc. die dcrn angcwandtcn Me'3Prut'vcrfahrcn anhaiicn
a) unmrcichcndc Realisierung hLw. Definition dcr Mc1.l-/ ErgcbnisgriiBe (NBhcrungcn/ldcalisicrun~en/Hypothcscn) (Typ B )
b) Unsichcrhcit von Verfahrcnspararnetcrn (7.B. auch Umgcbungsbedingungcn) und dcr bcrucksichtigten EinlluRgriil.(cn (Typ A, Typ B) c) Vcrnachliissigte Einflul3griiRcn (z. B. Temperatur, Lultdruck, magn. Fcldstiirkc) (Typ B) d ) Begrcwtc Instrumcntcnaulliisung, Un\chiirfc b/w. Unsicherheit der Lage von Diskriminatorschwcllcn ctc. (Typ B )
e ) Nachwcisgrcnzen, begrcn/rc Einpllndlichkeit (Typ B ) f) Rauschcn bzw. zufalligc Siiircinllusse (wie Stiirlcldcr ctc.) (Typ A. Typ 8) g) Unzureichcndc lrnpedanzanpassung und Ubcrtragung/Wandlung dcr Mel.lgriil.lc (Typ B) h ) Totzcitcn dcr Apparatur (Fchlcr durch KoinLidenLcn) (Typ B)
i ) Dynainik dcr Apparatur (Frcqucn/gang/Uhcrschwingen/Resonan/en )
j)
Unkrschiedliche Wahrnchmung/Visualisierung dcr Mcl&iiSen (Typ A. Typ B)
k ) Auswcrtung, Rcchengcnauigkcit ctc. (Typ B )
I) 4. Unsichcrheit der Rcleren/.wertc. die dcr Mcssungl prufung /ugrllnde liegcn
Unsichcrhcil crmittelt aus Ringvergleichen (Typ A. Typ B )
a ) Unsichcrhcit zertifiLiertcr Werlc/Kalibrierwcrte (Typ B ) h ) Drift/Altcrung von Rcfcrcn/wcrtcii/Rcfcren/mntcrialicn(Typ B) c ) irnporticrtc Werte aus der Lircratur (Tabellenwcrkc, Konktanten. ggl. aktuclle Veroffentlichungcn, etc.) (Typ B )
d) wie 3 ) I
Typ A. Typ B: Erlautrrung k h c Tcxr
3.4 Richtigkeit
89
Zur Quantifizierung der Unsicherheitsbeitrage gilt: Typ A ist meBtechnisch zuglnglich und erlaubt eine statistische Auswertung, Typ B verkorpert unbekannte systematische Abweichungen, die nur durch Abschatzung zuganglich sind. In Tab. 3-6 konnen die einzelnen Beitrage abhangig oder unabhangig voneinander sein. Sie haben zufiilligen und systematischen Charakter. Zufallige Beitrlge fuhren zur Variation der (Einzel-)Ergebnisse bei wiederholten Messungen unter vergleichbaren MeBbedingungen. Sie konnen mit empirisch statistischen Verfahren (z. B. empirische Standardabweichung eines Mittelwertes) abgeschatzt werden (Typ A), die unbekannten systematischen Beitrage rnussen geeignet geschatzt bzw. im Falle importierter Werte, aus den Angaben ermittelt werden (Typ B). Erliiurerungen Die Standardunsicherheit berechnet sich nach:
mit:
Standardabweichung n Anzahl der MeBwerte s
Diese Formel berucksichtigt nur zufallige MeBabweichungen bei der Ermittlung eines (Mitte1)wertes. Wenn man zusatzlich mit systematischen Abweichungen rechnet - und das sollte man, denn mogliche Fehler von dem EinfluB der Temperatur bei volumetrischen Messungen bis zu Differenzen beim Gehalt des Referenzmaterials sind in der Analytik Realitaten - brauchte man eine groSere Sicherheit bei den Angaben von Zahlenwerten. Zitat aus dem ,,Leitfaden zur Angabe der Unsicherheit beim Messen" (Beuth Verlag, Berlin): ,,Obwohl sich u universe11 zur Angabe der Unsicherheit eines MeBergebnisses verwenden IaBt, ist es in einigen industriellen, kommerziellen und regulatorischen Anwendungen sowie dann, wenn Gesundheits- und Sicherheitsaspekte zum Tragen kommen, haufig erforderlich, die Unsicherheit in Form eines Bereichs um das MeBergebnis anzugeben, von dem erwartet werden kann, daB er einen groBen Anteil der Verteilung der Werte umfaBt, die der gemessenen GroBe sinnvollerweise zugeordnet werden konnen." Der erste Ansatz, um aus einer Standardunsicherheiteinen tatsachlichen Vertrauensbereich (oder Vertrauensintervall) zu erhalten (MeSunsicherheit), ist das Multiplizieren der Standardunsicherheit mit dem entsprechenden t-Wert aus der t-Tabelle (Student-Faktor). Das ist nichts anderes als der ubliche r-Test, nur, daB nicht der t-Wert gesucht sondern entsprechend der Anzahl der MeBwerte der t-Wert (Student-Faktor) aus der Tabelle in die Formel eingesetzt wird. Dazu wird die ubliche Formel fur den t-Test' nach der MeBunsicherheit u aufgelost: I
Der Begriff t-Test wird ublicherweise fur den Soll/Ist-Vergleich verwendet. Mangcls anderer Bezeichnung wird fur den hier besprochenen Zusammenhang (Ermittlung der MeBunsicherheit) die Schreibweise ,,t-Test" verwendet.
Der zweite Ansatz basiert aufeinem Vorschlag von I S 0 GUM (Guide to the Expression of Uncertainty in Measurement, I993 bzw. Quantifying Uncertainty in Analytical Meansurement. Eurachem, 1995 bzw. die deutsche Ubersetzung: Die Ermittlung der Me& unsicherheit in der analytischen Chemie, 1998). Der Extrakt aus diesem Konzept wird nachfolgend zusammengefafir, das Prinzip wurde ausfuhrlich in Abschnitt 1 .S. I .S erliiutert. Der interessierte Leser findet daruber hinaus sehr detaillierte Beschreibungen incl. Beispiele in mehreren Literaturstellen uber MeBunsicherheit, siehe Abschnitt A.9. Die Vorgehensweise ist im Wesentlichen folgende: Unsicherheitsquellen werden identifiziert und die wesentlichen Beitriige werden als Standardunsicherheit quantifiziert. Dies geschieht entweder durch eine statistische Auswertung (Typ A) oder eine Schiitzung (Typ B). Ein Beispiel zum Typ A ist die Ermittlung der MeBunsicherheit durch den Soll/lst-Vergleich. Ein Beispiel zum Typ B ist das Schiitzen der MeBunsicherheit beim Pipetieren von Liisungen unterschiedlicher Viskositiit. die u. a. hervorgerufen wird durch den EinfluB wechselnder Teniperaturen. - Alle wesentlichen Beitriige werden quadratisch addiert. Diese Vorgehensweise setzt voraus, daD die Fehler bei den einzelnen Beitrigen unabhangig voneinander sind, dal3 es sich also um stochastisch unabhangige Prozesse handelt (Additivitiit der Varianzen). 1st dies nicht der Fall mufiten Kovarianzen berucksichtigt werden. -
Brispirl Man betrachte eine Verdunnungsreihe aus derselben Stammlosung oder die Kalibration mit einem Referenzmaterial. Ein falsch deklarierter Gehalt fuhrt in beiden Fallen zu gleichsinnigen Abweichungen d. h. in diesem Fall wirken sich nicht nur zufiillige sondern auch ein systematischer Fehler aufdas Ergebnis aus. Da das Rechnen mit Kovarianzen aufwendig ist, kiinnen die einzelnen Beitrige linear addiert werden. In diesem Fall ergibt sich naturlich ein griiBerer Wert fur die Unsicherheit. Ein einfaches Zahlenbeispiel sol1 dies demonstrieren. Die Unsicherheiten der drei Schritte einer Methode seien 1. 2 und 3
oder: 1/=1+2+3=6
3.4 Richtigkeit -
91
Durch Addition der einzelnen Beitrage wird eine kombinierte Stundardunsicherheit ermittelt; sie ist ein MaB fur Abweichungen des Wertes durch den EinfluB aller bekannten Fehlerquellen.
- SchlieBlich wird die kombinierte Standardunsicherheit mit einem ,,Enveiterung.~fukfor'~
k multipliziert, man erhalt die erweiterte Unsicherheit. Die resultierende erweiterte Unsicherheit stellt - ahnlich wie bei dem ,,t-Test" - auch einen Vertrauensbereich dar. Das ist der Bereich, der mit einer Wahrscheinlichkeit von 95 % den ,,wahren" Wert der ermittelten GroBe enthalt. k hat einen Wert zwischen 2 und 3, GUM empfiehlt k = 2, was einem Signifikanzniveau von 95 % entspricht. Sollte ein ,,groBzugigerer" Bereich sinnvoll erscheinen, so sollte die kombinierte Standardunsicherheit mit dem Faktor k = 3 multipliziert werden, was einem Signifikanzniveau von 99 % entspricht. Es ist zu beachten, dai3 das Multiplizieren der kornbinierten Standardunsicherheit rnit einer Konstanten keine neue Information, sondern nur die selbe Information in einer anderen Form liefert . Ein pragmatischer Ansatz zum Herausfinden des geeigneten Erweiterungsfaktors fur den eigenen Bedarf ware folgender: Man tragt in einer Regelkarte die entsprechenden Werte fur einen ausreichenden Zeitraum ein. Die Streuung der Werte zeigt das tatsachliche AusmaB aller EinfluBfaktoren auf das Ergebnis. Damit wird der Bereich ermittelt, in dem ein Wert erwartet werden kann. Und genau aus diesem Bereich, dem Vertrauensbereich, kann der Erweiterungsfaktor k ruckgerechnet werden. Ein Blick auf die t-Tabelle zeigt, daB fur das Vertrauensniveau von 95 % die t-Werte zwischen 3,182 (Anzahl der MeBwerte: drei) und 2,042 (Anzahl der MeBwerte: 30) liegen. Das heifit, der vorgeschlagene Wert von k zwischen 2 und 3 entspricht in etwa den t-Werten fur die ublich erzeugte Zahl von Laborwerten zwischen drei und dreiBig. Die durch die zwei Ansatze errechneten Vertrauensbereiche sind gar nicht so vie1 anders! Was bedeutet das konkret? Betrachten wir noch einmal die Werte aus dem oben aufgefuhrten Beispiel zur Prufung auf Richtigkeit niittels Soll/Ist-Vergleich: Sollwert: 95,90 Gefundener Mittelwert: 96,18 Standardabweichung: 0,23 Anzahl der Werte: 6 Standardunsicherheit:
uSt =
s
=
0,23
- 0,094 -
,,t-Test": t .s
2 3 7 1 . 0,23
t .s
4,032.0,23 = o,378
P = 9 5 %:
u=-=
P=99%:
u=-=
&
A
&
&
=
0,241
Erweiterte Unsicherheit fur k = 2 und k = 3:
95 %, k = 2
uE
=
k . u,,
=
2 . 0,094 = 0,188
99%,k=3
uE
=
k . u,,
=
3 . 0,094 = 0,282
Dac Vertrauensintervall (Vertrauensbereich) ware nach dem ,,t-Test":
95 % 99 5%
96,18 k 0,24 I d. h. 95,94 - 96,42 96, I8 f 0,378 d. h. 95,SO - 96,56
und nach dem Konzept der erweiterten Unsicherheit:
95%,k=2 99 %, k = 3
96,18 f 0, I88 d. h. 95,99 - 96,37 96.18 f 0,282 d. h. 95,90 - 96,46
Je grofier die Anmhl der MeBwerte, um so kleiner wird der Vertrauensbereich. Nehmen wir fur unser Beispiel nun eine Amah1 von 20 MeBwerten an; durch die griiRere Anzahl der MeRwerte nimmt bei konstantem Mittelwert von 96. I8 die Standardabweichung von 0.23 auf 0,18 ab. ,.r-Test":
95 %
1I =
2,093 0,I 8 20
=
0,084
99 c/c
1(
=
2,861 0.18 20
=
0,l I5
'
'
Es ergibt sich folgendes neues Vertrauensintervall: 95 % 99 7c
96,18 k 0,084 = 96,lO - 96,26 96,18 k 0, I I5 = 96,07 - 96,30
Erweiterte Unaicherheit:
95%.k=2
UE
99 %. k = 3
lfE =
=2.
0,I 8 = 0,081 20
0,18 3 . - = 0,121 20
3.4 Richtigkeit
93
Auch hier ergibt sich ein neues Vertrauensintervall: 95 %, k = 2 99 %, k = 3
96,18 f 0,08 I = 96,lO - 96,26 96, I8 f 0, I2 I = 96,06 - 96,30
und damit zusammenfassend: Vertrauensbcrcic h nach dem ,.t-Test"
Vertrauensbereich nach dem Konzept der erweiterten Unsicherhcir
6 Werte
6 Werte
P = 95 7%
95,94 - 96,42
k =2
95,99 - 96,37
P = 99 %
95,SO - 96,56
k =3
95,90 - 96,46
20 Werte
20 Werte
P = 95 %
96,lO - 96,26
k =2
96,lO - 96,26
P = 99 96
96,07 - 96,30
k =3
96,06 - 96,30
Fuzit: Wie dieses Beispiel zeigt. fuhrt die Verwendung des (Student-)t-Faktors im Vergleich zum Konzept der erweiterten Unsicherheit zu einem groBzugigeren und damit ,,sichereren" Vertrauensbereich gerade fur eine kleine Stichprobe. Und gerade im Handling einer kleinen Anzahl von Werten liegt die Stlrke der t-Verteilung! Je grol3er die Anzahl der MeBwerte, um so ghnlicher werden die Ergebnisse nach den zwei Ansatzen. Denn mit steigender Anzahl der MeBwerte nahert sich der Wert des t-Faktors dem Erweiterungsfaktor k = 2, z. B. ist fur 20 Werte t = 2,093 und fur 30 Werte t = 2,042. Die t-Verteilung geht langsam in die GauB-Verteilung uber, naheres s. Werke uber Statistik. Bereits bei 20 Werten ergeben sich praktisch identische Vertrauensbereiche. Deswegen wird verschiedentlich vorgeschlagen, fur eine kleine Anzahl von MeBwerten (n < 10) den ,&Test" zu benutzen, sonst jedoch generell die erweiterte Unsicherheit mit dem Erweiterungsfaktor k = 2. Diese Empfehlung ist gut und sachlich begrundet, es mu8 die Praxis zeigen, ob sie sich durchsetzt. Wir kommen zum SchluB kurz auf die Beweggrunde fur die verstlrkte Diskussion uber die ,,erweiterte Unsicherheit". Seit etlichen Jahren existieren nebeneinander folgende zwei Auffassungen: Der klassische Ansatz ,,kennt" systematische und zufallige Fehler, die Verfahrensmerkmale, die diese beschreiben, sind Richtigkeit und Prlzision. Diese Betrachtungsweise ist weit verbreitet. Zeugnis davon ist die Tatsache, daB fast ausnahmslos in jeder Literaturstelle zum Thema Validierung Richtigkeit und Priizision behandelt bzw. berechnet werden. Die Verfechter der erweiterten Unsicherheit vertreten die Auffassung, daB man eine derartige Unterscheidung gar nicht machen konne und solle. Die Argumentation lautet: Mit jedem Schritt eines Verfahrens mu13 - neben den zufllligen Fehlern - stets mit einem zusgtzlichen systematischen Fehler gerechnet werden. Es ist jedoch prinzipiell nicht moglich, alle potentiellen Fehlerquellen zu erfassen, geschweige denn deren Beitrage exakt zu berechnen. Also muB der ermittelte Wert mit einem Erweiterungsfaktor k (,,Sicherheitsfaktor") multipliziert wer-
den. Es ersibt sich somit ein Bereich, in dern ein Wert nach Einwirkung allerlei Eintlusse wahrscheinlich zu finden ist, auf die Unterscheidung systematische/zufiillige Fahler kann verzichtet werden. Mit der Anzahl von ermittelten Werten wiichst prorentual auch das Risiko von systematischen Fehlern, deswegen ergibt sich mit wachsender Anzahl von Werten ein - gegenuber dem ,,t-Test" - grofizugiger Vertrauensbereich. Wir beenden diesen Diskussionspunkt mit folgender Feststellung: Der r-Test stellt eine gut eingefiihrte Praxis dar. Die MeSunsicherheit bzw. erweiterte Unsicherheit ist zur Zeit in aller Munde, so wird dervorschlag aus dem GUM vielerorts stark diskutiert und oft bereits favorisiert, hat jedoch noch keine breite Anwendung gefunden. Das Konzept der MelSunsicherheit und der erweiterten Unsicherheit konnte nach der Inkraftsetzung der IS0 17025 Ruckenwind bekommen (s. auch Abschnitt 1.2. I ). Anhand zweier Beispiele sol1 noch einrnal die Anwendbarkeit des Vertrauensintervalls in der Praxis bewufitgemacht werden.
B r isp ir 1 I Die Wirkstoffproduktion der S.K.T.-JANE GmbH stellt den Wirkstoff ,,THESAAR - K N 95" her. Die Firma hat sich vertraglich aufeinen zu liefernden Gehalt von 80 c/r verptlichtet. Die Qualitiitskontrolle benutzt eine HPLC-Methode, der Gehalt wird ublicherweise durch Doppelbestimmung uberpruft: (,,Doppelbestimmung" heil3t zwei wirklich unabhiingige Bestimmungen und nicht Doppelinjektion!) In Tab. 3-7 sind fur vier VK's und fur 2, 3 und 4 Wiederholmessungen die sich ergebenden Vertrauensbereiche angegeben. Tab. 3-7 Vcrtrauensintervalle in Ahhiingigkcit von dcr Zahl der Wiederholmcssungcn Variationskocffi7icntcn V , der Methode lur cincn angcnommenen Gehalt von 80 % ,
II
und dcm
t,
n
11
0.5
I
I .5
2
3.57
7,lY
10.79
14.38
X.90
3
0.99
I .9x
2.98
3.97
2.48
4
0.64
I ,27
1.91
2.54
I .s9
7
i
"'
Es gilt: I/
t .s
= -
Ji
In der Forrnel fur die MeRunsicherheit t
[ I = - - . -
JJT
v,
'S
100
i/
wird s durch
v, ' X ~
100
ersetzt und wir erhalten:
3.4 Richtigkeit
95
So erhalten wir beispielsweise fur einen VK von 1,5 9% und eine Doppelbestimmung ein Vertrauensintervall von 10,79: 12,706 1,5 . 80
u = -.
Jz
-= 10,79
100
Fur einen VK von 0,5 % und eine dreifache Bestimrnung ergibt sich entsprechend ein Vertrauensintervall von 0,99: 4,303 0,5 . 80 - 0,99 u=-.-h 100 So weit zu den Werten der Tabelle. Welche Konsequenzen konnen nun daraus gezogen werden? Irn ersten Zahlenbeispiel hat der MeBwert eine Melhnsicherheit von 10,79 %. Um genau diese 10,79 % mu8 das Handelsprodukt angereichert werden. Nur wenn der Hersteller des Produktes ein solches mit einer Wirkstoffkonzentration von 80 % + 10,79 % = 90,79 % liefert, hat er strenggenommen den Liefervertrag erfullt. Er hat also Mehrkosten von absolut 10,79 % an Wirkstoff pro Jahr. Denn nur diesen Gehalt von 90.79 % kann man ,,wahrscheinlich" (Wahrscheinlichkeit P = 95 %) von 80 % - Gehalt unterscheiden, wenn nur eine Doppelbestimmung durchgefuhrt und eine Methode rnit einem V , von 1,5 % benutzt wird. Will man eine hohere Signifikanz (Wahrscheinlichkeit P = 99 %) bei der Entscheidung ,,Produkt in Ordnung jdnein" erreichen, d. h. auf der ,,sicheren Seite" sein, sieht es noch ungunstiger aus. Es existieren zwei Wege aus dern Dilemma: Entweder mu8 die Analytik praziser werden (kleinerer V,) oder es mussen mehr Messungen durchgefuhrt werden (groRerer Wert fur n). [38] Bemerkung: ,,Prazisere" Analytik, d. h. Verkleinerung von VK bedingt nicht unbedingt eine Anderung der experimentellen Bedingungen. Ein kleinerer VK ist auch durch Mehrfachrnessung einer Probe zu erreichen. Eine Doppelinjektion wurde beispielsweise den V , von I ,5 auf etwa I , eine Dreifachinjektion auf etwa 0,4 ,,drucken". Auf eine Berechnung wird hier verzichtet, s. dazu das Beispiel in Abschnitt. 3.3.4.2 und Abbildung 3-4. Die Werte der Tab. 3-7 zeigen eindeutig, welche Strategie die effektivere ist. Eine prazisere Analytik, d. h. V , = I % oder gar 0,5 % fuhrt zu einer Abnahme der MeBunsicherheit von 10,79 auf 7,19 bzw. 3,57. Die Erhohung von unabhangigen Messungen jedoch, z. B. auf 4, fuhrt bei konstanter Prazision ( V , = 15 %) zu einer Mehnsicherheit von 1,9 1, d. h. das Produkt mu13 statt auf 80 ,,nur" auf 8 1,91 O/o eingestellt werden, die Firma verliert nur I ,91 % des wirkstoffbezogenen Jahresertrages. Sogar eine Erhohung der Wiederholmessungen urn Eine - z. B. von 2 auf 3 - fuhrt zu einer merklichen Ersparnis durch die Abnahme des Vertrauensintervalls von 10,79auf 2,98. Aber: Durch mehr Wiederholrnessungen (oder prazisere Analytik) wird naturlich die Qualitat des Produktes nicht verbessert!
Als weitere. allgemeine Konsequenz gilt: Ein Verfahren, das unpriizise ist, aber kurz dauert - und dadurch mehr unabhiingige Messungen ermiiglicht -, ist einem priiziseren Verfahren. das Iiinger dauert und dadurch weniger Messungen erlaubt, vorzuziehen. Einen echten Gewinn bringt die friihe Information. Durch das fruhe Erkennen von Ausreifiern kann inan gezielter und hiiufiger den Produktionsprozefi verbessern. weil eben durch die fruhe Inforination eine h d e r u n g sofort erkannt wird, s. auch Abbildung 3-5, Abschnitt 3. I 1 und 5. I . Es sind vielfach enorme Verbesserungs-Potentiale vorhanden, auf die hier nicht eingegangen werden kann. Bei.7pit.l 2: In vielen SOP'S wird ein V , zwischen 1 % und 2 % verlangt. Gibt es eine Begrundung fur diese Zahlen? Betrachten wir dazu weitere iibliche Zahlenwerte aus der Welt der Produktanalytik: 6 Messungen, Spezitlkationsanforderung 99 % - 101 % oder 98 % - 102 70.Wir konnen n u n mit diesen Zahlen die sich ergebenden V,'s ausrechnen:
.\- -
sowie
11 =
t
'
v,
.r
'
100
I102 - 100)
'
2,57 I . I00
'
100
= 1,91 , also = 2 %
Welchen Wert darf dabei die MeRpriizision hochstens haben? Nach der Additivitiit der VarianJen. s. Abschnitt 3.3.4.3, gilt:
Unter der Annahme, daB
.sk\tI.,,I1,cI1t
, \ k(Probenvorbereitung'?!). ~ gilt welter:
3.4 Richtigkrit
Im Bereich um 100 o/o gilt vereinfacht V, -
- 0,7 J7 I
Stnstrument - -
97
= s und somit ergibt sich fur beide Falle:
2 -und slnstrument = 1,40.
J7
Eine MeBprazision von 1,4 oder sogar von 0,7 zu erreichen durfte heute bei mangelfreien Geraten kein Problem sein. Hinweis: Bei einem s-Wert (bei einem x-Wert von 100 = V,-Wert) von etwa 1 haben wir unter der Annahme einer GauB'schen Normalverteilung einen Schwankungsbereich der Werte um etwa 6 Prozentpunkte: 2 3 .F = 6 s und 6 . s ( VK) = 6 %. Das bedeutet, dal3 auch fur den Fall, dall der Mittelwert ,,in spec" ist, d. h. beispielsweise um 100 %, einzelne Werte sich weit jenseits der Spezifikationsgrenze von zwei bzw. vier Prozentpunkten (99 % - 101 % bzw. 98 % - 102 %) befinden konnen. Ohne hier tiefer einsteigen zu wollen, gilt Folgendes: Die Forderung, daB alle MeBwerte ,,in spec" sein mussen, ist unsinnig, sinnvoll ist sie nur fur den Mittelwert, s. ausfuhrliche Erlauterungen in Abschnitt 3. I 1.
3.4.4 Zusammenfassung von Tests zum Vergleich und zur Beurteilung von Zahlen und Zahlenreihen I n Abschnitt 3.3.6.5 und im vorliegenden werden mehrere Tests zur Bewertung und Beurteilung von Zahlen vorgestellt. Diese Tests und deren Zielsetzung sind in Tab. 3-8a und 3-8b abschlieBend zusammengefafit.
Tab. 3-8a Tests zur Beurlcilung von Zahlen bzw. Zahlenreihen und deren Aussage. Test
ZielsetzunglbeabsichtigteInformation
David-Test
Sind die ermittelten Werte normalverteilt?
Berechnung der Wicderholstandardabwcichung bzw. dcs Variationskoeffizienten
Wie ist die Streuung der unter Wicderholbedingungen ermittelten Werte?
AusreiBertests
Sind mit einer vorgegebencn Wahrscheinlichkeit Ausreil3er enthalten?
I-TCSI
Befindet sich ein Wert (rnit ciner vorgegebenen Wahrscheinlichkeit) im Vertrauensbereich des Sollwertes?
Trendtest nach Neumann
Gibt es einen zeitlichen Trend bei der Ermittlung der Zahlen?
Tab. 3-8a Forlsctzung ~
Test
Zielsetzung/hcahsichti~te Information
Wiederholgrcnxe
Welche Differenz sollte hei zwei daraullolgenden Wiedcrholmessungen in dcr Regel (Wahrscheinlichkeit: 95 %) nicht lberschritten wcrden?
MeRunsichcrheil
Mit dieser Mel3unaichcrheit ist ein MeBwcrt bchaftet, der mit dieser Methodc (d. h. mit diewr Standardahweichung und dirsrr An/ahl von Wertcn) ermittclt wurde.
Vertraucnshercich des MelJwertes
Das ist die ohere und untere Grenre der Zahlcnwcrte, die sich aus dem Wert der MeRunsicherheit crgebcn.
Erweitertc Unsicherheit
Das 1st ein Vcrtraucnsintervall. In dicscm sollten die Werte mi1 einer gegebenen Wahrscheinlichkeit sich hefinden: vielfaches der Mehnsicherheit (zuiillige plus systematische Fehler).
Wilcoxon-Test
Sind die Wcrte einer MelJseric um den Sollwert symmetrisch verteilt?
Tab. 3-8b Tests zum Vergleich von zwei Zahlenreihen. Test
Anmerkungcn
Vergleichsgrcnrc
Diese DilfcrenL der Mittelwerte v o n Lwei Zahlenreihen (cine Probe, zwei Anwendcr, zwei Cerate, zwei Labors) kann mil einer vorgegehenen Wahrscheinlichkeit (meist 95 %) erwartet werdcn. Die Lwei Mittelwerte wurden unter Wiederholbedingungen ermittelt.
F-Test
Konnen die Standardabweichungcn von zwei MelJrcihcn ( A . B. je 6 Messungen von zwei Produktchargcn oder j e 6 und 12 Messungen von zwei Mustern aus einer Deponie) verglichen werden? D. h. gchiiren diese Zahlen einer Grundgesamtheit?
Coc hran-Test
Sind m6gliche Differenzen bei dcr Analyse einrr Prohe mittels gleicher Anzahl v o n MeBwerten durch mchrcre Labors oder mehrcre Mitarheiter oder unterschiedliche Konfiguration von Geraten signifikant oder nicht'! Das ist Ictrten Endes nichts andcrcs als ein Ausreilkrtest lur MeBreihen.
3.4 Richtigkeit
99
3.4.5 Wie sol1 ich nun die Richtigkeit uberpriifen? Wenn zuverlassige Referenzsubstanzen zur Verfugung stehen z. B. zertifizierte Referenzmaterialien, Normale - Proben, deren Gehalt durch mehrere, unabhangige Methoden eindeutig bestimmt wurde - eigene Muster, die durch Spektroskopie und weitere physikalische Methoden zweifelsfrei charakterisiert wurden so empfiehlt sich in jedem Fall die erste Methode (Soll/Ist-Vergleich): ZweckmaBigerweise sollten mindestens drei Konzentrationsniveaus untersucht werden. -
Sind Referenzsubstanzen nicht vorhanden, so fallt bei Trenntechniken der Schwerpunkt auf die Uberprufung der Selektivitat und der Wiederfindung. Dies geschieht durch Vergleich mit bekannten und validierten Methoden oder durch Wiederfindungsexperimente und Priifung der Selektivitat (siehe Abschnitt 3.6). Bei Wiederfindungsexperimenten werden Losungen bekannten Gehaltes verwendet - wie bei der Linearitat: Der Gehalt der jeweiligen Referenzlosung wird berechnet und gegen den 1st-Wert aufgetragen. Somit konnen sowohl die Linearitat als auch die Richtigkeit mit den gleichen Daten beurteilt werden [39], siehe auch Kapitel7. Wenn moglich sollte die Vergleichsmethode eine stochiometrische d. h. eine Absolutmethode sein wie z. B. Titration oder Elementaranalyse. Die Annahme der Richtigkeit wird durch ein lineares Regressionsmodell mit a = 0 erhartet. Bei der Angabe der Richtigkeit sollte folgendes angegeben werden: geprufte Konzentration, Anzahl der Wiederholmessungen, evtl. Vorzeichen der Abweichung, Vertrauensintervall, Signifikanzniveau. Einfacher Test zum Vergleich zweier MeBwertreihen Werden statistische Tests nicht unbedingt gefordert, so konnten folgende zwei pragmatische Kriterien fur den Vergleich zweier MeBwertreihen gelten (Vergleich zweier Methoden zur Gehaltsbestimmung, zweier Chargen, der Arbeitsweise zweier Mitarbeiter, oder zweier Labors usw.): - Wenn die zwei VK's nicht groBer als 2 % sind und -
die relative Differenz der zwei Mittelwerte nicht mehr als 2 % betragt, so ist Richtigkeit und Prazision der zwei MeBwertreihen vergleichbar. 1st eine der zwei Methoden eine Referenzmethode, so liefert die zu prufende Methode richtige und prazise Werte.
Ein vereinfachtes Schema zur Vorgehensweise bei der Uberprufung der Richtigkeit zeigt Abb. 3-8.
Wilcoxon-Test )
JA + ( t-Test, evtl.
r L
Abb. 3-8 Schema zur Uberprulung der Richtipkeit
ENDE
Richtigkeit bewiesen 7
I
JA I
+
NElN
I
I
NElN
Richtigkeit bestatigt ?
Fehler aufheben
ENDE
Tests sorgfaltiger bzw. urnfangreichere Tests durchfuhren
k b
ENDE
1 Trenntechniken: Selektivitat, Linearitat, Wiederfindung und Gerat uberprufen
Systernatische Fehler gefunden ?
(erneut) kalibrieren, Optik OK ?
Spektroskopische und physikalischl chernische Methoden einsetzen
Auf andere Methoden ausweichen
Vergleich mit einer Referenzrnethode. Richtigkeit bewiesen ? (Differenzen &Test)
I
1
Referenzsubstanzen / Norrnale vorhanden ?
3.5 Robustheit
3.5
10 I
Robustheit
3.5.1 Definition und Erlauterungen Robustheit ist die Flhigkeit eines Verfahrens, ein Ergebnis zu liefern, das durch variierende Bedingungen nicht oder unwesentlich verfllscht wird. Oder: Robustheit beschreibt das AusmaB der Unabhangigkeit eines Ergebnisses von Anderungen aller relevanten EinfluBparameter. Als Ma8 fur die Robustheit gilt der Bereich, in dem das Ergebnis von einer Anderung eines Parameters unahhungig ist. Das Ergebnis beispielsweise ist stabil bzw. die Methode ist robust zwischen pH = 6 und 8, zwischen 30 "C und 50 'C, sie ist unabhlngig vom Dichtungsmaterial und fur die Matrix x, y und z usw. Nachfolgende Ausfuhrungen sollen etwas Klarheit in die unterxchiedlich benutzte Nomenklatur bringen. Im Englischen werden fur den deutschen Begriff ,,Robustheit" die Begriffe ,,robustness" und ,,ruggedness" verwendet. Zwar bemuhen sich die einzelnen Organisationen in letzter Zeit redlich um unmifiverstandliche Definitionen, doch wird durch deren Zahl die Situation nicht gerade erleichtert. Nachfolgend wird der Versuch einer Klarstellung unternommen. - USP<1225>
Fur USP ist ,,ruggedness" der Grad der Reproduzierbarkeit von Ergebnissen, wiedergegeben im V,-Wert, wenn Bedingungen variiert werden. ,,Variierende Bedingungen" kann laut USP bedeuten: Wechsel des Labors, des Anwenders, des Gerates, der Reagenzien, der Temperatur, des Zeitpunkts der Analyse usw. - also im Prinzip alles. ,,Ruggedness" ist somit laut USP ein Ma8 fur die Reproduzierbarkeit von Ergebnissen zwischen unterschiedlichen Anwendern und unterschiedlichen Labors unter ublichen experimentellen Bedingungen. Die Definition fur ,,robustness" ist identisch mit der ICH, s. dort. -
-
NATA Fur NATA bedeutet ,,ruggedness" das Gleiche wie Reproduzierbarkeit; im Gegensatz zu USP - fur die jegliche Anderung der Bedingungen moglich ist - ist fur die Australier eine Methode ,,rugged", wenn sie ,,nur" bei einer Anderung von Anwender oder Labor oder Gerat vergleichbare Ergebnisse liefert. FDA, ICH Bei ICH und FDA wird nur ,,robustness" erwahnt. Und ,,robustness" ist die Prufung der Flhigkeit einer Methode, ein Ergebnis zu liefern, das von kleinen aber realistischen und eindeutig definierbaren Anderungen der Methodenparameter wie pH-Wert. Temperatur, Extraktionszeit, chromatographische Saulen (Chargen, Hersteller) usw. unbeeinflufit bleibt. Im ubrigen sind das Experiniente, die in die Methodenentwicklung gehoren, ,,robustness" sei laut ICH nicht Bestandteil einer Methodenvalidierung.
So weit zur Nomenklatur.
Robustheit ist eines der wichtigsten Charakteristika einer Methode. das erfreulicherweise immer starker ins BewuOtsein ruckt. Das ist eine positive Entwicklung, denn ein nicht unerheblicher Teil der Analysenkosten wird durch nicht robuste Methoden verursacht. Es kiinnte sinnvoll sein, eine allgemeine Beschreibung fur das Vorgehen bei Arbeiten in der instrumentellen Analytik als SOP zu verfassen. Sie wurde sich durch ihren universellen Charakter von konkreten Prufanweisungen/-vorschriften unterscheiden und sie wiire Neueinsteigern in der Analytik eine groBe Hilfe. Bedarf ist vorhanden. Vcrriierenrle h’cdingiingeti kiinnen unterachiedlicher Natur sein und sie hiingen vom konkreten Prufverfahren ab:
I . Anderung von Methodenparametern (changes in method parameters, robustness, s. o.), Methodenrobustheit, Robustheit I. Beispiel: Anderung von pH-Wert, Ionenstiirke, Temperatur, Proben- und Matrixkonzentration; irreversible Sorption bestimmter Komponenten an Oberflachen von Hilfsmitteln wie Probengeber, Dichtungen, Pipetten abhiingig von den aktuellen experimentellen Bedingungen, Qualitat der eingesetzten Chemikalien usw. 2. Stabilitiit des Ergebnisses uber die vorgesehene Zeit (Laufzeit einer Analysenserie, Dauer der Kampagne usw.), Verfahrensstabilitiit. Beispiel: Stabilitiit von Losungen, Alterung der eingesetzten Mittel wie chromatographische Siiulen, Geratschaften, zeitabhiingige Sorption an Oberfliichen. 3. Variierende Parameter bei der Durchfuhrung in der Routine (changes in operating conditions, ruggedness) Anwendbarkeit, Robustheit 11. Hoispiel: Wechsel von Anwender, Geriit oder Labor, Zeitpunkt der Messung.
3.5.2
Priifung auf Robustheit
Es ist aus okonomischen Grunden sinnvoll, die Uberprufung der Robustheit zeitlich in zwei bzw. drei Stufen durchzufuhren.
3.5.2.1 Methodenrobustheit, Robustheit I: fruhes Stadium Bri.vpiele Zu Beginn des Lebenszyklus einer chromatographischen Methode wird ublicherweise die Selektivitat durch Variation der Methodenparameter ubeipriift. Werden diese Ergebnisse. die ja gleichzeitig Experimente zur Robustheit darstellen, in der Prufvorschrift/SOP entsprechend dokumentiert, so erspart man sich spiiter manchen Arger. Weiterhin kiinnen hier kritische Parameter der Methode ausfindig gemacht werden, die als Kriterien f u r die Robustheit der Methode in einem spateren Systemeignungstest verankert werden. Das sind auch hervorragende Kriterien fur die Notwendigkeit von Revalidierungsarbeiten bei etwaigen Veriinderungen, denn durch diese Tests wird ja festgestellt, welche Anderung in welchem AusmaD das Ergebnis beeinflufit.
-
3.5 Robustheit
103
- Wenn eine neue Freisetzungsapparatur installiert wird, so gehort zu den ersten Experi-
menten die Uberpriifung der Freisetzungsraten in Abhlngigkeit von der Ruhrgeschwindigkeit, vom pH-Wert und von der Temperaturkonstanz im ganzen Raum. Bei einer Universalpriifmaschine wird der Einflu13 von Erschutterungen und Temperaturschwankungen auf die Messung einzelner Pruflinge getestet. - Bei rheologischen Messungen (Messungen der dynamischen Viskositat) ware gleich zu Beginn der EinfluB von Temperatur, Erschutterungen und Art des Probeneinflusses auf die Ergebnisprazision zu untersuchen. Unmittelbar danach sollte der EinfluB von Temperatur, Matrix und Konzentration auf die FlieRgrenze und die Thixotropie getestet werden.
3.5.2.2 Verfahrensstabilitat Durch solche Experimente gewinnt man recht fruh ein erstes Gefuhl fur die Robustheit der betrachteten Methode. Nachdem nun die Methode ausgearbeitet ist, sollte - wenn notwendig - deren Verfahrensstabilitat uberpriift werden. Stabilitat von Losungen Eine Kontrollprobe wird wahrend einer Iangeren Zeit immer wieder gegen die frische Losung eines im Kuhlschrank aufbewahrten oder tiefgefrorenen Standards vermessen. Die Losung der Kontrollprobe gilt bei den aufbewahrten Bedingungen fur den Zeitraum so lange als stabil, wie die Gehaltsdifferenz einen bestimmten, vorher festgelegten Schwellenwert nicht uberschreitet.
Gegebenenfalls mussen ein F- und ein t-Test durchgefuhrt werden Streuung der Werte abhangig von der Zeit
Es wird der V , zu Beginn einer MeRserie und zum SchluB bzw. nach 12, 24,48 Stunden bestimmt. Auch hier gilt eine bestimmte, noch akzeptable VK-Differenz als Ma13 fur die Verfahrensstabilitat. Beispiel Es geht um die Verjiuhrensstahifitutbei der HPLC-Bestimmung der Nebenkomponente Methyl-NOVIATULIN. Die Spezifikationsgrenze liegt bei I ,5 %, die Bestimmungsgrenze von 0,l % wurde im Vorfeld durch die Kalibrierwertmethode (Abschnitt 3.9.2) ermittelt. Es wurden die Gehalte zu Beginn der MeRserie am Montagmorgen um 8.30 Uhr und am Ende der aktuellen Kampagne am Dienstag um 14.30 Uhr gemessen. Es sol1 anhand der erhaltenen Werte die Zuverlassigkeit sowie die Stabilitat der Methode fur diesen Zeitraum uberpruft werden.
Beginn der Messung: 0.81 %
0.80 56
0,79 c/r
0,77 56
0,84 56
0.85 56
-
.r = 0,81 s = 0,030
v,
= 3.74 %
Die erste Frage lautet, o h die Prlzision des Verfahrens fur diesen Bereich uberhaupt akzeptabel ist. Dazu berechnet man die Standardabweichung an der Spezifikationsgrenze ( I ,5 %):
Bei einer Doppelbestimmung erwarten wir in 95 % der Fille eine Differenr von hbchstens: Y
= 2,8 . s = 2.8 . 0,056 = 0,16
Der Vertrauensbereich fur den Gehalt sollte nicht griilkr sein als der halbe Toleranzbereich aus den vorgegebenen Spezifikationsgrenzen (s. Abschnitt 3.3.7.1). Das bedeutet im vorliegenden Fall: I/
<
I/
<
(OSG - USG) 2 1.5 ~
-
0.1
2
=
0.7%
0,16 als ,,erlaubte" Differenz, siehe oben, ist um mehr als Faktor 4 kleiner als der halbe Bereich zwischen der Bestimmungs- und Spezifikationsgrenze (4 . 0.16 = 0,64 < 0.7). Damit konnen wir uns beruhigt mit der eigentlichen Frage nach der Verfahrensstabilitit befassen.
Ende der Messung: 0,77 %
0,75 '/r
.Y = 0.78 s = 0,026
v,
= 334 8
0,80 %
0,76 %
0 3 2 c/c
0.78 C/r
3.5 Robustheit
105
Der F-Test ergibt: s2
0,0302
si
0,0262
F='=-
=
1,33 < 5,os
Nachdem wir nun wissen, dalj mit einer Wahrscheinlichkeit von 95 % es keinen signijkunten Unterschied der Standardabweichung zwischen den zwei MeRserien gibt, kann jetzt der t-Test zur Prufung der Richtigkeit angewandt werden: -
=
0,81
-
0,78
0, 0302 + 0, O2tj2
. v%
=
1,85 < 2,228
Mit einer Wahrscheinlichkeit von 95 % andern sich die Mittelwerte wahrend der Laufzeit der Meljserie von 30 Stunden nicht. Das Verfahren ist fur die Dauer dieser Meljserie stabil, die Prlzision und die Richtigkeit sind hinreichend.
3.5.2.3 Anwendbarkeit, Robustheit I1 Die Anwendbarkeit der Methode sol1 vor dem Routineeinsatz gepriift werden. Der Aufwand hlngt hier vom beabsichtigten, zukunftigen Einsatz der Methode ab. Wir unterscheiden hier folgende zwei Falle:
1. Die Methode wird ausschlieljlich im eigenen Labor eingesetzt. In diesem Fall sollte die Laborpriizision uberpruft werden. Dabei wird die Frage beantwortet, ob das Ergebnis konstant bleibt, wenn im Routineeinsatz realistische Anderungen unausweichlich sind, z. B. ein anderer Anwender die Analyse durchfuhrt, oder ein anderes Gerat verwendet wird. Welche Anderungen in welchem Ausmalj getestet werden, hangt von der konkreten Laborsituation ab: Welche gewollte oder ungewollte Anderungen sind denkbar und was kann die Zukunft noch an Variablen bringen? Beispielsweise werden 6 unabhangige Proben (6 Einwaagen) von einem anderen Anwender als dem Methodenentwickler am nachsten Tag an einem anderen Gerat vermessen. Oder er verwendet zusatzlich anderes Wasser undoder nimmt fur die Sulfatasche-Bestimmung andere Tiegel. Hier sind der (begrundeten) Phantasie keine Grenzen gesetzt. So kiinnen durch einen ,,unorthodoxen" Sequenzaufbau bei einer automatischen HPLCMethode Verschleppung, Uberladung der Saule, Matrixeffekte usw. schnell erkannt werden. Eine gute Praxis ist folgende: Die Validierung selbst sol1 mit unabhangigen Analysenserien von einer Personal-Gerlte-Chemikalienkonfiguration,die den spateren Routineeinsatz reprasentiert, durchgefuhrt werden. Das mag im ersten Moment etwas aufwendig klingen, doch erhalt man dadurch realistischere Werte fur die Kenndaten der Methode. Eine ,,abgespeckte" Version ist das ,,3 x 3 x 3-Modell" zur Uberprufung der Robustheit: Drei Anwender ermitteln mit drei Saulen (Tiegel in der Gravimetrie, Kuvetten
in der UV-Spektroskopie. Elektroden in der Titrirnetrie, usw.) an drei Geraten be\timmte Verfahrenskenndaten. Eine Vorgehenswei\e. bei der g1eichLeiti.g rnehrerc. Variablen veriindert werden, hat einen Vor- und einen Nachteil.
Beispiel Ein zweiter Bearbeiter fiihrt nach drei Tagen die Analyse einer bei Raumtemperatur aufbewahrten Probe an einem Geriit eines anderen Herstellers durch, indem er Reagenzien eines anderen Lieferanten verwendet. 1st der VK vergleichbar (F-Test) mit dem V , unter Wiederholbedingungen, so kann man wohl von einer recht robusten Methode ausgehen. Und man hat durch dieses kombinierte Experiment Zeit gespart. Variiert jedoch der VK stark, so bleibt der kritische Part der Methode im Verborgenen. Variationen: Wie oben, man verwendetjedoch stets tiefgefrorene Proben zur Errnittlung der Laborprlzision, d. h. Anwendbarkeit der Methode im Laboralltag. Ein Anwender priift die Wiederholstandardabweichungnach 6, 12,24,48 Stunden, wobei die Probe aul3er wahrend der Meflzeit sich im Kiihlschrank befindet, so wird die Verfahrensstabilitiit ermittelt. So wird festgestellt. welcher Akerung die Hilfsmitel wiihrend der Analysenzeit, bei realen Routinebedingungen, ausgesetzt sind. Bei Stabilitltsuntersuchungen bleiben samtliche Methodenbedingungen bis auf die Aufbewahrungstemperatur bzw. -bedingungen der Probe konstant. In diesem Zusammenhang sollte auch an die Robustheit des Auswertesystems gedacht werden. So kiinnte man versuchen, den PC durch komplexe und eventuell unsinnige Rechenoperationen, mehrere parallele Anwendungen. bewuBt kreierte Datenflut, uniibliches ,,Springen" in einem pull down menue usw. bewul3t stark zu beanspruchen. Ubersteht er solche ,,Strapazen", hiitte er einen pragmatisch angelegten Robustheitstest uberstanden. Gegebenenfalis gehort ein solcher Hartetest zur QualifiLierung eines PC's/einer computerisierten Anlage. ~
~
2. Die Methode sol1 auch auf3erhalb des eigenen Labors eingesetzt werden. Die Methode sol1 nun zweckrnafligerweise in einern zweiten oder dritten Labor unter Wiederholbedingungen vermessen und die VK's verglichen werden (Vergleichbarkeit). Die Vergleichsprazision 1st somit ein Kriterium fur die Robustheit. Nehmen mehrere Labors an solchen Tests teil, so ist die Rede von den Ring-oder L a h o r v e r ~ ~ l ~ ~ i c ~ h s v e rDa s i i sie ~ ~ hrecht ~ ~ naufwendig . und teuer sind, nimmt deren Zahl in reglementierten Bereichen, in denen ohnehin konkrete Vorgaben existieren, merklich ab. In folgenden Fallen sind Laborvergleichsversuche nach wie vor bedeutsam, deren Zahl nimmt sogar zu: Adaption neuer Methoden, behordliches Umfeld L B. UntersuchungsSmter. LUFAs, BAM. EMPA
3.5 Robustheit
107
- Auftragslabors nehmen an Laborvergleichsversuchen teil, urn ihre Chancen bei der
Vergabe von Auftragen, insbesondere durch kommunalelbehordliche Auftraggeber, zu wahren. - Herstellung von Referenzmaterialien.
3.5.3 Zeitlicher Ablauf der Robustheitstests Mit der Methodenentwicklung sol1 auch die Methodenrobustheit uberpruft werden. Wie ist der EinfluR von pH-Wert, Temperatur usw. auf das Ergebnis? Unmittelbar danach oder parallel zur ersten Stufe folgt, bei Bedarf, die Uberprufung der Stabilitat von Losungen bzw. der Verfahrensstabilitat. Hier wird untersucht, o b die Proben und das analytische System uber die vorgesehene Zeit stabil bleiben. Fur eine einfache Entscheidung sollte folgende Frage beantwortet werden: ,,Ist die Differenz zwischen VK ,jetzt" und VK nach x-Stundeaagen noch akzeptabel? Die noch akzeptierte Differenz sollte auf Basis von Erfahmngswerten vorher festgelegt worden sein. Die objektive Beurteilung erfolgt durch F- und ?-Test d. h. Vergleich der Standardabweichungen und der Mittelwerte ,jetzt" und nach x-StundedTagen. Ein gutes Vergleichskriterium ist die relative Verfahrensstandardabweichung(s. Abschnitt 3.7.2.4). Ein bewahrtes Werkzeug zur Uberprufung der Stabilitat von Prozessen sind die Regelkarten. Vor dem Einsatz der Methode in der Routine sollte deren Anwendbarkeit getestet werden. Im Falle der Anwendung im eigenen Labor durch die Laborprazision und bei Anwendung in mehreren Labors durch die Vergleichsprazision. Dafur eignet sich VK als objektives Kriterium fur die Robustheit = leichte Anwendbarkeit einer Methode sowohl was die Labor- als auch die Vergleichsprazision betrifft. Neben der einfachen Streuung der Werte innerhalb einer MeRserie (VK) kann uber die Varianzenhomogenitat gepruft werden, ob die zwei Wertereihen einer Grundgesamtheit entstammen, z. B. Werte mit Gerat A und Gerat B erhalten, Analyse von Mitarbeiter 1 und Mitarbeiter 2 durchgefuhrt, Werte stammen aus Labor 1 und Labor 2 usw. Das wird schematisch in Abb. 3-9 [34] dargestellt. Es liegt auf der Hand, dal3 der Ursache fur die Streuung, wie auf der linken Seite der Abbildung dargestellt, nachgegangen werden muB.
Abb. 3-9 Zur Robusthcit von Methoden; beim Wechsel von der Situation A zur Situation B (anderes Labor, andercs Geriit usw.) zeigt sich, da13 MethodeA2 robuster ist als Methode A l [34].
Ahb. 3-10 Zur Priiiision und Rohustheit von Methoden
Viele Methoden sind zu ,,priizise". L%t man sich (oft unnotig) auf sehr enge Spezifikationsgrenzen ein, hat man in der Zukunft mit einer nicht robusten Methode zu kampfen: Eine jede winzige Anderung in den Methodenparametern oder in der Umgebung kann zu einer Streuung der Werte fiihren und man gerLt leicht aul3erhalb der Spezifikationsgrenzen. Abbildung 3- 10 zeigt fur den gkichen Mittelwert eine sehr prlzise und nicht robuste sowie eine weniger priizise aber robuste Methode. Sind die Spezifikationsgrenzen vorgegeben, so sollten stets miiglichst priizise Methoden angestrebt werden, siehe Abb. 3- 10, Abschnitt 3.7.2 und 3. I I .3. Wichtig ist, die Spezitikationsgrenxen stets nach den tatsiichlichen Bedurfnissen und den Gegebenheiten im Alltag zu definieren (wenn man darf ...). Es kann gegebenenfalls mit Blick aufeine Kostenbegrenmng sinnvoll sein, parallel oder in
Kombination zu prufen z. B. die Stabilitiit von Liisungen zusammen mit der Laborpriizision oder der MeBpriizision (sechs Standardlosungen) - parallel in zwei Labors mit Analyse der Standard- und Probeliisungen (unabhiingige Einwaagen) nach 24, eventuell auch nach 48 Stunden usw. -
Ein Lhnlicher 3-Stufen-Plan wird von HPB (kanadisches Pendant der FDA) vorgeschlagen: Stufe 1: Wie empfindlich reagiert die Methode auf kleine Anderungen? 2 Chargen eines chromatographischen Materials Kleine Veriinderungen der mobilen Phase Anderer Anwender Stufe 2: Wie reagiert sie bei griiBeren Veranderungen? Unterschiedliche Saulentypen Anderes Geriit Anderes Labor Stufe 3: Anwendbarkeit auflerhalb des eigenen Labors'? - Testen in anderen Labors
3.5 Robustheir
Tab. 3-9 Robustheit von Methoden ggf. variiert werden sollten.
AASIAESIICP -
-
Spaltbreite Art der Dosierung Gasilufi Brcnnzeit (bei Flamnie) Temperatur (bei Graphit) Mineralisierungsgrad
-
Charakteristische Parameter, die bei einzelnen Methoden
Polarographie/ Vol tammetrie lonenstarke des Grundelektrolyten TropfgroOe, -geschwindigkeit Konkurrenzreaktionen an der Quecksilberoberflache Unerwunschte Nebenreaktionen, (vor allem im Spurenbereich!) Stabilitat von Losungen - Temperatur Abscheidungszeit Trenntechniken
-
Ti tration -
-
-
-
-
Gravimetrie/ Thermogravimetrie Bei Sulfatasche: Pyrosulfatbildung? Behandlung des Wagegllschens, Tiegelmaterials Temperatur bzw. Heizrate Substanzverteilung im TrockengefiB Bei Gasbrenner: Gaszufuhr, Luftzufuhr, Flammenabstand Bei Trockungsverlust: ungewunschte Umsetzung (Oxidationen, Dehydratisierungen)? Wirksamkeit von Mg (CL04)2und P205: Oberflache! Beschaffenheit: GranuWfest etc.
GC: GasfluB Splitverhaltnis bei der Injektion Aufheizrate Headspacetechnik und Matrix DC: Plattenmaterial Feuchtigkeit Auftragsart und -dauer Laufmittel CE: Injektion -
-
-
-
-
Spannung Pufferstarke und -stabilitat - Warmeabfuhr HPLC/IC: - pH-Wert - Temperatur FluB Charge der stationaren Phase
-
-
-
Qualitat des Urtiters Ertassung des Endpunktes (Potentiometer/Indikator) Ternperaturdifferenz: TitriergefiaRIWaage F"1lgeschwindigkej( Titriergeschwindigkeil C0,-Konzentration im Titriermittel
Spektroskopie -
-
-
-
109
-
Spaltbreite Zeitkonstante Probenvorbereitung (PreBling, Verreibung) Konzentration: a) der Probe selbst b) einzelner Probekomponenten Probelosungsmittel pH-Wert Temperatur Wellenlangerichtigkeit Streulicht'?
3.5.4 Kommentare. Hinweise Robustheit ist vermutlich das individuellste aller Kriterien einer Methode bezuglich Umfang und Durchfuhrungspraxis. So ist beispielsweise AAS eine robustes Verfahren, es besteht kaum Bedarf fur eine Uberprufung der Robustheit im eigentlichen Sinne. Bei einer UV-Messung gibt es dann schon einige Faktoren, die das Ergebnis beeinflussen kiinnen: Temperatur, Matrix. pHWert, Feuchtigkeit. Es gibt schliefilich komplexe HPLC-Methoden, bei denen die Uberprufung der Robustheit mit Sicherheit den Liiwenanteil der Methodenvalidierung darstellt. In Tab. 3-9 sind fur einige wichtige Verfahren die Parameter wiedergegeben, die bei der Uberprufung der Robustheit gepruft werden kiinnen. Robustheit ist abhangig von der Konzentration. Als quantitatives Mafi fur die Robustheit einer Methode kiinnten die verschiedenen Niveaus der Prazision bei unterschiedlichen Konzentrationen gelten.
3.5.5 Robustheit in der HPLC Nachfolgend werden einige Ansatze zur Uberpriifung der Robustheit in der HPLC vorgestellt. Diese Vorschlage gelten sinngemlB fur alle chromatographischen sowie verwandten Trenntechniken wie Kapillarelektrophorese und Kapillarelektrochroiiiatographie.Der notwendige Umfang der Experimente hiingt vom konkreten Fall ab. Der Einflufi einer komplexen Matrix sollte stets untersucht werden, ansonsten bestimmen Art der Probe und Trennmechanismus Umfang und AusmaBe der Experimente. So sind beispielsweise bei der Trennung von ionischen Substanzen pH- Anderungen kritisch. (s. Abb. 3- 1 I ), bei Normal-Phase-Trennungen spielen Spuren von Wasser im Hexan eine wichtige Rolle, Scherkrifte bei der Filtration von biologischen Proben kiinnen zu einer Fragmentierung von groBen Proteinen fuhren, die Pufferstarke beeinflufit die Wartneabfuhrung bei der Kapillarelektrophorese, Wechsel des Gerates in der Kapillarelektrophorese kann zur Anderung der Migrationszeit und der Nachweisgrenze fuhren ( s . Abb. 3- 12), die Temperaturkonstanz in der Elektrochromatographie ist immer noch eines der Hauptprobleme, und einige Mikroliter mehr oder weniger Tetrahydrofuran/ Cyclohexan als Liisungsinittel fur PAK's (Polyaromatische Kohlenwasserstoffe) lassen das Fluoreszenzsignal stark schwanken. Tab. 3- 10 gibt die Parameter einer HPLC-Methode wieder, die geandert werden kiinnen. Vorgehen zur Uberprufung der Robustheit in der HPLC Anhand eines Beispiels wird cine miigliche Vorgehensweise erlautert. 1. Man miichte zunachst den EinfluB ritzrs Parameters auf die chromatographische GroOen fest s te I I e n. Zunlchst sol1 entschieden werden a ) welche chromatographischen GriiBen zur Charakterisierung des Ergebnisses xu Rate
gezogen werden, z. B. Flache, Retentionszeit. . .. und b) welche Parameter fur die konkrete Methode kritisch sind.
3.5 Rohusrheit
+
10
1I I
pH 6.70
20
30
Minuten
40
50
60
Abb. 3-11 EinlluR des pH-Wertes irn Eluenten auf die Trcnnung von Arninosauren mittels RP-HPLC (Quelle: Waters).
Nehmen wir als Beispiel eine Spurenbestimmung. Untersucht wird die Anderung der Retentionszeit, der Bodenzahl, der Flache und der Hohe durch eine Variation der Zeitkonstante. Die Werte beim ublichen Einsatz der Methode und einer Einstellung der Zeitkonstante von 0,5 s entsprechen dem Nullniveau. Die resultierenden Anderungen bei einer Anderung der Zeitkonstante zwischen 0, I2 s und 2 s werden in einer Grafik prozentual eingetragen, wobei - wie bei den Residuen - auf die griil3te Abweichung normiert wird, s. Abb . 3- 13 [40]. Aus Abb. 3-13 wird zum Einen ersichtlich, daR die Zeitkonstante - wie erwartet - am starksten die Peakhohe beeinflufit. Zum anderen wird bei der gewahlten Zeitkonstante von 0,5 unnotig Peakhohe und damit Nachweisgrenze ,,verschenkt". (In diesem Beispiel handelt es sich um eine KorngroBe von 10 pm, bei der Anwendung der modernen 5 pm oder 3,5 pm Materialien fillt diese Beeinflussung noch gravierender aus!) Ahnlich der Zeitkonstante kann der EinfluB auch anderer Parameter untersucht werden, die vom Validierer fur diese Methode als kritisch eingestuft werden.
2. Man konnte anschlieBend den EintluB mehrerer Parameter auf eine bestimmte chromatographische GroRe uberpriifen. Man wahlt beispielsweise die Peakflache als chromatographische GroBe, wenn es sich um eine Cehaltsbestimmung handelt oder Peakhohe, wenn es um eine Spurenbestimmung von Nebenkomponenten geht.
350 300 -
250 200
-
150 -
-.
1007=.,50
/-------
-
0
0.000 0.00
flr 1
1
1
/L
L
C
,I 1
5.00
1
1
1
1
1
1
10.00
1
1
1
1
1
15.00
1
1
18.01
Abb. 3-12 EIcI\~rophcrogratnmhci idcntischcn Bedingungcn aher an 7wci unlcr\chicdlichcn Gcraten (Qucllc: Dr. Michael Krimcr, NOVARTIS, Bascl).
3.5 Robustheit
I 13
Tab. 3-10 Uberprufung der Robustheit einer HPLC-Methode.' EinfluBfaktoren
U berpru fu ng
Probenvorbereitung:
Extraktionszeit, Ultraschallzeit, Dauer und Art der Entgasung, Starke des Probelosungsmittels, z. B. mehdweniger Acetonitril als im Eluent, EinfluU der Probelosungsmittel auf Retention, Peakflache und -form abhangig vom lnjektionsvolumen
Verschleppung:
Der Injektion einer hochkonzentrierten Liisung folgt die Injektion von reinem Eluent. Bei einem Peak griillier als 50 '31der Nachweisgrenze (PeaWRausch-Verhaltnis > 3 : I ) ist die Verschlcppung nicht zu vernachlassigen.
Flu Rrate:
+S % und EinfluB auf Peakhohe, -flache und Retentionszeit.
Gradient:
Verweilvolumen, Design und Volumen der Mischungskammer, Mischungsqualitat abhangig a) von der Viskositat der Elucntcn A und B, b) von der Steilheit.
Eluent:
-
Normal-Phase: +SO ppm H 2 0 im Eluent
-
RP: +5 c/o organischer Anteil, z. B. bei einem 60/40 Wasser/Acetonitril-Eluenten 55/45 und 65/35 testen. ionische Komponenten: ?O,S pH-Wen, +5 mMol Puffer bzw Ionenpaarreagenz.
-
Saule:
Charge, Lieferant, Art und Dauer des ,,Einfahrens" bei ncuen/gebrauchten Saulen, Alter und Historie der Saule, Ubcrladung. irreversible Sorption bestimmter Bestandteilc der Probe.
Temperatur:
+s oc.
Dctcktion:
h + 2 nm, Zeitkonstante +0,2 sec (bei 10 mV-Ausgang),
Spaltbreite und Referenzwellenlange beim Dioden-Array.
Datenauswertung:
Datenaufnahmerate (Sample Rate) +2-4 Datedsec., Threshold-Wen, manuelle/automatische Integration, Integration mit/ohne ,,Splin"
Irreversiblc Adsorption bestimmter Komponenten in der Adage:
Flachc(n) mit und ohne SBule vergleichen.
'
Diese Tahelle gilt als Bcispiel einer Maximalforderung: Die Auswahl der zu priifenden kritischen Parameter 1st abhangig von der Methode und individuell festzulegen!
Anderung in %
2
17
= 0,12
S
=2s
- 4L
Retention
Bodenzahl
Flache
Konzentration
Hohe
Konzentration
Abb. 3-13 Auswirkung der Anderung der Zeitkonstante auf HPLC-Parameter.
Nun werden alle chromatographischen Parameter - fur die man sich entschieden hat im relevanten Bereich geandert und die jeweilige, prozentuale Anderung grafisch dargestellt, s. Abb. 3- 14 [40] als Beispiel fur die Peakhohe. Wahrend die Peakflache aul3er bei Anderung von Flu13 und Wellenlange sonst konstant bleibt, andert sich die Peakhohe bei einer Anderung von Packungsqualitat, pHWert, Temperatur, Wellenliinge und Elementenzusammensetzung. Diese Aussagen sind aus der Theorie bekannt und sicherlich nichts Neues. Nun - und das ist sehr wichtig - erkennt man hier schnell, welche Methodenparameter welchen EinfluR in welchem AusmaB in dieser konkreten Methode haben. Diese optische Darstellung ist leicht durch EXCEL zu realisieren und liefert eine Fulle an Informationen. Es wird empfohlen, eine solche Darstehng zur Illustration der Robustheit dem Validierungsbericht und spiiter auch der SOP beizulegen. Wird nun ein Parameter nach dem anderen variiert, so waren z. B . fur 6 Parameter mitje 2 Levels insgesamt 12 Experimente notwendig. Um die Anzahl der Experimente auf ein notwendiges Minimum zu reduzieren, wurden mehrere Modelle der Faktorenversuchsplanung entwickelt, die teilweise in der Literatur beschrieben sind [4 1-43]. Diese helfen tatsachlich Zeit zu gewinnen, sind allerdings in der Praxis nur bei entsprechendem mathematischen Hintergrund der Anwender praktikabel. Die ublichen Auswerteprogramme unterstutzen solche Modellrechnungen nicht. Man kann jedoch durch eine uberlegte Auswahl der zu verandernden Parameter auch ohne Modellrechnungen Zeit gewinnen. Es ist moglich, gleichzeitig zwei Parameter zu verandern, ohne dabei Informationen zu verlieren, eine solche Moglichkeit wird in Tab. 3- 1 1 gezeigt.
3.5 Robustheit
115
nu
60°C
10%
Saule 1
max
1,5ml/min
270nm
min
40°C
3Yo
2,5ml/min
280nm
Saule 2
Abb. 3-14 EinfluR von HPLC-Parametern auf die Peakhohe.
Wird z. B. der Flu8 und die Saule gleichzeitig geandert (Zeile 2 ) , so wissen wir, daB eine Anderung von Totzeit und Peakflache nur dem FluB (2), eine Anderung der Peakhohe (bei kleinen FluBanderungen) und der relativen Retention nur der Saule (3) zuzuschreiben ist. Ahnlich beeinfluBt eine geanderte Elutionskraft (1) nur die Retentionszeit, wahrend die GroBe des Signals bei konstanter Retentionszeit nur durch eine veranderte Wellenlange (5) zu andern ist (Zeile I ) . Werden gleichzeitig der FluB und die Temperatur geandert (Zeile 3), so ist fur die Anderung der Flache und der Totzeit die Ursache ausschlieBlich die Flu& anderung ( 2 ) ,wahrend restliche Anderungen der Temperatur (4) zuzuschreiben sind. Beim Vorgehen wie in Tab. 3- 1 1 gezeigt, reduziert sich die Anzahl der Experimente von 12 auf 8. Handelt es sich bei der Methode um die Trennung von neutralen Substanzen, spielt der pHWert keine Rolle. Hier waren nur 6 Experimente notwendig usw. Solche Tabellen konnen individuell erstellt werden. Tab. 3-10 Bcispiel eines Designs zur iikonomischen Uberpriifung der Robustheit in der HPLC. Erlauterungen der Ziffern im Text. 1
2
3
X
X
4
X
5
6
X
5
1
1
2
2
3
2
3
2
4
3
3
X
X
5
1
2 2
2
4
4
6
6
6
4
X
6
6
A: Anderung, N Bodenzahl, A: Peakflache, tR: Rerentionszeit, k: Retentionsfaktor (friihcr k’-Wert), to: Totzeit, H : Peakhohe
3.6
Selektivitat und Spezifitat
3.6.1 Definitionen und Erlauterungen Selektivitiit ist die Fiihigkeit einer Methode, wrschierlerie, nehrrieiriurider :~r.hestimrneride Korripotietiterz ohne gegenseitige Storung zu erfassen und sie somit eindeutig zu identifizieren. Verwandt mit dem Begriff der .,Selektivitit" ist der Begriff ,,Spezifitiit". Spezifitiit ist die Fiihigkeit einer Methode, eine Substanz oder eine Substanzklasse ohne Verfiilschung durch andere in der Probe vorhandene Komponenten 7,u erfassen und sie somit eindeutig zu iden t i ti zieren . Eine .re/ektitv Methode liefert richtige Ergebnirse fur al/e interessierenden Analyten, wohingegen eine spez(fische Methode richtige Ergebnisse fur eincw Analyten liefert, wahrend andere Analyten sich gegenseitig storen konnen. Be isp ie Ir Eine ionenchromatographische Methode ist selektiv, wenn sie alle vorhandenen organischen Ionen in einer Abwasserprobe erfaBt. Hier handelt es sich um eine selektive Methode fur organische Ionen. Eine FIA-Methode (Flieflinjektionsanalyse) arbeitet spezifisch, wenn sie Chromat in einer Rheinwasserprobe eindeutig identifizieren kann, man spricht von einer spcyijischeti Bestiinmung fur Chromat. ZusammengefaBt heiljt das folgendes: Selektivitiit ist relativ, sie kann verbessert, erhoht werden z. 9. durch selektivere Wechselwirkungen i n der Chromatographie. Selektivitat mu13 bewiesen werden, somit stellt sie ein wichtiges Validierungselement bei Trenntechniken dar. Spezifitiit ist absolut und somit prinzipiell nicht zu verbessern, so unterliegt sie nicht der Beweisnot. Eine 100 c/o selektive Methode ist eine spezifische Methode. Daher spricht IUPAC von der Spezititiit als das ,,non plus ultra", als die ultimative Selektivitiit. In der Praxis wird in der Regel zwischen ,,Selektivitat" und ,,Spezititiit" nicht unterschieden. Beide Begriffe werden synonym verwendet, wobei der Begriff ,,Selektivitat" im deutschen Sprachraum hlutiger vorkommt, wiihrend im Englischen in letzter Zeit eher von ,,specificity" die Rede ist, z. B. in den ICH-Guidelines. Das ist insofern etwas bemerkenswert, als gerade die ICH-Texte sich vorwiegend an ,,Chromatographeure" wenden. Folgende knappe Definition erscheint fur den taglichen Sprachgebrauch pragmatisch: Selektivitat ist die Fahigkeit einer Methode zur Unterscheidung aller interessierender Stoffe in der Probe. Das Vorhandensein von Selektivitiit ist eine der Grundvoraussetzungen fur die Richtigkeit von Trenntechniken. Bei einer Reihe von anderen Methoden wiederum ist die Art der Bestimmung per se spezitisch, denn es wird hier eine bestimmte, charakteristische Eigenschaft der Substanz gemessen. Beispiele dafur sind u. a. AAS, FTIR, emymatische Tests, Immunoassays, "C-Radioaktivitat, P-NMR, Gen-Antigen-Wechselwirkungen. In diesen Fiillen spielt Selektivitiit im Rahmen einer Methodenvalidierung eine untergeordnete Rolle. Die Selektivitiit ist dagegen eines der wichtigsten Kriterien fur die Cute von Trenntechniken wie Chromatographie und Kapillarelektrophorese bzw. Elektrochromatographie. Aus diesem Grunde wird nachfolgend aufdie Prufung der Selektivitat in der Chromatogra-
3.6 Selektivitut und SpeziJitat
1 17
phie, speziell HPLC, eingegangen. SinngemaR gelten diese Ausfuhrungen fur alle Trenntec hniken.
3.6.2 Grundsatzliches zur Prufung auf Selektivitat 1. Wenn die Richtigkeit bereits bewiesen wurde (s. Abschnitt 3.4.2), kann auf eine Pru-
fung der Selektivitat verzichtet werden, denn wenn das Ergebnis richtig ist (keine systematischen Fehler), mu13 die Methode, die zu diesem Ergebnis fuhrte, selektiv sein. 2. Fur alle Trenntechniken empfiehlt sich vor der eigentlichen Trennung, Tests mit Leerwerten durchzufuhren um sicher zu sein, daR ,,Systempeaks" erkannt und identifiziert sind. Je komplexer die Probe undoder j e komplexer der Eluent ist, um so dringender wird diese Maljnahme zu einem ,,MuK'. Bei Gradiententrennungen sollte ein Blindgradient (Gradient ohne Probe) gefahren werden, weiter sollte j e nach Trennproblem folgendes injiziert werden: ein Systemleerwert (Eluent), ein Probeleerwert oder Leerprobe (Placebo bzw. Matrix ohne Probe) oder ein Methodenleerwert. Das ist eine ,,Wasserprobe", die samtliche Schritte der Probenvorbereitung bis einschlieBlich Injektion durchlaufen hat. Bei der Injektion dieser Leerwerte sollte das Signal von Peaks - falls vorhanden - hochstens 30 % bis 50 % der Nachweisgrenze betragen.
3.6.3
Prufung auf Selektivitat von bekannten Proben in der HPLC
Vergleich der Chromatogramme von der Probe und eines Standards, der alle denkbaren Storsubstanzen inkl. Matrix im erwarteten Konzentrationsbereich enthiilt. ,,Storsubstanzen" sind: Verunreinigungen, Zersetzungs- und Nebenprodukte, Hilfsstoffe, Matrix- und Formulierbestandteile, Restlosemittel usw. Zusatzliche Sicherheit erhalt man, wenn ausschlieRlich die Matrix ohne eine einzige der erwarteten Komponenten analysiert wird. Man spricht hier von Positiv- und Negativprufungen. - Die ,,Storsubstanzen" kijnnen auch der Probe zugesetzt werden. Es gilt zu beweisen, daR die interessierende Komponenten neben den zudosierten ,,StorsubstanZen" zweifelsfrei quantitativ bestimmt werden konnen. Stehen nicht alle ,,StorsubstanZen" zur Verfugung, so kann man sich behelfen, indem man durch StreRtests (Licht, Hitze, Feuchtigkeit, Oxidation, saure/alkalische Hydrolyse) Zersetzungsprodukte erzeugt. Sie werden dann zusammen mit der Matrix analysiert. AnschlieBend werden die Profile (,,fingerprints") der Chromatogramme von Probe und gestreRten Standards verglichen. Bei StreRtests sollte die Relevanz fur die Praxis bewahrt bleiben. Es sol1 noch einmal auf den EinfluR der Matrix hingewiesen werden: Gerade bei Konzentrationen in der Nahe der Nachweisgrenze kann die Matrix nicht nur Flache und Hohe sondern auch Peakfonn und Retentionszeit stark beeinflussen. - Es konnen schliel3lich als letzter Ausweg ahnliche Substanzen - d. h. die selben funktioneilen Gruppen, ahnliches Molekulargewicht - in der erwarteten Konzentration zusammen mit der Matrix analysiert werden. -
1 18
3 Die ~ilidierirng.spparumetev
3.6.4 Prufung auf Selektivitat in der HPLC bei Proben unbekannter Zusammensetzung Die Uberprufung der Selektivitat einer chromatographischen Methode fur unbekannte Proben - in Kombination mit geringen Analytmengen und komplexer Matrix - durfte den schwierigsten Fall darstellen. Was die Probenart betrifft, sind Umweltproben am problematischsten, da der Metabolismus nicht immer bekannt ist und mit Uberraschungen gerechnet werden muR. Systematische Variation der Methodenparameter
1. Einstellparameter an der Apparaturhzw. Anderungen physikalischer Natur. 1. Hier wird nicht die Selektivitat - Abstand zwischen den Peakspitzen - sondern die Aufli/sung Abstand zwischen den Peaks an der Peakbasis - erhoht, (s. Abb. 3- 15).
Beispirle Kleineres Totvolumen einer isokratischen HPLC- Anlage, kleinere Partikel der stationaren Phase, besser gepackte Slulen, kleineres Injektionsvolumen, Erhohung der Datenaufnahmerate (Sample-Rate), Erniedrigung der Zeitkonstante des Detektors (bei 10 bis 1 OOmV-Ausgang), Anderung der Wellenllnge/des Detektionsprinzips usw. 2. Anderungen chemischer Natur, das sind Anderungen, die die Wechselwirkung der Probe mit der stationfren Phase beeinflussen konnen.
Beispiele Temperatur, stationare Phase, mobile Phase inkl. Anderung von pH-Wert, Ionenstarke, Modifier. In der chromatographischen Fachliteratur wird ausfuhrlich auf die Uberprufung der Selektivitat bzw. Selektivitatserhohung in der HPLC eingegangen.
gute Selektivitat schlechte Auflosung
Abb. 3-15 Zum Unterschied zwischen Selektivitat und Aufllisung in der chromatographic
3.6 Selektivitiit und Sprzifititcit
1 19
3. Aufnahme einer Kalibriergerade im unteren Konzentrationsbereich Geht die Gerade durch den Nullpunkt oder schneidet sie die y-Achse? Durchfuhrung und Details siehe Kapitel 3.7.
4. Das Ergebnis wird mit dem Ergebnis einer zweiten, unabhiingigen (chromatographischen) Methode verglichen - RP-HPLC und Normal-Phase-HPLC - lonenpaarchromatographie/Kapillarelektrophorese -
HPLC/ELISA Chromatographie/Spektroskopie
5. Off-line-/on-line-K~pplung zweier Verfahren rnit moglichst unterschiedlichen Trennprinzipien bzw. Trennmechanismen Man spricht hier von mehrdimensionaler Chromatographie oder orthogonalen Trenntechniken.
Beispiel 1 On-line-Kopplung HPLC/AusschluBchromatographie: Trennung eines Co-polymers nach den chemischen Eigenschaften mittels Gradienten-RP und anschlieaende Trennung nach den Molekulargewichten mittels GPC, siehe Abb. 3- 16, Quelle: Peter Kilz, PSS, Mainz. Trotz aufwendiger Optimierungsexperimente war es nicht gelungen, mittels nur eines Trennprinzips die gewiinschte Auflosung zu erzielen (Abb. 3- 17 und 3-18). Beispiel 2 On-line-Kopplung RP-HPLC rnit AMD-DC: ,,Vortrennung" mittels HPLC. Die Fraktionen werden weiter mittels AMD-DC aufgetrennt. Dabei werden die Peakkapazitaten (die Anzahl der Peaks, die man rnit Hilfe einer Methode auftrennen kann) der zwei Methoden multipliziert, z. B. Trennung von zehn Peaks in der HPLC undTrennung von sechs Flecken in der DC; theoretisch sind durch eine Kopplung HPLC-DC 60 Komponenten aufzutrennen! In Abb. 3-19 wird die Trennung eines Emulgators mittels RP gezeigt. Quelle: Dr. Klaus Burger, Bayer AG, Dormagen. Peak ,,D", der mittels HPLC nicht mehr aufgetrennt werden kann, wird on-line rnit Hilfe der DC im AMD-Modus weiter aufgetrennt - rnit hervorragendem Erfolg, wie in Abb. 3-20 ersichtlich ist. Folgende Moglichkeiten sind bei der Off-line/on-line-KopplungChromatographie/ Spektroskopie denkbar: HPLC - UV - (DAD) HPLC - MS(MS) HPLC - MALDI - TOF HPLC - NMR GC - MS GC - AES CE - MS
-
PSS 3D - Flachendarstellung eines Stern Blockcopolymeren
18
Styro - Anteil [% x 101
Abb. 3-16 On-line Kopplung H P L C E P C Lur Trcnnung von Stcrnblocl\polymcren; y-Achsc: RPHPLC-Trcnnung nach Sorptionscigcnschat‘ten, x-Achsc: GPC-Trcnnung nach Molekiilgr(il.(c (Au5schlul3chromalographie).
3.6 Selekrivitat und Spe:@tiit
12 1
Projektion HPLC ( 1.Dimension ) A
16 1412-
10 20
30 40
50 60
70
RP-Elution [rnl]
80 90
Abb. 3-17 Trennung von Sternblockcopolymerennach einem RP-Trennmechanismus.
25 15 10 5 11
12
13
14
15
16
17
18
19
20
21
GPC - Elution [mi]
Abb. 3-18 Trennung von Sternblockcopolymerennach einem GPC-Mechanismus.
Beispiel3 On-line-Kopplung HPLC-MALDI: HPLC-Trennung eines Fettsaurengemisches und Untersuchung einzelner HPLC-Peaks mittels MALDI, siehe Abb. 3-2 1 bis 3-2 I b, Quelle: Dr. Michael Schmitt, Zentrale Analytik, Henkel KGaA, Diisseldorf. Die Kopplung Chromatographie - Spektroskopie zeigt eindrucksvoll den eingeschlagenen Weg in der Analytik. In dem Mafie, wie es gelingt die Spezifitat zu erhohen, in dem MaBe verliert die Trennung, die einen selektiven Vorgang darstellt, an Bedeutung. Eine Erhohung der Selektivitat ist fast immer mit betrachtlichem Aufwand verbunden, denn es ist vie1 ,,Chemie" notwendig. Selektive Wechselwirkungen sind oft nur durch langwierige Optimierungsversuche zu erzielen. Bei der Spezifitat steckt der Aufwand im Vorfeld, namlich in der Entwicklung des MeBprinzips; ,,Physik" ist gefragt.
Ahh. 3-19 RP-Trennung eines Emulgators (Quelle: Dr. Klaus Burger, Bayer AG, Dormagen).
680[mV/10 Absl
1
0
D
Iodine A420
60mm
Abh. 3-20 DC-On-linc-Trennung der Fraktion ,,D" des HPLC-Chromatogramms aus Abb. 3- 19.
So werden kurze Saulen eingesetzt, die im ersten Schritt schnelle, gerade ausreichende HPLC-Trennungen erlauben. Die anschlieRende on-line Kopplung mit MS, M S M S (ggf. im multiple reaction mode oder MALDI-TOF) fuhrt zu schnellen und recht verlal3lichen Aussagen.
3.6 Selektivitiit und Sprzifitiit
123
Method: silion
PlARlO Manual lnjektion 1 CH 1 mL 400
Fr.5
350
F
300 250 Fr.3 200
n Fr.6
0
10
20
30
40
46
Minutes Abb. 3-21 HPLC-Chromatogramm nach der Reaktion von Fettsauren mit Ethylenoxid (Quelle: Dr. Michacl Schmitt. Henkel KGaA, Dusseldorf).
6. Kombination der zwei letztgenannten Moglichkeiten
Kopplung zweier unabhangiger Trennmethoden und anschlieljende Kopplung rnit spektroskopischen VerfahredSensoren. Diese Moglichkeit, namlich die Kopplung - vorzugsweise in miniaturisierter Form zweier chromatographischer Verfahren rnit unterschiedlichem Trennmechanismus und anschlieljende Kopplung rnit hochauflosenden spektroskopischen Verfahren (MS (MS), AES, NMR) oder rnit chemischedbiologischen Sensoren gibt die groljtmogliche Sicherheit.
Beispiele Gelelektrophoretische ,,Vortrennung" und anschlieflende Kopplung rnit Kapillar-LCMS oder LC-CE-DAD- oder LC-CE-MS oder HPLC-GC-MS oder Kapillar-LC-DCFTRaman oder Kapillar-LC-DC-Wirkungsdetektor [44]. Die Entwicklung von neuen Feldern auf breiter Basis wie Kombinatorische Chemie und Wirkstoffchemie auf Proteinbasis hangt u. a. vom Vorhandensein schneller Analytik mit spezifischer Detektion ab. Es wiire denkbar, did3 die MS-MS-Kopplung (ohne vorherige chromatographische Trennung!) in spatestens 10bis 15 Jahren bestimmte Bereiche der Analytik revolutionieren wird, denn bezuglich Schnelligkeit und Spezifitat ist MS-MSKopplung unubertroffen.
Abb. 3-21a On-line MALDI-Spektrum der Fraktion Nr. I aus Abb. 3-2 I.
3.6 Selektivitiit und Spetifitiit N
0 0
m
0 0
co
a,
F m
. r
0
m
0 9 0 b
4-z m d
:-i 9
0 0
m
3.6.5 Uberprufung der Selektivitat in der HPLC - Schnellmethoden Oben vorgestellte Methoden sind am aussagekraftigsten, aber auch aufwendig und teuer. Es gibt daneben eine Reihe einfacher Moglichkeiten, die Peakreinheit und darnit die Selektivitat der Methode zu uberprufen. Dazu werden einfache, chromatographische Regeln verwandt und chromatographische GroBen wie Peakbreite, Retentionszeit, Peakhohe und flache und Asyrnmetriefaktor, benutzt. Weiterhin kann die erste und zweite Ableitung des Peaks zu Hilfe gezogen werden (Ableitungs-Chromatographie). Peakbreite und Retentionszeit Das Verhaltnis von Peakbreite und der dazugehorenden Retentionszeit ist charakteristisch und bei bestirnmten chromatographischen Bedingungen konstant fur eine Substanz, d. h. die Peakbreite ist der Retentionszeit linear proportional. Tragt man demnach die Peakbreite an der Peakbasis - oder bei 10 % Peakhohe - gegen die dazugehorende Retentionszeit, die z. B. durch Eluentenanderung zunirnmt, auf, so ergibt sich fur eine Kornponente eine charakteristische Gerade. Befindet sich nun aufgrund rnangelnder Selektivitat ein weiterer Peak unter dem zu betrachtenden Peak, so wird das Verhaltnis Peakbreite/Retentionszeit gestort, weil es unwahrscheinlich ist, dal3 zwei Komponenten bei Erhohung der Retentionszeit sich in gleichem MaBe verbreitern. Weicht fur eine gegebene Komponente die Peakbreite von dern durch die Gerade vorgegebenen Wert ab, so besteht der Verdacht, daB der Peak nicht homogen ist. Beispiel Man tragt die Peakbreite/Retentionszeit-Werteeiner Standardsubstanz auf, das ware quasi die ,,Kalibrierung". AnschlieBend werden die Werte des Peaks aufgetragen, den man in der Probe als diese Kornponente vermutet. Man muBte die gleichen Punkte auf der Gerade erhalten. 1st es nicht der Fall, so besteht der Verdacht, dal3 eine Verunreinigung unter dem Peak vorhanden ist. Es kann sich naturlich auch urn eine Komponente handeln, die bei einer bestimmtem Eluentenzusarnmensetzung, einem bestimmtem pH-Wert oder einer bestimmten Temperatur in zwei Gleichgewichtsformen vorkommt, z. B. ionischhicht ionisch, solvatisierthicht solvatisiert usw. Oder aber der Mechanismus fur die Wechselwirkung dieser Substanz mit der stationairen Phase lndert sich ah einer bestirnmten Eluentenzusarnmensetzung: RPWechselwirkungen konnen beispielsweise silanophilen Wechselwirkungen weichen [45]. Eine Variante dieses Experimentes ist folgende: Man tragt die Peakbreiten verwandter Substanzen z. B. substituierte Phenole oder Zucker gegen die Retentionszeit auf. Auch hier ergibt sich fur eine homologe Reihe und einen einheitlichen Mechanismus eine Gerade. Eine Abweichung von der linearen Abhangigkeit weist auf eine mangelhafte Abtrennung der entsprechenden Substanz von einer Storkornponente hin (s. Abb. 3-22) Quelle: Prof. Siegfried Ebel, Universitat Wurzburg.
Asymmetriefaktor und Peakhohe Die Ableitung von Asymrnetrie- (A,) und Tailingfaktor ( r ) sind der Abb. 3-23 zu entnehmen.
3.6 Selektivitiit und Spezijitiit
I
1 1
2
I 3
I 4
127
t,lrnin J 5
Abb. 3-22 Abhiingigkeit der Peakbreite von der Retentionszeit bei der HPLC-Analyse eines Antiepileptika-Gemisches. Phenobarbital und Methylphenobarbital konnten nicht getrennt werden (Quelle: Prof. Siegfried Ebel, Universitat Wurzburg).
Abb. 3-23 Zur Definition von Asymmetrie- und Tailingfaktor, A, und 7:
In der Literatur wird auch folgende Definition angegeben:
As
b
=U
Bei symrnetrischen Peaks ist As = 1. Der Asymmetriefaktor bleibt konstant, unabhangig davon, bei welcher Hohe er gemessen wird. Tragt man nun den Asymmetriefaktor gegen
Tab. 3-12 Hiiufigc Ursachcn fur Tailing und Tests xur Urwchenfor\chung Ursnche
Test
U hcrladung
weniger injiLieren
ZwciIc Koniponcnte an der Peakflankc
Wenigcr in.ji/icren. Mcthodcnhcdingungen vari ieren
Bildung labilcr Mctallkomplcxc durch Konlamination dcr stationiircn Phase mil Metallioncn
4-4' Bipyridyl injkicrcn, ist die stationiirc
Schlcchte Packung
Phase nietallionenlrei. erhrlt man einen symmctri x h e n Peak. Die Injektion eincr jcden Komponente luhrl
zum Tailing
Ionischc Wechsclwirkungcn in dcr RP-HPLC
Nur die Injektion von ionischen Komponcnten fuhrt Lum Tailing ( L . B. Ethylanilin, Phthalsiurc). Jedc ncutrale Komponentc eluiert \ymmetrisch.
die Peakhohe auf (z. B . an der Peakbasis) bei 10 %, 30 %, 50 56, 70 % und 90 76 der Peakhohe, so sollte sich eine Parallele zur x-Achse (Peakhohe) ergeben. Tritt eine Abweichung auf, so wiiren zuerst folgende Ursachen fur ein Tailing ausmschliekn ( s . Tab. 3- 12). Wenn obige Ursachen ausgeschlossen werden kiinnen, besteht der Verdacht auf eine mangelhafte Trennung. Asyinmetriefaktor und Retentionszeit Ahnlich der Peakbreite ist der Asymmetriefaktor eines Peaks fur eine bestimnite Komponente unabhiingig von der Retentionszeit. Triigt man nun den Asymmetriefaktor bei einer bestimmten Peakhohe oder noch besser bei mehreren Peakhohen - gegen die Retentionszeit auf, so ergibt sich bei homogenen Peaks eine Parallele zur x-Achse (Retentionszeit). Bei Abweichung besteht der Verdacht auf Inhomogenitiit des Peaks. Abbildung 3-24 zeigt diese Auftragung fur die simulierten Peakiiberlappungen aus Abb. 3-25, AbschlieOend sei noch angemerkt, dal3 bei gleicher Retentionszeit zweier Komponenten es unwahrscheinlich ist, da13 auch die restlichen chromatographischen GriiBen vollig identisch sind. Somit eroffnet sich die Moglichkeit, eine Komponenten-Matrix zu erstellen, d. h. jede Kotnponente hat fur gegebene chromatographische Bedingungen ihre ,,eigene" Zahlenkombination von z. B. Peaktliiche, Peakhohe, Asymmetriefaktor und Peakbreite bei einer bestimmten Wellenliinge und Injektionsmenge. Weiterhin ist bei einem homogenen Peak das Peakhiihenverhiiltnis zweier bei verschiedenen Wellenliingen aufgenommenen ~
H,L,\ konstant. H,., Steht schlieBlich ein Diodenarray-Detektor zur Verfugung, so konnen folgende Verhiiltnisse msatzlich errechnet werden:
Signale
~
3.6 Selektivitiit und Spezifitiriit
Peakhohe ~~
Peakflache Peakhohe bei A2 Peakflache
~~
Peakhohe
bei A,(oder Amax) oder
Asy mmetriefaktor
bei
129
A,
Peakhohe bei A, Asy mmetriefaktor
Abb. 3-24 Abhangigkeit des Asymmetriefaktors von der Peakhohe fur die simulierten Peaks aus Abb. 3-25 (Quelle: Prof. Siegfried Ebel, Universitat Wurzburg).
Abb. 3-25 Uberlapptc Peaks in dcr HPLC (simuliert) (Quelle: Prof. Siegfried Ebel, Universitat Wurzburg).
Abb. 3-26 Erste Ablcitung der Peaks aus Abb. 3-25.
Diese Quotienten reagieren empfindlicher auf Verunreinigungen als die iibliche RatioplotBildung (,.Peak-purity"-Test) [46,47].Mit Hilfe der Chemometrie kann eine recht sichere Zuordnung von Peaks auch bei nicht ausreichender Auflosung erfolgen: Durch Einsatz geeigneter Software konnen substanzspezifische rnehrdimensionale Diagrarnme erstellt werden. ,,Fit"-Routinen geben anschliefiend sehr zuverlassige Inforrnationen uber Peakhomogenitat - schon eine visuelle Entscheidung ist recht sicher [48]. Ableitungschrornatographie
Eine Peakinhornogenitat kann durch die erste und zweite Ableitung des iiblichen Peaks (GauBkurve) sichtbarer gemacht werden. In Abb. 3-25 sind vier simulierte Uberlappungen dargestellt. Irn Fall 1 (Schulter) ist eine Peakiiberlappung noch direkt zu erkennen. Eine Uberlappung wie irn zweiten Fall erkennt man erst in der 1. Ableitung (Abb. 3-26) und noch eindeutiger in der 2. Ableitung (Abb. 3-27). Die Voraussetzungen fur brauchbare Ergebnisse sind hier ein sehr gutes Peak-RauschVerhaltnis und eine Datenaufnahmerate von rnindestens 4 Datenpunkten pro Sekunde.
3.6 Selektivitiit und Spe5jitut
131
Abb. 3-27 Zweite Ableitung der Peaks aus Abb. 3-25.
3.6.6 Zusammenfassung Bei physikalischen und spektroskopischen Methoden handelt es sich um selektive oder gar spezifische Messungen, ein wesentlicher Vorteil gegeniiber den aufwendigen Trenntechniken. Daher wird fur neue analytische Probleme, fur die keine Referenzsubstanzen hergestellt bzw. durch Reinigung gewonnen werden konnen, eine Verlagerung der Praferenz von chromatographischen Trenntechniken hin zu Spektroskopie (genauer: Spektrometrie) erwartet. Treibkrafte sind ,,Schnelligkeit", ,,Robustheit" und eben Selektivitat". Eine (ganzheitliche) Wirtschaftlichkeitsanalyse zeigt beispielsweise, dal3 sogar eine MS-MS-Kopplung mit einem heutigen Anschaffungspreis von 200 bis 300 T Euro sich rechnet. Die Uberpriifung der Selektivitat ist eine der aufwendigsten Aufgaben bei der Validierung einer chromatographischen Methode. 1st die Probe bekannt und stehen Vergleichsproben zur Verfugungen, halt sich der Aufwand in Grenzen. Hier gilt es, ,,nur" zu zeigen, dal3 die chromatographische Auflosung zwischen den interessierenden Peaks ausreichend ist. Als Kriterium in der HPLC wird verschiedentlich eine Auflosung von R > 1,5 empfohlen.
Dabei sollte man folgende Punkte beachten: Richtigerweise bezieht sich die Forderung auf ,.R" (Resolution. Auflosung) obwohl manchmal irrtiimlicherweise die Rede von der Selektivitiit ist. Das Ziel ist in der Tat ein ausreichender Abstand zwischen den Peaks an der Peakbasis und nicht zwischen den Peakspitzen. Der Unterschied zwischen Selektivitat und Auflosung wird in Abb. 3- I5 dargestell. Bei gleicher Selektivitat der Methode in beiden Fallen ist die Autliisung im unteren Bild besser als im oberen. Dies ist durch eine Erhiihung der Bodenzahl, d. h. durch eine Verbesserung der Trennleistung (Effizienz) zu erreichen. Vollstandig aufgeliiste Peaks sind nicht unbedingt notwendig. Die Selektivitiit der Methode ist hinreichend, wenn sich das MeSsignal des betreffenden Analyten so auswerten lafit, dafi die Anforderungen an die Richtigkeit erfullt sind. -
Wie erwartet, ist der Aufwand bei unbekannten Proben (moglicherweise eine grol3e AnzahI an zu trennenden Komponenten, womoglich noch bei unterschiedlicher Konzentration und komplexer Matrix) am griifiten. Wenn es sich um eine wichtige Probe handelt. ist nahezu jeder Aufwand gerechtfertigt, denn von der Selektivitiit hiingt direkt die Richtigkeit des Ergebnisses ah. So kann evtl. auch an eine Derivatisierung gedacht werden. Die Priizision nimmt evtl. ab. aber die Selektivitat wird verbessert. Es gilt, von Fall zu Fall zu unterscheiden, oh vielleicht bei einer selektiven Methode eine Priizision von ,,nur" V , = 5 r/r in Kauf genommen werden kann. Am Beispiel der HPLC konnte die Uberprufung der Selektivitiit bei einer unbekannten Probe wie folgt aussehen (Abb. 3-28).
1. Chromatographisches System wird nichtlunwesentlich verandert - Herrschen optimale apparative Gegebenheiten? Einstellungen am Gerat wie Wellenlange, Zeitkonstante, Datenaufnahmerate usw., Totvolumen der Apparatur etc. uberprufen, evtl. optimieren. Moglichkeiten der Software ausnutzen. RatioplotVPeakpuritytests beim DAD, 1. und 2. Ableitung, Peakformanalyse, Chemometrie - Chromatographische Regeln nutzen. Beispielsweise kann bei einer isokratischen Trennung die Peakbreite sowie der Asymmetriefaktor bei unterschiedlichen Peakhohen in Abhangigkeit von der Retentionszeit aufgetragen werden. 2. Es werden Methodenparameter verandert 2. 6. andere Saulen einsetzen bzw. eine zweite Saule in Serie schalten, Injektionsvolumen bzw. -menge verringern, Eluent und Temperatur andern, Moglichkeiten der Miniaturisierung ausschopfen. 3. Aufwendigere MaOnahmen, Kopplung - Fraktionieren und off-line-/on-line-Kopplung rnit anderen Verfahren. - Fraktionieren und off-line-/on-line-Kopplung rnit Spektroskopie bzw. chemischenl Biosensoren. Abb. 3-28 Uhcrprutung dcr Selcktivitat bei cincr Prohc unbekanntcr Zusan1tncnset;rung am Bcispiel dcr HPLC.
3.7 Lineuritiit
133
Die sicherste aber auch aufwendigste Methode zum Beweis von chromatographischer Selektivitat ist die Kopplung zweier unabhangiger Verfahren miteinander und off-lineionline- Uberprufung der Fraktionen mittels Spektroskopie. Ziel und Wichtigkeit der konkreten analytischen Methode bestimmen den zu vertretenden Aufwand.
3.7
Linearitat
3.7.1
Einleitung und Definitionen
Wozu braucht man eigentlich eine Kalibrierung? In der instrumentellen Analytik werden durch Anwendung unterschiedlicher physikalischer MeBprinzipien MeBwerte erhalten. Der MeBwert muB nun - im Gegensatz z. B. zu einer Langenmessung mit einem geeichten MetermaB - in das Analysenergebnis umgerechnet werden. Dazu bedarf es im Vorfeld der Kalibrierarbeit. Dabei werden dem MeBwert empirisch bekannte Substanzkenndaten wie z. B. Menge oder Struktur zugeordnet. D. h. beispielsweise, es wird experimentell ermittelt, welchem MeBwert welche Menge der zu prufenden Substanz entspricht. Eine richtige Kalibrierung ist somit die Grundvoraussetzung per se fur quantitativ-analytisches Arbeiten. Uber Linearitat und ,,Mathematik": Linearitat ist das Validierungselement, dem vermutlich in der Literatur die ausfuhrlichsten Berechnungen gewidmet sind. Auch nur ein Versuch in diese Richtung wurde nicht nurden Rahmen sondern auch die Intention des vorliegenden Buches sprengen. Im Folgenden wird nur das sinnvoll Notwendigste beschrieben, wobei nicht ganz auf Formeln verzichtet werden kann. Der interessierte Leser sei auch auf die weiterfuhrende Literatur verwiesen [49, 501. Beim Begriff ,,Linearitat" verbindet der Analytiker die Korrelation zwischen Signal und Konzentration bzw. Menge. Und er hofft, daB diese Korrelation, d. h. die Kalibrierfunktion, durch eine Gerade zu beschreiben ist. Linearittit ist nun die Fahigkeit einer Methode innerhalb eines gegebenen Konzentrationsbereichs Ergebnisse zu liefem, die der Konzentration des Analyten direkt proportional sind. In diesem Zusammenhang werden mehrere Termini synonym verwendet. Nachfolgend wird versucht, die kleinen inhaltlichen Unterschiede, die doch vorhanden sind, aufzuzeigen: -
(Grund)Kalibrierung: Ermittlung des Zusammenhangs zwischen MeBwerten (Signal) und verschiedenen Konzentrationen (Menge, Substanzgehalt) anhand von Standardlosungen. Hier geht es um die Abhangigkeit Signal/Konzentration, also um die Kalibrierung des Analysenprinzips - naturlich inclusive der verwendeten Apparatur. Deswegen bleiben typische Charakteristika einer bestimmten Methode wie Extraktionsausbeute, Matrixeinflusse etc. aul3en vor.
-
-
-
-
Rrgrr.s.vion:Mit Regression wird die Art der Abhlngigkeit zwischen Variablen charakterisiert, hier rwixhen Konzentration und MeOwert. ~ulibrie~u/z~ oder t i ~Regressionsmodell ff oder Regressionsanalyse: Das ist das mathematische Model1 mit dem der Zusammenhang zwischen Me13wei-t (Signal) und Konzentration am besten zu beschreiben ist. Lineares Regressionsmodell oder doch quadratische Kalibrierfunktion? Korrrlationscina!\.sr: Diese priift den Grad der Abhiingigkeit zwischen Variablen. Ein Ma13 fur diese Abhiingigkeit ist der Korrelationskoeffizient - eine reine Indexzahl. Linraritut: Diese bezieht sich auf die konkrete Methode, d. h. auf den Zusammenhang zwischen Signal und Konzentration nach Durchfuhrung samtlicher Schritte der Methode.
Auf einen Nenner gebracht bedeutet dies, daR die Linearitat einer Methode abhiingig ist von der Kalibrierfunktion. D. h. von der Abhingigkeit des MeRwertes von der Konzentration (spezifisch fur ein MeRprinzip und das entsprechende Geriit), aber auch die konkrete Probe mit der charakteristischen Matrix und den weiteren Methodenspezifika spielen eine Rolle. Wenn die Probe ,,unkritisch" ist, wenn sie z. B. vorher durch AufschluR uniformiert wird oder wenn es sich um eine spezifische Bestimmung handelt, dann richtet sich das Augenmerk ausschliel3lich auf die (Grund)Kalibrierung z. B. FTIR, AAS. Dazu sollte zum Einen angemerkt werden, daR die Wortwahl .,Linearitat" etwas unglucklich ist. Suggeriert der Name doch, dal3 ein linearer Zusammenhang ,.besser" sei oder sogar anzustreben ist. Selbstverstlndlich ist das Rechnen mit einer linearen Gleichung einfacher. Es ist allerdings ausschliefilich notwendig, einen mathematisch beschreibbaren Zusammenhang zwischen Signal und Konzentration zu haben. Im ubrigen gibt es Falle, bei denen, bedingt durch das MeRprinzip, ein linearer Zusammenhang nicht erwartet werden kann: Messung mit bestimmten ionenselektiven Elektroden, Rontgenfluoreszenz, DC mit Densitometer, Immunoassays. Der Terminus ,,Kalibrierfunktion" mag hier generell geeigneter zu sein. Immer wieder wird das Wort ,,Analysenfunktion" (analytical response) vorgeschlagen. Dieser Begriff 1st allerdings ,,vergeben". Er wird in der Literatur fur die inverse Kalibrierfunktion benutzt. Aus dem erhaltenen MeRwert gilt es dabei, den gesuchten Gehalt zu ermitteln. Zum Zweiten wird oft von der Linearitat einer Methode berichtet, ,.ermittelt" wird sie jedoch durch Vermessen von Standards; z. B. 6-fach Injektion von sechs Aliquoten einer Standardlijsung in eine HPLC-Anlage. Hiermit wird jedoch bestenfalls die Kalibrierfunktion mit Hilfe von Standards ermittelt, nicht jedoch die Linearitat der Methode. Und nur im gunstigsten Fall ist Kalibrierung (mit Standards) gleich Linearitiit (Analyt + Matrix). Es mu13 mindestens eininal - eben im Rahmen der Methodenvalidierung - die Linearitit mit realen Proben oder synthetischen Proben plus Placebo gepruft werden. Es hat sich wiederholt gezeigt, daB die Matrix den linearen Bereich einengen kann. Sogar Unterschiede durch verschiedene Formulierung bei gleicher Matrix sind bekannt z. B. Pulver und Tablette. Wenn bewiesen wurde, da13 reale Proben und Standards sich buuglich der Linearitiit identisch verhalten, so konnen in der Routine selbstverstandlich als Kontrollproben reine Standards verwendet werden. Es liegt auf der Hand, daR zur Herstellung von Kontrollproben und Standardlosungen unterschiedliche Hersteller oder zumindestens unterschiedliche Chargen notwendig sind, um eventuelle systematische Fehler feststellen zu konnen.
3.7 Lineaririit
0
03
1
2
03
25 + x
Proportionalitat
0
135
1
Linearitat, aber keine Proportionalitat
2
25 + x
Abb. 3-29 Dcr Unterschicd zwischen Proportionalitat und Linearitat.
Bemerkung : Der Begriff ,,Linearitat" wird in vielen Standardwerken definiert, so z. B. im ICH QADokument: ,,The linearity of an analytical procedure is its ability (within a given range) to obtain test results which are directly proportional to the concentration (amount) of analyte in the sample". Diese Definition ist nicht korrekt, die Beschreibung trifft exakt auf die Proportionalitat zu, zur Erlauterung s. Abb. 3-29. Der Unterschied zwischen Linearitat und Proportionalitat bedeutet fur die Praxis folgendes: Im Falle von Proportionalitat kommt man mit einer Einpunkt-Kalibrierung aus (ein Punkt der Geraden ist stets der 0-Punkt) wahrend man bei Linearitat mindestens eine Zweipunkt-Kalibrierung benotigt. Trotz dieses Unterschieds wird, entsprechend des allgemeinen Sprachgebrauchs, in diesem Buch weiterhin die Rede yon der ,,Linearitat" sein, auch wenn die Abhangigkeit zwischen Konzentration und Signal proportional sein sollte.
Wir schlieben die Diskussion zur Normenklatur mit der Bemerkung ab, daO eine Unterscheidung oft nicht gemacht wird, und dal3 die Begriffe Kalibrierung, Kalibrierfunktion, Linearitiit, Regressionsmodell synonym benutzt werden. Es sol1 nur darauf geachtet werden, da13 unter einem Begriff das Gleiche verstanden wird.
3.7.2 Durchfiihrung der Linearitatstests 3.7.2.1 Grundsiitzliches
Die Angaben in der Literatur iiber die Anzahl der unbedingt notwendigen MeBpunkte (Konzentrationen) sowie den abzudeckenden Konzentrationsbereich variieren stark. Es werden zwischen drei und zehn K~n=entrationsni\'Yuiis empfohlen. Wird eine lineare Abhiingigkeit angenommen, so werden die Messungen oft bei drei Konzentrationen durchgefuhrt. Die Zahl funf stellt die Mindestanzahl dar. um eine Krummung feststellen zu konnen, das ist ein ublicher Wert im Pharmabereich (ICH-Richtlinien). Die Zahl sechs ist die am haufigsten Angetroffene. SchlieRlich empfiehlt die DIN 38402, Teil 5 I zehn Werte. Die empfohlene Anvrhl der Messurzgen pro Kon:entrtrrion variiert in der Literatur meist zwischen zwei (Doppebestimmung) und sechs, selten wird sogar von zehn Messungen berichtet. Es liegt auf der Hand, dal!, eine Mehrfachbestirnmung die Sicherheit der Messung erhoht. Wird nun der Aufwand mit rnehr als drei Messungen betrieben, so sollten unabhangig hergestellte Kahbrierhsungen verwendet werden. In diesem Fall kann in einem Arbeitsschritt auch die Methodenpriizision fur die jeweilige Konzentration bestimmt werden. Hernerkirng: Doppel- oder Dreifachbestimmungen stellen nicht immer stochastisch unabhSngige Messungen dar. Die Werte sollten gemittelt werden und die dann erhaltenen jeweiligen Mittelwerte der einzelnen Konzentrationen sollten zur Berechnung herangezogen werden. Bei einer linearen Gleichung y =(I + bx ist y die Variable und x die konstante GrGBe. Man mu13 dafur sorgen, daB diese prinzipielle Forderung erfullt wird. Das heiBt nichts anderes, als daB groBte Sorgfalt der Bestimmung von x gelten soll. Die verwendeten Referenzsubstanzen mussen sehr gut charakterisiert sein, weiterhin mu13 peinlichst darauf geachtet werden, dal!, durch entsprechend ausreichend eingewogener Menge Wiegefehler vermieden werden. Noch ein kritischer Punkt: Die Konzentration von Losungen mit Referenzsubstanzen muB konstant bleiben, was bedeutet, daR man das Verdampfen von Liisungsmitteln bei haufiger Entnahme .,im Auge" behalten soll. Hier kann sich die Dichte Sndern und es schleicht sich ein proportional-systematischer Fehler ein. Weitere Bedingung ist, dal3 die Fehler von y unabhiingig von der Konzentration .r sind. Die Realitiit ist hiiutig anders. Wenn bei einer Messung manch relativer Fehler konstant bleibt, nimmt der absolute Fehler bei hoheren Analytkonzentrationen zu. Als Konzentrationsbereich fur den Linearitatstest werden folgende Angaben am hiiufigsten (Pharmaindustrie) genannt:
3.7 Linearittit
137
Gehalt, Wirkstoff 80 % bis 120 %, z. B. Spezifikation der Komponente liegt bei min. 18 %, max. 22 %. Die Linearitat sollte zwischen 14,4 % und 26,4 % gepriift werden. Gleichformigkeit (content uniformity): Von 50 % bis 70 % als Untergrenze und von 130 % bis 150 % als Obergrenze. Die haufigsten Angaben in der Literatur bewegen sich zwischen 70 % bis 130 %. Gehalt, Freisetzung: +20 9% der Spezifikationsgrenze (deklarierte Dosierung). Bei retardierter Wirkstofffreigabe wird der Bereich auf 110 % erweitert. Verunreinigungen (Reinheit): Von der Bestimmungsgrenze bis 120 % der Spezifikation, z. B. die Spezifikation einer Nebenkomponente betrlgt max. 0,l %, die Bestimmungsgrenze mu6 dann 0,03 % betragen. Die Linearitat sollte hier zwischen 0,03 % und 0,12 % gepruft werden. Der Arbeitsbereich der Kalibriergeraden sollte so gelegt werden, daf3 sich die zu erwartende Konzentration der Probe in der Mitte der Kalibriergerade befindet. Die Herstellung von Losungen erfolgt auf unterschiedliche Weise: Unabhiingige Einwaagen von synthetischen Mischungen bzw. Referenzsubstanzen. Diese Praxis ist aus analytischer Sicht die beste, allerdings auch die Aufwendigste. - Verdunnungen aus einer Stammlosung rnit oder ohne Placebo (Merke: Bei einer Verdiinnungsreihe des Analyten wird nur die Linearitat des Analysengerateslder Apparatur gepruft). Diese leider haufig angetroffene Vorgehensweise ist nicht sinnvoll, da ein eventeull gemachter systematischer Fehler sich fortpflanzt. - Unterschiedliche Volumina aus einer Stammlosung rnit oder ohne Placebo: Das bedeutet, es werden aus einer Stammlosung parallele Losungen abgewogen bzw. abgefullt. Dieser Usus ist ein vernunftiger Kompromiss zwischen den zwei erstgenannten Praxen. Definierte Aufstockungen: Das ist ebenfalls eine ubliche, gute Praxis. - Oft sind Vemnreinigungen als Standard nicht vorhanden oder einfach nicht bekannt. Fur diesen Fall kann wie folgt verfahren werden: Die Linearitat wird rnit Verdunnungen der Hauptkomponente gepruft z. B. 0,l %-0,5 %. Abhangig vom speziellen Fall wird mit dem gleichen oder korrigierten Responsefaktor gerechnet. Obwohl in diesem Fall eine einzige Komponente zur Prufung der Linearitat verwendet wird, empfiehlt sich dringend fur die zwei Konzentrationsniveaus (Gehalt und Spurenbereich) zwei Regressionsmodelle zu ermitteln bzw. die Varianzenhomogenitat zu priifen, siehe weiter unten. -
Die Linearitat von Verunreinigungen kann in der Chromatographie auch indirekt uber die Flachenprozente uberpruft werden: Es herrscht fur die Vemnreinigungen Linearitat vor, wenn das Ergebnis unabhangig vom Injektionsvolumen ist. Die Flachenprozente bleiben konstant, solange die Konzentration der unbekannten Verunreinigung sich linear verhalt. Als Kriterium gilt folgendes: Die Standardabweichung der Ergebnisse rnit unterschiedlichen Injektionsvolumina unterscheidet sich von der Standardabweichung bei Wiederholmessungen nicht signifikant. Dazu sollte ein F-Test durchgefuhrt werden. Wenn bei der Validierung auch die Nachweis- und Bestimmungsgrenze bestimmt werden soll, so empfiehlt es sich, die Konzentrationsreihe aus unterschiedfichen Einwaagen
und nicht aus einer Stammliisung anzusetzen, um Linearitiit, Nachweis- und Bestimmungsgrenze in einem Arbeitsschritt zu priifen.
3.7.2.2 Priifung auf Linearitat Dam gibt es folgende Moglichkeiten: -
Visueller Linearitatsteat Eine grobe Abweichung von der Linearitat wird leicht erkannt. Es wird gepriift werden, welches mathematische Modell den ermittelten Zusammenhang der Wertepaare KonzentratiotdSignaI am besten beschreibt. Zunzchst werden die lineare Kalibrierfunktion und die Kalibrierfunktion zweiten Grades
sowie die jeweiligen Reststandardabweichungen berechnet. Wie wird nun vom Rechner die beste Gerade/Kurve gefunden? Es wird zunlchst eine Vielzahl von Geraden/Kurven durch alle gemessene Punkte gelegt. AnschlieBend werden die ,,Reste" oder Residuen addiert. ,,Reste" oder Residuen ist derjeweilige vertikale Abstand eines gemessenen Punktes von der errechneten Gerade bzw. Kurve. Die Gerade bzw. Kurve mit der kleinsten Summe wird als die beste ( B P s t g r t - a h , Bestkurve) auserkoren. oder .,Reststreuung"? Und was bedeutet ,Rrststandur~lahwei~hiin~" Das ist nichts anderes als die Standardabweichung, errechnet aus den Zahlenwerten dieser Reste. Die Reststandardabweichung ist somit ein Ma8 fur die Streuung der MeUwerte um die Regressionsgerade bzw. um die Kurve bei Funktionen zweiten Grades. Sie wird, wie wir gesehen haben, aus der Standardabweichung der Differenzen von den MeBwerten und den dazugehorigen Werten der errechneten Kalibriergerade bzw. -kurve ermittelt. Der allgemeine lineare Zusammenhang
lautet fur die Chromatographie: Peaktlache = (I . Konzentration (oder Menge) + h Wenn a eine Konstante i\t und h = 0. ist die Peakflache proportional der Konrentration oder der Menge. Es folgt n u n ein Vergleich der Reststandardabweichung, der linearen und der quadratischen Kalibrierfunktion.
3.7 Lineciririit
139
a) vereinfachte, qualitative Aussage: 1st die Reststandardabweichung der vom Rechner errechneten Funktion I . Grades kleiner oder gleich der Reststandardabweichung der Funktion 2. Grades, so ist die Kalibrierfunktion im untersuchten Arbeitsbereich linear. b) Rechnerische Uberprufung: (DIN 38402, Teil 5 1, Anpassungstest nach Mundel) - Aus den zwei Reststandardabweichungen wird die Differenz der Abweichungrvarianzen DS berechnet.
mit:
DS2 sy, sy2 N
Differenz der Abweichungsvarianzen Reststandardabweichung der linearen Funktion Reststandardabweichung der quadratischen Funktion Anzahl der Messungen, d. h. Anzahl der Konzentrationen, bei Doppel- oder Dreifachbestimmung Anzahl der Mittelwerte.
AnschlieBend wird der Priifwert, PW, berechnet PW=-
DS2 SY:
und dieser rnit dem Tabellenwert aus der F-Tabelle (Freiheitsgrad,f, = 1, f 2 = N - 3, P = 99 %) verglichen. Wenn PW 5 F, ist die Kalibrierfunktion linear, bei PW > F i s t die Kalibrierfunktion in diesem Arbeitsbereich nicht linear. Hier handelt es sich also um einen modifizierten F-Test (bei der Ermittlung der PriifgroBe werden die unterschiedlichen Freiheitsgrade zwischen Gerade und Kurve - 2 und 3 - beriicksichtigt), der von Mandel in den 30er Jahren fur die Entscheidung ,,linear/quadratisch" vorgeschlagen wurde. - Der KorrelutinnskoefSizient rnit dem groBten Wert entspricht dem Modell rnit der
besseren An passung. z. B. lautet ein errechneter Korrelationskoeffizient r = 0,99983 bei der Funktion 2. Grades und r = 0,99964 bei der Funktion 1. Grades. So wird die Abhangigkeit Signal/Konzentration im untersuchten Arbeitsbereich rnit einer Funktion 2. Grades besser beschrieben. Zu den Entscheidungskriterien fur Linearitat siehe auch Abschnitt 3.7.2.3. -
Schatzverfahren (Dr. Noack, BAM, Berlin) Um den Linearitatsbereich zu ermitteln, sind eine Blank-L6sung (MeBwert Rmin), eine Losung mit der angenommenen oberen Konzentration des Arbeitsbereichs (MeBwert: R,,,) sowie eine Losung rnit halber Maximalkonzentration (MeBwert: R0.5max) je zehn ma1 zu messen.
Es 1st dann jeweils der MeRwert fur die halbe Maximalkonzentration zu schatzen
als Mittelwert aus Rmi, und R,,,,, max
(geschltzt) = 0.5 x (R,,,,, + R,,,,,)
AnschlieRend ist jeweils (i= 1 his 10)die Differenz Dj zwischen (geschltzt) zu ermitteln:
und Ro,~,,,,,
1st die Differenz etwa in 50 % der Falle positiv bzw. negativ, dann kann eine Linearitlt angenommen werden. Sind die Differenzen dagegen in neun oder gar allen zehn Flllen nur positiv bzw. nur negativ, dann liegt ein nicht linearer Zusainmenhang zwischen Signal und Konzentration vor. -
Residualanalyse Residuen sind die vertikalen Abstande der Meljwerte von der Regressionskurve. Zur graphischen Darstellung sollte zweckmarjigerweise als x-Achse der in Frage kommende Arbeitsbereich, als Abschnitt auf der y-Achse die positiv- bzw. die negativ-groRte Abweichung verwendet werden. 1st das gewlhlte mathematische Modell richtig. so sind die Residuen um das Nullniveau normalverteilt. In Abb. 3-30 [32] sind mehrere mogliche Fllle gezeigt, die auftreten konnen.
Abb. 3-30 Graphischc Darstellung von Residuen in Ahhangigkcit von den KonLentrationcn .x. a ) idealcr Verlaul. d. h. richtiger Modcllansat/. h) lincarcr Trend. evtl. ialscher Ansatz odcr Rechenichler c ) anstcigende Varianzcn. d. h. Varianzcninhomogenilat d ) nicht-lincarer Vcrlaui, dn falschc Regressionsfunkrion gewiihlt
3.7 Linearittit
3
3.2
3,4
3,6
3,8
14 I
4,2
4
+ x
Abb. 3.31 Kalibrierung init konzentrationsabhangiger Steigung.
Abb. 3-32 Residuenplot der Kalibrierung aus Abb. 3-30.
Durch die Residualanalyse werden Trends leicht und sicher erkannt, s. Abb. 3-3 1 und 3-32. Die Abhangigkeit Signal-Konzentration in Abb. 3-3 1 ist nicht linear. Dies IaRt sich einfach beweisen, in dem die Steigung zwischen den MeBpunkten berechnet und anschliefiend gepruft wird, ob sie konstant bleibt: x ( i + I)-x(i)
y(i+ i)-y(i)
0,439
0,25
0,027
0,108
0,461
0,25
0,028
0,112
X
.v
3
0,4 12
3.25
33
AyIAx
3,15
0,498
0,25
0,03 1
0,124
4
0,530
0,25
0,032
0, I28
Ein Trend ist bei der Steigung eindeutig zu erkennen. Bereits bei kleinen Konzentrationsbereichen wird dies festgestellt. Einfacher werden derartige Trends mit Hilfe eines Residuenplots, s. Abb. 3-32 erkannt. Ublicherweise wird bei einer nicht-linearen Funktion der Arbeitsbereich eingeengt oder es werden die experimentellen Bedingungen geiindert (s. Beispiel in Abschnitt 3.7.2.4) oder man verwendet mehr Punkte (Konzentrationen) zur Errechnung des mathematischen Modells mit der Hoffnung, jetzt doch eine akzeptable Linearitat zu erhalten. Dieser Aufwand ist nach Ansicht des Autors nicht immer gerechtfertigt. KonzentrationSignal-Zusammenhlnge wie in Abb. 3-33 dargestellt, sind durchaus fur eine quantitative
? ' 9
T a 7
6 5 4 3 2 1
0 1
2
3
4
5
6
7
8
9
1 0 1 1 1 2 1 3 1 4 1 5
+ .r
Abb. 3-33 Nicht lineare ahcr komtante, inathcniatisch heschrcibbarc Korrclation /wisehen Signal und Konzentration.
Gehaltsbestimmung geeignet. Als Vorauscetzung gilt lediglich das Vorhandensein einer robusten Methode und das Herrschen von konstanten experimentellen Bedingungen - eine Forderung. die eigentlich immer gelten sollte! 1st diese Forderung erfullt, besteht eine konstante - wie auch immer geartete - Korrelation zwischen Konzentration und Signal. Diese Meinung wird auch von anderen Autoren geteilt. So William Horwitz: ,.Linearity is not an absolute requirement for a calibration curve. As long as the response-concentration relationship is repeatable, satisfactory concentration estimates are possible." Aus den .r-y-Wertepaaren kiinnen eine Reihe kommerzieller Programme den mathematischen Zusammenhang zwischen x und y errechnen. So wurde von EXCEL fur die Werte im besprochenen Beispiel folgender Zusammenhang ermittelt:
Man erhiilt beispielsweise fur die bekannte Konzentration x = 1.3 einen graphisch interpolierten Wert fur J von ca. 5,13. s. Abb. 3-33, und einen nach der Formel errechneten von 5.1553. Folgende Vorgehensweise kann man sich fur die Praxis vorstellen: 1. Die .r-y-Werte werden aufgetragen, es entsteht ein Graph. 2. Mit Hilfe von ublichen Softwareprogrammen wird aus den experimentell ermittelten Daten der mathematische Zusammenhang ermittelt. 3. Fur drei Konzentrationsniveaus (,,Unten", ,,Mitte", ,,Oben") werden nun die drei Werte zuin Einen graphisch ermittelt und zum Anderen nach der ermittelten Formel berechnet. 4. Nach vorher definierten Kriterien (z. B . hochste Differenz 5 5%) wird eine mogliche Differenz zwischen den zwei Befunden akzeptiert oder nicht. Im ersten Fall wiire die
3.7 Linetrrifiit
143
Kalibrierung beendet, im zweiten Fall wird der ubliche, oben beschriebene Weg eingeschlagen: Lineare Regression, quadratische Regression, Mandeltest usw.
3.7.2.3 Beurteilung der Ergebnisse Es folgen einige Hinweise fur die praktische Durchfuhrung und Beurteilung der Ergebnisse. Es sollte vor einer Kalibrierung ein Test auf Normalverteilung z. B. nach David, siehe Abschnitt 3.3, durchgefuhrt werden. 1st die Bedingung einer Normalverteilung nicht erfullt, so nimmt die Aussagekraft im Hinblick auf die Analysenergebnisse ab [5 I]. Aus Abb. 3-34 kann entnommen werden, daB moglicherweise im unteren und im oberen Konzentrationsbereich keine Normalverteilung herrscht. Die Ermittlung der MeBwerte ist mit Fehlern behaftet. Der Gesamtfehler setzt sich zusammen aus der Prazision der Messung (MaB: Reststandardabweichung der Kalibriergeraden) und der Summe der Fehler, die mit der Kalibrierung zusammenhiingen. Dazu gehoren die Anzahl der Kalibrierlosungen. die Anzahl der Wiederholmessungen, die Steigung und damit die Art der Probe und das Detektionsprinzip. Nach dem Fehlerfortpflanzungsgesetz folgt, dal3 die ,,wahre" Kalibriergerade zwischen zwei Hyperbelasten (Prognose- oder Vertrauensbander) liegt. Das bedeutet, daB fur einen vorgegebenen Wert x sich
A
f
y2.........................................................................................
a k -
X
PrognoseInterval1
Abb. 3-34 Kalibriergerade und Prognoseintervall. Normalverteilung herrscht nicht zwangslrulig im gesamten Arbeitsbereich!
t,
rwei zugehorige y-Werte ergeben, und t2 in der Abb. 3-34. Der Abstand der Lwei yWerte wird nach folgender Gleichung von passenden Softwareprogrammen wie folgt berechnet.
mit:
(I
h ,sy N N
s .t-
Steigung der Geraden Ordinatenabschnitt Reststandardabweichung Anzahl der KalibrierlZisungen (Anzahl der Konzentrationsniveaus) Anzahl der Wiederholmessungen pro Kalibrierliisung (Einfach-, Doppel-und Dreifachbestimmung) Konzentration der Kalibrierliisung Mitte des Arbeitsbereichs
Q,, Quadratsumme x, Q,, =
c1.2
-
(c -TI )I
~
N
Uingekehrt heiRt es, dal3 fiir ein bestimmtes Signal der tatsiichliche Analytwert x in einem bestimmten Bereich anzutreffen ist. Dieser Bereich ergibt sich durch den Schnittpunkt der Horizontalen des -Wertes mit dem oberen und unteren Hyperbelast um die Kalibriergerade und heiRt Vertrauensbereich oder Konfidenz- oder Prognoseintervall. Er kann durch Umstellung der oben angegebenen Gleichung ermittelt werden.
mit:
<*
y
Signalwert der Probe Mitte des Signalbereiches
Wann ist n u n das Prognoseintervall klein? Das ist der Fall. wenn vor allern die Messung priizise (kleiner Wert der Standardabweichung s") und die Methode empfindlich ist (groRer Wert fiir die Steigung u siehe obige Formel): SchlieOlich kann man selbst den Bereich mitbestimmen, in dem inan ,.streng" (kleiner t-Wert, P = 95 %) oder ,,grolMigig" ist (groRer r-Wert. P = 99 %). Weniger ausgepriigt ist der Einiluss einer steigenden Anzahl von Kalibrierliisungen ( N ) und an Wiederholungsbestimmungen. Gunstig wirkt sich ein in der Mitte liegender Signalwert aus. Bei den Extremen (sehr verdunnte/sehr konzentrierte Losungen) ist der Prognoseintervall 7 - y groli. In einem Beispiel (Abschnitt 3.7.2.6) werden wir den Eintlul3 von N und N aufdas Ergebnis mit Zahlen belegen. Sol1 n u n - anders als bei Gehaltsbestimmungen - ein grol3er Konzentrationsbereich abgedeckt werden, s o ist mit Hilfe des F-Tests die Varianzenhomogenitiit zu uberprufen. 1st sie nicht gegeben - da die Streuung der Werte bei Lwei Konzentrationen signifikant unter-
3.7 Linrciritiit
145
schiedlich ist - so sollte der Konzentrationsbereich eingeengt werden oder es ist mit einer gewichteten Regression zu arbeiten, s. Abschnitt 3.7.2.8. Hier sol1 auf ein Dilemma hingewiesen werden: Mit mehr Punkten in der Mitte der Geraden haben wir dort ein sehr enges Prognoseintervall - die Uberprufung der Linearitat jedoch uber einen groBen Konzentrationsbereich ist ungenau. Bei gleicher Verteilung der Punkte uber den ganzen Konzentrationsbereich wird die Linearitst wahrhaftiger gepruft (Varianzenhomogenitat vorausgesetzt), aber das Prognoseintervall ist breit. Folgende Punkte sollten bei der Ermittlung der Linearitat bedacht werden:
- Die gewiihlten MeBwerte sollten iiquidisfuantsein z. B. 5 ppm, 10 ppm, I5 ppm, 20 ppm, -
-
25 ppm, 30 ppm und nicht etwa 1,2, 10,50, 100, 1000. Beim Vergleich von Ergebnissen sollte immer geklart werden ob bei den Messungen die Menge bei konstantem Volumen der Losung erhoht wurde, oder ob 2. B. die doppelte Menge durch doppeltes Volumen einer Stammlosung vermessen wurde? Ein Vergleich von Ergebnissen ist nur moglich, wenn die Anzahl der Punkte, die Anzahl der Bestimmungen pro Konzentration und die Verteilung uber einen bestimmten Konzentrationsbereich identisch sind. Sonst kann es leicht passieren, daB fur eine Methode unterschiedliche Resultate erhalten werden, siehe Abb. 3-35a und b.
2oooooo
r
2000000
20 1500000 :m Y G
2
n
1000000 500000
I
n
Abb. 3-35a und b Unterschiedliche Empfindlichkeit und Aufircten eines Matrixell’ckies bei cin und dcrselben Mcthode, wenn die Anzahl der Punkte und dcren Vcrteilung sich andert.
Eine hohe Priizision der MeBwerte fuhrt leicht zur Errechnung einer Kalibrierfunktion zweiten Grades. Das heist: je groOer die Streuung der MeBwerte ist, um so groBer die Wahrscheinlichkeit fur ein lineares Regressionsmodell. ... Umgekehrt gilt die Aussage: je prlziser die Methode, um so geringer die Standardabweichung bei Mehrfachbestimmungen und um so kleiner der lineare Arbeitsbereich. Die Linearitat ist abhiingig von der Robustheit der Methode. So kann beispielsweise ein nicht konstanter pH-Wert im Eluent nicht nur die Priizision sondern auch die Linearitat und die Empfindlichkeit einer HPLC-Methode beeintlussen. Die Uberpriifung auf AusreiBer nach der Erstellung der Kalibriergeraden kann wie folgt erfolgen: Es wird das Prognoseintervall ohne Beriicksichtigung des ausreiaerverdlchtigen Wertes berechnet. Befindet sich nun dieser Wert innerhalb des Prognoseintervalls, so handelt es sich um keinen AusreiRer (AusreiBertest nach Huber). Es sollen nur gemessene und nicht extrapolierte Werte in die Berechnung aufgenommen werden. So ist beispielsweise der tatsiichlich gemessene kleinste Wert die Bestimniungsgrenze, oder aber der Nullwert (Konzentration 0). Wenn Nullwerte (Konzentration 0, MeBwert 0) berucksichtigt werden, so fuhrt dies zu Krummung der Kalibrierfunktion im unteren Konzentrationsbereich [34]. Ein positiver Blindwerj (existierender MeBwert bei Konzentration 0) ist ein Hinweis fur einen konstanten systematischen Fehler. Handelt es sich um keinen Matrixeffekt und kiinnen weiterhin Pipetierfehler ausgeschlossen werden. so bedeutet dies z. B. in der Chromatographie, daR der betrachtete Peak nicht homogen ist. In diesem Fall mu8 die Selektivitiit verbessert werden. Ein tiepriver Blitidvvert gibt zuniichst keinen physikalischen Sinn. Wenn ein MeBfehler, z. B. durch Justieren und erneute Kalibration, ausgeschlossen werden kann, so kann es sich bei der Flussigchromatographie uni eine unkontrollierte Adsorption groBerer Molekule an sogenannten ,,hungrigen Oberfliichen" handeln, siehe Abb. 3-36. Ein typisches Beispiel ist die Adsorption von Proteinen an Dichtungen. Stahl- und Glasoberfllchen. Dieses Phiinomen ist auBer von der Temperatur, Losungsmittel. Beschaf-
Abb. 3-36 ..Vcrlust" cincr Kornponente liihrt hci Extrapolation der Gcraden zu ncgarjvcn Signalwcrten, Erliiuterung siche Text.
3.7 Lineuritiit
147
fenheit der betreffenden Oberflachen usw. auch von der Konzentration und der Matrix abhiingig. Negative Blindwerte werden auch bei Zweistrahlgeraten in der UV-Spektrometrie bei nicht vollkommen identischer Beschaffenheit der zwei Kuwetten beobachtet. - Eine Einpunkt-Kalibrierung ist erlaubt, wenn Linearitat gegeben und der Achsenabschnitt a = 0 ist (also Proportionalitat herrscht!). Als vereinfachtes Entscheidungskriterium, ob der ermittelte y-Achsenabschnitt signifikant von Null verschieden ist, gilt wenn der y-Achsenabschnitt groBer als die dreifache Standardabweichung des Blindwertes (6-fach-Bestimmung bei Konzentration 0) ist. Urn bei einer Einpunktkalibrierung proportionale Fehler zu vermeiden, sollte die Konzentration der Kalibrierlosung rnoglichst nahe der Konzentration der Probelosung liegen. So mussen beispielsweise bei quantitativen DC-Bestimmungen mit einem Densitometer die Flecken der Kalibrier- und Probelosung annahernd gleichen Mengen entsprechen. 3.7.2.4 Welche Methodenkenndatenlhformationen konnen aus einer linearen Kalibrierfunktion gewonnen werden? Der Arbeitsbereich ist der Konzentrationsbereich (untere - obere Grenze), fur den die ermittelte Kalibrierfunktion Gultigkeit besitzt. Die Steigung b ist ein Ma6 fur die Empfindlichkeit einer Methode. Je groBer die Steigung, um so empfindlicher ist die Methode, desto leichter konnen kleine Konzentrationsunterschiede noch registriert werden: Das bedeutet, daB eine geringe Konzentrations- bzw. Mengenanderung in den Proben zu einer moglichst groBen Anderung des MeBwertes (Signals) fuhrt. Diese Forderung ist wichtig fur den Spurenbereich. Fur die ,,normale" Routine allerdings stehen storungsfreie Messungen im Vordergrund. In diesem Fall wird man wohl zugunsten der Prazision auf moglichst groBe Empfindlichkeit verzichten. Schliefilich sei noch angemerkt, daR bei einer gekrummten Kalibrierfunktion die Empfindlichkeit eine Funktion der Konzentration ist. Ein Achsenubschnittu ungleich 0 bedeutet, daB bei einer Konzentration von 0 ein Signal gemessen wird, der Blindwert stellt einen konstanten, systematischen Fehler dar. Hier wird empfohlen, mit der errechneten Kalibrierfunktion inclusive Achsenabschnitt zu arbeiten. Man konnte zwar von allen MeRwerten den Blindwert abziehen - vorausgesetzt der Blindwert ist konstant - doch ist der erstgenannte Ansatz der sicherere. Der Korrelationskoefizient r geniefit als wichtiges Kriterium fur Linearitat eine hohe Akzeptanz. Doch sollte sein Informationswert etwas differenzierter betrachtet werden. Was bedeutet ein Korrelationskoeffizient von 0,999?
Beispiel Es wurden wassrige Losungen von Fluorescein in einem Fluorimeter vermessen und es ergaben sich folgende Intensitaten (s. Abb. 3-37 und Tab. 3- 13) [49].
I
0
I
2
I
4
I
I
6
8
I
I
1 0 1 2 Konzentration (pglmL)
Ahh. 3-37 Kalihrationsplott der Datcn aus Tah. 3-13.
Tab. 3-13 Linearititadaten hci dcr Bcstiminung von Fluorescein mit cinem Fluorirnctcr [4Y] McOdaten Konzcn-
tration
berechncte Datcn
Intensitat
IP&/111ll
.r
.T)?
?',- .?
(?., ~.i? (x, -.?)(XI
.v;
?i
0
2. I
-6
36
66.0
5.0
-4
I6
l,o -x, i
12 I .oo
2
65.6 I
32.4
4
9.0
-2
4
-4,l
I6,X 1
-0.5
0.25
.v,
-
(XI
~
-1
8.2 0
6
12.6
0
0
X
I7,3
2
4
I0
2 I .o
4
I6
7,9
62.4 I
3 I ,h
I2
24.7
6
36
I1,6
I34,Sh
6Y.6
42
17.64
x,4
-
?.I
3.7 Linetrritiit
149
Der Korrelationskoeffizient errechnet sich wie folgt:
i
r=
I
2 16,2
=
JiiGiiG
- 2 16,2 = 0,9980 -
216944
Obwohl einige Werte sich nicht auf der errechneten Gerade in Abb. 3.37 befinden, ist r ,,ziemlich gut". Das wird oft beobachtet. Eine Aussage wie ,,MethodeA hat einen grofieren Korrelationskoeffizienten als Methode B, sie ist deshalb besser" ist nicht a priori richtig. Betrachten wir dazu Abb. 3-38 [49].
I
5
I
I
I
I /
Y 4
3 2 1
0 5 4
3 2 1
0
1
2
3
4
5
Abb. 3-38 Linearitat einer ,,Gemden" rnit r = 0,986.
In Abb. 3-38 oben ist eindeutig ersichtlich, daR trotz einem r von 0,986 die Werte sich aufeiner Kurve betinden. Im unteren Bild haben wir eine sehr gute Korrelation zwischenx und j’- nur sie ist nicht linear. Ein hoher Absolutbetrag fur den Korrelationskoeftiizienten ist ein notwendiges, aber nicht hinreichendes MaR fur die Linearitat. Es mu6 weiterhin bekannt sein, wie der Rechner ab- und aufrundet. Im vorliegenden Beispiel wurde eine Nicht-Berucksichtigung der Zahlen hinter dem Komma eine glatte 1,000 liefern; wird dagegen eine Kommastelle beriicksichtigt ergibt sich ein Wert von r = 0,9991. Dazu noch folgende Bemerkung: Durch eine Quadrierung von r werden Unterschiede stiirker sichtbar. So ist in der Literatur vielfach vom Bestiriiriithrirsrnt~~~ r2 die Rede. Auch bei gleichem. groBen Wert von r wissen wir wenig uber die Qualitat zweier Methoden. Man muB noch einmal betonen: r ist ein MaR dafur, wie gut eine Korrelation zweier Werte durch eine mathematische Funktion zu beschreiben ist. Ein grofier Wert von r heiBt lediglich, daR groRe x-Werte zu groSen y-Werten und kleine x-Werte zu kleinen 1-Werten fuhren. Die Korrelation zwischen x und y ist rnit dirsrr mathematischen Funktion gut zu beschreiben. Und das ist wiederum nicht der Fall, wenn bei einer stetigen Zunahme von x die Zunahme von y ma1 stiirker. ma1 weniger stark ausfiillt. Das Ergebnis ware hier eine willkurliche, ,,chaotische“ Streuung der Punkte um eine Gerade oder eine Kurve. Folglich kann ein Korrelationskoeffizient von 0,999 selbstverstiindlich die Verhaltnisse sowohl bei einer Geraden als auch bei einer Kurve wiedergeben. In Abb. 3-39 haben wir zwei Methoden rnit identischem, hohen r-Wert. Die zwei Methoden konnen sicherlich nicht als gleichwertig bezeichnet werden. Es liegt auf der Hand, daR a und b (additiver und systematischer Fehler) mehr lnformationen liefern. Zusammenfassend gilt folgendes: Der Korrelationskoeftizient ist ein Ma8 fur den Grad der Anpassung eines mathematischen Modells an die experimentell ermittelten Werte, wlhrend die Gute einer Methode eher rnit der Emptindlichkeit (Steigung) zu beurteilen ist. Die Rest.strrtirl~irCiLIh).(.L’i~hiing ist die Streuung der MeRwerte um die Regressionsgerade, also ein Prii:isionsrn~~Jfur die Messung. Ein legales Mittel fur eine Verkleinerung der Reststandardabweichung ict die Erhohung der Messungen, es wird immer wieder von 10 MeRwerten pro Konzentration berichtet. Wird n u n die Reststandardabweichung auf die Mitte des Arbeitsbereichs normiert (dies geschieht durch Division rnit der Steigung), so kann die Ve~~~hrens,standrrrdclhwric~hung errechnet werden. Wir konnen zusammenfassend festhalten, daR eine Methode um so leistungsfiihiger ist, je griiRer die Steigung und je kleiner die Reststandardabweichung ist. Die Verfahrensstandardabweichung sxOist somit ein Ma13 fur die Leistungsfahigkeit einer Methode.
X
X
Ahh. 3-39 Zwci Kalibrationsplotts rnit idcntischcm Korrclationskoetli/ienten
s,
sY
=-
b
Wir haben bereits bei der Prazision gesehen (Abschnitt 3.3.4.2),daR die Normierung einer GroBe auf einen Wert die bessere Information liefert. So wurde dort durch Division der Standardabweichung durch den Mittelwert und Multiplikation mit 100 der Variationskoeffizient (relative Standardabweichung) erhalten. Genau das gleiche Prinzip wird auch hier angewandt: Wird die Verfahrensstandardabweichung durch die Konzentration in der Mitte des Konzentrationsbereichs dividiert und mit 100 multipliziert, erhalten wir auch hier eine NormierungsgroBe, den Vefahrenvariarionskoefizienten oder relative Vefahrerisstundurdubweichung
Vorausgesetzt, daB die MeBwerte sich auf gleiche Konzentrationen beziehen, erlaubt die relative Verfahrensstandardabweichungeinen Vergleich verschiedener Verfahren. Ein einfaches Beispiel sol1 demonstrieren, welche Anderungen in einer Methode welche KenngroBen, die im Rahmen der Kalibrierung erhalten werden, in welchen Ma8 beeinflussen, Tab. 3- 14. Es wurde eine lineare Regression mit 10 Probelosungen durchgefuhrt, die Originalwerte sind in der ersten Reihe der Tab. 3-14 zu sehen [50]. Bei einer neuen Probe wird ein Matrixeffekt beobachtet (Werte der 2. Reihe). Es verandert sich der Ordinatenabschnitt, sodass sich eine parallele Verschiebung gegenuber der Originalgeraden ergibt. Die restlichen Werte bleiben konstant. Beim Vermessen einer weiteren Probe mit dem gleichen Analyten aber einer anderen Matrix wird eine proportional systematische Abweichung der Signalwerte beobachtet, die die Steigung verandert (Werte der 3. Reihe). W a r e n d die Werte fur den Ordinatenabschnitt a, den Korrelationskoeffizienten r und das BestimmtheitsmaR r2 sich nur wenig verandern wird eine merkliche Anderung der relativen Verfahrensstandardabweichung vk, beobachtet. Im einem dritten Experiment wurde ein AusreiBer provoziert, s. Werte der 4. Reihe. Durch dieses ,,MiBgeschick" andert sich die Steigung und die relative Verfahrensstandardabweichung stark, die Werte fur den
Tab. 3-14 Eintluli ctwaiger Verandcrungcn auf die Kenndaten eincr linearcn Rcgression.
Wert
Steigung b Ordinatenabschnitta Korrelationskoeffizientr BestirnmtheitsmaR r' relative Verfahrensstandardahweichung
I . Reihe:
2. Reihc:
3. Reihc:
4. Rcihe:
Original
ti-Wert verandert
Steigung verandert
AusreiUer
0,994
0,994
3,004
3,O I 0
0,0333
2,033
-0,020
0,9994
0,9994
0,9988 2,216 5%
0,166
0,9999
0,997 1
0,9988
0,9998
0,9942
2,216 %
0,740 %
4,517 lo
Ordinatenabschnitt, den Korrelationskoeffizienten und das Bestimmtheitsmalj dagegen nur wenig.
Ftrzit: Der Korrelationskoeffizient eignet sich als lndikator fur proportional systematische Fehler und fur AusreiBer nicht, er reagiert sehr &age". Es sei hier folgende platte Ausdrucksweise erlaubt: Man kann mit der Methode machen, was man will, der Korrelationskoeffizient liefert mindestens zwei ,,9" nach dem Komma, nicht einmal das BestimmtheitsmaB ist zu bewegen. Anders formuliert: Ein stets ,,guter" Korrelationskoeffizient tauscht eine robuste Methode vor. Das ,,ehrlichste" und aussagekriiftigste Kriterium fur derartige Veriinderungen ist die relative Verfahrensstandardabweichung. Der Verfahrensvariationskoeffizient ist schlieljlich ein geeignetes Beurteilungskriterium fur die Robustheit aller kalibrierbedurftigen Analyseverfahren in der Routine. Bleibt er konstant, ist die Methode fur den betrachteten Zeitraum robust. Nachfolgend wird von Dr. Joachim Kleiner und Dr. Ulrich Lernhardt (Bodenseewerk Perkin-Elmer, Uberlingen) diese Moglichkeit ausfuhrlich dargestellt. Fur den eiligen Leser ist ein Resume vorgeschaltet, anschlieBend wird ein mathematischer Ansatz fur die Tageskalibrierung entwickelt. Bei der Validierung eines Analysenverfahrens wird zur Absicherung der niedrigsten Konzentration im Arbeitsbereich die Bestimmungsgrenze herangezogen. Diese KenngroBe wird aus dem Vertrauensbereich der Kalibriergeraden gewonnen 1521. Die Absicherung der Bestimmungsgrenze erfordert in der Regel eine dynamische Anpassung des Arbeitsbereichs. In der Routineanalytik istjedoch ein schneller Vergleich von 1st-Kalibrierung und Qualitiitsziel wiinschenswert. In den AQS Merkblattern zu den Rahmenempfehlungen der Landerarbeitsgemeinschaft Wasser (LAWA) fur die Qualitiitssicherung bei Wasser-, Abwasser und Schlammuntersuchungen wird fur kalibrierbeduftige Analysenverfahren, speziell in der Atomspektrometrie, zur internen Qualitatskontrolle die relative Verfahrensstandardabweichung als Beurteilungskriterium herangezogen. Um ein Analysenverfahren zu beherrschen, wird auf der Grundlage empirischer Untersuchungen gefordert, daB diese KenngroRe kleiner 3 3 3 r/C sein mul3: Damit gilt die Bestimmungsgrenze als abgesichert [ 5 3 ] . Nachdem seit 1994 die Begriffe Nachweis- und Bestimmungsgrenze fur die cheinische Analytik in der DIN 32 645 unterschiedlich zur bisherigen Festlegung geregelt wird [54), wird dieses Kriterium unter den neuen Begriffen betrachtet. Das empirische Qualitatsziel fur die relative Verfahrensstandardabweichung [ 5 5 ] wird aus dem theoretischen Ansatz abgeleitet, daB am untersten Kalibrierpunkt die maximale Ergebnisunsicherheit (in Konzentrationseinheiten) hochstens gleich dieser Konzentration selbst sein dad. Hierzu werden die Begriffe und Formalismen der DIN 32 645 benutzt. Weiterhin erfolgt eine Verallgemeinerung des Qualitiitsziels auf unbeschrankte Arbeitsbereiche sowie auf eine variable Anzahl von eingesetzten Kalibrierstandards. Da der Wert der Verfahrensstandardabweichung eine einfach zu berechnende GroBe ist, eignet sich diese Kenngriilje zur Qualitiitskontrolle bei Routineanalysenverfahren. Der ige Wert der relativen Verfahrensstandardabweichung fur beliebige Arbeitsbereiche kann aus einer hyperbolisch gekrummten Fllche ermittelt werden. Im gebrauchlichen Spezialfall - I0 Kalibrierpunkte aquidistant uber eine Konzentrationsdekade verteilt - ergibt sich das bereits in 1531 empirisch ermittelte Qualitiitsziel (3,4 56).Die Verfahrens-
3.7 Linearitiir
153
standardabweichung in der relativen Darstellung enveist sich damit als einfaches Qualitatskriterium zur Beurteilung der Tageskalibrierung. Fur die Beurteilung der Tageskalibrierung bezuglich der Kalibrierprazision bedarf es einer KenngroBe, die einfach zu berechnen ist und deren Beurteilung einer allgemein gultigen Theorie genugt. Die relative Verfahrensstandardabweichung scheint hierzu geeignet, da die Reststandardabweichung ein Malj fur die Kalibrierprazision darstellt. Das Bestreben, fur die relative VerfahrensstandardabweichungWerte kleiner 3,33 % zu erreichen, setzt voraus, daB die Kalibrierung in einem sehr restriktiven Rahmen angelegt wird. Die Gultigkeit dieses Qualitatszieles ist nur dann gewahrleistet, wenn der Arbeitsbereich mit einer 10-Punktkalibrierung genau eine Konzentrationsdekade erfaBt. Somit ist obiges Qualitatsziel im Allgemeinen nicht auf Verfahren ubertragbar, die einen groBeren oder kleineren Arbeitsbereich als eine Konzentrationsdekade besitzen oder eine Anzahl von Kalibrierstandards ungleich 10 verwenden. Genau dies zeichnet in der Regel Routineanalysenverfahren aus.
Theoretischer Ansatz Fur die Wahl des Arbeitsbereichs ist bei niedrigen Konzentrationen die quantitative Bestimmbarkeit der untersten Kalibrierkonzentration eine unabdingbare Forderung. Nach DIN 32 645 wird der Wert der Bestimmungsgrenze durch den Vertrauensbereich der Kalibriergeraden und der Festlegung einer zu akzeptierenden relativen Ergebnisunsicherheit an der Bestimmungsgrenze (z. B. 33 %) festgelegt. Als Randbedingung fur die Wahl der relativen Ergebnisunsicherheit wird vorausgesetzt, daB die sich ergebende Bestimmungsgrenze im quantitativ erfaBbaren Konzentrationsbereich liegen mu& Quantitativ erfaBbar sind Konzentrationen ab der Erfassungsgrenze, die formell mit der Nachweisgrenze der fruheren Definition z. B. [54] ubereinstimmt. Damit ergibt sich die Forderung, daB die unterste Kalibrierkonzentration groBer als die Konzentration an der Erfassungsgrenze sein muR. Fur den Routineeinsatz eines Analysenverfahrens stellt sich das Problem jedoch nicht aus dieser Sicht, denn der Arbeitsbereich wird unter Umstanden durch andere Erfordernisse wie z. B. durch die zu vermessenden Proben bestimmt. Die Anzahl der zu verwendenden Kalibrierstandards fur die Routinekalibrierung kann ebenfalls von I0 abweichen. Damit ist der t-Faktor, Mittelwert in x und der Summenausdruck Q , im Wurzelausdruck zur Berechnung der Vertrauensbandbreite [ 521 durch methodisch, analytische Festlegungen vorgegeben. 1
mit
Q,
c(x, N
=
-
X)2
i= I
mit:
VB Vertrauensbereich Reststandardabweichung b Steigung
sy
(x-X)2
N Q, x x t
AnLahl der Konzentrationen Summenauadruck Messwert Mittelwert von x t-Faktor
Unter diesen Gegebenheiten wird die Weite des Vertrauensbereiches der Kalibriergeraden nur noch durch die aktuelle Prlzision der Kalibration beatimrnt - ausgedruckt in der Reststandardabweichung (sY). Damit wird die tagliehe Erfassungsgrenze ausschlieRlich von der Reststandardabweichung bzw. der Verfahrensstandardabweichung .sxo abhangig. Fur die Tagesjustierung muB dann gefordert werden, daB die untere Arbeitsbereichsgrenze aktuell im quantitativ erfaljbaren Bereich liegen muR. Dies ergibt fur die Prlzision der Kalibrationsdaten die Mindestanforderung, daB die Verfahrensstandardabweichung einen bestimmten Wert nicht ubersteigen darf, urn der Forderung X E < -xl zu genugen (mit: X E Erfassungsgrenze, x I kleinste Konzentration). Die Erfassungsgrenze ergibt sich nlherungsweise aus der doppelten Breite des Vertrauensbandes in Konzentrationsrichtung am Schnittpunkt der Kalibrationsgeraden mit der Ordinate. An der Konzentration x = 0 ergibt sich Gleichung 2 als Ansatz zur Berechnung von XE.
mit:
X E Erfassungsgrenze
Wird im Grenzfall die Konzentration der Erfassungsgrenx gleich dem untersten Wert der Kalibrierung (xI)gesetzt, so ergibt Gleichung ( 2 ) bei festgelegten analytischen Randbedingungen eine Forderung an die VerfahrensstandardabweichungsXO.Gleichung (2) kann jedoch nicht analytisch geschlossen nach .sxO aufgelost werden.
Verallgemeinerung Damit die Verfahrensstandardabweichung sxo auch fur Analysenverfahren mit nicht nlher festgelegten Kalibrationsbereichen als einfach zu berechnende Qualitatsbeurteilungsgro~e benutzt werden kann, mufi die Ausgangsuberlegung geringfugig abgelndert werden. Die Bedingung X E < x , wird ersetzt durch die Forderung, daB die doppelte Breite des Vertrauensbereichs am untersten Konzentrationspunkt xI hochstens gleich dem Konzentrationswert aelbst ist [xl2 2 . V B ( x l 1.) Dieser Ansatz gewlhrleistet eine relative Ergebnisunsicherheit (Definition siehe 1541)von maximal 50 c/o am untersten Kalibrierpunkt. Damit kann sichergestellt werden, daB x , - V B ( x l )> 0 ist, d. h. die untere Arbeitsbereichsgrenze ist eindeutig vom theoretischen Blindwert (gegeben durch den Achsenabschnitt der Kalibriergeradengleichung) unterscheidbar. Hieraus ergibt sich folgender Gleichungsansatz:
3.7 Linearitii~
I 55
Als einzige Bedingung wird das Uberdecken des Arbeitsbereiches mit 6quidistanten Konzentrationsabstanden beibehalten. Mit dieser Voraussetzung konnen folgende Berechnungsterme durch die Kenntnis des niedrigsfen ( x , ) und hiichsten ( x N )Kalibrierstandards ausgedruckt werden. -
Konzentrationsmittelwert:
-
Abstand der Konzentrationswerte:
-
Konzentrationsfolge:
xi mit
= x,
i = 1,
+ (i - 1 ) . d,
..., N
Damit vereinfacht sich der Summenterm fur Q, zu: Q,
=
( x , - &[*-0,5] i=l
N-1
und der gesamte Wurzelausdruck zu W,:
Somit kann die Ansatzgleichung (3) nach sx0aufgelost werden und als relative GroOe bezuglich der Arbeitsbereichsmitte (relative Verfahrensstandardabweichung s,.,~~~,) dargestellt werden: -
sX0,reI -
t ( P .N
-
1 2) . (I
+ j ) . WN
mit dem Arbeitsbereichsparameterj: xN = j . x I Da das Problem in der Verallgemeinerung zwei zusatzliche EingangsgroBen (Anzahl der Kalibrierkonzentrationen und Ausdehnung des Arbeitsbereichs) besitzt, ergibt sich fur die
156
3 Die Vulidierungspummeter
18-191 17-16; 16-17 15-16 14-15 13-14 12-13 11-12
:: I 10-11l
7-8
6-7
1
,
5-6 4-5
2-3 3-4
1
1-2
0-1
Arbeitsbereich j m it Xn = j * X1
r
U
-
N 0
Abb. 3-40 Maximal zulassige relative Verfahrensstandardabweichungen.
relative Verfahrensstandardabweichung,die maximal erreicht werden darf, um dem Qualitatsziel VB(x,)5 x, zu geniigen, eine in zwei Raumrichtungen hyperbolisch gekriimmte Flache (Abb. 3-40), die mittels eines Tabellenkalkulationsprogramms, z. B. EXCEL, berechnet und dargestellt werden kann. In Tab. 3-15 sind exemplarisch die maximalen relativen Verfahrensstandardabweichungen fur 4 Kalibrierbereiche mit unterschiedlicher Anzahl von Kalibrierpunkten aufgelistet. Hieraus ist zu erkennen, da13 die Anforderung an die Kalibrierprazision mit abnehmender Anzahl an Kalibrierstandards zunimmt. Ebenfalls bestatigt wird die empirisch gefundene Forderung aus [53]. Tab. 3-15 Maximale relative Verfahrensstandardabweichung in [%I
4 Punkte
5 Punkte
10 Punkte
20 Punkte
8,3 4,1 2,3
12,5
14,6
62
10 X I
6,O 38 1,6
x,,= 20 X I
0,9
1,2
13
7,3 4,o 2,l
Kalibrierbereich xEI= 2 x,
x N = 5 x, XN =
(*): Empirisches Qualitatsziel aus: Vom
3,4 (*I
Wasser, 74,91-105 (1990): 3,33 %.
3.7 Lineciritiit
157
Zusammenfassung Die Verfahrensstandardabweichung ist eine grundlegende KenngriiBe, mittels der die Prlzision der Kalibrationsmessungen um die Ausgleichsgerade beschrieben wird. Da der Wert der Verfahrensstandardabweichung eine einfach zu berechnende GroBe ist, eignet sich diese Kenngrolje zur Qualitatskontrolle von Analysenverfahren im Routineeinsatz. Die Qualitatskontrolle mittels der Verfahrensstandardabweichung ist bei uneingeschranktem Arbeitsbereiche mit variabler Anzahl von Kalibrierstandards allgemeingultig beschreibbar. Es ergibt sich ein Maximalwert fur die relative Verfahrensstandardabweichung, der aus einer hyperbolischen Fllche im dreidimensionalen Raum ermittelt werden kann. Hiermit erweist sich die Verfahrensstandardabweichungin der relativen Darstellung als einfaches Qualitatskriterium fur die Beurteilung der Prazision der Tageskalibrierung. Die bis dato gemachten Ausfuhmngen sollen nun zunachst in einem FlieBschema incl. Kommentierung und in einem abschlieaenden Beispiel zusammengefaat werden. 3.7.2.5 Flieljschema zur Kalibrierung und zur Ermittlung der Linearitat
1. Errnittlung der Signalwerte fur den gewunschtenlerwarteten, "unteren" und "oberen" Konzentrationsbereich. Dazu werden je sechs oder zehn (DIN 38402 Teil51) unabhangig voneinander hergestellte Kalibrierlosungen verwendet.
Ersfer Test: Test auf Normalve~ei/u~g
I
Nein-
Werte normal verteilt?
iJa
Arbeitsbereich einengen
Zweiter Test: Test auf Varianzenhomogenitat
I
Varianzenhornogenitat gegeben?
2.
-Nein-
Mit einer Gewichtung arbeiten, s. Abschnitt 3.7.2.8.
Herstellung von Kalibrierlosungen, Messung und Erhalt der entsprechenden Signale
3.A. Ermittlung rnit Hilfe spezieller Validierungssoftware-Programme oder EXCEL der Bestgeraden (lineare Regression) und der Bestkurve (quadratische Regression) rnit den dazu gehorenden KenngroOen; u. a. Ordinatenabschnitt, Steigung, Reststandardabweichung, Verfahrensstandardabweichung,relative Verfahrensstandardabweichung
Abb. 3-41 FlieBschcma Kalihdcrung.
B
Durchfuhrung des Mandeltests d h Frage beantworten "Wetches mathematische Modell (linear oder quadrattsch) beschreibt am besten, die von mir experimentell gefundene Abhangigkeit des Signals von der Konzentration? Und welter Falls das quadratische Modell "besser" ist, 1st es signifikant besser?
Lineare Regression angepaOter bzw. nicht signifikant "schlechter" als die quadratische?
Nein, d. h. quadratische Regression signifikant besser
Arbeitsbereich einengen. experimentelle Bedingungen andern, Anzahl der Kalibrierpunkte erhohen und erneut den Mandeltest durchfuhren
Nein
I
quadratische Regression immer noch signifikant besser?
Messung auf Fehler uberprufen und bei negativem Befund fur die Zukunft mit einer quadratischen Regression arbeiten C
Vertrauensbander um die Bestgerade (Streuung der y-Werte, Prazision der Messung) sowie Prognoseintervall (Streuung der x-Werte, Gute der Kalibrierung) ermitteln Bei Bedarf AusreiOertest nach Huber durchfuhren.
Ende der Kalibrierung
Bemerkungen Die relative Verfahrensstandardabweichung 1st ein wichtiges Gutekriterium einer Methode Als solches eignet 1 sie sich fur den Vergleich von Methoden, bei Wiederholmessungen be1 Ringversuchen etc Ihm gebuhrt besondere Beachtung 2 Es wird empfohlen. den Residual- und den Sensitivitatsplot aufzunehmen Mit Hilfe der Residualanalyse werden Trends erkannt eine wichtige Information, die die Reststandardabweichung nicht zu liefern vermag Der Sensitivitatsplot 1st ein strenges Kriterium fur das Vorhandensein von Linearitat im unteren und im oberen Konzentrationsbereich, s Abschnitt 3 7 2 7
Abb. 3-41 Fortsetzung.
3.7 Lineuritiit
159
Kommentar - Nach Eingabe der experimentellen Daten bzw. iibernahme der selbigen aus einer EXCEL
-Tabelle erfolgen mit Hilfe von dafur ausgelegten Softwareprogrammen automatisch die Berechnungen des Punktes 3 a) bis 3 c). Einige Programme erlauben dariiber hinaus die Prufung auf Normalverteilung und Varianzenhomogenitat bzw. die Durchfuhrung des Bartlett-Tests, Punkt 1, die Residualanalyse und der Sensitivitatsplot, Punkt 4, sind ebenfalls Bestandteil mehrerer Softwarepakete. Als ,,Kalibrierung" werden ublicherweise die Aktivitaten der Punkte 2 bis 3 c) oder sogar nur 2 und 3 a) des FlieBschemas bezeichnet. Wie auch immer, braucht der Analytiker heute ,,nur" die Kalibrierlosungen sorgfaltig herzustellen und zu vermessen, die Wertepaare Konzentration/Signal einzugeben (wenn sie nicht automatisch ubernommen werden), die KenngroBen der Kalibrierfunktion werden dann automatisch ermittelt. Die Aufgabe des Analytikers besteht nun darin, sich mit der Aussagekraft dieser Zahlenwerte auseinander zu setzen. Zu kritischen Punkten bezuglich Linearitat s. auch Abschnitt 3.7.2.3, 5.2 und 7. -
Die Streuung der MeBwerte uber den gesamten Arbeitsbereich mu13 konstant sein, will man zur Berechnung der Kalibrierfunktion die ungewichtete Regressionsanalwe durchfuhren. Bis auf solche Falle, in denen der abgedeckte Konzentrationsbereich relativ gering ist - wie z. B. bei Gehaltsbestirnmungen in der Pharmaindustrie- sollte die Konstanz der Varianzen (Streuung) stets uberpriift werden. Der in DIN 38 402 Teil5 1 empfohlene F-Test zur Uberprufung der Varianzenhomogenitat (Gleichheit der Streuung) ist nicht geeignet wie in [56] sehr schon dargelegt wird. Wenn nun eine groBere Streuung bei einer bestimmten Konzentration ubersehen wird, zeigt die Kalibrierfunktion bei Anwendung der ungewichteten Regressionsanalyse einen falschen Verlauf. Die Folge ist eine falsche Steigung und somit ein falsches Ergebnis. Geeigneter als der in der DIN empfohlene F-Test ist der Bartlett-Test. Der Bartlett-Test priift den Verlauf der Streuung im betrachteten Bereich insgesamt, wahrend der F-Test letztlich nur die Streuung zweier MeBreihen miteinander vergleicht (,,unten" und ,,oben") [56].Der BartlettTest ist somit nichts anderes als ein kombinierter Test auf Normalverteilung und Varianzenhomogenitat. Genaueres zum Bartlett-Test, s. [57]. 1st der Aufwand gerechtfertigt? Ja, er ist es, wenn ein grofier Konzentrationsbereich abgedeckt werden soll. Die Norm empfiehlt 10 MeBwerte pro Konzentration, also insgesamt 20 MeBwerte. Der BartlettTest verlangt mindestens 5 MeBwerte fur eine MeBreihe. Wird nun der Arbeitsbereich gleichmaBig in 5 Konzentrationsniveaus unterteilt und wird pro Konzentration eine MeBreihe mit 6 Werten bestimmt, hatten wir insgesamt 30 Mefiwerte. Der Mehraufwand ist insofern gerechtfertigt, als dadurch ein moglicher systematischer Fehler bei der Kalibrierung vermieden und daruberhinaus quasi als Nebenprodukt, die Prazision des Verfahrens fur die 5 Konzentrationen ermittelt wird.
- Aufgrund des MeBprinzips (z. B. HPLC mit UV-Detektion) wird in der Analytik oft
eine lineare Abhangigkeit erwartet. Wird nun eine ,,schlechte" Linearitat festgestellt, kann dies ein Hinweis auf einen Fehler in der Methode oder im Detektionssystem sein:
160
. .. .. .. -
-
Mogliche Frhlrrqirellen in der HPLC, die zu einer schlechten Linearitat fiihren "1: Der Analyt ist schlecht liislich: Weil dieses Problem recht hiiufig auftritt, ist es besser, jede Konzentration einzeln einzuwiigen, damit der Fehler auch erkannt wird. Uberladung der Trennsiiule Der Analyt koeluiert mit einer weiteren Substanz oder wird durch den Systempeak unterlaufen Der Analyt wird z. T. an der stationLen Phase adsorbiert Der Analyt zersetzt sich auf der SIule Beginnende Hydrolyse oder sonstige Veriinderung des Analyten Die Linearitat und/oder der MeBbereich des Detektionssystems ist ungeniigend.
Man sollte mit den KenngrBRen, die ermittelt werden konnen, wie der Abstand der Hyperbelaste urn die Kalibriergerade. Prognoseintervall und Verfahrensvariationskoeffizient bewuBt umgehen. Fragen wie: Lohnt sich statt einer Einfach- eine Dreifachbestimmung, wenn das Verfahren recht priizise ist? Wieviel Konzentrationsniveaus brauche ich wirklich? Wie vergroRert sich das Prognoseintervall in Abhangigkeit von der erwarteten Konzentration? konnen objektiv beantwortet werden. Der Abstand der Hyperbelaste und das Prognoseinterval1 sind GroRen, die sehr klar zeigen, welcher Arbeitsaufwand in Bezug auf eine Verbesserung zu akzeptieren ist. Der Verfahrensvariationskoeffizient ist ein hervorragendes Giitekriterium eines Verfahrendeiner Methode, weil in dieser GroBe folgende wichtige KenngroRen enthalten sind: Reststandardabweichung, ein Ma13 der Streuung der MeRwerte urn die Bestgerade ( PriizisionsmaB) Steigung, ein Man fur die Empfindlichkeit einer Methode, wichtig gerade im Spurenbereich (EmpfindlichkeitsmaR) Der Verfahrensvariationskoeffizient bezieht sich wie wir gesehen haben auf die Mitte des Konzentrationsbereichs. Diese ist in der Regel identisch mit der Zielkonzentration. Daher ist VLoein geeignetes charakteristisches Giitekriterium einer Methode fur die quantitative Bestimmung eines Analyten in einer bestimmten Konzentration unter den konkreten experimentellen Bedingungen.
In dem FlieRschema und im Kommentartext ist die Rede bewuljt von Kulihrirrung und nicht von Li/ieciritiit. Die Kalibrierung wird mit Kalibrierliisungen durchgefiihrt. Sie enthalten den gut charakterisierten Analyten (Standard) und das Losungsmittel. Die realen Proben jedoch konnen daruber hinaus noch Begleit-. Zusatz-, Fullstoffe usw., d. h. eine mehr oder weniger komplexe Matrix, enthalten. Die Matrix kann die Kenngrol3en der Kalibrierfunktion (Steigung, Arbeitsbereich usw.) beeinflussen. Daher ist es unerliiRlich. im Rahmen der Validierung diesen EinfluR zu iiberpriifen. Nachfolgend wird die Vorgehensweise fur eine derartige Uberprufung skizziert. In [ 58 I findet sich eine detaillierte Beschreibung mit Zahlenbeispielen.
3.7 Lineuritat
161
Durchfuhrung der (Grund-)Kalibrierung wie oben beschrieben und Ermittlung der Kalibrierfunktion (z. B. lineare Regression) Herstellung von Blindlosungen: Eine Blindlosung ist eine synthetische Losung, die die Matrix der spater zu analysierenden realen Proben (Placebo, Formulierung, Abwasser, Staubextrakt usw.) und das Losungsmittel enthalt. 1st eine analytfreie Matrix nicht herzustellen, so ist die Standardaddition anzuwenden, s. weiter unten. Die Blindlosungen werden mit Analyt (Standard) aufgestockt. Man erhalt Losungen mit der selben Konzentration wie die Kalibrierlosungen. Diese ,,Probelosungen" werden nun vermessen. Ein erstes ,,Gefuhl" uber den EinfluB der Matrix auf die einzelnen KenngroBen kann man bereits jetzt erhalten, indem man folgende Quotienten bildet: SteigungKalibrierung . 100% SteigungLinearitit
ReststandardabweichungKalibrierung
.loo%
ReststandardabweichungLinearitat
Wenn man dieses Experiment mit den in Frage kommenden Matrices oder auch bei modifizierten Analysenbedingungen durchfuhrt, kann man interessante Informationen erhalten. Beispiele: In der Matrix Blut ist die Empfindlichkeit der Methode XYZ zur Bestimmung des Metaboliten Methylvalidols um so und soviel Prozent geringer als im Urin. Durch Wechsel des Schrittes ,,Filtration" mit ,,Zentrifugation" in der Probenvorbereitung sind bei sonst gleichen Analysenbedingungen die Prognosebander um die Bestgerade um so und soviel Prozent naher geriickt, d. h. die Prazision der Methode ist um so und soviel besser geworden. Jetzt werden die x-Werte (Gehalte) der ,,Probelosungen" ausgerechnet, indem die Signalwerte der ,,Probelosungen" in die Gleichung fur die Kalibrierung eingesetzt werden. AnschlieBend wird rnit den Gehalten der Kalibrierlosungen und den gefundenen Gehalten der ,,Probelosungen" eine lineare Regression durchgefuhrt. Dazu werden die errechneten Werte der Probelosungen auf der y-Achse und die der Kalibrierlosungen auf der x-Achse aufgetragen. Im Idealfall hatte die Matrix bei einer Konzentration des Analyten von 0 keinen EinfluB auf das Signal und dariiber hinaus wurde sie keine konzentrationsabhlngige Abweichungen hervorrufen. In diesem Fall ware kein Matrixeffekt feststellbar, man erhielte eine Winkelhalbierende, die Steigung w&e I und der Achsenabschnitt 0, s. auch Abschnitt 3.4.2. I . xProhs = I . XKalihrierung -IXProhe = XKalihrierung Wie kann man nun objektiv beurteilen, wie ,,schlimm" der EinfluB der Matrix ist? Dazu mussen die Vertrauensbereiche des Ordinatenabschnitts und der Steigung ermittelt werden. - SchlieBt der Vertrauensbereich ( P = 95 %) der Steigung den Wert 1,O rnit ein, ist eine proportional-systematische Abweichung nicht festzustellen SchlieBt der Vertrauensbereich ( P = 95 %) des Ordinatenabschnitts den Wert 0 rnit ein, ist eine konstant-systematische Abweichung nicht festzustellen.
Dieser Befund wurde bedeuten, daR der MatrixeintluB nicht signifikant ist und man den Gehalt des Analyten in der realen Probe mit den Daten aus der (Grund)Kalibrierung bestimmen kann. Auch wenn die Signifikanz statistisch nicht nachgewiesen werden kann, konnte aus analytischer Sicht die Information uber einen vorhandenen EinfluB der Matrix von Interesse sein. Dafur eignen sich folgende Quotienten, in denen praktisch alle wichtigen KenngroBen enthalten sind:
PrognoseinteTVallK,I,~r,e~n~ . 100 ?h PrognoseinteTVaIll,,,,,,,,,,
relative V e r f a h r e n s ~ t a n d a r d a b w e ~ c h u n. g100 ~ ~8~ ~ ~ ~ ~ ~ ~ ~ ~ ~ relative VerfahrensstandardabweichungLinearitat Ergibt die oben skizzierte statistische Bewertung, daB der EinfluR der Matrix auf Steigung und Achsenabschnitt signifikant ist, konnen die Daten der Kalibrierung zur Bestimmung von realen Proben nicht verwendet werden. Man mul3te hier das Verfahren der Stundurdaddition anwenden [ 58 1: - Eine Originalprobe wird rnit detinierten Mengen an Analyt aufgestockt und vermessen. Man erhalt beispielsweise fiinf Signale (ein Signal der Originalprobe, vier Signale aus den vier Aufstockliisungen), die konzentrierteste Losung sollte hochstens die doppelte Konzentration der Originalprobe haben, die Linearitat des Detektors darf nicht uberschritten werden. Die funf Signale werden gegen die Originalkonzentration und den vier Aufstockungen aufgetragen (Signale auf der y-Achse, Konzentrationen auf der x-Achse), man erhalt die Aufstockfunktion rnit wahrscheinlich anderen KenngroBen als die Kalibrierfunktion. Auch hier gilt, objektiv - d. h. mit statistischen Mitteln - zu beurteilen, ob die Unterschiede signifikant sind. Dazu werden zwei Tests durchgefuhrt: 1. Priifung der Reststandardabweichungen der zwei Funktionen (Kalibrierung, Aufstockung) auf Varianzenhomogenitat nach dem ublichen F-Test. 2. Mittelwert-t-Test der zwei Steigungen. Erweisen sich die Unterschiede als signifikant, so hat die Matrix einen ,,zu" starken EinfluB auf das Ergebnis, der Fehler (bias) ist nicht zu akzeptieren. Da bei der beschriebenen Vorgehensweise die Matrix die einzige Variable ist, konnen andere systematische Fehler (konstant und proportional) ausgeschlossen werden. In diesem Fall mussen die experimentellen Bedingungen auf vorliegende Matrix hin optimiert werden (Probenvorbereitung, Detektion, usw.) oder es mu13 auf ein Alternativverfahren ausgewichen werden. Bemerkung: Verschiedentlich wird vorgeschlagen, in jedem Fall drei Experimente unter gleichen Bedingungen durchzufiihren und anschliel3end die drei Verfahrensvariationskoeffizienten zu vergleichen: 1. Kalibrierung mit Standardlosungen 2. ,,Kalibrierung" mit Standardlosungen, denen Matrix zugegeben ist. 3. ,,Kalibrierung" rnit realen Proben, denen definierte Mengen an Standard zugegeben ict (Standardaddition).
3.7 Linearitiit
163
Diese Verfahrensweise liefert sicherlich gesicherte Informationen; es sol1 individuell entschieden werden, in welchen Fallen der Aufwand gerechtfertigt erscheint.
3.7.2.6 Beispiel zur Priifung auf Linearitat [51] Nachfolgendes Beispiel ist fur Leser gedacht, die anhand einer ublichen Fragestellung die einzelnen Schritte bei der Entwicklung und Beurteilung eines Linearitatstests sukzessiv und detailliert verfolgen mochten. Fur erfahrene Anwender durfte diese detaillierte Beschreibung von geringerem Interesse sein. Das ausgewahlte Beispiel dient ausschlieljlich didaktischen Zwecken: Selbstverstandlich sollte in der Praxis die Prufung auf Linearitat mit Hilfe von Softwareprogrammen erfolgen, zu kommerziellen Softwareprogrammen s. Anhang A 6. Das Schmerzmittel Acetylsalicylsaure (ASS) in einer Tablette, die 0,5 g ASS pro Tablette enthalten soll, wird mit Hilfe der UV-Spektroskopie untersucht. Dazu wurde die Tablette in heiljem Wasser gelost und so verdunnt, dalj (schatzungsweise) 175 pg/L ASS in der verdunnten Losung enthalten sind. Es entstand bei der Messung eine Extinktion von 0,643. Daraufhin beschlolj der Analytiker, die Kalibrierfunktion in einem Arbeitsbereich zwischen
100 pg/L und 300 pg/L ASS zu untersuchen. Es steht ein ASS- Standard von der gleichen Firma zur Verfugung. Der Matrixeinflulj ist zu vernachlassigen.
1. Priifung auf Varianzenhomogenitat Fur die Reihe 1 (verdunnteste Losung) wurden 10 ma1 separat eine Losung von 100 pg/L ASS hergestellt und bei 247 nm jeweils die Extinktion gemessen. Fur die Reihe 2 (konzentrierteste Losung) wurden 10 ma1 separat eine Losung von 300 pg/L ASS hergestellt und bei 247 nm jeweils die Extinktion gemessen. Mcssung Nr. I 2 3 4 5 6 7 8 9 10
100 l r g n
Reihe 1
Reihe 2 300 p g n
0,24 I 0,239 0,239 0,244 0,240 0,237 0,239 0,244 0,24 1 0,231
0.94 I 0,93 1 0,933 0,927 0,942 0,952 0,944 0.93 1 0,929 0,920
Die Berechnung der Varianxn s 2 erfolgt mit:
mit:
s 2 Varianzenhomogenitat
.vi Messwert
Mittelwert N Anzahl der Konxntrationen
y
Fur die Reihe I ergibt sich: .sf = 0.00000610.
Fur die Reihe 2 ergibt sich:
S;
= 0,00009063.
Aus den Varianzen errechnet sich eine PrufgroBe PG:
P G = s12 = 0,00009063 = 14,85 ,yf O.000006 10 DerTabellenwert FlautetV;=IO- I..f2=
10- ] , p = 9 9 % ) = 5 , 3 5 .
Ergehriis: Varianzenhomogenitiit hegt nicht vor!
Die Werte der hoch konzentrierten Losungen schwanken stiirker als die Werte der niedrig konzentrierten. Vielleicht ist die Gultigkeit des Lambert-Beerschen Gesetzes fur die Spektroskopie bereits uberschritten und somit eine Linearitat nicht gewlhrleistet. Oder die Herstellung der konzentrierteren Losung ist auf diese Art und Weise wegen beginnender Hydrolyse nicht moglich. Es wurde darauthin separat 10 ma1 eine Konzentration von 250 pg/L ASS hergestellt und jeweils die Extinktion gemessen. Die Konzentration der verdunnten Liisung wurde mit 100 pg/L belassen. Mcswng
Nr. I
2 3 4
S
6 7 X 9 I0
Rcihc 1 100 pg/L
Rcihc 3 250 pg/L
0,241 0.239 0,239 0,244 0.240 0.237 0.239 0.244 0.24 I 0.237
0,76 I 0.763 0.760 0.757 (1.764 0,763 0.76 I 0.756 0.758 0.766
3.7 Lineciritiit
16.5
Die Berechnung der Varianzen s2erfolgt mit:
s2
=
c
(Y; - L? N-1
Fur die Reihe 1 ergibt sich: s: = 0,00000610. Fur die Reihe 2 ergibt sich: si = 0,0000109. Aus den Varianzen errechnet sich eine PriifgroBe PG: p G = -si =
$
0,0000109 = 1,78 0,00000610
Der Tabellenwert F lautet (fi = 10 - l,f2 = 10 - 1, P = 99 %) = 5,35
Ergehnis: Vananzenhomogenitit ist gegeben (genauer: eine Varianzeninhomogenitat kann nicht nachgewiesen werden)
Aussage:
Es konnen keine signifikanten Unterschiede in der MeBwertstreuung bei den zwei Konzentrationen festgestellt werden.
2. Ermittlung der Kalibrierfunktion
a ) Lineure Regression
Wertetabelle (Arbeitsbereich 100 bis 250 pg/L, 7 Kalibrierlosungen): Konz.
Nr.
Extinktion
x,-
y;
10 000
24,000 38,875 58,350 82,425 110,800 46,025 189,750 650,225
Y
X ~
X ,!;
~~~
6 7
I00 I25 I50 I75 200 225 250
0,389 0,47 1 0,554 0,649 0.759
22 500 30 62.5 40 000 50 625 62 500
0,057 0,096 0,151 0,22 1 0,306 0,42 I 0.576
Summe
1225
3,373
231 875
1 ,83 I
I 2 3 4 S
0,240
0,31 I
15 625
~
-
Berechnung der Bereichsmitte:
y = -
c?’, N
-
y=-
3,3373 = 0,482 7
50
100
150
Regression Ausgahc: Ordinatenabschnitt y(0) Rcststandardabweichung s) Korrelationskoetfirient r Anzahl der Messungen N Freiheitsgradc .f Sreigung h
200
250
-0,l 176 0,0 142 0,19976 7 5 0,00343
Abb. 3-42 Kalibrierkurvc fur die Bestimrnung von ASS.
-
Berechnung der Quadratsummen
Q,,
=
Q,,
=
231875-
~
1225’ 7
=
17500
3,37? 1,832 - -= 0,2064 7
Q,, =650,225-(1225.3,373/7)
= 59,95
300
Konzentration x [pg/L]
3.7 Lineuritut -
Berechnung der linearen Kalibrierfunktion (lineares Regressionsmodell) p=b. +a
Extinktion = b . Konzentration
+a
Berechnung der Steigung m:
h = 59’95 = 0,00343
I7 500
Berechnung des Ordinatenabschnitts a: a =J-h.i
u = 0,482 - 0,00343. 175 = -0,1176
Aufstellung der Kalibrierfunktion: Extinktion = 0,00343 . Konzentration -
Berechnung der Reststandardabweichung s Y
sy =
-
+ (-0, I 176)
i
Berechnung der Verfahrensstandardabweichung .yxo
=
.sXo =
5. h
~
0,O 142 = 4,139 0.00343
167
Berechnung der relativen Verfahrensstandardabweichung
-
v,,
= 4'139 .
17.5
100% = 2,36.5%
h) Qriadrufischr Regrt.ssicm Wertetabelle (Arbeitsbereich 100 his 2.50 pg/L, 7 Kalibrierlosungen): Nr.
-
Konz.
Signal
-
'
v,
I
100
0.240
I 0 000
I 000 000
I00 000 000
0.0576
24.000
2 400.00
2
125
0,31 I
15625
I953 125
244 140625
0,0967
38.875
4 859,37
3
150
0.389
22 500
3 375 000
506 250 000
0. I5 I3
58,350
8 752.50
82,425
I4 424,37
22 I60,OO
4
175
0,471
30 625
5 359 375
937 890 625
0.22 I8
5
200
0,554
40 000
8 000 000
1600 000 000
0.3069
1 10,800
6
225
0,649
SO 625
1 1 390 625
2562 890 625
0,42 I2
146.025
32 855.62
7
250
0,759
62 500 15 625 000
3906 250 000
0.5 760
I 89.750
47 43730
C
1225
3.373 23 1 875 46 703 I25
9857 421 875
1 .X3 16
650.225
I32 889.37
Berechnung der Bereichsmitte:
122.5 = 17.5pg 7
-
y=-
-
3,373 = 0,482 7
\'=-
-
.r;
\8-
Berechnung der Quadratsummen:
L
i
3.8 Wieder$ndung und Wiuderj5ndungsrute
3,3732 7
Qyy = 1,832 - -= 0,2064
Qxy
=
y]
[
650,225- 1225.
=
59,95
[
Qxxx
=
7 = 6 125000 c 4 6 7 0 3 125 - 1225 231875]
Qxxy
=
l32889,4- 3,373.
i
7
- Berechnung der quadratischen Kenndaten:
quadratische Steigung n:
n =
n=
Qxy
. Qxxx
(ex,,1
2
- Qxxy
- Qxx
Qxx
.Qxxxx
59,95.6125000 - 21 158,75.17500 = o,ooooo537 (6125000)2- 17500-2,177.lo9
169
lineare Steigung h: Qxy
b=
- ‘1
. Qxxx
Qxx
59,95 - 0,00000537I ’ 6 125 000 I7 500
b=
=
o,OO 545
Ordinatenabschnitt a:
CI =
3,373 - 0,001545. I225 - 0,000005371.23 187.5 7
o,0334
Die Gleichung der quadratischen Funktion lautet demnach:
Extinktion = 0,000005371 * Konz.* + 0,001545 * Konz. + 0,0334 -
Berechnung der Reststandardabweichung sy:
sY
=
1,83 1 - 0,0334.7373 - 0,00 1545.650,225 - 0,00000537 1 . 2 3I 875
7-3
sY = 0,0038 -
Berechnung der Empfindlichkeit E:
E
=
h+2.n.F
-
E = 0,001545 + 2 0,000005371 * 175 = 0,00343 -
Berechnung der Verfahrensstandardabweichung: S,()
=
S,[, =
sY -
E
0,0038 = 1.1 17 0,00343
3.7 Lineaririit - Berechnung der relativen Verfahrensstandardabweichung:
vxo = s,o.100% X
1,l 17 vl.o= . 100% = 0,638% 175
c ) Vergleich der Duten beider Regressionsunsatze (Mandeltest) lineare Regression N
0,00000537 1
-
B
-
quadratische Regression
0,003457
0,00 1 545
A
-0,l 176
0,0343
rY
0,0 I42
0,0038
.rxo
4,1392
1,117
2,365 8
0,638 8
Berechnung der Varianzendifferenz: Berechnung der Varianzen aus den Standardabweichungen:
Linear:
s;L
= 0,0142' = 0,0002016
Quadrutisch:
S&
=
0,003g2 = 0,0000144
Berechnung der Varianzendifferenz: Ds2 = [ ( N - 2 ) . s ; ~ ] - [(N - 3 ) . s&]
Ds2 = 5 . 0,0002016- 4 .0,0000144 = 0,0000950 Berechnung der PriifgroBe PG:
DS'
PG
=-
PG
=
9,50 .
1,444.
=
65,9
17 1
-
Bewertung:
F ( P = 99 c/o / j ' ,= l,,f2 = 7 - 3) = 21,20 (It. F-Tabelle) PG = 65,9 Ausstige: Die quadratische Regression ist signifikant besser als die lineare Regression.
3. Kalibrierstrategien: Strategieprinzip (s. auch Okonomie der Validierung 7. I ) :
Es sollte untersucht werden, oh durch eine Einengung der Menwerte oder eine Neukalibrierung nach einer anderen Probenvorbereitungsvorschriftvielleicht doch eine akzeptable Linearitit erreicht werden kann. -
Strtitegie
I : Eiriengiirig a i f 6 Dater? Konicntration pg/L
Extinktion
I00
0.240 0.3 I I 0,380 0,411 0.554 0,649
I25
1
so
175
100 125
Daten der linearen Regression: Arbeitsmitte x Arbeitsmitte Steigung der Geraden h Ordinatenabschnitt a Reststandardabweichung .sy Verfahrensstandardabw. sx0 Verfahrensstandardabw. V,,, Quadratsume Q,,
162,s 0,436 0,003269 -0,00947 0,0078 2,385 1,468 % 8083,33
Daten der quadratischen Regression: Quadratische Steigung tz: lineare Steigung h Ordinatenabschnitt N Reststandardabweichung .sY Verfahrensstandardabw. s , ~ ~ Verfahrensstandardabw. V,, Empfindlichkeit E
0,00000400 0,oo 1964 0,00360 0,oo 1 8 0,5376 0,326 r/r 0,00326
3.7 Linenritiir
Bewertung beider Regressionen: Varianzendifferenz DS2 PriifgroBe PG F(P = 99 %, f i = 1, f2 = 3)
173
0,0002335 72,06 34,12
Ergehnis: Die quadratische Anpassung ist immer noch signifikant besser! - Strutegie 2: Neukalibrierung
Es wird das bisher venvendete Losemittel ,,heiBes Wasser" gegen Methanol ausgetauscht und neue Werte im Bereich von 125 his 235 pg aufgenommen (Auf eine erneute Bestimmung der Varianzenhomogenitat wurde verzichtet.) Konzentration
Extinktion
125
0,309 0,372 0,434 0,493 0,554 0,649
145 165
I85
205 235
- Daten der linearen Regression: Arbeitsmitte x
Arbeitsmitte y Steigung der Geraden b Ordinatenabschnitt u Reststandardabweichung sY Verfahrensstandardabw. s,, rel. Verfahrensstandardabw. V,, Quadratsume Q,,
176,67 0,4685 0,003075 -0,0747 0,oo14 0,464 0,263 % 8083,33
- Quadratische Regression:
-
Quadratische Steigung n lineare Steigung h Ordinatenabschnitt a Reststandardabweichung sy Verfahrensstandardabw. s, Verfahrensstandardabw. V,,
-0,00000020 I 0,003002 -0,0685 0,OO 16 0,5235 0.296 %
Empfindlichkeit E:
0.00307
- Bewertung:
Varianzendifferenz Ds2 PriifgroBe PG F(P = 99 % , f i = 1 ,f2 = 3)
0,00000393 2,32 34,12
-
E r p h r i s : Die quadratische Anpassung liefert formal zwar immer noch bessere Werte, der Unterschied ist jedoch nicht signifikant, sondern zufallig. Eine lineare Regression kann angewendet werden.
4. Ermittlung der unbekannten Konzentration Die urspriinglich aufgenommene Extinktion der Probe, die in heiBem Wasser geliist wurde, betrug 0,564. Nach der Umstellung der Arbeitsvorschrift (Losung in Methanol) erhielt man eine Extinktion der Probenlosung von 0,55 1. Die Geradengleichung
wird umgeformt zu:
= Extinktion - (-0,0747) ~~~~~~~~~~i~~ 0,003075
Konzentration =
'3'
- (-070747) = 203,47 pglL 0,003075
5. Ausreifiertest nach Huber Im vorliegenden Fall existiert kein ausreifierverdachtiger Wert, daher wird hier auf den Huber-Test verzichtet.
6. Ergebnis der Bestimmung Fur einen bestirnmten Signalwert j existiert eine Reihe moglicher .? -Werte; der .,wahre" Wert befindet sich in einern Bereich, dem Prognoseintervall, dessen GriiRe durch die zwei Hyperbeliiste (Prognose- oder Vertrauensbznder) urn die Kalibriergerade bestimmt wird, s. Abb. 3-34. Mit Hilfe folgender Gleichung kann dieser Bereich errechnet werden:
In unserem Beispiel betragen nun der t-Wert nach der zweiseitigen Tabelle (95 c/o, f = 4): 2,776, die Anzahl der Kalibrierlosungen: 6, die Anzahl der Bestimmungen pro Kalibrierliisung: 1. Es wird folgendes Interval1 berechnet:
3.7 Lineuritut
1
xu,o = 203,47 k Xu,o
&o
I75
(0,551 - 0,4685)2
1
0,0030752 . 8083,33
L+ + 1
=
203,47 f 1,2638699.
=
203,47 f 1,2638699. 1,1211493
=
203,47 k 1,4169868
-
0,0903093
Ergehnis: Der tatsachliche Wert der AcetyIsalicy.-aure liegt mit einer statistisc..m Sic..:t ..eit von P = 95 % zwischen 202,05 und 204,89 pg/L. Angenommen, der Anwender mochte das Prognoseintervall verkleinern. Die Prazision der Messung zu erhohen (kleinere Reststandardabweichung sy) oder auf einen empfindlicheren Detektor auszuweichen (Erhohung der EmpfindlichkeitBteigung rn) erscheinen als zu aufwendige Mafinahmen. Deswegen werden folgende zwei Strategien verfolgt: 1. Erhohung der MeBwerte von 6 auf 20 2. Statt einer Einfach- sol1 eine Dreifachbestimmung durchgefuhrt werden. Zu 1.: Erhohung der Mefiwerte (N) auf 20
iu,o = 203,47 f
1
+
20
1
+
(0,551 - 0,4685)2 0,0030752 . 8083,33
1
iU." = 203,47 f 0,9565528 . 1,068 1335
iU,<) = 203,47 f 1,02 Der Wert der Acetylsalicylsaure liegt mit einer statistischen Sicherheit von P = 95 % zwischen 202,45 und 204,49 p g k . Zu 2.: Erhohung der Anzahl der Wiederholmessungen
Xu,,,
=
203,47 f
(i) auf 3
(035 1 - 0,468a2 0,0030752 .8083,33
.; ,,,,, = 203,47 F 1,2638699. 0,7678378
Der Wert der Acetylsalicylsaure liegt mit einer statistischen Sicherheit von P = 95 c/c zwischen 202.50 und 204,44 pg/L. Bei einer Vierfachbestimmung liegt der Wert zwischen 202,57 und 204.37 mg/L.
Kominenttrr: Es ist fraglich, o b der Aufwand mit den 20 MeRwerten die erzielte Verkleinerung des Vertrauensbereichs von 2,84 (204,89 - 202,05 = 2,84) auf 2,04 (204,49 - 202,45 = 2,04) rechtfertigt. Die 3-fach-(4-fach-)Messung fuhrt zu einer Verkleinerung des Bereichs auf 1,94 ( 1,go). Wenn also eine Verkleinerung des Vertrauensbereichs durch ,,FleiB" angestrebt werden soll, ist eine Mehrfachbestimmung sinnvoller (Strategie Nr. 2) als eine Erhohung der Anzahl der MeBwerte (Strategie Nr. I ) . 3.7.2.7 Eine kritische Betrachtung der Kriterien fur Linearitlt Als Akzeptanzkriterien fur eine lineare Kalibrierfunktion gelten ublicherweise folgende: -
Korellationskoeffizient, r > 0,999 y-Achsenabschnitt, a < 0 his 5 9% der Zielkonzentration Reststandardabweichung, s\. < 1,s bis 2 8
Diese Kriterien sind jedoch als Beweis fur eine Linearitlt nicht ausreichend - vor allem nicht im unteren Konzentrationsbereich.
Beispiel I Wirkstoffanalyti k Neben der ,,klassischen" Auftragung Signal gegen Konzentration sind weitere Auftragungsarten moglich. z. B. Responsefaktor (Quotient aus Signal und Konzentration) gegen Konzentration. Diese Auftragung wird gelegentlich als Rrsponsr- oder Sensiriviriir.s-P/or bezeichnet. Solange eine Proportionalitat zwischen Erhohung des Signals und Konzentration herrscht, bleibt der Quotient konstant: der lineare Bereich wird durch eine Parallele zur x-Achse (Konzentration) wiedergegeben. In Abb. 3-43 wird eine Auftragung Signal (Fliiche) gegen Konzentration (mg/I) gezeigt. Der errechnete Korellationskoeffizient ist r = 0,99995 (rechtes Bild), der auch optisch zu erkennende lineare Bereich erstreckt sich von ca. 25 mg/l his 500 mg/l. Wird n u n der Responsefaktor gegen Konzentration aufgetragen (,,Response Plot"), Abb. 3-44 ergibt sich als linearer Bereich der Konzentrationsbereich von ca. 100 mg/l bis vielleicht 400 tng/1. Durch diese Auftragung kann ein kleinerer ,,abgesicherter" linearer Bereich definiert werden. Diese Auftragung stellt ein strengeres Linearitltskriterium dar und eignet sich, um sehr friih und sicher Abweichungen zu erkennen. beispielsweise werden Verdunnungs-/Pipetierfehleroder Stabilitltsprobleme sichtbar.
3.7 Lineorilut 24
24
20
20
177
Lineare Regression y = a + b.x a=17 b = 24,343
16
16
s
s
812
g12
5
L
m
8
8
4
4
0
I
0
200
I
I
I
I
400
600
800
1000
Konzentration in mg/l
0
0
200
400
600
800
1000
Konzentration in mgll
Abb. 3-43Priifung auf Linearitat durch die Auftragung des Signals gegen die Konzcntration.
Beispiel 2 Bestimmung von Manitol [59] Abbildung 3-45 gibt die Auftragung Signal gegen Konzentration in Form der Flachenverhaltnisse Manitol/interner Standard gegen Konzentration fur die Konzentrationsbereiche 5 bis 80 mg/ml und 12 bis 28 mg/ml wieder. Ebenfalls aufgetragen (rechte ,,y-Achse") ist ahnlich dem ersten Beispiel - der Quotient am Flachenverhaltnis und Konzentration (Responsefaktor). Der Korrelationskoeffizient fur den Konzentrationsbereich 5 bis 80 mg/ml betragt r = 0,99952 und fur den Konzentrationsbereich 12 bis 28 mg/ml r = 0,99965. Beide Werte sind ,,gut", ein linearer Zusammenhang kann fur beide Falle zweifelsohne bestatigt werden. Sollte nun ein linearer Zusammenhang tatsachlich vorliegen, so wurden die Responsewerte eine Parallele zur Konzentrationsachse bilden. Im linken Teil der Abb. 3-45 ( 5 bis 80 mg/ml) kann davon gar keine Rede sein, es werden ca. 15 % Differenz bei den Responsewerten beobachtet. Linearitat ist dagegen nur fur den kleineren Konzentrationsbereich ( 12-28 mg/ml) gegeben. Dort betragt die Differenz nur ca. 1,5 %. Damit wird ersichtlich, dalS ein Korrelationskoeffizient r > 0,999 kein ausreichender Beweis fur einen linearen Zusammenhang im gesamten untersuchten Bereich ist. Es wird empfohlen, als weiteres Kriterium fur Linearitat den Quotienten aus Responsefaktor und Konzentration hinzuzuziehen. Fur die einzelnen Zielsetzungen waren folgende Linearitatskriterien denkbar:
178 2:
24
K 0 .c
F
c
c
W
23
5m
c
m ._ ul
22
21
I
I
I
0
200
400
I
600 Konzentration in mg/l
I
I
800
1000
Abb. 3-44 Prufung a u l Linearitat durch die Auftragung des Quotientcn aus Signal und Konzcntration (Response) gcgen die Konzentration.
om 0,086 0,082
0,09
:m
0,086
C c -
P
f
0
2 f 0
0,078 $ 0,074
._ m 2,5 L
W
g
9c
2
L a,
u
2 Y m W
0,082
-i
-f 0
0
1,5
0,078 $ 0,074
a,
n
Abb. 3-45 Prufung a u l Linearitat durch die Auftragung des Verhaltnisscs Signal/Konzentration geLinearitat herrscht pen die Konzentration ( a ) und des Responsefaktors gegcn die Konzentration (3). nur fur den untcren Konzentrationsbereich. siche rechtcs Bild.
3.7 Linearitat
179
Wirkstoffgehalt: r 2 0,999 fur 80 bis 120 % des Sollwertes - y-Achsenabschnitt I 2 % des Sollwertes - Reststandardabweichung I 1,5 % - Differenz der Responsefaktoren I 2,5 % -
Verunreinigungen:
- r 2 0,980 fur 0,l bis 2,5 % der Hauptkomponente bzw. der Verunreinigung - y-Achsenabschnitt I 10 % des Signals bei 2,5 % der Hauptkomponente bzw. der Ver-
-
unreinigung Reststandardabweichungen
I 10 % fur < 0,5 % I S% fur 0,s % bis S % 12,s % fur > 5 % Differenz der Responsefaktoren I 5 % fur Konzentration > 0,5 % und 5 10 % fur Konzentrationen < 0.5 %
Gehalt, Freisetzung: rl0,990 y-Achsenabschnitt 5 5 % (komplette Freisetzung, x = 100 %) Reststandardabweichung I 1,5 % (komplette Freisetzung, x = 100 %) Differenz der Responsefaktoren I 3 %
-
Gleichformigkeit, content uniformity: r 2 0,990 y-Achsenabschnitt I 5 % (Sollwert: 100 %) Reststandardabweichung I 1,5 % (Sollwert: 100 %) Differenz der Responsefaktoren I 3 %
-
Ein Problem bei groSen Arbeitsbereichen kann die mangelnde Varianzenhomogenitat sein. Andererseits ist das Arbeiten mit einer Kalibrierfunktion fur einen grol3en Konzentrationsbereich sinnvoll, wenn in einer Probe sowohl der Gehalt der Hauptkomponente als auch der Nebenkomponente(n) bestimmt werden soll. Wird hier die ubliche lineare Kalibrierfunktion verwendet, kann es bei geringen Konzentrationen zu Uberbefunden kommen. Ein Ausweg ist die gewichtete lineare Regression. Dazu existieren mehrere Modelle. Es folgt nun als Beispiel ein Ansatz von Dr. H. J. KuS, Universitat Miinchen. 3.7.2.8 Gewichtete lineare Regression Eine Kalibration ist nur uber einen bestimmten Konzentrationsbereich, den Arbeitsbereich, gultig. Nur in diesem Bereich durfen Analysenwerte errnittelt werden. Die einfachste Beziehung zwischen dem MeSsignal und der Konzentration ist eine Gerade. Dieser Zusammenhang ist bei chromatographischen MeBverfahren im Gegensatz zu den enzymatischen Verfahren meist gegeben. Die Uberpriifung der Linearitat der Kalibrierfunktion ist eine zentrale Forderung der Validierung, die Anpassung an eine Geradengleichung erfolgt mit
der linearen Regression. Dieses Rechenverfahren minirniert die Surnme der quadratischen Abweichungen in der y-( MeBwert-Richtung. Die Konzentrationswerte werden als so exakt angenommen. daB ihre Abweichung vernachliissigbar ist. Bei der linearen Regression werden die Abweichungen der MeBwerte bei den kleineren und den griilJeren Konzentrationen gleich berucksichtigt, d. h. gleiche Varianzen (Quadrate der Abweichungen von der berechneten Geraden in y-Richtung) uber den Arbeitsbereich vorausgesetzt, wie beispielsweise in der Abb. 3-46 gezeigt. Je groljer der Arbeitsbereich ist, desto geringer ist die Wahrscheinlichkeit der Varianzenhomogenitat, die ublicherweise mit dem F-Test (Quotient der gr6Reren durch die kleinere Varianz) fur jeweils 6 bis 10 MeBwerte jeweils bei der kleinsten und der groRten Konzentration des Arbeitsbereichs getestet wird. Wenn man zu jeder Konzentration nur einen MeBpunkt hat, gibt z. B. die graphische Darstellung der Abweichungen von der berechneten Geraden einen Eindruck von der Verteilung der Varianzen. Mit einer Tabellenkalkulation IZBt sich die Differenz eines MeRwerts von dem bei dieser Konzentration aus der Geradengleichung ermittelten y-Wertes (yher) leicht berechnen und darstellen. Stellt man nun fest, wie es bei einem Arbeitsbereich vom Faktor 100 leicht sein kann, daR die Abweichungen im oberen Konzentrationsbereich erheblich hijher sind, als im unteren Bereich, ist die lineare Regression nicht mehr zulissig und sollte in der einfachen Form nicht mehr durchgefuhrt werden. Es bietet sich an, die gewichtete lineare Regression zu verwenden, d. h. MeBpunkte mit kleinerem Absolutfehler auch starker zu berucksichtigen. Eine ausfuhrlichere Diskussion zur gewichteten Regression ist in [49)enthalten. Die lineare Kalibrierfunktion stellt den Zusammenhang her zwischen den mit sehr geringem Fehler herstellbaren Konzentrationen und den mit einem Fehler behafteten MeBwerten. In der Chromatographie sind dies die gernessenen Fliichen oder Hohen. Es sollen deshalb die quadratischen Abweichungen der MelJpunkte von der Geraden nur in y-Richtung minimiert werden:
c (?.'her
-
ygC"~)'= Minimum
Unterscheiden sich nach dem F-Test die Varianzen der MeRwerte bei der hochsten und der niedrigsten Konzentration signifikant voneinander, konnen die Varianzen durch eine w= I / y oder \t.=1/y2 Gewichtung ausgeglichen werden [60]. Es wird dann:
2
-
ygOrl1)' \ta = Minimum
Die Geradengleichung (Kalibrierfunktion) lautet: Jher
= hx; + N
Einsetzen in die obige Gleichung ergibt:
3.7 Lineciritut
18 1
ausgeklammert ergibt sich: b2 Cx2w + 2 ba
Minimum
+ 2 ha c x w -
2 b c x y w + a2
cw
-
2 a c y w +cy2w=
Fur das Differenzieren nach a mussen nur der 2., 4. und 5 . Ausdruck beriicksichtigt werden:
S c l Sa = 0 = 2 b ~ x x c + r ~2 a
cw- 2cyw
Nach a aufgelost ergibt sich:
Fur das Differenzieren nach b ergeben nur die ersten drei Ausdriicke von Null verschiedene Werte:
SC I S b = 0 = 2 b C x 2 w + 2 a
c xw - 2
XYW
Der Faktor 2 wird herausgestrichen und fur a der vorherige Wert eingesetzt:
b=
2
Nach diesen Gleichungen ist es nur notwendig, die Summen derxw, yw, x w, xyw und w zu bilden, um b und LI auszurechnen. Fur die ungewichtete lineare Regression haben die Werte alle die gleiche Wichtung von 1 . Damit geht die Summe uber alle Gewichtsfaktoren w in die Anzahl der Werte II uber und es ergibt sich eine Gleichung, die u. a. in 1611 hergeleitet ist. Eine EXCEL-Maske, die die gewichtete (und ungewichtete) Regressionsberechnung einschlieOlich einer Graphik der Kalibriergeraden und der Abweichungen beinhaltet, kann von
[email protected] angefordert werden. Darin ist ebenfalls die Berechnung der Verfahrensstandardabweichungenthalten, wie in [ 321 als KenngroOe vorgeschlagen.
Praxis Erfolgt eine Mehrfachbestimmung des grol3ten und des kleinsten Wertes im Arbeitsbereich, so durfen sich dievarianzen um den Faktor 5 unterscheiden, damit sich auf dem 5 %-
Niveau noch kein signifikanter Unterschied ergibt. Das heifit. daB sich die Standardabweichungen nur um etwas mehr als den Faktor 2 unterscheiden durfen. Hat man z. B. in der Gaschromatographie mit manueller lnjektion einen dominierenden InjektionsvolumenFehler. so zeigt der F-Test bereits einen signifikanten Unterschied, wenn der Arbeitsbereich deutlich mehr als den Faktor 2 umfaBt. Fur diesen Fall kann man eine gleiche prozentuale Abweichung im Arbeitsbereich annehmen und eine l/y 2 Gewichtung ist angemessen (vgl. Abb. 3-47). Damit wiirde der prozentual gleiche Fehler, der bei hohen Konzentrationen eine weit gr6Rere Absolutabweichung ergibt auf etwa gleiche Abweichungen und Varianzen gebracht. Eine noch starkere Heruntergewichtung der Varianzen fur die hohen Konzentrationen ist unsinnig. Haufig wird man einen geringeren EinfluB von Volumeneffekten (auch: Probenvorbereitung) haben und mit einer I /y Gewichtung eine genugende Varianzenhomogenitat herstellen konnen.
Vuriarz,quotientenwichtiin~ Da man nach DIN sowieso die Varianzen am oberen und unteren Punkt des Arbeitsbereichs bestimmen soll, kann dieser Wert auch zur exakten Gewichtung herangezogen werden. Durch eine I/cX Wichtung wird der gebrochene Exponent so gewahlt, da13 die Varianzen gleich sind, d. h. der F-Test immer 1 ergibt. Damit ist auch keine Willkur mehr gegeben, sich fur I/c oder l/c2 entscheiden zu mussen. Um den Exponenten zu finden, mu13 nur der Logarithmus des experimentellen F-Wertes durch den Logarithmus des Konzentrationsquotienten (obere durch untere Konzentration des Arbeitsbereichs) geteilt werden. Auf diese Art werden die Varianzen so gewichtet, daB sie am oberen und am unteren Punkt des Arbeitsbereichs gerade gleich sind. Mit den nach den D1N-Richtlinien ermittelten Werten ist damit die bestmogliche Schitzung der Verteilung der Abweichungen moglich. Aus dem Ergebnis fur den Achsenabschnitt (I l%Btsich der Effekt der Gewichtung aufdie berechnete Gerade ablesen. Durch die hoheren Varianzen bei der hoheren Konzentration wird ein hoher MeBpunkt zu sehr und ein MeRwert fur eine geringe Konzentration zu wenig berucksichtigt. Dies fuhrt im Allgemeinen zu einem gro13eren Wert fur a. Nun sollte der Achsenabschnitt a moglichst nahe am Nullpunkt liegen. Urn sich dessen Bedeutung zu veranschaulichen, kann man das u nach der Geradengleichung in eine Konzentration ruckrechnen. Eine negative Konzentration, d. h. eine Parallelverschiebung der Geraden nach unten gibt physikalisch nur in Ausnahmefallen einen Sinn. Eine positive Konzentration fur u wiirde einem uberlagerten Systempeak entsprechen. der physikalisch moglich ist, aber durch eine Leerprobe ausgeschlossen werden kann. Auf jeden Fall sollte die dem Achsenabschnitt entsprechende Menge moglichst nicht grofier sein, als der Fehler des MeRwerts bei der kleinsten Konzentration. Damit ware er nicht von Null zu unterscheiden und miiRte nicht beachtet werden. Da die Abweichungen bei den unteren Konzentrationen mit der gewichteten Regression mehr und damit realistischer berucksichtigt werden, wird sich im Regelfall eine bessere Annaherung der Geraden an den Nullpunkt ergeben. Vie1 wichtiger ist aber, daB die Schatzung der Genauigkeit der ermittelten Werte realistisch ist. Unter der ublichen Voraussetzung der Varianzenhomogenit~twerden die hohen Werte zu exakt und die unteren Werte zu unexakt angegeben Das entspricht im Regelfall nicht den tatslchlichen (mel3baren) Gegebenheiten. Erst die gewichtete Regression liefert hier ein realistisches Bild.
3.7 Linearitut
,
1
Abb. 3-46 Homogene Varianmxieilung mit F = 1.
I Abb. 3-47 Varianzverteilung, dic durch cine l/c2 Gewichtung auqgeglichcn wird
183
Die dargestellte Methode ist generell anwendbar. Der Gewichtungsexponent sollte aber nur zwischen 0 und 2 liegen, weil Werte aul3erhalb dieses Bereichs kaum physikalisch erkliirbar sind. A priori sind die hlufig vorkommenden Probleme wlhrend einer Validierung mit dem F-Test ausgeschlossen. Er ist immer ideal erfullt. Es ist auch keine Entscheidung fur oder gegen die Gewichtung notwendig. Im Fall experimentell ermittelter gleicher Varianzen am oberen und unteren Punkt des Arbeitsbereichs geht die gewichtete Regression in die ungewichtete Regression uber, weil sich eine Gewichtung aller Werte von 1 ergeben muR. I n Abb. 3-46. ist ein Beispiel einer homogenen Varianzverteilung mit F = 1, d. h. gleichen Absolutwerten der Varianz dargestellt. (Aus Grunden der Darstellung wurden die Abweichungen mit 50 c/o unten und 10 c/o oben unrealistisch grofi angesetzt). Abbildung 3-47 zeigt eine Varianzverteilung, die durch eine I /c2Gewichtung exakt ausgeglichen wird. Sowohl am oberen, als auch am unteren Punkt des Arbeitsbereichs betriigt die Standardabweichung SO 5% des MeRwertes. Durch die Quadrierung der Abweichungen ergibt sich fur den Varianzquotienten ein F von 25 in einem 5-fachen Konzentrationsbereich. Der Exponent errechnet sich aus dem Quotienten des Logarithmus beider Werte zu 2.
3.8
Wiederfindung oder Wiederfindungsrate
3.8.1 Definitionen und Erlauterungen Die Wiederfindung oder Wiederfindungsrate ist das Verhiiltnis des unter Wiederholbedingungen gemessenen Mittelwertes zum richtigen Wert des Analyten in der Probe.
mit:
W Wiederfindungsrate in o/o x gemessener Mittelwert xR richtiger Wert
Der Idealwert fur W ist 100 %. Mit Hilfe der Wiederfindungsrate kann die gesamte Methode bewertet werden! Denn wird der Wert .rRtatsiichlich gefunden ( W = 100 %), so ist die Selektivitiit, die Richtigkeit und die Robustheit bewiesen - natiirlich nur fur diesr Konzentration, rliesr Matrix und iiberhaupt diese experimentellen Bedingungen. Eine hohe Wiederfindungsrate bedeutet, daR wiihrend siimtlicher Schritte der Methode keine nennenswerten Substanzverluste zu verzeichnen sind, eine wichtige Voraussetzung fur Spurenmethoden. Wird eine Wiederfindungsrate von beispielsweise 80 5% gefunden, so muRte der gefundene Wert mit dem Faktor 1,2S multipliziert werden. Sei es, dab der Substanzverlust von externem oder internem Standard ebenfalls 20 % betriigt; in diesem Fall ist Vergleichbarkeit gegeben, eine rechnerische Korrektur entfdlt.
3.8 Wiederfindung oder Wiederfindungsrate
I 85
3.8.2 Ermittlung der Wiederfindungsrate Analyse von zertifizierten Referenzmaterialien Steht ein zertifiziertes Referenzmaterial zu Verfiigung, so wird der zertifizierte Wert als richtiger Wert in die oben angegebene Formel eingesetzt. Zudosierungs- oder Aufstockungsexperimente (,,spiken" einer Probe) Einer Leerprobe (analytfreie Probe mit Matrix) oder einer ublichen Probe wird eine bekannte Menge einer Kalibriersubstanz zugesetzt. Diese Kalibriersubstanz ist in der Regel der Analyt selbst; sollte dies nicht moglich sein, kann eine dem Analyten moglichst ahnliche Substanz verwendet werden. Isotopenmarkierte Analyten werden immer seltener benutzt. Die Moglichkeiten im Einzelnen: 1. Leerprobe
mit:
W Wiederfindungsrate CgemessenGemessene Konzentration des zudosierten Analyten (Kalibriersubstanz!) CzugesetLt Zugesetzte Konzentration
2. Probe mit Analyt a) Es wird Analyt zugesetzt. Insgesamt werden drei Losungen hergestellt, die samtliche Schritte der Methode durchlaufen. Losung 1 : zu V 1 ml Probelosung V2 ml Kalibrierlosung geben, man erhiilt Signal Sl Losung 2: zu V 1 ml Probelosung V2 ml Losungsmittel geben, man erhalt Signal s2 Losung 3: zu V I ml Losungsmittel V2 ml Kalibrierlosung geben, man erhalt Signal S3 Die Wiederfindungsrate W errechnet sich folgenderrnal3en:
w = (Sl-S2)/S3 x
100
Hinweis
Es kann vorkommen, dal3 ein geringer Teil des Analyten aus der Kalibrierlosung an der Matrix sorbiert wird (Losung I). In diesem Fall ist S1-S2 nicht gleich S3 sondern kleiner, es wird eine kleinere Wiederfindung vorgetauscht.
b) Es wird eine dem Analyt ahnliche Substanz zugesetzt. Sie ist praktisch der interne Standard.
Mit
W Wiederfindungsrate S , Signal des internen Standards in der Probelosung S, Signal des internen Standards in der Kalibrierlosung, normiert auf die Konzentration des internen Standards in der Probelosung
lndirekt uber die Richtigkeit Wird die Richtigkeit durch Soll-/Is(-Werte uberpruft, so ergibt sich die Wiederfindungsrate durch die Steigung der Regressionsgerade. Massenbilanzierung Die Moglichkeit der Massenbilanzierung (Tests zur Ermittlung der einzelnen Probenbestandteile und Normierung auf 100 %) ist aufwendig und wird selten benutzt (s. Abschnitt 3.4.2.5).
3.8.3 Praktische Hinweise und Bemerkungen Der Wert des Aufstockverfahrens ist insofern begrenzt, als man damit nur die Richtigkeit der Stufen der Methode bestimmt, die der Aufstockung folgen [29]. - Der zugesetzte Analyt mu6 in der gleichen Form zugesetzt werden wie er vermutlich in der Probe vorliegt. - Die Wiederfindungsrate kann von der Analytkonzentration abhangig sein. Deswegen ist es wichtig, daB bei Vergleichtests der bekannte Gehalt in etwa dem Gehalt in der Probe entspricht. Gegebenenfalls ist durch Messungen mit unterschiedlichen Gehalten eine Wiederfindungsfunktion zu erstellen. Sie gibt die Abhangigkeit der Wiederfindungsrate von der Konzentration exakt wieder. Bei Zudosierexperimenten sol1 darauf geachtet werden, dal3 der lineare Bereich nicht uberschritten wird. Weiterhin d a d durch Losungsmittel keine Veranderung der Matrix oder Verdunnungsfehler (Volumenkontraktion) auftreten. Diese Probleme werden minimiert, wenn die Kalibriersubstanz so konzentriert wie moglich zudosiert wird. Desweiteren muB die Probe homogen sein. Die akzeptierte Wiederfindungsrate hangt naturlich vom Gehalt des Analyten ab. Als Beispiel einer Empfehlung (EPA) sind in Tab. 3- 16 Richtwerte fur Wiederfindungsraten in Pflanzenschutzmittelformulierungen in Abhangigkeit von der Wirkstoffkonzentration angegeben. -
3.9 Nachweis-, Bestimmungs- und Erjussungsgrenze
187
Tab. 3-16 Richtwerte fur Wiederfindungsraten in Abhangigkeit vom Wirkstoffgehalt in der Probe.
Wirkstoffkonzentration in %
akzept. Wiederfindungsrate
> 10
98,O - 102,O
1-10
97,O - 103,O
<1
95.0 - 105.0
Die Wiederfindungsexperimente sollten in funf Niveaus, vornehmlich von 80 % bis 120 % der Zielkonzentration durchgefuhrt werden. - Es sollte auch die irreversible Adsorption des Analyten, z. B. an einer chromato-
-
graphischen Saule uberpriift werden: Vergleich von PeakflachePeakhohe mit und ohne Saule. Eine Differenz von ca. 2 % kann noch akzeptiert werden. Bei den Wiederfindungsexperimenten sol1 peinlichst auf konstante experimentelle Bedingungen geachtet werden. Die Adsorption an Oberflachen ist ein sehr empflindlicher Vorgang und minimale Anderungen der Bedingungen konnen die Kinetik stark beeinflussen. Das ist z. B. bei Streatests zu beachten.
Wenn eine Wiederfindungsrate kleiner 100 % gefunden wird, so kann die erhaltene Differenz wie folgt beurteilt werden: Liegt der berechnete Wert innerhalb des Vertrauensbereichs des gemessenen? Fur ein Zahlenbeispiel zur Berechnung des Vertrauensbereichs siehe Abschnitt 3.4.3. Ermittlung der zwei Vertrauensbereiche, vom berechneten und gemessenen Wert. Anschlieaend Vergleich beider Werte nach dem ?-Test bzw. Priifung, ob der Vertrauensbereich des gemessenen Wertes den Wert 100 % einschlieat. Ein Zahlenbeispiel fur den &Test findet sich in Abschnitt 3.2. Liegt der gemessene Wert um mehr als der vierfache Variationskoeffizient vom Wert 100 entfernt, so gilt die Wiederfindungsrate als ausreichend. Beispiel Der Variationskoeffizient einer Methode sei 1,5 %, die Wiederfindung 95,70 %. Folglich betragt die Differenz: 100 % - 95,70 % = 4.30 %. Der vierfache Variationskoefizient berechnet sich zu: 4 . V , = 4 . I ,5 = 6. Da 4,3 < 6 k kann die Wiederfindungsrate als ausreichend akzeptiert werden.
3.9
Nachweis-, Bestimmungs- und Erfassungsgrenze
Der Autor lebte noch bis vor kurzem in der Annahme, daR mit diesen drei Begriffen die Verhaltnisse im untersten MeBbereich eigentlich zu beschreiben sind. Er ist eines Besseren belehrt worden. Folgende Begriffe werden im besprochenen Zusammenhang verschiedentlich zitiert:
Nachweiskriterium Nachweisgrenze - Nachweisvermiigen - qualitative Nachweisgrenze Bestimmungsgrenze Erfassungsgrenze - Erfassungsvermogen Erkennungsgrenze - Entscheidungsgrenze Quantifizierungsgrenze Kritischer Wert der MeRgroRe -
3.9.1 Definitionen und Erlauterungen I n Klammer unter dem Begriff ist die Quelle aufgefuhrt, in der dieser Begriff definiert ist. Der Text auf der rechten Seite ist nicht unbedingt identisch mit dem Text aus dieser Quelle! Nachweisgrenze (DIN 32645)
Bestimmungsgrenze (DIN 32645)
Kritischer Wert der MeRgroRe (DIN 32645)
Erfassungsgrenze (DIN 32645)
Kleinste nachweisbare Menge. Das ist nichts Anderes als die Entscheidung fur die Frage: Analyt vorhanden jdnein? Irrtumswahrscheinlichkeit SO %: SO % Leerwert, 50 c/o MeBwert. Altere. selten benutde Bezeichnuns: Nachweisvermiigen. Kleinste quantifizierbare Menge. Das ist die Menge, die mit einer vorgegebenen Richtigkeit und Priizision quantitativ erfal3t werden kann. Oft: dreifdche Nachweisgrenze. Sie sollte hochstens 50 % der unteren Spezifikationsgrenze betrdgen. MeBwert, bei dessen Uberschreitung unter Zugrundelegung einer definierten Irrtumswahrscheinlichkeit erkannt wird, daB die Menge des Analyten in der Probe griil3er ist als diejenige in der Leerprobe. Vereinfacht ausgedruckt: Das Signal, das der Nachweisgrenze entspricht. Mindestmenge, die mit vorgegebener Wahrscheinlichkeit nachgewiesen werden kann. Oft: Zweifdche Nachweisgrenze; sie liegt also zwischen Nachweis- und Bestimmungsgrenze. Die Erfassungsgrenze mu8 kleiner sein als der erste Kalibrierpunkt. Der Begriff ,,Erfassungsgrenze" wurde bis vor kurzem nur in Deutschland verwendet und ist in der DIN 32645 zu finden. SinngemaR identisch ist die ,,Entscheidungsgrenze". Er taucht zum ersten Ma1 auf der internationalen ,,Buhne" in der neuen I S 0 11843-1 auf, siehe weiter unten, sowie bei der IUPAC.
3.9 Nuchweis-, Bestimrniingv und Erfii:fsungsgrenze
Entscheidungsgrenze (Amtsblatt der Europaischen Gemeinschaften Nr. L 223 vom 1 1.08.1987)
189
Die Entscheidungsgrenze ist der geringste Gehalt des Analyten, der bei tatsachlicher Anwesenheit mit angemessener statistischer Sicherheit nachgewiesen wird und entsprechend den Kriterien der Methode identifiziert werden kann.
In der neuen I S 0 11843-1, first edition 1997, fur die es noch keine offizielle deutsche Ubersetzung existiert, heiBt es zu Nachweis- und Erfassungsgrenze:
Nachweisgrenze
Kritischer Wert der Nettokonzentration oder des Gehalts.
Erfassungsgrenze
Minimale detektierbare Nettokonzentration oder Gehalt.
Erkennungsgrenze DIN 55350
Signalwert, dessen oberer Abstand vom geschatzten Blindwert so groB ist, daB seine rein zufallige Uberschreitung durch einen MeBwert der Blindprobe unwahrscheinlich ist.
Quantifizierungsgrenze (Amtsblatt der Europaischen Gemeinschaften Nr. L 223 Bestimmung des Analyten mit einem angegebenen vom 1 I .08.1987)
Die Quantifizierungsgrenze ist der kleinste gemessene Gehalt, oberhalb dessen eine Ma13 an Richtigkeit und Wiederholbarkeit innerhalb eines Labors moglich ist.
Unterschiede in der Normenklatur: Funk [32]
Nachweiskriterium bei Funk entspricht dem kritischen Wert der MeBgroBe in DIN 32645. Nachweisgrenze entspricht der Erfassungsgrenze in DIN 32645.
DIN 55350
Erfassungsgrenze entspricht der Nachweisgrenze in DIN 32645. Erfassungsvermogen entspricht der Erfassungsgrenze in DIN 32645. Erkennungsgrenze entspricht dem kritischen Wert der MeBgroOe in DIN 32645.
IUPAC
Als “detection limit” wird bei IUPAC die Erfassungsgrenze definiert.
3.9.2 Ermittlung der Nachweis-, Bestimmungs- und Erfassungsgrenze -
Abschiitzung aus der Signalhohe Ausgehend von einer Leerprobe wird die Konzentration des Analyten stetig erhoht bis ein Signal eindeutig erkennbar wird. Oder umgekehrt: es wird mit immer kleineren Analyt-Konzentrationen ,,gespickt“ bis kein Signal mehr erkennbar ist. Letztere Vorgehensweise konnte zu Problemen durch Verschleppung fiihren.
- Fur die Ermittlung der Nachweisgrenze wird ein Sigtial/Rau.schVerhiiltnis von 3: I und
fur die Bestimmungsgrenze von 9: I (in der Literatur manchmal 10:I ) ernpfohlen. Das ist ein beliebtes Verfahren in der Chromatographie (Peak/Rausch-Verhaltnis). -
Blindwert- oder Leerwertmethode bzw. Blindwert-/Leerwertverfahren (direkte Methode )
rnit:
NWG Nachweisgrenze BSG Bestimmungsgrenze .yBllnd Achsenabschnitt der Kalibrierfunktion .sBllnd Wiederholstandardabweichung von 6 Leerwertproben
Man findet allerdings in der Literatur auch fur die Wiederholstandardabweichung die Angabe: Standardabweichung einer Probe nahe der Nachweisgrenze/bzw. Reststandardabweichung (aus den Werten fur die Kalibriergerade). Dam werden standardisierte Referenzproben verwendet rnit einer Konzentration. die 10 % bis 50 % kleiner ist als die niedrigste Konzentration der Kalibrierlosung. Das Argument hierbei ist, daO man rnit ,,echten" Probelijsungen eher mit einer Normalverteilung der Werte rechnen kann als rnit Leerwertproben. Als letzter und denkbar schlechtester Ausweg gilt die Messung von Losungsmittelproben. -
Kali brierverfahren oder Kalibriergeradenverfahren oder Kalibrierkurven-/Kalibriergeradenmethode (indirekte Methode) NWG = 3,3 . SR,I,](J S
mit:
BSG
=
l o .s B I ~ ~ ~ d s
.sBllnd Standardabweichung von vornehrnlich sechs (Empfehlung nach DIN
32645: zehn) Leerwertproben oder aber auch Reststandardabweichung der Werte fur die Kalibriergerade in der NIhe der Nachweis- bzw. Bestimmungsgrenze -
Es gibt eine Reihe weiterer Moglichkeiten zur Ermittlung von Nachweis-, Bestirnmungsund Erfassungsgrenze. Sie werden nachfolgend zusammengefaRt. Es werden die Formeln fur NWG und BSG angegeben, im erstgenannten Fall auch fur die Erfassungsgrenze
Erfassungsgrenze = xsllnd+ 6 ,sBllnd oder
3.9 Nuchweis-, Bestirnnzungs- und Erfussungsgrenze
19 1 oder oder
NWG = 3 . Blindwert, mit:
BSG = 10. Blindwert
Mittelwert aus (sechs) Blindwertmessungen (blanks, Leerwerte) sBllnd Standardabweichung bei der - vornehmlich (Empfehlung aus dem ,,orange book" von IUPAC) - 6-fachen Messung des Blindwertes (blank, Leerwert) s~~~~~~~~ Standardabweichung bei der vornhemlich 6-fachen Messung des Signalrauschens
XBlind
Die NGG bzw. BSG ist die Menge an Analyt, die jeweils den so errechneten Signalwerten zuzuordnen ist. - Menge in einer Verdunnungslosung (aus der Verdunnungsreihe einer Kalibrierprobe),
deren sechsfache Bestimmung einer gerade noch akzeptierten Streuung (z. B. V , = 10 oder 20 %) aufweist. Diese Empfehlung, die ursprunglich aus Kanada stammt, und von EURACHEM ubernommen wurde, geniefit immer mehr Akzeptanz.
3.9.3 Kommentare und Hinweise Leerwert- und Kalibriermethode Eine Voraussetzung bei der Bestimmung der NWG und BSG ist, daR die MeBwerte der Kalibrierproben normal verteilt und voneinander unabhangig sind. Noch sicherer ist, wenn sie an unterschiedlichen Tagen hergestellt und analysiert werden. Eine zweite Voraussetzung ist, daB im Bereich zwischen Leerwert und hochstem Kalibrierwert Varianzenhomogenitat besteht. Es empfiehlt sich, als hochste Konzentration nicht mehr als das IOfache der erwarteten NWG zu nehmen, z. B. 0,l bis 10 ppm. Je mehr der Auswertebereich nach hoheren Konzentrationen verschoben wird, um so mehr verschiebt sich auch der resultierende Mittelwert (Schwerpunkt) nach oben. Die Gefahr dabei ist, dal3 die erhaltenen Werte fur NWG/BSG zu hoch sind und die Fahigkeit des Verfahrens fur diesen unteren Spurenbereich unterschatzt wird. In der Praxis werden oft zwei Kalibriergeraden aufgenommen oder zumindest zwei Konzentrationsbereiche fur sich getrennt betrachtet. Der Eine zur Ermittlung der Linearitat und der Andere zur Bestimmung von NWG und BSG. Als dritte Voraussetzung gilt, dal3 der Verlauf der Kalibrierfunktion linear sein muR, zu den Linearitatskriterien gerade im Spurenbereich siehe Abschnitt 3.7.2.7. Zur Priifung, ob die errechnete NWG plausibel ist, sollte diese Konzentration synthetisch hergestellt und mehrfach bestimmt werden. Der ,,validierte" Wert fur die NWG/BSG ist der tatsachlich gemessene Wert bei Anwesenheit der Matrix!
Die NWG(BSG) nach dem Blindwert- und Kalibrierkurvenverfahren sind recht iihnlich. wiihrend die Erkennungsgrenzen deutlich differieren. Dies ruhrt daher, daB Blindwerte bei zeitlichem Abstand weitaus schwerer zu reproduzieren sind als Standardabweichungen und Steigungen von Kalibriergeraden. Peak/Rausch-Verhiiltnis Bei der Bestimmung des Peak/Rausch-Verhaltnissesin der Chromatographie sollte zur Ermittlung des Rauschens etwa die zehnfache Peakbreite genommen werden. Das PeakRausch-Verhiiltnis hangt stark von dem aktuellen Zustand einer Anlage und den experimentellen Bedingungen ab, z. B. Detektor, Reinheit von Losungsmitteln, Temperatur usw.
3.9.4 AbschluBbemerkungen und Empfehlungen -
Wenn aus regulatorischer Sicht keine Notwendigkeit existiert, durfte in der Praxis fur quantitative Bestimmungen die Ermittlung der BSG, fur qualitative Aussagen die der NWG ausreichend sein. Dies kann durch die Definition der Nachweisgrenze begriindet werden. Nachweisgrenze ist als diejenige Analytkonzentration definiert, deren 9.5 c/c Prognosebereich sich nicht mit dem Blindwert (X = 0) uberschneidet. Da der Blindwert ebenfalls eine statistische Hiiufigkeitsverteilung aufweist, ergibt sich eine 500/ige Uberschneidung beider Verteilungskurven und damit ein Fehlerrisiko von 50 %. Somit ist nur eine qualitative Aussage moglich. Die Bestimmungsgrenze ist definiert als diejenige Analytkonzentration, deren 9.5 % Prognosebereich sich nicht mit dem 95 9% Prognosebereich des Blindwertes (X = 0) uberschneidet. Damit ergibt sich ein fur quantitative Aussagen hinreichendes Fehlerrisiko von 5 %. Interessanterweise ist in der neuen IS0 11843-1 nur von der Nachweis- und der Erfassungsgrenze die Rede, der Begriff ,,Bestimmungsgrenze" fehlt giinzlich. Genau s o verhiilt es sich bei der I S 0 Norm 17025 Abschnitt 1.2.1. Der Grundgedanke der Verfasser ist vereinfacht ausgedruckt der Folgende: Mit der Nachweisgrenze als erstem ,,Vet-dachtsmoment" fur das Vorhandensein des Analyten und der Erfassungsgrenze als ziemlich sichere Information (2fache Nachweisgrenze, lrrtumswahrscheinlichkeit nahezu Null) ist alles an primiiren Begriffen, die notwendig sind, gegeben. Bestimmungsgrenze ist letzten Endes nichts anderes als eine erweiterte MeRunsicherheit: Empfehlung der DIN 32645, 533 %, Empfehlung der IUPAC, k10 %. Das heiRt konkret, daB der Anwender den Vertrauensbereich fur die Nachweisgrenze bestimmen kann und ihn als prozentualen Wert fur die Bestimmungsgrenze angeben kann. Der Vorteil ist dabei, daO man tlexibel ist, der angegebene Wert kann der Situation angepaBt werden. I m Pharmabereich sind 10 % sicherlich akzeptierbar, im Umweltbereich sind eher die DIN-Empfehlungen von 33 % praxistauglicher. Folgende Mindestforderung gilt fur den ersten, niedrigsten Punkt der Kalibriergeraden [62]. .r
-
2 V,(X) > 0
3.9 Ntrchweis-, Bestimmungs- und Erfir.ssungsgrenze
mit:
193
kleinste Analytkonzentration V,(x) Vertrauensbereich von n
x
Diese Zusammenhange werden in Abb. 3-48 und 3-49 graphisch dargestellt [62]. Die Nachweisgrenze entspricht dem Punkt x in Abb. 3-48, die Erfassungsgrenze ist die zweifache Nachweisgrenze (gestrichelte Linie). Diese Konzentration ist nichts anderes als der zweifache Vertrauensbereich der Analytkonzentration x. Einfach ausgedruckt: Unterhalb dieser Konzentration und bis zur Nachweisgrenze ist man ,,ziemlich" sicher, daB der Analyt wirklich vorhanden ist, Punkt 1, Abb. 3-49. Erst oberhalb dieser Konzentration und zwar fur die Bedingung x - 2 . V e ( x ) > 0 sind quantitative Aussagen erlaubt. Wo Punkt 2 in Abb. 3-49 liegen soll, also was als Bestimmungsgrenze definiert wird, sollte der Analytiker nach der konkreten Fragestellung entscheiden.
I
2* v0
X
Konzentration
Abb. 3-48 Nachweis- und Erfassungsgrenze nach DIN 32645.
Konzentration Abb. 3-49 Erfassungs- und Bestirnrnungsgrenze.
-
Unabhangig vom ausgewahlten Verfahren gebuhrt dem EinfluB der Matrix hochste Aufmerksamkeit. Wenn dieser Konzentrationsbereich tatsachlich von Relevanz ist, sollten vor einer endgultigen Weitergabe der ermittelten NWGBSG ausreichende Robustheitsexperimente durchgefuhrt worden sein. Ohne auf weitere Details einzugehen seien hier einige Fragen aufgefuhrt, die ggf. zu klaren waren: Das Verhaltnis Peakhohe/Peakbreite ist in der HPLC konstant, bei kleiner werdenden Peaks jedoch nimmt es ab. Dieser Effekt ist stark matrix-abhangig. Wird nun die Peakhohe gemessen, gilt zu prufen, ob die BSG tatsachlich als die dreifache NWG angenommen werden darf. Vielleicht ist gerade in diesem Bereich die Krummung der Kalibriergerade starker, obwohl die Varianzenhornogenitat gegeben ist. Kann man damit rechnen, daB das Verhaltnis Matrix/Analyt konstant bleibt? Wenn nicht, sollten eventuell zwei getrennte Verdunnungen erfolgen. In der Chromatographie ist die Kinetik und damit die Peakhohe - durch irreversible Sorption auch die Peakflache - mengenabhangig. Das fuhrt zu einer starken Streuung der Werte in diesem Bereich. Der Vorschlag von Eurachem, die NWG/BSC uber die individuell akzeptierte Streuung der erhaltenen Werte zu ermitteln ist ein praxisnaher Ansatz.
Welches Verfahren ist vorzuziehen? Die Ermittlung uber das PeakRausch-VerhAtnis ist in der Chromatographie sehr verbreitet und es wird von Behorden (noch) akzeptiert. Dennoch sind Ergebnisse aus oben genannten Grunden nicht immer vergleichbar. - Die Blindwert- und Kalibrierwertverfahren werden von vielen Softwareprograrnrnen unterstutzt, sind leicht anwendbar und als ,,offizielle" Verfahren genieBen sie eine hohe Akzeptanz. Das Blindwertverfahren liefert etwas kleinere Werte als das Kalibrierwertverfahren. - Das Verfahren uber den noch akzeptierten V , ist ein gutes Verfahren, denn es werden quasi alle Faktoren, die die NWG/BSG beeinflussen, berucksichtigt. Es kann an die aktuelle Fragestellung angepaat werden. Der Nachteil dabei ist, daB es durch eine evtl. groBe Anzahl von Verdunnungsschritten recht aufwendig ist. Ein ebenso pragmatischer Ansatz ist die Angabe der Bestimmungsgrenze uber den individuell akzeptierten Vertrauensbereich. -
Mit dem Ziel, nicht mehr als notwendig zu tun, kann sich der Aufwand fur die Prufung der aktuellen Notwendigkeit anpassen. Man konnte sich folgende Vorgehensweise beispielhaft vorstellen: Befindet man sich in einem fruhen Stadium der Methode oder geht es um eine ,,quick and dirty" Fragestellung, reicht durchaus, die Nachweisgrenze uber das PeakRauschVerhaltnis oder uber den dreifachen Blindwert zu berechnen. Erst spater, wenn der Bedarf ansteht (der Kunde hat nach den ersten Vorversuchen den Auftrag tatsachlich erteilt und es mu13 ein Validierungsbericht abgegeben werden, die Methode sol1 nun eingereicht werden, der Termin fur die FDA-Inspektion steht fest usw.), sollten statistisch abgesicherte Werte ermittelt werden: Anwendung des Kalibrierwert- oder Leerwertverfahrens.
3.11 ProzeJ- und Merhodenfihigkeit
195
Tab. 3-17 Zielsetzung, Probe und empfohlener Arbeitsbereich fur die Pharmaindustrie (ICHEmpfehlung). Test
Arbeitsbereich
Gehalt (Wirkstoff und Arzneiform)
80- 120 % der Zielkonzentration
Gleichformigkeit des Gehaltes (content uniformity)
70-130 % der Zielkonzentration
Freisetzung
*20 % OSG/USG
Nebenprodukt
Spezifikation - 120 % der Spezifikation
Nebenprodukt, Arzneiform
ab 0,5 % bei Tagesdosis < 1mg ab 0,25 % bei Tagesdosis < 1-10 mg ab 0,l % bei Tagesdosis 10 mg - 1 g ab 0,05 % bei Tagesdosis > 1 g
Gehalt und Reinheit zusammen
Spezifikation Nebenprodukt - 120 % der Gehaltspezifikation
3.10 Arbeitsbereich Der Arbeitsbereich ist der Konzentrationsbereich des Analyten in der Probe (unterelobere Grenze) mit einem akzeptablen MaR an Prazision, Richtigkeit und Linearitat. Dieser kann aus der Linearitat abgeleitet werden. Der Arbeitsbereich hangt direkt von der Prazision der Methode ab: je praziser eine Methode ist, um so strengere Kriterien gelten fur die Linearitat und demnach desto geringer ist der Arbeitsbereich. Die Angabe des Arbeitsbereichs in einem Validierungsbericht ist insofern eminent, als Richtigkeit, Prazision, Selektivitat und Robustheit der Methode von der Konzentration abhangen. Richtigkeits-, Prazisions- und Robustheitsangaben ohne gleichzeitigen Bezug auf eine Konzentration sind nicht brauchbar. Laut ICH, fur den Pharmabereich maagebend, gelten folgende Arbeitsbereiche abhangig vom Testzweck [63], siehe Tab. 3- 17. Da der ,,Gehalt" nur in Bereichen wie Pharma, Pflanzenschutz, Kosmetik, Lebensmittel relevant ist, spielt der Arbeitsbereich nur dort eine Rolle. In anderen Bereichen reicht meist eine Grenzwertangabe aus: Nicht grofierkleiner als ,,x".
3.1 1 ProzeB- und Methodenfahigkeit 3.1 1.1 Definitionen und Erlauterungen ProzeBfahigkeit liegt vor, wenn die Streuung eines (Produktions)Prozesses im Vergleich zu den Spezifikationswerten gering ist. Als MaB werden Fahigkeitsindices verwendet, sie verknupfen die Streuung von Priifergebnissen mit den Forderungen.
Analog spricht man von der Methodenfiihigkeit. Die Methodenfiihigkeit gibt Aufschlufi, in wie weit die durch die Methode verursachte Streuung mit den gestellten Forderungen konform ist. Methodenflhigkeit ist somit das Verhiiltnis der vorgesehenen Spezifikationsgrenzen zu der tatsiichlichen Streuung der Methode. Allgemein gilt:
"p
mit:
~
Toleranzbreite Prozefibreite
-
OSG - USG 6s
ProzeRfahigkeitsindex OSG Obere Spezifikationsgrenze USG Untere Spezifikationsgrenze cp
Fur eine Methode gilt entsprechend cM.Der Fuhigkeifsindexc,,/cMsollte demnach mindestens 1 sein. weil in diesem Fall die Streuung der Produktion/Methode genau zwischen den Spezifikationsgrenzen liegt. Oft ist zwar die Rede von der Methodenfiihigkeit, als Symbol wird aber statt ,,cM",.,cp'' verwendet. Warum ist die Kenntnis von cMwichtig? Es ist von elementarer Bedeutung, die Qualitat von Produkten gem28 Spezifikationen zu beurteilen. Zur Ermittlung der Prozefifiihigkeit z. B. eines Herstellprozesses werden nun Merkmalswerte ermittelt und diese zu den Forderungen in Beziehung gesetzt. Merkmalswerte werden allerdings durch Prufmethoden ermittelt. Die Mefigenauigkeit der Prufmethode beeinflufit folglich die Aussage iiber die ProzelJfiihigkeit. Wenn die Prufmethode zu sehr streut, konnen falsche Ruckschlusse auf die ProzeBfiihigkeit gezogen werden. Auf diese Problematik werden wir weiter unten eingehen. Die ProzeBfahigkeit bezieht sich immer auf eine routinemiifiige Anwendung der Methode. Und sie kann nur ermittelt werden, wenn fur den betrachteten Zeitraum der analytische ProzeB in statistischer Kontrolle (ISK) ist. Die Methodenfiihigkeit (auch .,Methotlrripotential" und in der Fertigungsindustrie ,,Muschinrnfiihih.keit" genannt) wird in einer Kurzzeituntersuchung ermittelt. cMist n u n eine aussagefiihige GriiDe nur fur mittenzentrierte Prozesse. Der korrigierte Fiihigkeitsindes c~~ berucksichtigt dagegen eine Verschiebung des Mittelwertes und ist daher vorzuziehen.
cMK
mit:
=
OSG - X h 3s
oder
C,,
=
.Yh -
USG
3s
.q, Beiugwert, z. B. Mittelwert cMK
ist bei mittenzentrierten Prozessen gleich cM
3. I I Pmzejl- und Methodenfiihigkeit
197
Abbildung 3-50 gibt diese Zusammenhlnge graphisch wieder [64]. Es geht um Bogenschiel3en. In Abb. 3-50 sind Zielscheiben mit Punkten fur die Treffer von 4 Bogenschutzen skizziert. Daneben ist in Form einer Haufigkeitsverteilung dargestellt, wie die entsprechende Verteilung der Treffer, bezogen auf das Ziel, aussieht und welchen Wert die zugehorigen Flhigkeitsindices haben. ProzeRfahigkeit
-X
USG
Bogenschutze 1
OSG
ProzeR 1
USG ?
Bogenschutze2
ProzeR 2
-X
USG
Bogenschutze3
OSG
OSG
ProzeR 3
I
1
I/ Cpk = 0.4
~
USG
Bogenschutze4
USG = Untere Spezifikationsgrenze
ProzeR 4
OSG i
OSG = Obere Spezifikationsgrenze
Abb. 3-50 Zusamnienhang zwischen Streuung, Lage des Mittelwertes. Spezifikationsgrcnzc und Methodenfihigkeit [64], Erlautcrung siche Text.
3.1 1.2 Beispiele Zwei Beispiele sollen n u n der Erlauterung dienen. Zurn Einen geht es um den Zusarnmenhang Spezifikationsgrenze, Standardabweichung und Methodenfahigkeit. Das zweite Beispiel befaljt sich mit dem Unterschied zwischen Methodenfahigkeitsindex und korrigiertem Methodenfahigkeitsindex. Wie soeben dargestellt ist der Fahigkeitsindex cM ein Kriterium fur die Eignung (FBhigkeit) einer Methode. Verkniipft er doch die Streubreite von Ergebnissen mit Spezifikationsforderungen. Nehmen wir an, daR zwei Methoden beispielsweise den gleichen cM-Wert von cM= 1,3 haben. Sind beide Methoden automatisch gleich ,,gut"? Nicht unbedingt. Dazu folgendes Zahlenbeispiel:
a) Die Spezifikationsforderung fur eine Gehaltsbestimmung ist 98 o/o bis 102 %. Bei der ersten Methode betragt die Standardabweichung s = 0,5, dernnach ist CM =
OSG-USG 6s
-
102-98 4 - 1,3 6 . 0.5 3
Die zweite Methode weist die doppelte Standardabweichung auf, niimlich s = I , demnach ist
CM
=
OSG-USG 6s
-
102-98 6.1
-
4 6
-
0,67
Der Vergleich fuhrt zu der Aussage, daR die zweite Methode ungeeignet ist: Die Werte streuen stark, sie ist zu unpriizise. Wenn man die Spezifikationsgrenzen der zweiten Methode auf die Werte 96 o/o bis 104 o/o festlegt, ergibt sich fur die zweite Methode ebenfalls ein cM-Wertvon 1,3.
CM =
OSG-USG 6 .s
-
104-96 6.1
-
8 6
-
1.3
Durch eine harmlos anrnutende ,,Anpassung" oder ,,Optimierung" von Speziiikationsgrenzen kann eine Methode ..fahig"gernacht werden. ... Positiv ausgedriickt: Eine kleine Ausweitung von Spezifikationsgrenzen (durch die die Qualitat des Produktes nicht unbedingt leiden rnuR!) erlaubt, mit dieser Methode weiterhin zu arbeiten, die sonst f u r den vorliegenden Fall als unfiihig zu bezeichnen ware. b) Werden Fiihigkeitsindizes zur Beurteilung einer Methode herangezogen, so eignet sich dafur nur der korrigierte Fahigkeitsindex. Auch hier sol1 ein Zahlenbeispiel der Verdeutlichung dienen:
3. I I ProzeJ- und Methodenfihigkeit
199
Spezifikationsgrenze: 98 % bis 102 %, s = 0,5 Dazu betrachten wir die zwei Falle, daB der Mittelwert in der Mitte der Spezifikationsgrenze (100) liegt und daB er naher an der unteren Spezifikationsgrenze (99) liegt. Irn ersten Fall gilt: CM
=
OSG - USG 6s
CMK =
x,, - U S G
3s
-
102 - 98 - 1,3 und 3
2 - 100-98 - -
3 . 0,5
13
1,45
1
... und irn Zweiten: CM =
CMK
102 - 98 OSG - USG = 1,3 und 6s 3
=
x,, - U S G
3s
-
99-98 - 1 - 0,67 3 . 0,5 1,5
Wahrend der cM-wertin beiden Fallen 1,3 betragt, ist der CMK-Wert im ersten Fall 1,45, irn zweiten Fall nur 0,67; die zweite Methode ist nicht akzeptabel. Bei der zweiten Methode haben wir bei einer Streuung der Werte von k3 s um den Mittelwert folgendes Ergebnis: k3 . 0,5 = +1,5 urn den Wert 99, also von 97,5 bis 100,5.2,28 % der statistischen Werte befinden sich unterhalb der unteren Spezifikationsgrenze von 98 %, das ist irnmerhin ca. jeder 40. Wert. Sornit ist nur der cMK-Werteine aussagefahige KenngroBe, da er irn Gegensatz zum cMWert beriicksichtigt, wenn ein Mittelwert nicht in der Mitte der Spezifikationsgrenzen liegt. Das bedeutet, der CMK-Werterlaubt eine Aussage iiber Streubreite und Lage des Mittelwertes der betrachteten Methode relativ zu der am nachsten liegenden Spezifikationsgrenze. Zur Veranschaulichung siehe Abb. 3-50 und 3-51. Genaueres zur Problematik von Analysenergebnissen in der Nahe der Spezifikationsgrenze siehe [65].
1
OSG
99 98
USG
Abb. 3-51 h e r die VerlaRlichkeit von Daten innerhalb der Spezifikationsgrenze.
3. I 1.3 Akzeptanzkriterien, Bewertung von Prozessen und Methoden Es liegt aufder Hand, dalj Prozesse (oder auch Methoden) mit cp < 1 ungeeignet aind, denn dies bedeutet ja, daB die Streubreite des Prozesses griiljer ist als der Bereich zwischen unterer und oberer Spezifikationsgrenze. cp= 1 bedeutet, dalj der ProzeB zwar innerhalb der Spezifikationsgrenze streut, die ProzeljfBhigkeit ist allerdings eingeschrgnkt. es ist einfach kein ,,Puffer" da. Ein Prozelj wird ab einem c,-Wert von I ,33 als sicher angesehen. Wo kommt die ,,1,33" her? Ein ,,Puffer", eine ..Sicherheitszone" von 1 s zwischen der Streuung des Prozesses und der oberen bzw. unteren Spezitikationsgrenze wird allgemein als ausreichend angesehen. Bei einer konventionell akzeptierten Streuung von +3 s (die Wahrscheinlichkeit ist 99,73 ?h, dal3 der Wert in einem Bereich von 13 s anzutreffen ist) ,,darf' der ProzeR um k4 s streuen. bzw.
-[-)
f 4 . s 8 = 1,33 k3.s 6
Zusammengefaljt heil3t es wie folgt: cp> 1,33 Proze6 sicher (Abb. 3-S2a [65]) I < cp < 1,33 ProzeB ziemlich sicher (Abb. 3-S2b [6S]) CP < 1 Prozelj unsicher (Abb. 3-S2c [6S]) Das alles gilt, es sei erlaubt es noch einmal zu betonen, fur ISK-Prozesse. Wird der Mittelwert verschoben, so ist der ProzeBldie Methode trotz eines Fiihigkeitsindeces von > 1.33 nicht ,,fBhig". Das wird graphisch in Abb. 3-53 demonstriert [28]. Bei einem konstanten c,,Wert von 1,66 (10s : 6s) ergeben sich durch die Mittelwertverschiebung immer kleinere cp,-Werte. Eine stete, leichte Verschiebung des Mittelwertes ist trugerisch und stellt eine grolje Gefahr im Laboralltag dar: Die Standardabweichung bleibt konstant und der gefundene Mittelwert Bhnelt weiterhin dem Referenzwert. Kein Wunder, denn auch der Referenzwert verschiebt sich! Solche und weitere Bhnlich diffizile Situationen kann man mittels Regelkarten erkennen (s. Kapitel 8). Bei solchen ProzessenMethoden ist es eine Glucksache, ob der aktuell ermittelte Wert und der nkhste und der vom nlchsten Tag gerade unterhalb oder oberhalb der Spezifikationsgrenze sich befindet. Das Ergebnis sind unprazise Werte, die nicht nachvollziehbar sind. N u n zuruck zur Methodenfghigkeit. Diese Forderung ist fur die Produktanalytik, d. h. dort, wo Spezifikationsforderungen vorgegeben sind, eminent. Wenn ,,Methodenfiihigkeit" wiirtlich genommen wird, so sollte ein cMvon kleiner ca. 2 nicht akzeptiert werden, solche Werte bedeuten eine nicht akzeptable Streuung der Methode von ca. 50 c70 innerhalb der vorgegebenen Spezitlkationsgrenzen. Erliiuterung Eine analytische Methode in der Produktanalytik hat die Aufgabe, einen ProduktionsprozeR zu uberwachen. Das bedeutet, zu prufen, ob bei ungewollten (oder gewollten) etwaigen Anderungen der Herstellbedingungen - und damit niiiglicherweise verbunden eine Anderung von relevanten Produkteigenschaften - die Spezifikationsforderung immer noch ein-
3. I I ProzeJ- und Methodenfahigkeit
20 1
Stetiqe Qualitatsverbesserung Zuku nft
Stetiae Qualitatsverbesserung Zur Zeit
Spezifi kationen
Spezifikationen
Charakteristik
Charakteristik
Abb. 3-52a Der ProzelJ ist sicher; die schraffierte Flache gibt den ,,Puffer"zwischen Streuung des Prozesses und Spezifikationsgrenze wieder.
*
Abb. 3-52b Der ProzeB ist ziemlich sicher; trotz einer groaeren Streuung des Prozesses sind die Spezifikationsgrenzen ,,weit" genug entfernt.
Stetiae Qualitatsverbesserung Vergangenheit
I---
Spezifikationen +I- 3s
Charakteristik
Abb. 3-52c Der Prozel!, ist unsicher, denn die Streuung ist griiRer a k der Bereich, der der Spezifikationcforderung entspricht.
Prozesfa higkeit
Verteilungskurve
Cpk
cP
+a=
% aui3erh Spez.
< 1.0
Toleranzbreite
1121L
=
l,o
Toleranzbreite
> l,o
Toleranzbreite
USG I,66
0,003
1,33
--
~
USG 1.66
1,o
0,14
0,67
2,28
0.33
16,O
0.0
50,O
USG
1 USG
1.66
1
.~
USG
1
1,66
.-
~
USG
1,66
Abb. 3-53 ProA3fahigkeit und Mitrelwertvrrsc~hiebung.
-0,33
84,O
3. I I Prozej- und Methodenfahigkeit
203
gehalten wird. Um eben eine Streuung des Prozesses uberpriifen zu konnen, darfdie Streuung der Werte durch den MeRvorgang selbst nicht ,,zu" stark sein. 1st es dennoch der Fall, so wurde man streuende Werte einem streuenden ProzeR zuschreiben, die Streuung der Werte jedoch rtihren in Wirklichkeit von der unprazisen Methode her. Die Methodenstreuung sollte hochstens 25 bis 30 % der erwarteten Streuung des (Produktions)Prozesseseinnehmen. Das heiBt, die ProzeRtoleranz (Abstand zwischen USG und OSG des Produktes) sollte ungefahr das vierfache der durch die Methode bedingten Streuung sein: Eine Streuung von +3 s bedeutet eine Gesamtstreuung von 6 s. Wenn nun die Streuung der Methode in etwa 25 bis 30 % der ProzeRtoleranz ausmachen sollte, so miil3te die ProzeBtoleranz 24 s betragen:
Die Streuung eines Wertes um +3 s, also insgesamt 6 s, entspricht 25 % von 24 s.
Beispiel Bei einer Spezifikationsgrenze von 98 bis 102 % und einer Standardabweichung, s,von 0,2 hatten wir: CM =
CM
=
OSG - USG 6s
102-98 4 6 . 0,2 1,2
2
cp = 3,34
Die Streuung von 6 s, gleich 1,2, entspricht 30 % des Spezifikationsbereichs von 4 (98 bis 102). Bei einern s-Wert von 0,3 hatten wir: 102-98 6 . 0,3
CM==--
-
4 1,8
s
CM =
2,2
Die Streuung von 1,8 entspricht ca. 45 % der vorgegebenen Spezifikation von 4 (98 bis 102). Was zeigen diese Beispiele? Es sei noch einmal das anvisierte Ziel wiederholt: Die Streuung einer Methode sollte bis ca. 30 % der vorgegebenen Spezifikationsgrenzen einnehmen (s. auch Abschnitt 5.2). Nur in einem solchen Fall befindet sich der Gesamtpro-
zeR innerhalb der Spezifikationsgrenzen, wenn j a eine eventuelle Streuung der Produktion zu der Streuung der Methode hinzukiime. DaB die Streuung einer Methode im Vergleich zu den Spezifikationsforderungen des Produktes gering sein muB, leuchtet sicherlich ein. Es ist jedoch in der Praxis kaum realisierbar, Methoden mit einer Streuung von s-OJ zu finden, was bei einer Spezifikationsforderung 98 his 102 %, wie im obigen Beispiel dargestellt, notwendig wiire. Patentlasungen fur dieses Dilemma gibt es leider nicht. Man sollte Werte auBerhalb der Spezifikationsgrenze nicht all ,,zu Ernst" nehmen - wir erwarten ja solche bei einer unfiihigen Methode! Arbeitet man mit unprazisen = unfiihigen Methoden, so mu8 man leider hiiufige Wiederholungen und hin und wieder die Bearbeitung von Reklamationen hinnehmen. Nachfolgend werden einige Mafinahmen vorgeschlagen, die ersten zwei sind die Effektivsten, siehe auch Abschnitt 5.2.
3.1 1.4 Mafinahmen bei unzureichender Methodenfahigkeit zu kleine cMK's -
-
-
-
-
-
Wenn dem Labor die Miiglichkeit gegeben wird, sollte es zusammen mit der Produktion/Kontrollbehorde realistische Spezifikationsforderungen formulieren. 1st cMK< cM,handelt es sich um einen NISK (NISK: Nicht In Statistischer Kontro1le)Prozek Hier besteht unbedingt Handlungsbedarf. Ein hervorragendes Werkzeug zur Verfolgung und Optimierung von Prozessen ist die statistische ProzeRkontrolle, SPC. Es sollte noch einmal uberpriift werden, oh der Mittelwert richtig ermittelt wurde. Zufillige Fehler sollen durch Verbesserung der Priizision, beispielsweise durch robustere Methodenbedingungen, minimiert werden oder es ist auf eine andere, priizisere Methode zuruckzugreifen. Es sol1 ein interner Standard verwendet werden; das ist zwar keine ..Losung". erhoht aber die Sicherheit der Aussage bei unpriizisen Methoden. In einem Betriebslabor ist eine OOS-Situation alle 10-20 Chargen durchaus tolerierbar. Tritt bei einer priizisen Methode diese Situation hiiufiger ein, so sollte als erstes gepriift werden, oh die Geriite aus dem Betriebslabor die gleiche Priizision aufweisen wie die Geriite in der Entwicklungsanalytik.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
4
Haufige Fragen zur Validierung
4.1
Ermittlung der interessantesten Fragen
Welche Fragen uber Validierung beschaftigen am starksten die Anwender? Diesem Thema ist der Autor nachgegangen: In Seminaren uber Validierung in der Analytik wurden die Teilnehmer nach den fur sie drei, vier wichtigsten Fragen bzw. Themenbereiche befragt, die im Seminar intensiver behandelt werden sollten. Es wurden die Antworten von ca. 340 Teilnehmer ii ca. 3 Fragen, das entspricht ca. 1000 Fragen, aus Veranstaltungen in den Jahren 19961999 ausgewertet. Es erfolgte zunachst eine Zuordnung der Fragen in Themenbereiche und anschlieBend eine Gewichtung nach der Haufigkeit der angegebenen Fragen, siehe Abb. 4- 1. Aus Abb. 4- 1 wird folgendes ersichtlich: Von den unten aufgefuhrten sieben Themenbereiche waren die ersten zwei fur die Befragten mit Abstand die wichtigsten gewesen. Die sieben ermittelten Themenbereiche sind folgende (die Nummerierung entspricht den Ziffern in Abb. 4- 1 ):
loo0 800
I
700
Anzahl der Fragen
600 500
(Mehrfachnennung moglich) 400
300 200 100
0 1
2
3
4
5
6
7
Abb. 4-1 Haufigkeit von Fragen zur Validicrung nach Themen sortiert, Erliuterung siehe Tcxt
1. ,,W-Fragen" aus dem Validierungs-Alltag: z. B. ,,Wer legt den Validierungsumfang fest?" ,,Was ist wirklich notwendig?" ,,Wie oft mu13 ich validieren?" ,,Wann brauche ich uberhaupt Validierung?" usw. 2. Es besteht ein starkes Bedurfnis fur eine genaue Erlauterung der einzelnen Validierungselemente und Tips fur deren Ermittlung z. B. ,,Was ist eigentlich Prazision, Nachweisgrenze, ... und wie bestimme ich sie?" 3 . Problem: Mangelnde Zeit fur Validierungsarbeiten; .,Wie kann ich Zeit sparen?" Geld spielt in diesem Zusammenhang offensichtlich eine untergeordnete Rolle. 4. Behordliche/rechtliche Anforderungen? 5. Gibt es Hilfen fur mich? 6. Zum Teil sehr detaillierte Fragen zum Validierungsumfang abhangig a) vom installierten oder beabsichtigten QM-System b) von der Methode c ) von der analytischen Fragestellung. 7. Sonstiges; hierunter fallen sehr unterschiedliche Fragen zur Dokumentation, MalJnahmen in ,,out of spec"-Fallen, Anzahl der Einwaagen, Grenzen der Validierung usw.
4.2
Antworten auf die sieben wichtigsten Fragenkomplexe
Nachfolgend wird versucht, sehr knapp auf typische, Fragen zu antworten, b7w. es wird auf die entsprechende Stelle im Buch verwiesen. Ein Teil der Antworten stammt von Wolfgang Gottwald, Provadis, und Dr. Joachim Ermer, Aventis. Bei den Fragen handelt es sich um Zitate. 1. a) ,,Was ist der Mindestumfang einer Validierung?"
,,Was ist notwendig festzulegen und was bleibt dem einzelnen Labor als Spielraum?" .,Was rnuP unbedingt gemacht und auf was kann verzichtet werden?" Zu diesen Fragen heiBt es in der I S 0 17025: ,,Die Validierung mu13 in dem Umfang durchgefuhrt werden, der zur Erfullung der Erfordernisse der beabsichtigten Anwendung oder des betreffenden Anwendungsgebiets notwendig ist". Das bedeutet nichts anderes als daB das Labor, ausgehend vom Validierungszweck, selbst Umfang und Vorgehensmodus bestimmen kann und sollte. Soweit zum analytischen Aspekt und zum Geist der IS0 17025. DaR Inspektoren, nationale Behorden und Verbiinde oft den Umfang direkt oder indirekt stark oder ausschliel3lich bestimmen, ist eine hautige Praxis. Auf diese Problematik wird in Kapitel 7 eingegangen. b) ,,Wofur benotige ich die Validierung?" ,,lst Validierung fur meine Arbeit wichtig?"
4.2 Antworten uuf die sieben wichrigsten Frugenkornplexe
207
,,Wie weit ist Validierung fur mich sinnvoll, wenn ich nicht an gesetzliche Vorgaben gebunden bin?" ,,Ich bin heute zwar hier im Seminar, aber wann mu13 ich uberhaupt validieren?' Diese Fragen entsprechen generell der Frage nach dem ,,Wann?' In folgenden Fallen ist Validierung notwendig: - Es wird demnachst rnit einer neuen Methode, z. B. Hausmethode oder Methode, mit der das Labor noch nie konfrontiert war, gearbeitet. Man sollte die Methode durch Ermittlung deren Merkmale naher kennenlernen, d. h. dann, wenn es um die Bewertung einer Methode auf ihre Qualitamignung geht. - Dem Labor steht eine Akkreditierung/Zulassung ins Haus. - Wichtige analytische Fragestellungen sind Grund fur eine Validierung, z. B. wenn ein vielversprechendes Produkt vor der Markteinfuhrung steht, oder ein Produkt rnit einem gesundheitlichem Risikopotential vorliegt usw. - Verkaufschancen sollen erhoht werden, Validierung ist ein wichtiges Argument fur das Labor bei Gesprachen rnit Kunden. - Zu der Frage welche Verfahren validiert werden sollten steht in der IS0 17025: ,,Das Laboratorium mu13 nicht genormte, selbst entwickelte Verfahren, genormte Verfahren, die aurjerhalb ihres vorgesehenen Anwendungsbereiches angewendet werden und Erweiterungen von genormten Verfahren validieren, um zu bestatigen, da13 die Verfahren fur den beabsichtigten Gebrauch geeignet sind." c) ,,Wie oft mu13 ich validieren?" Zu Beginn des Lebenszyklus der Methode; im Routinebetrieb empfiehlt sich das Fuhren von Regelkarten rnit Kontrollproben. d) ,,Wenn die HPLC-Saule verkurzt wurde - mu13 das ganze Verfahren revalidiert werden?" Nein; es sollten die Merkmale der Methode uberpriift werden, die durch die konkrete Anderung beeinfluat werden konnten. Im vorliegenden Fall: - Ja: Auflosung, Linearitat (Uberladung der Saule?), Lebensdauer der Saule (gleiche Packungsqualitat?) - Vielleicht: Nachweis-Bestimmungsgrenze. - Nein: Richtigkeit, Wiederfrndungsrate, Methodenprazision. Beim Wechsel jedoch zu einer vollig anderen Matrix, neue Formulierung, andere Konzentration sollten alle Merkmale noch einmal uberpriift werden - zunachst mit einer kleineren Anzahl an MeBpunkten. Dazu die IS0 17025: ,,Wenn einige Anderungen in den validierten nicht genormten Verfahren vorgenommen werden, sollte der Einflu13 solcher Anderungen dokumentiert werden, und sofern angemessen, sollte eine neue Validierung vorgenommen werden. ''
e ) ..Was inacht in1 Routinebetrieb Sinn?"
So wenig Messungen wie moglich ligente" Systemeignungstests.
-
verstiirkter Einsatz von Regelkarten und ,,intel-
f) .Jst ruckwirkende Validierung uberhaupt Lulassig?"
Teilweise ja. Zeigen die Daten der Vergangenheit durch Verwendung von Regelkarten, daR der ProzeU in statistischer Kontrolle ist, erfihrt man einiges uber Robustheit, Priizision und Methodenfahigkeit. Man erhalt natiirlich keine Information daruber, ob das Ergebnis richtig ist (methodenbedingter systematischer Fehler) und wie die Bestimmungsgrenze der Methode ist. Man unterscheidet wie folgt: Prospektii*e,vorausschauende Vtrlidienrng: AbschluB der Validierung vor Nutzung des Prozesses. Rrtrosprktive, ruckwirkende Vulidierung: Validierung bereits bestehender Prozesse.
g) .,Kann eine ordentliche Kalibrierung die Validierung ersetzen?" Ja, wenn im konkreten Fall - einfach ausgedruckt - der MeRvorgang und nicht die Probe selbst als kritisch anzusehen ist, oder bei ,,El-gebnisvalidierungen", wenn eine geeignete Kalibriersubstanz vorhanden ist. Merkr
Kalibriert werden Instrumente und MeRmittel. Validiert werden Verfahren, Methoden und Prozesse. Dnzu die IS0 17025: ,,Zur Bestinimung der Verfahrensmerkniale kann als Methode eine ,Kalibrierung mit Bezugsnormalen oder Referenzmaterialein ' verwendet werden." h ) ..Was passiert mit Ergebnissen, die auaerhalb der ,,limits" sind?"
Es gibt keine einheitlichen Regelungen: Fur manche Organisationen gibt es prinzipiell keine AusreiRer, es werden alle Werte berucksichtigt. In manchen SOP'S wird vorgeschrieben. daB der Wert wiederholt wird, bei manchen darf der Wert ersatzlos gestrichen werden, usw. Die Vor- und Nachteile der einzelnen Vorgehensweisen liegen auf der Hand: ,,Saubere" Mathematik (,,es gibt keine AusreiBer") auf der einen Seite, Realitiit des Analytikalltags auf der anderen Seite. Durch eine plotzlich auftretende Luftblase in einer HPLC-Pumpe iindert sich der Flu13 und damit die Peakfliiche. der resultierende Gehalt 1st nicht brauchbar. Drei Wiederholwerte erhiihen zwar die Sicherheit, doch ist der Aufwand fur diese Analyse gerechtfertigt? Pragmatisch gesehen ist es unerheblich, wie das Problem geregelt wird, es ist nur wichtig. daB alle Beteiligten mit den Daten nach festgelegten, objektiven Kriterien umgehen.
4.2 Aniwrtrten &'die sieben ivichtigsten Fragenkortipkxe
209
i) ,,Welche Konsequenzen sollen bei ,,out of spec"-Situationen folgen? Auch hier hangen die Konsequenzen von der Fragestellung ab. Folgende Aspekte bestimmen die erforderliche Reaktion: - Sicherheitsaspekte fur Mensch, Tier und Umwelt. - Relevanz der Spezifikationsgrenze (,,Was fordert der Kunde? Was kann wirklich passieren?') - Juristische Aspekte, sonstiger Konflikt denkbar? Empfehlung: Drei Doppelbestimmungen durchfuhren, jeder Mittelwert mu8 innerhalb der Spezifikation liegen. Merke: Generell gilt, daB der Mittelwert bei 00s entscheidend ist. nicht die einzelnen Werte! j) ,,Bestmogliche Methodenabsicherung nach heutigem Standard?" Diese Frage ist in dieser Form aus prinzipiellen Grunden nicht zu beantworten. ,,Bestmoglich" hangt von Geld, Zeit, Wichtigkeit etc. ab, s. auch Kapitel 7. 2. ,,Was ist eigentlich Prazision . . .?'Die Erlauterung der einzelnen Validierungsparameter und deren Ermittlung finden sich ausfuhrlich in Abschnitt 3.3 bis 3.11.
a) ,,Der Korrelationskoeffizient r bzw. das BestimmtheitsmaB r2 sagen nichts uber die mathematische Verteilung aus. Welche Bedeutung hat r2?"
. . . genauso wenig uber die Empfindlichkeit des Verfahrens. Die Bedeutung des ,,BestimmtheitsmaB" ist lediglich die vergroaerte ,,Scharfe" des Indexes ( r = 0,9 entspricht r 2 = 0,8 I ) . b) ,,Ein F-Test sol1 entscheiden helfen, ob unabhangig voneinander berechnete Standardabweichungen s, und s2 aus zwei unterschiedlichen Grundgesamtheiten stammen. Dieser Test stellt somit nur ein ,,Vortest" auf Zuverllssigkeit des t-Testes dar. Inwieweit ist es aus mathematisch/statistischer Sicht zulassig, den F-Test z. B. auch mit a = 0,Ol durchzufuhren, bzw. zu einem anderen Signifikanzniveau als den t-Test'?" Die Signifikanzniveaus 90, 95, 99 und 99,9 % sind stellvertretend fur ,,zufiillige Abweichung"; ,,wahrscheinliche Abweichung, aber nicht signifikant"; ,,signifikante Abweichung" und ,,hochsignifikante Abweichung". Es macht keinen Sinn, bei Fund ?-Test unterschiedliche Signifikanzniveaus anzulegen. c ) ,,Bitte erlautern Sie die Begriffe ,,Kalibrierfunktion des Grundverfahrens" und ,,Reststandardabweichung der Wiederfindungsfunktion". ,,Unter dem Grundverfahren wird in der ,,Wasseranalytik" das Kalibrierungsverfahren des reinen Standards, d. h. ohne Matrixeinflusse und ohne besondere Bearbeitungsschritte verstanden. Es wird die Kalibrierfunktion des Grundverfahrens erhalten.
AnschlieBend werden Standardlosungen der neuen Analysenprozedur mit Matrixeinflussen unterworfen und die Signalhohe rnit der Grundfunktion berechnet. Es ergibt sich der ,,reale" Wert, der gegen den ,,theoretischen" Wert aufgetragen wird. Die Steigung der Wiederfindungsfunktion ist im Idealfall 1,00, der Ordinatenabschnitt a = 0, die Reststandardabweichung der Wiederfindungsfunktion entspricht dann der des ,,Grundverfahrens". Mit Hilfe der Reststandardabweichung der Wiederfindungsfunktion (= Verfahrensstandardabweichung, da Steigung b = 1) und des Grundverfahrens sol1 uber die Varianzen eine Varianzenhomogenitlt nachgewiesen werden. Bei (wahrscheinlichen) Abweichungen wird der Vertrauensbereich VB ( P = 9.5 %) errechnet. Es liegt dann eine konstant systematische Abweichung vor, wenn der Vertrauensbereich des Ordinatenabschnitts b den Wert 0 nicht mit einschlieBt. Es liegt eine proportional-systematische Abweichung vor, wenn der Vertrauensbereich der Steigung den Wert mit 1,0 nicht mit einschlieflt. d) ,,Der Mittelwert-Test (Zwei-Stichproben-t-Test) darf nur dann durchgefuhrt werden, wenn die Nullhypothese CT, = 0,nicht verworfen wurde. Eine Ausweichlosung, wenn der ,,normale t-Test" nicht angewandt werden kann (Nullhypothese fur F-Test verworfen, 0,# 02) ist der modifizierte Zwei-Stichproben-[-Test. 1st solch eine Vorgehensweise bei der statistischen Auswertung in der Pharmazie zulassig?" Das ist eine uralte Streitfrage. Grundsltzlich ist er ein akzeptables Verfahren. Sinnvoller ist es jedoch, sich rnit der Frage zu beschlftigen, warum der ,,normale t-Test" nicht anzuwenden ist: womoglich wegen schlechter Selektivitat. Also sollte letztere verbessert werden, um bei verbesserter Selektivitlt (und geringerer ,,Unrichtigkeit") vielleicht doch noch den ,,normalen [-Test'' anwenden zu konnen. e) ,,Wieviel MeBwerte xi sind fur Nimindestens zu bestimmen? Nach meiner Auffassung mind. fiinf." Vorschlag ICH fur die Prufung auf Richtigkeit aus Aufstockversuchen (Wiederfindung): Maximal 10 Serien mit jeweils SO Werten und 4 Mehrfachbestirnmungen Berechnung als prozentuale Wiederfindung (pro Serie): mittlere Wiederfindung mit 9.5 % Vertrauensbereich - Test des Mittelwertes gegen Sollwert 100 % Varianz, Standardabweichung und Variationskoeffizient - Ausreioertests nach DIXON oder GRUBBS - Test auf Normalverteilung nach DAVID - Trendtest (Test auf eine systematische Zu- oder Abnahme in der eingegebenen Rei henfolge).
4.2 Antworten auf die sieben wichtigsten Fragenkomplexe
2 11
f) ,,Es wird zu den einzelnen Ni eine unterschiedliche Anzahl n fur die MeBwerte xi bestimmt, also z. B. fur 80 %, n = 3 und fur 100 %, n = 7. W f e n hier eventuell fur das Gesamtergebnis Wichtungen vorzunehmen?"
1st durchaus denkbar und sinnvoll. Einen EinfluB auf den ,,gemittelten" Wert hat das Verfahren wahrscheinlich nicht, s. Abschnitt 3.7.2.7, jedoch auf den Vertrauensbereich VB ( N und n ) . Grundsatzlich uber t- und F-Test abgleichen. g) ,,Eine Voraussetzung zur Bestimmung der WFR ist die Signifikanzprufung der Verfahrensstandardabweichungder Kalibrierfunktion (zur Validierung eines Extraktes w f e das der Extrakt selbst) und die Reststandardabweichung der Wiederfindungsfunktion (Extrakt mit LS aufgestockt) notwendig. Diese diirfen sich im F-Test nicht signifikant voneinander unterscheiden. Wie werden diese beiden Standardabweichungen berechnet?" Ganz normal: Einmal s fur die Kalibrierfunktion und einmal fur die Wiederholfunktion.
2
PW=($
h) ,,Welche Verfahrenskenndaten sind grundsatzlich anzugeben und welchen statistischen Priifungen sind diese zu unterziehen? (Stichwort: Linearitatstest, Anpassungstest, Residualanalyse, AusreiBertest, Varianzhomogenitat, Absicherung der unteren Arbeitsbereichsgrenze)." Zunachst wird die Wiederfindungsfunktion durch Aufstockung verschiedener Konzentrationen ermittelt, z. B. durch ungewichtete lineare Regression. Ublicherweise werden dann folgende Angaben gemacht: - Anstieg und Ordinatenschnittpunkt mit 95 % Vertrauensbereichen
relative und absolute Verfahrensstandardabweichung, Korrelationskoeffizient - Test von Anstieg und Ordinatenschnittpunkt gegen Sollwerte (1 und 0) - graphische Darstellung der Werte, der Regressionsgeraden mit den Grenzen des 95 % oder 99 % Prognosebereiches, der Sensivitaten (SignaUKonzentration vs. Konzentration) mit individuell definierbaren Grenzen, der Residuen. -
i) ,,Im Bereich der Phytopharmazie werden zur Gehaltsbestimmung eines nativen Extraktes im Fertigarzneimittel haufig Leitsubstanzen (LS) gewiihlt. Da es aber keine
LS freie Extrakte gibt, ist nach meiner Auffassung die Bestimmung einer konstantaystematischen Abweichung nicht sinnvoll. Demzufolge ist und kann nur auf proportional-systematische Abweichung gepruft werden; d. h. die Steigung h = I mu8 im V Bmit P = 0,95 in zweiseitiger Fragestellung den Wert b = I einschlieBen. Bitte erliiutern Sie den Zusammenhang zwischen h und der WFR." Ihre Auffassung ist richtig: Wird f u r eine Untersuchung eine reale Matrix eingesetzt, die die zu bestimmenende Substanz bereits enthalt, so sind keine Aussagen hinsichtlich einer konstant-systematischen Abweichung mogl ich. Die WFR ermittelt sich aus der Steigung der ,,Wiederfindungsfunktion" und stellt einen Regressionswert (optimierter Wert) dar. Im Gegensatz dam, wird der Mittelwert ublicherweise bei drei Konzentrationsniveaus ermittelt.
j ) .,Sind Kalibrierfunktion und Analysenfunktion das gleiche?" Nein. Die Kalibrierfunktion wird dadurch ermittelt, daB ich fur Losungen bekannter Konzentrationen x die entsprechenden Signale erhalte. Und sie wird zur Analysenfunktion, wenn ich den aktuellen MeBwert meiner Probe in die Gleichung einsetze und somit das entsprechende Analysenergebnis i erhalte. Voraussetzung: Vollkommen gleiche experimentelle Bedingungen bei Kalibrierung und Analyse. k) ,,Nach gr6Bter Anstrengung habe ich so langsam die ,,Verfahrensstandardabweichung" verstanden. Nur, was bringt sie mir wirklich?" Beispiele: I . Sie vergleichen zwei Verfahren identischer Prazision, die Sie gerade kalibriert haben. Das Verfahren (oder als Variable auch Gerat, Detektor, Slule, Matrix usw.) mit der geringeren Verfahrensstandardabweichung ist das empfindlichere Verfahren. 2. Bei einer Gehaltsbestimmung der Hauptkomponente im 90 %-Bereich weisen die Verfahren A und B die gleiche Verfahrensstandardabweichung auf: A ist empfindlicher aber unpraziser, B ist praziser aber unempfindlicher. Verfahren B ist vorzuziehen. Die Forderungen an das Verfahren sind hier: Stabilitat, Prazision, Vergleichbarkeit der Ergebnisse und nicht - zu Lasten dieser! - bei einem Gehalt von 90 % eine gute Empfindlichkeit . 3. Mit Hilfe von Losungen eines Metaboliten im Ratten-Plasma wird eine ,,Kalibrierkurve" aufgenommen. 1st die Verfahrensstandardabweichung einer Kalibrierkurve mit der Matrix ,,Human Plasma" vergleichbar (F-Test bzw. t-Test fur die Zielkonzentration) mit der ersten Kalibrierkurve, kiinnen die Daten der ersten Kalibrierkurve zur Auswertung des zweiten Experiments verwendet werden.
I ) ,,Nachweis-, Erfassungs- und Bestimmungsgrenze sind ggf. Anforderungen bei der Bestimmung von Restlosungsmitteln. DIN 32 645 gibt zwei Methoden, direkte und indirekte Methode (Leerwert- und Kalibriergeradenmethode) zur Berechnung der Grenzen an.
4.2 Antworten
iiuf
die sieben wichtigsten Frngenkotnplexe
2 13
Wonach richtet sich die verwendete Methode? Welche Verfahrenskenndaten sind zur Bewertung einer Methode grundsiitzlich anzugeben und welchen statistischen Prufungen sind diese zu unterziehen? Sind die in der DIN-Norm angegebenen ,,Schnellschatzungen" zur Uberprufung geeignet und geben sie eine hinreichende Aussagesicherheit?" Blindwertverfahren anwenden,wenn ein meBbarer Blindwert iiberhaupt vorliegt. Nachteil: Blindwertstreuung darf sich nicht von der MeBwertstreuung unterscheiden. Bei sehr schwachen Blindwerten sind MeBwertverfalschungen moglich. Sind die Blindwerte auch normalverteilt? Bitte, uberpriifen. Kalibrierverfahren anwenden, wenn eine Kalibrierung mit verdiinnten Kalibrierlosungen vorliegt. Es werden dabei Streuungen erfaBt, die real sind. Systematische Fehler durch schwache Blindwerte werden dadurch vermieden. Grundsatzlich ist dem Kalibrierverfahren Vorzug zu geben. Anzugebende Verfahrenskenndaten (Wasseranalytik) Kalibrierverfahren: Anzahl der Niveaus Arbeitsbereich Verfahrensstandardabweichung Signifi kanzniveau Abschatzung durch F- und t-Test bei Mehrfachbestimmung k-Wert (Erweiterungsfaktor) Blindwertverfahren: Anzahl der Blindwerte Standardabweichung Empfindlichkeit Signifi kanzniveau Wenn das Verhaltnis von errechneter Nachweisgrenze und hochstem Kalibrierwert den Faktor 10 nicht ubersteigt, wird Varianzhomogenitat angenommen. Nachweis- und Bestimmungsgrenze sind, mehr als die anderen Validierungselemente, Momentaufnahmen und stark vom System, wie auch von der Berechnungsmethode abhangig. Dies hat insbesondere Bedeutung beim Methodentransfer oder bei der Festlegung von Berichtsgrenzen fur Nebenprodukte. Aus diesem Grund sollte die Bestimmungsgrenze des Prufverfahrens unter Berucksichtigung der Anforderungen festgelegt werden. Sie muB mind. 3 Standardabweichungen von der Akzeptanzgrenze entfemt liegen, um eine zuverlassige Quantifizierung zu ermoglichen (Methodenfahigkeit). Als Richtwert (und um die groBere Variabilitat der Streuung in diesem Konzentrationsbereich zu beriicksichtigen) kann die Bestimmungsgrenze auch auf 50 % der Akzeptanzgrenze gesetzt werden, d. h. bei einer Begrenzung des Nebenproduktes auf 0,l ?h sollte die Bestimmungsgrenze mind. 0,05 % betragen. Im Rahmen der Validierung wird dann mit einem der beschriebenen Verfahren uberpruft, oh diese Bestimmungsgrenze zuverlassig eingehalten werden kann. Die Verfahrenskenndaten nach dem Schnelltestverfahren wurden friiher sehr haufig ermittelt, als noch keine brauchbaren Rechenvorschriften fur bestimmte
Iterationsverfahren vorhanden waren. Heute werden sie uberwiegend aus historischen Grunden und zur Vergleichbarkeit zu alten Verfahren durchgefuhrt. Nach den gemachten Erfahrungen unterscheiden sich die Werte nicht grundsltzlich (F-lr-Test) und sind bei der Unschlrfe des Systems durchaus brauchbar. m) ,,Die Durchfuhrung analytischer Validierung mittels Aufstockmethode (Wiederfindungsrate = WFR) zur Belegung der Richtigkeit ist i. a. die Methode der Wahl. I . Die Anzahl der Kalibrierproben wird in der Literatur mit N = 5 angegeben. Die RDN. 903 fordert in der Regel N = 3 (80 %, 100 %, 120 5%). 1st N = 3 noch als ausreichend anzusehen? 2. Zur Bestimrnung der WFR werden die aus denjeweiligen Ni (80 %,90 %, I00 %, I I0 %, I20 %) erhaltenen Mittelwerte X zu einen gemeinsamen x-quer zusammengefaRt. Es ist jedoch bekannt, daB Mittelwerte X weniger streuen als Meljwerte x. Mittelwerte konnen auch dann (nlherungsweise) normalverteilt sein, wenn Meljwerte nicht norrnalverteilt sind (Zentraler Grenzwertsatz). In der Praxis sind dann unabhangig von der Verteilung der MeBwerte Mittelwerte aus Stichproben vom Umfang n > 5 (annihernd) normalverteilt. Muljte nicht zu jedem Ni (80 %, 90 %, 100 %, 1 10 %, 120 %) Normalverteilung nachgewiesen werden? Unter welchen statistischen Voraussetzungen ist es zuIissig, die einzelnen Mittelwerte zusammenzufassen und dann diesen Mittelwert ein V B in zweiseitiger Fragestellung ( P = 0,95) zu berechnen? 3. Wie groB mu13 die Anzahl an Beobachtungen mind. sein, um Normalverteilung voraussetzen zu konnen?" Die Richtigkeit eines analytischen Verfahrens druckt die Ubereinstimmung zwischen dem gefundenen Wert und einem entweder konventionell als wahr akzeptierten Wert oder einem akzeptierten Referenzwert aus. Mangelnde Ubereinstimmung ist ein Hinweis auf systematische Fehler. ICH-Richtlinien: Die Richtigkeit kann geschluBfolgert werden aus den Validierungselementen Spezifitlt, Linearitlt und Prlzision. Bei quantitativen Prozeduren sollten als Minimun neun Bestimmungen uber mindesten drei Konzentrationsniveaus des gesamten Arbeitsbereicher (z. B. 3 x 3) durchgefuhrt werden. Die Ergebnisse werden als Prozent Wiederfindung oder als Differenz zwischen dem Mittelwert und dem Referenzwert sowie den Vertrauensbereichen berichtet. quantitative Richtigkeitsbelege: Arzneistoff I Vergleich der Ergebnisse mit einem etablierten, unabhlngigen Verfahren I I Anwendung des Prufverfahrens auf ein Referenzmaterial Arzneiform I Vergleich der Ergebnisse mit einem etablierten, unabhangigen Verfahren I1 Anwendung des Prufverfahrens auf eine synthetische Mischung aller Komponenten 111 Aufstockung von Analyt zur Arzneiform
4.2 Antworten uujdie sieben wichtigsten Frugenkomplexe
2 15
Nebenprodukte (quantitativ) I Vergleich der Ergebnisse mit einem etablierten, unabhangigen Verfahren II Aufstockung von Nebenprodukt zu Arzneistoff oder -form. Prozedur I. und 11. ist generell einsetzbar, stofit jedoch bei neuen Arzneimitteln naturgemafl auf Grenzen, ebenso II. bei neuen Arzneistoffen. Zu 1: Die hier erwahnte Literatur ist Standard in der ,,Wasseranalytik". Das Verfahren RDN 903 bezieht sich auch Pharmaka. Bei quantitativen Prozeduren sollten nach ICH als Minimum neun Bestimmungen uber mind. drei Konzentrationsniveaus des gesamten Arbeitsbereiches (z. B. 3 x 3) durchgefuhrt werden. Nach den Erfahrungen in der Pharma reicht das aus. Zu 2: Im Prinzip schon. Jedoch kann in der Regel bei der Pharmaanalytik Normalverteilung angenommen werden. Problematisch ist die Priifung auf Normalverteilung bei n = 5. Zulassig ist die Zusammenfassung, wenn die Mittelwerte keine signifikanten Unterschiede (F-/&Test)aufweisen. Zu 3: Realer Nachweis der Normalverteilungje nach Matrix ah etwa 20-15 Tests. ICH schllgt 6 MeBwerte vor.
3. Die Zeitknappheit ,,Moglichkeit der Verkiirzung der Validierung wegen Zeitmangel" ,,Welche ist die kurzeste Vorgehensweise?" ,,Wie fuhre ich eine Validierung durch, wenn ich wenig Zeit zur Verfugung habe?" Dem Problem ,,Zeit" kann man wie folgt begegnen:
- Einen Teil der Validierungsarbeit (Selektivitat, Robustheit) moglichst bei der
Methodenentwicklung mit abdecken
- Validierungsumfang uberdenken und folgende oder ahnliche Fragen stellen: -
-
-
Warum brauche ich diese Kenntnis wirklich? Warum brauche ich 10 statt 6 Werte? Brauche ich fur den ganzen Konzentrationsbereich eine Dreifach-Bestimmung? Warum wird die Nachweisgrenze sowohl nach dem PeaWRausch-Verhiltnis als auch nach dem Blindwertverfahren ermittelt? Sehr wichtig: Der Kalibrier- und damit auch der Zeitaufwand kann mit Hilfe der SPC auf ein Minimum reduziert werden. Methoden vereinheitlichen und Parallelvalidierungen durchfuhren. Bei ,,unwichtigen", einfachen Methoden Schnelltests durchfuhren, gefolgt von Plausibilitatsuberlegungen oder Schatzen der MeBunsicherheit. Wenn Referenzmaterialien vorhanden sind, stets Ergebnisvalidierung anstreben.
4. Behordliche/rechtliche Anforderungen a) ,,Wie vie1 mu8 ich bei einer ,,offiziellen" Methode wie 5 35 LMBG, DAB; DIN usw. validieren?"
Uberhaupt nicht, diese gelten als validiert. Bei Erstanwendung empfiehlt sich jedoch in .jedem Fall, die Anwendbarkeit im eigenen Labor xu uberprufen. Vorausgesetzt wird naturlich. dafi das Labor die Methodik beherrscht. b) ,,GMP-Validierung" Es gibt keine ,,GMP- oder GLP-VulidirnrnX".Wenn Sie in einer GMP-Umgebung arbeiten, mussen Sie laut ,,Regelung der Arzneimittel in der Europiiischen Gemeinschaft", Band IV, S. 56, bei der Priifung ,,validierte analytische Methoden" einsetZen. Wie die Validierung erfolgen soll, entscheiden Sie - jedenfalls h u t GMP. Die Amerikaner sind etwas restriktiver - jedoch mit positiver Tendenz. Im .,Federal Register" (vergleichbar mit dem Bundesgesetzblatt) wurde 1996 ein Vorschlag der FDA abgedruckt mit folgender Forderung fur Qualitiitskontrollabors, die mit cGMP arbeiten, an die Methodenvalidierung: Richtigkeit, Empf'indlichkeit, Spezifitiit und Vergleichbarkeit. c) ,,Validierung - wieviel ist notig, wenn ich vor der Akkreditierung stehe?"
Empfehlung: Uberlegen Sie sich einen Minimalumfang, der aus analytischer Sicht sinnvoll erscheint, wobei es okonomischer ist, Verfahren statt einzelne Methoden zu validieren: z. B. ..Nitrosamine mittels HPLC" statt ,,Nitrosodiethylamin in Haarshampoo". Der endgultige Umfang und Modus sollte beim Vorgesprach mit dem Begutachter der Akkreditierstelle geklart werden, wobei es hier grol3e Unterschiede geben kann, sowohl personenabhangig als auch abhangig von der Philosophie der Akkreditierstelle. d) ,,Welches Gesetz, welche DIN-Kommission, beschiiftigt sich mit dem Thema Validierung?" Validierung ist - z. B. anders als die GLP - kein Geset?! Merke: IS0 und DIN sind ,,Richtlinien", d. h. sie haben einen Empfehlungscharakter. Somit existieren keine branchenubergreifenden, umfassenden und akzeptierte Regelungen und Vorschriften. Das ,,Offiziellste" bezuglich Validierung sind die ISODefinitionen aus den Jahren I994 und 2000, siehe Abschnitt 1.2.1, und die Empfehlungen der Europiiischen Kommission, z. B. Nr. L214/18, Richtlinie 96/46/EG der Kommission vom 16.07.1996 oder DOC 8064/V1/97 rev. 1 vom 09.04.98. Dennoch existieren in den meisten Branchen Richtlinien, die faktisch als bindend und zwingend anzusehen sind, z. B. ,,Erliiuterungen zu Antrag auf Zulassung eines Arzneimittels beim BfArM" 1996. oder Pharmabetriebsverordnugn $ 6 (,,Analyse von Arzneimitteln") oder RichtlinienEmpfehlungen von Akkreditierstellen und FDA. Fur alle ,,Prtif- und Kalibrierlaboratorien" sind die Ausfiihrungen der IS0 17025 mafigebend.
4.2 Antworten aufdie sieben wichtigsterz Frqgenkomplexe
2 17
e) ,,Bis jetzt haben wir keine Validierung gebraucht, aber wir schreiben jetzt ein QMHandbuch. Mussen wir vor Einfuhrung eines QM-Systems unsere Methoden validieren und wenn ja, wie?" Auf die I S 0 17025, GLP und GMP wurde weiter oben eingegangen. In der I S 0 9001 ist die Rede von Designvalidierung (,,urn sichzustellen, daB das Produkt festgelegte Erfordernisse des Kunden erfullt"). Diese bezieht sich auf das Produkt, wobei das ,,Produkt" naturlich eine Dienstleistung sein kann. Bezuglich der Analytik ist bei der I S 0 9001 nur die Rede von der Priifmitteluberwachung (,,bekannte MeBunsicherheit der Priifmittel, die rnit der betreffenden Forderung vereinbar ist"), sowie von der Kalibrierung und Justierung mit zertifizierten Mitteln. Also wird die Validierung im klassischen Sinne von der IS0 9001 expressis verbis nicht gefordert. Fazit: Validierte Methoden in der Analytik werden im geregelten Bereich von der GMP, im ungeregelten Bereich von der Akkreditierung sowie bei der Zulassung eines Arzneimittels gefordert. Nach IS0 17025 sollen in Priif- und Kalibrierlaboratorien alle eingesetzten Verfahren (bis auf Normverfahren) validiert sein. f) ,,Validierung von Analysenmethoden, die geeignet sind, die Zulassung bei der EU bzw. FDA zu erlangen - Unterschiede?"
Ja, naturlich ist die Zielsetzung bei der Validierung in USA und Europa im Prinzip gleich, dennoch gibt es Unterschiede - sowohl inhaltlicher Natur als auch was prinzipielle Auffassungen betrifft. Dazu drei Beispiele: - Sulfatasche: USP: 80OOC und H2S04cone, EuroPharm: 6OO0C und 10 % H2S0, - Euro.Pharm: Gehaltsbestimmung rnit moglichst spezifischen Methoden wie HPLC - FDA: Gehaltsbestimmung rnit rnoglichst unspezifischen Methoden wie UV, Titration Folglich hat die Validierung nach unterschiedlicher Gewichtung zu erfolgen. Dennoch schreitet die Harmonisierung, ein Produkt der Globalisierung, rasch voran. In USA werden generell ,,wasserdichte", allgemeingultige Einheitskonzepte angestrebt, rnit denen ,jeder" arbeiten konnen sollte. In Europa wird eher einer Differenzierung nach analytischen Gesichtspunkten der Vorzug gegeben. 5. Hilfen, Infos
a) ,,Mu13 ich das Gerat validieren oder kann das der Hersteller im Rahmen eines Wartungsvertrages tun?" Ein Gerat wird nicht validiert, sondern qualifiziert, d. h. es wird auf Einhaltung der rnit dem Hersteller vertraglich vereinbarten angegebenen Spezifikationen uberpruft. Und das sollte in der Tat der Hersteller tun, ob bei der Erstinstallation (IQ, OQ),
2 18
4 Hiiufige Frqen :ur Validiclrung
siehe Abschnitt 2.3 oder aber bei der -jedenfalls im pharmazeutisch/medizinischen Bereich - ublichen, alljiihrlichen Geriteuberprufung. Die Validierung - Eignung fur einen .vp~irllrn Gebrauch - ist eine Sache des Anwenders, der ubrigens vor dem Gesetz fur die Analysenergebnisse haftet. b) ,,Kann ich gegen Aufpreis ein validiertes Gerlt kaufen?" Nein. Es gibt kein validiertes Gerat. Merkr Validierung ist keine einmal erlangte und dann immer wlhrende Absolution. Was man machen kann und auch unbedingt sollte, ist fur die Qualifizierung des Gerates zu sorgen, und dies bereits bei den Kaufverhandlungen festlegen. Was man wohl von auBen als Dienstleistung kaufen kann ist die Durchfiihrung einer Validierung. c ) ,,Softwarevulidierung
-
wie machen das die anderen?"
Vermutlich gar nicht. Die Validierung einer Software 1st nicht trivial, siehe dazu Abschnitt 6.5 und ,,Literatur", Abschnitt A. 10. Die folgenden Empfehlungen sind fur Leser bestimmt, die sich nicht exzellent mit source codes, Algorithmenzyklen etc. auskennen, aber auf pragmatische Art und Weise zu einem etwas sichereren ,,Gefuhl" kommen mochten: - Versuchen Sie durch extreme aber praxisrelevante Operationen den Rechner zum ,,Absturz" zu bringen. Installieren Sie die Software an zwei moglichst unterschiedlichen Rechnern (Hardware, Peripherie, Konfiguration, usw.) und uberprufen Sie, ob Sie bei zwei, drei moglichst unterschiedlichen Anwendungen die gleichen Resultate erhalten. - Fuhren Sie einige typische Rechenoperationen zusatzlich mit externen Programmen durch (Taschenrechner, EXCEL) und vergleichen Sie die Ergebnisse. - Der Hersteller sol1 Ihnen nachweisen, ob, wie und von wem die Software validiert wurde, siehe auch ,,Robustheit" in Abschnitt 3.5.2.3. d) ,,Wir bekommen immer wieder validierte Methoden aus ... . Wie kann ich beurteilen, ob die ihren Job richtig machen?" Das ist in der Tat eine auBerst schwierige und brisante Frage . . . Haben Sie eine reale Chance fur eine Einsichtnahme in der Validierungsdokumentation? Wenn nicht, versuchen Sie sich so viele Informationen uber die Methode und die Probe zu verschaffen, daB Sie die kritischen Punkte der Methode fur sich ausfindig machen konnen und uberprufen Sie anschlieBend, ob und wie grundlich diese Punkte in der besagten Methode berucksichtigt wurden. Als zweiten Schritt erstellen Sie einen Fragekatalog, in dem etwa folgende Fragen enthalten sein konnen:
4.2 Antworten uuf die sieben wichtigsten Frugenkomplexe Die Frage
.. .
- Wer fiihrte die Validierung aus?
2 19
... und die Info - Qualifikation des Validierers?
-
Wo fand sie statt?
-
Qualifikation der Einrichtung?
-
Wann erfolgte die Validierung?
-
-
Was wurde genau analysiert?
-
Nur Standards oder reale Proben mit Matrix, mit welcher Matrix, nur mit einer Matrix, nur bei zwei Konzentrationsniveaus? usw.
-
Wie wurde validiert?
-
Genaue Beschreibung der Methode angegeben?
-
Wurden nur Zahlen ermittelt oder wurde auch kommentiert?
-
Wurde an einem Tag griindlich validiert oder ist auch bekannt wie stabil tatsachlich der AnalysenprozeR ist?
Die Sensibilitat z. B. fur Robustheit war in den 70er und 80er Jahren nicht so hoch wie heute.
-
Welches Gerat wurde verwendet?
-
1st das Design geeignet?
-
Welche Rohdaten wurden mitgeliefert?
-
Ein Chromatogramm sagt mehr als 5 Seiten Beschreibung
-
Bei Zweifeln konnen mit den Rohdaten nachtraglich statistische Tests durchgefuhrt werden
-
Audits auf dem kurzen ,,Dienstweg" geben einen Hinweis auf das Qualitatsverstandnis eines Labors.
-
Wurde - und wenn ja von wem - das Ergebnis auf Plausibilitat uberpruft?
e) ,,Wer kann mir auaer meinem Chef beim Validieren helfen, gibt es Validierungsprogramme dazu?" Externe Berater ubernehmen Validierungsarbeiten in Form von Dienstleistungen. - Eine Reihe von Herstellern stellen kostenios Unterlagen oder sogar SOP'S zur ,,Validierung" Ihrer Produkte. Auch hier handelt es sich urn VerifizierungedQualifizierung, dennoch sind diese z. T. ausgezeichneten Unterlagen hilfreich. - Viele Organisationen, wie DACH, FDA usw. offerieren ausfuhrliche Unterlagen uber Validierung, siehe Abschnitt A.8 bis A. 10. - In der Zwischenzeit haben fast alle groaen Instrumentenanbieter in ihre Auswertesoftware Validierungsmodule eingebaut, mit denen man die ublichen statistischen Operationen (Standardabweichung, &Test, Linearitat, Bestimmungsgrenze usw.) durchfuhren kann. Daneben gibt es Validierungssoftwareprogramme, siehe dazu Abschnitt A.7.
-
6. Validierungsumfang als Funktion von Methode, Ziel ,,Urnfang der Validierung unter Berucksichtigung der Prufmethoden?" ,.Wann kann ich den Validierungsanspruch mindern - keine medizinische-, pharmueutische-, Lebensmitteluntersuchungen?" ,,Was ist bei der Validierung der verschiedenen Analysenmethoden zu beachten bzw. unterschiedlich?" Diese Fragen werden in Kapitel 7 behandelt. 7. Sonstiges a) Grund fur 6 Werte bei der Berechnung von V,? Das ist eine Konvention; es herrscht die allgemeine Meinung vor, da13 mit mindestens 6 Werten statistische Berechnungen zu vertreten sind. Ab einer Zahl von etwa ,,gewonnene Information" unverhaltnismll3ig, denn der t-Wert aus 7 wird der Term Aufwand der t-Tabelle lndert sich wenig. Selbstverstandlich gibt es auch andere Empfehlungen: mindestens 5 ICH (USA, EU, Japan): NATA (Australien): 7 DIN 38402 Teil S I : 10 b) ,,Was gehort alles in die Dokumentation?" ,,Dokumentation - was mu13 wie beschrieben werden?'
Die Frage nach dem Dokumentationsurnfang kann nicht generell beantwortet werden. In einem GLP-Labor beispielsweise mu6 im Prinzip aul3er Vorversuchen d l les" dokumentiert und archiviert werden. Auch in nicht reglementierten Bereichen existieren bezuglich Dokumentation meist recht konkrete Vorstellungen. 1st dies nicht der Fall, sollte imVorfeld mit dem Kunden abgeklart werden, welche Daten er wirklich im Validierungsbericht braucht. In jedem Falle empfiehlt sich fur den Validierungsbericht die Visualisierung der Ergebnisse (Chromatogramme, Regressionsgeraden, Kontrollkarten), der Hinweis auf kritische Punkte der Methode sowie eine Kommentierung und schliel3lich eine Aussage/Stellungnahme uber Eignungl Fahigkeit der Methode, siehe auch Abschnitt 2. Dazu I S 0 17025: ,,Das Laboratorium mu13 . . . festlegen, ob das Verfahren fur den beabsichtigten Gebrauch geeignet ist." c ) ,,Wie gelange ich von Validierung zur Zertifizierung einer Methode?'' Anmerkung: Zertifizierung wird hier im Sinne von Evaluierung, Charakterisierung, Beurteilung einer Methode verstanden. Die im Rahmen der Validierung erzeugten Daten werden fur eine kritische Beurteilung der Methode herangezogen. Fur eine ganzheitliche Beurteilung mussen auch die Faktoren Zeit, Kosten, Schwierigkeitsgrad, Geflhrdung usw. berucksichtigt werden.
4.2 Antworten uufdie sieben wichtigsten Frugenkomplexe
22 1
d) ,,Validierung von selbstentwickelten Methoden?" Detinieren Sie welche Schritte kritisch sind und untersuchen Sie diese besonders griindlich. Wenn zwei Anwender an zwei unterschiedlichen Tage zu ahnlichen Ergebnissen kommen, dann sieht es ,,gut" aus. Dazu mu13 man vorher definieren, welche Abweichungen akzeptabel sind. Wenn schlieBlich ein Dritter mit einer unabhangigen Methode die Ergebnisse bestatigt, so liefert die Methode vermutlich richtige, robuste und prPzise Ergebnisse. e) ,,In welchem Umfang kann eine Validierung des Gesamtsystems mit Standards und Qualitatskontrollen die Validierung bzw. Uberpriifung einzelner Komponenten ersetzen?" Voll und ganz.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
5
Haufige Fehler bei der Validierung analy ti scher Methoden
Bei der Besprechung der einzelnen Validierungselemente wurde bereits auf kritische Punkte hingewiesen. Hier erfolgt eine Zusammenfassung von typischen Fehlern. Diese stellt eine Auswahl dar und sollte nicht als vollstandige Fehlersammlung verstanden werden. Die moglichen Fehler konnen in zwei Kategorien eingeteilt werden. 1. Allgemeine Fehler und Interpretationsfehler 2. Fehler im Zusammenhang mit der praktischen Durchfuhrung der Validierung
5.1
Allgemeine Fehler und Interpretationsfehler
a) Es wird mit dem Kunden nicht genau geklart, was rnit dem Auftrag ,,Methodenvalidierung" beabsichtigt wird. z. B. - Braucht der Kunde nur einen ,,Persilschein" oder geht es tatsachlich um Uberpriifung der Eignung einer Methode? - Wie prazise mussen die Ergebnisse wirklich sein und warum eigentlich? - 1st es eine einmalige Fragestellung oder ist mit einem langeren Lebenszyklus der Methode zu rechnen? b) Man beschaftigt sich sehr intensiv rnit der Priifung oder sogar ausschlieljlich rnit dem Meljvorgang selbst und laljt evtl. kritische Schritte der Methode auBer Acht. z. B. - Handelt es sich um eine reprasentative Probe? - Wurde die Apparatur vor der Messung kalibriert? - 1st der Einflulj der Probenahme, des -transports, des -behaltnisses, der -lagerung, der -matrix, der -konzentration usw. auf die Stabilitat bekannt? - Beirn Methodenvergleich wird auf die gleiche Matrix, gleiche Konzentration, gleiche Anzahl von Meljwerten usw. geachtet, aber es wird manchmal ubersehen, dalj die Probenvorbereitung fur die zwei Methoden vielleicht unterschiedlich ist. c) Es wird zu wenig oder zu vie1 validiert. z. B. Zu wenig: Lediglich 6-fach-Bestimmung eines Standards und Aufnahme einer Regressionsgerade.
Zu viel: Ein ,,Validierungskatalog" wird stur abgearbeitet. Zu dieser Problematik siehe auch Abschnitt 1.4. 1st ein ProzeR in statistischer Kontrolle (ISK), sollte nicht zu oft kalibriert werden. Das ist nicht nur nicht notig, vielmehr besteht die Gefahr der Uberjustierung. In einem ISK-ProzeR wird durch das Kalibrieren zusatzliche Variabilitiit (= Fehler) von auRen eingefuhrt, die Streuung der einLelnen Werte nimmt 7.u! d) Nach der Erzeugung von Zahlen fehlt das eigentliche Ziel bei einer Validierung, nlmlich eine kommentierte Aussage des Durchfuhrenden, ,,Die Methode ist geeignevist nicht geeignet". e) Anwender, die mit der Methode nicht ausreichend vertraut sind, fuhren Validierungen durch - oft sogar ,.nebenbei" oder umgekehrt: Ein Fachmandeine Fachfrau fuhrt eine Validierung durch. ,,Trivialitaten" erscheinen nicht im Validierungsbericht oder in der SOP. AnschlieBend wenden weniger erfahrene Anwender die Methode in der Routine an. Es ist eine Frage der Zeit, wann die ersten Schwierigkeiten auftreten. f) Der Faktor ,,Zeit" wird nicht gebuhrend bedacht. Dazu zwei Aspekte: Validierung ist eine Momentaufnahme, meist sogar mit einer besonderen Sorgfalt durchgefuhrt. Was jedoch wirklich wichtig ist, ist die Frage nach der Eignung unter Praxisbedingungen und nicht die Ermittlung von ,.Sonntagswei-ten". Also gilt es, die Validierung unter realen Bedingungen durchzufuhren. Alle Faktoren, die das Ergebnis beeinflussen konnen, mussen im Rahmen der Validierung die ,,Chance" bekommen, auf das Ergebnis einzuwirken, denn genau dieses AusmaR gibt Auskunft, ob eine Methode geeignet ist oder nicht. Geschieht es nicht, haben wir die haufige Situation, daB die Standardabweichung in der Routine vielleicht den zweifachen Wert oder mehr aufweist als bei der Validierung ermittelt. Auch fuhrt dies zu haufigen Klagen der Routineanwender im Betrieb iiber die Kollegen in der Analytik, die die Methode entwickelt und validiert haben. Das heiOt fur die Praxis folgendes: Es gilt zu uberlegen, ob der Schwerpunkt bei der Durchfuhrung einer griindlichen Validierung i n einer kurzen Zeit liegen sol1 oder ob es vielleicht besser ist, den EinfluB der Zeit auf den ProzeB zu untersuchen. Denn wenn die Variabilitat von Tag zu Tag wegen allerlei Einflussen griikier ist als die Variabilitlt innerhalb eines Tages - und das ist meist der Fall - fragt man sich, wozu man den Aufwand betreiben sol1 und eine grundliche Validierung an darauffolgenden Tagen durchfuhren soll? Die Verfolgung der Werte uber einen Iangeren Zeitraum mittels einer Regelkarte bringt sicherlich mehr Informationen. Solche Beispiele gibt es zur Genuge. Diese Schwache der Validierung, namlich die Stabilitat eines Prozesses zu reflektieren, ist erkannt worden. Die FDA spricht bereits von der ,,validation at the time of use" und von ,,real time validation". Das alles fuhrt zu folgender These - wobei dies insofern mehr als eine These ist als bereits mehrfach deren Gultigkeit bewiesen wurde: in dem MaBe wie es gelingt, einen ISK-ProzeB zu installieren, im gleichen MaBe nimmt nicht nur der Validierungs - sondern selbst der Analysenbedarf ab, siehe Abb. 5- 1. Es herrscht in vielen Labors die Meinung, mit dem Mittelwert und der Standardabweichung sei die Streuung von Werten zu beschreiben - solange es sich um eine
5. I Allgemeine Fehler und Interpretutionsjehler
4
225
\
Validierungs- und Analysenbedarf
"wenig"
"viel"
Abb. 5-1 Abhangigkeit des Validierungs- und Analysenbedarfs von der Stabilitat d. h. von der Robustheit eines Prozesses (schematisch).
Normalverteilung handelt. Statistisch gesehen ist dies richtig, sobald Zahlen allerdings naturliche Prozesse beschreiben, ist der Parameter Zeit evident, denn wir mussen bei naturlichen Prozessen oft mit einer Schiefe rechnen. 3(X-X") Schiefe =
mit:
x Mittelwert
x" Median s
Standardabweichung
Zwei Prozesse mit gleichem Mittelwert und gleicher Standardabweichung konnen von recht unterschiedlicher Qualitat sein! Das ist in Abb. 5-2 bis 5-4demonstriert [63]. Zwei Verteilungen A und B werden bei vollig identischem Mittelwert X = 83,14 und vollig identischer Standardabweichung, s = 3,34 durch die gleiche GauBkurve (Abb. 5-2) beschrieben. Das bedeutet allerdings nur, dal3 links und rechts vom gleichen Mittelwert (-3 s und +3 s Bereich) sich die gleiche Anzahl von Werten befinden! Abbbildungen 5-3 und 5-4 zeigen die jeweilige Regelkarte. Abgebildet sind die Werte und der dazugehorige Zeitpunkt bei deren Ermittlung. Die zwei Prozesse (Methoden) sind schwerlich als gleichwertig zu bezeichnen - obwohl der Mittelwert und die Standardabweichung gleich sind. Ob ein ProzeB in der Routine in statistischer Kontrolle (ISK) ist oder nicht (leichte Verschiebung des Mittelwertes, Alterung von Reagenzien und Instrumenten, keine Normalverteilung usw.), kann erst durch das Fuhren von Regelkarten erkannt werden. Und gerade die Kenntnis ist ja wichtig, ob ein ProzeB stabil ist. Aktuelle Zahlen zeigen nur einen Ausschnitt der Wahrheit.
226
5 Hiiufige Fehler hei der Vdidierung anulytischer Methoden A
\I B
Abb. 5-2 Gauss-Kurven von Werten, die mit zwei Methoden A und B crmittelt wurden. Die Mittelwerte und die Standardabweichung sind identisch [65].
Mes wert
I I I I I I I I I I I I I I Abb. 5-3 Regelkarte der Werte nach Mcthode A [5X].
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Abb. 5-4 Regelkarte der Wcrte nach Methode B
[%I.
5.I Allgerneine Fehler und Interpretutionsfehler
227
Dazu folgender Fall: Einmal im Monat wird eine Kontrollprobe sechs ma1 vermessen und der V , berechnet. Bei einem V , < 0,3 % wird die Aussage gemacht: ,,Methode plus Gerat sind in Ordnung, alles bestens". Die SchluBfolgerung ist in dieser Form nicht zulassig. Obiges Ergebnis sagt lediglich aus, daB fur den wahrscheinlich kurzen Zeitraum von 1 oder 2 Stunden MeBzeit die Streuung der Werte gering ist, sonst nichts. Eine Regelkarte jedoch uber einen langeren Zeitraum wurde mehr Informationen liefern: Werden vielleicht im betreffenden Zeitraum verschiedene Mehiveaus, Trends, AusreiBer, zeitabhangige Streuungen usw. beobachtet?
g) Allzu groBe Bereitschaft zur Ubernahme von Geratespezifikationen oder Prazisionsdaten aus Herstellerangaben. Diese Zahlen haben etwas mit derverifizierung zu tun, d. h., mit allgemeinen Forderungen und nicht mit der Validierung. Letztere bezieht sich auf diese Probe und den Komponenten x, y ... in dieser Konzentration, in dieser Matrix usw. h) Keine allgemein akzeptierte bzw. durchgesetzte Nomenklatur, die Begriffe werden teilweise uneinheitlich benutzt. Z. B. - ,,Genauigkeit" gleich ,,Richtigkeit" Genauigkeit: Abstand eines einzigen MeBwertes vom richtigen Wert, zufallige plus systematische Fehler. Richtigkeit: Abstand des Mittelwertes vom richtigen Wert (systematische Fehler), siehe Abb. 3- 1. - Der Inhalt des Begriffes ,,Reproduzierbarkeit" (Vergleichbarkeit) wird im Laboralltag fur ,,Wiederholbarkeit" benutzt: ,,Die Retentionszeit war reproduzierbar". - ,,Erfassungsgrenze" in DIN 55350, Teil34, entspricht der ,,Nachweisgrenze" in DIN 32645. Erfassungsgrenze in DIN 32645 entspricht dem ,,Erfassungsvermogen" in DIN 55350, Teil 34. i) Keine kritische Betrachtung der ermittelten Zahlen, bzw. die Aussagekraft von Zahlen wird unter- oder uberbewertet. Beispiele
- Aus einem Validierungsbericht: . . . ,,Es wurde durch Bestimmung auf Konzentrationsniveaus im Bereich zwischen 0,Ol % und 0,2 % die Linearitat nachgewiesen. Der
gultige Arbeitsbereich lautet: 0,Ol % - 0,2 %. Aus den Daten zur Bestimmung der Linearitat wurde die Nachweis- und Bestimmungsgrenze errechnet. Es ergab sich (P = 95 %) ein Wert von 0,02 % als Nachweisgrenze und ein Wert von 0,04 % als Bestimmungsgrenze ..." Fehlerhafte Aussage! Hier wurden MeBwerte auBerhalb des Arbeitsbereiches ermittelt; quantitative Angaben unterhalb der Bestimmungsgrenze sind nicht erlaubt, siehe auch Abschnitt 3.9. Der gultige Arbeitsbereich lautet richtig: 0,04 % - 0,2 %.
-
Die Spezifikationsgren7en fur den Gehalt cine\ Inhalts5toffej lauten 99 % - 100 %. 30 Routinebehmmungen ergaben folgende Werte. Mittelwert: 99,61 Standardabweichung: 0,23
Alles bestens'? Naturlich nicht, denn die Streubreite der Methode ist zu groB. Die Streubreite betragt Ki s, d. h., 6 . s = 6 . 0,23 = 1,38. Die Streubreite ist um 0,323 griifier als die Spezifikationsbreite von 1 76. Die Konsequenz aus dieser Tatsache heifit zweierlei: Die hohe Streuung der Analysenmethode wird erstens zwangslaufig zu berechtigten Reklamationen fuhren, da ein Analysenwert zwar innerhalb der Spezifikation liegt, die wirkliche Konzentration jedoch moglicherweise aul3erhalb der Spezifikationsgrenzen. Gleichzeitig besteht zweitens ein erhiihtes Risiko, wenn ein Analysenwert auRerhalb der Spezifikationsgrenze liegt, wobei die wirkliche Konzentration innerhalb der Spezitikationsgrenzen liegt. In diesen Fallen werden zusatzliche Kosten anfallen, die Ware zu verbessern, wobei dies gar nicht notig war. Eine Uberarbeitung dieser Methode wiire dringend von Niiten. Aus dem gleichem Grunde muR eine Methode zur Gehaltsbestimmung eines Wirkstoffs mit der Spezifikation 98 % - 102 % und einer Standardabweichung von .s = 0,7 als nicht geeignet bezeichnet werden. 6 . s = 6 . 0,7 = 4,2; Die Streubreite von 4,2 ist gr6Rer als die erlaubten 4 %. Die Prlzision der Methode mul3te aufeinen Wert .s kleiner +3 s verbessert werden 6 s < 4, das heifit s 2 0.65.
Beg rundung Werte konnen streuen. Eine Streuung von k 3 s um den Mittelwert wird allgemein akzeptiert. Dieser Bereich entspricht nach Gauss einer Wahrscheinlichkeit von 99,73 %, daR eben ein x-beliebig gemessener Wert dort anzutreffen ist. Diese Streuung ist die Streuung der Werte, die durch diese Methode ermittelt werden, stellt somit ein Charakteristikum der Methode dar. Wir unterhalten uns also im Moment uber das Validierungselement .,Prlzision". ein Ma13 dafur ist die Standardabweichung. Diese durch die Methode hervorgerufene Streuung muO nun kleiner sein als die durch die Spezifikation vorgegebene, in unserem Beispiel 4 %. Das ist dann der Fall, wenn s gleich oder kleiner (A65 ist: 6 . 0,65 = 3.9 Heist es, dal3 ein Wert beispielsweise von s = 0.4 (daraus folgt: 6 .0,4 = 2. und 2,4 < 4) in Ordnung ist? Nein.
Brgriinduiig Eine Analyse wird selten als Selbstzweck durchgefuhrt. Sie dient eher der Uberprufung eines Wertes z. B. der Uberwachung eines Produktionsprozesses. Die Aufgabe der Analytik ist es, eine Versehiebung des Produktionsprozesses moglichst fruh zu registrieren. Wenn nun im Labor eine Streuung der Werte festgestellt wird, kann jene aus der Produktion oder aus dem MeRvorgang selbst oder - was wahrscheinlich ist - aus beiden herruhren. Bei
5. I Allgemeine Fehler und 1nterpretation.Cfehler
229
stochastisch unabhangigen Prozessen gilt fur die Gesamtstreuung als Resultierende folgendes (siehe auch Ausfuhrungen in Kapitel 8):
mit
V,, Gesamtstreuung VMv Streuung durch den MeBvorgang V,, Streuung durch die Produktion
Je geringer die Streuung der Analytik ist (kleiner VMv-Term),um so eher entspricht die gefundene Streuung der Streuung des Produktionsprozesses, siehe Abb. 5-5. Und Zielsetzung der Analytik ist ja, z. B. die Produktion zu uberwachen. Umgekehrt bedeutet eine starke Streuung der Analytik, dal3 hier falschlicherweise die festgestellte Streuung in der Produktion vermutet wird. Manche Partie wurde schon intumlicherweise vernichtet. Etwas vereinfacht formuliert: Wenn die Analytik eine zu groBe Streuung innerhalb der Spezifikationsgrenzen fur sich in Anspruch nimmt, laBt sie der Produktion kaum Spielraum. Der Anteil der Analytik an der Gesamtstreuung w%e, wie in der Auto- und Elektronikindustrie, mit 10 % optimal, in der Praxis sollte ein Wert von hochstens 30 % - 50 % anvisiert werden. In unserem Beispiel bedeutet bei den Spezifikationsgrenzen von 4 Prozentpunkten (98 % - 102 %) und einem s von 0,4, daB diese Methode (6 s = 6 . 0,4 = 2,4 und 2,4 entspricht 60 % von 4) 60 % der erlaubten Gesamtstreuung fur sich in Anspruch nimmt, was einfach zu vie1 ist. Hier wird eine bekannte Problematik offensichtlich: Haufig werden von behordlicher oder sonstiger offizieller Seite Spezifikationen vorgegeben, ohne analytisch-chemische Gegebenheiten zu beriicksichtigen. 1st man gezwungen, diese Spezifikationen tatsachlich ernst zu nehmen, gelangt man leicht in eine Zwickmuhle, denn die Entwicklung einer HPLC-Methode beispielsweise mit einer Standardabweichung fur reale Proben von s kleiner 0,4 ist nicht gerade die leichteste Aufgabe. Sind - vor einem naturlich begrundeten Hintergrund - in einem Gesprach zwischen Analytik, Produktion und Marketing die Spezifikationsgrenzen nicht ,,korrigierbar", bleibt ein einziger Ausweg ubrig: Auf eine weniger selektive aber dafur prazisere Methode wie z. B. Titrimetrie auszuweichen. MuB im vorliegenden Fall unbedingt mit der HPLC gearbeitet werden, so hat der Autor hier keine allgemeingultige Losung, nur die Empfehlung, ,,out of spec"-Situationen nicht uberzubewerten und haufige Wiederholmessungen in Kauf zu nehmen. Ein Ansatz wiire, im Rahmen des Moglichen zu versuchen, EinfluB auf die Festlegung solcher Vorgaben zu nehmen (s. auch ProzeBfahigkeit, Abschnitt I . I ) . Ziel: Abnahrne von, ,V
1 Abb. 5-5Die gemessene Streuung V,,, in der Analytik resultiert aus der Streuung der Methodc VMv und der Streuung der Probe/des Produktes V,,, Erlauterung s. Text.
230
5 Hiiufige Fehler hei d e r Vrrlidierung ~ i n u l y t i s c h Methoden ~~r
5.2
Fehler im Zusammenhang mit der praktischen Durchfuhrung der Validierung
Prazision a) Die Annahme einer Normalverteilung ist falsch, eine Uberprufung z. B. nach David, siehe Abschnitt 3.2 ist empfehlenswert. b) Statt die Methodenprazision zu bestimmen, wird lediglich die MeBprazision bestimmt. Bei der Methodenprazision werden z. B. sechs u n t e r s c ~ i e ~ Einwaagen ~ ~ ~ h e inkl. samtlicher Schritte wie Extraktion, Filtration usw. vermessen, wahrend bei der MeBpriizision eine (stabile) Probe sechs ma1 vennessen wird.
c) Bei ,,zu priizisen" Methoden werden etwas abweichende Werte irrtumlicherweise als AusreiBer ,,erkannt", siehe auch Abschnitt 3.2. d) MiBverstandnisse durch Begriffe, die von den Beteiligten unterschiedlich interpretiert werden. 2. B. Was heiBt ,,6 unabhiingige Bestimmungen"? Folgende Interpretationen waren denkbar: Sechs Einwaagen mit je einem Anwender - Ein Anwender bearbeitet alle sechs Einwaagen Eine Einwaage, sechs Aliquote - Standardabweichung der sechs Mittelwerte aus sechs MeBserien oder aber Standardabweichung der sechs Werte? - Gibt es zu jeder Bestimmung eine eigene Kalibrierung? e ) Statt realer Proben werden Standards vermessen. Aber gerade die Matrix kann die Prazision - und nicht nur diese - beeinflussen! f)
Ermittelte Zahlen sind gar nicht vergleichbar. z. B. - Zur Ermittlung der MeBprlzision werden sechs Bestimmungen durchgefuhrt (eine Probe wird sechs ma1 vermessen). Die Methodenprazision will man vielleicht etwas grundlicher bestimmen und ermittelt zehn Werte (zehn unterschiedliche Einwaagen). Die VK's sind nun nicht mehr vergleichbar. So kann es vorkommen, daR der V , der Methode kleiner ist, als der V , der Apparatur. 1st die Anzahl der MeBwerte nicht identisch, so bleibt der Beitrag der Apparatur zur Gesamtstreuung unbekannt, weil eben die zwei V , 's nicht vergleichbar sind. - Es werden V,'s verglichen, obwohl die Bestimmungen bei unterschiedlichen Konzentrationsniveaus stattfanden. - Trends in Zahlenreihen werden nicht erkannt, weil ausschlieBlich Zahlen, in diesem Fall V,'s, verglichen werden, siehe Tab. 5- 1 [66].Bei der ersten MeBreihe haben wir
5.2 Fehler im Zusammenhung mit der pruktischen Durchfuhrung
23 1
rnit einer Drift zu tun, die Werte der zweiten MeBreihe streuen um den Mittelwert, beim Fall Nr. 3 haben wir eine gute Methodenprazision der Werte bis zum vierten MeBpunkt, Wert 5 und 6 ,,tanZen vollig aus der Reihe". Tab. 5-1 Zur Vergleichbarkeit von MeRwertreihen rnit identischem Variationskoeffizienten, ErIauterung siehe Text. Probe
Fall 1
Fall 2
Fall 3
I
3,50
3,62
3,63
3,56
334
339
339
3,57
3,61
3,64
3,7 1
3,64
5
3,67
3,66
3,50
6
3,75
3,73
3,75
2,50 76
2,50 %
2,50 %
VK
Richtigkeit a) Die Priifung auf Richtigkeit durch Methodenvergleich wird bei nur einer Konzentration vorgenommen, siehe Abschnitt 3.3. b) Der Gehalt von Referenzmaterialien bleibt uber die Zeit nicht konstant. z. B. - Durch Verdampfung des Losungsmittels bei jeder Entnahme aus dem Flaschchen mit dem Standard andert sich die Dichte und somit schleicht sich ein proportional systematischer Fehler ein. - Andern sich die Aufbewahrungsbedingungen durch auBere Einflusse, kann dadurch auch die Stabilitat beeinflufit werden. c) ,,Verfuhrung" durch willkommene Ergebnisse. z. B. Durch eine gute Prazision und eine ausreichende Linearitat neigt man dazu, Richtigkeit als gegeben anzusehen. Hier kann nur dringend empfohlen werden, wenigstens Wiederfindungsexperimente durchzufuhren. d) Beim Methodenvergleich werden zu ahnliche Methoden verwendet. z. B. RP-HPLC rnit einer C,,-Saule und Normal-Phase-HPLC rnit einer CN-Saule. Je unterschiedlicher jedoch das MeBprinzip bei der Richtigkeitspriifung durch Methodenvergleich ist, um so sicherer ist die Aussage, z. B. Chromatographie und Immunoassay.
Robustheit
a) Unterschiedliche Festlegung von Toleranzbereichen von Anwendern, die rnit der selben Methode arbeiten. b) Der Faktor Zeit wird auch irn ,,kleinen" in seiner Tragweite unterschiitzt, z. B.: - Wiihrend der iiblichen Stabilitatspriifungen iiber einen Iangeren Zeitraurn befinden sich die Proben - bis aufdie MeOzeit - im Kuhlschrank. Was passiert mit den Proben einer Partie, wenn sie sich aus einern bestimmten Grunde liinger als ublich im Probengeber bei Raumtemperatur befanden? - Wie stabil ist eine Probe, wenn sie unterschiedlich lange einer bestirnrnten Ternperatur in Kombination mit einern Feststoffkatalysator - wie es die stationiire Phase einer chromatographischen Siiule nun einmal ist - ausgesetzt ist?
Brispirl Retentionszeit 20 min bei 50 "C und nach Optimierung der Methode: Retentionszeit 8 min bei 50 "C Bleibt die ,,Chemie" konstant oder finden an der Oberfllche der stationiiren Phase im ersten Fall Veriinderungen an bestirnrnten Komponenten der Probe statt?
c) Leicht zu iindernde Parameter werden gerne uberpruft und aufwendigere vernachliissigt.
Beispiel: Robustheit in der HPLC - FluUinderung: Zwar wichtig, aber selten kritisch. - pH-Wert-Anderung: Zwar aufwendig, aber fur ionische Verbindungen sehr kritisch und darnit sehr wichtig. - pH-Messung; Temperatureinflu8 im Alkalischen ist vie1 griiBer als die haufigere Uberprufung im Sauren. Systerneignungstest a) Ahnlich der Robustheit werden manchmal leicht xu ermittelnde GriiBen unnotig iiberpriift. Statt einer Bestirnrnung folgender GroBen Retentionsfaktor (k-Wert) Retentionszeit - Trennbodenzahl Peakbreite - Asyrnmetriefaktor - Tailingfaktor konnen nur - ohne Informationsverlust - die Retentionszeit und die Peakbreite, evtl. auch der Asymmetriefaktor, bestirnmt werden, siehe auch Abschnitt 3.4.
5.2 Fehler im Zusammenhang mit der praktischeri Durchfiihrung
233
b) Die Zielsetzung beim Systemeignungstest wird unterschiedlich gehandhabt. Merke: Einfache Bedingungen wie Methanol/Wasser, C ,,-Saule, Testgernisch: Benzol, Toluol, Ethylbenzol oder die beliebten Parabene bei 254 nrn dienen der Gerateverifizierung. Zur Methodenvalidierung wird ,,Spezifisches" gebraucht, z. B. reale Proben und die dazugehorenden Bedingungen. Linearitat
a) Es werden zu wenig Punkte fur einen groljen Konzentrationsbereich bestimmt. Die Gefahr besteht darin, daB der Rechner beispielsweise zwar ein lineares Regressionsmodell errechnet, daB aber die Streuungen im unteren und im oberen Konzentrationsbereich nicht gleich sind, also keine Varianzenhomogenitat herrscht. b) Die Linearitat wird statt rnit Placebo und zudosierten Mengen oder realen Proben, rnit einem Standard, der nur den Analyten enthalt, bestimrnt (Kalibrierung). Damit wird allerdings die Linearitat des Detektors/MeBprinzips und nicht die der Methode uberpruft ! c) Die Berechnungen sind bei kleinen Differenzen aus groljen Werten rnit groljen Fehlern behaftet. d) Man neigt gerne dazu, die Kalibriergerade durch Extrapolation durch den Nullpunkt zu legen. e) Beispiel aus einern Validiemngsbericht ,,. . . Die Linearitat wurde durch dreifach-Bestimmung auf funf Konzentrationsniveaus irn Bereich 70 % - 130 % der angegebenen Konzentration des Wirkstoffs uberpruft. Die errechnete Regressionsgerade geht durch den Nullpunkt, der Korrelationskoeffizient betragt, 0,996 . . ." Dazu muB man folgende kritische Punkte anmerken: 5 Konzentrationen ergibt 15 Punkte. Zu rnehr Sicherheit - allerdings bei groljerem Verdunnungsaufwand - gelangt man bei folgender Kombination - wenn der gesamte Konzentrationsbereich interessiert: Eine Doppelbestirnmung rnit 8 Konzentrationen und entsprechend 16 Punkten. - Ein Bereich von 80 % bis 120 % fur einen Wirkstoff ist ausreichend. - Der Blindwert soll, wo es moglich ist, gemessen und nicht extrapoliert werden. - Fur die Entscheidung, ob ein lineares Regressionsmodell angernessen ist oder nicht, bedarf es der Kenntnis nicht nur des Korrelationskoeffizienten des linearen sondern auch des quadratischen Regressionsmodells. Vielleicht ergibt sich im vorliegenden Fall fur die quadratische Anpassung ein Korrelationskoeffizient von 0,999? Zu den Kriterien fur Linearitiit uber den Korrelationskoeffizienten hinaus, siehe Abschnitt 3.7. - Eine 3-fach-Bestimmung rnit
234 -
5 Hiiujige Fehler hei der Vulidierung unalytischer Methoden
Eine starke Streuung der Werte, d. h., eine geringe Prazision der Methode, verhilft dem Rechner, leicht eine Gerade mit einem relativ guten Korrelationskoeffizienten zu errechnen . . .
Nachweis- und Bestimmungsgrenze a) Werte werden verglichen, obwohl die Nachweisgrenze nach unterschiedlichen Methoden bestimmt wurde. Das ist nicht zulassig, denn das Peak-/Rausch-Verhaltnis beispielsweise ist von der ,,Tagesform" der HPLC-Apparatur inkl. Lampe abhangig. Weiterhin liefert die Blindwertmethode bekanntlich in der Regel kleinere Werte als die Kalibriermethode. b) Die Anzahl der Werte zur Errechnung des Vertrauensbereichs variiert von Labor zu Labor. c) Ahnlich der Prazision und der Linearitat werden auch hier fur die Bestimmung oft statt einer realen Probe matrixfreie Analytlosungen verwendet. Selektivitat Wie bereits an anderer Stelle erwlhnt, ist die Uberprufung der Selektivitat am aufwendigsten in der Chromatographie. Folglich herrscht hier die groRte Gefahr fur Fehler. Zur Erlluterung wird ein Abschnitt aus einem Validierungsbericht einer HPLC-Methode zitiert: ,,. . . Zwei Belegchromatogramme mit allen Vor-, Neben- und Abbauprodukten liegen vor. Die Selektivitat wird belegt durch Vergleich der Retentionszeiten der Kalibriersubstanzen". Bei der Beurteilung miissen folgende kritische Punkte beachtet werden: a) Ein ,,Beweis" der Selektivitat durch Vergleich von Retentionszeiten ist, vor allem bei rnehreren Peaks in komplexen Proben, eine risikoreiche Angelegenheit. Die Verwendung eines DAD und eine gezielte Anderung von chromatographischen Parametern, siehe Abschnitt 3.5, ist der rninimalste Aufwand, der bei wichtigen Proben unbedingt in Kauf genommen werden muR. Bei unbekannten und/oder komplexen Proben kommt man um eine LC-MS Kopplung - am sichersten im multiple reaction mode, MRM - nicht herum.
b) Bezuglich des Vergleichs von Retentionszeiten sollte an Folgendes gedacht werden: - Handelt es sich bei bei den Chromatogrammen um etwa die gleichen Konzentrationen? Gerade in komplexen Gemischen ist die Saule schnell lokal uberladen, es werden konzentrationsabhangige Retentionszeiten beobachtet. - Sind die bekannten Komponenten einzeln oder als Gemisch injiziert worden? Auch hier kann sich die Retentionszeit einer Komponente andern, je nach dem, ob sie einzeln oder zusammen mit anderen Stoffen durch die Saule wandert. Dieses Verhalten
5.2 Fehler im Zusammenhang mit der prcrktischerr Durchfihrung
235
wird in Abb. 5-6 und 5-7 fur HPLC-Trennungen in der Qualitatskontrolle demonstriert. In Abb. 5-6 ist die Injektion zweier Komponenten als interner Standard, in Abb. 5-7 die Injektion des internen Standards zusammen mit einer Probe gezeigt. Die Retentionszeiten bleiben konstant. Im zweiten Fall gibt Abb. 5-8 die Injektion eines internen Standards zusammen mit der Probe wieder, in Abb. 5-9 wird diese Injektion wiederholt, nachdem die erste Komponente zudosiert wurde. Es wird eine kleine, jedoch eindeutige Retentionszeitverschiebung festgestellt:
3,0 min 3,s min 4,9 min
-+ 2,4 min + 3,2 min + 4,6 min
Je groBer die Anzahl der Peaks urn so groljer die Gefahr fur eine falsche Peakzuordnung.
7.3
5
10
RT (min)
1'0
RT (min)
Abb. 5-6 Inicktion cines internen Standards.
I
7,3
5
Abb. 5-7 lnjcktion dcs internen Standards usammen mit der Probe; die Retentionweiten der zwci Standardkomponenten bleiben konstant (7,3 und 8,1 min).
L
l
l
l
l
l
l
l
l
l
l
r
1
1
1
1
1
1
1
I
I
1
I
I
I
'
Abb. 5-8 Injektion cine9 intcrncn Standards /,usammen mit clcr Prohc.
c ) Sind die bekannten Komponenten als reine Standards injiziert oder einer realen Probe/ Placebo zudosiert worden? 1st der EinfluR der Matrix auf die Retentionszeit bekannt?
d ) 1st das Probeliisungsmittel und Injektionsvolumen in beiden Fiillen identisch? Es liegt in der Natur der Sache, dal3 genannte Punkte eher in komplexen, matrixbelasteten Proben eine Rolle spielen, wlhrend z. B. diese Problematik bei einer Gehaltsbestimrnung in der Pharma-Qualitiitskontrolle mit genauer Kenntnis uber die Probe vermutlich untergeordnet ist. Es wird empfohlen, gemachte und potentiell erkannte Fehler in Form einer open-end Liste als Bestandteil der Prufvorschrift fur die Lebensdauer der Methode zu erstellen. Diese gehort naturlich nicht nur in das Archiv sondern sie sollte ,.leben", ihr PlatL ist beim Anwender im Labor.
5.2 Fehler ini Zusuninienhun,qrnit der praktischen Durchfchrung
237
Abb. 5-9 Wie hci Ahb. 5-8 jedoch nach Zudosierung eincr Komponente; es wird eine leichte Ahnahme der Retcntionszeiten festgestellt.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Teil C Zur Validierung einzelner Techniken und Gebiete Mit Beitragen von:
Agilent, Aventis, BAM,Bayec Hessische Landesanstalt fur Umwelt, Hoffmann - La Roche, Merck, Schering, Schott, Spectral Service
6
Techniken und Gebiete
6.1
Validierung in der Spektroskopie
Werner Ockels, Spectral Service, Koln
6.1.1
Einleitung
Spektroskopie hat verschiedene Anwendungsbereiche, fur die der Validierungsbedarf unterschiedlich ist. Sie wird in ihrer ursprunglichen Form zur Strukturaufkliirung oder Identifizierung von chemischen Substanzen eingesetzt. Der Begriff ,,Spektroskopie" ist aus dem Griechischen abgeleitet und bedeutet soviel wie ,,ein Bild anschauen", und in der Tat will man sich bei der Strukturaufkliirung ,,ein Bild von der Substanz machen". Der Validierungsbedarf ist bei dieser Anwendung eher gering. Spektren sollten in einem gewissen Rahmen reproduzierbar sein, man kennt fur die verschiedenen spektroskopischen Methoden diverse EinfluBgroOen, die das Aussehen eines Spektrums beeinflussen. Den Spektroskopiker interessiert weniger die exakte Reproduzierbarkeit eines Spektrums, sondern vielmehr das ,,Muster" der spektroskopischen Daten, im Englischen als ,,pattern", der Vorgang als ,,pattern recognition" bekannt. Zu einem Spektrum gehoren daher immer die Aufnahmebedingun-
gen und die verwendeten Materialien. Der Fachmann kann dann beurteilen, ob Abweichungen relevant sind oder nur auf unterschiedliche Bedingungen der Aufnahme zuruckzufiihren sind. Im folgenden ist fur die einzelnen Methoden zusammengestellt, welche Parameter kontrolliert und angegeben werden mussen. Prinzipiell sollte zu den Rohdaten immer ein Ausdruck mit den verwendeten MeRparametern gehoren.
6.1.2 Infrarot-Spektroskopie Mit einern geeigneten Referenzmaterial (z. B. Polystyrolfolie) ist regelmiiBig zu prufen, ob die Wellenliingenkalibrierung und die Intensitiit der Banden korrekt ist.
Einem Spektrum sollten folgende Angaben beigefiigt sein: Typ und Hersteller des Instruments, verwendete Software Anzahl der akkumulierten Pulse (nur bei FT-IR) Art der Probe (KBr-PreOling, Flussigkeit in Kuvette, Film, Gas etc.) Probenkonzentration. -
6.1.3 UV/VIS-Spektroskopie Mit geeigneten Referenymaterialien ist regelmal3ig zu prufen. ob die Wellenliingenkalibrierung und die Intensitat der Banden korrekt ist. Das DAB empfiehlt, zur Wellenliingen-Kontrolle eine Holniiumperchloratlisung zu verwenden. Mit einer Kaliumdichromatliisung bectimmter Konzentration wird die molare Extinktion bei festgelegter Wellenliinge kontrolliert. Die Vorgehensweise ist im DAB beschrieben. Einem Spektrum sollten folgende Angaben beigefugt win: Typ und Hersteller des Instruments, verwendete Software Liisungsmittel und Konzentration der Probe Referenzmaterial bei Zweistrahlmessungen Kuvettendaten (Material. Schichtdicke).
-
6.1.4 Massenspektroskopie Bei einem Massenspektrometer m u 8 die Massenzuordnung regelmaOig tnittels einer geeigneten KalibriersubstanL iiberpruft werden; bei Abweichungen muB eine neue Kalibrierung vorgenommen werden. Je nach Geratetyp, Massenbereich und Ionisierungsmethode kotnmen verschiedene Substanzen in Betracht. Elrktrorienstc~~~-lorii.strtioii (+El): Quadrupol-Instrumente init einem Massenbereich bis 650 amu (atomic mass units) werden meistens mit Pertluortributylatnin (Heptacosa, FC4.3) kalibriert, wiihrend man Sektor-
6. I Rilidierung in cier Spektroskopie
24 1
feldgerate mit Perfluorkerosen (PFK) his etwa 900 amu kalibriert. Verschiedene Perfluoralkyltriazine konnen bis 1500 amu eingesetzt werden.
Chemische ionisation (-+Ci): Man benutzt meistens dieselbe Ionenquelle wie bei +El und verlilJt sich daher aufdie +EIKalibrierung. Es gibt fur CI keine Kalibriersubstanzen, die uber den Massenbereich verteilt genugend Stutzpunkte liefern. Man konnte sich eine Mischung iius verschiedenen Substanzen herstellen, jedoch ist die Gefahr einer Kontaminierung des Instruments zu gro13. Fast Atom Bombardment-lonisation(kFAB): Meistens wird CsJ verwendet, welches eine Kalibrierung von 130 amu bis ca. 4000 amu erlaubt. Die Massenstutzpunkte liegen immer 127 bzw. 133 amu auseinander. Falls es erforderlich ist, unterhalb von 130 amu zu kalibrieren, kann man eine Mischung aus N d l RbJ/CsJ einsetzen, die zudem dichter folgende Massenstutzpunkte liefert und daher eine priizisere Massenkalibrierung gewiihrleistet. Thermospray- und Elektrospruy- Ionisierung (kTSP/kESI) hei LC/MS: Der genutzte Massenbereich betragt selten mehr als 2000 amu, geeignet sind verschieden hoch polymerisierte Polyglykole (PEGS), oft als Mischung eingesetzt. Die verschiedenen Typen von Massenspektrometern, die heute gebriiuchlich sind, liefern durchaus von derselben Substanz deutlich unterschiedliche Massenspektren. Deshalb ist der Typ des Massensanalysators (Quadrupol, Ion Trap, Sektorfeld, TOF, FT-MS) grundsitzlich anzugeben. Weiterhin mu13 ein Massenspektrometer regelma13ig feinabgestimmt (Tuning) werden, wobei auf Peakform, Auflosung und Intensitatsverteilung uber den Massenbereich geachtet werden mu13. Empfindlichkeitstests mit einer der Fragestellung angepal3ten Substanz (z. B. Methylstearat, Hexachlorbenzol, Benzophenon, Coffein, Adenosin) sollten ebenfalls regelmaBig durchgefuhrt und dokumentiert werden. Einem Spektrum sollten folgende Angaben beigefugt sein:
- Typ und Hersteller des Instruments, verwendete Software
Ionisierungsmethode (+EI, C I , +FAB, kTSP, +ESI, kAPCI) ProbeneinlaRmethode (Direktprobe, GC/MS, LC/MS usw.) - Verdampfungstemperatur (bei G C M S Trennsiiule und Temperaturprogramm) Scan-Bereich und -Geschwindigkeit - Ionenquellentemperatur. -
6 . I .5
NMR-Spektroskopie
Beim NMR-Spektrometer ist regelmii13ig eine Uberprufung der Auflosung (mit o-Dichlorbenzol) und der Peakform (Hump-Test, CHCI, in Aceton-d6) durchzufuhren. Die Kalibrierung der Chemischen Verschiebung wird bei 'H-NMR und "C-NMR bei jeder Messung durch einen geeigneten internen Standard gewahrleistet (Tetramethylsilan, TMS). Bei
"F-NMR bezieht man sich auf eine Messung von CCI,F, bei "P-NMR auf Phosphorsiiure (externe Kalibrierung). Die Chemische Verschiebung wird durch viele Parameter beeintluBt. Wichtig sind das verwendete Losungsmittel, die Konzentration und der pH-Wert (bei wiiRrigen Systemen). Die Intensitatsverhiiltnisse werden durch die Relaxationszeit beeinfluat. Das Signal/Rauschverhiiltnishiingt aul3er von der Konzentration der Probe von der Anzahl der akkumulierten Pulse ab. Das Aussehen des Spektrurns iindert sich auch durch die mathematische Nachbehandlung der Rohdaten, z. B. GauR-Multiplikation. Einem Spektrurn sollten folgende Angaben beigefugt sein: Typ und Hersteller des Instruments, verwendete Software Art des gemessenen Kerns, MeBfrequenz (z. B. ' H . 300MHz) Relaxationsdelay Anzahl der akkumulierten Pulse Datenpunkte, Frequenzbereich Pulswinkel Angaben zur mathematischen Behandlung (Processing). -
~
Die Durchfiihrung der angegebenen Tests und die Angabe der wesentlichen Parameter gewiihrleisten vergleichbare und reproduzierbare Spektren. die zur Identifizierung. Strukturaufklarung und Charakterisierung von Substanzen eingesetzt werden konnen. Weitere MaBnahrnen zur Validierung sind bei diesen Einsatzgebieten nicht sinnvoll. Spektroskopische Methoden werden aber zunehmend auch zur Quantifizierung eingesetzt. Oft sind sie dann gekoppelt mit chromatographischen Methoden. die Spektrometer fungieren als Detektoren. Hier sind prinzipiell dieselben Anforderungen gestellt wie bei klassischen chromatographischen Methoden, wobei die HPLC-UV- und in zunehmendem MaRe die HPLC-MS(MS)-Kopplung die bekanntesten Beispiele sind. Man mu8 prinzipiell jedoch unterscheiden zwischen zwei verschiedenen Gegebenheiten. Es gibt Methoden, bei denen wesentliche Teile des MeBsystems kontaminiert werden und solche, bei denen dies nicht der Fall ist. Als Extrernfall der ersten Sorte ist das Massenspektrometer zu nennen, ein Beispiel fur den zweiten Fall ist das NMR-Spektrometer. Ein Massenspektrometer iindert seine Eigenschaften von Messung zu Messung. Man beobachtet, dali GC/MS-Messungen nach einer Ruhepause des Geriites deutlich hiihere Peakflachen Leigen als in den direkt folgenden. Dies wird u. a. duroh die Belegung der Ionenquelle mit Wasser, Losungsmitteln oder auch dem Analyten bewirkt. Dies hat einen EinfluB auf die Fokussierung des Ionenstrahls und damit auf das MeBergebnis. In MeRpausen vertluchtigen sich diese Belegungen, man niihert sich wieder den Ausgangsbedingungen. Dies erschwert die Validierung einer Quantifizierungsmethode erheblich und 1st bei der Planung der MeBserien zu berucksichtigen. Die haufig schlechten statistischen Daten von MS-Validierungen sind auf derartige Phiinomene zuruckzufuhren. Eine hohe Anzahl von Qualitatskontrollproben ist erforderlich, um auf Probleme bezuglich der Ernptindlichkeit und Leistung des Instrumentes rechtzeitig aufmerksam zu werden. Weniger anfiillig sind diesbezuglich LC/MS-Methoden. Bei Einzelionenmessung (Single lon Recording (SIR), Single Ion Monitoring (SIM)) wird auch die Massenspektrometrie zur akkumulierenden Methode. Man kann individuell fur jedes gemessene Ionensignal die Zeitspanne festlegen, in der Daten akkumuliert werden (Dwelltime). Bei Validierungen massenspektrometrischer
6. I Validierung in der Spektroskopie
243
Quantifizierungen ist dieser Parameter unbedingt zu beriicksichtigen. Man wird ihn nicht variieren, seine GroBe ist aber zu dokumentieren und wahrend der MeBserie konstant zu halten. Die Dwelltime kann nicht beliebig lang gewlihlt werden, da die Summe der Zeitspannen fur die einzelnen Ionensignale einem ,,Scan" entspricht, sie sollte bei Kapillarsaulen eine Sekunde nicht uberschreiten, da man ansonsten chromatographische Auflosung verliert. Die Massenspektrometrie hat ihren Vorteil in der hohen Spezifitat und hohen Empfindlichkeit. Schwierigkeiten bereitet zuweilen die mangelnde Dynamik. Man beobachtet haufig gute Linearitat bei Proben geringer Konzentration, wahrend hohe Konzentrationen nicht korrekt (zu niedrig) wiedergegeben werden. Bei hohen Konzentrationen werden in der Ionenquelle nicht mehr alle Molekule ionisiert, so daB das resultierende Signal nicht mehr proportional der Konzentration ist. Weitere Fehler konnen durch StoBreaktionen (Chemische Ionisation) und damit Anderung der Fragmentierung und damit des Spektrums entstehen. Theoretisch laBt sich eine Substanz massenselektiv auch dann noch erfassen, wenn das Signal von einer anderen Substanz uberlagert wird. 1stjedoch das Signal der uberlagernden Substanz wesentlich groBer, reagiert die Ionenquelle mit dem beschriebenen nichtlinearen Verhalten. Eine Methodenvalidierung sollte diese Punkte berucksichtigen. Auch in der Gaschromatographie andem sich die Bedingungen von Messung zu Messung. In einer Probe konnen Substanzen enthalten sein, die das Injektor-Insert oder die Trennsaule so verandern, daR bei der folgenden Messung Absorption oder veranderte Peakform zu Problemen fuhren konnen. Bei der Validierung wird man solche Falle nicht einkalkulieren konnen. Die UV-MeBzelle einer HPLC-Anlage ist ebenfalls der Probe ausgesetzt, nicht jedoch die Strahlungsquelle und der Detektor, z. B. ein Diodenarraydetektor. Auch die Trennsaule und das Probenaufgabesystem sind weniger anfallig als in der Gaschromatographie. Bei der IR-Spektroskopie wird das MeBsystem nicht kontaminiert. Reproduzierbarkeitsmessungen zeigen daher exzellente statistische Werte. Eine Ausnahme ist die GC/IR-Kopplung, hier gelten die Einschrankungen der Gaschromatographie, bezuglich der MeBzelle ist die Situation ahnlich wie bei der HPLC-UV-Kopplung. Auch bei der NMR-Spektroskopie wird das MeBsystem nicht kontaminiert. Mehrfache Messungen derselben Probe ergeben praktisch identische Ergebnisse, Unterschiede kann man hochstens im statistischen Rauschen der Basislinie erkennen. Daher ist bei der Validierung einer Methode das Augenmerk weniger auf das Meainstrument zu richten, als auf die Probenvorbereitung. Eigenartig erscheint fur Viele das Problem der variablen Nachweisgrenze in der NMRSpektroskopie. Die Nachweisgrenze wird wie ublich durch Signal/Rausch-Verhaltnis(S/N) definiert, dieses aber hangt wie bei allen akkumulierenden Methoden von der Zahl der akkumulierten Messungen ab. Theoretisch verbessert sich das S/N-Verhaltnis mit der Quadratwurzel aus dem Faktor der Akkumulation. Bei der 4-fachen Anzahl der Pulse wird demnach das S/N-Verhaltnis verdoppelt. Es ist daher problemorientiert zu entscheiden, welches S/N-Verhaltnis benotigt wird, denn sinnlos lange MeBzeiten vergeuden Geld. Bei einer Validierung einer NMR-Methode ist die Anzahl der Pulse einzubeziehen, da uberraschenderweise eine unnotig hoch gewahlte Anzahl das Ergebnis trotz des verbesserten S/N-Verhaltnisses sogar verschlechtem kann. Bei automatischer Integration kann dies durch ungunstig gewahlte Integrationsgrenzen zu fehlerhaften Ergebnissen fuhren.
Die oben genannten HaupteinfluRgroRen auf ein NMR-Spektrum mussen in die Validierung einbezogen werden. Die Losungsmittelzusammensetzung und der pH-Wert der waBrigen Phase sollten unter dem Gesichtspunkt der .,Robustheit" der Methode beriicksichtigt und getestet werden. Auf Qualitatskontrollproben kann weitgehend verzichtet werden, der Bedarf richtet sich nach den Erfordernissen der Probleme bei der Probenvorberei tu ng . Quantifizierungen mit NMR-Spektrometrie zeigen typischerweise exzellente Linearitat uber einen weiten Bereich, bisher konnten nichtlineare Kalibrierungen immer auf Fehlerquellen bei der Probenvorbereitung zuruckgefiihrt werden. Bei der Quantifizierung von Phospholipiden mittels 3 ' P-NMR-Spektroskopie fanden wir bei einer MeSserie niit 32 unabhangigen Einwaagen fur die Hauptkomponente eine prozentuale Standardabweichung von < 0,7 56, fur eine Komponente im Bereich der Nachweisgrenze betrug sie < 4 %.
6.2 Widirrung von Anal~senrwfiihrenniit ICP-OES
6.2
245
Validierung von Analysenverfahren mit ICP-OES
Siegfried Noack, BAM Berlin
6.2.1 Einleitung Die ,,Optkche Emissionsspektralanalyse rnit induktiv gekoppeltem Plasma" (ICP-OES) ist eine kalibrierbedurftige Analysenmethode zur Untersuchung von Losungen der zu bestimmenden Elemente. Haufigstes Ziel einer Probenvorbereitung fur eine ,,ICP-Messung" ist es daher, eine (meist saure) wassrige Probenlosung zu erhalten. Es konnen aber auch organische Losungsmittel (z. B . fur Proben auf organischer Basis) verwendet werden. Bei einer Analyse rnit ICP-OES wird die Probenlosung z. B. rnit Argon zu einem Aerosol zerstaubt und das Aerosol in ein toroidales induktiv gekoppeltes Plasma eingebracht. Im Plasma verdampft das Aerosol, wird atomisiert, teilweise ionisiert und zur Emission seiner elementspezifischen Strahlung angeregt. Die Strahlung gelangt in ein optisches System, in dem diese nach der Wellenlange zerlegt wird. Je nachdem ob es sich um ein simultan oder sequentiell arbeitendes Spektrometer handelt, werden die den verschiedenen Wellenlangen zuzuordnenden Strahlungsanteile gleichzeitig oder in zeitlicher Aufeinanderfolge gemessen. Die Detektion erfolgt uber Photoelektronenvervielfacher(,,Photomultiplier") oder auch uber Flachendetektoren nach dem Prinzip eines CCD-Chips, wie er auch fur Videokameras verwendet wird. Es werden elementspezifische elektrische Signale erzeugt, deren Hohe bzw. Flache abhiingig ist von den Elementkonzentrationen in der Probelosung. ZusammengefaBt beruht das Prinzip der ICP-OES auf folgenden Vorgangen: -
Zerstaubung der Probenlosung unter Schutzgas (z. B. Argon)
- Einbringen des Aerosols in ein induktiv gekoppeltes Hochfrequenzplasma (ICP) - Uberfuhren der Probe in den ,,Plasma-Zustand" durch:
Trocknung Schmelzen Verdampfen Dissoziation in freie Atome Teilweise Ionisation - Anregung der freien Atome bzw. Ionen - Emission elementspezifischer Strahlung - Elementspezifische Detektion der Strahlung nach Wellenlangen und Intensitat.
Wegen der Kalibrierbedurftigkeit sind sowohl die Richtigkeit als auch die Unsicherheit der Ergebnisse einer mit ICP-OES durchgefiihrten Elementbestimmung in hohem MaOe von der Cute der Kalibration ahhiingig. Die Unsicherheit der erhaltenen Analysenergebnisse wird daruberhinaus auch noch von einer Vielzahl weiterer methodenbedingter EinfluOgroDen bestimmt. auf die im Abschnitt ,,Optimierung methodenbedingter Leistungsmerkmale der ICP-OES" eingegangen wird. Bei der Validierung von ICP-OES-Verfahren sind - wie bei anderen Analysenmethoden zwei Kategorien von Leistungsmerkmalen zu unterscheiden:
I . Allgemein ubergeordnete analytischen Leistungsmerkmale 2. Methodenbedingte Leistungsmerkmale. Letztere haben z. T. einen entscheidenen EinfluO auf die Richtigkeit der Ergebnisse. Im folgenden werden die methodenbedingten Leistungsmerkmale beschrieben. Ihre Optimierung wird im Hinblick auf die allgemeinen analytischen Leistungsmerkmale bei der Validierung eines Analysenverfahrens erlautert.
6.2.2
Beschreibung methodenbedingter Leistungsmerkmale der ICPOES
6.2.2.1 Spektrale und nicht spektrale Storungen
Spektrulo Stiirungen diirch Litiieniiherlageruti~~c~ii Spektrale StBrungen durch Linienuberlagerungen konnen in folgende Kategorien eingeteilt werden: Linienuberhppung der Analysenlinie durch eine Link eines anderen Elementes. Kriterien fur das AusmaR der Linienuberlappung sind die physikalische Linienbreite, die praktische Auflosung des Spektrometers, der Abstand zwischen Analysen- und Starlinie und das Intensitatsverhdtnis von Analysen- zu Storlinie. Ein Spezialfall ist die Lage einer Analysenlinie auf der Flanke einer stark emittierenden Linie. Uberlappung einer Molekulbande (z. B. N, und NO zwischen 200 und 240 nm, OH und NH zwischen 300 and 340 nm, CN zwischen 380 and 390 nm) mit der Analysenlinie. Anhebung des Untergrundes durch Rekombination (z. B. Aluminium zwischen 190 und 220 nm). Untergrundanhebung durch Streulicht.
Nicht-spektrule StBrungen Diese Storungen betreffen zwei Bereiche: 1. Zerstiiubung (physikalischer Natur) 2. Plasma (chemischer und physikalischer Natur).
6.2 Vulidierung von Atici!\seizvert~ihrL.n mit ICP-OES
247
Die Prufung der methodenspezifischen Leistungsmerkmale ist notwendig, da gewiihrleistet sein muB, daS sowohl bei der Kalibrierung als auch bei der Messung der Probenlosung der lediglich auf den Analyten zuruckfiihrbare MeBwertanteil korrekt ermittelt wurde. Die Signale sind also auf ,,Storungsfreiheit" zu iiberpriifen (s.Abschnitt ,,Optimierung methodenbedingter Leistungsmerkmale"). Transport-Storungen Unterschiede in der Viskositat, der Oberflachenspannung und der Dichte zwischen Probenund Kalibrierlosungen konnen die zur Analyse gelangende Losungsmenge, die Transportrate und die TropchengroBenverteilung im Aerosol beeinflussen. Damit kann es bei der Messung von Proben- und Kalibrierlosungen trotz gleicher Analytkonzentration zu unterschiedlichen Intensitaten kommen.
-
Storungen durch die Anregungsquelle Bei wechselnder Matrix ist die Folge meist auch eine Anderung der Anregungsbedingungen im Plasma, wodurch sich haufig auch eine Anderung der Selektivitat ergibt. Oft ist die Ursache eine Anderung der Konzentrationen von Elementen, die leicht zu ionisieren sind, z. B. Alkalielemente. Diese fuhren generell zu einem Intensitltsanstieg von Atotnlinieri und eine Reduktion der Intensitiit von lonenlinien.
-
6.2.2.2 Untergrundermittlung Die Untergrundermittlung und eine entsprechende Korrektur des ,,Bruttosignals" ist immer dann notwendig, wenn der lntensitatsbeitrag durch den Untergrund nicht vernachIiissigbar ist bzw. wenn man davon ausgehen muR, daB die Untergrund-Intensitaten bei verschiedenen Losungen unterschiedlich und die Brutto-Signale somit nicht vergleichbar sind. Zudem ist zu beriicksichtigen, daR der Untergrund anderen Schwankungen unterliegt als der reine Intensitatsbeitrag des Analyten. Eine Untergrundkorrektur wird so vorgenommen, daB das simultan oder sequentiell zum Bruttosignal ermittelte Untergrundsignal vom Bruttosignal abgezogen wird (,,Nettosignal"). Es ist jedoch zu bedenken, daR durch eine Untergrundkorrektur zwar die Richtigkeit des Ergebnisse erhoht, die Prazision durch die Fehlerfortpflanzung jedoch verschlechtert wird. Bei sequentiell messenden Geraten kommt noch hinzu, daB die Messungen von Bruttound Untergrundsignal streng genommen nicht vergleichbar sind, da sie nicht zur gleichen Zeit erfolgen.
6.2.2.3 Kurzzeit- und Langzeitstabilitat (Drift) Eine korrekte Ermittlung der MeBwerte im Sinne einer Vergleichbarkeit derart, daB zwischen MeSwertbeitrag des Analyten (,,Netto-Intensitat") und der Analyt-Konzentration eine Proportionalitat besteht, ist nur gewahrleistet, wenn ein und dieselbe Losung stets zu den gleichen MeBwerten fiihrt.
Wiihrend einer Einzelmessung mu13 eine Kurzzeit-Stabilitit gewiihrleistet sein, d. h. da13 zumindest die Gesamtzahl der ,,gesammelten Counts" innerhalb der lntegrationszeit konstant sein muB. Eine Langzeitstabilitiit muB mindestens uber den Zeitraum gewiihrleistet sein. fur den ein und dieselbe Kalibration gultig ist.
6.2.3 Optimierung methodenbedingter Leistungsmerkmale der ICP-OES Im Hinblick auf die allgemeinen Validierungskriterien eines Verfahrens wie 1. GenauigkeitskenngroRen:
Priizision Richtigkeit Ergebnisunsicherheit 2. Bereichsgrenzen: Background Equivalent Concentration (BEC) Nachweisgrenze Erfassungsgrenze Bestimmungsgrenze
3. KenngroBen der Kalibrierfunktion: Linearitiitsbereich Arbeitsbereich Empfindlichkeit 4. Robustheit 5 . Selektivitiit/Spezifitat
sind die in Tab. 6- 1 gezeigten methodenspezifischen Leistungsmerkmale zu optimieren. Als Voraussetzung fur die Optimierung der Leistungsmerkmale bzw. die Robustheit eines ICP-OES-Verfahrens sind zuniichst die folgenden Betriebsparameter einzustellen bzw. folgende Geriiteparameter zu kontrollieren:
Einzusrellrrzde Betriebspururnrtrr: Hochfrequenzleistung Beobachtungshohe - DurchfluD und Eingangsdruck des ,.Zerstiiubergases" - DurchfluB des ,,Plasmagases" - Durchf-luBdes ,,Hilfsgases" - Probendurchsatz (ml/min) - Spulzeit zwischen den Einzelmessungen -
6.2 Vulidierung von Anulysenvrtjiuliren mit ICP-OES
249
Tab. 6-1 Optimierung methodenspezifischer Leistungsmerkmale bei der ICP - OES. Validierungskri terium
Methodenspezifische Leistungsmerkmale
Richtigkeit
-
Prazision
EinstelIung/MaRnahmen -
-
Verhaltnis zwischen Nettound Unter&rund-Si&nal Spektrale Storungen durch Linienuberlagerungen Nicht-spektrale Storungen
-
-
Matrixanpassung, ggf. Verdunnung, ausreichende Spulzeit zwischen den Messungen der Liisungen
-
Stabilitat der Signale
-
-
MeBzeit
Vcrmeidung von Kurz- und Langzeitdriften, ggf. Dirftkorrektur
-
Optimierung der MeBzeit hinsichtlich Kurz- und Langzeitdriften
-
GroBtmGgliches Verhaltnis Messung auf stijrungsfreien Linien, ggf. Korrektur
BEC
-
Verhaltnis zwischen NettoSignal und Untergrund-Signal
-
GrliRtmiigliches Verhaltnis
Nachweisgrenze
-
Verhaltnis zwischen Nettosignalhohe und Untergrundschwankungen
-
Gr(il3tmBgliches Verhaltnis
Linearitat
-
Proportionalitat zwischen Nettosignal und Massenkonzentration
-
Statistischer Linearitatstest
Arbeitsbereich
-
Bereich zwischen unterer und oberer Bestimmungsgrenze
-
Ermittlung der unteren und oberen Bestimmungsgrenze
Robustheit
-
Minimierung des Einflusses von Gerateparametern auf die Signalhohe
-
Einstellung der Gerateparameter nach Angaben des Herstellers
Selektivitav Spezifitat
-
Freiheit von Linienuberlagerungen
-
Messung auf storungsfreien Linien
Zu kontrollierende Gerateparameter:
Gerateparameter
Kontroll-Eigenschaft
Ausrichtung der Quarz-Zylinder der Plasrnafackel untereinander
Konzentrische Anordnung
Ausrichtung der gesamten Plasmafackel gegenuber der Hochfrequenzspule
Konzentrische Anordnung
250
6
T d i i i I k o i i irtitl
G~~hirre
Oberfliichenbeschaffenheit der Fackel
-
Ablagerungsfreiheit Glattheit der Quar7-Zylinder
Justierung des .,Analysenkanals"
Ausrichtung auf die opticche Achse des Systems
Hochfrequenzleistung
Korrekte Abgabe und Stabilitat
Hochfrequenzspule
Korrekte .,Geometric“
Zerstiiubereinrichtung
Blockierfreiheit der Kapillaren
Gasstriime
Korrekte Einstellung und Stabilitat
FSrderputnpe
Stabilitiit der Forderrate
Optischea System
Durchliissigkeit des Systems
Wenn notwendig: Thermostatisierung
Temperaturkonstanz
Wenn notwendig: Wasserkuhlung
Ausreichender und ,,funktionsfiihiger" WasserzufluR (Druck!)
Einstellungen am Detektor
Entsprechend der Geriiteanleitung
6.2.3. I
Spektrale und nicht spektrale Storungen
Sprktrtrlt. StBrungt~r?durcli Liriieiiiiht.t-ltrjier~n~rIi Grundsiitzlich sollte auf Linien gemessen werden, die von den anderen in der Probe enthaltenen Elementen nicht oder nur vernachliissigbar gestiirt werden. Ob eine Linie als ,,st& rungsfrei" anzusehen ist, kann GberschlagsmaOig aus den in der Software meist integrierten Wellenlangentabellen entnommen werden. Man mufi aber davon ausgehen, daB die Wellenliingentabellen nicht alle Storlinien enthalten. Besser ist deshalb die Vorgehensweise, die in Frage kommenden Stiirelemente bei der MeBwellenlange des vermeintlich des gestorten Elementes zu messen. Hierzu verwendet man zweckmiifiigerweise ,,Ein-Element-Losungen" der in Frage kommenden ,,Starer". Voraussetzung fur eine Storungsermittlung ist, daB es sich jeweils um hochreine Losungen der Stiirelemente handelt: Es mu8 sichergestellt werden, daR ein eventuell auftretendes Signal tatsachlich von dem Storelement hervorgerufen wird und nicht von einem Element, mit dem wiederutn die Pruflosung verunreinigt ist. Prinzipiell kommen als Stiirelemente alle Elemente in Frage, die in der Probe enthalten sind. Eine Korrektur kann vorgenommen werden, wenn man ermittelt, welche Konzentration des Stiirelementes welche Analytkonzentration vortauscht. Das Vorhandensein spektraler Storungen bei Verwendung von ,,Multielementlosungen" bei der Kalibration kann erkannt werden, wenn man dafur sorgt, daB das Konzentrationsverhiiltnis der Elemente in den einzelnen Kalibrierliisungen moglichst unterschiedlich ist. Eine spektrale Storung eines Elementes wurde sich dann mit griiRer Wahrscheinlichkeit durch eine Nicht-Linearitiit der Kalibrierfunktion zu erkennen geben.
6.2 Vulidierung von AnnlysenverJithrm mit ICP-OES
25 1
Nicht-spektrale Storungen Eine Minimierung des Einflusses nicht spektraler Storungen ist moglich durch: - Matrixanpassung der Kalibrierlosungen an die Zusammensetzung der Probenlosung - Verdiinnen der Probenlosung -
-
Transport-Storungen Transportstorungen konnen durch Verwendung einer peristaltischen Pumpe reduziert werden. Alle Losungen sollten bei der gleichen Temperatur gemessen werden. Storungen durch die Anregungsquelle Durch die Anregungsbedingungen bedingte Storungen konnen durch folgende MaBnahmen beseitigt bzw. minimiert werden: Optimierung der Plasmabedingungen durch Veranderung der Leistung, des Zerstauber-Gasstroms und der Beobachtungshohe Matrixanpassung oder Verdunnen der Probenlosung Verwenden eines inneren Standards Anwendung der Standard-Additionsmethode.
6.2.3.2 Untergrundermittlung Es ist grundsatzlich darauf zu achten, daB der Untergrund nicht auf einer ,,spektralen Struktur" ermittelt wird, also z. B. auf der Flanke eines weiteren Peaks, sondern daB es sich nach Moglichkeit nur um den ,,natiirlichen" Untergrund (Kontinuum) handelt. In der Regel unterscheidet man drei Falle: a) Gleiche Untergrundhohe auf beiden Seiten der Analytlinie: In diesem Fall ist es statthaft, den Untergrund nur auf einer Seite so nahe wie moglich an derAnalytlinie zu messen. Der Abstand zu einer anderen Linie sollte aber mindesten 2-3 Peak-Halbwertsbreiten betragen. Wenn eine unerwartete Steigung des Untergrundes anzunehmen ist, dann ist es gunstiger, auf beiden Seiten des Peaks zu messen. b) Unterschiedliche Untergrundhohe auf beiden Seiten der Analytlinie - Lineare Zunahme des Untergrunds: In diesem Fall hat der Untergrund eine positive oder negative Steigung und ist auf beiden Seiten des Analysenpeaks zu messen. Der eigentliche Untergrundwert ist dann durch Interpolation zu ermitteln (bei gleichem Abstand der MeBpunkte zum Peakmaximum ist dies die Halfte der Summe beider Meflwerte). c) Unterschiedliche Untergrundhohe auf beiden Seiten der Analytlinie - Nicht-Lineare Zunahme des Untergrunds: In diesem Fall hat der Untergrund einen gekrummten Verlauf und kann nur uber eine mathematische Funktion (z. B. Polynom 2. Ordnung) ermittelt werden, welche den Verlauf beschreibt. Hierzu ist eine entsprechende Regressionsrechnung (funktionaler Zusammenhang zwischen Wellenlange und MeBsignalhohe) durchzufuhren.
In jedem Fall ist darauf zu achten, daB das SignalkJntergrundverhaltnismoglichst groB ist.
252
6 Technikrn und Gebieta
6.2.3.3 Kurzzeit- und Langzeitstabilitat (Drift) Intensitats-Schwankungen, die transportbedingt sind, lassen sich bei simultan messenden Spektrometern mit einem ,,inneren Standard" ausgleichen. Hierfur ist ein Element zu verwenden, das nicht Bestandteil der Probe ist. HBufig wird hierfur Yttrium oder Scandium gewahlt. Es ist jedoch darauf zu achten, daR durch den inneren Standard nicht wiederum andere Elemente ,,eingeschleppt" werden - insbesondere den zu bestimmenden Analyten betreffend. Da der innere Standard nur dann vollstandig ,,wirkt", wenn die Intensitaten der zu bestimmenden Elemente und die Intensitat des inneren Standard sich bei Parameteranderungen absolut gleichsinnig verhalten, konnen durch einen inneren Standard nicht alle Parameterschwankungen ausgeglichen werden. Es ist deshalb - insbesondere bei hohen Anspruchen an die Priizision und Richtigkeit der Ergebnisse - zweckmaBig, einen externen Standard zusatzlich zu verwenden. Hier empfiehlt es sich, das zu bestimmende Element direkt als externen Standard einzusetzen 1671. Spiilzeit zwischen den Messungen van verschiedenen Liisungen Die Spiilzeit zwischen den Messungen zweier Losungen mu13 so gewiihlt werden, daR kein ,,Memory-Effekt" auftritt, d. h. keine MeBwerterhohung durch die vorher gemessene Losung. Aus diesem Grunde ist es zweckmiiRig, vor dem Beginn einer MeRserie eine Losung mit ~ y p i s c h e Zusammensetzung" r so oft zu messen, bis die MeRwerte konstant sind. Der ,,Memory-Effekt" kann wie folgt ermittelt werden: Fur jedes Element sind eine Messung der Losung mit der maximalen Konzentration des Arbeitsbereichs und anschliebend 12 Messungen der ,,Blank-Losung" durchzufuhren. Aus den letzten zehn Messungen der ,,Blank-Losung" ist die Standardabweichung sI0zu berechnen. 1st die Differenz der MeRwerte der ersten beiden MeRwerte der ,,Blank-Losung" (RBI und RB2) groRer als das 4-fache der Standardabweichung sIO,dann liegt ein ,,MemoryEffekt" vor:
In diesem Fall ist die Vorspulzeit zu erhohen und der Test zu wiederholen.
Wahl de r In teg ra tionszeit Ein Heraufsetzen der Integrationszeit verbessert generell die Prazision, erniedrigt die Nachweisgrenzen und reduziert den EinfluCj von Kurzzeit-Schwankungen. Gleichzeitig wird aber der EinfluR von Langzeit-Fluktuationen groRer. Das bedeutet, daR die Interagtionszeit ein KompromiB darstellt. Man kann jedoch davon ausgehen, daR Messungen unterhalb einer Dauer von 1 Sekunde haufig keine hinreichende Prazision liefern. Um einen Uberblick uber Schwankungen wiihrend der MeRzeit ZLIerhalten, ist es zweckmaRig, mindestens 3 Wiederholungsmessungen (Replicates) durchzufuhren.
6.2 Vulidierung w n Anulysenverfiihren mit ICP-OES
253
Insgesamt sollte die relative ,,Mel3-Wiederholstreuung" fur den erhaltenen Mittelwert besser als 1 % sein.
Trennscharfe Selektivitat bzw. Spezifitat konnen nur dann erreicht werden, wenn es gelingt, auf storungsfreien Linien zu messen. Spezifitat ist bei der ICP-OES nur dann gegeben, wenn die Analytlinie durch keine andere Linie der in der Probe noch enthaltenen Elemente gestort wird. Dies durfte eher die Ausnahme sein. Selektivitat bzw. Spezifitat hangen bei der ICP-OES naturgemal3 u. a. von der Autlosung des verwendeten Spektrometers ab.
6.3
Validierungsaspekte bei Arbeiten in mikrobiologischen Labors
Michael Rieth, Merck KGaA, Darmstadt Klaus-Peter Gerbling, Schering AG, Berlin
Als drei verschiedene Beispiele fur Validierungsaufgaben im mikrobiologischen Labor werden die Prufung auf Sterilitiit, die Prufung auf Dichtigkeit (,,closure integrity test") und die Qualifizierung eines Arbeitsgerats (Mikrotiterplattenlesegerat) vorgestellt. Die Sterilitatsprufung ist in allen Pharmakopoen weltweit beschrieben, z. B. im Kapitel 2.6.1 des Europaischen Arzneibuchs. Solche monographierten Methoden werden zwar ublicherweise als validiert angesehen, jedoch mussen Untersuchungsproben, bei denen antimikrobielle Eigenschaften vermutet werden, produktbezogen validiert werden. Weitere Faktoren wie Inkubationszeiten und -temperaturen, unterschiedliche Niihrmedien-Chargen und der physiologische Zustand der Referenzmikroorganismen (Stammsammlung) mussen in die Validierung im eigenen Labor mit einbezogen werden. Zum Dichtigkeitstest finden sich Informationen z. B. im Technical Information Bulletin No. 4 (,,Aspects of ContainerKlosure Integrity"), herausgegeben von der Parenteral Drug Association (PDA). Im Falle eines Messgeriits muss der Anwender seine Anforderungen formulieren und Kriterien fur die Qualifizierung festlegen, eventuell zusammen mit dem Geratehersteller oder einem Fachingenieur. Mit Teilen der Qualifizierung wie IQ und meist auch OQ kann der Hersteller beauftragt werden. Die PQ muss vom Betreiber unter seinen eigenen labortypischen Bedingungen durchgefuhrt werden.
6.3. I
Priifung auf Sterilitat (fliissige und filtrierbare Arzneimittel)
6.3. I . 1 Validierungsphn fur die Durchfuhrung der Sterilitiitsprufung
Zirl drr Vulidierung: Die Validierung sol1 zeigen, daB die Durchfuhrung der Sterilitiitsprufung den Anforderungen der Pharmakopoen Europas (EP), Japans (JP) und der USA (USP) entspricht. Die Anwesenheit des Prufproduktes in den verwendeten Medien sol1 keinen EinfluB auf das Wachstum der eingesetzten Testmikroorganismen haben. Fur jedes der verwendeten Medien sol1 in An- und Abwesenheit des Prufproduktes bzw. Membrantilters eine Wachstumskontrolle durchgefuhrt werden. Falls das Produkt wachstumshemmende Eigenschaften hat, konnen Verdunnungen angelegt oder neutralisierende Agenzien zugesetzt werden. Die Untersuchungen sollen an drei Produktionschargen durchgefuhrt werden.
6.3 Vulidierungsnspekte bei Arbeiten in mikrobiologischen Labors
255
6.3.1.2 Beschreibung der Durchfuhrung Die Validierung wird nach Vorgaben der EP, der JP und der USP unter aseptischen Bedingungen durchgefuhrt. Es werden Membranfiltrationen, z. B. Steritestsystem der Fa. Millipore fur zwei Nahrmedien, angewendet.
Nuhrmedien: 1. Caseinpepton-Sojamehlpepton-Bouillon(CSB-Medium) folgender Zusammensetzung:
Pepton aus Casein Pepton aus Sojamehl Natriumchlorid Di-Kalium hydrogenphosphat D-Glucose monohydrate pH-Wert Destilliertes Wasser
17,0 g
38g 5,0 g 2,5 g 2S 7,2-7,4 ad I L
2. Thioglycolat-Medium (Thio-Medium) folgender Zusammensetzung: Trypton 15,O g Pepton aus Sojamehl 5,O g Natriumchlorid 5,0 g Agar 15.0 g pH-Wert 7,2-7,4 Destilliertes Wasser ad 1 L
3. Pepton Phosphat Medium folgender Zusammensetzung: Di-Natriumhydrogenphosphat 14S g Kaliumdihydrogenphosphat 3sg Natriumchlorid 4,3 g Pepton 1,0 g pH-Wert 6,s-7,2 Destilliertes Wasser ad 1,OL Tween 80 1 ,0 ml Der Behalterinhalt (Anzahl in Abhangigkeit des Abfullvolumens, siehe USP) wird uber zwei Filtriereinheiten (Steritestsystem, Fa. Millipore) verteilt. Jeder Membranfilter wird anschlieaend mit 250 ml Pepton-Phosphat-Polysorbat-Losungnachgewaschen, die zuvor rnit 10- 100 KBE eines Testmikroorganismus entsprechend Tab. 6-2 inokuliert wurde. Danach wird jeder Membranfilter mit 100 ml Medium entsprechend Tab. 6-2 uberschichtet und 5 Tage bebrutet. Die Filtriereinheiten werden taglich visuell auf Klarheiflrubung gepruft. Die Prufung ist valide, wenn nach der Bebrutungszeit von 5 5 Tagen unter den vorgeschriebenen Bedingungen (Tab. 6-2) das Wachstum der Testmikroorganismen bei den rnit Prufprodukt beschickten GefaBen nicht schlechter ist als bei den ohne Produkt beschickten Kontrollgefa8en.
Tab. 6-2 Te~tmikroorganismenund Inkuhationsbedingungcn. Te5torganismus
Medium
Inkuhationsieit (Tage)
Tcmpcratur ("C)
Bedingungen
20-25 30-35
aeroh aeroh
20-25 30-35
aerob aeroh
20-25 30-35
aeroh aeroh
Brrci//ir.c subti I is
ATCC6633
CSB Thio
5
Cmidiclcr albicans
ATCC 1023 I
CSB Thio
5
Stcr/'h?./ot,oc.(.ir.c aureus
ATCC 6538P
CSB Thio
5
5
5 5
Thio
5
30-35
aerob
C/osrrirfirmsporogenes
ATCC 1 I437
Thio
5
30-35
aerob
Asprr,qi/Iii.\ nigcr
ATCC 16404
CSB
5
20-25
aerob
Psc,uciorrioritr.c aerupinoaa ATCC 9027
6.3. I .3 Validierungsbericht
Ergehrzissr Die Ergebnisse der Validierung werden tabellarisch dargestellt (Tab. 6-3). Exemplarisch sind hier nur die Ergebnisse mit 2 Testorganismen dargestellt.
BrwertutzRshrispiel Die Validierung entspricht den Anforderungen der Pharmakopoen der USA, Japans und Europas in Bezug auf das Verfahren zur Sterilitatsprufung. Nach Membranfiltration, Uber-
Tab. 6-3 Visuelle Wachstumspriilung der inokuliertcn Testorganismen in den Steritesteinheiten nach Tcstproduktfiltration und Uberschiehtung mit Medium gem28 Ahschnitt 6.3.1. I . Visuelle Untcrwchung Testorganismus
Tag 2
Tap 1
Medium
Membran-Filtereinheit 1
2
I
2
triib
triih
BcrcI'//ussu hti lis
CSB-Medium ohne Priifprodukt
triih
triib
Boci//ir.s cubti I is
Thio-Medium ohne Priifprodukt
triib
triib
triib
triih
Bticilltrs subti I is
CSB-Medium n i t Priifprodukt
triib
triib
triib
triib
Btrci//ir.r \ti b ti lia
Thio-Medium mit Priifprodukt
triih
triib
triib
triih
Ctrrididu alhicans
CSB-Medium mit Priifprodukt
triib
triih
triib
triih
Cmdidti a I b i c an s
Thio-Medium ohne Priifprodukt
triih
triib
triib
triih
triih
triih
triih
triib
Cundidu albicans
CSB-Medium mit Priifprodukt
triib
triib
Cmdidtr albicans
Thio-Medium rnit Priifprodukt
triih
triih
6.3 Vulidierungsuspekte bei Arbeiten in mikrobinlogischen L.ubor.7
257
schichtung mit Medium und anschliefiender Inkubation fur zwei Tage wurde in An- und Abwesenheit vom Prufprodukt und nach Inokulierung mit Testmikroorganismen gleich gutes Wachstum durch Trubung der Medienbehalter festgestellt. Das Verfahren zur Durchfuhrung der Sterilitatspriifung wird daher als valide betrachtet.
6.3.2 Mikrobiologische Dichtigkeitspriifung (Closure Integrity Test) von Primarbehaltern eines aseptisch hergestellten Wirkstoffs unter Worst Case Bedingungen des VerschluBsystems 6.3.2.1 Validierungsplan
Ziel der Vulidierung: Bei aseptisch hergestellten Praparaten und Losungen mu13 gewahrleistet werden, da13 keine Mikroorganismen von au13en in die Primarbehaltnisse eindringen und zur Unsterilitat des Inhalts fuhren. Auf mikrobiologische Integritat sollen Injektionsflaschen mit Verschlu13system fur die Herstellung eines sterilen Wirkstoffs untersucht werden. Zur Simulierung von ,,Worst Case-Bedingungen" werden Flaschen und Stopfen verwendet, die nahe den minimal (Stopfen) bzw. maximal (Flaschen) zulassigen Fertigungstoleranzen hergestellt wurden. Die Integritat der Prtifflaschen ist nachgewiesen, wenn keine der untersuchten Flaschen nach Durchfuhrung der Dichtigkeitsprufung trubes Medium enthalt. Verantwnrtlichkeiten: Validierungsverantwortlicher:Leiter der Funktion - Freigabe von Validierungsplan- und bericht Validierungsteam: Wissenschaftliche Mitarbeiter Koordination der Validierungsdurchfuhrung Ausfuhrung der mikrobiologischen Integritatsprufung Dokumentation von Plan, Bericht und Rohdaten Ausfuhrung der aseptischen Nahrmediumabfullung - VerschluB und Verbordeln der Prtifflaschen. Beschreihung der Materialien und Durchjiihrung Dokumentation zur Umgebung und zur Qualitat der eingesetzten Materialien und Mikroorganismen; die Rohdaten zur Umgebung und zur Qualitat der Materialienwerden aufgenommen. - Nahrmediumherstellung - Wachstumsprufung von Nahrmedium und Testmikroorganismus - Zertifikate zu Prufflaschen und Stopfen incl. Bewertung der Toleranzen - Mikrobiologische Monitoring aus dem Bereich der aseptischen Abfullung, Verschlu13 und Verbordeln werden als Anlagen zum Validierungsbericht dokumentiert. Generelle Methoden: Sofern nicht anders beschrieben, sollen alle Arbeiten unter aseptischen Bedingungen erfolgen.
258
6 Trchriiken utid G d i e t r
Folgende Methoden werden nach USP durchgefuhrt: Herstellen der Nahrmedien (flussig und in Agar) - Wachstumsprufung der eingesetzten Niihrmedien und des Testorganisinus Inkubationen in Brutschrlnken zur Kultivierung des Testmikroorganismus -
6.3.2.2 Beschreibung der Prufflaschen und Stopfen Fur die Integritiitsprufung sollen Injektionsflaschen verwendet werden, die nahe der Plustoleranz hergestellt wurden (Hersteller mit Chargenangabe) und Injektionsstopfen mit Zapfendurchmesser an der Minimaltoleranz (Hersteller mit Chargenangabe, Flaschenvolumen in diesem Beispiel: 20 ml).
Nahrmrdium f i r die B
Medium zur Vrrdinnung von Krimsuspensionen zur Krimzalzlhrstimmung Pepton Phosphat Medium folgender Zusammensetzung: Di-Natrium hydrogenphosphat 14,5 g Kalium dihydrogenphosphat 3sg Natriumchlorid 4,3 g Pepton 1,o g pH-Wert 6,8-7,2 Aqua purificata ad 1,OL Tween 80 1.0 ml
6.3 Vulidierungsctspekte bei Arbeiten in mikrobiologischen Labors
259
6.3.2.3 Testmikroorganismus, Herstellung der Tauchsuspension und Keimzahlbestimmung
Pseudomonas aeruginosa ATCC 9027: Zum Tauchen der Prufflaschen sollen vor Durchfuhrung der Integritatsprufung zwei 10 LSuspensionskulturen mit Pseudomonas aeruginosa wie folgt hergestellt werden: Ein 1 OO ml Schuttelkolben mit 50 ml CSB-Medium wird rnit der Stammkultur Pseudomonas aerugino.sa beimpft (Impfose) und drei Tage bei 30-32 "C unter Schutteln inkubiert (lO"lO'o KBE/ ml). AnschlieRend werden jeweils 10 ml dieser Vorkultur-Suspension in zwei 10 L-Behalter mit CSB-Medium uberfuhrt (Ausgangskeimzahl 106-107KBE/ml). Das Wachstum des Testmikroorganismus wahrend der Integritatsprufung wird durch Keimzahlbestimmungen ermittelt. Dazu werden zu Beginn, nach drei und nach zehn Tagen der Integritatsprufung aus jedem der 10 LBehalter 0,l ml der Bakterien-Tauchsuspension rnit einer sterilen Pipette entnommen und mit Pepton Phosphat Medium 102-fach, 104-fach, 106-fach und lo8fach verdunnt (Endvolumen 10 ml). Aus jeder Verdunnung werden anschlieljend 0,l ml und 1 ml entnommen und jeweils in eine Petrischale pipettiert. Danach werden 10-15 ml CSB-Agar (Temperatur 4 0 4 6 " C) unter Schwenken zugegeben und die Petrischalen dann zwei Tage bei 33-35" C bebrutet. Nach der Bebrutung werden die herangewachsenen KOlonien visuell a u s g e z ~ l t Die . Keimzahl der Bakterien-Tauchsuspension einer Entnahme wird aus dem Mittelwert der Kolonienzahl aus den oben beschriebenen vier Keimverdunnungen errechnet. Das Ergebnis der Keimzahlbestimmungen der PseudomonasTauchsuspension wird im Validierungsbericht dokumentiert. Die mikrobiologische Integritatsprufung ist valide, wenn die Zahl der lebenden Pseudomonas-Suspensionsbakterienam Ende der Dichtigkeitspriifung nicht kleiner ist als zu Beginn der Prufung (Tab. 6-3). Vorbehandlung der Priiflaschen und Stopfen: Die Prufflaschen sollen unmittelbar vor Verwendung in der Flaschenwaschmaschine gereinigt werden. Die letzte Spulung erfolgt rnit Wasser fur Injektionszwecke und die Flaschen werden anschlieljend getrocknet. Dann werden die Flaschen drei Stunden bei 210-225 "C im Heiljluftsterilisator sterilisiert. Die Prufstopfen werden direkt vor Verwendung sterilisiert (Temperatur 120,6-121,6 "C, Zeit 30 min, Druck 2 1,l bar) und im Vakuum getrocknet (Temperatur 60-80 "C, Zeit 3 4 h, Druck 100 mbar). Nahrmediumabfiillung, Verschlup und Verbiirdeln: 300 Prufflaschen, die entsprechend vorliegendem Plan vorbehandelt wurden, sollen mit 10 ml sterilem CSB-MediumFlasche unter aseptischen Bedingungen befullt (Reinraumklasse A) und rnit Stopfen aseptisch verschlossen und verbordelt (Flaschenfullvolumen 50 %) werden.
6.3.3 Mikrobiologische Integritatspriifung 6.3.3.1 Dichtigkeitsprufung Die Prufung wird z. B. in Anlehnung an [68,69]durchgefuhrt und nachfolgend detailliert beschrieben. Nicht weniger als 300 Prufflaschen sollen nach Nahrmediumabfullung in eine
Psrirdornorias aer-rcSinosa-Suspensioneingetaucht werden (Tauchsuspension s. 0 . )und darin zehn Tage bei Raumtemperatur im Liegen inkubiert werden. Dann werden die Prufflaschen aus der Tauchsuspension entnommen, die AuRenwiinde mit Kombispray (Antiseptica) desinfiziert, mit Wasser nachgespult, 14 Tage bei 33-35 "C bebrutet und anschliefiend visuell auf Klarheit untersucht. Die Untersuchungsergebnisse werden im Validierungsbericht dokumentiert. Die mikrobiologische Integritatsprufung ist valide. wenn alle untersuchten Primiirbehdter klare Liisungen enthalten.
6.3.3.2 Wachstumspriifung nach der Dichtigkeitsprufung Das sich nach der Dichtigkeitsprufung in den Prufflaschen befindende CSB-Medium sol1 einer Wachstumsprufung unterzogen werden. Drei Prufflaschen werden jeweils mit 50100 KBE der Testmikroorganismen des Tauchmediurns inokuliert, zwei Tage bei 33-35 "C bebrutet und dann visuell auf Trubung gepruft. AnschlieRend wird eine Keimidentifkierung durchgefuhrt (,.Bunte Reihe", z. B. mit API-System). Die Ergebnisse der Wachstumspriifung und Keimidentifizierung werden im Validierungsbericht dokumentiert. Die mikrobiologische Integritatsprufung ist valide, wenn alle drei Prufflaschen am Ende der Wachstumsprufung trubes Medium enthalten.
Zritplan: Herstellung der Prutbehiilter und Stopfen Herstellung des Abfullmediums Herstellung der Tauchsuspension Niihrmediumabfullung und VerschluR Dichtigkeitsprufung Wachstumspriifung
Datum: Datum: Datum: Datum: Datum: Datum:
~rlidieriiti~s.sbrric~ht: Die Validierung wurde entsprechend der Ziele im Validierungsplan durchgefuhrt. Zum Nachweis der Integritiit der gepruften Behiilter mussen alle untersuchten Behiilter klares Medium am Ende der Prufung enthalten. Die Durchfuhrung der Integritatsprufung ist valide, wenn sie den Anforderungen im Validierungsplan entspricht. ~~r-oiir\i~or-tlichkeirrrl: Entsprechend der Angaben im Validierungsplan.
Br.sdireihrrrig rler- Mciter-icilieri wid Diircl~fiihriirzg:Entsprechend der Angaben im Validierungsplan.
6.3.3.3 Ergebnisse Die mikrobiologische Qualitiit der verwendeten Medien und das mikrobiologische Monitoring des Raumes sowie des Bereiches der aseptischen Abfullung und des Verschlie-
6.3 Vnlidierungsuspekte bei Arbeiten in mikrobiolo~ischenLubors
26 1
fiens der Primarbehalter entsprechen den Anforderungen. MeBprotokolle werden als Rohdatenblatter dokumentiert. Die Ergebnisse der mikrobiologischen Dichtigkeitspriifung sind in Tab. 6-4 dargestellt. Alle untersuchten Behalter blieben steril. Die Anforderung auf Integritat der Behalter ist damit erfullt. Wahrend der Integritatsprufung wurde die Anzahl der vermehrungsfahigen Mikroorganismen aus der Pseudomonas-Tauchsuspensionbestimmt (Tab. 6-5). Am Ende der Untersuchungen wurde eine deutlich hohere Anzahl vermehrungsfahiger Mikroorganismen nachgewiesen als zu Beginn (Tab. 6-5). Die Durchfuhrung der Priifung ist daher in diesem Punkt valide. Nach der Integritatsprufung wurde das Medium aus drei Behaltern voneinander getrennt jeweils einer Wachstumsprufungunterzogen. Dazu wurde jeder Behalter mit 50-100 KBE Pseudomonas aeruginosa inokuliert und dann zwei Tage bei 33-35 "C inkubiert. Die anschliefiend festgestellte Triibung des Mediums wurde ausschliefilich durch Pseudomonas aeruginosa verursacht, was durch Identitikation mit dem API-System (Identitatswahrscheinlichkeit > 90 S )gezeigt wurde (Tab. 6-6).
Tab. 6-4 Ergebnisse der visuellen Priifung von 300 analysierten Primarbehaltern nach der mikrobiologischen Integritatspriifung. Priifergebnis
Anzahl der klaredtriiben Behalter nach Inkubation bei 33-35 "C fur
0 Tage
14 Tage
Triib
0
0
Klar
300
300
Tab. 6-5 Bestimmung der Anzahl vermehrungsfahiger Pseudomonus ueruginosu Bakterien aus dcr Tauchsuspension wahrend dcr Integritatspriifung entsprechend Abschnitt 6 . 3 (Testmikroorganismus, Herstellung der Tauchsuspension und Keimzahlbestimmung). Testmikroorganismus
Medium
Anzahl der KBE nach 0 Tagcn
Pseudomonas ueruninosci
I x 10'
CSB-Medium
3 Tagen 6 x
10 Tagen
loK
8 x 10"
Tab. 6-6 Wachstumspriifung von inokuliertem Medium nach der mikrobiologischen Intcgritatspriifung. Testmikroorganismus:
Pseudomonas aeruginosa
Medium:
CSB - Medium Ergebnis nach
Behalter Nummer
1 Tag
2 Tagcn
triib
triib
triib
triib
triib
triib
Folgerungen: Das Verfahren der mikrobiologischen Integritatsprufung der analysierten Primarbehalter mit VerschluRsystem wurde erfolgreich durchgefuhrt. Das Verfahren simuliert ,,worst case" Bedingungen hinsichtlich der Behalter und Stopfen. die nahe der maximal (Behalter) bzw. minimal (Stopfen) zulassigen Fertigungstoleranz hergestellt wurden. Kein Testmikroorganismus konnte in die analysierten Behalter eindringen. Alle durchgefuhrten Kontrollen (Monitoring der aseptischen Produktion, Wachstumsprufung des Mediums und Testmikroorganismus) entsprachen den irn Validierungsplan beschriebenen Anforderungen. Die mikrobiologische Integritlt der analysierten Behalter wurde eindeutig nachgewiesen.
6.3.4 Qualifizierung eines Analysesystems am Beispiel Mikrotiterplattenphotometer 6.3.4.1 Qualifizierungsplan fur das computergestutztes System Mikrotiterplattenphotometer
Ziel drr Qualifizierung: Die Qualifizierung sol1 zeigen, da13 das Mikrotiterplattenphotometer (Herstellfirma, Inventar Nr.) korrekt funktioniert und daB es alle Leistungen innerhalb der vom Hersteller festgelegten Spezifikationsgrenzen erfullt. Durch Anwendung geeigneter Testverfahren, die vom Hersteller entwickelt wurden, sol1 aul3erdem der korrekte Datentransfer vom Photometer zum PC nachgewiesen werden. Ausgangssituation fur die Quulififizirrung: Der Hersteller des Mikrotiterplattenphotometers entwickelt ein Kontrollsystem mit dem sicher gestellt wird, daR der angeschlossene Computer und die Software zur Systemsteuerung und zur Datenaufnahme zuverllssig arbeiten und die Daten vorschriftmatiig gesichert werden. Mit diesem Kontrollsystem werden unabhiingig vom Nutzer-PC die MeBdaten verarbeitet und ausgedruckt. Es folgt ein Vergleich mit dem Ausdruck der MeRwerte des NutzerPCs. Mogliche Abweichungen mussen im Bereich der zullssigen Toleranzen liegen. Die vom Hersteller entwickelte Software wird zum standardgemlfiigen Betrieb des Gerlts eingesetzt und wird nicht verandert. Das Photometer wird als Standardgerat in vielen Pharma-Firmen eingesetzt (Verbreitungsgrad des Gerats als Anlage zum Qualifizierungsbericht). siehe auch Abschnitt 3.5. Der Sourcecode kann beim Hersteller eingesehen werden (Verfugbarkeitsregelung als Anlage zum Qualifizierungsbericht). VrrL-int~~,ortlichkeitrri: Die Qualifizierungsarbeiten werden von eingewiesenen Mitarbeitern gemeinsam init dem Gerateverantwortlichen durchgefuhrt. Verantwortlich fur die ordnungsgemiiBe Durchfuhrung der Qualifizierungsarbeiten sind deren Fachvorgesetzte sowie die jeweiligen Leiter der organisatorischen Einheit.
6.3 Vulidierungsaspekte bei Arbeiten in mikrobiolngischen kihory
263
Beschreihung des Systems: Das Gerat wird im Rahmen von Freigabeuntersuchungen zur quantitativen Bestimmung chromogener Verbindungen eingesetzt, wie z. B. Endpunktbestimmung von peroxidasekatalysierten ELISA-Verfahren. Typische ELISA-Verfahren sind in Unterlagen der prufenden Abteilung beschrieben. Fur dieses Verfahren mulj das gesamte MeBsystem korrekt funktionieren, was durch geeignete Qualifizierungstest zu zeigen ist (s. Abschnitt 6.3.4.3).Speziell bei ELISA-Verfahren mu6 die Robustheit, Prazision und Sensitivitat des Photometers gewlhrleistet sein. Geeignete Testprogramme dazu sind die Systemeignungstests. Weitere Angaben zum System sind im Geratelogbuch beschrieben. Das Geratelogbuch befindet sich am Gerat.
6.3.4.2 Betrieb des computergestutzten Systems
Systemanderungen Systemanderungen werden nur durch die Herstellerfirma vorgenommen. Der Versionswechsel der Software auf dem PC fur die Gerate-Software, das Betriebsystem, die Bedieneroberflachen, die Utilities und spezielle Anwendungs- bzw. Auswertesoftware wie z. B. Microsoft Excel werden vom Gerateverantwortlichen vorgenommen. Nach dem Versionswechsel wird ein Normalbetriebstest durchgefuhrt und die entsprechenden Ergebnisse werden dem Geratelogbuch beigefugt. Die Archivierung der Software-Versionen erfolgt durch den Gerateverantwortlichen. Alte Versionen werden zusammen mit den Testrohdaten am Gerat abgelegt. Die Abnahme erfolgt durch die Systemfreigabe. SicherheitsmaBnahmen (Datensicherung) Da nach jeder Messung die Daten sofort ausgewertet werden, erfolgen keine Sicherungen. Bei Ausfall des Systems wahrend einer Messung wird die Messung nach Wiederanlauf des Systems wiederholt. Die bei der Kalibrierung erstellten Standarddatenansatze werden als Rohdatenblatter beim Geratelogbuch abgeheftet. Archivierung der Ergebnisdaten Fur jede Messung mit dem Mikrotititerplattenphotometer, die zur Auswertung fuhrt, wird ein Meljprotokoll gedruckt. Die Protokolle zur quantitativen Bestimmung chromogener Verbindungen (z. B. fur ELISA Verfahren) werden zusammen mit weiteren Priifdatenblattern in der Prufbefunddokumentation aufbewahrt. Zugriffssicherheit Das Mikrotitierplattenphotometer wird ohne AnschluB an weitere Rechner oder Netzwerke betrieben. Die Zugriffsberechtigungen werden durch den Leiter der Funktion erteilt.
Fehlerbehandlung Beim Auftreten eines Geriitefehlers sind der Gerateverantwortliche und der Fachvorgesetzte zu informieren. Gegebenenfalls wird zur Behebung des Fehlers der MeBgeriiteservice oder der Herstellerservice angefordert. Das Gerat darf bis zur erfolgreichen Reparatur und Freigabe nicht mehr fur Messungen eingesetzt werden. Bei Stiirungen der Versorgung oder durch Umgebungsbedingungen ist der Leiter der Einheit zu informieren, ggf. zusiitzlich der Betriebsingenieur oder die zustiindigen Werkstiitten. Ein weiterer Betrieb des Gerats 1st bis zur Behebung der Stiirung nicht zuliissig. Notbetrieb Bei Ausfall des PCs kann das Mikrotiterplattenphotometer unabhiingig betrieben werden. Die Auswertung erfolgt manuell. Bei Ausfall des MeRgerates ist kein Notbetrieb moglich. Wiederanlaufverfahren -
-
Wiederanlauf nach Betriebstorung Bei Wiederaufnahme des Betriebes nach einer Betriebsstiirung, wie z. B. einem Strom-, Datenleitungs- oder Druckausfall, wird ein Normalbetriebstest durchgefuhrt. Wiederanlauf nach MeDsystemausfall Vor Wiederaufnahme des Betriebs nach einem Mefisystemausfall aufgrund eines Fehlers am Mikrotiterplattenphotometer oder aufgrund eines Fehlers am PC entscheidet der Geriiteverantwortliche in Abhangigkeit vom Urnfang der Reparaturarbeiten daruber, ob eine erneute Kalibrierung erforderlich ist. Es mu8 jedoch mindestens ein Qualifizierungstest durchgefuhrt werden.
Fehlerprotokollierung Alle beim Betrieb des Geriites beobachteten Fehler werden in dem Geriitelogbuch protokol liert . Erforderliche Dokumente und Geriitelogbucher - Geriitelogbuch mit funktionaler Systembeschreibung des Mikrotiterplattenphotometers. -
-
-
Hinterlegungsregelung zum Software-Quellcode Firmenreferenzliste als Dokument uber den Verbreitungsgrad des Mikrotiterplattenphotometers Bestiitigung des Herstellers, dalS die Gerite-Software entsprechend den Richtlinien eines Qualitiitssicherungssystems entwickelt wurde Servicebericht zur einwandfreien Funktion des System5 Geriiteservice Manual zur Performance Qualification Prufzertifikat der Herstellerfirma einschlieRlich zugehbriger MeRprotokolle MeBprotokolle zum Normalbetriebstest und zu den Qualitkierungstests
6.3 Validieriingscispektebei Arbeiten in rnikrobiologischen Labors
265
Risikobewertung des Systems Das Arbeiten mit einem defekten System oder einer defekten Software kann die Priifergebnisse verfalschen und zur Freigabe falsch dosierter Pharmaka fuhren. Die Arbeit mit verfalschten Prufergebnisse stellt somit ein wesentliches Risiko dar. Vor jedem Experiment wird ein Systemeignungstest durchgefuhrt. Dadurch werden Fehler in dem System und in der Software sofort bemerkt.
6.3.4.3 Testprogramme fur die Systemeignung, Qualifizierung und Requalifizierung Sy stemeignungstests
Zur Uberprufung des gesamten MeBsystems werden vor jeder Messung zwei Systemeignungstests (Normalbetriebstest) durchgefuhrt. Beide Tests ergeben wichtige Aussagen zur Robustheit, Prazision, Sensitivitat und zur oberen MeBgrenze des Mikrotiterplattenphotometers, speziell fur den Einsatz bei ELISA-Verfahren. Die Tests erfolgen gemaB ,,Performance Qualification", aus dem Gerate Service Manual. Durchfuhrung und Angabe der Akzeptanzkriterien sind nachfolgend beschrieben. Die Durchfuhrung der Normalbetriebstests erfolgt nach der ,,Performance Quailification" im Gerate Service Manual und umfaBt den nachfolgend beschriebenen ,,Flat bottom plate Test" und den 3 OD Test. Durchfuhrung des ,,Flat bottom plate Test": Zur Durchfuhrung wird eine kratzerfreie Mikrotiterplatte aus Polystyrol verwendet. Alle 96 Vertiefungen werden mit 150 pl0,l % Tween 20 in Phosphat gepufferter Saline-Losung befullt. Mikrotiterplatten-Photometer und PC einschalten. Am PC die ,,Photometer" Software durch Doppelklick mit der Maus aktivieren. Wellenlange = 650 nm einstellen. Einstellungen am PC durch OK bestatigen und am PC ,,Read Plate" auslosen. Das MeBergebnis wird als Rohdatenausdruck abgelegt. Beurteilung: Wenn das Photometer korrekt funktioniert, betragt die Differenz zwischen der niedrigsten und hochsten Absorption I 0,012 Absorptionseinheiten. Bei nicht korrekter Funktion muB der Betriebsingenieur benachrichtigt werden (siehe Gerate-Logbuch).
Durchfuhrung des ,,3 OD Tests ": Einen einfachen Drucker direkt an das Photometer anschlieBen. Mikrotiterplattenphotometer einschalten und das Photometer in den 4 OD Arbeitsbereich versetzen. Die Filterplatte des Herstellers in die Mikrotiterplattenhalterung einsetzen. Auf der Folientastatur ,,650 nm" drucken; Read-Taste drucken. Beurteilung: Auf dem Papierausdruck erscheinen 16 Werte, die vom Filterwert (liegt dem Filter bei) k 0,040 Absorptionseinheiten abweichen durfen. Sonst arbeitet das Ger2t nicht korrekt und mu8 vom MeBgerateservice gepruft werden. Ein entsprechendes MeBprotokoll ist Bestandteil des Qualifizierungsberichts.
266
6 Techniken und Gehiete
Qualifizierungstestprogramme Die Qualifizierungstestprogramme werden zur Qualifizierung des Mikrotiterplattenphotometers einschliefilich PC und Software jahrlich durchgefiihrt und liefern Aussagen zur korrekten Funktion des Photometers zum Einsatz bei ELISA-Verfahren und fur andere Funktionen wie z. B. Messung kinetischer Vorgange. Die Tests sind vom Hersteller vorgegeben und erfolgen gemlfi ,,Performance Qualification" . Wie bei der Kalibrierung wird der Luftreferenztest bei 405 nm und der Test ,,Kinetisches Rauschen" bei 405 nm und 450 nm durchgefiihrt. Die Tests beinhalten: Systemeignungstests (siehe oben) und Luft-Referenztest bei 405 nm
Durchjiuhrung: Mikrotiterplatten aus dem Gerat entfernen. Einen einfachen Drucker direkt an das Photometer anschliefien und das Photometer einschalten. Auf der Folientastatur ,,Modus" eine WellenIange 405 nm wlhlen. Einstellungen am PC mit OK bestatigen und das Programm starten. Angezeigte Daten via PC ausdrucken und mit Papierausdruck des einfachen Druckers vergleichen. Der gesamte Vorgang mul3 dreifach durchgefuhrt werden. Beurteilung: Das Mikrotiterplattensystem funktioniert korrekt, wenn alle Absorptionswerte 0,000k 0,002 Absorptionseinheiten betragen und die Werte vom Photometerdrucker init den parallel ausgedruckten Werten des PC ubereinstimmen. Ein entsprechendes Mefiprotokoll ist Bestandteil des Qualifizierungsberichts. Bei nicht korrekter Funktion mussen der Betriebsingenieur oder der Meflgerateservice benachrichtigt werden (siehe Geratelogbuch). Test Kinetisches Rauschen bei 405 nm
Durchfuhrung: Mikrotiterplatten aus dem Gerat entfernen. Einen einfachen Drucker (Epson FS 800 oder entsprechenden Drucker) direkt an das Photometer anschlieBen. Das Photometer einschalten und auf der Folientastatur ,,Modus" die Wellenlange 405nm wlhlen. Auf der Folientastatur auf ,,5 minute kinetic run time" einstellen und starten. Beurteilung: Das Gerat funktioniert korrekt, wenn alle 96 ausgedruckten MeBwerte 5 k 0,2 mOD/min betragen. Ein entsprechendes Mefiprotokoll ist Bestandteil des Qualifizierungsberichts. Bei nicht korrekter Funktion mussen der Betriebsingenieur oder der Mefigerateservice benachrichtigt werden (siehe Geratelogbuch). Test Kinetisches Rauschen bei 450 nm
Durchfuhrung: Der Test wird wie bei 405 nm durchgefuhrt.
6.3 Vrrlidierungsuspekte bei Arbeiten in mikrobiologischen h b o r s
261
Beurteilung: Das MeRgerat funktioniert korrekt, wenn alle 96 ausgedruckten MeBwerte I k 0,110 mOD/ min betragen. Ein entsprechendes MeRprotokoll ist Bestandteil des Qualifiziemngsberichts. Bei nicht korrekter Funktion mussen der Betriebsingenieur oder der Meagerateservice benachrichtigt werden (siehe Geratelogbuch). Requalifizierungstests Fur die Requalifizierung wird jahrlich eine Qualifizierung durchgefuhrt wie oben beschrieben. Fur die Requalifizierung werden die Daten der Qualifizierung eingesetzt. Die neuen Ergebnisse mussen mit den archivierten Ergebnissen ubereinstimmen. Bei Abweichungen wird das System gesperrt und die Herstellerfirma mit der Uberprufung des Gerats beauftragt. Die bei der Requalifizierung erstellte Dokumentation wird vom Qualifizierungsdurchfuhrenden und dem Gerateverantwortlichen abgezeichnet und im Geratelogbuch abgelegt. Kalibrierung Das Mikrotiterplattenphotometer mit angeschlossenem PC wird vom Hersteller kalibriert und die Funktionen einschliefilich Datenubertragung durch verschiedene Priifverfahren bestatigt. Diese Uberprufung sol1 immer dann erfolgen, wenn die Qualifizierungstests ergeben, dalj das Mikrotiterplattenphotometer nicht korrekt funktioniert, sowie nach Austausch der Lampen. Bestandteil der Kalibrierung sind die optische Kontrolle der MeBkammer, der LuftReferenztest bei 405 nm, der Test kinetisches Rauschen und der Test bei einer optischen Dichte von 3 OD. Die Kalibrierung erfolgt gemll3 ,,Performance Qualification", im Service Manual des Herstellers. Der Test ,,Kinetisches Rauschen" wurde aber bei 405 nm und 450 nm und der ,,Luftreferenztest" bei 405 nm durchgefuhrt, da das MeRgerat fur ELISA- Meljverfahren mit diesen Wellenlangen funktionieren muR. Das MeBergebnis einschlieBlich der zu erreichenden Grenzwerte ist in einem Prufzertifikat zusammengefaBt. Die Meljprotokolle und das Priifzertifikat sind Bestandteile des Qualifizierungsberichts.
6.3.4.4 Nachweis der korrekten Installation und Funktionalitat des computergestutzten Systems sowie der umgebenden Raumeinrichtung Die Herstellerfirma hat die Installation und Funktionalitat des Mikrotiterplattenphotometers gepruft. Die korrekte Funktion des Systems wird im Servicebericht Nr.. .xyz dokumentiert. Das Mikrotiterplattenphotometer wird als Einzelplatzsystem ohne Verbindung zu Zentralrechnern oder Rechenzentren betrieben. Sonstige Verkabelungsplane werden uber das Rechenzentrum (RZ) bzw. in der Technik verwaltet.
268
6 Techniken und Gehieta
6.3.4.5 Raumeinrichtungen Raumplane und Verwendungszweck Die Raumplane des Gebaudes, in dem das Photometer installiert wurde, befinden sich beim Leiter der Funktion. Verwendungszweck des Raumes sind Vorbereitung, Durchfuhrung und Auswertung von Analysen, z. B. fur: Ansetzen von Lasungen fur biochemische Zwecke - Gelelektrophorese - PCR-Analysen Mikrotiterplattenphotometer Versorgung Der Raum, in dem das Mikrotiterplattenphotometer aufgestellt ist, wird mit folgenden Betriebsmitteln versorgt: - Wasser aus dem offentlichen Netz Voll entsalztes (VE) Wasser aus der Energiezentrale Druckluft aus der Energiezentrale - Case aus einem zentralen Raum des Gebaudes, in dem sich die Gasflaschen befinden - Vakuum aus einer zentralen Vakuumamlage, die von der Funktion Haustechnik betreut wird. Die Plane der Versorgungsleitungen sind uber den Betriebsingenieur zuggnglich. Klima Die RIutne werden durch eine Anlage ini Gebaude zwangsbeluftet, die von der Funktion Haustechnik gewartet wird. Die Plane der Klimaanlage sind uber den Betriebsingenieur zuganglich. Mafinahmen gegen Storeintlusse Die Funktionen Zentrale Automation, Betriebstechnik, Klimauberwachung und Sicherheitsuberwachung stellen sicher, dafi keine Storeinflusse fur den Betrieb von Laborgeraten auftreten. Reinigungsverfahren Die Grundreinigung des Mikrotiterplattenphotometers wird jeweils nach der Kalibrierung durch den Herstellerservice vorgenommen. Routinereinigungen erfolgen nach Abschlufi der Messungen vom jeweiligen Benutzer des Gerates. Die Reinigung des PC wird bei Bedarf durch Mitarbeiter der Funktion Gebaudewirtschaft vorgenommen.
6.3 Vulidierungsuspekte bei Arbeiten in mikrobiologischen Lubors
269
Freigabe des Systems Nach AbschluB der Qualifizierungsarbeiten erfolgt die Systemfreigabe durch den Leiter der organisatorischen Einheit fur den Einsatz des Systems.
6.3.5
Qualifizierungsbericht fur das System Mikrotiterplattenphotometer
Das Ziel der Qualifizierung entspricht dem Qualifizierungsplan. Die Verunfworttichkeit entspricht dem Qualifizierungsplan. Die Beschreibung des Systems entspricht dem Qualifizierungsplan.
Zusammenfassung und Bewertung der Untersuchungsergebnisse Die Qualifizierung wurde gems Qualifizierungsplan fur das computergestutzte System Mikrotiterplattenphotometer durchgefuhrt. Das Geratelogbuch wurde erstellt und befindet sich am Gerat. Daruberhinaus wurden folgende Dokumente erstellt und in der Anlage zum vorliegenden Bericht abgelegt: Hinterlegungsregelung zum Software-Quellcode Firmenreferenzliste fur die Dokumentation des Verbreitungsgrads des Mikrotiterplattenphotometers Bestatigung des Herstellers zum Qualitatssicherungssystem der Software Entwicklung Servicebericht zur einwandfreien Funktion des Systems Prufzertifikat der Herstellerfirma einschlieBlich zugehoriger MeBprotokolle MeBprotokolle zum Norrnalbetriebstest und zu den Qualifizierungstests Am ,,Datum" genannten Tag wurden von der Herstellerfirma die Kalibrierung und die Qualifizierung des Mikrotiterplattenphotometers durchgefuhrt und protokolliert. Das Zertifikat sowie alle Qualifiziemngs-MeBergebnissesind in der Anlage zum vorliegenden Berichte dokumentiert. Bewertung: Das Mikrotiterplattenphotometer-System ist betriebsbereit. Das gesamte MeBsystem funktioniert korrekt. Die Qualifizierung wurde erfolgreich abgeschlossen.
Empfehlung zur Freigabe des Systems Das computergestutzte System Mikrotiterphotometer kann fur den quantitativen Bestimmung chromogener Verbindungen, wie z.B bei Durchfuhrung von ELISA-Verfahren, freigegeben werden. Anlagen: Rohdaten der im Qualifizierungsplan genannten Analysen und Herstellerunterlagen.
270
6 Tcchrriken wid Gehiete
6.4
Validierung einer Titrationsmethode
Jiirgen Peters, Schott Gerate GmbH, Hofleim
6.4.1 Einleitung Die Titration ist ein Analysenverfahren, das schon seit ,,Jahrhunderten" eingefuhrt ist. Francios Descroicilles titrierte schon 1791 den Indigogehalt mit Chlorwasser. Die Prazision von Gay-Lussac, der 1835 mit einer Genauigkeit von 0,05 % den Silbergehalt einer Miinze bestimmen konnte, ist auch heute nur rnit vie1 Aufwand zu ubertreffen. Eine solche Zahl fur die Genauigkeit einer Analysenmethode ist dabei heute rnit grol3er Vorsicht zu geniel3en. Um heute sicher zu sein, mit einer Genauigkeit von zum Beispiel 0,05 % ein Analysenergebnis erhalten zu haben, mu13 der Anwender den Nachweis in Form von statistischen Berechnungen und einer Validierung seiner Methode liefern. Dahinter steckt wie eh und je der Wunsch, ein moglichst wahres Analysenergebnis zu erhalten. Die Titration als Absolutmethode ist ohne den EinfluD physikalischer Effekte direkt auf das Wiegen zuruckzufuhren. Sie ist uber einen weiten Konzentrationsbereich von ppm bis hin zu 100 % Gehalten einsetzbar. DieTitration ist dabei einfach und schnell ohne einen zu groDen apparativen Aufwand durchzufuhren. Deshalb stellt sie eine einfach zu validierende Methode dar.
6.4.2 Ubersicht Validierungsmerkmale Im folgenden sollen daher die Validierungsschritte einer Titration an dem Beispiel einer Saure-Base-Titration erklart werden. In Tabellen sind dann Hinweise enthalten, wie andere Titrationen validiert werden konnen. Die einzelnen Validierungsmerkmale einer Titrationsmethode und ihre Bedeutung sind in Tab. 6-7 enthalten.
6.4.3 Voraussetzungen fur eine Titration Die drei Voraussetzungen fur die Titrationen miissen gleichwohl erfullt sein: -
-
eine quantitativ ablaufende chemische Reaktion, die in kurzer Zeit nach einer genau definierten Stochiometrie ablauft, ein titerstabiles Reagenz, das prazise dosiert werden kann und eine Indikation des Endes der chemischen Umsetzung.
I 6.4 Vulidierung einer ~ t r i ~ ~ i [ ) n . ~ m e t h [ 27 )d~ Tab. 6-7 Bestandteile der Methodenvalidierung fur die Titration; o weniger wichtig, ++ sehr wichtig. Validierungsmerkmal
Wichtigkeit
Bedeutung fur die Titration
Prazision
++
1st die Starke der Titration
++
Richtigkeit
+ wichtig,
Mu8 fur jede Methode nachgewiesen werden
Wiederfindung
+
Eine Probenvorbereitung ist in dcr Regel nicht erforderlic h
Linearitat
t
Die Titration ist eine Methode mit hoher Linearitat. Der angewendete Konzentrationsbereich sollte uberpriift sein.
Selektivi tat
0
1st in der Regel nicht von Bedeutung
++
Robustheit
Wichtig fur die Ubertragbarkeit einer Methode
Nachweisgrenze
0
Entfallt in der Regel
Bestimmungsgrenze
0
Es wird der Bereich definiert und uherpruft, in dcni Proben anfallen. In der Regel wird jedoch die Probenmenge angepaljt, um einen gleichrnaljigen verbrauch zu erhalten
Tab. 6-8 Elemente der Titrationsmethode und wesentliche Aspekte fur die Validierung. Chemische Reaktion
Reagenz und Dosierung
Indikation
-
Anwendbarkeit
-
Titerstabilitat des Titrierreagenzes
-
Sensor funktioniert spezifikationsgemafl
-
Stochiometrie
-
Exakte Dosierbarkeit mit exakten Volumina der BUrette
-
Sensor ist fur die lndikation der chernischen Umsetzung geeignet (selektiv bzw. sensitiv)
-
Reaktionsgeschwindigkeit
-
Genau bekannte Zusammensetzung und Gehalt des Reagenzes
-
Ende der chemischen Reaktion
-
Nebenreaktionen
-
Aus Kurve, aquivalcnte Umsetzung ablesbar bzw. berechenbar
Die Aspekte aller drei Kriterien mussen daher immer wieder bei einer Methodenerstellung uberpriift werden. Sie werden unter anderem im Rahmen einer Prtifmitteliiberwachung sichergestellt. Die Methodenvalidierung setzt darauf auf. Tabelle 6-8 zeigt die verschiedenen Elemente der Analysenmethode ,,Titration" und wichtige Aspekte, die bei einer Validierung einer Titrationsmethode beachtet werden mussen. Tabelle 6-9 zeigt, wer in der Kette vom Hersteller der Reagenzien uber den Geratehersteller bis zum Anwender bestimmte Anteile der Validierung eines Gesamtsystems beisteuern kann.
272
6 Techriiken urid Gehiete
Tab. 6-9 Bcitrage zum Gesamtprozess einer Validierung. Chernische Reaktion ReagenzHersteller
GerateHerstcllcr
Anwcndcr
Rcagenz und Dosierung
Indikation
-
Forschung und Pu blikationen
-
Garantiert Zusamrnensetzung
-
Patcntc
-
Garantiert Haltbarkcit
-
Erfdhrungen
-
Garantiert cxakte Dosicrung
-
Garanticrt lndikationsfunktion
-
Applikationcn
-
Konformitatserklarung
-
Konformitatserklarung
-
Hcrstellerprufzertifi kat
-
Herstcllcrprufzcrtifikat
-
Titerstellung
-
Kurvenanalyse
-
Prufmitteluberwachung
-
Prufinittelubcrwachung
-
Validieren
Tab. 6-10 Sichtprufung. Gerateteil
Prulung
Anzcigc
Segmente priifen: Vollstandigkeit, Helligkeit. GleichmaBigkeit; Sonderzeichcn prufen
Stcckkontakte
Korrosion, Festigkeil, Verbiegung. Vollstandigkcit, Beschadigung dcr Stecker-Gchause
Schaltcr + Potis
Korrosion, Leichtgangigkeit, Rast- und Endstellungen, mcchanische Fcstigkeit, Beschriftungen
Gchausc
Beschadigungen, Funktionsbeeintrachtigungegn
Zylindcr, Kolben
Beschadigungen, Abnutzung, Glascintrubung, Glasobcrflachen (innen und au0en)
Kolbenstange
Korrosion, Beschadigungcn
Dichtungcn
Flussigkcitaustritt, Rissc, Verforrnungen
Schlauche
Abknickungcn, Beschadigung, Verbindung/Verschraubung, Flussigkcitaustritt, Luftcinlritt
lnnerer Autbau
Allgerneincr Zustand
Lei terplattcn
Beschadigungen, insbes. Korrosion der Leitcrbahnen, der Bauteilc, der Liitstcllen, der Steckcr
Funktion
-
Mcchanik
Korrosion und Beschadigungen des Antricbssysterns, insbesondere der Suindcl, Suiel der Mechanik
6.4 Vulidierung einer Titrutionsmethode
273
6.4.4 Prufmitteluberwachung Der Hersteller eines Titrationsgerates garantiert also die Funktion seines Gerates. Dies pruft er zum Beispiel nach den Kriterien, die in den entsprechenden Tabellen enthalten sind (Tabelle 6-10 bis 6- 14). Der Anwender kann fur seine Prtifmitteluberwachung alle diese Merkmale ubernehmen oder eine fur sich sinnvolle Auswahl treffen. Fur die Titration ist sicher die exakte Dosierung der Reagenzes der wichtigste Punkt. Dies wird nach DIN 12650 Teil6 gepruft. Es mussen bei drei Dosierungen rnit etwa 10 %, 50 % und 100 % jeder Wert weniger als 0,3 % (oder Herstellerspezifikation) vom Sollwert abweichen, bezogen auf das Gesamtvolumen des Zylinders der Burette. Die neue I S 0 8655 (in Vorbereitung) erfordert jeweils zehn gleiche Volurnina fur Nominalvolumen, 50 % Nominalvolumen und das kleinste auswahlbare Volumen oder 10 % des Nominalvolumens. Die Richtigkeit des Volumens muR bei einer 10 ml Burette k 0,20 % betragen, die Prazision 0,lO % des Sollvolumens. Tab. 6-11 Schnittstellen.
Schnittstelle
Priifung
RS-232-C
Funktionsprufung: Ubertragen von Daten auf einen Priif-PC mit Terminalprogramm Praktische Funktionsprufung, z. B. SGH-Schnittstellernit angeschlossenem SGH-Gerat Messen von 3 Spannungen, verteilt iiber den Bcreich Praktische Funktionspriifung mit dem korrespondierenden Gerat Praktische Funktionsprufung rnit angeschlossenem Riihrer Drucker anschlieBcn, 5 Werte iibertragen
andere Schreiberausgang Reglereingang RuhreranschluB Centronics
Tab 6-12 Elektronik.
Parameter
Priifung
MeBverstarker Regelverhalten Elektr. Sicherheit
Priifen und Neu-Justieren nach Abgleichanleitung Sichtpriifungder sicherheitsrelevantenVerbindungen Messen nach Norm
Tab. 6-13 Dialogsystem.
Funktion
Prufung
Tastaturfunktion Parametereingabe
Menue-Durchlauf,Priifen der Funktionstasten. Menue-Durchlauf rnit Halt an fiinf Positionen, die vorher durch Zufallsentscheid bestimmt wurden. Dort Eingabe von sinnvollen Parametern. Priifen ob die angezeigten rnit den eingegebenen Wcrten/Zeichen iibereinstimmen.
274
6 Techniken und Cehiete
Tab. 6-14 Zusatzliche QS-Priifungen.
Parameter
Priifung
Zertifikat
Es wird ein Qualitatspriifzertifikat nach DIN 55350- 18-4.2.2 ausgestellt. Diescs Dokument ist in Qualitatsmanagementsystemen nach DIN EN I S 0 9000 ff verwendbar. Die Ausstellung erfolgt nur
Spindelweg Spindel kraft pH/mV-Bereiche Temperaturbereich Dead-Stop-Bereich Volumen nach DIN
durch Personen, die von Geschaftsfiihrungund Qualitatsmanagement ernannt worden sind Mit Hiihenmelkinrichtung an 3 Punkten messen: 10 %, 50 70, I00 %,, Soll-1st-Vergleich Messen des Maximuins mit Kraftmeligerat Soll/Ist-Vergleich der Me8-Abweichungen an je 3 Punkten wie pWmV-Bereich wie pH/mV-Bereich 50 96, Auswagen mit Wasser nach DIN I 2 650, Teil 5. bei 10 8, 100 %, Soll-1st-Vergleich
Der Unterschied liegt im Detail: Wlhrend nach der DIN kein einziger Wert herausfallen darf, wird in der neuen I S 0 uber eine Gauss-Kurve eine Wichtung durchgefuhrt, bei der ein einzelner Wert durchaus schon ma1 ,,daneben" liegen kann. Da die meisten automatischen Motorkolbenburetten nicht kalibriert werden mussen, ist eine Volumenprufung nach diesen Normen nur selten erforderlich. ErfahrungsgemaB sind Sichtprufungen in kiirzeren Zeitraumen sinnvoll. Die aufwendigere Volumenprufung sollte dennoch einmal im Jahr durchgefuhrt werden, bei starker Beanspruchung oder einer einma1 erkannten Abweichung auch haufiger. Ein praktischer Ersatz (nicht nach der Norm!) ist eine Titerstellung mit einem Standard oder Urtiter bei dem mit verschiedenen Titriervolumina gearbeitet wird. Dabei werden die Volumina so gewlhlt, daB der gleiche Mengenbereich wie bei den Proben erfaBt wird und gleichzeitig unterschiedliche Positionen der Kolbenburette vorliegen. Die Elektronik und viele andere Punkte werden einschliel3lich Sensor damit automatisch zusatzlich uberpruft. Fur die unterschiedlichen Titrationstypen haben die einzelnen Elemente einen unterschiedlichen EinfluB. Daher sol1jetzt an zwei Beispielen die Validierung diskutiert werden. Wenn Besonderheiten der Prufmitteluberwachung einen signifikanten EinfluB haben, wird dies besonders erwahnt.
6.4.5 Praktisches Vorgehen Die Stochiometrie der Reaktion ist in aller Regel bekannt. Wenn bei einer bestimmten Anwendungen mit Nebenreaktionen zu rechnen ist, gibt es verschiedene Methoden, dies herauszufinden: - Veranderung der Temperatur (z. B. eine langsamer ablaufende Nebenreaktion wird bei niedrigerer Temperatur nicht mehr ins Gewicht fallen).
6.4 Validierung einer Titrutionsmethode
275
Zugabe eines Standards zu einer Probe (der Standard muB wiedergefunden werden). Zugabe einer weiteren definierten Menge Probe nach beendeter Titration (im Unterschied zu den Titrationen, bei denen direkt mit unterschiedlichen Mengen gearbeitet wird). Zugabe von Hilfsreagenzien, die vom Titriermittel nicht erfal3t werden, wohl aber die Konzentration der zu bestimmenden Komponente oder einer Matixkomponente verandern (Maskierungen, Fallungen). Verlnderung der Titrationsgeschwindigkeit. Weitere spezifischere Methoden sind moglich. Bei einem Beispiel einer Saure-Base Reaktion wird Salzsaure vorgelegt und rnit Natronlauge titriert. Die Reaktion ist schnell, quantitativ und lauft nach einer einfachen 1 :1 Stochiometrie ab. Es konnen jedoch eine Reihe von Nebenreaktionen eintreten. In der Atmosphare existiert bekanntlich ein Anteil an CO,, der naturlich rnit der Reaktion im TitriergefaB im Gleichgewicht steht. Eine zu lange Titration bei hohen pH-Werten kann zu einem falschen Ergebnis fuhren. Wenn die Probe mit Wasser verdunnt wird, mu13 auf die Qualitat des Wassers geachtet werden. Durch Ionenaustauscher gereinigtes Wasser kann Sauren enthalten, die durch den Austausch der Kationen erzeugt werden. Haufig enthalt deionisiertes Wasser auch Kohlensaure. Die in diesem Beispiel verwendete Natronlauge als Reagenz ist besonders empfindlich gegen die Aufnahme von CO, aus der Luft. Sie braucht deshalb als Schutz ein C0,Adsoptionsmittel, z. B. Kalknatron oder Calciumhydoxid. Die Dosierung von Laugen rnit einer Glasburette oder Motorkolbenburette bereitet fur die in der MaBanalyse verwendeten Konzentrationen kaum Probleme. Es muS jedoch auf den Zustand des Glaskolbens der Buretten geachtet werden. Die Richtigkeit des Burettenvolumens kann dabei nach DIN 12650 Teil6 (neue Norm I S 0 8655 in Vorbereitung) uberpriift werden. Die Indikation der Reaktion erfolgt rnit einer Glaselektrode, die den pH-Wert der Losung selektiv erfassen kann. Die Elektrode muR fachgerecht gelagert werden, z. B. in einer KCl-Losung. Das Diaphragma muB sauber und unbeschadigt sein. Die meisten Elektrodenprobleme entstehen durch ein verstopftes Diaphragma. Die Nachfulloffnung der Elektrode muljjetzt noch geoffnet werden, damit die Salzlosung durch das Diaphragma nach auBen diffundieren kann. Eine Kalibrierung der Elektrode zeigt daruber hinaus uber Steilheit, Nullpunkt und Einstellzeit, ob die Elektrode einsetzbar ist. Tabelle 6- 15 zeigt die Kriterien, die als Voraussetzung vor einer Saure-Base Titration erfullt sein mussen. Die meisten Fehler treten in der Praxis genau an diesen Stellen auf. Wenn alle Bedingungen sorgfaltig eingehalten werden, bereitet die nachfolgende Methodenvalidierung meist keine Schwierigkeiten.
6.4.6 Validieren einer Saure-Base-Titration Die haufigste Anwendung ist die Saure-Base-Titration. Sie soil daher als Beispiel fur das Vorgehen bei der Validierung herangezogen werden. Andere Titrationen verhalten sich im Prinzip gleich. Es werden zur Titerstellung andere Chemikalien oder Standards eingesetzt.
Tab. 6-15 Uhcrprufen der Voraussetzungcn fur die Titration und einfache MaOnahmen Ti trationsmerkmal
Was mu13 uherpriift werdcn
Kritcrium fur eine einwandfrcic Titration
Rcaktion
Nehenrcakt ioncn
Keine Verunreinigungen
Wasserqualitat
Rcagcnz
MaUnahmen und Bernerkungen
Kein C 0 2
Entgasen
Leitfahigkcit < 10 pS/cm
Dcstillieren
Titrationsdaucr
Nicht zu schnclle oder zu lanpsame Titration
Korrekter Gehalt
Titer 1,OO lr 0.02
Titerstellung mit cinem Urtilcr oder Standard C0,- Adsorber
C0,-Aufnahme hei Basen Zustand des Dosierkolhcns
Dichtigkeit
Sichtpriifung
Zustand der teitungen und Ventile
Dichtigkeit
Keine Lufthlascn beim Dosieren
Keine Knicke
Einwandfreies Dosieren
Abweichungcn kleiner als 0,3 9% vom Gcsamtvolumen der Burette oder Herstellerspwi fikation
Prulcn nach DIN I2650 Teil 6; Auswiegen mit Wasser hci delinierter Tempcratur Ncuc Norm i n Vorbereitung I S 0 8655
Richtigkeit Burettenvolumcn
lndikation
Lagerung
Glasclcktrodc
Kalihration
In KCI-Losung lagern Steilheit 95 % his 100 %' Nullpunkt 7,OO f 0.30 Einstell-leit kurz
Diaphragm
An der feuchtcn Elektrode tritt KCI am Diaphragma aus
Nac h fu I lii l f n u ng
Offen hei der Titration
Lu fthlascn i n der Elcktrodc
Keine Lufthlasen in der Elektrode
Mil heiRem Wahscr inncn und auRen rcinipen hci Verstopfung Schuttcln
Jede Titrationsart bedarf naturlich einer entsprechenden Elektrode, die wie die Glaselektrode nach den Anweisungen des Herstellers richtig behandelt werden muB. Bevor die ein7.elnen Valdierungsmerkmale uberpriift werden, mu13 die Anwendbarkeit einer Titrationsmethode fur eine bestimmte Probe sichergestellt sein. Diese Uberprufung wird bei vielen Anwendungen durch die Merkmale Wiederfindung und Linearitiit erfaRt. Weitere Aspekte wurden schon bei der Beschreibung der Voraussetzungen erwahnt. In dem
6.4 Vulidierung einer Titrutionsrnethode
277
Tab. 6-16 Vorgehen fur die einzelnen Validierungsschritte. Validierungsmerkrnal
Vorgehen
Prazision
Mehrfachbestirnmung einer definierten, moglichst gleichen Probenmenge (6-fach his 10-fach).
Richtigkeit
Titration eines Urtiters oder Standards rnit dem gleichen Titriermittel.
W iederfindung
Zu der Probenrnatrix wird eine definierte Menge hinzugeben (Aufstockung, Standard-Addition).
Linearitat
Es werden die gleichen Versuche wie fur die Prazision mit unterschiedlichen Probenrnengen durchgefiihrt. Als Anhaltspunkt wird die kleinste und die groRte vorkornmende Probenmenge eingesetzt. Es empfehlen sich mindestens zwei his drei zusatzliche Konzentrationen in moglichst gleichen Abstanden. Wenn die Wiederfindung und die Linearitat erfullt sind, sind in der Regel keine weiteren Versuche fur die Selektivitat bei der Titration erforderlich. Die Bestirnrnungen sollten in mehreren Laboratorien mit unterschiedlichen Arbeitsbedingungen (Personal, Titratoren .. .) als (,,Mini")Ringversuch durchgefuhrt werden. Alternativ konnen die charakteristischen Merkmale definiert und variiert werden: Elektroden Losungsmittelmengen - Ternperatur Ruhrgeschwindigkeit Titriergerat Titrationspararneter
Selektivitat
Robustheit
Nachweisgrenze
Die Nachweisgrenze muR fur eine Gehaltsbestimmung in der Regel nicht bestimmt werden.
Bestimmungsgrenze
Anstelle der Bestimmungsgrenze werden schon mit der Linearitatsprufung die Grenzwerte der Methodengultigkeit erhalten.
spateren Anwendungsbeispiel des Essigs wird dies durch die Aufstockung der Probe mit Standard erreicht. Die einzelnen Validierungsmerkmale werden in Tab. 6- 16 beschrieben.
Beispiel: Es soll in der Qualitatskontrolle ein 30%iger Essig untersucht werden. Die Gehaltsbestimmung soll per Titration erfolgen. Das praktische Vorgehen kann dabei nach dem folgenden Schema (Tab. 6-17) ablaufen: Beispielprobe: Titriermittel:
Wassrige Essigsaure ca. 30%ig NaOH 1,OO mol/l
278
6 Techniken und Gebiete
Tab. 6-17 Schema fur die Validierung einer Essig Titrationsmethode. Arbeitsschritt
Validierungsmerkmal
Durchzufuhrende Arbcit
1
Richtigkeit
Bestimmung des Titers der NaOH durch Titration mit Kaliumhydrogenphthalat als Urtiter:
~
-
Das Kaliumhydrogenphthalat (Urtitersubstanz) wird bei 120 "C zwei Stunden getrocknet.
-
Es werden sechs Proben mit ca. 2 g Kaliumhydrogenphthalat auf drei Stellen hinter dem Komma genau eingewogen und mit den vom Hersteller angegeben Parametern titriert (dynamisch, schnell, auf Equivalenzpunkt)
-
Furjede Titration (etwa 10 ml Verbrauch) wird der Titer bcrechnet: Titer = Verbrauch [ml] ,204,233 / (Einwaage [g] . 1000)
-
2
Prazision, Richtigkeit, Liiieari tat
Es wird der Mittelwert des Titers mit Standardabweichung angeben.
Es werden jcweils sechs Proben Essig, verdunnt auf ca. 100 ml mit destilliertem Wasser, mit unterschicdlicher Probenmcnge titriert: -
Scchs Titrationen mit ca. 1 ,0 Gramm Essig gcnau eingewogen. Sechs Titrationen mit ca. I .5 Gramm Essig genau eingewogen.
-
Sechs Titrationen mit ca. 2,0 Gramm Essig genau eingewogen.
-
Sechs Titrationen mit ca. 2.5 Gramm Essig genau eingewogen.
-
Sechs Titrationen mit ca. 3,s Gramm Essig genau eingewogen. Die Ergebnisse werden mit Mittelwert und Standardabweichung berechnet: % Essig = Verbrauch [ml] . Titer. 100/(Einwaage [g] . 1000)
Die Standardabweichung sollte in keinem Fall 0.3 % uberschrciten. -
Es werden in einer Grafik die Einwaagen gegen die Verbrauche aufgetragen. Die resultierende Ausgleichsgerade sollte einen Korrelationskoeffizienten von groller als 0,995 haben. Der Schnittpunkt der Geraden sollte durch der Ursprung gehen. Ein Verbrauch bei einer Einwaage von 0,O Gramm kann auf Blindwerte oder andere Probleme deutcn. Eine Abweichung von 30 1.11 (etwa 1 Tropfen) sollte nicht uberschritten werden. Anstelle der Einwaage kann auch der theoretiscbe Sollvcrbrauch aufgetragen werden.
-
Es werden in einer Grafik die Einwaagen gegen die Gehalte aufgetragen. Die resultierende Ausgleichsgerade sollte eine Steigung nahe 0 haben. Bei einem Wert von uber 0,l 8 zeigt die Methode eine Nicht-Linearitat. Anstelle der Einwaage kann auch der theoretische Sollverbrauch aufgetragen werden.
6.4 Validierung einer Titrationsmethode
279
Tab. 6-17 Fortsetzung.
Arbeitsschritt
Validierungsmerkmal
Durchzufuhrende Arbeit
3
Wiederfindung
4
Bestimmungsgrenzen
Zu sechs Proben von ca. 2,O g genau abgewogenem Essig werden jeweils 5,OO ml 1 moVl Essigsaure Normallosung hinzugeben. Der Verbrauch muR sich urn 5,OO ml . Titer erhohen. Die Standardabweichung sollte 0,3 % unterschreiten. Bei einer guten Linearitat im gesamten Bereich wird die Methode festgelegt fur Proben von 1,O bis 3,5 Gramm 30%igen Essig.
5
Robustheit
Eine Probe mit genau bestimmtem Gehalt wird mit einer Sechsfachbestimmung in vier anderen Laboratorien mit der gleichen Vorschrift titriert. Die Standardabweichung sollte 0,3 % nicht uberschreiten. Der Gehalt sollte sich um weniger als 0,3 % unterscheiden.
Die Titration liefert sehr genaue Werte bei Verbrauchen von 5 bis 20 m l Verbrauch. HOhere Verbrauche fiihren nicht zu einer besseren Wiederholbarkeit (Wiederholprazision). Bei Verbrauchen unter 5 ml Titriermittel mussen zusatzliche Aufwande beriicksichtigt werden. Die folgenden Grafiken verdeutlichen den Zusammenhang. Abbildung 6- 1 zeigt den guten linearen Zusammenhang einer Serie von Salzsaure-Titrationen. Abbildung 6-2 zeigt den Zusammenhang zwischen den erzielbaren Standardabweichungen in Abhangigkeit vom Verbrauch. Die genauen Zahlenwerte sind Tab. 6-18 zu entnehmen. Linearitatsverhalten der Titrationsmethode 20
-
f
/-
18 16 ,A
14 c.
E 12
~~
Y
S
J” 10
E
f ! 8
s
6 4
0 2
0
2
4
6
8
10
12
Sollwert [ml]
Abb. 6-1 Linearitat der Titrationen aus Tab. 6- 18
14
16
18
20
22
280
6 Techiiiken und Gehirte
Standardabweichung in Abhangigkeit vorn Verbrauch 6 r 5
0
1-
c
0
2
4
6
8
10
12
14
16
18
20
22
Sollwert [mi]
Abb. 6-2 Relative Standardabweichungin Abhangigkeit von der Probenmenge.
Tab. 6-18 Ergebnisse von jeweils 10 Salzsaure-Titrationenunterschiedlicher Probenmenge.
Vorlage [ml]
EQ [ml]
s
[ml]
src,[%I
pH-Wert
Dauer [s]
0,l
0,094
0,005
5,494
7,04
33
0,25
0,257
0,007
2,626
6,97
51
0,s
0,507
0,007
1,33 1
7.05
53
1
1,006
0,005
0,s 13
7,19
61
2
2,008
0,006
0,3 15
7,lO
76
5
5,013
0,009
0,189
736
101
10
10,013
0,005
0,048
7,16
I32
20
19,999
0,003
0,O 16
7,44
148
Eine vollstandige Uberpriifung der Richtigkeit einer Titration wiirde man nach folgendem Schema erhalten: Bestimmung des Titers einer Base A mit einem Urtiter wie Kaliumhydrogenphthalat. - Bestimmung des Titers einer Saure B mit einem Urtiter wie Natriumcarbonat. - Titration der SBure B mit der Base A. Der jetzt resultierende Titer muB 1.000 sein. Diese cyclische Bestimmung schliel3t alle ublichen Fehlermoglichkeiten aus.
6.4 Validierung einer Titrationsmethode
28 1
6.4.7 Validieren einer Karl Fischer Titration Die Karl Fischer Titration dient der Bestimmung von Wasser in vielen unterschiedlichen Matrizes. Sie ist als Methode in vielen Normen und im deutschen Arzneibuch enthalten. Die Methode ist weitgehend selektiv oder zumindest durch die Wahl von Solventien, Titriermittel, Probenvorbereitung und Reaktionsbedingungen selektiv zu gestalten. Die Validierung umfaBt hier die gleichen Elemente wie die Saure-Base-Titration. Tabelle 6- 19 zeigt das Vorgehen im Einzelnen auf.
Tab. 6-19 Schema einer Karl Fischer Titration. Vorgehen
Elemente
Was mu13 getan werden
Voraussetzungen
Reaktion
Es wird eine Probe titriert und die Titrationskurve analysiert. Abbildung 6-3 zeigt die wichtigsten Merkmale einer KarlFischer Titrationskurve. 1st der zu erwartende Gehalt kleiner oder groljer als das erste Ergebnis, ist mit einer Nebenreaktion zu rechnen.
Reagenz und Dosierung
Es wird eine Mehrfachbestimmung (z. B. 10 fach) mit einem Standard, einem Urtiter (Dinatriumtartrat Dihydrat) oder Wasser (Mikroliterspritze, evtl. wiegen) durchgefuhrt. Wenn unterschiedliche Mengen genommen werden, die auch unterschiedliche Burettenvolumina abdecken, ist damit die Geratefunktion des Titrators weitestgehend sichergestellt. Eine zusatzliche Priifmitteluberwachung ist dann nur noch in Fallen eines Problems oder zur Grundprufung des Titrators erforderlich.
Dichtigkeit des Titrationsgefarjes
Das Titrationsgefa mu13 dicht sein, weil die Luft eine gro13ere Menge Feuchtigkeit enthalt. Dies wird durch die Drift angezeigt. Die Drift sollte unter 5 pg Wasser pro Minute liegen. Bei der Arbeit mit dem Ofen ist die Drift groljer. Die Drift kann direkt am Gerat abgelesen werden oder wird leicht erhalten, indem nach dem Konditionieren (Trocknen des Solvents) eine Stunde gewartet und dann eine Titration gestartet wird. Die Drift berechnet sich nach: Drift [yglmin] = Verbrauch [ml] . Titer [mg Wasser/ml] 1000/60 [min]
Indikation
.
Die Funktionsfahigkeit der Indikation kann auf einfache Art bestimmt werden: Doppel-Pt-Elektrode aus dem TitrationsgefaR nehmen -
Titration starten: Es fliel3t kein Strom oder oder es wird keine Spannung angezeigt
-
Mit einer Metall-Buroklammer die beiden Platinstifte kurzschlierjen: Es flieRt ein Strom und die Titration bricht nach der Abschaltzeit ah.
Wenn dieser Test funktioniert, arbeitet das Indikationssystem richtia.
282
6 Techniken und Grbiete
Tab. 6-19 Fortsctzung. Vorgchen
Elemente
Was mu13 getan werden
Validierung
Prazision
Mehrfachbestimmung einer Probe (z. B. 10 fach). Ermittlung Mittelwert und Standardabweichung
Richtigkeit
-
Zur Probe wird bei jedcr Bestimmung eine definierte Menge Wasser (oder Standard) mehrfach hinzugcsetzt. Diese Menge muR vollstandig wiedergefunden werden. Mittelwert und Standardabweichungen der einzelnen Wiederfindungsmengen werden notiert. Weniger Wasser deutet auf eine nicht vollstandige Umsetzung hin. Ein hoherer Wassergehalt deutet auf Drift oder Nebenreaktionen hin.
-
Die Versuche zur Linearitatsprufung werden analysiert. Die Gerade muR eine Steigung (bei dcr Auftragung Sollverbrauch gegen Istverbrauch) von etwa 1,OO haben. Die Gerade muf.3 durch den Nullpunkt gehen. Der Korrelationskoeffizient sollte nahe 1,OO liegen. Abweichungen weisen auf Drift, Nebenreaktionen oder unvollstandige Umsetzungen hin.
-
Vergleich mit einem Standard, dessen Wassergehalt und Beschaffenheit bekannt ist und sich identisch mit der Probe verhalt. Der Standard muR zertifiziert sein.
-
Zur Probe wird bei jedcr Bestimmung einc definierte Menge Wasser (oder Standard) mehrfach hinzugesetzt. Diese Menge mu6 vollstandig wicdergefunden werdcn. Mittelwert und Standardabweichungen der cinzelnen Wiederfindungsmengen wcrden notiert.
-
Zur Probe mit bekanntem Gehalt werden weitere Proben mit bekanntem Gehalt gegeben. Diese Probenmenge mussen vollstandig wiedergefunden werden.
Wiederfindung
Lineari tat
Es werden mehrere Proben mit steigendem Gehalt titricrt. Dabei werden z. B. von jedem Gehalt zehn Titrationen durchgefuhrt. Der kleinste und grofite Wassergehalt sollte mit den praktischen Anforderungen uhereinstimmen. Die Gerade mu13 eine Steigung (bei der Auftragung Sollverbrauch gegen Istverbrauch) von etwa 1,OO haben. Die Gerade mu8 durch den Nullpunkt gehen. Der Korrelationskoeffzicnt sollte nahe 1 ,OO liegen. Von den einzelnen Titrationen eines Gehaltes wird Mittelwert und Standardabweichung berechnet.
Selcktivitat
Die Karl Fischer Titration ist selektiv fur Wasser. Die Methode i s t fur fast alle Prohentypcn gepruft. Nebenreaktionen mussen ausgeschlosscn werden kiinnen (uber Richtigkeit, Linearitat, Wiederfindunp).
6.4 Vulidierung einer Titrutionsmethode
283
Tab. 6-19 Fortsetzung. Vorgehen
Elemente
Was muR getan werden
Robustheit
-
-
Die Robustheit kann durch einen Ringversuch ermittelt werden. Es werden alle relevanten Parameter der Karl Fischer Titration variiert: Elektrode Losungsmittelmengen Temperatur Riihrgeschwindigkeit Titrationspararneter Ti triergerat
Nachweisgrenze
Die Nachweisgrenze ist bei der Gehaltsbestimmung kein Kriterium. Sie kann gleich der Bestimmungsgrenze definiert werden.
Bestimmungsgrenze
Der Arbeitsbereich ergibt sich aus der Linearitatspriifung. Der Bereich zwischen der kleinsten und groaten Probenmenge, der innerhalb des linearen Bereichs liegt (Bestimmung der zwei Probemengen entsprechend der geforderten Standardabweichung), wird als Arbeitsbereich definiert. Die Bestimmungsgrenze ist der dreifache Wert der Standardabweichung. In dem Beispiel der Saure-Base-Titration ist dieser Wert bei 0,018 ml erreicht, ein Wert der elwa einern Fiinftel der kleinsten Menge in diesem Versuch entsprache.
8.4
6,O 4,a
0,o 0.10
20.10
40.10
Abb. 6-3 Karl Fischer Titrationskurve.
60.10
80.10
100.10 120.10 ( s )
160.10
Die Interpretation der Titrationskurve ist bei der Karl Fischer Titration, wie auch bei vielen anderen Titrationen, von grofier Bedeutung. Abb. 6-3 zeigt ein Muster einer korrekten Titrationskurve. Wenn die Titrationskurve am Ende nicht parallel zur x-Achse verliiuft, sondern weiter gleichmafiig ansteigt, bedeutet dies eine Nebenreaktion oder eine kontinuierliche Drift. Ein zu scharfer Knick deutet auf eine Ubertitration hin. So sind viele mogliche Probleme bei der genauen Bestimmung in der Titrationskurve erkennbar. Die Validierung wird durch die Analyse der Titrationskurven erheblich erleichtert.
6.4.8 Ubertragen auf andere Titrationen Das Schema lafit sich auf alle anderen Titrationsarten ubertragen. Die Standardisierung der Titriermittel und die Uberprufung der Elektroden sind dabei die wichtigsten Arbeitsschritte. Die Abhangigkeit der Probenmatrix kann bei anderen Bestimrnungen ebenfalls einen zusatzlichen Arbeitsaufwand bedeuten. Tabelle 6-20 enthalt einige Urtiter und Ihre Anwendungsgebiete.
Tab. 6-20 Urtiter fur Titrationen. Molmasse
(g/mol)
garantiertcr Gehall
Oxidimetric Ccrinietrie
lY7.84
99.95- I00.05 ' X
I05 "C
Benloeslure Calciumcarbonat
Alkaliinetrie
122.12
Komplexometrie
IOO.09
I05 "C
Eisen( 11)-ethylendiammonium-sulfat
Oximetrie Cerinietrie
382, I5
99.9s- IOO.05 Q 99,95- 100.05 [L 99.9s- IOO.05 'L
Kaliumdichroinat
Oxidimetrie Ccrimetrie
294,19
99.95- IOO,O5 c/r
I05 "C
KaliumhydrogenPhthalat
Alkaliinctrie
204.23
99,9s- IO0,OS %'
Kaliumiodat
Ox idinict rie Cenmetne
2 14.00
99.95-100.05 %
150 "C
Natnumcarbonat Wasserfrei
Acitlinietne
105.Y9
99.95-100.0s Q
28.5 "C
Natriumchlorid di-Natriumoxalal
98.44 I34.00
di-Natriumtartrat Dihydrat
Argentometrie Oxidimetrie Ceriinetrie Karl-FischerTitration
Tns(hydroxyinethyl aininomethan
Perchlorwuretitration
121.13
99.95- I00.05 (%
Zink
Komnexometrie
65.31
99.95- IOO.05 %'
Urtitersubstanz
Anwendung
di-Arsentrioxid
Formel
230,OX
nach
Troc knung hei
min. 99.5 '%'
Wasw-: 15.66 ? 0.05 'X
Zn
I05 "C
6.4 Validierung einer Titrutionsmethode
285
6.4.9 Zusammenfassung Die Titrationsmethode dient der Gehaltsbestimmung. Die Validierung einer solchen Methode ist reativ einfach durchzufiihren. Fur die meisten Anwendungen existieren Urtitersubstanzen, die eine Uberpriifung der Richtigkeit problemlos ermoglichen. Die Titration lafit sich in einem weiten Konzentrationsbereich einsetzen. In der Praxis wird jedoch die Frage der Bestimmungsgrenzen mehr durch die Konzentrationsbandbreite der vorliegenden Proben definiert. Eine Nachweisgrenze ist bei einer Gehaltsbestimmung nicht notwendig. Da die meisten Titrationen nicht selektiv sind, miissen bei vielen Validierungen solche Kriterien auch nicht beachtet werden. Die gute Linearitat und Prazision der Titration lafit sich bei vielen Anwendungen immer wieder feststellen. Die Probleme liegen haufig schon im Bereich der Voraussetzungen der Validierung, narnlich der Gerateuberwachung. Der Uberpriifung der Sensoren, Biiretten und Chemikalien ist besondere Aufmerksamkeit zu schenken.
6.5
Validierung von Software und computerisierten Anal ysensy stemen
Ludwig Huber, Agilent GmbH, Waldbrclnn
6.5. I
Einleitung
Softwarefehler konnen zu gravierend falschen Ergebnissen bei analytischen Messungen fuhren. Deshalb sollten Software und Computersysteme immer Bestandteil einer Gesamtvalidierung sein. Die Validierung von Software und computerisierten Systemen 1st auch zur Erfullung von verschiedenen gesetzlichen Auflagen erforderlich und verschiedentlich auch Bestandteil von Firmengrundsiitzen zur Qualitat. Der nachfolgende Beitrag fuhrt Benutzer von Analysegeraten durch den gesamten ProzeB der Validierung von der Qualifikation des GerZteherstellers uber die Installation und Qualifizierung fur den Betrieb bis zur laufenden Kalibrierung und Leistungskontrolle im Routinebetrieb. Weiterhin gibt er Anleitungen fur die retrospektive Evaluierung und Bewertung von bereits existierenden Systemen und zur Validierung von Programmen, die in einem Labor entweder als einzelstehende Software oder in Verbindung mit einer Gerltesteuer- und Auswertesoftware entwickelt wurden. Zu dieser Thematik siehe auch [70-721. Im wesentlichen werden folgende Themen behandelt: Definition von computerisierten Systemen und von verschiedenen Softwarekategorien Ubersicht einer Gesamtvalidierung Beitrag von Gerateherstellern - MaBnahmen bei der Installation und lnbetriebnahme - Validierung am Beispiel einer Chromatographiesoftware - Validierung von selbst erstellen Programmen Validierung von bereits vorhandenen Systemen -
6.5.2 Definition von computerisierten Systemen und Softwarekategorien Vor einer Diskussion uber die Validierung sollten die wichtigsten Begriffe im Zusammenhang mit Computerisierten Systemen und der verschiedenen Softwarekategorien abgeklart werden. In analytischen Labors eingesetzte Computersysteme bestehen aus der Computerhardware, Peripherien und aus der Software, um eine bestimmte Aufgabe auszufuhren. Software schliel3t das Betriebssystem ein, wie z. B. Microsoft MS DOS und Microsoft Windows, NT, Microsoft 2000, UNlX und die Standard- Anwendungsprogramm-Software, L . B . Chromatographie-Software.
6.5 Vulidierung von Software und computerisierten Analysensystemen
287
---a
1
Instrumente
11
SOPS Handbuchei
computer %stem
coMput€xisiertessys~
USW.
I
Abb. 6-4 Beispiel fur ein Computer- und Computergestutztes System [70].
Der Computer ist eng verbunden mit der Gerate-Hardware wie beispielsweise einer Waage oder einem Chromatographen. Die Software im Computer steuert nicht nur die Gerateparameter wie beispielsweise einen Temperaturgradienten, sondern sie kann auch Daten von den Geraten aufnehmen und auswerten, z. B. Signale oder Spektren von einem Massenspektrometer. Das ganze analytische System besteht aus der Computerhardware, Software und der analytischen Hardware, die als ein computergestiitztes System definiert wird. Alternativ zu dem Begriff computergestiitzt werden auch die Begriffe computerisiert und computergesteuert benutzt (s. Abb. 6-4). In dem folgenden Beitrag wird die Validierung von computergesteuerten Systemen diskutiert. Es wird dabei allerdings nicht auf die sehr aufwendigen Aktivitaten bei der Entwicklung und Herstellung der Hardware und Software eingegangen. ValidierungsmaBnahmen bei der Herstellung von Software sind an anderer Stelle ausfiihrlich beschrieben [70]. Hier beschranken wir uns auf Validierungstatigkeiten im Labor des Benutzers. Sofmare Kategorien: Computer in analytischen Labors enthalten typischerweise drei Arten von Software (s. Abb. 6-5):
1. Systemsoftware, z. B. Betriebssysteme DOS@, NTTM, 0S/2Twoder UNIX@, die von Softwarefirmen geliefert wird, wie beispielsweise von Microsoft. Systemsoftware beinhaltet auch Druckertreiber und Dateimanagement. Sie werden zusammen mit der Computerhardware ausgeliefert, sind nicht anwenderspezifisch und konnen vom Benutzer normalerweise nicht modifiziert werden.
288
6 Techniken und Gehiete
Systemsoftware unabhangig von der spezifischen Applikation Standardsoftware Anwender definiert Bedingungen, Funktionsund Reportparameter Applikationssoftware (urn das System eigenen Anforderungen anzupassen)
MS-DOS UNlX
z. B. Chromato-
graphiesoftware
z. B. Excel oder
Chromatographiesoftware Macros
Abb. 6-5 Kategorien von Software [70]
2. Standard Applikationssoftware, beispielsweise Chromatographie- oder LIMS-Software. Diese wird ublicherweise von Softwarelieferanten zur Verfugung gestellt. 3. Anwenderspezifische Applikationssoftware. Sie wird ublicherweise vom Anwender oder im speziellen Auftrag des Anwenders von einer Drittfirma erstellt. Beispiele fur anwenderspezifische Software sind Macro-Programme fur Chromatographiesoftware oder fur Tabellenkalkulationen. Zu I. Weitverbreitete Systemsoftware benotigt keine spezielle Validierung auf der Anwenderseite. Man geht davon aus, da13 die korrekte Funktion durch die richtige Ausfiihrung der Standard- und Applikationssoftware bestatigt wird. Zu 2. Bei Standard-Applikationssoftware sollte vom Lieferanten der Nachweis erbracht werden, dal3 die Software unter Anwendung eines anerkannten QualitgtsmanagementSystems entwickelt und validiert wurde. Der Anwender sollte einen Funktionstest (Akzeptanztest) durchfuhren und damit den Nachweis erbringen, da13 das Produkt in der Umgebung des Anwenders die vorgesehene Leistung erbringt. Zu 3. Vom Benutzer entwickelte Applikationssoftware sollte vom Benutzer validiert werden.
6.5.3 Ubersicht einer Gesamtvalidierung Abbildung 6-6 zeigt die wesentlichen Schritte, die im Zusammenhang mit einer Gesamtvalidierung durchgefuhrt werden sollten.
6.5 Validierung von Software und computerisierten Ariulysensystemen
289
Komponenten, Matrix Methoden-Leistungsmerkmale (Prazision, Nachweisgrenze)
I * I Funktionsspezifikationen
Benutzerspezifische
Validierung
Auswahl des Gerates Qualifizierung des Herstellers
lnstallationsqualifizierung Betriebsqualifizierung
Definition der Geratefunktionen und Spezifikationen (Basislinienrauschen des Detektors)
Definition und Verifizierung von Kriterien (z. 8.I S 0 9001)
Verifizierung der korrekten Installation Verifizierung der Geratefunktionen und SDezifikationen Verifizierung der Benutzeranforderungen
- Systemeignungstests - Kontrollgruppen
Vorbeugende Waftung
Datenvalidierung
Plausibilitat, Integritat, Nachvollziehbarkeit
Abb. 6-6 Schematische Darstellung einer Gesamtvalidierung.
1. Da Validierung den Nachweis eines Produktes oder Prozesses fur den geeigneten Gebrauch bedeutet, sollte am Anfang jeder Validierung immer definiert werden, wofur das Produkt oder die Methode eingesetzt werden soll. 2. Aus den Anforderungen des Systems werden dann die Anforderungen fur die einzelnen Komponenten abgeleitet. Fur ein Analysengerat sind das Geratefunktionen und Spezifikationen. 3. Falls man sich fur die Neubeschaffung eines Gerates entschieden hat, folgt nun die Auswahl des Gerates und des Gerateherstellers. Der Geratehersteller sollte nach bestimmten Anforderungen qualifiziert werden. 4. Falls das Gerat nicht alle Funktionen enthalt, konnen vom Anwender oder im Auftrag des Anwenders Zusatzprogramme erstellt werden. Diese Programme mussen vom Anwender validiert werden. 5. Die Installation sollte nach schriftlichen Verfahren durchgefiihrt werden. Vor der Inbetriebnahme sollten die in Punkt zwei erstellten Funktionen und Spezifikationen iiberpriift werden. 6. Die verwendeten Methoden sollten grundsatzlich validiert sein. 7. Die Eignung der Methode sollte auf dem neuen Gerat nachgewiesen werden. Diese Leistung des Systems sollte in der Routineanwendung laufend uberpruft werden. 8. Die mit dern System erzeugten Daten sollten validiert werden.
6.5.4 Beitrag des Gerateherstellers bzw. Softwarelieferanten zur Validierung Software fur Gerltekontrolle und Datenauswertung wird gewohnlich von Gerateherstellern bezogen. Auch in diesem Fall ist der Benutzer fur die Gesamtvalidierung verantwortlich. Diese Forderung findet man in dem OECD- GLP-Konsenspapier Nummer 5 [73]. Das bedeutet aber nicht, daB der Benutzer mit dem Problem immer auf sich allein gestellt sein muB. Das OECD-Papier gibt auch einen Hinweis darauf, daR Teile der Validierung im Namen des Benutzers vom Hersteller durchgefuhrt werden konnen. Der Benutzer sollte sich vergewissern, daB fremdbezogene Systeme in Ubereinstimmung mit einem anerkannten Qualitiitssicherungssystem, z. B. I S 0 900 I . entwickelt und wahrend der Entwicklung auch validiert wurden (s. Abb. 6-7).
Es wird empfohlen, I . Ausschlieljlich Hersteller mit IS09001 Zertifizierung auszuwahlen und 2. eine schriftliche Garantie vom Hersteller zu verlangen, daR eine Validierung nach dokumentierten Verfahren durchgefuhrt wurde und 3. daR zusltzliche Validierungsdokumente einschlieBlich Quellcode, Testplane und Testergebnisse Behorden zugiinglich gemacht werden konnen. 4. Hersteller auszuwahlen, die entweder durch direkte personelle Unterstutzung oderhnd durch Bereitstellung von Testpaketen bei der Validierung im Labor des Anwenders helfen konnen. Erfullung von Punkt 3 ist nur fur Labors erforderlich, die nach GLP oder GMP arbeiten.
Der Anwender hat sicherzustellen, daO die Softwareprogramme validiert sind. Die Validierung kann vorn Anwender oder vom Lieferanten durchgefuhrt werden, vorausgesetzt, der Anwender fuhrt einen Akzeptanztest durch. Der Anwender sol1 gewahrleisten, daO jede von auOerhalb bezogene Software uber einen anerkannten Lieferanten bezogen wurde. I S 0 9001 Registrierung ist nicht zwingend notwendig, aber zweckdienlich.
~
Abb. 6-7Verantwortlichkeiten von Hcrstcller und BenutIer 1721.
6.5 Vulidierung von Sofmctre und computerisierten Analysensysternen
29 1
6.5.4.1 Installation Die Dokumentation der Installation ist Bestandteil der Gesamtvalidierung. Fur groSere Labors mit vielen Geraten ist es ratsam eine Datenbank anzulegen. Eintrage fur jedes Gerat sollten folgendes beinhalten: Firmeneigene Identifikationsnurnmer (Assetnummer) Bezeichnung des Gerates (Name, Seriennummer) Name, Adresse und Telefon/Faxnummer/email des Gerateherstellers und, falls vorhanden, die Nummer des Servicevertrags Revision der Firmware Software mit Produkt- und Revisionsnummer Datum des Gerateeingangs Der gegenwartige Standort GroIJe, Gewicht Geratezustand bei Eingang, zum Beispiel neu oder gebraucht Eine Liste mit autorisierten Benutzern und verantwortlichen Personen Hierbei sollte insbesondere auf eine gute Erfassung aller Hardware- und Softwarebestandteile Wert gelegt werden. Das ist insbesondere im Hinblick auf eine Erweiterung des Systems wichtig. Tabelle 6-2 1 zeigt ein Formular, das sich zur Erfassung eines Computersystems gut bewahrt hat. Tab. 6-21 Formular zur Eingabe von Daten fur ein Computersystem. ~
Computer Hardware
Hersteller Modell (Nummer, Bezeichnung) Seriennummer Prozessor Co-prozessor Speicher (RAM) Graphikkarte Videospeicher Modem Maus Festplatte CD-ROM Platzbedarf Drucker
Hersteller Modell Seriennummer Platzbedarf Systemsoftware Betriebssystem (Bezeichnung, Revision) Benutzerschnittstelle
292
6 Techniken und Gehiete
Tab. 6-21 Fortsetzung. Applikationssoftware 1
Be
~
~~
Applikationssoftware 2
Beschreibung HerstellcrLieterant Produktbezeichnung mit Revision Erforderlicher Speicherplatzbedarf
6.5.4.2 Testen des Gesamtsystems vor der Inbetriebnahrne Bevor die Geriite fiir analytische Messungen eingesetzt werden, sollten sie von dem Benutzer in seiner Laborumgebung ausfuhrlich getestet werden (Akzeptanztest). Das Ziel ist nachzuweisen, da13 das System das tut, was es tun soll. Die Tests und entsprechende Akzeptanzkriterien hangen von dem Geratetyp und vom beabsichtigten Gebrauch ah. Ein HPLC-Test kann z. B. das Uberprufen der richtigen Kornmunikation zwischen Modulen oder das Uberprufen des Basislinienrauschens und der Prazision der Retentionszeiten und Peakflachen beinhalten. Anweisungen fur diese Tests sollten zusammen mit Grenzwerten fiir Akzeptanzkriterien vom Hersteller zur Verfugung gestellt und vom Benutzer entsprechend der geplanten Verwendung angepaRt werden. Die Anweisungen sollten auch Empfehlungen fur den Fall beinhalten, daR Gerate die vorgegebenen Grenzwerte nicht einhalten. Bei einer Erstinstallation wird hier ublicherweise der Hersteller beauftragt, das Problem zu losen.
System- oder Modultest? Bei kornplexen modularen Systemen gibt es grundsiitzlich zwei Testphilosophien: - Testen jedes Moduls fur sich allein - Testen des Gesarntsystems. Fur geschlossene Systerne, beispielsweise ein cornputerisiertes HPLC System entsprechend Abb. 6-8 ist generell ein Systemfunktions- und Leistungstest vorzuziehen. Der Arbeitsaufwand ist wesentlich geringer und man kann davon ausgehen, dal3 bei erfolgreichem Systemtest auch die einzelnen Module richtig funktionieren. Modultests sollten nur als Bestandteil einer Diagnose durchgefuhrt werden, falls der Systemtest nicht erfolgreich durchgefuhrt werden kann. 6.5.4.3 Ausgeubte Softwarefunktionen und Darstellung der Ergebnisse Ein Ergebnis eines Gesamtsystemtest uber die Leistungsfahigkeit eines HPLC-Systems ist in Abb. 6-9 dargestellt. Da in diesern Beispiel die gesamte Testdurchfuhrung automatisch
6.5 Vulidierung von Sojiwure und computerrsierten Anulysenswtemen
293
-
1--
.
Systentest ( empfohlen fiir Leistungstests)
I
Modultest ( enpfohlen fiir Kalibrierung einzelner Module, z.B. Wellenliingengenadgkeit und fiir Untersuchung Mn Fehlern)
Abb.6-8 Gegenuberstellung von Modul- und Systemtest [70].
erfolgt und von einem Computersystem gesteuert wird, werden hierbei nicht nur die Leistungsmerkmale der Geratehardware sondern auch alle wesentlichen Softwarefunktionen getestet. Zu den ausgeubten und getesteten Softwarefunktionen gehoren: -
Geratesteuerung
- Datenaufnahme - Peakintegration - Quantitative Auswertung -
Statistische Auswertung
- Abspeicherung der Ergebnisse - Wiedereinlesen der Ergebnisse -
Ausdrucken der Ergebnisse.
Der Testreport sollte einige wesentliche Elemente enthalten Angaben oder Referenz zu Testmethode Angabe, wo die Datenfiles abgelegt sind - Person, die die Tests durchfuhrt - Testparameter - Akzeptanzkriterien - Aktuelle Ergebnisse - Testdatum. -
HPLC Instrument Verification Report Test method: Data File Directory: Original
C\HPCHEM\ l\VERIF\Che C\HPCHEM \ l\VERIF\Res Dr. Watson
Test item Userlimit Actual Com DAD noise <5xl0-%U 1x10-5AU Pass Baseline drift <%lo1.5~10Pass DAD WL +1nm 21 nm Pass DAD 1.5AU 2.2AU Pass Pump performance <0.3O h RSD R?D. 15Yo RSD rrrPass k0.15 "C Pass Temp stability 20.15 "C Precision of peak area< 0.5% RSD 0.09Yo RSD Pass Verification Test Overall Pass HP 1100 Series System, Friday, April 14,2000 Test Engineer Name: Signature: Abb. 6-9 Testbericht einer aurornatischen HPLC Verifizierung (HPI 100 Seric mit HP ChernStation).
6.5.5 Automatischer Test des Computersystems ohne Geratehardwaretest Computersysteme erfahren weit haufiger eine Anderung als Geriitehardware. Der Hauptgrund ist Installation von neuer Software mit neuen Leistungsmerkmalen. Oft ziehen die Softwareanderungen auch eine Computerhardwareanderung nach sich, da neue Software vielfach auf schnellere Computer ausgerichtet ist und mehr Speicher erfordert. Jedes Computersystem sol1 nach einer Anderung durch geeignete Tests darauthin uberpruft werden, ob es noch die erforderliche Leistung erbringt. Falls sich die Anderung ausschlieRlich auf das Computersystem bezieht, reichen auch Tests ausschlieRlich an dem Computersystem aus, die Gerltehardware braucht in diesem Fall nicht in den Test mit einbezogen werden. Im folgenden wird ein praktikables Verfahren beschrieben, mit dem sich beispielsweise Chromatographie-Auswerte-Systeme ohne Probeninjektion einfach und genau testen lassen. Das Verfahren beruht auf sehr gut detinierten Chromatographie Rohdatenfiles und standardisierten Auswertemethoden.
6.5 Wilidierun~von Sofiware
iind
compurerisierien Ancil\;sens~sreinnrn
295
Das Verfahren kann allgemein dafur benutzt werden, die Funktionen und die richtige Arbeitsweise fur formale Akzeptanztests, Leistungsiiberpriifungen, Betriebsqualifikationen oder Requalifikationen zu verifizieren: - bei der Installation - nach einer Veranderung des Systems (Computerhardware und Softwareaufrustungen) - nach der Hardware Reparatur - nach langerem Einsatz
Eine erfolgreiche Ausfuhrung des Verfahrens stellt sicher, daa:
- Programmdateien richtig auf die Hard Disk geladen werden, -
die aktuelle Hardware kompatibel rnit der Software ist und
- die aktuelle Version des Betriebssystems und der Benutzeroberflache rnit der Applika-
tions-Software kompatibel ist. Diese Methode testet Schliisselfunktionen des Systems, wie beispielsweise die Peakintegration, Quantifizierung, Ausdruck, Abspeichern und Wiedereinlesen von Ergebnisdaten. Zur Erstellung der Vergleichsdaten werden zunachst Testchromatogramme von Referenzstandards oder wirklichen Proben erzeugt und die erhaltenen Rohdaten werden auf einem elektronischen Speicher als Master Datei gelagert. Als nachstes wird eine Referenzmethode fur die Integration und Auswertung entwickelt. Danach werden die Rohdaten rnit dieser Methode ausgewertet und die Ergebnisse ausgedruckt und elektronisch abgespeichert. Bei der Verifizierung werden die gleichen Rohdaten rnit der gleichen Methode ausgewertet und die neu ermittelten Ergebnisse werden rnit den elektronisch abgespeicherten Ergebnissen verglichen (s. Abb. 6- 10). In einem einseitigen Verifizierungsbericht werden die wichtigsten Informationen uber den Test zusammengefaat. Dazu gehoren die Identifikation der Gerate- und Computerhardware und der Software, die getesteten Funktionen, das Ergebnis und Eingabefelder fur den Namen und die Unterschrift der Testperson (s. Abb. 6- I 1 ). Diese Methode hat mehrere Vorteile:
1. Der Benutzer kann eine oder mehrere Dateien wahlen, die reprasentativ fur Laborproben sind. Zum Beispiel konnte eine Datei gut getrennte Peaks enthalten, die einen weiten Bereich der Kalibrierungskonzentrationen abdecken, um die Linearitat des Integrators zu verifizieren. Ein zweites oder drittes Chromatogramm kann dazu benutzt werden, die Moglichkeiten des Integrators fur die genaue Integration bei schwierigen Trennungen zu verifizieren. Chromatogramme konnen ausgewahlt werden mit: - Peaks nahe der Detektionsgrenze - Peaks mit Schultern - schlecht aufgeloste Peaks - Peaks auf driftenden Basislinien - Peaks rnit Tailing - asymmetrischen Peaks
Erzeugung der 1 Erzeuge .,Master"chrornatogramm 2 Entwickle Methode fur die Auswertung 3 Erzeuge ,,Master"ergebnis 4 Speichere das Ergebnis elektronisch und auf Papier
Verifizierung 1 Wahle das , Master"chromatogramm und die Methode 2 Test lauft automatisch ab 3 Software vergleicht aktuell ermittelte Werte mit Sollwerten 4 Bericht wird automatisch ausgedruckt
.
.
Datenubertragung Datenakquisition Integration Quantifizierung Abspeichern/Einlesen
Abb. 6-10 Vcrfahren zur Vcriiiiierung von Chromatographicsoitware
2. Der ganze Ablauf ist vollautomatisch. Das vermeidet fehlerhafte Ergebnisse und ermutigt den Benutzer. die Tests haufiger durchzufuhren. 3. Die Ergebnisse der Verifizierung sind so dokumentiert, daB die Dokumentation direkt fur interne Uberprufungen und externe Audits verwendet werden kann.
4. Auf Wunsch konnen detaillierte Testdaten ausgedruckt werden.
6.5.6 Validierung von Anwendungsprogrammen, die vom Benutzer erstellt wurden Eine vom Geriitebenutzer selbstentwickelte Software sollte auch vom Benutzer validiert werden. Es kann sich dabei um Programme handeln, die unabhlngig von Analysengeraten ablaufen, z. B. statistische Auswertungen von manuell in den Computer eingegebenen Daten oder um - ein Macro-Programm, das direkt fur die weitere Auswertung von Daten eingesetzt wird. Als Bestandteil der Validierung sollte in jedern Fall eine Dokumentation erstellt werden, die unter anderem beinhaltet, was das Programm machen sol1 wer die Formeln definierte und eingab und was die Formeln bedeuten und welche Tests gemacht wurden.
6.5 Vatidierung von Sofmure und computerisierten Analysensystemen
2%’
ChemStationVerification Report Tested Configuration Component
Revision
Serial Number
Diode-array detector HPLC 3D ChemStation Microsoft Windows MS-DOS Processor CoProcessor
1.o Rev. A.02.00 3.10 (enhanced mode) 5.0 i486 Yes
3148G00859 N/A N/A N/A N/A N/A
ChemStation Verification Test Details Test Name Data File Method Original Acquisition Method Original Operator Original Injection Date Original Sample Name
:C:\HPCHEM\l \VERIFYCHECK01 .VAL : C:\HPCHEM\l\VERIFWCHECHOl .VAL\DEMODAD.D : C:\HPCHEM\l\VERIFWCHECKOl .VAL\DEMODAD.M : PNASTD : Hans Obbens : 08/02/1985 : Al RTEST
Signals Tested Signal 1 : DAD B, SIG=305, 190 Signal 1 : DAD B, SIG=270, 4 Signal 1 : DAD B, SIG=310, 4
Ref=550,100 of DEM0DAD.D Ref=550,100 of DEM0DAD.D Ref=550,100 of DEM0DAD.D
ChemStation Verification Test Results Test Module
Selected For Test
Test Result
Digital electronics test Integration test Quantification test Print analytical report
Yes Yes Yes Yes
Pass Pass Pass Pass
ChemStation Verification Test Overall Results: Pass HP 1050 LC System, Monday, Aprol7,2000 12:16:55 PM by Page 1 of 1
Abb. 6-11 HP ChemStation Testbericht. Bei Bedarf konnen detaillierte Reports ausgedruckt werden [701.
298
6 Techniken icnd Gebiete
Der Benutzer sollte das Programm testen und die korrekte Funktion bestatigen. Es wird empfohlen, die von Computerprogrammen ermittelten Ergebnisse an einigen kritischen Beispielen mit einer von dem Programm unabhangigen Methode, z. B. mit einem Taschenrechner, nachzuvollziehen. Eine haufig gestellte Frage ist, wieviele Tests durchgefuhrt werden sollen und welcher Art die Tests sein sollen. Die Antwort ist relativ einfach: Die Tests sollen zeigen, dal3 das System richtige, genaue und zuverlassige Ergebnisse liefert. Ein Testprogramm sollte typische Testfalle uber den gesamten geplanten Anwendungsbereich beinhalten und sowohl Grenzbereiche als auch nicht erlaubte Eingaben enthalten. Falls das Programm vorwiegend mit kleinen Zahlen arbeiten wird, sollen auch die Testfalle kleine Zahlen beinhalten. Falls das Programm drei Stellen nach dem Komma verarbeiten wird, sollen die Tests auch solche Zahlen beinhalten. Es sollte auch das Verhalten bei unerlaubten Eingaben getestet werden. Eine beliebte Testmethode ist das Verhalten des Programms bei einer Division durch die Zahl Null. Die Tests sollten im Betrieb in regelmaljigen oder unregelmafligen Abstanden wiederholt werden. In gleicher Weise sol1ten kommerzielle Tabellenkalkulationsprogramme und Datenbanken Funktionstests unterzogen werden, die den Nachweis erbringen, dal3 die Programme fur die beabsichtigte Anwendung richtig funktionieren. Dies ist insbesondere dann wichtig, wenn vom Benutzer Formeln zur Berechnung von Daten eingegeben wurden. Es ist heute al lgemeines Verstandnis, dalj fur kommerziel le Tabellenkalkulationsprogramme kein Nachweis vom Hersteller uber die Validierung vorliegen mu& es sollten jedoch Ergebnisse von Tests vorliegen, die mit benutzertypischen Werten durchgefuhrt werden. Eine wichtige Frage beim Einsatz von Spreadsheet und Macro-Programmen ist die Frage der Sicherheit und der Integritat (s. Abb. 6-12). Formeln in Spreadsheets lassen sich
0
Beschreibung, was das Programtn
M e Beschreiung der vexwendeten
Berechnungiiber das erskllte
mgramn Andere Berechnung, zB. manuell oder nit lbchenrechr
nrmthenrmtischenFormeln Allsdruck des P r o m 0 Erwartete Testergebnisse 0 Aktuelle E r g e b h e VerfahrenfiiraWrisierte iindenmgen 0
Vergleich der Ergebnisse
Abb. 6-12 Validierung von Macros.
6.5 Vulirlierutig \'on Sojhvare und computerisierten Ancil~sens~stemeti
299
relativ leicht verandern und werden oft nicht ausreichend oder gar nicht dokumentiert. Deshalb sollten Verfahrensanweisungen vorhanden sein, die festlegen, wer Anderungen autorisiert, durchfuhrt, testet und wer die Programme schliefilich fur die Benutzung freigibt. Am Ende der Validierung sollte folgende Dokumentation als Minimum vorliegen: El Eine Beschreibung, was das Prograrnm macht El Eine Beschreibung der mathematischen Formeln, die irn Programm benutzt werden Ein Ausdruck des Programms Falls erforderlich, eine Liste rnit Erlauterungen zum Programm Ein Testverfahren rnit Akzeptanzkriterien El Ein Testbericht mit erwarteten und aktuellen Ergebnissen, gepruft und unterzeichnet 0 Ein Verfahren fur Anderungen (z. B. wer autorisiert die Anderungen, wer fuhrt sie durch, wer testet die geanderten Programme und wer gibt sie frei) El Datum der Installation El Name des Programmierers Ed Revisionshistorie rnit den Angaben, wann von wem welche Anderungen gemacht wurden.
6.5.7
Nachtragliche Untersuchung und Validierung von existierenden Sy stemen
Bereits bestehende computergestutzte Systeme in Labors benotigen im Nachhinein eine Untersuchung und Bewertung, falls ihre anfangliche Validierung nicht formal dokumentiert wurde. Es ist schwierig, dieselben Validierungskriterien fur ein alteres Cornputersystem anzuwenden wie sie fur ein neues System angewandt werden. Die Software wurde eventuell nicht in Ubereinstimmung rnit neuesten Richtlinien entwickelt und validiert oder die Dokumentation ist eventuell nicht archiviert worden. Glucklicherweise haben existierende computergestutzte Systeme einen wesentlichen Vorteil gegenuber neuen Systemen: die Erfahrung uber langere Zeit hinweg. Die Validierung kann diese Information nutzen, indem man die Qualitiit der analytischen Ergebnisse von computergestutzten Systemen aus der Vergangenheit anschaut und beurteilt. Eine solche Beurteilung kann genugend Beweismaterial erbringen, dab das System das gemacht hat und immer noch macht, was es machen SOH. In diesem Fall besteht eine Untersuchung und Validierung im Nachhinein ausschliefilich aus einer detaillierten Dokumentation dessen, was schon in der Vergangenheit gemacht wurde. Bevor ein EntschluB gefafit wird, ein existierendes System im Nachhinein zu validieren, sollte daruber nachgedacht werden, ob der Kauf einer entsprechenden neuen Software oder einer Nachrustungssoftware nicht sinnvoller ware. Wichtige Kriterien fur eine solche Entscheidung sind die zu erwartenden Kosten der nachtriiglichen Validierung gegenuber einem neuen System und eine Beurteilung, wie erfolgreich die Validierung sein wird. Das letztere kann aus der Vergangenheit des Computersystems beurteilt werden. Kriterien sind Art und Ergebnisse von durchgefuhrten Wartungsarbeiten, Kalibrierungen und Leistungsuberprufungen sowie ein mehr oder weniger reibungsloser Betrieb.
Sobald man sich entschlossen hat das System zu validieren, sollte man einen Validierungsplan und entsprechende Validierungsdokumente erstellen. Vorzugsweise sollten die gleichen Dokumentationen vorhanden sein wie im vorigen Kapitel fur neue Systeme beschrieben, und Versuche sollten gemacht werden, um an diese Informationen zu gelangen. Falls die Bewertung der Ergebnisse aus der Vergangenheit keinen genugenden Nachweis erbringen. daB das System validiert ist, sollte ein entsprechendes Testprogramm entwickelt werden. Das Validierungsprotokoll fur ein existierendes System sollte auch eine Liste von nicht vorhandenen Dokumenten enthalten, die normalerweise fur die Validierung erforderlich sind. Das Protokoll sollte auch eine Erklarung enthalten, warum die Dokumente fehlen. In vielen Fallen mag das System qualifiziert sein, aber wichtige Daten wurden nicht dokumentiert. In anderen Fallen mogen die Daten zwar vorhanden sein, aber sie sind nicht durch eine Unterschrift autorisiert worden. Der Validierungsplan sollte einen Aktionsplan enthalten, der beschreibt, was gemacht werden sollte, falls die erzeugten Daten nicht den s p e d zierten Validierungsanforderungen entsprechen, beispielsweise wer in diesem Fall benachrichtigt werden soll. Ein solcher Fall konnte eintreten, wenn sich bei sorgfaltigen Funktionstests herausstellt. daR Fehler in einer rnathematischen Formel vorhanden sind. Nach der Untersuchung und Validierung sollten folgende Dokumente vorhanden sein: Der Validierungsplan und ein Validierungsprotokoll Eine Beschreibung der Systemhardware und Software - Liste mit Spezifikationen Ein Geriiteprotokol aus der Vergangenheit mit zeitlicher Auflistung von Geriiteausflllen, Reparaturarbeiten und Kalibrierungen - Testdaten. die nachweisen, dalS das System macht, was es machen SOH. Das konnen Testergebnisse von Systemeignungstests oder gut dokumentierte Kontrollkarten sein - Verfahren und Anweisungen fur vorbeugende Wartung und Leistungstests (z. B. regelm3Bige Systemeignungstests oder die Analyse von Qualitatskontrollproben) Plan zur Aufieichnung von Fehlern und ein Aktionsplan im Falle von Gerateausfiillen Bedieiiungsanleitungen Quellcode (bei fremdbezogenen Systemen beim Hersteller). -
Mehr Details und eine Standardarbeitsanweisung (SOPS)uber die nachtriigliche Validierung bestehender Systeme siehe 170, 7 I].
6.5.8 Zusammenfassung Computergestutzte Systeme sollten validiert und die Ergebnisse dokumentiert werden -
Fur fremdbezogene Computersysteme und Software sollte der Lieferant die Software wiihrend der Entwicklung validieren und entsprechendes schriftliches Beweismaterial zur Verfugung stellen. Der Hersteller sollte garantieren, daB Validierungsdokumente wie die Testplane, Testergebnisse und der Quellcode Behorden zugiinglich gemacht werden kiinnen. Der Benutzer sollte sich vergewissern, daB der Hersteller die Produkte gem2B einem anerkannten Qualitatssicherungssystem entwickelt.
6.5 Validierung von Sofhvare und computerisierten Analysensystemen
30 1
Bevor das System in der Routine eingesetzt wird, sollten die korrekten Funktionen vom Benutzer unter typischen Betriebsbedingungen bestatigt werden. Ein integrierter chromatographischer Systemfunktionstest beispielsweise rnit gut charakterisierten Referenzproben ist genugend Beweismaterial fur das korrekte Funktionieren der Hardware und Software, falls die aktuellen Testergebnisse in Ubereinstimmung rnit den erwarteten Ergebnissen sind. - Software, die vom Benutzer entwickelt wurde, sollte auch vom Benutzer validiert werden. Art und Umfang der Validierung hangen von der Komplexitat der Software ab. Die Entwicklung und Validierung sollten nach einem dokumentierten Verfahren durchgefuhrt werden. - Bereits in einem Labor befindliche Computersysteme konnen nachtraglich validiert werden. Die Validierung kann bei problemlos arbeitenden Systemen aus einer Systembeschreibung und einer gut dokumentierten Bestandsaufnahme von bisher durchgefuhrten Wartungs- und Reparaturarbeiten, Kalibrierungen und Leistungsuberpriifungen bestehen. - Fur neue und existierende Systeme sollte ein Plan entwickelt werden, rnit dem nachgewiesen werden kann, daR das System wie beabsichtigt arbeiten wird. Der Plan sol1 vorbeugende Wartungsmahahmen, tagliche Systemeignungstests und/oder die Analyse von Qulitatskontrollproben sowie in grol3eren Abstanden durchzufuhrende vollstandige Leistungsuberprufungen beinhalten. - Nach einer Anderung an einem validierten System, z. B. nach einer Software- oder Hardwareaufrustung, sollten die korrekten Funktionen des Systems uberpruft werden. Die Durchfuhrung der Uberprufung sollte moglichst rnit gut definierten Testdateien automatisch erfolgen, um Eingabefehler des Bedienungspersonals auszuschlieBen und um eine bessere Konsistenz rnit fruheren Tests sicherzustellen. Validierungsergebnisse sollten entweder elektronisch oder auf Papier dokumentiert und archiviert werden. In beiden Fallen sollte die Datenintegritat und Ruckfuhrbarkeit auf Rohdaten sichergestellt sein. Falls die Daten elektronisch archiviert werden, wird empfohlen, Geratebetriebsparameter und Gerateseriennummern sowie Datum und Uhrzeit zusammen mit den Rohdaten abzuspeichern. -
6.6
Validierung von chemometrischen Methoden am Beispiel multivariater Datenanalyse in der Nah-Infrarot Spektroskopie
Michel Ulmschneidec E Hqjfmann - La Roche AG, Basel
6.6.1 Einleitung Multivariate Methoden in der Chemie stellen einen wichtigen Bereich der Chemometrie dar. Mit Chemometrie beschaftigt man sich intensiv seit Anfang der siebziger Jahre. Sie umfasst die Gesamtheit aller mathematischen, statistischen und weiteren formellen Verfahren, um analytische Methoden zu optimieren oder Daten zu interpretieren. Bei bestimmten Analysenverfahren werden Informationsmengen erzeugt, die nur rechnergestutzt erfassbar sind. Diese Rohdaten sind meist nur Messwerte in elektronischer Form und bilden nicht das eigentliche Resultat der Untersuchung. Urn aus diesen Daten Schlussfolgerungen ziehen zu konnen, muss ein entsprechendes Werkzeug die Information extrahieren. Ganz gezielt werden dabei mathematische Verfahren - sogenannte multivariate Methoden - verwendet, die mehrere analytische Kenngrossen untersuchen und bewerten. Das folgende Beispiel behandelt die Nah-Infrarot Spektroskopie (NIR). Mit NIR konnen Identitatsprufungen durchgefiihrt, physikalische Eigenschaften zugeordnet oder Qualitatsmerkmale beurteilt werden. Die Verhaltnisse zwischen den mittels NIR messbaren, analytischen Kenngrossen bilden dabei den Ansatzpunkt. Eine Zuordnung in Abhangigkeit von bekannten und unbekannten Kenngrossen wird durch die multivariate Datenanalyse moglich.
6.6.2 Allgemeines zur multivariaten Datenanalyse Aus einem Probensatz ermittelt man ausgewahlte Eigenschaften, die mit etablierten analytischen Verfahren gemessen werden. Bei einem multivariaten Verfahren wird bei der Datenanalyse noch zusatzlich der Einfluss aller bekannten oder versteckten Eigenschaften und deren potentiellen Interaktionen untereinander berucksichtigt. Bei einem multivariaten Verfahren sind drei Schritte zu betrachten: 1. Definition und Erkennung der untersuchten und somit bekannten Eigenschaften, 2. Erstellen von Messreihen, 3. Durchfuhrung der Datenanalyse, mit dem Ziel, eine adlquate ,,Kalibrierung" zu erstellen. Dies entspricht einem ,,Adernen" des analytischen Systems beziiglich Zusammen-
6.6 kilidierung von chemometrischen Methnden
303
hangen und Ausmassen der untersuchten Eigenschaften und die Ruckfuhrung auf einen definierten Standard. Ziel sol1 es sein, - Untergruppen im Probensatz zu identifizieren, die mit einer bestimmten Eigenschaft, z. B. Identitat der Probe, verbunden sind. - Unterschiede zwischen Gruppen zu erkennen und mathematisch formal zu belegen. - Ein Merkmal, wie z. B. den Gehalt, zu quantifizieren. Multivariate Analysenmethoden konnen somit in zwei grosse Gruppen eingeteilt werden: 1. Qualitative Datenuntersuchungen wie Klassifizierungen und Identitatsprufungen. Sie beruhen auf der Suche nach Hauptmerkmalen in einer gegebenen Datenmenge. 2. Quantitative Datenuntersuchungen. Sie basieren auf der Kenntniss der Hauptmerkmale in der urspriinglichen Datenmenge und deren Abhangigkeit zu den untersuchten Grossen. Mit diesen Kalibrationen konnen direkte oder indirekte Grossen bestimmt werden. Clusteranalyse, Hauptkomponentenanalyse (principal component analysis, PCA), multivariate Kalibrierung (principal component regression, PCR, partial least squares, PLS) sind ubliche Werkzeuge der multivariaten Datenanalysen. Fur eine detaillierte Ausfuhrung sei an dieser Stelle auf die Literatur verwiesen. Die folgenden Grundprinzipien sind fur einen praxisgerechten Einsatz der multivariaten Datenanalyse bei der NIR empfehlenswert. Datensatze bilden die Grundlage samtlicher multivariater Methoden. Ein Datensatz wird in zwei zueinander vergleichbare Unter-Datensatze geteilt. Beide Satze sollten, von der Datenmenge her, im Verhaltniss 2 zu 1 oder 3 zu 1 stehen. Die vermuteten oder bekannten Merkmale mussen unbedingt in beiden Datensatzen gleich verteilt sein. Mit dem grosseren Datensatz wird zuerst die multivariate Kalibration erstellt. Man spricht daher von einem Kalibrations- oder Lernsatz genannt. Mit dem kleineren Datensatz, dem Validierungsoder Testsarz, wird das multivariate Modell uberpruft. Interessanterweise bilden viele in Computer-Programme angebotene Rechenverfahren fur multivariate Datenanalyse automatisch aus dem Kalibrationssatz Untergruppen. Wahrend des iterativen Prozesses der Datenanalyse werden letztere fur die Uberprufung der nach und nach entstehenden Kalibrationen eingesetzt, bis ein Optimum erreicht wird. Auch wenn dabei von Validierung die Rede ist, sind diese Testschritte zu eng mit der eigentlichen Kalibrierung verbunden. Aus unserer Sicht kann nur durch einen zusatzlichen, vom Modellieren unabhangigen Test, die Gute der Kalibrierung massgebend beurteilt werden. Aus dem Kalibrationssatz wird zuerst das multivariate Modell mit geeigneten Kalibrationen gerechnet. Zum Beispiel wird mittels PCA aufgrund von Spektren bekannter Proben ein Modell zur Identitatsprufung erstellt. Mittels PLS wird eine physikalische Grosse, zum Beispiel der Wassergehalt, anhand der gegebenen Spektren der Proben mit bekanntem Wert zugeordnet und ein quantitatives Modell erstellt. Die Cute des multivariaten Modells wird nun rnit dem Validierungssatz beurteilt. Mit diesem Satz wird eine Vorhersage der zu beurteilenden Eigenschaften durchgefuhrt. Das Ergebniss der Vorhersage (predicted value) wird rnit dem erwarteten Wert (laboratory value) fur samtliche Daten im Validierungssatz verglichen. Eine Ubereinstimmung der Ergebnisse mil den erwarteten Werten schlieBt ein erfolgreiches Modellieren ab. Deshalb ist es sehr
304
6 k h n i k e n iind Gebiete
wichtig, dass der Validationssatz die bei der Kalibration abgedeckten Eigenschaften auch enthalt. Die Validierung stellt einen von der Kalibrierung oder Modellierung unabhangigen Schritt dar. Sie gewiihrt einen Einblick in die Zuverhssigkeit, Wiederholbarkeit, Linearitat, Nachweisgrenze und Bestimmungsgrenze des Modells beim Einsatz zur Vorhersage an unbekannten Datensatzen. Hierbei ist eine Varianz der nicht untersuchten Eigenschaften im Sinne der Robustheit zu berucksichtigen, die gegebenenfalls das Modell storen konnten. Wichtig fur die Methode ist auch, dass die Probenzusammensetzung konstant ist und dass zum Beispiel vor allfalligen Anderungen der Hilfstoffqualitlt die Methode neu evaluiert wird.
6.6.3 Praktisches Beispiel aus der Nah-Infrarot Spektroskopie NIR kann fur qualitative und quantitative Fragestellungen eingesetzt werden. Es ist eine schnelle und zerstorungsfreie Spektroskopie. Dank der Lichtleiter-Technologie kann das Licht ohne grossen Aufwand an die Probe herangefuhrt werden. Diese Spektroskopie kann sowohl im Labor, als auch in der Produktion oder im Lager eingesetzt werden. In der Abteilung fur die Qualitatskontrolle von pharmazeutischen Praparaten der Firma F. Hoffmann - La Roche AG in Basel, wurde eine NIR-Anwendung fur die direkte und zerstorungsfreie Wasserbestimmung in ROCEPHIN-Substanz und -Ampullenflaschen entwickelt. Die Ampullenflaschen werden mit Dosierungen von 0,25, 0,5, 1 und 2 g produziert. Diese NIR-Anwendung ersetzt seit mehreren Jahren erfolgreich die fruher durchgefuhrten Karl Fischer Titrationen. In weniger als einer Minute wird das Wasser direkt durch den Boden der ungeoffneten Ampullenflasche mittels diffuser Reflektion des NIR-Lichtes am Pulver bestimmt. Es werden dabei keine Chemikalien oder Losungsmittel verwendet. 6.6.3.1 Grundlagen Der NIR-Bereich (4000 cm-' bis 10'000 cm-I, 1000 nm bis 2500 nm) deckt die Ober- und Kombinationsschwingungen der Infrarot-Grundschwingungen ab. NIR-Banden sind breiter und diffuser als charakteristische IR-Banden. Ihre Intensitat ist auch 10 bis zu 100 ma1 schwacher. Was vorerst als Nachteil bei der NIR-Spektroskopie erscheint wird zum Vorteil bei der Probenvorbereitung, da sie praktisch entfallt. Es ist im Gegensatz zur IR-Spektroskopie keine Verdunnung der Proben erforderlich. Das Probenvolumen kann durchaus dem Original-Behaltnis entsprechen. Da NIR-Licht leicht durch weisses Glas dringen kann, konnen Ampullenflaschen direkt gemessen werden, ohne dass sie geoffnet werden mussen. Unterschiedliche Bodendicken spielen keine Rolle. NIR-Spektren enthalten sowohl chemische als auch physikalische Informationen. Eine einfache und direkte Interpretation der Spektren ist nicht vorstellbar. Die Selektivitiit der NIR-Analytik beruht Lunachst auf der Qualitat der Spektren aber auch auf der Cute der Kalibrierungen. Multivariate Methoden wie PCA oder PLS sind in der Lage, die komplexen und verzweigten Eigenschaften der Proben, die im NIR-Spektrum versteckt sind, zu interpretieren. Von Interesse ist hier die Eigenschaft der multivariaten Datenanalyse, bekannte oder vermutete Grossen bestimmen zu konnen.
6.6 Validierung von chernornetrischen Methoden
305
Die genaue Kenntnis weiterer Grossen wie Glasqualitat, Bodendicke usw. ist nicht von Grund auf erforderlich, solange diese in jeder Probe mit den normalen, zu erwartenden Unterschieden vorhanden sind. Der Einfluss dieser Grossen auf das Model1 ist im Vergleich zum Rauschen verschwindend klein.
6.6.3.2 Methode Von ROCEPHIN-Ampullenflaschen wurden 126 NIR-Spektren aufgenommen und gespeichert. Die ROCEPHIN-Ampullenflaschen wurden so aussortiert oder gegebenenfalls vorbereitet, dass sie den erlaubten Spezifikationen im Wassergehalt entsprechen. Fur die vollstandige Kalibrierung wurden auch Proben mit Werten unter und uber den fur die Produkte geltenden Spezifikationen vorbereitet, z. B. durch Anfeuchten bzw. Nachtrocken. Diese Proben wurden anschlierjend in einen Kalibrierungs- und einen Validierungssatz unterteilt (siehe Tab. 6-22 und 6-23). Folgende Spektrometer und Programme wurden eingesetzt:
Tab. 6-22 KalibrierungssatzROCEPHIN.
Verteilung der ROCEPHIN-Prohen im Kalibrierungssatz Vials, Hersteller A Vials, Hersteller B Bulk, Verfahren I ( I ) Bulk, Verfahren 2 ( I ) Bulk, Verfahren 3 ( I )
8
Total
8
8
8
6
16
22
22
8
46
6
6
6
6
0
0
40
24
80
2g
Total
( I ) abgefiillt auf ca. I g
Tab. 6-23 Validierungssatz ROCEPHIN.
Verteilung der ROCEPHIN-Proben im Validierungssatz 025 g
Vials, Hersteller A Vials, Hersteller B Bulk, Verfahren 1 ( I ) Bulk, Verfahren 2 ( 1 )
0,s g
6
4
4
Bulk, Verfahren 3 ( I )
Total ( I ) ahgefiillt auf ca. 1 g
Ig
20
6 4
2
2
2
4 4
4
32
2
34
4
4
46
306 -
-
6 Techniken und Gehiete
Spektrometer: NIRSystems ,,Model 5000" mit ,,Rapid content sampler". Messbereich: von 1100 nm bis 2500 nm, 3.5 absorbance units. Datenaufnahme und -verarbeitung: Near Infrared Spectral Analysis Software (NSAS), Program for identification qualification and quantification (IQ2).
6.6.3.3 Kalibrierung und Validierung Die Kalibrierung basiert auf 80 verschiedene Proben - wobei die Anzahl Muster auf der analytischen Erfahrung basiert, -die jeweils 3 ma1 aufgenommen wurden, bevor der Wassergehalt mittels Karl Fischer Titration (KF) bestimmt wurde. Bei Bulk-Ware wurde jeweds 1 g ROCEPHIN-Wirkstoff in eine 15 ml Ampullenflasche umgefullt, damit ergibt sich ein reprlsentativer Wert der Ware in den ublichen abgefiillten ROCEPHIN-Ampullenflaschen. Fur jede Messung mussen die Flaschen jeweils iiber dem NIR-Lichtleiter mittels einer Irisblende zentriert werden. Das diffus reflektierte Licht wird von sechs Bleisulfid Detektoren abgefangen. Nach der NIR-Messung wurde der Wassergehalt mittels KF bestimmt. Die Wasserwerte (in % Wasser) sind um den spezifizierten Bereich von 8,0 bis 10,O 5% normalverteilt (Spanne: 5,34 % bis 12,77 %, Mittelwert 9,OO %, Standardabweichung 0,81 %).
Im Datensatz werden die Wasserwerte den entsprechenden Spektren zugeordnet. Es ist dann moglich, ein multivariates Modell zu rechnen. Die PLS-Prozedur sucht nach denjenigen Komponenten, die den Original-Spektrendatensatz am besten beschreiben und gleichzeitig die jetzt bekannten Wasserdaten voraussagt. Das Programm bildet bei entsprechender Vorwahl automatisch aus dem Kalibrationssatz Untergruppen, die wahrend des iterativen Prozesses der PLS-Rechnung fur die Uberpriifung der Cute des Modells herangezogen werden. Das fertige Modell besteht aus 6 Komponenten (Korrelationskoeffizient R = 0,994, Standard Error of Calibration SEC = 0,090). Der Validierungssatz besteht aus 46 Proben die ebenfalls dreimal gemessen wurden. Mit der oben beschriebenen PLS-Kalibration wurde aus den NIR-Spektren der Wassergehalt bestimmt. Die gerechneten Wasserwerte wurden dann mit den KF-Wasserwerten verglichen. Mit Hilfe des bei F. Hoffmann - La Roche eingesetzten Vergleichsprogramms (alternative analytische Methoden) wurde bewiesen, dass keine signifikanten Unterschiede zwischen den gerechneten und den experimentellen Wasserwerten zu finden sind. Die Linearitat und die Wiederholbarkeit der NIR-Methode sind dabei uberpruft worden. Die Validierung ist somit erfolgreich abgeschlossen.
6.6.4 Fazit Fur die schnelle Bestimmung des Wassers in ROCEPHTN-Substanz und ROCEPHTNAinpullenflaschen wurde eine zerstorungsfreie NIR-Methode entwickelt und validiert, die heute erfolgreich im taglichen Labor-Betrieb die Karl Fischer Titration ersetzt. Anhand dieses Beispiels wird die Eigenschaft der multivariaten Datenanalyse, bekannte oder vermutete Grossen bestimmen zu konnen, demonstriert. Sie erspart dem Analytiker eine aufwendigere Vollanalyse der Proben. Man geht jedoch davon aus, dass samtliche Parameter
6.6 Vulidierung von chemometrischen Methoden
307
oder Grossen in jeder Probe in gleicher Weise zu finden sind. Gerade bei der NIR-Spektroskopie helfen multivariate Methoden die komplexen und verzweigten Eigenschaften von Proben zu modellieren. Hier liefert der unabhangige Validierungsschritt - sofort nach der rnultivariaten Kalibrierung - eine Aussage uber die Zuverlassigkeit, Wiederholbarkeit und Linearitat der NIR-Methode. Da diese Methode spezifisch fur eine Bestimmung innerhalb klar limitierter Grenzen ist spielen die Parameter, die bei einer klassischen Validierung einer Analysenmethode zu berucksichtigen sind, weniger eine Rolle. Insbesondere die Nachweisgrenze (LOD) und die Quantifizierungsgrenze (LOQ) brauchen bei dieser Methode nicht berucksichtigt zu werden. Die Linearitlt spielt eine untergeordnete Rolle, da auffallige Abweichungen durch das Modell abgefangen werden. Wiederholbarkeit und Reproduzierbarkeit spielen im Verhaltnis zu KF-Titration eine wesentlich untergeordnete Rolle. Bei der KF-Titration ist bekannt, dass verschiedene Laboranten bei gleicher Prazision zu teilweise leicht unterschiedlichen Ergebnissen gelangen. Prasizion und Richtigkeit der NIR-Methode liegen gemass unserer langjahrigen Erfahrung uber derjenigen der KF-Titration. Einzig die Robustheit spielt eine Rolle. Diese wird abgedeckt, indem das Modell im Falle von Anderungen am Glas oder an den Hilfstoffen neu verifiziert wird. Variationen der Glasbodendicke sind bereits bei der Erstellung des Modelles in dieses eingeflossen. Die Validierung von chemometrischen Methoden ist ausserordentlich wichtig, wie an diesem Beispiel der NIR-Spektroskopie gezeigt wurde. Sie ist zudem im Verhaltnis zu anderen Validierungen mit weniger Aufwand zu erreichen.
308
6 Techniken Lind Gebiete
6.7
Basisvalidierung - primary validation in der Normung von Analysenverfahren
Gunter Pupke, Hessisches Lundesamt f u r Umweltschutz, Wiesbaden
6.7.1 Einleitung Der Gehalt eines Stoffes in einer Umgebungsmatrix (z. B. Wasser) wird immer indirekt bestimmt, d. h. unter Zuhilfenahme einer oder mehrerer physikalischen Mefigrorjen, welche in einem mathematischen Zusammenhang mit der Konzentration des gesuchten Stoffes stehen. Da im Prinzip jede physikalische Messung der Heisenberg'schen Unscharferelation unterliegt, mufi jedes Analysenergebnis mehr oder weniger ,,unbestimmt", d. h. fehlerbehaftet, sein. Selbst das exakteste analytische Arbeiten fuhrt deshalb immer statt zu einem Ergebniswert (z. B. a mg/l) zu einem Ergebnisband (z. B. a k b mg/l). Durch geeignetes Arbeiten und geeignete Mafinahmen innerhalb der analytischen Qualitatssicherung (AQS) kann der Analysenfehler und damit das Ergebnisband schmal gehalten werden. Fur die Praxis im Umweltschutz stellen sich dabei z. B. die Fragen: -
Wie breit ist jeweils das Ergebnisband? Wie verwende ich Ergebnisbander im umweltrechtlichen Vollzug?
Unter Basisvalidierung versteht man im Zusammenhang mit der Ermittlung der Leistungsfahigkeit und Grenzen eines beschriebenen Verfahrens (z. B. einer Norm) u. a. die Feststellung der Mefiunsicherheit. Synonyme fur diesen Begriff sind Merjwertunsicherheit und Mefiergebnisunscharfe. Der folgende Text sol1 in Kurzfassung wichtige Bestandteile aber auch Probleme der Basisvalidierung von Normen auflisten. Zum Verstandnis dieses Kapitels werden Grundkenntnisse in der analytischen Qualitatskontrolle (AQK') vorausgesetzt. Hierzu werden z. B. die Literaturstellen [331 und [74 bis 821 empfohlen. Die Basisvalidierung reiht sich ein in die sog. Validierungshierarchie, die in der ENV 13530 1751 beschrieben ist. Anhang A.3 zeigt als Destillat aus dieser ENV, welche Arten von Validierungen im Zusammenhang mit der Entwicklung und Anwendung von Analysennormen existieren.
Fruge: Was ist ,,M&uzsicherheit (Mejwertunsicherheit, Me~erg"hnisurzscha~e) :I "
Kurzantwort: Abschatzung, wie grofi der analytische Fehler - trotz exakter Einhaltung der Norm - maximal sein konnte.
Fruge: Wus ist dus Ziel hei der Beschaifrigung mit der ,,Mejunsicherheit" .? Kurzantwort: Angabe einer quantitativen Grorje zur Fehlerabschatzung.
6.7 Brisi.svulidierun~- primary validation
-
in der Normung von Analysenverjiuhren
309
Fruge: Wie ist der Weg? Kurzantwort: Festlegung von Konventionsverfahren zur Fehlerabschatzung. Das bedeutet, es wird operationell festgelegt, auf welche Weise der Fehler abgeschatzt werden kann. Alternative Wege sind dabei ausgeschlossen. Fruge: Wie wird die Fehleruhschatzung vorgenomrnen: Allgemein setzt sich der Analysenfehler (= Ungenauigkeit) aus einer systernatischen Komponente (= Unrichtigkeit) und einer zufulligen Komponente (= Unprazision) zusammen: Ungenauigkeit (UG)= Unrichtigkeit ( U R )+ Unprazision ( U P ) Genauer:
VB(UG) = U R + VB(U P )
bzw.
Genauigkeit = Richtigkeit
AuBerdem:
U R = (WFR - 100) %
(1)
(21
+ Prazision
(3 (4)
Es bedeuten: V B Vertrauensbereich WFR Wiederfindungsrate Zumindest in der Wasseranalytik werden diese Zusammenhange zwischenzeitlich international akzeptiert [75I. Die Unrichtigkeit eines Ergebnisses kann man nur in Ausnahmefallen ermitteln. In der Praxis sind allenfalls mehr oder weniger geeignete Schatzungen moglich. Aus diesem Grunde werden fur die Analytik im gesetzlich geregelten Umweltbereich (insbesondere in der Wasser- und Abfallwirtschaft) sog. Konventionsverfahren eingesetzt. Dies sind standardisierte Verfahren (Normen, Richtlinien, Merkblatter), deren exakte Anwendung zum konventionell richtigen Ergebnis fiihren soll. Ein konventionell richtiges Ergebnis sollte keinen systematischen sondern nur einen zufalligen Fehler haben. Nach dieser Betrachtungsweise beschrankt sich die Bestimmung des Analysenfehlers auf die Berechnung bzw. Schatzung der (Un-)Prazision eines Ergebnisses und es gilt folgende allgemeine Formel: Ungenauigkeit
5
Unprazision (UP):
V.t VB(UP)= -(%)
fi
S . t
bzw.
77
Es bedeuten: VB(U P ) Vertrauensbereich des zufalligen Fehlers V Variationskoeffizient (in %) S Standardabweichung (in Konzentrationseinheiten) N Anzahl an Meljwerten (dimensionslos) t Studentfaktor (95 %,f: N - 1; dimensionslos)
3 10
6 Techniken urid Grhirtr
Die Fehlerabschatzung bei normierten Verfahren geschieht somit uber die Auswahl der geeignetsten Unpriizision, von der folgende 3 Typen existieren: -
-
-
Verfahrensunpriizision ( yx0, V,,,): Streuung der Kalibrierpunkte um die Regressionslinie Wiederholunpriizision, Wiederholbarkeit: Streuung des Mittelwertes von im gleichen Labor durchgefuhrten Messungen. Folgende Varianten werden unterschieden: a) within-batch: innerhalb einer Serie (s,(wb), Vx(wb)) b) between-batch: uber mehrere Serien verteilt (s,(bb), Vx(bb)) Vergleichsunprazision, Reproduzierbarkeit (sR, V,): Streuung des Mittelwertes von in verschiedenen Labors durchgefuhrten Messungen.
Die Erwartung ist folgende Abstufung:
V," < Vx(wb) < V,(bb) < VR Hierbei bedeuten: vxo Verfahrensstandardabweichung, -variationskoeftizient s,(wb), V,(wb) Wiederholstandardabweichung, -variationskoeffizient in der Serie s,(bb), V,(bb) Wiederholstandardabweichung, -variationskoeffizient zwischen den Serien SR. VR Vergleichsstandardabweichung,-variationskoeffizient SXO'
6.7.2 MeBunsicherheit in der Normung DIN, CEN und ISO-Normen dokumentieren bisher hierzu nur Ergebnisse aus Ringversuchen. In CEN- und ISO-Normen werden die Ringversuche nach I S 0 5725 [81] durchgefuhrt. Redaktionelle Fundstellen fur die Ringversuchsdaten sind die Normabschnitte ,,Angabe der Ergebnisse", ,,PrZzision und Genauigkeit", ,,Verfahrenskenngrofien" oder die AnhZnge der Normen. In DIN-Normen wird neuerdings im Abschnitt ,,Angabe des Ergebnisses der Begriff ,,MeRergebnisunscharfe" verwendet. Dieser Begriff ist leider nicht eindeutig! Gemeint sind z. B. einerseits externe QK-Daten, das ist der Vergleichsvariationskoeffizient VR fur geeignete Konzentrationsbereiche des Ringversuches (nach DIN 38402-A4 1,42 [82]), aber auch andererseits interne QK-Daten wie Wiederholvariationskoeffizient(z. B.: V,(bb) aus Range-Kontrollkarten). Zu den Basis-Verfahrenskenngroflen aus Ringversuchen nach I S 0 5725 [811 und DIN 38402-A42 [82]sowie Regeln und ,,Faustregeln" fur DIN-Ringversuche nach DIN 38402A4 I , 42 siehe die Anhange A. 1 und A.2. Zur Abhandlung der Meflergebnisunschkfe schreibt der DIN-NAW AA I3 ein Papier ,,Basisvalidierung genormter Verfahren zur Wasser-, Abwasser- und Schlammuntersuchung" vor, welches von den fachlich zustandigen DIN-Arbeitskreisen die Dokumentation folgender verfahrensspezifischer Angaben abfordert : "
6.7 Busisvalidierung - primary validation - in der Norrnung vnn Analysenverjuhren
311
Interne AQS-Ergebnisse (Efahrungen des Arbeitskreises): - Parameter (Stoffe), Matrices, Arbeitsbereiche - Nachweis-/Erfassungs-Bestimmungsgrenze (DIN 32645) wahrend des Validierungsringversuches ermittelt - Storungen, positivehegative bias - Art, Standards, Kalibrierfunktion, Prazision (s,, Vx0) - Probenvor- und -aufbereitung - Richtigkeit (Wiederfindungsrate von Standards, Schwankung der Wiederfindungsrate) - Selektivitat, Spezifitat Externe AQS-Ergebnisse (der Ringversuchsteilnehmer):
- Mit Ringversuchen Verfahrenskenndaten zur Kontrolle von Richtigkeit (Wiederfindungs-
rate), Prazision (V,, V,, VI) und Robustheit (dieser Begriff wird nicht exakt definiert) - Weitere Kenndaten aus Ringversuch.
Bei Beachtung dieser Validierungsvorschrift konnen die DIN-Verfahren der Gruppe 38402 ff. kunftig als basisvalidiert betrachtet werden. Dies bedeutet nach der CENASO-,,Philosophie" [75],daB der Anwender sofort mit der Secondary Validation starten kann (siehe Anhang A.3).
6.7.3 Modelle zur Abschatzung von MeBunsicherheiten 6.7.3.1 Unprazisionsangaben aus laborinternen Messungen Die mittlere MeBunsicherheit des matrixfreien Analyten uber den gesamten Arbeitsbereich kann man bestimmen, indem man in Gleichung ( 5 ) fur V den Verfahrensvariationskoeffizienten V,, und fur N die Anzahl Kalibrierstandards ( 5 bis 10) einsetzt. Setzt man in Gleichung ( 5 )fur V den Wiederholvariationskoeffizienten V,(wb) und fur N die Anzahl an Parallelbestimmungen (mindestens 4!) ein, so ergibt sich die laborindividuelle MeBunsicherheit in einer Probe. Die laborindividuelle MeBunsicherheit von Proben in Abhangigkeit vom MeBzeitraum bei einer Kontrollperiode von mindestens 30Tagen kann man berechnen, wenn in Gleichung ( 5 )fur V der Wiederholvariationskoeffizient V,(bb) aus einer geeigneten Kontrollkarte und fur N die Anzahl der MeRpunkte in der Kontrollkarte (mindestens 30) eingesetzt werden.
6.1.3.2 Unprazisionsangaben aus Ringversuchsergebnissen Betrachtet man die Unrichtigkeit eines MeBergebnisses (UR),so gilt die allgemeine Formel: UR = (WFR - 100) %.
- Fur das einzelne Ringversuchs-Teilnehmerlaborgilt: UR, = (WFR, - 100) %, wobei WFR, die Wiederfindungsrate des Labormittelwertes ist.
-
Fur das gesamte Teilnehmerkollektiv sowie fur ein ,,durchschnittliches" Teilnehmerlabor gilt: UR,:= (WFR, - 100) Yr. wobei WFR, = Wiederfindungsrate des Gesamtmittelwertes ist.
Die U~iprij:i.~ioti eines MeBergebnisses ( U P ) ergibt sich
BUS
Gleichung (5):
V B ( U P ) =V , t l N ' ' 2 % . -
-
-
Um die Laborunprazision eines bestimmten Ringversuchs-Teilnehmerlabors UP, zu bestimmen, wird fur V der betreffende Laborvariationskoeffizient V ,eingesetzt. Die mittlere Wiederholunpriizision eines ,,durchschnittlichen" Teilnehmers UP, erhiilt man, indem fur V der Wiederholvariationskoeffizient V ,(im englischen: V,) eingesetzt wird. Die Vergleichsunprazison fur das gesamte Teilnehmerkollektiv UP, erhiilt man durch Ersetzen von V durch den Vergleichsvariationskoeft~zientV,.
Um die Urigrrzuiiigkeit eines MeBergebnisses (UG)bestimmen zu konnen. verwendet man die allgemeine Formel: VB(UG) = CJR + VB(UP). Die Ungenauigkeit eines bestimmten Ringversuchs-TeilnehmerlaborsUh, erhalt man, wenn man fur CJR die individuelle Laborunrichtigkeit UR, und fur VB(UP,) die individuelle Laborunprazision VB(U P,) einsetzt. Um die mittlere Ungenauigkeit eines ,,durchschnittlichen" Teilnehmerlabors UG, zu erhalten, wird fur U Rdie Gesamtunrichtigkeit UR, und fur VB(CJP)die mittlere Wiederholunprazision VB(UP,) eingesetzt. Die Ungenauigkeit fur das gesamte Teilnehmerkollektiv UG, bestimmt man durch Austausch von U Rdurch die Gesamtunrichtigkeit UR, und von VB(UP)durch die Vergleichsunpriizision VB(UP,,.
6.7.4
Probleme bei der Anwendung des DIN-Basisvalidierungspapieres
Soweit die (gute) Absicht (Abschnitt 6.7.2) und die Theorie (Abschnitt 6.7.3), aber wie gut funktioniert das vorgestellte Konzept'? Es zeigt sich, daR der Anwender oft so unsicher bzw. unerfahren ist, daB immer wieder die gleichen Fehler auftreten. Im nachsten Abschnitt sind einige typische Fehler beschrieben:
6.7.4. I
Praxisbeispiele zur Ableitung von Schltzwerten fur die MeRunsicherheit aus Priizionswerten
Die im Abschnitt 6.7.3 beschriebenen Definitionen eroffnen eine Fulle von Miiglichkeiten Abschatzung von MeBunsicherheiten, auch wenn einschrankend die Gleichung 5 zugrunde gelegt wird (der systematische Fehler wird in diesem Falle vernachlassigt! ). Nachstehend sind hierzu zwei Beispiele beschrieben. die das verdeutlichen konnen: Lur
6.7 Basi.rvalidierung - primary validation - in der Normung von Anulysenverfahren
3 13
Beispiel I : a) In einer Wasserprobe wurde in einer Einfachbestimmung ( N = 1) ein AOX-Wert von 200 pg/l gemessen. Aus einem geeigneten AOX-Ringversuch resultierte ein Vergleichsvariationskoeffizient VR von 12,5 %. Nach Einsetzen dieses VR-Wertes in Gleichung (5) errechnet sich ein Fehler von ca. 25 %: VR . t VB(UP) = -(%)
fi
%
12,5%.-
2
JI
25%
z
b) Lage kein entsprechender Ringversuchskennwert vor, hatte man z. B. die oben genannte Probe im Labor dreifach ( N = 3) analysieren konnen. Unter der Voraussetzung, daB der Mittelwert dieser Dreifachbestimmung ebenfalls 200 pg/l betragen wurde und der WiederholvariationskoeffizientVx(wb) 12,5 % betragt, errechnet sich nunmehr ein Fehler von ca. 31 %: VB(UP)
=
'x(wh)
-(%)
43 1 2 , 5 % , 2 Y 31%
'
fi
Y
J 3
c) Hatte der Analytiker schliefilich bei einer Doppelbestimmung ( N = 2) ebenfalls 200 pg/l als Ergebnis erhalten und hatte er fur Vx(bb) in Gleichung ( 5 ) den Wiederholvariationskoeffizienten (hier ebenfalls 12,5 %) aus einer AOX-Range-Kontrollkarte eingesetzt, errechnet er einen Fehler von ca. 18 %: VB(UP) =
'x(hh) ~
fi
.
(%)
Y
12,5%.-
2
Jz
Die entsprechenden Ergebnisbander Zu a) AOX = (200 k 50) pg/l oder: Zu b) AOX = (200 k 62) pg/l oder: Zu c) AOX = (200 k 36) pg/l oder:
Y
18%
in den obigen Beispielen sind demnach: 150 5 AOX I 250 pg/l (s. Ergebnisband 3 in Abb. 1) 138 5 AOX I 262 pg/l (s. Ergebnisband 1 in Abb. 1) 164 I AOX I 236 pg/l (s. Ergebnisband 2 in Abb. 1)
In dem genannten Beispiel sind noch weitere Varianten denkbar, z. B. Doppelbestimmung und Ruckgriff auf V, aus dem Ringversuch. Das Ergebnis ware in diesem Falle: AOX = (200 35) pg/L
*
Beispiel 2: Chlorid sol1 nach der DIN/EN/ISO 10304-2 (IC-Verfahren) bestimmt werden. Der Mefiwert betragt 15 mg/l. Gesucht ist VB(UP) als Malj fur die MeBunsicherheit. a) Es wird eine Einfachbestimmung durchgefiihrt, die Werte N und VR stammen aus einem Ringversuch: VR = 9,8 %, N = 61. Formel:
VR
t
VB(UP) = -
9,8.2,0(95%, f = 60)
fi=
Ergebnis: C1 = (15,O f 3,O) mg/l
Ji
Y
20%
3 14
h Evhnikeri und Gehiete
b) Es wird eine Dreifachbestimmung im Labor durchgefuhrt ( N = 3), der Wiederholvariationskoeffizient betrlgt Vx(wb) = 9,s %. Formel:
VB(UP) =
Vx(wh) ' ~
fi
t
-
9,s . 4,3(95%,f
Js
=
2)
= 24%
*
Ergebnis: CI = (15,O 3,6)mg/l
c) Eine Doppelbestimmung wird durchgefuhrt, deren Wiederholvariationskoeffzient aus einer Mittelwert-Kontrollkarte entnommen wird: VJbb) = 9,s %, N = 30 (30 Kontrollwerte in der Kontrollkarte). Formel:
VB(UP) =
Vx,,h) ~
fi
. t - 9,8 . 2 (95%, f = 29) -
Jz
= 14%
Ergehnis: C1 = ( 1 5,O f 2,l)mg/l
Wie ist sowas moglich? Dreimal das gleiche AOX- bzw. CI-Ergebnis (200pg/L bzw. 15 mg/l) und die gleiche Standardabweichung (Variationskoeffizienten V, Vx(bb) und Vx(wb)jeweils 12,5% bzw. 9,8 %) und doch drei sehr unterschiedliche Fehle; bzw. Ergebnisbander! Dazu ist folgendes zu sagen: Die AQS beschreibt im Gegensatz zu einer Fachnorm nicht per Konvention eine vorgegebene - und damit Alternativen ausschlieljende - Vorgehensweise sondern verschiedene Werkzeuge. Je nach Anwendungsfall konnen diese Werkzeuge geeignet sein oder Unsinn erzeugen. (Ungeeignete AQS kann, wenn sie z. B. einen zu kleinen Fehler vorgaukelt, schlimmer sein als gar keine!). Alles hangt von den Fahigkeiten und Erfahrungen des Laborpersonals ab. In dem Beispiel 1 scheidet die Variante a) (Ergebnisband 3 in Abb. 6-13)aus, da der analytische Grundsatz verletzt wurde ,,Mache niemals Einfachbestimmungen!" Die Variante b) (Ergebnisband 1 in Abb. 6-13) ist die sicherste Losung, denn je groljer der angegebene (das ist nicht notwendigerweise auch der richtige!) Fehler, um so groRer die Aussagesicherheit. Die Variante b) ist z. B. tragbar fur Grenzwertuberwachungen bei denen der Grenzwert oberhalb von 262 pg/l liegt. Die Variante c) (Ergebnisband 2 in Abb. 6-13)ist analytisch gesehen die ,,bequemste", denn sie greift auf immer vorhandene Daten zuruck ( AOX-Doppelbestimmungen werden durch die Norm DIN EN 1485, Range-Kontrollkarten vom LAWA-AQS-Merkblatt P-5 [4] vorgeschrieben). Allerdings muljte vor einer generellen Anwendurig der Variante c ) durch einen statistischen Vergleich (Varianzenhomogenitatstest) sichergestellt sein, dalj sich die Variationskoeffizienten VJwb) und Vx(bb) (s. 0.) nicht signifikant voneinander unterscheiden, und die Rangekontrollkarte iniiBte am Tage der besagten AOX-Analyse ,,in control" gewesen sein. Vergleichbares gilt fur Beispiel 2. Abbildung 6-I3 zeigt die Ergebnisbiinder und ihre Lage zu einern fiktiven AOX-Grenzwert von 200 pg/l. Hinzugefugt wurde ein Ergebnisband 4, welches den Fall symbolisiert, dalj der Grenzwert justitiabel (gerichtsverwertbar) iiberschritten wurde.
6.7 Basisvalidierung
-
AOX-MW
primary validation
-
in der Norrnung von Analysenvetfahren
3 I5
Grenzwert
255 - 310 pg/l
AOX-Konz.
200
150
250
pgi
-300
Abb. 6-13 Ergebnishander und Grenzwert: Ergebnisband I : Es ist nicht auszuschlieBen, dal3 Grenzwert iiberschritten is? Ergebnisband 2 bzw. 3: Grenzwert ist nicht iiberschritten Ergebnisband 4: Grenzwert ist mit Sicherheit uberschritten.
6.7.4.2 Praxisbeispiel zur Ableitung von Schatzwerten fur die Meaunsicherheit aus Nachweis-, Erfassungs- und Bestimmungsgrenzwerten nach DIN 32645 Das in Abschnitt 6.7.2 vorgestellte Basisvalidierungs-Papierdes DIN-NAW sieht als weitere Aufgabe vor, im Ringversuch von den Teilnehmern die Nachweis-, Erfassungs- und Bestimmungsgrenze nach DIN 32645 ermitteln zu lassen. Dabei wird von den Teilnehmern oft nicht beachtet, dalj diese DIN-Norm verlangt, dass Nachweis-, Erfassungs- und Bestimmungsgrenze innerhalb des betrachteten Arbeitsbereiches liegen sollen. Abbildung
I
'<....................................................................................... k4 60 Arbeitsbereich
20 \ r 2
200 1
..........................
>
Abb. 6-14 Zusammenhange zwischen Arbeitsbereich, Nachweis-, Erfassungs- und Bestimmungsgrenze.
3 16
6 Techniken und Gebiete
Tab. 6-24 Beispiele fur Nachweis-, Erfassungs- und Bestimmungsgrenze fur Kalium nach I S 0
49 1 1 - 1 (Diplomarbeit, HLfU, 1997).
Beispiel
Arbeitsbereich (Pg/l)
% (PgO
1
200-2000
2
XNG
XL<,
Xilo
15,s
62
124
170
I 00- 1000
3,6
14
28
40
3
SO- 500
2.7
I1
22
30
4
20- 200
5s
22
44
60
(P&/l)
(PdO
(Pg/l)
Nur das Beispiel 4 in Tab. 6-24 erfullt die Forderung der Norm, bei den ubrigen Beispielen liegen XNG,X,, und XBGdeutlich unterhalb der unteren Arbeitsbereichsgrenze. In diesen Fallen muR der Arbeitsbereich so variiert werden, daB er die Forderung der DIN-Norm erfullt.
6.7.4.3 Praxisbeispiel zur Ableitung von Schatzwerten fur die Mefiunsicherheit aus Prazisionswerten von Kontrollkarten Im Abschnitt 6.7.2 wird ausgefiihrt, daB neuere DIN-Normen als MeBgroBe fur die sogenannte ,,MeBergebnisunscharfe" u. a. Wiederholprazisionen vorschlagen (z. B. Wiederholvariationskoeffizienten aus Range-Kontrollkarten; moglich sind aber auch andere Kontrollkartentypen). Aber auch hierbei verstecken sich Fallstricke in der Anwendungspraxis. Zum einen werden entsprechende Prazisionswerte nicht wahrend der Basisvalidierung ermittelt, sondern in der Secondary Validation-Phase vorbereitet und in der Tertiary ValidationPhase gemessen (siehe hierzu Anhang A.3). Zum anderen werden in der Praxis Kontrollkarten oft als Qualitatspriifungs- und nicht als QualitatsregelungsmaBnahmen betrachtet. Dies fuhrt dann d a m , daB bei Aufierkontrollsituationen nicht rechtzeitig eingegriffen wird. Die Kontrollkarte dokumentiert in diesen Fallen dann lediglich die ,,analytische Misere", kann aber den ,,Schaden nicht mehr reparieren", wenn die betreffenden Analysenergebnisse schon beim Kunden gelandet sind. Ein reales Beispiel zeigt Abb. 6- 15. Am 23. Arbeitstag war das MeBsystem aufier Kontrolle und hatte am gleichen Tag optimiert werden miissen, bevor AOX-Proben gemessen wurden. (Ab dem 36. Arbeitstag ist das MeRsystem ganzlich ,,aBer Tritt geraten".) 6.7.4.4 SchluRbemerkungen Die Angaben in den Norrnen (DIN, EN, ISO) zur MeBunsicherheit sind bisher unvollkommen gewesen. Auch die Hinweise in den neuesten DIN-Normen zur Ermittlung der
6.7 Busisvalidierung - primary validation - in der Normung von Analysenverjuhren
3 17
0.40
.Eingriff erforderlich aber nicbt erfolgt!
[MI
7 0,30 --
.
= m 0,20
'' .. 8
r.. ! ! 1
--
' ,
:'
r;
7
::,,
;,
&;
8
.I
, (
h ' ii.
L
*
1
:
!!
8
., I
A ,,-
I .
"
=.: p 'i;. . .. ;.:
. I
,
9
=. ..-
..
8
I .
.
. * .' =.
,
.'I.
..
B :
. . . ; + ; : *
,
.
..
a m :,.: I
: :, I
:. i;
* ,
'cd'
,
,.
1
I
0,101:
~
: : : : : : : : ,: : : : : : : : : : : : : : : : : :
~
: : : : : : :
~
"
'
"
'
'
'
~
,,MeBergebnisunscharfe" sind widerspriichlich. Die nunmehr fur DIN-Normen geschaffene Handlungsanweisung fur die Ermittlung der MeBunsicherheit bei der Anwendung der Normen (,,Basisvalidierungspapier" des DIN) beinhaltet einen Mahahmenkatalog, welcher von dem zustandigen Arbeitskreis zu erfullen ist. Aber auch die Ergebnisse dieser Basisvalidierung sagen noch nichts abschliel3endes uber die Bewahrung des Verfahrens in der Praxis aus. Hierzu sind die Phasen der Secondary und Tertiary Validation zu durchlaufen. Erfahrungen zeigen, dafi UR, UP und UG aus internen AQK-Ergebnissen problemangepafiter als die externen AQK-Ergebnisse gestaltet werden konnen. Zwischen internen und externen AQK-Ergebnisssen mul3 allerdings ein adaquates Verhaltnis bestehen. Z. B. sind VR-Werte(externe AQK) MaBstabe fur interne Werte, wie V,(wb oder bb), und umgekehrt. Die Eigeninitiative bei der Ermittlung der Meljunsicherheit im laufenden Laborbetrieb ist unverzichtbar. Dazu gehoren die Schulung des Personals und Kenntnisse und Erfahmngen uber einschkgige AQS-Vorschriften (DIN-Strategiepapier, ENV 13530, LAWA-AQSMerkblatter usw. [75, 76, 771). Durch das QS-System nach I S 0 170251 ist festzulegen, welche internen AQK-MaBnahmen fur jedes Verfahren am effzientesten hinsichtlich Abschatzung der Meljunsicherheit sind. Der richtige Umgang mit der DIN I S 0 8466 [80] und DIN 32645 [79] ist ebenso zu erlernen wie eine geeignete Kontrollkartenpraxis (siehe ENV 13530 [75]).
3 18
6 Techniken und Gebiete
6.7.4.5 Anhang und Erlauterungen
A.l Basis-Verfahrenskenngrofien aus Ringversuchen nach I S 0 5725 und DIN 38402-A42: Anzahl teilnehmende Labors Anzahl ausreiflerfreier Einzelwerte - prozentualer Anteil an AusreiBern konventionell richtiger Wert (optional) - Gesamtmittelwert - Wiederfindungsrate (optional) ( WFR) Vergleichsstandardabweichung(sR) und -koeffizient ( VR) - Wiederholstandardabweichung (sl bzw. sr) und -koeffzient (V, bzw. V,). -
A.2 Regeln und ,,Faustregeln" fur DIN-Ringversuche nach DIN 38402-A41,42: Mindestteilnehmerzahl: L 2 8
-
-
Mindestanzahl Einzelwerte: K . L 2 24 Hochstanteil an AusreilJern: NAP 5 25 % Anzahl Niveaus pro Arbeitsbereich: M = 3 Anzahl Bestimmungen pro Niveau: K = 4 Vergleichsvariationskoeffizient:VR 5 25 % Wiederholvariationskoeffizient: V, < VR 1/3 v,5 vR5 1/2 VI,
A.3 Validierungshierarchie = 3-Stufenmodell der AQS (nach ENV 13530) Primary volidation - Prifung der Leistungsfahigkeit des Verfohrens: Anwendungsbereich, Storungen Selektivitat, Spezifitiit, Sensitivitat Kalibrierfunktion mit abgeleiteten GroBen (sx0, R2) Wiederfindungsrate, Richtigkeit, Matrixeinflusse - Nachweisgrenze, Bestimmungsgrenze zeitl. Abhiingigkeit verschiederner Prazisionen: s,(wb), s,(bb), Trends interne Standardisierung Robustheit. -
Secondary validation - Priifung der Eignung des Verjiihrens ( f i r spez. Proben):
Einubphase mit Tests der Prazison (Kontrollproben, stat.Techniken, Varianzanalyse) und Richtigkeit - Vorbereitung auf Routine durch Qualitltsziele fur die Routine, Auswahl Kontrollkartensysteme, Auswahl der Kontrollproben. -
TertiaT validation - Prifung der Zuverlassigkeit des Verfahrens in der Routine: -
,,abgespeckte", bedarfsgerechte AQS (Okonomiegebot) Richtigkeitskontrolle mit Wiederfindungsraten-. MW-, BW-Kontrollkarten Priizisonskontrolle mit Range-, MW-Kontrollkarten, Wiederholbestimmungen, Standardaddition
6.7 Busi.walidierung - primary validation -
-
in der Normung von Anulysenverfuhren
3 19
Prinzipien der Kontrollkartenanwendung
- Genauigkeitskontrolle: UG = U R + U P - Zusiitzlich: Fehlersuche, spezielle Qualitatsziele angeben.
A.4 Welche Norm fur welche Verfahrenskenngronen? -
Kalibrierfunktion, -kenngroBen (sxo): Jetzt einheitlich nach I S 0 8466 [80]
- Nachweis-, Erfassungs-, Bestimmungsgrenze: Jetzt einheitlich nach DIN 32645 [79] -
Fehler, Fehlerberechnung: Literatur 1321, [75]
- Ringversuchsdurchfiihrung: DIN 38402-A41,42; IS0 5725 [81,82].
A S Definitionen, Berechnungsformeln fur Nachweis-, Erfassungs- und Bestimmungsgrenzen nach DIN 32645 Die Nachweisgrenze XNG
- ist eine Entscheidungsgrenze fur das Vorhandensein eines Stoffes in der Probe
ist derjenige Gehalt, der unter Verwendung der ermittelten Kalibrierfunktion dem kritischen Wert der MeBgroBe zuzuordnen ist (d. h. der Gehalt des Bestandteils in der Probe ist groBer als derjenige in der Leerprobe) - kann durch Schnellschatzung ermittelt werden - Berechnungsformel nach der Kalibriergeradenmethode: XNG = 4 . sxo - Berechnungsformel nach der Leerwertmethode: XNc = 3 . sL / h
-
Die Erfassungsgrenze X,,
X,, ist der kleinste Gehalt eines Analyten, bei dem mit festgelegter Wahrscheinlichkeit ein Nachweis moglich ist - liegt um die Breite des Prognoseintervalls der Kalibrierfunktion oberhalb der Nachweisgrenze - kann durch Schnellschatzung ermittelt werden - Berechnungsformel nach der Kalibriergeradenmethode: XNG= 8 . sxo - Berechnungsformel nach der Leerwertmethode: XNG= 6 . sL/ b - Die Erfassungsgrenze
Die Bestimmungsgrenze X,, -
~
~
ist der kleinste Gehalt eines Analyten, der noch bestimmt werden kann ist derjenige Gehalt, der unter Verwendung der ermittelten Kalibrierfunktion dem kritischen Wert der MeBgrolje zuzuordnen ist (d. h. der Gehalt des Bestandteils in der Probe ist gr6Ber als derjenige in der Leerprobe) kann durch Schnellschatzung ermittelt werden Berechnungsformel nach der Kalibriergeradenmethode: XNG= 1 1 . sXo Berechnungsformel nach der Leerwertmethode: XNc = 9 . sL / h
Es bedeuten: sxo
sL
b
Verfahrensstandardabweichung(aus Kalibrierfunktion) Wiederholstandardabweichung des Leerwertes Steigung der Kalibrierfunktion.
320
h 7i.chriikrri i t r i d Gc4iicJtcJ
6.8
Validierung in der pharmazeutischen Analytik
J m c h im Erme r; Aventis, Frankfurt
6.8.1 Einleitung Der Begriff ..Validierung" ist keine Erfindung der letzten Jahre. Er wird - naturlich in allgeineiner Form - als ..etwas in rechtsgultiger Form vollziehen" bereits in alten Lexika beschrieben [ 831. Im pharmazeutischen Bereich ist diese ,,Rechtsgultigkeit" auch heute wortlich zu nehmen. Allgemein kann Validierung als ,,dokumentierter Nachweis der Eignung fur eine bestimmte Aufgabenstellung" angesehen werden. Die folgende Diskussion erfolgt ausschliefllich fur Prufverfahren im Rahmen der pharmazeutischen Analytik. In der Literatur wie auch den Guidelines wird ,,Methode" oft synonym zu .,Verfahren" verwendet. Aus inhaltlichen Grunden ist es jedoch vorteilhaft, beide Begriffe zu trennen. ,.Methode" sollte als die eigentliche Bestimmung des Analyten (in mehr oder weniger vor- und autbereiteter Form) definiert wer-den,z. B. RP-Chromatographie, Titration usw. Demgegenuber umfaBt das analytische Verfahren alle Schritte einer Prufung von der Probenvorbereitung uber die Durchfuhrung bis zur Bewertung des Ergebnisses gegen festgelegte Grenzen. Teilweise wird auch von Validierung eines Analyseninstruments (HPLC, UV-Spektrometer) gesprochen. Hier sollte jedoch der Begriff ,,Qualifizierung" verwendet werden. Qualifizierte Gerate - z. B. nach den Herstellerspezifikationen - sind essentielle Voraussetzungen fur die Durchfiihrung einer Validierung. Das vorliegende Kapitel umfaRt eine zusammenfassende Darstellung von beherdlichen Empfehlungen (Guidelines, Leitlinien) zur analytischen Validierung, danach eine Diskussion der Validierungselemente, -anforderungen und hewertung. Im ersten Abschnitt wird zuniichst auf einige behordliche Empfehlungen und Guidelines eingegangen. Nach einer kurzen Beschreibung der Internationalen Harmonisierungskonferenz (International Conference on the Harmonization of Technical Requirements for the Registration of Pharmaceuticals for Human Use, ICH) erfolgt eine ausfuhrliche inhaltliche Wiedergabe der ICH-Guidelines. Im zweiten Abschnitt werden wichtige Schwerpunkte aus der Sicht des Autors diskutiert, insbesondere hinsichtlich der Bewertung von Ergebnissen und einer rationalen und effizienten Durchfuhrung der Validierung.
6.8.2
Regulatorische Anforderungen zur analytischen Validierung
Im folgenden werden Empfehlungen und Guidelines von Zulassungs- und Uberwachungsbehorden zusammengefaflt. Falls rniiglich, wird bei gleicher inhaltlicher Bedeutung die ICHTerminologie verwendet. Die Validierungselemente werden in Abschnitt 6.8.2.6 definiert.
6.8 Validierung in der phurmuzeurischen Analytik
32 1
6.8.2.1 Deutschland [84] Die ,,Erlauterungen des BGA zum Antrag auf Zulassung eines Arzneimittels" geben Hinweise fur den Antragsteller sowohl in formaler, d. h. das Ausfiillen der Formularbogen betreffend, als auch in inhaltlicher Hinsicht. Im Teil I1 (Phamazeutische Qualitat) wird z. B. beschrieben, welche Prtifverfahren einschlierjlich Spezifikationsgrenzen im Normalfall erwartet werden. Zur Erleichterung der Kommunikation mit der Zulassungsbehorde sind die einzelnen Erlauterungsabschnitte mit Randnumrnern (Rdn.) versehen. Fur die Gehaltsbestimmung wirksamer Bestandteile, die nicht in einer Pharmakopoe beschrieben sind, wird der Nachweis der Genauigkeit in Form von Prazision und Richtigkeit gefordert (Rdn. 443). Bei der Prazision unter Wiederholbedingungen sollen Standardabweichung (SD), Variationskoeffizient (VK, relative Standardabweichung) und Vertrauensbereich des Mittelwertes aus mindestens 6 Bestimmungen angegeben werden (Rdn. 444). Als Marj fur die Richtigkeit gilt die Differenz zwischen dem mit dem zu validierenden Prtifverfahren bestimmten Mittelwert und dem eines unabhangigen Verfahrens mit bekannter Genauigkeit, ggf. unter Einbeziehung statistischer Methoden (t- und F-Test) (Rdn. 445). Eine weitere Moglichkeit ist der Einsatz von Referenzsubstanzen (Rdn. 446). Bei Verwendung von Kalibriergeraden ist der Nachweis des linearen Bereiches des Meberfahrens zu fuhren (Rdn. 447). Zur Bestimmung von Verfahrenskenngrorjen wird auf DIN 38402 Teil5 verwiesen [78] (Rdn. 448). Bezuglich der Nebenprodukte werden fur qualitative bzw. quantitative Prufverfahren Nachweis- bzw. Bestimmungsgrenze (Rdn. 472, 473) gefordert. Als Moglichkeit zur Berechnung dieser Grenzen wird auf das Kalibrierkurvenverfahren verwiesen [52j. Zur quantitativen Nebenproduktbestimmung konnen ggf. auch Angaben zur Prazision und Richtigkeit erforderlich sein. Bei allen chromatographischen Methoden ist ein Selektivitatsnachweis erforderlich (Rdn. 474). Bei Fertigprodukten ist zum Nachweis der Richtigkeit die Bestimmung der Wiederfindungsrate angegeben (Rdn. 5 17), ansonsten gelten Rdn. 443-448. Sonstige Validierungsuntersuchungen oder solche fur kombinierte Prufverfahren werden in Abschnitt E.4 behandelt (Rdn. 532). Im Rahmen von Haltbarkeitsuntersuchungen wird zusatzlich auf die Spezifitat der Gehaltsbestimmung verwiesen (Rdn. 544). Dem Aufbau der ,,Erlauterungen ..." entsprechend, sind die Anforderungen an die Validierung jeweils in die entsprechenden Abschnitte des Zulassungsantrages eingearbeitet. Teilweise gibt es recht detaillierte Angaben zu Berechnungsmethoden der Validierungsparameter in Form von Literaturverweisen [52,78].
6.8.2.2 Europai sche Gemeinschaft [851 Untersuchungen zur Spezifitat, Prazision, Richtigkeit, Linearitat, Arbeitsbereich und Robustheit werden erwahnt. Die Guideline ist sehr allgemein gehalten. Die Auswahl sollte als Fall-zu-Fail Entscheidung vorgenommen werden, Einzelheiten zur Durchfuhrung wie Anzahl der Messungen, Bearbeiter u s ~ werden . nicht diskutiert. Der Anwendungsbereich umfarjt die folgenden Sektionen der chemischen, pharmazeutischen und biologischen
Zulassungsdokumentation: galenische Entwicklung ( 1 1-A), IPC wahrend der Herstellung ( I 1 -B), Kontrolle der Ausgangsstoffe ( I 1 -C), Qualitatskontrolle der Zwischenprodukte ( I I D) und Fertigprodukte (1 1 -E) sowie Stabilitat ( 1 1 -F). Revalidierung kann unter bestimmten Umstanden notwendig werden, wie L . B . Methodentransfer oder bei signifikanten Anderungen in Herstellung oder Zusammensetzung des Arzneimittels. Folgende Validierungselemente werden den Prufverfahren zugeordnet: -
Identitat: Spezifitat Nebenprodukte: Spezifitat, Nachweisgrenze, Bestimmungsgrenze Assay: Spezifitat, Wiederholbarkeit, Prazision, Vergleichbarkeit, Richtigkeit, Linearitst, Arbeitsbereich und Sensitivitat.
Es wird eine detaillierte Beschreibung der Untersuchungsbedingungen, -materialien. Berechnungsformeln usw. verlangt. 6.8.2.3 USA Es gibt zwei Guidelines der US-Zulassungsbehorde (Food and Drug Administration, FDA), wobei sich die eine primar an den Antragsteller einer Zulassung richtet [ 861, die andere an Inspektoren und Gutachter [77]. Wie der Titel der ersten Guideline ausdruckt, sol1 das Prufverfahren im Bedarfsfall in FDA-Laboratorien nachvollzogen werden konnen. Die Dokumentation verlangt demzufolge neben der detaillierten Beschreibung der Prufverfahren auch die Auflistung von Testproben und Referenzmaterialien. Zusatzlich zu den eigentlichen Validierungsdaten werden fur den Arzneistoff ein Synthese-Flowchart mit bekannten Nebenprodukten sowie Informationen zu polymorphen und isomeren Formen, fur Arzneimittel ein Degradationsschema verlangt. Es werden Validierungsdaten gefordert, die eine geeignete Richtigkeit, Prszision, Linearitiit von 80-1 20 %, Spezifitat und Bestimmungsgrenze fur Neben- und Degradationsprodukte belegen. Reprasentative Chromatogramme oder instrumentelle Aufzeichnungen sollten beigefugt werden. Fur das Arzneimittel sind zudem Wiederfindung, Abwesenheit von Placebointerferenzen (einschliefilich Zersetzungsprodukte) und Variabilitat bezuglich Zeit, Labor, Bearbeiter, Saule zu prufen. Die zweite Guideline [87] ist als Anleitung fur FDA-Gutachter gedacht, um die in der Zulassungsdokumentation enthaltenen Prufverfahren und deren Validierung beurteilen zu konnen. Als Anforderung an ein Prufverfahren wird formuliert, Ergebnisse zu liefern, die fur seine beabsichtigte Anwendung hinreichend zuverlassig, richtig und prlzise sind, und zwar uber seine gesamte ,,Lebenszeit" (Robustheit). Revalidierung wird als fortschreitende Validierung bei Verfahrensanderungen definiert. Zunachst werden die verschiedenen chromatographischen Techniken beschrieben, einschliefilich einiger ,,Schwachpunkte", z. B. bei Reversed-Phase der begrenzte Elutionsbereich, das Problem der Responsefaktoren bei UV-Detektion usw.
6.8 klidierung in der pharmazeutischen Analjtik
323
Die allgemeinen Anforderungen an die Validierungselemente decken sich rnit der ersten Guideline, es werden jedoch ausgewahlte kritische Aspekte mit speziellem Bezug zu RPchromatographischen Methoden rnit UV-Detektion diskutiert. So wird auf die Abhangigkeit von Nachweis- und Bestimmungsgrenze von Typ und aktuellem Zustand des Detektors hingewiesen und die Uberprufung der Bestimmungsgrenze im Systemeignungstest empfohlen. Bei der Bestimmung von Nebenprodukten als Flachenprozent ( 100 %-Methode) sollte der lineare Bereich von der Bestimmungsgrenze des Nebenproduktes bis 20 % uber der Arbeitskonzentration des Wirkstoffes sichergestellt sein. Der Korrelationskoeffizient r sollte normalerweise mindestens 0,999 betragen. Im Rahmen der Prazision wird die Injektionswiederholbarkeit als Ma13 fur die Sensitivitat diskutiert. Sie sollte als Teil der Validierung bei 10 Injektionen bzw. im Systemeignungstest bei 5 Injektionen einen V K von hochstens 1 % aufweisen. Bei der Spezifitat/Selektivitat werden StreOtests (Same- und Basenhydrolyse, Temperatur-, Licht- und oxidative Belastung) sowie zur Uberprufung der Peakreinheit Diodenarraydetektion empfohlen. Eine geeignete und hinreichende Skalierung der Chromatogramme bzw. Probenkonzentration sollte beachtet werden. Zusatzlich zu den ICH-Vdidierungselementen wird separat auf die Uberpriifung der Stabilitat der Testlosungen verwiesen. Mehrfach wird die Verbindung der Validierungselemente mit einem Systemeignungstest betont. Es sollen ,,enge, aber realistische" Systemtestspezifikationen gesetzt werden. Als Systemeignungstest-Parameter sind Kapazitatsfaktor, Systemprazision, Trennfaktor (sollte > 2 sein), Tailingfaktor und Bodenzahl erwahnt. Das US-Arzneibuch (USP) widmet der Validierung ein allgemeines Kapitel [88]. Eine Validierung von Priifungen, die in einer Arzneibuchmonographie beschrieben sind, ist nicht erforderlich, deren Eignung muB jedoch uberpruft werden. Zur Validierung von USP-Gehaltsmethoden sind Richtigkeit, Priizision, Spezifitat, Nachweis- und Bestimmungsgrenze, Linearitat und Arbeitsbereich beschrieben. Es werden 3 Kategorien aufgelistet: Kategorie 1: Verfahren zur Quantifizierung von Hauptkomponenten in Arzneimitteln Kategorie 2: Verfahren fur Nebenprodukte in Arzneistoffen und Arzneimitteln (quantitative Bestimmungen und Grenztests) Kategorie 3: Verfahren fur pharmazeutisch-technische Charakteristika, z. B. Freisetzung des Wirkstoffs aus dem Arzneimittel Die Anforderung fur die verschiedenen Kategorien finden sich weitgehend in der ICHGuideline wieder. 6.8.2.4 Kanada [S9] Im Gegensatz zu anderen Guidelines findet sich hier eine detaillierte Diskussion von Prinzipien, Anforderungen und insbesondere von Bewertungskriterien: Prazision wird unterteilt in System- und Methodenprazision. Fur erstere sollten 5 Bestimmungen einer Standardlosung einen VK < 1,0 % fur Arzneistoffe und < 2,O % fur Arzneimittel ergeben. Sechs Wiederholinjektionen von Nebenproduktlosungen im Bereich der Spezifikationsgrenze sollten einen VK < 5 % (bei einer Konzentration von 0,2 %) ergeben. Die Methodenprazision ist nochmals unterteilt in Wiederholprazision (intra-day) und Vergleichsprazision (inter-day). Bei ersterer sollen 6 Wiederholbestimmungen in der Regel
einen VK < 1 .0 c/c fur Armeistoffe und < 2,0 c/c fur Arzneimittel ergeben. Die Vergleichsprazision wird als Doppel- oder Dreifachbestimmung an 5 aufeinanderfolgenden Tagen durchgefiihrt. Die Richtigkeit sol1 bei Arzneistoffen durch Anwendung des zu validierenden Testverfahrens auf eine Referenzsubstanz oder durch Vergleichsbestimmung einer Probe mit einem validierten Alternativverfahren belegt werden. Bei Arzneimitteln werden Aufstockversuche (Wiederfindung) bzw. ebenfalls ein Vergleichsverfahren vorgeschlagen. Der Fehler sollte bei Dreifachbestimmung 2 47r bei Arzneimitteln bzw. 1 9bei Arzneistoffen nicht uberschreiten. Bei instrumentellen Methoden ist als Nachweisgrenze ein Signal-Rausch-Verhiiltnis von 3 : I bzw. die 2-3fache Standardabweichung des Blindwertes akzeptabel. Die Bestimmungsgrenze wird definiert als Abschiitzung fur die geringste Analytkonzentration, die einen VK von ca. 10 % bei 6 Wiederholbestimmungen ergibt. Die Spezifitiit (Selektivitiit) wird durch Vergleich von Proben mit und ohne Neben- und Degradationsprodukte, Hilfsstoffe usw. uberpruft. Bei chromatographischen Methoden sollte die Peakhomogenitiit mittels Diodenarraydetektion oder Rechromatographie der isolierten Peakfraktionen belegt werden. Die Sensitivitiit ist als geringste Konzentrationsdifferenz des Analyten definiert, die zuverlassig erfaBt werden kann. Dieser Parameter ist uber den Anstieg der Regressionsgeraden oder die Prazision zugiinglich. Die Linearitiit sol1 uber den beanspruchten Bereich des Verfahrens durch mathematische Behandlung der Analyseergebnisse, iiblicherweise durch lineare Regression bestimmt werden. Der Arbeitsbereich wird aus der Linearitiit abgeleitet und durch akzeptable Priizision innerhalb und an seinen Grenzen bestatigt. Der Anstieg der Regressionsgeraden und seine Varianz sind ein mathematisches MaB der Linearitiit, der Ordinatenschnittpunkt ein Indikator fur systematische Fehler. Es sollten 6 Konzentrationen eingesetzt werden, die bei bekannten Nebenprodukten jeweils die Spezifikationsgrenze. bei unbekannnten Nebenprodukten 0,l % und bei Arzneistoffen den Bereich von 50-1 50 c/c (die letzten beiden bezogen auf die Arbeitskonzentration des Arzneistoffes) umfassen. Als Richtgrok fur das Bestimmtheitsmal3 (Quadrat des Korrelationskoeffizienten r) werden Werte von 2 0,997 fur Arzneistoffe und 2 0,990 fur Nebenprodukte empfohlen. Die Robustheit (ruggedness) ist als Empfindlichkeit des Analyseverfahrens gegen Veriinderungen der MeB- und Umweltbedingungen definiert. Die Wechselbeziehung zu Systemtests ist ausdrucklich hervorgehoben. Es sollten homogene Proben in verschiedenen Laboratorien durch verschiedene Bearbeiter analysiert werden und als Reproduzierbarkeit mit der normalen Methodenpriizision verglichen werden. Robustheit sol1 in Abhiingigkeit des geplanten Einsatzes des Analyseverfahrens betrachtet werden. Prinzipiell werden 3 Ebenen unterschieden: 1. Reproduzierbarkeit innerhalb des Labors, 2. Reproduzierbarkeit in einem anderen Labor, 3. Ringversuch (falls relevant).
Als akzeptables MaB fur eine maximale Abweichung der Ergebnisse werden 1 c/c fur Arzneistoffe und 2 c/c fur Arzneirnittel angegeben.
6.8 Validierung in der pharmazeutischen Analytik
325
Tab. 6-25 Fur Analyseverfahren erforderliche Validierungselemente nach der kanadischen Guideline [89]. Validierungselement
Gruppe 1
Gruppe 2
Gruppe 3
Gruppe 4
Identitatstests
Wirkstoffe
Neben- und Degradationsprodukte
Physlkochemische Tests (Freisetzung)
Arzneistoff
Arzneimittel
quantitativ
nein nein
;a
ja ja
ja
nein
ja
eventuell
la
eventuell
ja
Richtigkeit
nein eventuell
eventuell nein
ja nein
ja
Nachweisgrenze
eventuell ja
ja eventuell
Systemprazision Methodenprazision
nein
Grenztest
Bestimmungsgrenze
nein
nein
nein
ja
nein
eventuell
SelektivitatLSpeLifitat Arbeitsbereich
ja nein
eventuell eventuell
ja ja
ja nein
;a nein
eventuell ja
Linearitat
nein
ja
ja
;a
nein
;a
Robustheit
eventuell
ja
ja
ja
ja
ja
Die Analyseverfahren werden in 4 Gruppen eingeteilt, fiir die die jeweils erforderlichen Validierungselemente definiert sind. Tab. 6-25. Voraussetzungen und Umfang fur eine Revalidierung werden sehr detailliert beschrieben (Tab. 6-26). Diese wird als notwendig erachtet, wenn das Testverfahren uber langere Zeit eingesetzt worden ist (1 Jahr) oder wenn signifikante Anderungen in Ausrustung oder Analysenobjekt eingetreten sind. 6.8.2.5 Good Manufacturing Practice [90] In den GMP-Regularien werden nur die erforderlichen Validierungselemente genannt, jedoch keine weiteren inhaltlichen Anforderungen formuliert. $21 1.222 des Code of Federal Regulation 2 1 nennt Richtigkeit, Sensitivitat, Spezifitat und Reproduzierbarkeit von Testverfahren, die validiert und dokumentiert sein mussen. 6.8.2.6 International Conference on the Harmonization of Technical Requirements for the Registration of Pharmaceuticals for Human Use (ICH) Der ICH-ProzeB wurde etwa 1990 initiiert, um die Anforderungen fur die Zulassung von Arzneimitteln in den drei wesentlichen Regionen Europa, USA und Japan einander anzugleichen und damit Doppelarbeit, Ineffizienz und Verzogerungen zu vermeiden. Ziel war es, ein Forum fur einen konstruktiven Dialog zwischen Zulassungsbehorden und Industrie zu schaffen. Es sollten Bereiche definiert werden, in denen Modifikationen der Anforde-
ja
evtl.' ja
nein ncin nein
ja
SST: Systemeignung.;tcst I : z. B. Extraktionsmittel und -Bedingungen, Derivatisierung, Zentnfugation, Mischung, pH, Filtration und Pulverkierung 2: z.. B , Detektor/.eIIcngcometrie, Detektortyp. Autosampler. Integrator. Datensystem 3 : Saulenlieferant, -geometric, stationare Phase. Fluhate, Injektion\volumen. Siiulentemperatur, mobile Phase 1: rn Abhjngigkeit vom Auftreten neuer Nehen- oder Degradation~produkte( b w .deren Ahtrennung) und der An des Tests
ja
nein
nein
Robustheit
evtl.'
evtI.'
ncin nein
ncin nein
ja
nein
nein
Linearitit
nein cvtl.'
nein nein
nein
ncin
ja
nein
ncin
ncin
Arbci tsbcrcic h
ja
evtL4
evtl.'
evtl.'
evtl.'
cvtl.'
ja
evtl.'
SST
Bedingungen'
nein nein
nein
ja
ncin
ja
ja
ja
SelektivitHt/Spc/iI'ilBt
ja
nein
nein
nein
nein
nein
nein
nein
Bcstimmunpqgenze
ja
nein nein
nein
ja
nein
nein
ja
nein
nein
Nachweisgrenie
ja
evtl.4
ja
ja
ja
ja
evtl.'
evtl.'
ja
ja
evtI.'
ja
ja
ja
evtI.'
Richtigkeit
.la
ja
Systembestand-
ja
Probenvorbe-
SST
SST
Gchalt
Anderunp Herstellung
chrornatographischen Verfahrcns
SST
SST
SST
nein
Methodenpraizision
SST
Grenzt.
SST
quant.
Systemprazision
Validierungsclcrnen t
Hi1f.qstoffe
Dosis
Arzneistoff
NehenlDegr.produkt
Zusarnmensetzung des Arzncimittels
neue Quelle oder Synthese des Wirkstoffs (neues Nehenprodukt)
Analyten
Modifiiierung des
Tab. 6-26 Umt'ang fur Revalidierungcn (chromatographischc Verlahren) nach der kanadischen Guideline [ W ] .
a
-. z-
--i
cn
3
m
h)
W
6.8 klidierung in der pharmcizeutischen Ancilyrik
327
rungen effizientere Prozesse ohne Beeintrachtigung der Arzneimittelsicherheit ermoglichen sowie Empfehlungen fur eine Harmonisierung der Zulassungsanforderungen ausgesprochen werden. Die 6 Cosponsoren der ICH waren die Europaische Kommission und die EFPIA (European Federation of Pharmaceutical Industry Association), das Japanische Ministerium fur Gesundheit (MHW) und die JPMA (Japanese Pharmaceutical Manufacturers Association), die FDA (Food and Drug Administration) und die PhRMA (Pharmaceutical Research and Manufacturers of America). Verschiedene Organisationen, wie die Kanadische Gesundheitsbehorde (Canadian Health Protection Branch) und die USP agierten als Beobachter. Es wurden 3 Hauptgebiete der Zulassungsanforderungen definiert: Sicherheif, Wirksamkeit und Qualirur, fur die die entsprechenden Arbeitsgruppen Harmonisierungsschwerpunkte festlegten. In der Sektion Qualitiit wurden funf Schwerpunkte ausgewahlt: Stabilitat, Validierung, Nebenprodukte, Arzneibucher und biotechnologische Produkte. Die Erarbeitung der Guidelines erfolgt(e) in funf Schritten: 1. Von einer durch das ICH Steering Committee geleiteten Expertengruppe wurde ein vorlaufiger Entwurf zur Orientierung erstellt. Diesen diskutierte man in einer gemeinsamen ICH Expert Working Group bis zur Einigung auf einen Guideline-Entwurf. 2. Der Guideline-Entwurf wurde zur formalen Konsultation an die drei regionalen Behorden weitergeleitet. 3. In der gemeinsamen ICH Expert Working Group wurde der erganzte Entwurf erneut diskutiert. 4. Der endgultige Entwurf wird durch das Steering Committee akzeptiert und seine Annahme durch die regionalen Behorden empfohlen. 5 . Es erfolgt(e) die Umsetzung der Empfehlungen in regionale Vorschriften und Gesetze. Die Guidelines zur Validierung [91, 921 haben inzwischen den Schritt 5 erreicht, ebenso wie die fur eine analytische Validierung bedeutsamen Nebenprodukt-Guidelines [93-951. Die erste Phase der ICH, gekennzeichnet durch die Bestrebungen, einen Basissatz an Daten zu definieren, der Qualitat, Sicherheit und Wirksamkeit von Arzneimitteln gewahrleistet, erreichte im Juli 1997 mit der 4. Konferenz in Brussel seinen AbschluB. Die nachste Phase strebt auf der Grundlage der etablierten Guidelines ein weltweit einheitliches Format der Zulassungsunterlagen (Common Technical Document, CTD) an. Ein wichtiger Bestandteil des CTD-Teils Qualitat sind die Guidelines zu Spezifikationen [96, 971. Die auf chemisch synthetisierte Substanzen bezogene hat im Juli 1997 ICH-Schritt 2 erreicht. Ziel ist die Etablierung einer global gultigen Spezifikation fur neue Arzneistoffe und Arzneimittel. Voraussetzung dafur ist jedoch eine Harmonisierung der verschiedenen Arzneibuchmethoden. Die ICH-Guidelines [ 9 I , 921 definieren die Anforderungen an die Validerung analytischer Priifverfahren alsTeil der Zulassungsunterlagen (s. Tab. 6-27). Dies ist nicht als ,,Checkliste" zu verstehen. Es ist Aufgabe und Verantwortung des Analytikers, fur das konkrete Prufverfahren sinnvolle Validierungsprotokolle und insbesondere Bewertungskriterien der zu bestimmenden Validierungsparameter festzulegen. Fur die einzelnen Validierungs-
Tab. 6-27 ICH-Validierungsanforderungen [ Y I
I.
Validtcrunwclemcnt
ldcntitat
Prutverfahrcn ~
Ncbcnnrodu ktc
Quantitativ
GrcnLtcut
Gchalt'
Spciit'itat' (Specificity)
+
+
+
+
Linearitst (Linearity)
-
+
-
+
Arbeitsbereich (Range)
-
+
-
Richtigkeit (Accuracy)
-
+
-
-
+
-
+
-
+
-
+
4
+
Prikision (Precision) Wicdcrholbarkcit (Repeatability)
-
Vergleichharkcit (Labor/Ringversuch') (Intermcdiatc Prccision/Rcproducibility')
Nachweisgrcnzc (Dctection Limit)
-
Bestimmungsgrcnze (Quantification Limit)
-
-
+
-
+ +
-
+ crlordcrlich. nicht crfordcrlich. 1 einschlicBlich Methoden hci Frei\etiung und Gleichfiirmigheit dcs Gehaltcs. 2 tchlende (cingeschriinkte) Spezititit cines Analyscverlahren kann durch iushtzliche Verfahrcn konipen\iert werden, 3 Interinediatc precision ausrcichend fur Zulassung. 4 hedurf'swcisc. ~
elernente sollte rniiglichst das gesarnte Prufverfahren einschliefllich Probenvorbereitung betrachtet werden.
Spezifitat
II
6.8 Vulidierung in der phurmuzeutischen Anulytik
329
Bei chromatographischen Methoden sollten die Trennfaktoren des kritischen Peakpaares betrachtet werden. Tests zur Peakhomogenitat, z. B. mittels Diodenarray und Massenspektrometrie werden empfohlen. Dokumentiert werden sollte eine Tabelle der in Betracht gezogenen Substanzen, die Begrundung fur deren Auswahl sowie, je nach Priifverfahren Trennfaktoren oder andere Analysenergebnisse inklusive Diskussion und Bewertung.
Linearitat Dejhition ICH 1911: Die Linearitat eines analytischen Verfahrens ist seine Fahigkeit (innerhalb eines gewissen Bereiches) Testergebnisse zu erzielen, die der Konzentration (Menge) des Analyten in der Probe direkt proportional sind. Man kann zwischen der Linearitiit des Detektors/Analysengerates (Verdunnungsreihe des Analyten) und der Linearitat des analytischen Verfahrens (unabhangige Einwaagen, inklusive Probenvorbereitung) unterscheiden. Mindestens 5 Analytkonzentrationen uber den gesamten Arbeitsbereich des analytischen Verfahrens sollten gepruft werden. Neben einer visuellen Beurteilung des Analysensignals als Funktion der Konzentration werden geeignete statistische Auswertungsverfahren empfohlen. Im uberwiegenden Fall einer linearen Abhangigkeit (eventuell nach mathematischer Transformation) bietet sich eine lineare Regression an. Die Parameter Anstieg und Ordinatenschnittpunkt, die Fehlerquadratsumme und der Korrelationskoeffizient sollten berichtet werden.
Arbeitsbereich
De$nition ICH [91]: Der Arbeitsbereich eines analytischen Verfahrens ist der Interval1 zwischen unterer und oberer Konzentration (Menge) des Analyten in der Probe, uber den ein geeignetes (akzeptables) Ma8 an Prazision, Richtigkeit und Linearitat gezeigt wurde. Die Grenzen des Arbeitsbereiches werden durch die Anforderungen des Prufverfahrens (bzw. die Spezifikation des Kontrolltests) bestimmt und in der Regel aus der Linearitat abgeleitet. Die geforderten Minimalbereiche sind in Tab. 6-28 wiedergegeben. Tab. 6-28 MindestgroBe des Arbeitsbereiches nach ICH [92].
Kontrolltest
min. Arbeitsbereich
Gehalt (Wirkstolf und Arzneiform)
80-120 % Testkonzentration
GleichMrmigkeit des Gehalts
70-1 30 % Testkonzentration
Freisetzung
20 % ohere bzw. untere Spezifikation
Nehenprodukte a) Arzneistoff 1931 b) Arzneiform [94]
Berichtsgrenze his I20 9 Spezifikation ab 0.05 % bei Tagesdosis 5 2 kg ab 0,03 % bei Tagesdosis > 2 g ab 0.1 %' bei Tagesdosis < I g ab 0,05 %' bei Tapesdosis > 1 g
Gehalt und Reinheit zusammen, mit 100 9% Standard
Berichtsgrenze Nebenprodukt bis 120 o/o GehaltssDezifikation
Tab. 6-29 Miiglichkeiten des quantitativen Richtigkcit~nachwcisesnach ICH 1921.
Arzncistoff
-
Anwendung des Prufverfahrens auf ein Rcfercnzmatcrial Verglcich der Ergebnisse mit einem ctabliertcn, unabhsngigen Vcrfahrcn
~
Arzneiform
Nchenproduktc (quantitativ)
Anwendung dcs Prufverfahrens auf cine synthetischc Mischung allcr Komponenten Aulstockung von Analyt zur Arzncilorm - Vcrgleich der Ergchnisae mit einem ctahlierten. unahhgngigen Vcrlahren -
-
Aulstockung von Nchenprodukt xu Arzneistoff odcr -form
-
Verglcich der Ergebnisse mit cincm ctablierten, unabhsngigcn Vcrlhhren
Richtigkeit fkfinirion I C H [ S l ] : Die Richtigkeit eines analytischen Verfahrens druckt die Ubereinstimmung zwischen dem gefundenen Wert und einem entweder konventionell als wahr akzeptierten Wert oder einem akzeptierten Referenzwert aus. Mangelnde Ubereinstimmung 1st ein Hinweis auf systematische Fehler. Die Richtigkeit kann aus den Validierungselementen Spezifitlt, Linearitat und Prlzision geschlubfolgert werden. Bei quantitativen Prozeduren sollten als Minimum neun Bestimmungen uber mindestens drei Konzentrationsniveaus des gesamten Arbeitsbereiches (z. B. 3x3) durchgefuhrt werden. Die Ergebnisse werden als Prozent Wiederfindung oder als Differenz zwischen dem Mittelwert und dem Referenzwert sowie den Vertrauensbereichen berichtet. Die ICH-Guideline listet verschiedene quantitative Richtigkeitsbelege auf (Tab. 6-29).
Prazision
DqjinifionICH [ Y l ] : Die Priizision eines analytischen Verfahrens ist ein Ma8 fur die Ubereinstimmung (Streuung) der MeBergebnisse bei wiederholter Durchfuhrung des Analysenverfahrens mit einer homogenen Probe.
In die Priizision gehen die zufiilligen Fehler ein. Es sollten nach Miiglichkeit homogene, authentische Proben verwendet werden. Berichtet werden Standardabweichung. Variationskoeffizient und Vertrauensbereich auf jedem Prlzisionsniveau.
WirderholhLirkeit Bei der Wiederholprazision erfolgt die Analyse laut gesamtem Prufverfahren unter denselhen MeBbedingungen innerhalb eines kurzen Zeitraums (d. h. einer MeRserie). Es sollten mindestens neun Bestimmungen uber drei Konzentrationsniveaus des gesamten Arbeitsbereiches durchgefuhrt werden (z. B. 3 x 3) oder sechs Bestimmungen bei 100 8 Testkonzentration.
6.8 Validierung in d e r pharmuzeutischen Analytik
33 1
Vergleichbarkeit Die Vergleichsprazision umfaBt verschiedene MeBserien bei Variation der Parameter Zeit, Bearbeiter, Geriit, HPLC-Saulen, Reagentien, Laboratorien usw. Je nach AusmaB der Variation unterscheidet man die - Intermediate Precision (innerhalb eines Labors) und die - Reproduzierbarkeit (Ringversuchspfzision, Einbeziehung mehrerer Labors, zur Standardisierung oder beim Methodentransfer). Diese ist jedoch nicht zur Zulassung erforderlich. Die gewahlten Variationen sind an dem geplanten Einsatz des Prufverfahrens zu orientieren.
Nachweis- und Bestimmungsgrenze Definition ICH 1911: Die Nachweisgrenze eines Analyseverfahrens ist die geringste Analytmenge in einer MeRprobe, die detektiert, aber nicht als quantitativer Wert bestimmt werden kann. Die Bestimmungsgrenze eines Analyseverfahrens ist die geringste Analytmenge in einer MeBprobe, die mit der notwendigen Priizision und Richtigkeit quantifiziert werden kann.
Nachweis- und Bestimmungsgrenze konnen z. B. visuell festgelegt, aus dem SignalRausch-Verhaltnis, aus der Standardabweichung des Blindwertes oder aus der Kalibriergeraden irn Bereich der Bestimmungsgrenze berechnet werden. Bestimmungsmethode und Ergebnisse, eventuell relevante Chromatogramme miissen berichtet werden. Im Fall der Berechnung oder Extrapolation sollte das Ergebnis mit einer geeigneten Anzahl an Proben mit entsprechenden Analytkonzentrationen verifiziert werden.
Robustheit Definition ICH 1911: Die Robustheit eines analytischen Verfahrens ist ein MaS seiner Kapazitat, gegenuber geringen, aber uberlegten Anderungen der Methodenparameter stabil zu bleiben. Sie ist ein Hinweis auf die Zuverlassigkeit im Routinebetrieb.
Dieses Element sollte wiihrend der Methodenentwicklung betrachtet werden. Kritische Parameter miissen identifiziert und durch geeignete Maanahmen im Einsatz des Priifverfahrens kontrolliert werden, z. B. im Systemeignungstest. Zu diesen Parametern konnen gehoren: Stabilitat der Testlosungen, Probenvorbereitung, pH und Zusammensetzung der mobilen Phase, HPLC-Saulen, Temperatur, FluBrate usw.
Systemeignungstest Obwohl kein Validierungselement, sind Systemeignungstests integraler Bestandteil der meisten analytischen Verfahren. Die entsprechenden Parameter konnen aus den Validierungsdaten abgeleitet werden.
6.8.3 Planung, Durchfuhrung und Bewertung von Validierungsstudien Der ICH-ProzeR hat einen wertvollen Beitrag zur internationalen Anniiherung der Anforderungen bei der Zulassung von Arzneimitteln geleistet, auch wenn die erreichten Kompromisse teilweise zu lnkonsistenzen gefuhrt haben und manchmal das ,,Rad neu erfunden'' wurde, wie im Beispiel Spezifitiit - Selektivitiit. Es ist jedoch eine weltweit einheitliche Basis entstanden, die Begriffe und Mindestanforderungen sind einheitlich definiert worden und der Handlungsrahmen sowohl fur Industrie als auch Behorden ist deutlicher abgesteckt. Im Laufe des ICH-Prozesses ist auch der ubergreifende und integrative Charakter der einzelnen Schwerpunkte immer deutlicher geworden, was sich insbesondere in den Guidelines zu den Spezifikationen 196,971niederschlagt. Die ICH-Guidelines sind nicht als .,Checkliste" zu verstehen. Es ist Aufgabe und Verantwortung des Analytikers, fur das konkrete Prufverfahren sinnvolle Validierungsprotokolle einschliel3lich des experimentellen Designs, der relevanten Parameter sowie insbesondere der Hr,r.rrtirrig.c.kriterirn festzulegen. Darauf wird sich die zukunftige Diskussion und Interpretation der Guidelines konzentrieren mussen. Die ,,Eignung" analytischer Verfahren ergibt sich primar aus dem Ziel der Priifungen, d. h. dem Vergleich der Ergebnisse mit festgelegten Akzeptanzkriterien. Diese Spezifikationsgrenzen konnen aus notwendigen Qualitats- und Sicherheitsanforderungen abgeleitet werden, sich aber auch - naturlich nur falls ersteres nicht prohibitiv ist - aus der Leistungsfahigkeit des Prufverfahrens ergeben 1961. Daneben sollten bei der Bewertung der Validierungsparameter der Stand der Technik sowie Erfahrungswerte berucksichtigt werden. Verschiedene weitere ICH-Guidelines stehen in enger Wechselbeziehung bzw. verweisen auf diejenigen zur Validierung. Hier wlren insbesondere die Guidelines zu Nebenprodukten 19.7-951zu nennen, die Maximalkonzentrationen fur Nebenprodukte festlegen (s. Tab. 6-30) und damit Mindestanforderungen an die jeweiligen Prufverfahren stellen. Dies mul3 naturlich in der Validierung berucksichtigt werden. Sehr wichtig sind auch die Guidelines zu Spezifikationen [96,97]. Hier wird auf die Begrundung und Rechtfertigung der zur Qualitltsprufung ausgewlhlten Prufverfahren und deren Akzeptanzgrenzen eingegangen. Letztere sind ein Ma8 fur die Eignung des Analyseverfahrens und damit ein Beurteilungskriterium von Validierungsdaten. Andererseits kiinnen (und mussen) jedoch Ergebnisse der Validierung auch auf die Festlegung von AkzeptanzgrenLen EintluR haben. naturlich unter dem Vorbehalt der Arzneimittelsicherheit. 6.8.3.1 Spezifitat
Spe,-ififischoder Selektiv? Zur Definition dieses Validierungselements wird eine sehr kontroverse Debatte gefuhrt, die sich vorrangig an der Begriffsbestimmung entzundet 1981. Nach der IUPAC-Definition 1991 wird Spezifitat als ultimativer Grad an Selektivitiit definiert. Obwohl der Einwand berechtigt ist, warum ICH eine von anderen Organisationen abweichende Begriffsbestimmung eingefiihrt hat, bleibt die Frage nach der praktischen Relevanz der IUPAC-Spezifitiit. In der Praxis durfte es danach nur verschiedene Grade an Selektivitat geben, jedoch keine (wirklich) spezitischen Methoden.
6.8 Widierung in der phnrmciieutischen Analytik
333
Tab. 6-30 ICH-Grenzwerte fur Berichten, Identifizierung und (toxikologische)Qualifizierung von Ncbenprodukten in neuen Arzneistoffen [93] und Fertigarzneimitteln [94].
Maximale Tagesdosis'
Grenzwerte' Berichten
Identifizierune
Oualifizierune
0,os 70 0.03 %
0,l % 0,1 %
0,l 9% oder 1 mg 0,05 %
Arzneistoff 52g >2g
Fertigarzneimittel
I m g - IOmg
1,0 9% oder S pg 0,5 7% oder 20 pg
>lOmg-2g
0.2 % oder 2 mg
iI
mg
< 10 mg 10 mg - 100 mg > l00mg-2g 5 l g >IE >2g
1 ,0 % oder 50 pg 0,s % oder 200 pg
0,2 % oder 2 mg
0,l % 0.05 c/r
0,l %
0,l %
I : an Wirksubstanz 2: in Prozent oder Gesarnttagesrnenge an Wirkstoff, jeweils niedrigerer Wert.
Im Unterschied zur isolierten Betrachtung jedes Prufverfahrens ist in der pharmazeutischen Analytik die Summe aller Prujiungen zur Qualitatsbeurteilung des Wirkstoffes oder Arzneimittels von wesentlicher Bedeutung. Durch dieses Spannungsfeld zwischen Validierung einzelner Verfahren und Gesamtbeurteilung der Spezifikation ist vermutlich sowohl die Diskrepanz zur IUPAC als auch Inkonsistenzen in den ICH-Guidelines zu verstehen. Einerseits folgt man der absoluten IUPAC-Definition und spricht von ,,unequivocally" und daB es ,,nicht immer moglich" sei, Spezifitat zu demonstrieren. Andererseits werden dann aber verschiedene Grade an Spezifitat zugestanden, was der Praxis natiirlich eher entspricht. Weitere Definitionen, die eine inhaltliche Differenzierung erlauben, wenden Selektivitat auf physische Trennung von Substanzmischungen an, d. h. Erfassung des Analyten neben anderen Komponenten wie z. B. Chromatographie und Elektrophorese. Im Unterschied dazu beschreibt Spezifitat die individuelle Erfassung des Analyten in Gegenwart anderer Substanzen, d. h. als gruppen- oder strukturspezifische Bestimmung ohne signifikante Beeinflussung des Ergebnisses durch andere Substanzen, z. B. mittels MS, NMR, IR, Fluoreszenz-, UV-, elektrochemischer Detektion, Titration [ 1001. Ungeachtet der Definitionsdebatte besteht jedoch Ubereinstimmung, daB der Nachweis fehlender Beeinflussung des MeBergebnisses eine essentielle Voraussetzung fur die Richtigkeit und damit kritische Grundlage des Verfahrens ist. Erschwerend wirkt bei diesem Validierungselement, daB es kein quantitatives MaB fur die Spezifitat (der Autor bleibt hier bei dem ICH-Terminus) gibt. Das notwendige MaB hangt sowohl von der Anforderung an das jeweilige Prufverfahren, als auch von einer geeigneten Kombination verschiedener Prufverfahren ab. So kann z. B. die Gesamtspezifitat
der Qualitiitsprufung durch Absicherung bzw. Korrektur einer sehr prazisen und effizienten Gehaltstitration mit einer selektiven chromatographischen Nebenproduktbestimmung gewahrleistet werden.
Trrnr~iiirktorivi Bei chromatographischen Methoden sollten Trennfaktoren des kritischen Peakpaares bestimrnt werden. Dieses ergibt sich aus dem Ziel der Priifung. Bei der Gehaltsbestiinmung muR eine ausreichende Trennung von Nebenprodukten und Placebopeaks vom Hauptpeak gewahrleistet sein, die Nebenkomponenten untereinander mussen nicht getrennt sein. Dies gilt ebenfalls fur individuelle Bestimmungen von Nebenkomponenten. Bei ,,universellen" Verfahren zur Nebenproduktbestimmung mussen demgegenuber alle zu erfassenden Peaks eine geeignete Mindesttrennung aufweisen. Die erforderlichen Trennfaktoren des kritischen Peakpaares hangen wesentlich von dem GroRenunterschied ab. Wahrend bei Peaks gleicher Griil3e ein Trennfaktor von I ausreichend ist, erfordert die Quantifizierung von Nebenkomponenten, die 100-oder 1000-fach geringer vorhanden sind als die Hauptkomponente, wesentlich bessere Trennungen und wird stlrker von Tailing und Elutionsreihenfolge beeinflufit [ 1011. Deshalb ist es unbedingt erforderlich, die notwendigen Trennfaktoren in einer reprlsentativen Zusainmensetzung der Probe zu bestimmen.
mit
tRo,h
\v(,,5n,h
Retentionszeit der Peaks a und b mit t R h > tK,, Breite der Peaks a und b in halber Hiihe Breite der Peaks a und b an der Basis.
Eine Berechnung der Trennfaktoren uber die Peakbreite in halber Hohe (Gleichung ( I ) , Pharm.Eur.) oder an der Basis (Gleichung (2), USP) ist nur sinnvoll bei basisliniengetrennten Peaks oder Peaks lhnlicher GriiBe. Auaerdem muR berucksichtigt werden, daO beide Berechnungen unterschiedlich auf Peakasymmetrien reagieren. Die vom US-Armeibuch angegebene Gleichung (2) ist auf Tailing weniger emptindlich, jedoch komplizierter (und damit fehleranfilliger) zu berechnen bzw. abzuleiten. Bei koeluierenden Peaks, insbesondere bei unterschiedlicher GriiRe ist die Berechnung nach Gleichung ( 1 ) oder (2) nicht mehr miiglich oder aufgrund der Additivitiit der Peak-Hullkurven fehlerbehaftet. I n solchen Fallen bieten sich Parameter an, die aus der Hiihe des Tales zwischen den beiden Peaks abgeleitet werden (Abb. 6- 16 a und b). Diese Verfahren haben den Vorteil, direkt mit der Integration von Peaks und damit der Quantifizierung. also dein Ziel der Prufung gekoppelt zu sein. Ebenso spielen Abweichungen der Peaks von der GauRform keine Rolle, da
6.8 Validierung in der pkarrnazeutischen Analqtik
335
1 ' . . . , . " . ~ ' " , ' ' ' . , ~ . ' . , . . min ..,.'.','...
50.0
50.1
50.2
50.3
50.5
50.6
50.7
50.8
5
Abb. 6-16 Peak-Trennungsparameter: Peak-Tal-Verhaltnis = 1 - h / a . a bei Peaks ahnlicher GroBe [nach 1021 b
bei Spurenkomponenten [nach 1001.
keine derartigen Voraussetzungen in das Berechnungsmodell eingehen. Der Ansatz aus Abb. 6-16a ist zu bevorzugen bei ahnlicher PeakgroOe [102], der aus Abb. 6-16b bei starken GroBenunterschieden zwischen den Peaks [ 1001. Durch die Subtraktion des Verhaltniswertes von 1 erhalt man einen gleichsinnigen Wert gegenuber dem herkommlichen Trennfaktor R,. Ein Peak-Tal-Verhaltnis von 1 bedeutet Basislinientrennung, ein Wert von 0 keine (An)Trennung. Neben einer Optimierung der Trennung sollte auch an die der Detektion gedacht werden, um Interferenzen zu unterdrucken. Peakhomogenitut Bei chromatographischen Verfahren sind Untersuchungen zur Peakhomogenitat sehr wichtig. Falls der Konzentrationsunterschied der koeluierenden Peaks nicht zu groR ist, konnen einfache Methoden der eindimensionalen Detektion angewendet werden, wie z. B. die Betrachtung der Peakbreite in halber Hohe in Abhangigkeit von der Retentionszeit, oder des Symmetriefaktors in Abhangigkeit von der Peakhohe. Ersteres ergibt fur normal eluierende, reine Substanzpeaks einen linearen Zusammenhang, da sich die Peakbreite proportional zur Retentionszeit verhalt. Unter derselben Voraussetzung ist der Symmetriefaktor unabhangig von der Peakhohe 11031, s. auch Abschnitt 3.6.5. Eine sehr einfache und effektive Methode im Fall von geringen Verunreinigungen stellt die Rechromatographie der zu untersuchenden Peakfraktion dar (s. Abb. 6-17). Die Aussagekraft wird urn so groBer, j e unterschiedlicher die beiden chromatographischen Methoden sind, wobei die verschiedensten Kopplungen denkbar sind, z. B. RP-Chromatographie mit RP (anderer Eluent, pH, Saule), SEC, IC, TLC, CE usw. Vorteilhaft ist hierbei die hohe Empfindlichkeit der Detektion und die universelle Verfugbarkeit. Die Rechromatographie kann mit isolierten Peakfraktionen durchgefuhrt werden, mit Saulenschaltungen oder als direkte, orthogonale Kopplung der beiden Methoden, s. Abschnitt 3.6.4.
a
Chrornatogramm der zu validierenden Methode (Acetonitril/Wasser/ 0,1 % Trifluoressigsaure, RP C8-Saule). Der Hauptpeak wurde in einer Fraktion von 9,6 bis 11,O Minuten gesammelt.
Abb. 6-17 Untersuchung der chromatographischen Peakreinheit mittels Rechromatographie. b
Rechromatographie der gesammelten Peakfraktion mit anderer Methode (Acetonitril/0,2 M Natriumphosphatpuffer pH 4,0, RP C8-Saule).
E R
s
B
5.
s
Y
o\
W W
6.8 Vulidierung in der phnrmcizeutischen Ancilytik
331
Mit der Verbreitung von Diodenarrqdetektoren und der entsprechenden Auswertesoftware ist die Untersuchung der spektralen Peakhomogenitat sehr einfach geworden. Diese Methode setzt jedoch Unterschiede sowohl im Spektrum, als auch in der Retentionszeit koeluierender Substanzen voraus. Da potentielle Neben- oder Degradationsprodukte oft eine sehr iihnliche Struktur und damit spektrale Eigenschaften aufweisen, sollte man sich der Limitierung in der Aussagekraft bewul3t sein. Wenn die o. g. Voraussetzungen jedoch erfullt sind, ist mit kommerziell verfugbarer Software der Nachweis einer Koelution von Substanzen mit nicht zu grol3em Konzentrationsunterschied sehr einfach. Peakverunreinigungen unter 1 % konnen jedoch im allgemeinen nicht mehr erfal3t werden (s. Abb. 6- 18).
Match Factors 1 1000 2 999 3 999 4 993 5 974
80 60 40 20
199.9
220.0
240.0
260.0
280 0 nm 299
-1 200.0
80
6o
220.0
240.0
260.0
nm
299.9
Match Factors 1 1000 2 999 3 999 4 999 5 999
t\
20 I
9.60
9.80
I
I
I
10.00 10.20 10.10
I
10 rnin
-1 200
220
240
260
280 nm 300
Abb. 6-18 Untcrsuchung der chrornatographischen Peakreinheit mittels Diodenarraydetektion. Spektren von Arzncistoff (AS) und Nebenprodukt (NP), Die Spcktren wurden im Peakmaximurn (3) und in ca. S % sowie ca. S O 7r Peakhiihc. jeweils in der anstcigenden ( I . 2) und ahfallenden (4, 5 ) Peaktlanke extrahiert. Die Normierung (Matchfaktor 1000)erfolgte auf das erste Spcktrum in ca. 5 %, Peakhiihe, ansteigend ( I ) . Koelution ciner Mischung mit ca. 10 %, Nehenprodukt, Koelution ciner Mischung mit ca. 0,5 %, Nebenprodukt.
(r.**r.rrrrr
...,*....
J
I
Ahb. 6-19 Untersuchung der chromatographinchen Peakreinheit mittcls LC-MS.
338 6 Techniken und Gebiete
E
i
6E
c 0
e
3
I
6.8 Validierung in der pharmazeutischen Anulytik
339
Die aussagekraftigste Methode zur Untersuchung der Peakreinheit stellt die massenspektrometrische Detektion dar (s. Abb. 6- 19). Das obere und untere Chromatogramm stellen die UV-Spur bei 240 nm und das extrahierte Ionenchromatogramm fur m/z 325 dar. Die Inserts a bis d sind representative Massenspektren aus der ansteigenden und abfallenden Signalflanke des zu untersuchenden Peaks. Der Anteil an koeluierendem Nebenprodukt betragt 0,5 %. Bei direkter LC-MS-Kopplung werden dazu Massenspektren uber den Elutionsbereich des zu untersuchenden Peaks betrachtet. Zunachst wird versucht, die auftretenden Masse-Ladungs-Zahlen (m/z) dem betreffenden Analyten zuzuordnen. Im vorliegenden Beispiel treten hauptsachlich die m/z-Werte 550,5, 275,7 und 295,7 auf. Diese entsprechen dem einfach geladenen Molekulion, dem doppelt geladenen und einem Komplex von letzterem mit dem Eluentenbestandteil Acetonitril. Bei Auftreten eines zusatzlichen m/z-Wertes wird das entsprechende Massenchromatogramm extrahiert (hier m/z 325,l) und mit der UV-Spur oder den zum Analyten gehorenden Massenchromatogrammen verglichen. Ein Unterschied in der Retentionszeit oder der Peakform ist ein direkter Beweis fur eine Verunreinigung. Im gezeigten Beispiel konnte ein Nebenprodukt von 0,5 % nachgewiesen werden. Selbst bei identischen Retentionszeiten ist eine Identifizierung von Verunreinigungen moglich, wenn die gefundene Masse nicht dem Analyten zugeordnet werden kann. Bei der Validierung von LC-Verfahren mit nichtfluchtigen Eluenten konnen die betreffenden Peakfraktionen isoliert und unter MS-kompatiblen Bedingungen rechromatographiert werden. Eine weitere Moglichkeit ist die direkte on-line Kopplung der beiden Systeme [ 1041. Eine Limitierung stellen Isomere dar, wobei Strukturisomere durch unterschiedliche Fragmentierung in MS-MS-Experimenten unterschieden werden konnen. Dazu sind allerdings Triple-Quadrupol- oder Ionenfallen-Gerate notwendig. Der apparative Aspekt steht naturlich einer breiten Anwendung noch im Wege. Da sich in den letzten Jahren allerdings hier grol3e Fortschritte ergeben haben, sowohl was die routinemaBige Bedienbarkeit, als auch den Preis betrifft, sollte die Verbreitung von MSGeraten in den nachsten Jahren deutlich zunehmen. Die massenspezifische Detektion und damit die Ausblendung von interferierenden Substanzen, die Eroffnung einer weiteren Dimension in der Chromatographie [ 1051 sowie die einfache Moglichkeit einer positiven Identifizierung bieten einen deutlichen Gewinn an Effizienz und Zuverlassigkeit der entsprechenden Prufverfahren, so daB auch der routinemaBige Einsatz in der Qualitatskontrolle sinnvoll und okonomisch gerechtfertigt erscheint.
6.8.3.2 Linearitat und Arbeitsbereich Der Begriff ,,Analytical Response" wurde dieses Validierungselement besser erfassen, da ein h e a r e r Zusammenhang zwar wunschenswert, aber nicht zwingend notwendig ist. Durch das Design des Priifverfahrens wird der grundsatzliche Zusammenhang zwischen Analyt und Analysensignal vorbestimmt. Bei Messung der UV-Absorption ist durch das LambertBeersche Gesetz - zumindest innerhalb bestimmter Grenzen - ein h e a r e r Zusammenhang gegeben, bei anderen Methoden, wie z. B. Fluoreszenzdetektion oder DC dagegen eine nichtlineare Funktion.
900
800
b = 5.15f 0.23= 4.45% (95% VB) a = 2.12f 5.43(95% VB)
Anstieg Ordinatenschnittpunkt
= 0 41 % Signal be1
700
Arbeitskonzentration
600
500 r :m
400
P"
300
B
relative Verfahrensstandardabweichung Korrelationskoeffizient Sensitivitat (PeakflBche/Konzentration) Mittelwert Variationskoeffizient
200 100
0 -100
20
40
I
I
60
80
-
100
5.16
0.93% 1-
1
120
1.1 % 0.9997
140
160
1 10
Arbeitr konzentration (%)
Abb. 6-20 Lincare Regression (ungcwichtet)der Pcaktliichen cines chromatographicrten Wirkstollcs i n Ahhiingigkcit von der KonLentration. Zwltzlich L u r Rcgressionsgeradcn sind die Grenzen des ohcren und untcrcn 95 74 Prognosebereiches
eingczcichnet. Die fur dicscs Beispiel durchgcluhrtc Polynomregression 2. Grades (y = ( I + ti . .x + c . x2) crgah folgcndc Paraineter: ( I = -17.49, h = 5.57, (. = 0,0021 0,013 (95 74 Vertraucnsbercich).
*
Die eigentliche Frage, die bei diesem Validierungselement beantwortet werden muB, ist die nach der Eignung derjeweiligm Kulihriet@nktion, die zur Quantifizierung des Analyten verwendet wird. Danach richten sich sowohl die relevanten Parameter (Gleichung (3) ( 1 1 ) und Abb. 6-20), als auch deren Bewertung (Tab. 6-3 1 j.
Qucrtiti~ifj,i~rirrig.~nleth~~~~t~ Man kann zwischen externer und interner Kalibrierung sowie Normalisierungsverfahren unterscheiden. Die primiire Wahl der Quantifizierung sollte aus dem Design des Prufverfahrens unter Optimierung des Aufwandes abgeleitet werden, wobei dem (unter den jeweiligen Bedingungen) einfachsten Modell der Vorrang eingeriiumt werden sollte. Dies kann den EinfluR v o n Fehlerquellen minimieren. Bezuglich der Anforderungen an die Linearitiit besteht kein Unterschied zwischen externer und irit~rrierKulihrirrrrng. Da bei letzterer der interne Standard gemeinsam mit der Probe analysiert wird, muO im Rahmen der Spezititiit die Abwesenheit von Interferenz zwischen den Probekomponenten und dem internen Standard (Koelution, Reaktionen usw. j nachgewiesen werden. Interne Kalibrierung wurde ursprunglich in der GC angewendet, um Fehler durch die manuelle lnjektion bzw. sehr kleine Injektionsvolumina auszugleichen. Da durch die zusatdichen Probenvorbereitungsschritte wie z. B. die Addition des
6.8 Widierung in der pharmuzeutischen Analytik
34 1
Tab. 6-31 Anforderungen an die Quantifizierungsmethoden mit relevanten Parametern. Quantifizierung
Anforderung
relevante Parameter
Einpunktkalibrierung (externer Standard)
lineare Funktion
Verfahrensstandardabweichung (Reststandardabweichung), Sensitivitaten (Variationskoeffizient, graphische Darstellung), Residuenanalyse, Test gegen quadratische Regression
nicht signifikanter Ordinatenschnittpunkt
EinschluB von Null in Vertrauensbereich des Ordinatenschnittpunktes. GrBRe des Ordinatenschnittpunktesin Proitent der Arbeitskonzentration
Varianzhomogenitat*
F-Test der Varianzen an unterer und oberer Grenze des Linearitatsbereiches
lineare Funktion
Verfahrensstandardabweichung (Reststandardabweichung), Sensitivitaten (Variationskoeffizient, graphische Darstellung), Residuenanalyse, Test gegen quadratische Regression
Varianzhomogenitat*
F-Test der Varianzen an unterer und oberer Grenze des Linearititsbereiches
linear, gewichtet
lineare Funktion
Verfahrensstandardabweichung (Reststandardabweichung), Sensitivitaten (Variationskoeffizient, graphische Darstellung), Residuenanalyse, Test gegen quadratische Regression
Nichtlinear
stetige Funktion
Adaquate mathematische Funktion
100 %-Methode (Flachennormalisierung fur Nebenprodukte):
fur Huuptpeuk: . .
Mehrpunktkalibrierung linear, ungewichtet
lineare Funktion
Verfahrensstandardabweichung (Reststan dardabweichung), Sensitivitaten (Variationskoeffizient, graphische Darstellung), Residuenanalyse, Test gegen quadratische Regression I
nicht signifikanter Ordinatenschnittpunkt
EinschluR von Null in Vertrauensbereich des Ordinatenschnittpunktes, GroRe des Ordinatenschnittpunktesin Prozent der Arbeitskonzentration
,Fir Nehenkomponenten.
lineare Funktion
*
Verfahrensstandardabweichung (Reststan dardabweichung), Sensitivitaten (Variationskoeffizient, graphische Darstellung), Residuenanalyse
kann bei eingeschrinktem Arbeitsbereich (Faktor 10-20) normalerweise vorausgesetzt werden.
internen Standards die Variabilitiit erhoht werden kann und aufierdem jeweils der Nachweis der Spezifitiit gefuhrt werden muB, sollte der Vorteil einer internen Kalibrierung im Rahmen der Verfahrensentwicklung gezeigt werden. Dazu konnen die Validierungselemente Linearitat, Priizision und Richtigkeit verwendet werden. Eine interne Kalibrierung ist ebenfalls in der CE [ 1061 sowie bei komplexer Probenvorbereitung mit Extraktions- oder Derivatisierungsschritten mit niedriger Ausbeute angezeigt, ebenso wenn bei unterschiedlicher Zusammensetzung der Matrix Wechselwirkungen mit dem Analyten nicht ausgeschlossen werden kiinnen. Letzteres ist jedoch eher fur biologische Proben als in der pharmazeutischen Analytik zu erwarten. Die Anforderungen an die verschiedenen Quantifizierungsmethoden mit den relevanten Validierungsparametern sind in Tab. 6-3 1 zusammengefafit. Der erforderliche Bereich der Linearitiit wird durch den notwendigen Arbeitsbereich des Priifverfahrens vorgegeben (s. Tab. 6-28). Bei Einpunktkalibrierung sollte der Konzentrationsbereich nach unten ausgedehnt werden, um eine zu grofie Extrapolation auf den Ordinatenschnittpunkt zu vermeiden.
Liri e N re Regressiori
mit
tv,
= 1 ungewichtet 1 gewichtet
kvi #
95 96 Vertrauensbereich des Anstiegs t (95%,tz - 2 ) ' sy
vBb =
JW
Ordinatenschnittpunkt
a = j- h . X
95 % Vertrauensbereich des Ordinatenschnittpunkts
6.8 Vulidierung in der phurmazeutischen Annlytik
343
relativer Ordinatenschnittpunkt
Reststandardabweichung
sy =
'i
( v ; - .?;I2
n-2
relative Verfahrensstandardabweichung sy "xo
=
'
100%
h.x
Eine ungewichtete lineure Regression (Gleichung ( 3 ) , wi = 1) setzt eine gleichartige Streuung der Werte im gesamten Bereich voraus (Varianzenhomogenitat), da der absolute Betrag der Fehlerquadrate zur Regression herangezogen wird. Diese Voraussetzung kann in Vorversuchen durch eine geeignete Anzahl von Wiederholbestimmungen (n = 6-1 0) an den Grenzen des erforderlichen linearen Bereiches uberpriift werden. Die Varianzen der Wiederholbestimmungen werden mittels F-Test gepruft [78]. Da in der pharmazeutischen Analytik der Arbeitsbereich oft relativ begrenzt ist, kann in solchen Fallen auf eine Uberprufung verzichtet werden. Im allgemeinen ist bei Verwendung der UV-Absorption (im linearen Bereich) die Varianzenhomogenitat uber etwa 1-2 GroBenordnungen gegeben. Wenn ein gro13erer Arbeitsbereich erforderlich ist, mu13 die Kalibrierung uber eine gewichtete lineare Regression durchgefuhrt werden (Gleichung (3), wi # 1). Hierbei erhalten die kleinen Konzentrationen einen zusatzlichen Wichtungsfaktor. Dadurch wird gewahrleistet, da13 auch diese Konzentrationen in der Regression angemessen berucksichtigt werden (Abb. 6-21). Die Wichtungsfaktoren konnen aus der individuellen Varianz bei der jeweiligen Konzentration abgeleitet werden. Die Wichtung erfolgt dann mit der reziproken Varianz der jeweiligen Konzentration. Als Naherungsverfahren kann auch die reziproke Konzentration bzw. deren Quadrat verwendet werden. Zur gewichteten Regression s. auch Abschnitt 3.7.2.8. Bei Abweichungen von einer linearen Funktion, z. B. bei quantitativer Dunnschichtchromatographie oder Fluoreszenzdetektion, mu13 eine nichtlineare Anpassung, z. B. eine Polynomregression 2. Ordnung (quudrutische Regression) gewiihlt werden [ 521. Da bei einem Einsatz von Wichtungsfaktoren oder nichtlinearen Funktionen zusatzliche Voraussetzungen angenommen werden bzw. Freiheitsgrade verlorengehen, mu13 stets das einfachste Regressionsmodell gewahlt werden. Anderenfalls konnten mit den ,,flexibleren" Funktionen zufallige Abweichungen ebenfalls ,,angepaBt" werden. Auljerdem erfordern Mehr-
90 80 70
60
50 40
30 20 10 0
0
25
50
75
100
Ahb. 6-21 Verglcich [wisehen ungewichtetcr ( a ) und gewichtctcr (b) linearen Regression. Der Insert ieigt den unterschicdlichen Vcrlauf der Regressionsgeraden irn unteren Konzentrationsbcrcich. Folgende Paramcler (einschlieBlich 95 ?k Vertrauensbereich) wurdcn berechnet: a Anstieg h = 0,636 f 0,94 % und Ordinatenschnittpunkt 11 = -0.0X3 f 0.22 b Wichtung: Its: Anstieg h = 0,633 f 1,03 c/r und Ordinatenschnittpunkt ( I = -0,006 f 0. I3
punkt- oder nichtlineare Kalibrierungen eine griibere Werteanzahl. Auch im Fall von intrinsisch nichtlinearen Zusammenhlngen kann gepruft werden, ob im notwendigen Arbeitsbereich eine Naherung durch eine lineare Funktion tolerierbare Abweichungen ergibt. Brurteiliirig d r r Linearitiit Im Fall der linearen Funktion geht es primlr zunachst um eine qualitative Aussage, d. h. besteht (im erforderlichen Bereich) ein linearer Zusammenhang oder nicht'? Fur eine Einpunktkalibrierung ist die positive Beantwortung (neben der Voraussetzung eines von Null nicht signifikant verschiedenen Ordinatenschnittpunkts)bereits ausreichend, da auf die Parameter der Regressionsgeraden im splteren Einsatz des Prufverfahrens nicht wieder zuriickgegriffen wird. Bei einer Mehrpunktkalibrierung kann dies auch gelten, hier kiinnten jedoch aus den Geradenparametern Akzeptanzgrenzen fur die aktuelle Kalibrierung im Prufverfahren abgeleitet werden (als Systemeignungstest). Der Korreltrtiorzskoe~~i~t~f (Gleichung ( 1 1)) wird ublicherweise angegeben, ist jedoch kein MaB zur (quantitativen) Beurteilung der Linearitlt 11071. Dafiir geeignet sind die Sensitivitiiten (Quotient aus Signal und Analytkonzentration), deren graphische Auftragung
6.8 Vulidierung in der phurmazeutischen Ancilytik
345
5.4
Abb. 6-22 Darstellung der Sensitivitaten als Funktion der Konzentration. Zusatzlich zum Mittelwcrt der Sensitivitalen sind die oherc und untere 2 %-Grenze eingezeichnet. Es wurden die in Ahb. 6-20 dargestellten Werte verwendet.
gegen die Konzentration im linearen Bereich des Priifverfahrens eine Parallele zur Abszisse ergeben mu13 (Abb. 6-22) [ 1081. Die Grenzen der Streuung der Sensitivitaten um einen Mittelwert oder Sollwert sind in Abhangigkeit vom betrachteten Konzentrationsbereich festzulegen. Im Bereich der Bestimmungsgrenze ist eine gro13ere Streuung akzeptabel als im Bereich der Arbeitskonzentration fur eine Gehaltsbestimmung, s. Abschnitt 3.7.2.7. Eine weitere graphische Beurteilungsmoglichkeit ist die Auftragung der Abweichung der experimentellen von den mittels Regressionsgerade berechneten Werten (ResiduenPlot). Die Residuen sollten unregelmaaig urn den Nullwert streuen. Als numerische Linearitatsparameter sind der Variationskoeffizient der Sensitivitiiten oder die Ve$uhrensstandurdubweichung (Gleichung (10)) geeignet. Letztere ist ein Ma13 fur die Abweichung der experimentellen Werte von der Regressionsfunktion und kann damit als Gutekriterium herangezogen werden. Zur Beurteilung sollte aus Grunden der einfacheren Vergleichbarkeit der prozentuale Wert verwendet werden. Dieser ist dem Variationskoeffizienten der Priizision vergleichbar. Bei einer ungewichteten linearen Regression wird die Verfahrensstandardabweichung starker von den grol3eren Konzentrationswerten beeinflufit, die Sensitivitaten dagegen von den kleineren. Vorbehaltlich dieses Wichtungseinflusses kann man sich an einer fur den betrachteten Konzentrationsbereich akzeptablen Priizision orientieren (z. B. 10-20 % an der Bestimmungsgrenze, 1-2 % bei Gehaltsbestimmungen). Als stntistischer Lineuritiitstest kann eine Prufung auf Signifikanz des quadratischen Koeffizienten bei Durchfuhrung einer Polynomregression zweiter Ordnung (quadratische
Regression) durchgefiihrt werden. Dabei wird gepruft, ob der 95 5% Vertrauensbereich des quadratischen Koeffizienten c der Gleichung y = u + h . x + c . x2 den Wert Null einschlieflt [ 1091. Im positiven Fall wird der quadratische Term zu Null und die Gleichung kann auf eine lineare Funktion reduziert werden. Eine analoge Aussage liefert der statistische Vergleich der Reststandardabweichungen der linearen und quadratischen Kalibrierfunktion mittels F-Test [ 781.
Einpunktkulihrierung und Sign$kanz des Ordinutrnschnittpunkts Dies ist ein Hinweis auf systematische Fehler. Bei Abwesenheit von z. B. Matrixeinflussen, Analytadsorption, usw. mufl der Ordinatenschnittpunkt (innerhalb der MeBwertstreuung) durch den Koordinatenursprung verlaufen. Fur die Verwendung einer Einpunktkalibrierung und die 100 %-Methode fur die Nebenproduktbestimmung ist dies (fur die Hauptsubstanz) Voraussetzung. Als Beurteilungsparameter konnen der 95 % (oder 99 c/o) Vertrauensbereich des Ordinatenschnittpunktes (Gleichung (7)) und das Verhiiltnis des Ordinatenschnittpunkts zum Analysensignal bei der Arbeitskonzentration (Gleichung (8)) verwendet werden. Wenn der Vertrauensbereich Null einschlieOt, kann der Ordinatenschnittpunkt auf dem jeweiligen Signifikanzniveau (95 o/c oder 99 %) statistisch nicht von Null unterschieden werden. Als Prozent des Analysensignals bei der jeweiligen Arbeitskonzentration ausgedruckt, sollte die GrijBe des Ordinatenschnittpunktes im Bereich einer akzeptablen Prizision liegen (z. B. 1-2 %). Beide Parameter sollten stets zusammen zur Beurteilung herangezogen werden. Im Fall einer sehr geringen Streuung der Werte um die Regressionsgerade, insbesondere bei einer ungewichteten Regression und im oberen Konzentrationsbereich, kann es vorkommen, dal3 der Vertrauensbereich nicht den Wert Null urnfafit. In diesem Fall erhalt die absolute GriiDe des Ordinatenschnittpunkts ein hoheres Gewicht in der Beurteilung. Um Wichtungseffekte auszuschlieBen, sollte bei einer Prufung auf Signifikanz des Ordinatenschnittpunkts nicht zu weit extrapoliert werden. Selbst wenn der notwendige Arbeitsbereich fur eine Gehaltsbestimmung uber Einpunktkalibrierung nur 80-1 20 % betragt, sollte fur die Linearitiit ab ca. 10 5% validiert werden. Wie aus Abb. 6-23 ersichtlich, ergibt sich bei Nichtzutreffen der Voraussetzungen der Einpunktkalibrierung ein Fehler, der mit dem Abstand der Probenkonzentration vom Standard zunimmt. Im Umkehrschlul!, kann jedoch bei genugender Ubereinstimmung zwischen Probe und Standard die Abweichung auf ein akzeptables MaB eingeschriinkt werden und eine Einpunktkalibrierung als Niiherungsverfahren eingesetzt werden. Das AusmaR des systematischen Fehlers an den Grenzen des Arbeitsbereiches sowie dessen Robustheit mu6 in der Validierung uberpruft und die Akzeptanz begrundet werden. Nortncilisirrung f 100 %Methodr) Da uber einen Bereich von drei GroOenordnungen aus den oben geschilderten Grunden die Varianzhomogenitiit in der Regel nicht gewiihrleistet ist, sind zur Anwendung der 100 %Methode bei Nebenproduktbestimmungen zwei getrennte Forderungen zu erfullen (s. Tab. 6-28): Bezuglich des Wirkstoffs mu13 die Kalibriergerade innerhalb der Fehlergrenzen durch den Koordinatenursprung verlaufen, um eine Einpunkt-Kalibrierung zu rechtfertigen. Fur das Nebenprodukt mussen die Voraussetzungen aus Tab. 6-28 ebenfalls erfullt sein.
347
6.8 klidierung in der phnrmuzeiitischen Anuljtik
.
Signal
I1
30
50
70
90
110
130
150
Konzentration
Abb. 6-23 Potentielle Fehler bei der Einpunktkalibrierung. Die Einpunktkalihricrung beruht auf einer eindeutig festgelegten Gerade, die durch den MeSwert des Standards und den Wert Null verlauft (GEP). Wenn die Vorraussetzung eines Nullpunktdurchganges nicht zutrifft (GR),ergibt sich bei Verwendung der Einpunktkalibrierung ein Fehler, der mit wachsender Entfernung des MeBwertes (ys) der Probe von dem des Standards zunimmt. xEp fehlerhaft bestimmte Konzentration fur den MeBwert .vS mit xR wahre Konzentration fur den MeBwert ys,
6.8.3.3 Richtigkeit Im Gegensatz zur Prazision wird in der ICH-Guideline fur die Richtigkeit die Alternative der sechsmaligen Bestimmung bei 100 % Testkonzentration nicht beschrieben. Im Fall eines eingeschrankten Arbeitsbereiches (z. B. Gehaltsbestimmungen oder Nebenprodukte mit sehr kleiner Spezifikationsgrenze) gibt es keine Begrundung fur eine Ungleichbehandlung von Prazision und Richtigkeit.
Vergleichsvegahren Bei Verfugbarkeit von zertifizierten Referenzsubstanzen kann der Mittelwert des zu validierenden Verfahrens gegen den vorgegebenen Gehaltswert des Referenzmaterials mittels Sollwert-?-Test gepruft werden. Gibt es etablierte unabhangige analytische Verfahren, werden die Ergebnisse uber einen Mittelwert-t-Testverglichen. In beiden Fallen mu13 in die Beurteilung einbezogen werden, dalj sich zwei unabhangige Analyseverfahren hochstwahrscheinlich in ihrer Spezifitat unterscheiden. Dies kann zu einem systematischen Einflu13 auf die Prijfergebnisse fuhren. Wenn dieser Effekt quantifiziert werden kann, ist es sinnvoll, die Mittelwerte vor dem statistischen Vergleich zu korrigieren. Falls das nicht moglich
ist, sind die Voraussetzungen fur einen statistischen Vergleich nicht gegeben und dieser ist somit gegenstandslos. In diesem Fall sollte die Plausiblitiit der Ergebnisse qualitativ diskutiert und bewertet werden.
Wiedetjindung Bei Aufstockversuchen sollte darauf geachtet werden, dal3 diese miiglichst nahe an den authentischen Bedingungen durchgefuhrt werden, um mogliche Wechselwirkungen zwischen Matrix und Analyt erkennen zu konnen. Der Idealfall ware z. B. eine direkte Herstellung des Arzneimittels mit unterschiedlichem Wirkstoffgehalt. Am anderen Ende der Skala stunde die Zugabe einer Stammlosung des Arzneistoffs zur Placebolosung. Wenn die Aufstockung auf verschiedenen Konzentrationsebenen durchgefuhrt wird, kann die Wiederfindung entweder auf jeder Ebene separat als proientuule Wiedetfindung berechnet werden, oder als lineare Regression der gefundenen Konzentration gegen die zugegebene (Wiederfindungsfunktion). Im ersten Fall kann gepruft werden, ob der 95 c/o Vertrauensbereich des Mittelwerts der Wiederfindung den theoretischen Wert von 100 umfal3t. Wahrend dieses Kriterium bei Gehaltsbestimmungen von Wirkstoffen zwingend notwendig ist, konnen fur Nebenprodukte im Bereich der Bestimmungsgrenze Abweichungen akzeptiert werden. Bei der Wiederfindungsfunktion werden Anstieg und Ordinatenschnittpunkt gegen die theoretischen Werte 1 und 0 gepruft. Die beiden Methoden konnen aufgrund des unterschiedlichen Wichtungseinflusses zu verschiedenen Ergebnissen fuhren, da im ersten Fall normiert wird, im zweiten nicht. Die Auswahl der Prozedur sollte sich nach der Quantifizierungsmethode richten: Da die Einpunktkalibrierung ebenfalls eine Normierung darstellt, ist hier die prozentuale Wiederfindung besser geeignet. Bei Mehrpunktkalibrierung sollte die Wiederfindungsfunktion gewiihlt werden. Es ist besonders darauf zu achten, dal3 bei der Uberprufung der Richtigkeit dieselbe Quantifizierungsmethode (Kalibrierung) verwendet wird, die auch im Prufverfahren zum Einsatz kommen soll. Abweichungen von den theoretischen Werten bei der Wiederfindung unter Verwendung einer Kalibrierung mit einer reinen Wirkstofflosung konnen auf Wechselwirkungen zwischen Arzneistoff und Placebobestandteilen hindeuten. In diesem Fall sollte die Kalibrierung mit Wirkstoff und Placebo durchgefuhrt werden. Ein gleichartiges Verfahren stellt die Uberprufung der Linearitlt fur den Wirkstoff und fur eine Aufstockung dar. Die Parameter beider Regressionsgeraden konnen dann, z. B. uber die Vertrauensbereiche oder mittels ?-Test miteinander verglichen werden.
6.8.3.4 Priizision Zusiitzlich zu den ICH-Niveaus ist die Bestimmung der Geriiteprlzision (System-, Injektionspriizision) sinnvoll. Dies kann durch wiederholte Messung derselben Probelosung oder mittels Doppelinjektionen (Gleichung (12)) bestimmt werden. In der HPLC beeinflussen diesen Parameter vorrangig das Injektionssystem und die Kurzzeit-FluBkonstanz der Pumpe.
6.8 Kilidierung in der pharmazeutischen Anafytik
349
Die Berechnung der verschiedenen Prazisionen kann als Varianzanalyse durchgefuhrt werden [ 1 101. Die Bezeichnung der Prazisionsebenen richtet sich nach den experimentellen Bedingungen. Der Variationskoeffizient der intra-seriellen Prazision gibt den gemittelten Wert innerhalb der verschiedenen Serien an, in die inter-serielle Prazision geht zusatzlich die Streuung zwischen den Serien ein. Bei wiederholter Messung derselben Probelosung innerhalb einer Serie und Wiederholung dieser Prozedur fur 6 Einwaagen (das entspricht 6 Serien) entspricht die intra-serielle Prazision der Systemprazision, die inter-serielle der Wiederholprazision. Bei Analyse von 6 Einwaagen innerhalb einer Serie und Variation von Zeit, Chromatographiebedingungen (Saule, mobile Phasen), LC-Gerat oder Operator zwischen den Serien entspricht die intra-serielle der (Gesamt)wiederholprazision, die interserielle der Laborvergleichsprlzision (intermediate precision). Bei Einbeziehung weiterer Laboratorien reprasentiert letztere die Ringversuchsprazision oder Reproduzierbarkeit. Durch einen Vergleich der 3 Prazisionsniveaus konnen Riickschliisse auf den fehleranfalligsten Schritt des Prufverfahrens bzw. die Robustheit gezogen werden.
Aus den jeweiligen Standardabweichungen konnen Wiederholgrenzen berechnet werden (Gleichung ( 1 3)). Diese geben die maximal zulassige Differenz an, die zwischen zwei Wiederholungen der jeweiligen Analyse auftreten darf. Dadurch ist eine einfache Uberpriifung moglich, ob unter den Routinebedingungen eine vergleichbare MeBwertstreuung auftritt. Die Wiederholgrenze bietet sich somit als Systemeignungstest-Parameter an. Auf diese Weise kann man sich auf die groBere statistische Absicherung wahrend der Validierung stutzen, ohne dieselbe Anzahl an Bestimmungen in der Routineanalytik durchfuhren zu mussen. Die Wiederholgrenze ist fur die jeweilige Prkisionsebene definiert, deren Standardabweichung zur Berechnung herangezogen wurde. Insbesondere bei Gehaltsbestirnmungen ist die Eignung entweder der Spezifikationsgrenzen oder der Verfahrensprazision zu beurteilen. Dazu kann die Verfahrensfahigkeit herangezogen werden. Zur Gewahrleistung einer zuverlassigen Quantifizierung muB der Ziel(mitte1)wert mindestens 3 Standardabweichungen von der Spezifikationsgrenze entfernt sein. Anderenfalls muB entweder die Grenze, oder das analytische Verfahren angepal3t werden. Die Notwendigkeit eines minimalen Spezifikationsbereiches von 6 Standardabweichungen kann mittels statistischer Simulation verdeutlicht werden: Es wurden 1000 Datensatze mit jeweils 3,4, 6 und 10 Werten aus einer normalverteilten Grundgesamtheit mit einem Mittelwert von 100 und einer Standardabweichung von 1 generiert. Die berechneten Mittelwerte dieser Datensatze wurden dann gegen fiktive Spezifikationsgrenzen verglichen, die 0.5, 1 , 2 usw. Standardabweichungen vom wahren Mittelwert entfernt lagen. Eine Uberschreitung der jeweiligen Spezifikationsgrenze wurde als Ergebnisablehnung (Out-ofSpecification, 00s)gewertet. Da die Daten jedoch alle zu derselben Normalverteilung mit dem wahren Mittelwert von 100 gehoren, ware dies eine unberechtigte Ablehnung, also ein falsch negatives Ergebnis. Zur Absicherung wurden die Simulationen lOOmal wiederholt. Die graphische Darstellung der Anzahl der 00s-Ergebnisse in Abhangigkeit der Entfernung der Spezifikationsgrenze vom wahren Mittelwert ist fur verschiedene Wiederholbestimmungen in Abb. 6-24 zu sehen.
350
6 Techniken und Gebiete
1000
100
10
1 0
035
1
115
2
Abstand des wahren Wertes von der Spezifikationsgrenze (in Vielfachem der Standardabweichung) ~
Abb. 6-24 Anzahl an falsch negativen Ergcbnissen bei Priifung von Mittelwerten gegen Spezitikationsgrenzen.
Mit zunehmender Anzahl der Wiederholbestimmungen nimmt naturlich durch die bessere Absicherung des Mittelwertes die Anzahl der 00s-Ergebnisse ab. Man kann nun eine maximal tolerierbare Anzahl an falsch negativen 00s-Ergebnissen festlegen, z. B. 10 von 1000 oder 1 von 1000. Daraus ergibt sich fur 3 Wiederholbestimmungen eine notwendige Entfernung der Spezifikationsgrenze vom (wahren) Mittelwert zwischen 1,5 und 2, fur 6 Wiederholbestimmungen zwischen 1,1 und 1,3 Standardabweichungen. Zusatzlich muB beriicksichtigt werden, daB die oben beschriebenen Berechnungen mit der wahren Standardabweichung durchgefuhrt wurden. Die experimentelle Standardabweichung unterliegt jedoch ebenfalls einer Wahrscheinlichkeitsverteilung. Bei 6 Wiederholbestimmungen betragt die obere Grenze des 95 % Vertrauensbereiches etwa das Doppelte der experimentellen Standardabweichung. Unter Berucksichtigung dieser zusatzlichen Variabilitat ergibt sich ein notwendiger Sicherheitsabstand von 2 bis 3 (experimentellen) Standardabweichungen zur (nachstliegenden) Spezifikationsgrenze, in Abhangigkeit von der Anzahl der Wiederholbestimmungen. Daraus ergibt sich weiterhin, daR auch die Anzahl der Wiederholbestimmungen in das Design des Prufverfahrens einbezogen werden muB. Da die Erhohung der Anzahl der Wiederholbestimmungen teilweise nicht ohne betrachtliche Aufwandserhohung moglich ist, sollte in diese Entscheidung auch eingehen, ob die damit erreichbare Verengung der Spezifikationsgrenzen einen zusatzlichen (bzw. notwendigen) Gewinn an Sicherheit oder Qualitat des Arzneimittels bringt. Eine alleinige Erhohung der statistischen Sicherheit (,,Testing into statistics") sollte nicht das Ziel eines
6.8 Vulidierung in der phamuzeutischen Anulytik
35 1
integrierten Qualitatsdesigns sein. Gleiches gilt noch in verstarktem MaB, wenn die jeweils berechneten 95 % Vertrauensbereiche gegen die Spezifikationsgrenzen gepruft werden. In diesem Fall erhoht sich der notwendige Sicherheitsabstand auf 7 Standardabweichungen fur 3 Wiederholbestimmungen bzw. auf 3 Standardabweichungen fur 6.
6.8.3.5 Nachweis- und Bestimmungsgrenze
Berechnungsrnethoden Es gibt eine Vielzahl von Berechnungsmethoden, die entweder auf dem Analysenblindwert (Leerwert) beruhen oder die Streuung der AnalytmeBwerte im geringen Konzentrationsbereich heranziehen bzw. beides kombinieren. Letztere verwenden entweder die Parameter einer Regressionsgeraden im Bereich der Bestimmungsgrenze oder beziehen sich direkt auf den Variationskoeffizienten bei Wiederholbestimrnungen. Bei den Blindwertverlfhhren wird die BerechnungsgroBe fur die Nachweisgrenze rnit dem Faktor 3 , 3 , fur die Bestimmungsgrenze mit dem Faktor 10 multipliziert. Die Berechnungsgrose kann sich aus dem Signal des Blindwertes, der Standardabweichung des Blindwertes oder der Standardabweichung des Ordinatenschnittpunktes der Kalibriergeraden (als extrapolierter Blindwert) ergeben. In den letzten beiden Fallen wird das Signal mittels Division durch den Anstieg der Regressionsgeraden in eine KonzentrationsgroBe umgewandelt (Gleichung 14) [92]. Bei direkter Verwendung der Kalibriergeraden konnen obige Faktoren ( 3 , 3 bzw. 10)rnit dem Quotienten aus der Reststandardabweichung und dem Anstieg multipliziert werden (entspricht der Verfahrensstandardabweichung)(Gleichung ( 14)) [92]. F . SD DL ; QL = h
mit
F Faktor 3,3 (Nachweisgrenze, DL) bzw. 10 (Bestimmungsgrenze, QL) SD Standardabweichung des Blindwertes, Standardabweichung des Ordinatenschnittpunktes, Reststandardabweichung der Kalibriergeraden b Anstieg der Kalibriergeraden.
DL =
2.t(95%,n-2).sy b
1
( a + y, - y,2
b2 .
c(xi
- X)2
Eine weitere Miiglichkeit besteht in der Berechnung aus dem 9.5 % Prognosebereich der Kalibriergeraden (Gleichungen ( I 5 ) und (16)) 1.541. Diesem Verfahren liegt die Uberschneidung der MeDwertstreuung zweier benachbarter Konzentrationen zugrunde. Eine SO%ige Uberschneidung der Streuung von Blindwert und Analytkonzentration wird fur die N x h weisgrenze definiert (Abb. 6-2Sa). Bei der Bestimmungsgrenze betragt die Uberlappung von Blindwert- und Analytverteilung 5 % (Abb. 6-25b). wodurch eine zuverlassige Quantifizierung gewahrleistet ist.
( k ' 2 . DL - Y)'
XBC =
h
QXX
b
DL
Konzenlration
Abb. 6-25 Hluligkcitsvertcilung von Blindwert ( H W )und Analysenwcrtc (AW) [ nach 541 a Bci einem siatistischen Fchlerrisiko von SO %, (d. h. SO%ige Uhcrschneidung von Blind- und Analysenwcrtvcrteilung. schraftierte Flachc) cntspricht dic obcre Grenze dcr 95 5T Vcrtcilung dcr Nachweisgrenx ( D L ) . b Die Bestimmungsgrenzc ( Q L )ergiht sich, wcnn das Fehlcrrisiko 5 '5 betriigt (schraflicrte FIIchc).
6.8 Vulidierung in der pharmuzeutischen Anulyrik
353
Die nach DIN [79] definierte Erfassungsgrenze entspricht der oben definierten Nachweisgrenze. Die Berechnung der Bestimmungsgrenze (nach DIN) erfolgt unter Einbeziehung einer frei wahlbaren Ergebnisunsicherheit k (Gleichung (1 7)). Die relative Ergebnisunsicherheit ist identisch mit der relativen Vertrauensbandbreite der jeweiligen Konzentrationswerte und stellt somit eine Prazision der Kalibrationsmessung dar [ 11 lc]. Der im jeweiligen Fall als akzeptabel definierten Ergebnisunsicherheit von z. B. 33 % bzw. 50 % entspricht dann ein Faktor von 3 bzw. 2 in Gleichung (17), wobei letzteres Ergebnis mit der Erfassungsgrenze identisch ist. Bei gleicher Wahrscheinlichkeit fur den Fehler 1. und 2. Art ( a = P, betragt die DIN-Nachweisgrenze die Halfte der Erfassungsgrenze. Eine ausfuhrliche Diskussion der DIN-Verfahren ist in [ 11 11 zu finden. Die Bestimmungsgrenze kann auch direkt aus der Prazision abgeleitet werden. Dazu erfolgt die Wiederholbestimmung bei abnehmender Analytkonzentration. Der Variationskoeffizient wird gegen die jeweilige Konzentration aufgetragen. Die Bestimmungsgrenze entspricht dann derjenigen Konzentration, bei der ein zuvor festgelegter Grenzwert des Variationskoeffizienten (z. B. 10 oder 20 %) uberschritten wird [89]. Infolge der grolJen Streuung der Standardabweichung im geringen Konzentrationsbereich (s. Abb. 6-26) ist eine solche Ableitung jedoch nur bei Verwendung einer genugend groRen Anzahl an Analytkonzentrationen zuverlassig.
[7
Serie 2.1 Serie 2.2
0
Serie 2.3
0
Serie 1.1
0
Serie 1.4
+ Serie 1.2 Serie 1.5
0 Serie 1.6
1
0,1 Analytkonzentration (vg I ml )
I
A
Serie 3.1
A
Serie 4.1
A
Serie 5.1
1
Abb. 6-26 Reproduzierbarkeit der Bestimmung des Variationskoeffizienten im Bereich der Bestimmungsgrenze. Es wurden jeweils 6 Wiederholinjektionen durchgefuhrt. Die erste Ziffer der Serienbezeichnung gibt das verwendete LC-System an, die zweitc Ziffer die Wiederholungsserie. Die 5 Wiederholungen bei LC-System 1 und die 3 bei System 2 verteilten sich uber einen Zeitraum von ca. 9 Monaten.
I
0,45 I
Berechnungsmethoden
SignaCRauschVerhaltnis Standardabw. Ordinatenschn Reststandardabweichung 95 % Vertrauensbereich
Prazision
(5%Variations-
Serie 1
Serie 2
koeff.)
Abb. 6-27 Verschicdene Berechnungsvarianten der Bcstimmungsgrenze. Die heiden dargestcllten Gruppen \ind Wicderholungcn an demselben LC-System (Erlauterungen s. Text).
Reproduzierhurkeit der Bestimmungsgrenze In Abb. 6-27 sind die beschriebenen Berechnungsvarianten der Bestimmungsgrenze dargestellt. Da groRe Unterschiede auftreten, mu13 bei der Angabe einer Bestimmungsgrenze stets das Berechnungsverfahren deutlich gemacht werden. Die auf dem Blindwert beruhenden Methoden tendieren zu unrealistisch niedrigen Werten. Da die Kalibrierkurvenverfahren auf der ungewichteten linearen Regression beruhen, darf der Konzentrationsbereich das Zehnfache der Bestimmungsgrenze nicht uberschreiten, uni die Homogenitlt der VarianZen zu gewahrleisten. Auch bei Wiederholung der Bestimmung treten deutliche Unterschiede auf (Abb. 6-28). Dies zeigt, dal3 Nachweis- und Bestimmungsgrenze Momentaufnahmen sind, die stark vom System abhangig sind (Detektorart, Alter der UV-Lampe usw.), wie auch von der Berechnungsmethode. Da der experimentelle Aufwand recht betrachtlich ist, stellt sich die Frage, wie sinnvoll eine solche Validierung - eventuell noch als ,,Intermediate Quantitation Limit" - zur Feststellung der allgemeinen Bestimmungsgrenze des Prufverfahrens 1st. Der konkrete Wert der Bestimmungsgrenze sowie besonders seine zuverliissige Reproduzierbarkeit hat beim Methodentransfer oder bei der Festlegung von Berichtsgrenzen fur Nebenprodukte [ 93,941 grol3e Bedeutung. ,,Allgemeinr " Bestimmungsgrenze des Priifverfclhrens
Aus den oben dargelegten Grunden sollte die ,,allgemeine" Bestimmungsgrenze des Prufverfahrens unter Berucksichtigung der Anforderungen festgelegt werden. Sie mu13 minde-
355
6.8 Widierung in der pharmuzeutischen Ancilytik
t 1.2
1.1
Sign: . R a m
1.3
1.4
1.5
1.6
2.1
2.2
abweichung
2.3
3.1
4.1
5.1
0 95% Vertrauensbereich
Abb. 6-28 Reproduzierbarkeit der Bestimmungsgrenze. Die erste Ziffer der Serienbezeichnung gibt das verwendete LC-System an, die zweite Ziffer die Wiederholungsserie. Die 5 Wiederholungen bei LC-System 1 und die 3 bei System 2 verteilten sich uber einen Zeitraum von ca. 9 Monaten. Die jeweilige Bestimmungsgrenze wurde nach 3 verschiedenen Methoden errnittelt (Erlauterungen s. Text).
stens 3 Standardabweichungen von der Akzeptanzgrenze entfernt liegen, um eine zuverlassige Quantifizierung zu ermoglichen (Verfahrensfahigkeit). Als Richtwert (und um die grofiere Variabilitlt der Streuung in diesem Konzentrationsbereich zu berucksichtigen) kann die Bestimmungsgrenze auch auf 50 % der Akzeptanzgrenze gesetzt werden, d. h. bei einer Begrenzung des Nebenproduktes auf 0,l % sollte die Bestimmungsgrenze mindestens 0,05 % betragen. Im Rahmen der Validierung wird dann mit einem der beschriebenen Verfahren uberpriift, ob diese Bestimmungsgrenze zuverlassig eingehalten werden kann. Ein solches Vorgehen wird auch im Entwurf des allgemeinen USP-Kapitels zur Validierung empfohlen [112]. Als sehr effziente Variante bietet sich hier die Erfassung der Prazision der entsprechenden Nebenprodukte im Bereich der definierten Bestimmungsgrenze an. Wenn ein akzeptabler Variationskoeffizient erhalten wird (z. B. 10-20 %), kann die Bestimmungsgrenze als validiert betrachtet werden. Als Proben konnen authentische oder mit den entsprechenden Nebenprodukten aufgestockte Chargen eingesetzt werden. Bei identischen Methoden zur Gehalts- und Reinheitsbestimmung konnen die Ergebnisse aus der Prazisionsbestimmung des Wirkstoffs entnomrnen werden. Bei der Spurenanalyse mit taglicher Kalibrierung kann es demgegenuber sinnvoll sein, jeweils eine aktuelle Bestimmungsgrenze zu berechnen und das Berichten der Ergebnisse darauf abzustimmen. Dies durfte jedoch kaum auf die pharmazeutische Analytik zutreffen, da hier Konflikte mit dem Spezifikationskonzept (welches starre Grenzen vorsieht) vorprogrammiert sind.
6.8.3.6 Robustheit Auch hier besteht einige Konfusion, da in der USP zwischen ,,Robustness" und ,,Ruggedness" unterschieden wird, und es kommt auch zu Uberschneidungen mit dem Validierungselement Priizision. In der 1CH-Guideline wird die Anwendung eines faktoriellen Designs empfohlen 192, 1131, d. h. die systematische, kombinierte Variation verschiedener Faktoren mit statistischer Auswertung. Ein solches Vorgehen ist experimentell recht aufwendig und der praktische Nutzen erscheint im Einzelfall aufgrund der Wechselbeziehung der Faktoren untereinander sehr begrenzt. Auaerdem kann der au13erst wichtige Faktor Zeit (Langzeitverhalten des Systems) nicht erfaBt werden. In praktisch sehr relevanter Weise kann diese Information retro.spkti\~BUS Annlysenserien uber einen Iiingeren Zeitraum erhoben oder im Laufe der Zeit ergiinzt werden. Dafur bieten sich die Ergebnisse des Systemeignungstests an. Neben der MeBwertstreuung (z.B. aus Doppelbestimmungen berechnet, Gleichung ( I 2)) kann hier auch die Reproduzierbarkeit von Trennfaktoren usw. betrachtet werden. Die Auswertung kann bei ausreichender Datenlage in Form von Qualitltskontrollkarten (s. Abschnitt 8) erfolgen. Ein quantitatives Ma13 fur die Robustheit eines Prufverfahrens sind ebenfalls die verschiedenen Niveaus der Priizision bzw. deren Vergleich (s. Abschnitt 6.8.3.4). Die erforderliche Robustheit ergibt sich aus dem geplanten Einsatz des Prufverfahrens, woran sich auch die Uberprufung orientieren sollte, z. B. eine Inter-Laborpriizision bei beabsichtigtem Methodentransfer. Das Konzept der Robustheit sollte um den Begriff ,,Ju.stierhLrrkrit ergiinzt werden, da von wesentlicher Bedeutung ist, mit welchen Moditikationen bei Bedarf der Systemeignungstest erfiillt wird. Dies sollte auch in der Prufanweisung beschrieben werden. Vorschliige zum erlaubten Rahmen dieser Modifikationen wurden kurzlich veriiffentlicht [ 114,l 1.51. Basierend aufder Methodenentwicklung sollten naturlich sehr sensitive Bereiche (z. B. pH-Wert der mobilen Phase, Detektionswellenllnge usw.) vermieden werden, urn den jeweiligen aktuel len Justierungsaufwand zu begrenzen. "
6.8.3.7 Systemeignungstest
Wiihrend die Validierung den prinzipiellen Nachweis der Eignung eines Prufverfahrens liefert, weist der Systemeignungstest die Eignung eines bestimmten Systems zu einem bestimmten Zeitpunkt nach. Die fur die Zuverlsssigkeit kritischen Faktoren, die entweder aus allgemeinen Uberlegungen abgeleitet oder in Verfahrensentwicklung und -validierung identifiziert werden kiinnen, mussen mittels geeigneter Parameter einschlieBlich Akzeptanzgrenzen kontrolliert werden. Diese konnen aus den Validierungsdaten abgeleitet werden. Da im Rahmen der Validierung oft Daten mit einem gut konditionierten System erhoben werden, die mehr oder weniger Momentaufnahmen darstellen, sollte dies beim Festlegen der Akzeptanzgrenzen berucksichtigt werden.
6.8 Vulidierung in der phumuzeutischen Anulytik
357
Bestandteile eines Systemeignungstests konnen z. B. sein: Vergleich mit einem Testchromatogramm oder einem Referenzstandard Bodenzahl, Tailing, Peakasymmetrie - Trennfaktoren Retentionszeiten - Systemprazision - Wiederholgrenzen - Linearitatsuberpriifung (Semitivitaten) Verfahrensstandardabweichungen(bei Mehrpunktkalibrierung) Nachweis- bzw. Bestimmungsgrenzen. -
6.8.3.8 Rationelle Validierung Zentraler Punkt einer effektiven Validierung ist naturlich deren Planung und das Design der experimentellen Untersuchungen. Dabei mussen die wirklich notwendigen Parameter abgedeckt und in einer fur die Routineanalytik relevanten Art und Weise erhoben werden, wie z. B. bei der Bestimmungsgrenze diskutiert (s. Abschnitt 6.8.3.5). Soweit sinnvoll und moglich, sollten verschiedene Validierungselemente kombiniert in gemeinsamen experimentellen Serien uberpriift werden (z. B. Prazision und Richtigkeit (Wiederfindung), Linearitat und Richtigkeit (Wiederfindung), Prazision und Bestimmungsgrenze). Es bietet sich ebenfalls eine ,,fortschreitende" Validierung an, in der nach Erhebung eines Basisdatensatzes verschiedene Validierungselemente wie intermediate precision/ Reproduzierbarkeit oder Robustheit aus der Routineanalytik extrahiert werden. Ein solches Konzept, erweitert um eine Abstufung der inhaltlichen Anforderungen bietet sich auch im nicht durch die ICH-Guideline abgedeckten Bereich an (s. Abschnitt 6.8.3.9). Der Umfang der Prazisionsstudien sollte sich am geplanten Einsatz des Prufverfahrens orientieren. Bei Bedarf kann die Validierung der Prazision in den Methodentransfer einbezogen bzw. durch diesen erganzt werden. Zur effektiven Auswertung und Dokumentation konnen Software-Programme eingesetzt werden. Da im pharmazeutischen Bereich nur eine geringe Datenanzahl gefordert wird, sollte eine statistische Auswertung vorsichtig interpretiert werden. Statistische Tests sind als Entscheidungshilfe fur den Analytiker zu verstehen und durfen nicht zu einer automatischen Bewertung des entsprechenden Validierungselementes fuhren [ 1 161. Die Bewertung muR in der Verantwortung des Analytikers bleiben.
Revalidierung Vermutlich aus Grunden der Komplexitat wird dieser Begriff in der ICH-Guideline nicht diskutiert, im Gegensatz zur sehr detaillierten Behandlung in der kanadischen Guideline [89]. Zunlchst ist eine eindeutige Begriffsbestimmung und -abgrenzung erforderlich. Revalidierung sollte nicht auf Modifizierung bzw. Anderung von Prufverfahren angewendet werden. Modifizierung wird, wie auch in [ 1 14, 1151 diskutiert, von der ursprunglichen Validierung abgedeckt oder im Bedarfsfall durch den Systemeigungstest uberpriift. Bei Variationen, die zu einer Anderung fuhren, ist eine vollstandige Validierung erforderlich, da diese immer mit dem jeweiligen Prufverfahren gekoppelt ist. Gegebenenfalls kann man
begrunden, wenn bestimmte, durch die Anderung nicht beeinflufite Teile iibernomrnen werden. Somit sollte Revalidierung als Nachweis dafiir definiert werden. daD sich das Prufverfahren immer noch, oder besser kontinuierlich im validierten Zustand befindet. Dies erfolgt am gunstigsten in einer geeigneten Dokumentation des Systemeignungstests, z. B. in Form von Kontrollkarten (s. Abschnitt 8).
6.8.3.9 Validierungskonzept wahrend der Arzneimittelentwicklung und -herstellung
Die Anforderungen der ICH-Guidelines beziehen sich auf den Zeitpunkt der Zulassung und auf die Prufung von Arzneistoffen und -formen. Zusiitzlich ist bei der analytischen Validierung der GMP-Aspekt zu berucksichtigen. Darunter fallen analytische Verfahren, die fur Inprozetikontrollen (IPC), zur Qualitltskontrolle von Hilfs-, Ausgangs- und Zwischenprodukten oder wiihrend der Arzneimittelentwicklung eingesetzt werden. Die ICHGuidelines sollten hier eine Orierztierung darstellen, wobei Anforderungen und Dokumentationsaufwand stufenweise in Abhangigkeit vom Herstellungs- bzw. Entwicklungsstadium gesteigert werden konnen.
Validierungsstufe I bezieht sich auf analytische Verfahren zur Prufung von Enwicklungsprodukten irn Labormaastab bzw. von Hilfs- und Ausgangsstoffen und auf Inprozel3kontrollen. Spezifitiit kann an vorliegenden Chargen und gestreBten Proben belegt werden. Zur Uberprufung der Linearitiit ist die Verwendung von Analytverdunnungen ausreichend (Detektorlinearitiit). Die Richtigkeit wird aus Spezifitiit, Linearitat und Priizision abgeleitet. Es wird eine Systempriizision bestirnmt. Nachweis- und Bestimmungsgrenze werden visuell festgelegt. Die Ergebnisse der Untersuchungen werden dokumentiert und in einer Zusammenfassung bewertet. ValidierungsstufeI1 wird angewendet auf Verfahren fur qualitatsbeeinflussende Ausgangsstoffe, fur Zwischenprodukte sowie im Technikumsmaastab der Entwicklung. Die Spezifitiit wird an verschiedenen Chargen, mit relevanten Nebenprodukten und Stabilitatsmustern uberpruft. Es konnen auch Methoden zur Uberprufung der Peakreinheit angewendet werden. Die Linearitatsprufung erfolgt fur den Detektor oder das Analyseverfahren an mindestens 5 Konzentrationen. Die Richtigkeit wird abgeleitet oder quantitativ mittels 3 Bestimmungen bei einer Konzentration uberpruft. Es erfolgt eine Bestimrnung der WiederholprPzision. Abhangig vorn Einsatz des analytischen Verfahrens kann auch die intermediate precision ermittelt werden. Nachweis- und Bestirnmungsgrenze werden visuell festgelegt oder mit einer quantitativen Methode ermittelt (z. B. aus der Prlzision oder Linearitiit). Die Ergebnisse sollten in einer Zusamrnenfassung fur jedes Validierungselement kurz diskutiert und bewertet werden. Die Validierungsstufe 111bezieht sich auf den ProduktionsmaBstab wiihrend der Entwicklung und entspricht den ICH-Anforderungen. Ein formaler Bericht faBt die Validierungsstudien zusammen und begrundet deren Design. Die Ergebnisse werden detailliert diskutiert und bewertet.
6.8 Rilidierung in der pharrncizeuiischen Annlyiik
359
6.8.3.10 Validierung als integraler Teil der Qualitatssicherung Validierung analytischer Prufverfahren sollte als Teil eines umfassenden Konzeptes zur Sicherung der Qualitat, Wirksamkeit und Sicherheit von Arzneimitteln betrachtet werden. Uber den formalen Aspekt der Zulassungsunterlagen hinaus ist die Qualitat und Zuverlassigkeit eines Prufverfahrens von entscheidender Bedeutung bei der Freigabe von Arzneimitteln. Prufergebnisse, die auBerhalb der festgelegten Spezifikationsgrenzen liegen, bedeuten zumindest einen hohen Uberpriifungsaufwand, konnen aber auch zur Ablehnung der Charge fuhren. Wenn dies auf mangelnde Eignung des Prufverfahrens bzw. der Spezifikationsgrenzen zuruckzufuhren ist, summiert sich schnell ein betrachtlicher finanzieller Schaden. In der pharmazeutischen Analytik beinhaltet das Priifverfahren oft, im Fall der Prufung des Arzneistoffs fast immer, die grol3te Variabilitat. Aus diesem Zusammenhang ergibt sich zwangslaufig auch die Berechtigung einer Validierung unter dem Kostengesichtspunkt. Aufgabe der Validierung ist es, fur den Routineeinsatz des Prufverfahrens relevante und zuverlassige Informationen zu generieren. Daraus konnen Spezifikationsgrenzen abgeleitet werden bzw. kann geschluBfolgert werden, ob notwendige Grenzen zuverlassig einzuhalten sind. Weiterhin konnen Bereiche definiert werden, innerhalb derer kritische Verfahrensparameter gehalten werden mussen, welche dann im Systemeignungstest die aktuelle Validitat des analytischen Verfahrens belegen. Diese Risikominimierung ist umso wirkungsvoller, je besser es gelingt, die kritischen Punkte eines Verfahrens in der Validierung abzudecken. Dariiber hinaus spielen auch das gewahlte Priifverfahren (Probenvorbereitung, Analysenmethode, Quantifizierung usw.) und die Kombination der verschiedenen Prufverfahren zur Gesamtspezifikation des Arzneistoffs bzw. -mittels eine wesentliche Rolle.
6.9
Forderungen der ICH zur Validierung in der Pharmaindustrie am Beispiel der HPLC
Joachirn Hauswald, Bayer AG, Wuppertal
Vor dem routinemiiDigen Einsatz einer analytischen Methode mu13 die Validierung erfolgt sein. Beispielhaft wird nachfolgend eine fiktive Methodenvalidierung aus dem Bereich der pharmazeutischen lndustrie vorgestellt. In diesem Bereich liegen die hochsten Anforderungen der Registrierbehorden vor.
6.9.1 Praktische Durchfuhrung Diese Zusammenstellung zeigt den notwendigen Mindestumfang der Validierung einer HPLC-Methode zur Bestimmung von Wirkstoff und Nebenkomponenten. Schon wahrend der Methodenentwicklung wird durch Laboruntersuchungen nachgewiesen, dafi die Eigenschaften der Methode der beabsichtigten analytischen Anwendung gerecht werden. Vor Beginn der Validierung sollten folgende Punkte erfullt sein: Die LU validierende Methode muB in schriftlicher Form vorliegen Ein Validierungsplan wird erstellt Die benutzten Gerate mussen qualifiriert sein (geeigneter Funktionstest). -
6.9.1. I
Spezifitiit
Der Nachweis der Spezifitat erfolgt durch Chromatogramme und eine Liste aller Retentionszeiten bzw. relativen Retentionszeiten der gepruften - Einsatzstoffe Nebenprodukte - Abbauprodukte - des Hauptproduktes - gegebenenfalls Liisungen von Packmitteleluaten und Restliisungsmitteln. Sind die Analyten als Reinsubstanz vorhanden, so sollten sie. im Konzentrationsbereich der Priifspezifikation, einzeln chromatographiert werden. Sofern miiglich, ist die Peakreinheit des/der Analyten als rusatzliches Selektivitiitskriterium, z. B. durch Dioden Array Detektion oder eine Lweite chromatographische Methode (HPLC oder GC), zu uberprufen. Abschliefiend wird ein Belegchromatogramm erstellt. In diesem sollten alle Analytcn im Konzentrationsbereich der Spezifikation ausgewiesen sein.
6.9 Forderungen der ICH zur Validierung in der Phurrnaindustrie
36 1
Zur Auswertung gehoren: - ein oder mehrere Chromatogramme von allen zu validierenden Analyten, mit Peakzuordnungen und, wenn notwendig, Konzentrationsangaben. - eine Tabelle der Retentionszeiten oder, unter Bezug auf das Hauptprodukt, die relativen Retentionszeiten. Angaben uber Auflosungen, Peaksymmetrien und theoretische Trennbodenzahlen sind bei Bedarfzu rnachen und ebenfalls zu belegen. So ist z. B. die Forderung einer Mindesttrennbodenzahl von 5000 bei einer Trennung von Racematen mit a = I , I sicher angebracht und muB nachgewiesen werden. Bei einer normalen Reversed Phase Chromatographie mit a = 1,5 und groBer genugt normalerweise eine Mindesttrennbodenzahl von 3000-3500 und ist damit sicher nicht so kritisch zu betrachten.
6.9.1.2 Linearitat Die Linearitat muB in dem in der Prufungsvorschrift festgelegten Arbeitsbereich gewahrleistet sein.
1. Wirkstoff/Hauptprodukt Der Bereich 80 % - 120 % der in der Prufungsvorschrift angegebenen Konzentration ist mindestens zu uberprufen. Es werden mindestens 5 Konzentrationen, welche die Konzentration der Prufungsvorschrift einschlieljt, durch z. B. getrennte Einwaagen oder Aliquotierung, hergestellt. Die Probenvorbereitung erfolgt nach den Angaben der Prufungsvorschrift. Die einzelnen Losungen sollten mindestens 2 ma1 chromatographiert werden. Fur die statistische Auswertung sind moglichst gleichmaljige Abstande zwischen den MeBkonzentrationen notwendig. Die Auswertung umfaljt die graphische Darstellung der MeBwerte als Funktion der Konzentration, die resultierende Regressionsgerade rnit deren Vertrauensbereich, den Achsenabschnitt, die Steigung der Geraden und die Reststreuung um die Regressionsgerade. An dieser Stelle wie auch im weiteren Verlauf der Validierung konnen kommerzielle Statistik-Programme oder Validierungsprogramme eine wertvolle Hilfe sein, siehe Anhang.
2. Nehen- und Ahhauprodukte
Der Bereich von der Bestimmungsgrenze (BG) bis mindestens 120 % der Grenze der Spezifikation sol1 uberpruft werden. Es werden mind. funf Konzentrationen von der Bestimmungsgrenze bis mind. 120 % der Grenze der Spezifikation durch z. B. getrennte Einwaagen oder Aliquotierung hergestellt. Fur die statistische Auswertung sind moglichst gleichmaBige Abstiinde zwischen den MeBkonzentraiionen notwendig. Die Probenvorbereitung erfolgt nach den Angaben der Prufungsvorschrift. Die einzelnen Losungen werden mindestens zwei ma1 chromatographiert. Die Ergebnisse werden statistisch analog zu Punkt 1. ausgewertet.
6.9.1.3 Arbeitsbereich Der gultige Arbeitsbereich ergibt sich aus der bewiesenen Linearitiit bei nachgewiesener Priizision und Richtigkeit.
6.9. I .4 Priizision Im Rahmen der Prazision betrachtet man die Wiederholbarkeit. die laborinterne Priizision und die Vergleichsprazision.
I. Wirderliolhtrrkeit a) Wiederholbarkeit des Gerates
Dieser Punkt wird in der ICH-Guideline nicht gefordert! An dieser Stelle kann man mit geringem Aufwand den Nachweis der Prazision des Gerates (Geriite-Qualifikation) fuhren. Die Priizision des Geriitesystems wird durch Mehrfachinjektion der gleichen Prutliisung bzw. Probe (17 2 6) unter gleichen apparativen Bedingungen zeitlich zusanimenhiingend bestimmt. Jede einzelne Bestimmung ist nach den Angaben der Prufungsvorschrift durchzufuhren d. h. bei Hauptprodukten normalerweise auf dem 100 %-Niveau. Bei Nebenprodukten wird vorzugsweise an der Spezifikationsgrenze gearbeitet. AnschlieBend erfolgt die statistische Auswertung der Ergebnisse. Als Ma13 der Wiederholbarkeit des Geriites (Prazision des Geriites) sind anzugeben: die Wiederholstandardabweichung - der Variationskoeffizient - 2 s - bzw. 3 s-Interval1 der Meljwerte - Vertrauensintervall des Mittelwertes ( a = 0,05). -
b) Wiederholbarkeit der Methode
Zur Ermittlung der Wiederholstandardabweichung sind mindestens sechs unabhiingige Bestimmungen erforderlich. Unabhiingig heifit: Fur jede der Bestimmungen ist eine eigene Kalibrierung notwendig. Anders formuliert: Jede der mindestens 6 Bestimmungen ist so durchfuhren, als wenn nur eine Bestimmung gefordert ware. Kalibrierliiaungen und Pruflosungen sind wechselweise nach den Angaben der Prufungsvorschrift zu chromatographieren. Eine zweite Moglichkeit besteht in der Bestimmung von je drei Werten (dreifach Injektion) auf mindestens drei Konzentrationsniveaus innerhalb des gultigen Arbeitsbereiches. Als Ma13 der Wiederholbarkeit der Methode (Priizision der Methode) sind anzugeben: -
die Wiederholstandardabweichung der Variationskoeffizient 2 .s- bzw. 3 s-Interval1 der MeBwerte Vertrauensintervall des Mittelwertes ( a = 0,05).
6.9 Forderurrgen der ICH zur Vulidierung in d e r Phurrnuindiutri~
363
2. Laborinterne Prazision Die Bestimmung der laborinternen (intermediaren) Prazision wird analog der Bestimmung der Wiederholbarkeit der Methode (s. Punkt 1.b), durchgefuhrt. Dabei sol1 der EinfluB von verschiedenen Personen, verschiedenen Geraten und unterschiedlichen Arbeitstagen auf das Ergebnis gepruft werden. Der EinfluB dieser Variationen muB nicht einzeln, sondern kann in Summe nachgewiesen werden. Es genugt z. B. wenn eine zweite Person an einem anderen Tag, moglichst an einem zweiten Gerlt, die Vergleichswerte erzeugt. Die Mittelwerte der MeBreihen sind rnit dem t-Test auf Abweichung zu prufen.
3. Vergleichsprazision Die Bestimmung der Vergleichsprazision ist nur in Sonderfallen, wie z. B. vor der Aufnahme der Methode in eine Pharmakopoe, notwendig. Die Ergebnisse mehrerer Laboratorien sind statistisch zu vergleichen (Ringversuch).
6.9.1.5 Richtigkeit
Wirkstoff/Hauptprodukt und Nehenprodukte Die Richtigkeit eines Analysenverfahrens zeigt den Grad der Ubereinstimmung zwischen dem Wert, der entweder als richtiger oder als akzeptierter Referenzwert gilt, und dem gefundenen MeBwert. Folgende Methoden zur Bestimmung der Richtigkeit sind moglich: a) Durch den Vergleich rnit den Ergebnissen einer zweiten Methode mit bekannter Richtigkeit, z. B. einer Pharmakopoe-Methode. b) Durch die Wiederfindung von zugesetzten Mengen an Analyten. c) Durch das Wiederfinden von Mengen an Analyten, die Placebos zugesetzt wurden. d) Durch Analyse eines externen Standards mit bekannter Reinheit, z. B. einer Pharmakopoe-Referenzsubstanz. 1st keine der angegebenen Moglichkeiten a) bis d) durchfiihrbar, so mu13 die Richtigkeit der Methode durch eine Plausibilitatserklarung belegt werden. Wenn Daten iiber die Linearitat und uber die Spezifitat vorliegen ist dies moglich. So gilt z. B. eine spezifische Methode mit nachgewiesener Linearitat, bei der die Regressionsgerade durch den Ursprung geht (Abweichung max. ? 3 O/o bezogen auf die hochste gemessene Konzentration des gultigen Arbeitsbereiches), als richtig.
Auswertung: zu a) + d) Statistische Auswertung mit dem t-Test. Die Mittelwerte sollten nicht signifikant voneinander abweichen, andernfalls mu6 diese Abweichung schriftlich begriindet werden. zu b) + c) Statistische Auswertung der prozentualen Wiederfindungsrate der zugesetzten Menge. Das Vertrauensintervall des Mittelwertes sollte 100 % enthalten.
6.9. I .6 Nachweisgrenze Die ausgewahlten Konzentrationen der einzelnen Komponenten sollten sich in einem relevanten Bereich bewegen. Fur die statistische Auswertung sollten pro Komponente mindestens zehn MeRwerte (z. B. Doppelinjektion auf funf Konzentrationsniveaus) ermittelt werden. Eine weitere Moglichkeit ist nach ICH-Guideline das SignallRausch Verhaltnis. Aim~.ertutig:
a ) Die Auswertung erfolgt mit einer vorgegebenen statistischen Sicherheit von 95 c/c nach DIN. b) Basierend auf dem Signal zu Rauschverhiiltnis nach ICH-Guideline bzw. USP. Das 3fache Signal des Detektorrauschens wird als NG akzeptiert.
6.9. I .7 Bestimmungsgrenze
Die Durchfuhrung tindet wie unter Abschnitt 6.9. I .6 statt. Aus~.~ert~ing:
a) Die Berechnung der Bestimmungsgrenze (BG) erfolgt nach DIN. b) Das 10-fache Signal des Detektorrauschens wird als Bestimmungsgrenze akzeptiert (vergleiche Abschnitt 6.9).
6.9.1.8 Robustheit
Einflusse durch Veranderungen der Methodenparameter, die das Ergebnis nicht beeintrachtigen durfen, sind in schriftlicher Form in einer open-end-Liste zu beschreiben. Die openend-Liste sollte die Erfahrungen der Methodenentwicklung bzw. der Methodenoptimierung beinhalten. Auffiilligkeiten im spiiteren Routineeinsatz sind nachzutragen. Die Grundforrlrrungcw sind Aussagen uber die Stabilitiit der Pruflosung, die Verwendbarkeitsdauer des Elutionsmittels und die Verwendbarkeitsdauer der sonst benutzten Losungen. Zusiitzlich sind t i ~ ~ t h o r l r t ~ . s p r ~ ;Aussagen ~ s c h e zu machen. HPLC-typisch sind L . B. Aussagen uber den Eintlulj von Anderungen in der Zusammensetzung des Elutionsmittels, von pH-Wert-Anderungen der mobilen Phase, von verschiedenen Trennsaulen (Chargen und/oder Herstellern), von unterschiedlichen Temperaturen und unterschiedlichen Flul3raten auf die Retentionszeit, die Auflosung und die PeaktlSchen.
Hin wris Nach Anderungen an der Methode werden, je nach Art der Anderung, i m Umfang unterschiedliche, Revalidierungen notwendig.
6.9 Forderungen der ICH zur Vrtlidierung in der Pharmaindustrie
365
Tab. 6-32 Revalidierungsbedarf abhangig von den Veranderungen in dcr Methode.
Art der Anderung
Linearitat
Spczifitat Richtigkeit Prazision Nachweis-/ Robustheit Bestim- der HPLCmungs- Methode* grenze
Probenaufarhei tung : 1. Aufarbeitungsverfahren 2. Extraktionsmittel
-
-
X
X
X
MeBkonzcntration
X
Saulentyp
-
-
X
X X
X
X
X
X
X
X
X
X
X
-
-
X
X
Detektionswellenlange
X
X
-
-
X
X
Qualitative/quantitative Zusammensetzung des
X
X
-
X
X
X
Eluenten
*
Nur hei Anderungen, die durch die Validierung nicht abpedeckt sind.
Mogliche Anderungen sind z. B.: Anderungen der Probenaufarbeitung (z. B. verwendetes Losungsmittel), - Anderungen der MeBkonzentration, - Anderungen des Typs des Saulenmaterials, - die Anderung der Detektionswellenlange, - die qualitative sowie quantitative Anderung der Zusammensetzung des Eluenten aul3erhalb des unter Robustheit der Methode gepriiften Bereiches. -
Folgende Priifungen sind bei den aufgefuhrten Anderungen einer HPLC-Methode im Rahmen einer Revalidierung erneut durchzufuhren, s. Tab. 6-32. Die hierbei erhaltenen Ergebnisse sind nach Umstellung auf die neue Methodenvariante im Validierungsdokument zu beschreiben.
6.9.1.9 Systemeignungstest (System Suitability Testing) Es konnen z. B . Anforderungen fur nachfolgende Parameter festgelegt werden: - Mindestauflosung zwischen 2 benachbarten Peaks - Mindest-Peaksymmetrie bzw. ein Symmetriebereich - Grenzen fur die Responsefaktoren - Mindest-Trennbodenzahlen - Aussagen uber die Qualitat der Kalibrierkurve gemacht werden
6.9.2 Dokumentation Siimtliche bei der Validierung gewonnenen Daten sind entsprechend den GMP-Richtlinien zu dokumentieren und aufiubewahren. Die Ergebnisse der Validierung sind schriftlich zu bewerten. Graphiache Darstellungen, z. B. der Linearitiit, vervollstiindigen die Bewertung. Bei Bedarf ist ein Registrierdokument ,,Validierung der Analysenmethode" zu erstellen bzw. sind die gewonnenen Daten in ein bestehendes Dokument zu integrieren.
6.9.3 AbschlieBende Bemerkungen Diese beispielhafte Validierung erhebt naturlich nicht den Anspruch auf die alleinige richtige Sicht, sondern zeigt eine Vorgehensweise als Vorschlag zur Umsetzung der Forderutigen der ICH-Richtlinie. Der hier gewahlte Umfang zeigt den i n der Pharmazeutischen Industrie geforderten Mindestaufwand. Dieses Beispiel gibt dem Praktiker hoffentlich Anregungen und dem Ungeubten etwas Hilfestellung bei der Umsetzung von Methodenvalidierungen in der Pharmaindustrie. Den in anderen Bereichen tiitigen Lesern sol1 sie Hinweise auf die praktische Umsetzung von geforderten Methodenvalidierungen geben. Die sicher als teilweise uberzogen erscheinenden Forderungen mussen in diesen Bereichen naturlich nicht vollstiindig umgesetzt werden, siehe auch Abschnitt 2.1.4.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Teil .. D Okonomie bei Validierungen Mit Beitragen von:
Aventis, NOVIA, Schering
7
Umfang, Ablaufschema, zeitlicher Ablauf und Kosten der Validierung
Stavros Kromidas, NOVIA GmbH, Saarbriicken
7.1
Umfang einer Validierung
,,Wieviel Validierung braucht der Mensch?" oder noch eindeutiger: ,,Was ist das Minimum an Validierung, das unbedingt notwendig ist? Diese vollig berechtigte Frage beschaftigt
aus verstandlichem Grunde viele Analytiker. Wir konnen uns an die Beantwortung dieser Frage herantasten, indem wir noch einmal das Ziel einer Validierung vor Auge halten. Es geht dabei um die Frage der Eignung einer Methode. Diese Betrachtungsweise ist aber rein fachlich-analytisch. Denn die Validierung einer Methode ist letzten Endes eine der Voraussetzungen fur eine ganz andere Notwendigkeit: das Produkt ,,analytische Dienstleistung" bzw. mit der Hilfe der analytischen Dienstleistung ein gegenstandliches Produkt verkaufen zu konnen. Das ist das eigentliche Ziel eines Labors! Die Umsetzung dieses Ziels wird unter anderem vom Kunden, vom FDA-Inspektor, vom Gutachter der Akkreditierungsstelle, vom Regierungsprasidium stark beeinflubt. Zur Beantwortung der Frage ,,wieviel" an Validierung (aber auch der nach dem ,,wie" und ,,wie oft") sind drei Aspekte zu beriicksichtigen und in Balance zu bringen.
-
Analytische Vernunft inklusive technischer Miiglichkeiten Kosten Zwiinge von innen und aul)en.
Der EintluB von auRen Der dritte Aspekt ist schnell behandelt: der jeweilige Entscheider hat das letzte und gewichtigste Wort. So bekommt z. B. der mhlende(!) Kunde .,seine" Validierung so, wie er sie gerne haben miichte - wenn gewunscht mit 16 MeBwerten zur Bestimmung der WiederholpriiLision. . . . Selbstverstandlich ist die Aufgabe des Labors, dem Geschaftspartner beratend m r Seite LU stehen. Sol1 ein Medikament in den USA verkauft werden, sind die Richtlinien der International Conference of Harmonisation (ICH) bindend. Hat ein Labor nur als zugelassenes Labor eine Uberlebenschance, so ist den Vorgaben der entsprechenden Behorde Folge zu leisten usw. Auf einer Skala der tatsiichlichen Entscheidungsmacht uber das ,.Wieviel" steht demnach der Kunde an erster Stelle. Danach folgen die Genehmigungs- bzw. Kontrollbehiirden (z. B. ICH, Regierungspriisidium, Europaische Kornmission) und am Ende das eigene (Labor)inanagement. Dies bedeutet keinesfalls, daB unbegrundete Forderungen seitens einer offiziellen Stelle, welcher auch immer, widerstandslos akzeptiert werden rnussen. Erfreulicherweise gibt es genugend Beispiele, in denen manch analytisches Labor durch selbstbewufltes Auftreten. Hartnackigkeit und naturlich nachvollziehbare Argumente ubertriebene Validierungsforderungen nach unten korrigieren konnte. Dabei liegt auf der Hand, daB ein Chernieoder Automobilunternehmen ab einer bestimmten GroBe bei einer lokalen Behorde unter Umstfnden bessere .,Karten" hat als z. B. ein Pharmaunternehmen, das gegenuber feststehenden FDA-Forderungen de facto chancenlos ist. Hier sind Korrekturen nur uber die kommunikative Ebene wshrend einer FDA-lnspektion denkbar. Existieren nun de jure oder de facto konkrete Vorgaben fur den Umfang einer Validierung, so bleibt dem Labor als Aufgabe lediglich, die Durchfiihrungspraxis zu optimieren. Eine Bkonornische, effiziente Urnsetzung kann zu einer betrachtlichen Kostenersparnis fuhren - auch bei vorgegebenern Umfang. Dazu existieren einige Moglichkeiten, mit den Kosten bzw. der Kostensenkung bei Validierungen werden wir uns im Abschnitt 7.3 beschaftigen. Folgende Kriterien/Fragen gilt es u. a. bei der Festlegung des Urnfangs xu berucksichtigen: Eigenart der analytischen Methode Analyt- oder matrixbemgene Validierung? - Zielsetzung, d. h. welche konkrete Frage gilt e\ zu beantworten'? - Hiiufigkeit und Wichtigkeit der Probe -
In Abb. 7- 1 sind wichtige Entscheidungskriterien bezuglich des Umfangs einer Validierung zusamrnengefaBt. Wenden wir uns jetzt dem Aspekt des Validierungsumfangs BUS analytischer Sicht zu.
7.1 Urnjiing einer Vulidientng
/ Analytische Gesichtspunkte. ,,harte" Fakten
369
Ziel der Validierung? MeOprinzip, Kornplexitat der Methode? Eigenart der konkreten Probe, Haufigkeit?
Risikopotentialfur KundeNnternehrnen? Firrnenpolitische Entscheidungen, ubergeordnete Kriterien
Vereinheitlichung von Validierungen innerhalb des Unternehrnens? Rucksicht auf normative und sonstige Forderungen?
Abb. 7-1 Entscheidungskriterienfur den Umfang einer Validierung.
7.1.1 Validierungsumfang in Abhangigkeit von dem Analysenverfahred dem MeBprinzip Vorbemerkung: Standardisierte Verfahren (DIN, DEV, DAB, USP, Euro.Pharm., BP, AOAC etc.) gelten grundsatzlich als geeignet, eine Validierung ist hier nicht erforderlich. Dazu ein Zitat aus der IS0 17025: ,,Genormte Verfahren mussen nicht validiert werden." Bei Standardverfahren geht es also zunachst nur um den Beweis fur die Befahigung des Labors, im konkreten Fall die Methode richtig anwenden zu konnen. Das ist der formale Aspekt. Es ist jedoch eine bekannte Tatsache, daB man einer ganzen Reihe von Verfahren aus Standardwerken nur mit Kopfschiitteln begegnen kann. In einem solchen Fall hat das Labor nach nuchterner Uberlegung zu entscheiden, ob das formale Alibi genugt oder ob dem analytischen Aspekt Rechnung getragen werden soll. Ein haufiges Dilemma in analytischen Labors lautet demnach: Einerseits ware manche Prufung aus analytischer Sicht angebracht, wird allerdings von Standardwerken nicht verlangt. Den (sinnvollen) Mehraufwand ist der Kunde erwartungsgemil3 nicht bereit zu bezahlen. Andererseits existieren unsinnige Anforderungen, die die Analytik verteuern - diesmal unnotig. Manches Standardwerk geht auch mit kritischen Punkten in Analyseverfahren groljzugig um, andererseits wird FORMALES groB geschrieben. Dazu ein Beispiel aus dem DAB (1996). In Abb. 7-2 ist das UV-Spektrum von einer Substanz, die mit HPLC quantitativ bestimmt wird, abgebildet. Im Text wird die Wellenlange von 353 nm angegeben. Ein Blick jedoch auf das Spektrum macht deutlich, daB eine Messung statt an der Flanke bei 353 nm, bei 350 nm auf dem Plateau, robuster ware. Soviel zur Praxistauglichkeit von standardisierten Verfahren. Es gibt eine Reihe physikalischer Verfahren, fur die eine Validierung nicht notwendig ist, siehe erste Spalte in Tab. 7- 1. Bei diesen Verfahren wird eine physikalische Eigenschaft gemessen (z. B. optische Drehung, PartikelgroBe, Schmelzpunkt) oder die Probe wird durch AufschluB uniformiert, z. B. CHN-Analyse. In diesen Fallen ist das Gerat die einzig wichtige Variable. Also gilt es,
Abb. 7-2 Zu dcr Fragc: ,.Kann von Standardverfahren erwartet wcrden. dal3 sic robust sind?" Tab. 7-1 Hiiufigc. physikalisch-chemische Verfahren und die Notwcndigkcit. sic LU validicrcn Vcrlahrcn, dic lur uhlichc. alltlglichc Fragcstcllungcn nicht vnlidicrt wcrdcn miissen Dichtcmc>sung Elemcntaranaly sc Farhcnmcssung Massc (wicgcn) Mi kroskopic pH-Wcrt qualitativc Spcktroskopic (Identitiit): IR/FTIR, NMR Schuttvolumen. -dichtc Tru hungsmcssung Zug-, Schcr-. Bicgckralt und Hiirtcprulunp
Verfahren mit geringem Validierungsbedarf, in der Regel: Prazision und Rohusthcit, sclten Richtigkeit -
~
-
Brechungsindcx (Darnpfdruck) Osmometrie Differentialscancalorimetrie zur Schmelipunktbestimmung Feuchtemessung Gravimetric/Thcrmogravimetrie: Asche, Sulfatasche, Trocknungsvcrlust, Trockenruckstand Mikrokalorimetrie Optische Drehung PartikelgroOenhestimmung (Laser) Schmelzpunktbestimmung Viskosimetrie
Vcrlahrcn. die validicrt wcrden musscn
~
-
-
-
Chromatographic. Gclund Kapillarclcktrophorcse: HPLC, IC. GC, DC, CE, CEC Elemcntaranalytik: AAS, ICP, AES, RF (Endym-) Immunoassays Frcisctzungstcsts Polarographic/ Voltammctric quantitative Spcktroskopie (Reinheit): UVIVIS. NMR, MS Titrimctric Wasscrhcstimmung
7.I Urnfang einer Validierung
37 1
dieses grundlich zu qualifizieren. Somit beschrankt sich die ,,Validierung" hier auf einer Grundkalibrierung des Gerates mit Hilfe von Referenzsubstanzen bzw. geeichten Referenzthermometern (Temperatur), Pufferlosungen (pH-Wert), Standardgewichtssatzen (Waage), PE-Folie (IR-Spektrometer) oder geeichte Priiflinge (Universalpriifmaschine). Es empfiehlt sich, die Kalibnerdaten von Beginn an mit Hilfe von Regelkarten zu verfolgen. Beispiel I : In der MS- und NMR-Spektroskopie (meist qualitative Fragestellung) erfolgt in der Praxis zunachst eine Gerateuberprufung und bei gegebener, bzw. uberprufter Spezifitat ein Vergleich der erhaltenen Spektren mit bekannten Spektren in Spektrenbibliotheken. Konstante Bedingungen sind die unabdingbare Voraussetzung fur eine Vergleichbarkeit von Ergebnissen. Beispiel 2: 1. Fur eine Triibungsmessung ist eminent, daB vollig identisches Wasser (destilliert und nicht demineralisiert) fur Probe und Vergleichslosung verwendet wird. 2. Bei Universalprufmaschinen (Zugspannung, Biegekraft) hangt zwar die Messung zunachst nur von der Qualitat der Priiflinge ab, die bei der Kalibrierung eingesetzt werden und von der Qualitat der Pendelschlagwerke. Doch ist der MeBvorgang in der Praxis abhangig von der Temperatur, der Feuchtigkeit und dem Grad der Erschutterungen. Davon beeinfluBt wird auch die ,,Linearitat" (verschiedene MeBbereiche). Hier ist zusatzlich die Uberpriifung der Robustheit notwendig. Das gilt auch fur eine zweite Gruppe von Verfahren.
Fur diese zweite Gruppe - zweite Spalte in Tab. 7-1 - ist ein geringer Aufwand an Validierungsarbeit notwendig. Ahnlich den Verfahren der ersten Gruppe 1st hier zunachst eine Qualifizierung/Kalibrierung der Gerate (Ofen, Waagen, Kalorimeter usw.) rnit Hilfe von Referenzmaterialien/ormalen notwendig. AnschlieBend sind die zwei Elemente ,,Prazision" und ,,Robustheit" zu uberpriifen, in seltenen Fallen auch die Richtigkeit. Es sei hier beispielhaft auf die Gravimetrie/Thermogravimetrieeingegangen. Der haufige Einsatz dieses Verfahrens liegt in der Qualitatskontrolle. Somit hat es den Charakter einer Konventionsmethode, das bedeutet in der Praxis: Vergleichbarkeit von Ergebnissen steht vor Richtigkeit. Und Vergleich ist moglich, wenn die Messungen bei identischen Bedingungen stattfinden. Das bedeutet wiederum, dal3 neben einer Kalibrierung (Gerat OK!) die Robustheit uberpriift werden sollte, um den EinfluB von einzelnen Faktoren auf die Messung festzustellen. Wenn die Ermittlung der Sulfatasche nicht nur als Grenzwert, sondern als Reinheitspriifung fur organische Substanzen benutzt wird, so ist naturlich die Uberpriifung der Prazision notwendig, weiterhin wird man moglicherweise noch auf eine GC-MS Messung zuriickgreifen mussen, wenn Richtigkeitspriifung verlangt wird. Und wenn beim Trocknungsverlust auch andere Losungsmittel auBer Wasser vermutet werden, so sollte die Richtigkeit durch Karl-Fischer- oder Aufstockversuche uberpruft werden. Verfahren, die in der dritten Spalte in Tab. 7-1 aufgefuhrt sind, sollten validiert werden. Bei den Methoden der ersten und zweiten Spalte spricht man von geriitebetonter, bei Methoden der dritten Spalte von methodenbetonter Validierung.
Tab. 7-2 Ublichcr Validierungdxxlarf bci hckannten Verlahren
Richtigkcit
Prazision
SpezifitW LincariSelcktivitlt
NWG/ BSG
Robusthcit
tat AAS, AES, ICP, RF
X
X
X
X
X
Polaro~raphieiVoltarnetrie
X
X
X
X
X
Titration (Gehalt) Wasserbcstimmung
X X
X
X X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
ChrotnatographiclKapillar-
elektrophorese (Gehalt) Spektroskopie (Reinheit) Freisctzung TOC Entyrnttntnunoa+\ay\
(X)
X X
X
X
X
X
X
X
X
X
X
Aus Tab. 7 - 1 IaBt sich folgende Faustregel ableiten: Bei Methoden der ersten Kategorie ist eine Validierung nicht notwendig, bei Methoden der zweiten Kategorie ist neben einer Gerltekalibrierung ein Zuverlassigkeitscheck durch Uberprufung von Prazision und Robustheit meist sinnvoll. Methoden der dritten Kategorie sind zu validieren. Tab. 7-2 gibt fur eine Reihe zu validierender Verfahren den ublichen Validierungsbedarf wieder. Der tatsachliche Umfang hlngt letzten Endes von dem Analysenziel ab.
7.1.2
Validierungsumfang in Abhingigkeit vom Analysenziel
Im Prufwesen nimmt der Validierungsumfang von einfachen Prufungen, z. B. Ermittlung von Materialeigenschaften, wie Zug- und Biegekraft, uber Messungen zur Ermittlung der physikalisch-chemischen Eigenschaften eines Musters (z. B. Obertliichenaktivitat, Oxidationsgrad, Leitfihigkeit) zu den chromatographischen Trenntechniken (Suche nach Art, Anzahl und Anteil der Komponenten in einer Probe) zu. Wenn man von Schwierigkeiten technischer Natur wie Notwendigkeit zur Miniaturisierung (Nanotechnik) und Messungen unter extremen Bedingungen absieht, nimmt der Validierungsaufwand in obiger Reihenfolge zu. In dieser Reihenfolge nimmt namlich ebenfalls die Komplexitat des MeBobjektes, der Probe, zu. So werden in der Pharmaindustrie und im Pflanzenschutz folgende Untergruppen entsprechend der Zielsetzung gebildet: -
Identitiitstests
- Gehaltsbestimrnung -
Qualitative Spurenmethode Quantitative Spurenmethode (Reinheitsprufungen, Neben- und Abbauprodukte) Freisetzungen.
7. I Urnfiing einer Widierung physikalischen
chemische
Spuren-
Spurenbestimmung
/'jQrj MeRprazision
(evtl Methoden-
Methoden-
Methoden.
Methoden-
373
Aussagen
F l nisse bedingt durch das Gerat
Methode im Allta
barkeit
Abb. 7-3Validierungsumfang abhangig vom Analysenziel
In Abb. 7-3 ist der erforderliche Umfang abhangig vom Analysenziel dargestellt. So mufi beispielsweise bei Identitiitstests ,,nur" der Analyt eindeutig identifiziert werden. Steht eine spezifische Methode zur Verfugung, ist mit der Messung die Arbeit bereits beendet. Existiert keine spezifische Methode, so ware der nachste Schritt die Suche nach einer rnoglichst selektiven Methode. Zur Validierung (Eignungsuberprufung) reicht hier die Uberprufung der Selektivitat vollkommen aus. Bei einfachen Absicherungstests, wie Dichtemessung oder Schmelzpunktbestimmung, ist ein noch geringerer Aufwand gerechtfertigt. Je nach Problemstellung kann also der Identitatstest relativ einfach ausfallen, z. B. Bestimmung des Wassergehaltes, Identifizierung eines Enzyms mittels eins Biosensors, sensorische Prufung bei Riechstoffen, Anwendung von NIRS oder Vergleich von NMRSpektren. Er kann aber auch sehr aufwendig sein, z. B. Off-line/on-line-Kopplungverschiedener chromatographischer Techniken und anschliefiend on-line-Kopplung mit der Spektroskopie. Die quantitative Bestimmung von Spuren in der Ruckstandsanalytik ist erwartungsgemafi ein recht aufwendiger Fall, siehe weiter unten. Bei der sogenannten Ergebnisvalidierung geht es ausschliefilich um den Beweis der Richtigkeit eines Verfahrens. Somit kann hier der Validierungsaufwand auf ein Minimum reduziert werden - wenn ein Bezug auf ReferenzsubstanzenNormale moglich ist. Hier konnte man wie folgt unterscheiden: -
Physikalische und physikalisch- chemische Standardverfahren: Grundkalibrierung mit Normalen oder zertifizierten Referenzmaterialien. Sind solche nicht vorhanden, so verwende man sehr gut charakterisierte Standards.
unwichtige -1WichtigkeitI
Abb. 7-4 Validierungsumfnng nach analytischen Gesichtspunktcn.
ENDE
i
unsicherheit
- Plausibilitat - Schatzen der Men-
und “wlchtlgkelt“
wiederkehrende
Urnfang abhangig u.a. vorn Analysenziel, siehe Abb.7.3 Fliehscherna, siehe Abb.7.5
+ Validierung durchfuhren
Nein
Ja
(1)
b ENDE
kornplexe Methode, Hausrnethode
Ergebnisvalidierung rnoglich ?
wichtige
urn die Anwendbarkett eines Norrnverfahrens irn eigenen Labor zu belegen
Kalibrierung --+ ENDE
Kalibrierung --+ ENDE
-_ -. -_ <
$-
7
5-
fi
z
IY
u
P
4
(*,
7. I Umfiing einer Kilidierung -
375
Relativverfahren: Richtigkeit mittels Zudosierungsexperimenten (Wiederfindungsrate) oder mit einer zweiten Methode beweisen.
Damit ware die Validierung erfolgreich beendet.
7.1.3
Valdierungsumfang abhangig von der Haufigkeit und Wichtigkeit der Probe
Neben dem MeRprinzip und der Zielsetzung spielt natiirlich die Haufigkeit und die Wichtigkeit der Probe fur den endgiiltigen Validierungsumfang eine entscheidende Rolle. In Abb. 7-4 wird der Umfang der Validierung - abhangig von allen genannten Faktoren - in Form eines Entscheidungsschemas dargestellt. Dazu zwei Bemerkungen: Die Gewichtung der genannten Faktoren nimmt in folgender Reihenfolge ab: Wichtigkeit (Umsatzerwartung, Risikopotential) MeOprinzip = Zielsetzung Haufigkeit Wie bereits angemerkt, konnen diverse Zwange die entscheidende Rolle bei der Festlesung des Umfangs spielen. Wir mochten nun abschliefiend den Validierungsumfang aus einem anderen Blickwinkel betrachten. Mit der Entwicklung bzw. dem Reifezustand einer Methode wachst in der Regel auch die Anzahl der zu bearbeitenden Proben. Welche Parameter einer Methode nun kritisch sind, hangt auch von der Probenzahl ab. So ist beispielsweise bei einer kleinen Probenzahl die Prazision eher unwichtig, bei einer groRen Anzahl sind die Anforderungen an die Verfahrensstabilitat entsprechend hoch, usw., siehe Tab. 7-3.
+
+
Tab. 7-3Validierungsparameter abhlngig von der Probenanzahl (Beispiel). Probenzahl
Prufpunkt(e)
1-10
-
MeBprazision
-
Selektivitat incl. EinfluU der Matrix, Verschleppungaeffekte usw.
-
evtl. Abschatzen der Prazision und der Bestimmungsgrenze
-
W iederholprlzision
Linearitat des Detektors gewahrleistet?
> 10-20
Linearitat, Bestimmungsgrenze, Wiederfindungsrate (Richtigkeit) Methodenrobustheit Verfahrensstabilitat innerhalb der Melfreihe?
> 100
-
Laborprazision: ,.Was kann sich im Laufe der MeBzeit fur die 100 Proben alles Indern?” EinfluB kritischer Parameter auf die Zuverlassigkeit der Methode (z. B. Stabilitat des Analyten und der Hilfsstoffe)
376
7 Urnfang, Ablauficherna, zeitlicher Ablauf iind Kosten der Validierung
Zusummenfussung:
Bestehen de jure oder de facto bindende Vorgaben, bleibt dem Labor als einzige (wichtige!) Aufgabe, diese Vorgaben moglichst effizient umzusetzen. Hier geht es um Okonomie in der Analytik, s. Abschnitt 7.3. Herrscht Entscheidungsfreiheit, gilt es zunachst, so kritisch und realistisch wie nur moglich die Frage zu beantworten: ,,Was beabsichtige ich mit der Validierung?" Uberwiegt der formale Aspekt, wird die Validierung nach dem iiblichen und erwarteten Schema - abzuarbeiten sein: Uberpriifung der einzelnen Validierungsparameter und Ermittlung der statistischen GroBen. Sind Gesundheitsrisiken oder auch juristische Fragen relevant, so ist der Aufwand fur eine sehr grundliche Validierung gerechtfertigt. Ansonsten sollte stets Ergebnisvalidierung mit Normalen/gut charakterisierten Referenzsubstanzen angestrebt werden.
7.2
Vorgehensweise bei der Validierung
7.2.1 FlieBschema und zeitlicher Ablauf In Abb. 7-5 wird am Beispiel des aufwendigsten Falls, der quantitativen Spurenbestimmung, ein FlieBschema zur Methodenvalidierung vorgeschlagen. Dieses allgemeine Schema kann fur andere Zielsetzungen entsprechend ,,abgespeckt" werden, s. als Beispiel Abb. 7-6 fur Identitatstests. Die drei Stufen des FlielSschemas stellen gleichzeitig den zeitlichen Ablauf dar, der dern ublichen ,,Werdegang" einer Methode angepaBt ist.
7.2.2 Kommentare zum FlieBschema Stufel, Vorvalidierung Die Uberprufung der MeBprazision kann entfallen, wenn sie z. B. durch haufige Uberpriifung des Gerates bekannt ist. In diesem Fall kann direkt mit der Uberpriifung der Selektivitat begonnen werden. Die Selektivitatsiiberpriifung sowie ausgewahlte Experimente zur Methodenrobustheit (Robustheit 1) sollen in einem friihen Stadium, d. h. eigentlich bereits bei der Methodenentwicklung stattfinden. Gegebenenfalls kann die Uberpriifung der Prazision - was ja eigentlich ein MaB fur die Robustheit der Methode darstellt - bereits jetzt sinnvoll sein. Oft wird dieser Schritt als Vorvalidierung bezeichnet. Stufe 2, Grundvalidierung Nach dem ersten ,,Gefuhl" fur die Methode wird sie nun genauer untersucht. In dieser Stufe werden die rneisten Validierungselemente gepriift. Ausgangspunkt und damit zentrales Element ist die Linearitat, naheres s. weiter unten. Charakteristisch fur diesen Arbeitsschritt ist das intensive Arbeiten an der Waage.
Dringender Hinweis Be1 Bedarf Probenentnahme, -Transport und Lagerung validieren oder zumindest sorgfaltig dokumentieren ErkennlnissdAussage
Prufpunkt/ Vorgehen Stufe 1(l),Votvalldlerung MeRprazislon h h MeRprazislon
uber
6 x Standard bzw 6 reale Proben ( Methodenprazlsion) unter Wiederholbedingungen analysieren
I
Wie 1st die Streuung meiner Ergebnisse bedingt durch das Gerat bzw durch das Gerat plus Methode 7
I
Selektlvltat
J L bekannte Probe
unbekannte Probe
1
1st die Methode uberhaupt selektiv fur meine Probe ?
1 -
\ \ I
J
Wenn moglich Substanzoder elementspezifische Messung durchfuhren bzw spezifische Detektion anwenden, 2.0 PNMR, spezielle Sensoren, GenAntigen-Wechselwirkungei
Vergleichsmessung mit einem Standard der alle denkbaren Komponenten enthalt
Orthogonale Trenn. techniken off-line/ online Kopplungen z E Chromatographie i Spektroskopie LC-MS(MS) LC-GPC Wie beeinflussen kleine Anderungen in der Methode mein Ergebnis ?
Robustheit I1Methodenrobustheitl-b
Y
h,
Stufe 2 Grundvalldlerung Llnearltat
Linearitat im relevanten Bereich gegeben 7 Konzentrationsbereich fur eindeutig rnathematischen Zusammenhang zwischen Signal und Konzentration ermitteln
experimentelle
Ja
z.B anderes Losunasminel Wledsrholprazlaion (fa s n cnl ZL Beginn erm llelll z E 6 E nKaagen Doppe Dest mmmg sow e Methodenfahigkeit Empflndllchkelt reiat ,e Verfahrensstandardabwelchung ermlle n Genl o e Regress onsgeraae emer Vera-nnmgsre ne o,rcn aen 0 . P m % i7
W Cnlge Kr lerien fdr a e G J e einer Melnoae Eestal g d g oef Sele%twtat
6estlmmu;Bsgrenze
1
SignallRauschVerhaltnis 9 1 (NGW:3'1)
niedrigste Konzentration fur die gewunschte Wiedernoiprazision
oder Kallbrlergerademethode
I
Liefert die Methode ein
Sollilst-Vergleich mil einer moglichst zeflifizierten oder gut charakterisierten synthetischen Probe
Aufstockverfahren ( Spiken ) Wledemndung
Systematische Fehler gefunden 7
Vergleich mil unabhangiger validierter Methode
Ja
-Nein
lndirekte Uberprufung uber StoffiMassenbilanzen
1
Stufe 3. Anwendbarkelt Robusthelt I1
/\ /
Methode nur fur laborinterne Zwecke
Schwachstellenanalyse durch systematische Variation der kritischen Parameter (umfangreichere Experimente als zu Beginn bei der Methodenentwicklung) Laborprazision Stabilitat von Losungen Verfahrensstabilitat zeitabhangige Streuung der MeRwerle?
Oft ~nder Praxis Selektivitat nicht gegeben +Linearitat gegeben +Gerade durch den Nullpunkt+ Ergebnis
Selektivitat verbessern s o Wiederfindungsrate uberprufen Fragen beantworten - Gehalt in Standardlosung wirklich in Ordnung? - Sonstige Systematische Fehler?
+
.-
D~~~~M~~~~an verun. relnlgungen kann ICh nOchquantlfizleren
\
Methode wird auch auRerhalb des eigenen Labors eingesetzt
Z d e r ass gke tslests Wje ZLverlassog n e Stab sl rnesne Metnooe m Labor alltag gegenuber verschiedenen Einnussenl.3 Gerat. A Anwender A Labor?)
' Vergleichsprazision (Ubertragbarkeit) Ringversuche
ENDE DER MESSUNGEN Nach den Messungen gilt nun Antworten u a auf folgende Fragen zu geben - 1st die Methode fur den beabsichtigten Zweck geeignet z B Streuung der Methode rnit den Spezifikationsanforderungenvereinbar (Methodenfahigkeit) 7 - Fur welchen Konzentrationsbereich (range) sind obige Aussagen gultig? - Wie andem sich die erhaltenen Werte in Abhangigkeit von der Zeit? Mittelwertverschiebung?Trends erkannt? Sol1 SPC-Einfuhrung empfohlen werden? - Sind kntische Punkte der Methode identrfiziertund herausgestellt? Empfehlungfur die Routineanwender? ENDE DER VALIDIERUNG (1) kann eniiallen, Erlauterung s. Text
Abb. 7-5FlieBschema zur Methodenvalidierung einer chromatographischen Methode zur quantitativen Spurenbestimmung.
9 R
T
a
Nein
i ENDE
I
Orthogonale Trenntechniken off-line/ online Kopplungen, z.B. Chrornatographie LC-MS(MS) LC-GPC
Identitat bewiesen
2. Selektivitat vorhanden ?
I
Wenn rnoglich Substanz- oder elementspezifsche Messung bzw. spezifische Detektion anwenden, z.B. PNMRspezielle Sensoren, GenAntigen-Wechselwirkungen
\ \
Abb. 7-6 Flieaschema zur Methodenvalidierung von Identitatstests in der Chromatographie
ENDE
1
-+
Anderes Analysenbzw. Trennprinzip verwenden, z.B. HPLC + ELISA GC HPLC
/ /
1
1.Gerat OK ?
Selektivitat uberprufen bzw. verbessern .
unbekannte Probe
Systernatische Varia tion der Analysenbedingungen, z.B. pH-Wert, chromatographische Saule usw.
Selektivitat u b e r p r u f e n 4 Vergleich rnit Standard in der erwarteten Konzentration, der alle denkbaren Kornponenten incl. Matrix
1
bekannte Probe
MeRprazision, Standard 6x analysieren bzw. MeRprazision ist bekannt und akzeptiert
7.2 Vorgehensweise hei der Vulidierung
Beispiel: 6-fach Bestimmung bei I2,5 und 37,5 ng/pl
379
+ Wiederholprazision bei verschiedenen Konzentrationen, Priifung auf Varianzenhomogenitat und Verschleppung
Sechs unterschiedliche Einwaagen der Zielkonzentration z. B. 25 ng/p1
+ Wiederholprazision,
Verdunnungen z. B. 2,4,6, 8, 10, 12 nglpl
-+Bestatigung der Selektivitat
Aufstockung z. B. 10, 15,20, 25, 30,35 ng/pl
-+
Methodenfahigkeit
mit Hilfe der Kalibriergeraden, Bestimmungsgrenze
Linearitat der Methode Empfindlichkeit, Richtigkeit (Wiederfindungsrate).
Wie bereits oben erwlhnt konnen wir Kalibrierungkinearitat als die zentrale Verfahrenskenngrofle der Validierung betrachten. Begrundung: Zeitlich gesehen erfolgt vor der Uberprufung der Linearitat ,,nur" die Uberprufung der Selektivit2t und der Methodenrobustheit (Stufe 1) und anschliel3end die Anwendbarkeit der Methode fur den Alltag (Verfahrensstabilitat, Vergleichbarkeit, Stufe 3). Wenn nun besprochener Arbeitsschritt richtig geplant wird, konnen mehrere Validierungselemente sehr effizient, d. h. kosten- und zeitsparend uberpriift werden, s. Abb. 7-7.
signalA
4-- Linearitat und Richligkeit (Wiederfindungsrate)
Wiederholprazisionbei verschiedenenkonzentrationsniveaus. Varianzenhomogenitat
+
Erliiuterurig:
Nach der Kalibrierung sollte die Wiederholprlzision von realen .,Prohen" (Matrix + Losungsmittel + Analyt bekannter Konzentration) fur 4-6 Konzentrationsniveaus (BartlettTest) oder wenigstens fur die zwei extremen Konzentrationen ,,unten", ,,oben" (Prufung auf Varianzhomogenitat, F-Test) gepruft werden, s. Abschnitt 3.7.2.5. Damit hiitten wir bereits die Wiederholpriizision bei verschiedenen Konzentrationen gepriift. Das Vermessen der realen ,,Prohen" im in Frage kommenden Konzentrationsbereich (Arbeitsbereich) fuhrt zur Linrurifat und zur Wiedeifindung und damit zur Richfigkeit fur diesen Arbeitsbereich. Die Messung bei hoheren Konzentrationen erlaubt weiterhin eine Aussage uber eine mogliche Verschleppung fur diese Matrix unter diesen experimentellen Bedingungen. Aus dem ,,unteren" Bereich der Geraden kann die Erfussungs- und Bestimmungsgrenze bestimmt und die Selektivittit bestltigt werden. Wird dariiber hinaus die Prlzision bei zwei Konzentrationsniveaus nach 24, 48 usw. Stunden uberpruft, so erhllt man Informationen uber die Vetlfirhrensstutiilitiit(Nebenreaktionen, ungewollte Adsorption an Stahl-IGlasoberfllchen, Zersetzung) fur diese Konzentrationsniveaus. Fuhrt diese Messungen ein anderer Anwender eventuell am anderen Gerat durch, so konnen uber die Luborpru:ision hinaus erste Aussagen zu Anwendbarkeit (Robustheit 11) gemacht werden. Ein objektives Vergleichskriterium fur die zwei letztgenannten Punkte ist die relative Verfahrensstandardabweichung, s. Abschnitt 3.7.2.4. Stufe 3, Anwendbarkeit In der dritten Stufe wird die Anwenrlburkrif der Methode im Alltag unter den jeweiligen realen Bedingungen gepruft. Das sollte vor dem Einsatz in der Routine erfolgen. Hier wlre abhlngig von den individuellen Gegebenheiten folgendes zu untersuchen: Laborprazision
die Laborprazision sollte spltestens jetLt uberpruft werden, denn veranderte Bedingungen sind im Alltag unvermeidlich (A Anwender, Gerlt, Chemikalien usw.).
Verfahrensstabilitat
z. B. bei biologischen oder Umweltproben, unbekannten oder in-
stabilen Proben, groljeren Serien. Vergleichsprlzision Vergleichspriizision (Ubertragbarkei t)
z. B. wenn eine Methode von der IPK entwickelt wurde und demnlchst von der Stabilitiits- oder Bulkwarenkontrolle ubernommen wird.
Durchfiihrung und Auswertung Die vorgestellten Stufen konnen unmittelbar hintereinander folgen oder aber zeitlich versetzt, dem Entwicklungsstand der Methode folgend, urn unnotigen Aufwand zu vermeiden, falls das Produkt doch ,,auf Eis gelegt" wird. Mit dem vorgeschlagenen Schema kann die
7.2 Vrtrgehensweise bei der Validierung
38 1
Validierung in 2-3 Tagen erledigt werden. Die Zahlen jedoch, die ermittelt werden, gelten nur unter optimalsten Bedingungen, die wahrscheinlich in diesen 2-3 Tagen geherrscht haben (erfahrene Anwender, optimale Apparatur, kalibrierte Hilfsmittel etc.). Der EinfluB weiterer Faktoren sowie der zeitliche Aspekt sollte unbedingt untersucht werden, wenigstens retrospektiv wahrend des Routineeinsatzes, s. Kapitel5 und 8. Entsprechend dem FlieBschema in Abb. 7-5 ist eine Validierung nicht mit der Ermittlung von Zahlenwerten beendet! Wie auch in der IS0 17025 gefordert, sind kommentierte Aussagen und die Beantwortung der zentralen Frage ,,Methode geeignetlnicht geeignet" ,,expressis verbis" notwendig. Tab. 7-4 zeigt die Starken und Schwachen der Validierung. Weitere Werkzeuge zur Qualitatssicherung sind statistische ProzeBkontrolle, SPC, siehe Kapitel 8 und Schatzen der Meaunsicherheit, s. Kapitel 9. Tab. 7-5 gibt einen Uberblick uber den rationellen Einsatz der einzelnen QS-Werkzeuge abhangig von der aktuellen Situation/Zielsetzung wieder. Der Einsatz des geeigneten Werkzeugs hangt von der aktuellen Zielsetzung, d. h. von den aktuellen Rahmenbedingungen und von dem Zeitpunkt der Fragestellung ab. So sind die einzelnen Werkzeuge weniger in der Konkurrenz zu sehen, vielmehr stellen sie oft sinnvolle Erganzungen dar. So kann beispielsweise eine ,,abgespeckte" Validierung und anschlieBend Fuhrung von Regelkarten, (Kapitel 8) moglicherweise mehr Informationen liefern als eine einmalige, sehr grundlich durchgefuhrte - und teure - Validierung. Man konnte sich fur bestimmte Falle ein ZeiVAktion-Muster wie in Tab. 7-6 dargestellt, vorstellen. Die Ubergange sind flieBend, die angegebenen Zeitmodule sind beispielhaft zu sehen.
Tab. 7-4 Starken und Schwachen der Validierung. Stiirken
Schwachen
Unter gleichen Randhedingungen kann rnittels Validierung die Leistungsfahigkeit von Methoden anhand konkreter Zahlen verglichen werden.
-
,,Validierung" als QS-Werkzeug geniel3t einen hervorragenden Ruf; fur eine Akkreditierung werden validierte Verfahren verlangt Eine - wie auch irnrner - validierte Methode gilt als ,,gute" Methode.
-
Validierung und Revalidierung ist teuer.
-
Durch die Validierung (man erhalt ja konkrete Zahlen!) kann der Blick fur kritische Punkte versperrt werden, z. B. reprasentative Probe, Probenahme, Geratealterung usw. Die Variabilitat des Gesamtverfahrens bleibt in der Regel im Verborgenen, unbernerkt ersetzt ,,Messen" das ,,Prufen" .. .
,,Validierung" ist eine Mornentaufnahme, der Faktor Zeit spielt eine untcrgeordnete Rolle.
Tab. 7-5 Zum Einsatz von Wcrkzeugcn m r Qualitiitssichcrung ( Q S ) abhiingig von der Situation/ ZiclaetLung. Situation/Zielsetzung
gceignetes QS-Werkzeug
Einlachcs physikalisches Vcrfahren, PrBzision des Ergebnisses ist nicht kritisch
Geriitekalibricrunp plus Plausihilitiitsuberprufung
Einmalige Fragestellung (,,quick and dirty"), F + E Bcreich
Schatzen der Meljunsicherheit
V i d e Routincdaten. Antwort auf die Fragc: ..Strcuung von Werten: 1st es die Analytik oder die Produktion'?", Erkennen von Trends. Einllul3 des Faktors ,,Zeit"?
Statisiischc ProzeBkontrolle SPC
..Olli~ieller"AnlaR (Akkreditierung. FDA-lnspektion), um5a17starkes Produkt. grolks Risikopotential
Validierunp und anschlielknde Kommcnlic rung. d. h. Charakterisicrung der Methode
Tab. 7-6 Produktlebenszyklus und crlordcrlichc MaOnahmcn /ur Qualitatssicherung (fiktiver Fall). Produktlchcnsphase
Ncuc Verhindung ,,Validin". hereits charakterisien
Zcitpunkt
.\
US-
Schiitzen der MeUunsicherhcit. evtl. Selektivitiit und Methodenrohustheit (Vorvalidierung)
Wiederholpriiiision, Selektivitiit, Richtigkeit, Lineantiit, Lahorpriizision. Bei Bedarf, Methodenriihigkeit, Bestininiungsgrenzc (Grundvalidierung)
Komplette Vali- Systerneignungst Rcvalidicrung dierung est der hritischcn Ausluhrliche Schrittc. SystemTests hLw. Wieeignungstest, evt I . modi ti i,iert derholtests zur Rohustheit, Stahilitiit und evtl. erste Tests m r Reinigungsvalidierung (Anwendharkeit. McthodeniuverIiissigkeit)
Vdlidierungs-
Validierungsstute I I
Vdlidierungs stute I l l
lspcl
lspcl
M;iOnahme
=0
\lute 1
I(Vorpenode)I
Herstellung Vor Produkgr00erer Mentionsheginn und gen, Chancen lur Vermarklung Vcrinarktung sind gegehen .I-
+ 6 Monate
.\-
+ I 2 Monate
Vermarktung
A
+ ...
Ispc1
Produhtvcrhesscrung
\+
lspcl
7.2 Kqehensweise bei der Vulidirrung
383
Am AbschluB dieses Abschnitts werden exemplarisch fur einige herausgegriffene Fragestellungen typische Priifpunkte angegeben, siehe Tab. 7-7.
Tab. 7-7Exemplarisch herausgegriffene Fragestellungen und typische Priifpunkte bei der Validierung. Die Ausgangssituation
Die Prufung
Einfache Identifikation
-
sensorische Prufung
Eingangsprufung; ldentifikation von Proben mit konstanter Matrix
-
NIRS, Kalibrierung des Gerats
Qualitative Spektroskopie
-
Geratefunktion uberprufen
-
Vergleich mit Hilfe von Spektrenatlanten
-
Schatzen der Mellunsicherheit, s. Kapitel 9
-
3-Punktkalibrierung
-
Zumischexperimente
-
Plausibilitatsbetrachtung
Unwichtige/unkritische Probe, Einzelfragestellung
Kritische Methode, z. B.
Sehr wichtig xu Beginn:
1. Neuer, evtl. instabiler Wirkstoff
-
Stabilitat
-
Selektivitat, anschlieknd Rest wie bereits dargelegt
2. Reinheit mit quantitativer Bestimrnung von Nebenkomponenten
Evtl. zu Beginn: -
Qualitat von Standards z. B. durch Massenbilanzen uberprufen, dann:
-
Selektivitat
-
Linearitat, anschliellend Rest wie bereits dargelegt
1. Korrekte Herstellung? Dosis?
-
Nominalgehalt des Wirkstoffs
2. Homogenitat?
-
Ergibt sich von an funf verschiedenen Stellen gezogene Proben ein V, < 10 %'?
Reinigungsvalidierung
-
SelektivitatIStabilitat; werden auch Nebenprodukte erfabt, die erst an der Oberflache nach einer Zeit x entstehen?
-
Empfindlichkeit - auch fur toxikologisch relevante Konzentrationen!
-
Wiederfindung (swabhnse-Losungen?) evtl. in Abhangigkeit von der Zeit
-
Nachweisgrenze
Uberwachung Pharmaproduktion
384
7 Urnfirrig, Ahlouf:icc.ckemci,zeitlicher Ahlauf iind Kosten der Vulidirrung
7.3
Kosten der Validierung und Ansatze fur deren Senkung
In Tab. 7-8 sind Kosten einer formalen Validierung fur verschiedene analytische Methoden in der Pharma in den USA aufgefuhrt. Das sind durchschnittliche Kosten fur Design, Entwicklung und Durchfuhrung einer kompletten Validierung, die normativen Anfordemngen genugt. Auch unter der Annahme, dal3 die Preise in Europa vermutlich urn ca. 30 % niedriger liegen durften, ist Validierung auch in nicht-GLP/GMP-Labors eine teure QS-MaBnahme. Bei einer Befragung in befreundeten Unternehmen sowie einer Literaturrecherche erhielt der Autor folgende Angaben beziiglich Validierungskosten: Installation einer Produktionsanlage
Validierungskosten: 5-1 0 5% der Installationskosten
Pharmaproduktion, laufender Betrieb
10-20 % der Investsummen sind direkte oder indirekte Validierungskosten
Computer: Entwicklung von Hardund Software
15-20 % der Entwicklungskosten sind Validierungskosten
Analytik
ca. 3 MannwochenIMethode, das sind ca. 10.000-12.000 Euro ohne Gemeinkosten
7.3.1 Senkung der Validierungskosten Wie kannen nun die direkten und indirekten Validierungskosten gesenkt werden?
Tab. 7-8 Validierungskosten einiger analytischer Verfahren in der Pharmaindustrie (USA). Quelle: Pharmaceutical Technology Europe Oktober 1994. Technik
Quantitative Aussage
Schwierigkeitsgrad
Kosten
RP-HPLC
ja
mittel
30.000
Gelfiltration
teilweise
klein
25.000
peptide map (.,fingerprint")
teilweise
mittel bis schwer 20.000- 70.000
Gelelektrophorese
semiquantitativ
schwer
15.000- 50.000
Radio-hmmunoassays (ELISA/RIA)
ja
mittel
25.000- 35.000
in vitro bioassay
semiquantitativ
schwer
60.000- 80.000
in vivo bioassay
semiquantitativ
sehr schwer
60.000- 100.000
($1
7.3 Kosten der Validierung und Ansatze,fur deren Senkung
385
Nachfolgend einige Vorschlage:
1. Grundsatzlich gilt im Vorfeld genau festzulegen, welche Informationen benotigt werden, um die gestellte Frage - und ausschlie13lich diese! - zu beantworten. Es sollte prinzipiell alles hinterfragt werden.
Beispiele: - Mu13 die Bestimmungsgrenze gesondert ermittelt werden, auch wenn sie ,,nebenbei" anfallt? Beispielsweise, wenn das Analysenziel ausschliel3lich die Gehaltsbestimmung (z. B. 80 %) ist und man sich bei den Nebenkomponenten nicht auf die Hauptkomponente bezieht. - 1st die Ermittlung der Bestimmungsgrenze bei einer Grenzwertforderung notwendig? - 1st bei einer prazisen Methode eine Dreifachbestimmung notwendig? - 1st die statistische Sicherheit bei zehn Meljwerten wesentlich groBer als bei sechs Me& werten? - Mu13 bei einer Anderung der Dimensionen einer GC-Kapillare die Wiederholprazision erneut ermittelt werden? 2. Das Instrument ,,SPC" sollte in der Routine verstiirkt eingesetzt werden, um Validier-, Kalibrier- und uberhaupt Priifaufwand zu minimieren, s. Kapitel 8. 3. Bereits bei der Methodenentwicklung bewul3t auf eine robuste und selektive Methode hinoptimieren, d. h. Qualitat in die Methode hineinstecken, statt nachher aufwendige und teure Kontrollen oder gar Wiederholmessungen durchzufuhren: Qualitatssicherung ist besser als Qualitatskontrolle. Methodenrobustheit sollte als selbstverstandliches, integrales Teil der Methodenentwicklung betrachtet werden ebenso wie ausgewahlte Experimente zur Laborprazision.
Beispiel: Kopplungstechniken in der Chromatographie sind zwar teuer, doch kann es ein Unternehmen um ein vielfaches teurer zu stehen kommen, wenn bei einem wichtigen Produkt die Erkenntnis, daR der Hauptpeak nun doch nicht homogen ist, erst nach zwei Jahren kommt. Solche Falle gibt es zur Geniige. 4. Effiziente Arbeitsweise anstreben. d. h. es sollte stets versucht werden, in einem Arbeitsschritt moglichst viele Parameter zu ermitteln, s. auch Abb. 7-6, (Beispiel 1) bzw. mit moglichst wenigen Messungen eine gesicherte Aussage zu erhalten (Beispiel 2).
Beispiel 1: [ 1 171 Aufgabe: Validierung einer HPLC-Methode zur Bestimmung eines Wirkstoffes, dessen Gehalt zwischen 95 % - 10.5 % liegen soll. Nachfolgend wird eine schematische Vorgehensweise dargestellt, um fur diese Aufgabenstellung geforderte Parameter Richtigkeit, Wiederholprazision, Methodenfahigkeit, Linearitat und Arbeitsbereich in einer MeBreihe zu ermitteln.
7 Umfung, Abluufschernu, zeitlicher Abluuf und Kosten der Vulidierung
386 Material:
-
-
Losungen:
Matrix (M) Standardsubstanz/Analyt (S) Losungsmittel (L)
-
Blindlosung oder Probeleerwert oder Leerprobe Standardlosung: ,,Probelosung (100)":
-
,,Probelosung ( 1 20)":
-
-
- ,,Probelosung (80)":
M rnit L verdunnt bzw. aufbereitet S mit L verdunnt bzw. aufbereitet Sloo+ M mit L verdiinnt (100 = Sollkonzentration) (Sloe x 1,2) + M mit L verdunnt ( 120 = Sollkonzentration) (S,,, x 0,8) + M mit L verdunnt (80 = Sollkonzentration)
Analy senserie: I. 2. 3. 4. 5. 6. 7. 8.
Blindlosung Standardlosung Probelosung (100) Probelosung (100) Probelosung (100) Probelosung (100) Probelosung ( 100) Probelosung (1 00) 9. Probelosung (1 20) 10.Probelosung (120) 1 1. Probelosung (80) 12. Probelosung (80) 13. Standardlosung
1 . Probelosung 2. Probelosung
sechs unabhangige
5. Probelosung 6. Probelosung 1. Probelosung 2. Probelosung 1 . ProbeIosung 2. Probelosung
- Die Kulibrierung erfolgt rnit den Injektionen der Losungen 2 und 13, aus den zwei
-
-
-
Injektionen (Mittelwert) wird der Faktor F ermittelt, z. B. fur eine Konzentration von 1 g/ml ergibt sich eine Flache von 300.000 counts. Die Richtigkeit ergibt sich aus den Befunden der Untersuchungen 3, 4, 5 , 6, 7 und 8 verglichen rnit dem Sollwert S,, (t-Test). Die Wiederholpruzision ergibt sich aus der statistischen Auswertung (V,-Wert) der Untersuchungen 3 , 4 , 5 , 6 , 7 und 8 ebenso wie die Methodenfahigkeit. Die Lineuritiit und der Arbeitshereich ergeben sich aus den Untersuchungen:
Blindlosung 3,4, 5 , 6 , 7 und 8 9 und 10 1 1 und 12
(soll 0) (soll 100) (soll 120) (soll 80).
7.3 Kosten der Vulidierung und Ansatze,fur deren Senkung
387
Bemerkungen: Im vorliegenden Fall kann von Proportionalitat ausgegangen werden, fur die Kalibrierung werden nur zwei Punkte benotigt (Konzentration 0 und 100, 1-Punkt-Kalibrierung). Die Gerade ist durch diese zwei Fixpunkte vorgegeben und sie ist ,,richtig", denn die zwei Konzentrationswerte 0 und 100 (Sollwert) sind ja auch richtig. Ergibt sich nun beispielsweise fur die Sollkonzentration 80 % oderhnd 120 % ein anderer Wert als durch die Gerade vorgegeben, so erhalt man eine Information uber den erwarteten Fehler mit dieser Methode, wenn man so weit entfernt von der Zielkonzentration mifit. Bei unterschiedlicher Matrix oder Formulierung (Tablette, Pulver) kann die Messung mit den entsprechenden Probelosungen 3 bis 8 wiederholt werden. Dadurch kann ein moglicher Einflufi der Matrix oder der Formulierung auf die untersuchten Parameter festgestellt werden, s. ausfiihrliche Beschreibung unter ,,Linearitat", Abschnitt 3.7.2.5. Beispiel 2: [39] Aufgabe: Uberprufung der Linearitat bei Reaktionskontrollen. Es sol1 der Blindwert bestimmt werden (Blindwert hier: Losungsmittelgemisch) und die Linearitat. Im Bereich 25 % - 125 % (bezogen auf die Konzentration der spater verwendeten Musterlosung) werden vier Losungen vom Edukt plus vier Losungen vom Produkt plus drei Losungen, welche Edukt und Produkt enthalten, hergestellt und je einmal injiziert. - Konzentration 1 = - Konzentration 1 = - Konzentration 1 = - Konzentration 1 = -
Konzentration 1 =
- Konzentration 1 = - Konzentration 1 =
Konzentration Konzentration Konzentration - Konzentration -
-
1 1 1 1
= =
= =
125 110 100 90 75 SO 25 0 0 0 0
% % % % % % % % % % %
Edukt+ 0 % Produkt Edukt+ 0 % Produkt Edukt+ 0 % Produkt Edukt+ 0 % Produkt Edukt + 25 % Produkt Edukt + 50 % Produkt Edukt + 75 % Produkt Edukt + 90 % Produkt Edukt + 100 % Produkt Edukt + 110 % Produkt Edukt + 125 % Produkt
In Abb. 7-8 ist ein mogliches Vorgehen zur Bestimmung der Linearitat fur Reaktionskontrollengezeigt.
5. Da wo es moglich ist Ergebnisvalidierung anstreben, d. h. Richtigkeit mit Hilfe von Referenzmaterialien, Standards, Vergleichssubstanzen uberprufen. 6. Methoden vereinheitlichen und Parallelvalidierungen durchfuhren.
7. Man sollte sich fruh genug und unter Beriicksichtigung aller relevanter Faktoren - auch solcher, die erst in der Zukunft wirksam werden! - Gedanken um ein zweckmafiiges Methodendesign machen.
388
7 Urnfiing, Abkiufschernu, zeitlicher Abluuf und Kosten der Vulidieriing
1. BhdlBsung
'
IA-
T
U
U
Abb. 7-8MZigliches Vorgehcn Lur Bestimmung der Linearitat fur Reaktionskontrollen.
7.3 Kosten der Validierung und Ansiitze,fur deren Senkung
389
,,Grofle" Schritte, wirkliche Neuerungen sind nur moglich, wenn Bestehendes in Frage gestellt wird. Die Anwendung dieses generellen Grundsatzes sol1 nachfolgend fur die Analytik und speziell fur die Validierung kurz diskutiert werden. Der klassische Fall in der Analytik sieht in etwa so aus: Ein Verfahren wird kalibriert, anschliel3end eventuell modifiziert, um den eigenen Spezifikationen zu genugen. Zum Schlurj sind oft - ob berechtigt oder nicht, spielt in diesem Zusammenhang keine Rolle - zusatzliche Qualitatsanfordemngen einer Behorde oder die Buchstaben einer Norm zu beriicksichtigen. Durch diese Vorgehensweise wird die analytische Tatigkeit und die Methode selbst ,,aufgeblaht", die Gesamtkosten - nicht nur die Validierungskosten! - steigen. Vielleicht konnte man umgekehrt beginnen, und zwar mit der Fragestellung und nicht mit der Methode. Die Analytik wird dann um die konkrete Fragestellung herum aufgebaut, das Ziel ist ein optimiertes Analysendesign, OAD. Bereits jetzt, bei den verschiedenen Losungsentwurfen, konnen samtliche - auch zukunftige - Aspekte wie Kosten, Zeit, Anwenderfreundlichkeit, erwartete Anderungen bezuglich Matrix, Laborstruktur, Haufigkeit etc. und der dann sich daraus ergebende Validierungsumfang beriicksichtigt werden. Das bedeutet, alle bekannten - und in der Zukunft erwarteten - Fakten bestimmen fruh genug das Analysendesign. Das Analysendesign gewinnt, das den inhaltlichen Anfordemngen und den behordlichenl normativen Forderungen am besten genugen kann. Optimiertes Analysendesign ist schlank und frei von unnotigem Ballast, denn es wurde ja als maflgeschneiderte Losung fur den konkreten Fall entwickelt, s. Abb. 7-9.
Klassischer Ansatz in der Analytik
Klassische Methodenvalidierung : oft recht umfangreich Methode + Wunsche + Q-Anforderungen Optimiertes Analysen Design
Analysendesgn pant sich der gegebenen Situation an
I
0pt imierte Methodenvalidierung: ,,schIank",gerade ausreichend
Wunsche + Q-Anforderungen Abb. 7-9 Optimiertes Analysendesign OAD fuhrt zur ,,schlanken" Analytik und sornit zur ,,schlanken" Validierung.
\ (1) quantitativ /
bedingt
4
Reinheit
\
Abb. 7-10 Die Auswahl dcs Vcrfahrcns in Abhangigkcit von der Ziclsctzung.
(I)
GC-MS,GC-AES
DAD, LC-MS(MS)
Sulfatasche
Wie sauber ist es?
Schrnelzpunkl
Stabiliut
Urn wieviel Menge handelt es sich?
4
4
Wie stabil ist es nach x WochenIMonaten? Wie stabil ist es nach StreBtests?
- Titrirnetrie - UVvis - HPLC - Massenbilanzen
- Wassergehalt
- DAD, LC-MS(MS) - GC-MS, GC-AES - CE, CEC
I
I
/
Wieviel kann man uantitativ bestimmen? Bestimmungsgrenze
(Moglichkeiten der Miniaturisierung ausreizen)
- Head Space GC - Kapillar-, mikro LC
IdentitZt bei bekannten Proben
1st es wirklich?
- Wassergehalt - Dichte - Trockenverlust - IR, NlRS
- Mikroskopie Wieviel und was jgt drin? - FTlR - NMR SelektivitWdentitait bei - GC-MS. GC-AES. unbekannten Proben LC-DAD, LSMS(MS) - lmmunoassays
w
s--_
R
3 2
a
3
%
b
2
2.
=r
5
-.
tu
-2
3-
2
b
: -
cT
u
W 0
7.3 Kosten der Validierung und Ansiitze fur deren Senkung
39 1
Wenn in einem friihen Stadium der zukunftige (Va1idierungs)Aufwand als wichtiger Faktor in die Entscheidung fur oder gegen eine Methode hineinflierjt, hat man die Chance, eine optimale sprich: effektive und effiziente Analytik aufzubauen. Effektiv im Sinne der Wirksamkeit und effizient im Sinne der Wirtschaftlichkeit, mehr dazu s. weiter unten. Diese Vorgehensweise ist naturlich nur in F und E Bereichen moglich, das heirjt in Bereichen, in denen der Kunde ein Problem hat und Antworten auf seine Fragen erwartet - das ,,wie" interessiert ihn kaurn, der AnalytikerNalidierer hat freie Hand. Wenn der Kunde allerdings sein Problem mit einer bestimmten Methode gelost wissen will, so ist der Spielraum des Validierers geringer, er kann ,,nur" die vorgegebene Methode giinstig, effizient einsetzen. Fur eine kostengunstige Validierung gilt in diesem Fall das auf den vorangegangenen Seiten Aufgefuhrte. Fur Fragestellungen, wie im ersten Fall geschildert, sollten gegebenenfalls zwei, drei Methoden herangezogen werden, die jede fur sich einen Teil der Anforderungen optimal losen kann. Eine einzige Methode ware vielleicht uberdimensioniert und somit wurde die Analytik inkl. Validierung uberteuert. So mu6 beispielsweise eine Entscheidung bewusst unter Berucksichtigung von Raumnutzungskonzepten, Mitarbeiterstruktur, Haufigkeit und zeitliche Ubereinstimmung der Analysen, Gerateauslastungsgrad usw. gefallt werden [ 1 181: Sol1 z. B. die Methode so optimiert werden, darj gleichzeitig Identitat, Gehalt und Reinheit bestimmt werden, oder ist es fur dieses Labor okonomischer, drei getrennte Bestimmungen mit unterschiedlichen Methoden durchzufuhren, z. B. UV oder Titrimetrie fur Gehalt und HPLC fur Nebenkomponenten? Fur eine fiktive Probe ist ein Auswahl-Portfolio fur die ,,richtige" Methode abhangig von der Fragestellung in Abb. 7-10 beispielhaft dargestellt.
7.3.2 Fazit Jeder Schritt in der Analytik ist mit Zeit und somit Kosten verbunden. Das angestrebte Ziel sollte ein Analysendesign mit einem Minimum an Aufwand und einem Maximum an Information sein, siehe dazu Abb. 7- 1 1.
Probe
Information
Optimiertes Analysen Design ermoglicht neben der Effektivitafiffizienzsteigerung im Alltag - quasi als Nebenprodukt - eine schnelle, ,,intelligente" Validierung. Es folgen n u n beispielhaft einige Ansitze in Form von Fragen. Die Beantwortung solcher Fragen und das Suchen weiterer konnte unser aller Aufgabe sein wenn wir okonomisch vorgehen wollen und Okonomie ist ein Aspekt von Qualitat. -
-
M I $ Pri$ittrg cti!fLitiearifiitimrirer win? Die Analytik wird oft zum Monitoring eines (Produkti0ns)Prozesses eingesetzt. Man kann nun den gesamten ProzeB definieren, dabei werden kritische Schritte austindig gemacht und deren EinfluB auf das Ergebnis (mit einer eingebauten Sicherheit) abgeschitzt. Diese Analyse fuhrt zu Threshold-Werten, die fur dieseri ProzeB charakteristisch sind. lnnerhalb der vorgegebenen Threshold-Werte(Akzeptanz-Grenzen, ,,acceptance limits") ist das Versuchsobjekt ,,in-spec" siehe Abb. 7- 12. Und das ist ja die Information. die beniitigt wird. Mi@ iriirner Litiriiritiit oder Proportionulitat sein? Nein! Es sei hier noch einmal die Voraussetzung fur quantitatives Arbeiten formuliert: Fur quantitative Bestimmungen brauchen wir eine konstante Korrelation zwischen Konzentration und Signal. Mit Hilfe einer Graphik oder auf rechnerischem Weg, s. Abb. 3-3, kann dann fur das gemessene Signal der Probe die dazugehorende Konzentration ermittelt werden. Man sollte den Aufwand, um einen linear/proportionalen Zusammenhang zu erhalten (Anderung der experimentellen Bedingungen, Einengen des Konzentrationsbereichs, gewichtete Regression verwenden) kritisch hinterfragen.
Spezifikationsgrenze
Ublicher Bereich fur Linearitat, der z. B. von der ICH verlangt wird
Abb. 7-12 Spe~ilikationsgrcnzcund ublicher Mefjbereich. Wird ,,zu" vie1 gemessen?
7.4 Wie geht es weiter? -
-
393
MuJ fur eine Gehaltsbestimmung immer Chromatographie sein ? Quantitative Spektroskopie und Titrimetrie sind praziser und einfacher. Sogar die Kombination einer UV-Messung zur Gehattsbestimmung und eine fur die Nebenkomponenten optimierte HPLC-Methode kann unter Umstanden weniger Aufwand bedeuten als eine komplexe HPLC-Methode. MuJ ,,FleiP'' immer sein? Ein gut uberlegtes Design eines Systemeignungstests kann in der Routine die eigentliche Information liefern, ob namlich der GesamtprozeB (Instrument, Methode, Probe etc.) stabil ist. Ein robuster ProzeB minimiert den Prufaufwand. Das Ziel heiBt: Diagnose vor Messung. Der Vorschlag von IUPAC zur Implementierung einer internen Qualitatskontrolle sollte mehr Beachtung finden (s. M. Thompson in ,,Auswahl interessanter Artikel zu speziellen Themen", Anhang A8). Validierungsexperimente so konzipieren, daB sie ,,nur" die gewunschte Information liefern - die Kenntnis, was die Methode noch alles ,,kann", ist oft sekundar. Klassifizierung und Bundelung der Information kann eine exakte (und teure!) quantitative Aussage ersetzen. Multivariate Analyse sollte mehr in den Vordergrund gestellt werden, s. auch Abschnitt 6.6. Das Prinzip: Schnelle, einfache Tests (Spektroskopie, Sensorik, Leitrahigkeit usw.) liefern charakteristische Zahlenwerte von der betreffenden Substanz. Die Kombination dieser Informationen fuhrt zu einer individuellen Zahlenkombination oder Graphik (bei entsprechender Darstellung der Werte in einem 3-D-Plott) oder Kombination beider. Eine Information in dieser Form ist zuverlassiger und gleichzeitig auch empfindlicher gegen etwaige Veranderungen als eine eindimensionale GroBe. Auf eine solche Moglichkeit von verdichteter Information wurde bei der ,,Selektivitat", siehe Abschnitt 3.6., hingewiesen. Die Frage lautet: Konnte vielleicht eine Klassifizierung von Informationen in einem friihen Stadium (on-line/in-line?) aufwendige Schritte in der Analytik z. B. Einsatz von Trenntechniken teilweise ersetzen?, s. auch Abschnitt 7.4.
Was kann nun der Analytiker vor Ort konkret tun, um dem Aspekt der Okonomie Rechnung zu tragen? In Tab. 7-9 werden einige Vorschlage/Ansatze vorgestellt, die direkt oder indirekt zu einer okonomischen Validierung fuhren konnen.
394
7 Umjung, Abluufschema, zeitlicher Abluuf und Kosren der Vulidieriing
Tab. 7-9 Der Aspekt der Okonomie bei den einzelnen Validierungselementen. Validierungsparameter
Vorschlage fur Okonomie bei Validierungcn
Priizision
AuRer in der Produktionsanalytik (Enge Spezifikationsgrenzen, Methodenf'ahigkeit, s. Abschnitt 3.1 1 .) konnte vielfach die Information .,V, kleiner als . . ." ausreichend sein.
Richtigkeit
Sehr wichtig: Qualitat von Standards uberprufen oder uberprufen lassen. Dazu gehort: tatsachlicher vs.deklarierter Gehalt, Stabilitat, Haltbarkeit etc.
Linearitat
Das Wissen um die Streuung der Werte bei unterschiedlichen Konzentrationen ist wichtig: Es sol1 Varianzenhomogenitat bewiesen oder mit einer gewichteten Regression gearbeitet werden. Mu13 auf Linearitat uberhaupt gepruft werden'? Wenn ja, muR es ,,Linearitat" sein? Wenn ja und wenn lineare Regression gegeben ist, Wiederholprazision, Selektivitat, Bestimmungsgrenze, Linearitat, Richtigkeit in einem kombinierten Arheitsschritt uberprufen.
Bestimmungsgrcnze
Sic kann und sollte individuell festgelegt werden, ,,worst-case"Prinzip anwenden, ,,was passiert, wenn . . .''
Robustheit
Aus praktischer Sicht vielleicht das wichtigste Kriterium fur die Eignung einer Methode im Alltag - bitte gebuhrend uberprufen! Absolutes, generelles ,,MuB": Methodenrobustheit und ausgewahlte Experi mente zur Laborprlzi sion. Mehrere Labors involviert'? 3 Vergleichsprazision Bei Bedarf Verfahrens- und Chemikalienstabilitat
Selektivi tat
Wenn folgende zwei Aspekte zutreffen, ist eine grundliche Uberpru fung der Selektivitat cine goldrichtige Investition: Trenntechniken und wichtige (unbekannte) Probe.
Eine off-line/on-line spektroskopische Uberprufung der Fraktionen (LS-MS, LC-NMR, LC-FTIR) oder/und cine weitere chromatographische Abtrennung mit einem effizienteren/selektiveren Verfahren inag einen Aufwand von zwei Mannwochen bzw. 5000-8000 Euro bedeuten. Dies ist jcdoch nur ein geringer Aufwand im Vergleich zu dein, der entsteht, wenn sich der Peak erst wesentlich spater als nicht homogen herausstellt.
7.4 Wie geht es weiter?
7.4
395
Wie geht es weiter?
Die Frage, wie es mit der Validierung weiter geht, ist verknupft mit der Frage, wie es mit der Analytik weiter geht. Die auf uns moglicherweise zukommende Entwicklung wird nachfolgend sehr komprimiert dargestellt und zwar nur in dem MalJe, wie es notwendig ist, um daraus den zukiinftigen Validierungsbedarf in groben Ziigen ableiten zu konnen, s. Tab. 7- 10. Tab. 7-10 Wichtige analytische Felder in der Zukunft (Auswahl). Analytische Felder mit wachsender Bedeutung
Zielsetzung/Anwendungsgebiet
Nanotechnik, Mikrostrukturtechnik, Chiptechnologie
Sehr schnelle Information bei ausreichender Selektivitat und niedriger Nachweisgrenze
Messungen in real-time
Studium von Reaktionen an Oberflachen; Reaktionskinetik, Molekularbewegung, Konfigurationsanderungen mit einer Auflosung im Pikosekundenbereich
Charakterisierung von Makromolekulen
Bei der Herstellung neuer Materialien ist die Untersuchung von makromolekularen Strukturen unentbehrlich
Charakterisierung von Biopolymeren und Biomolekulen in geringsten Mengen, Proteoinics, Genomics
Informationen uber die tertiare Struktur von Biopolymeren und Prufung auf Bioaktivitat/Bioaquivalenz; Diagnostik, Grundlagenforschung
Kombinatorische Experimente in zellularen Systemen
Entwicklung neuer Wirkstoffe fur Pharma und Pflanzenschutz
Spezifische Trenntechniken
Trennung von optischen, Konformations- und Strukturisomeren sowie Trennung von organischen Molekulen mit sehr ahnlichen chemischen Eigenschaften
Entwicklung neuer Immunoassays, Elisas, Westernblotts, Struktur-Wirkungsbeziehungen
Ahnlichkeitsanalyse, hochste Spezifitat avisiert
Diese Entwicklung bedarf Techniken rnit einem z. T. veranderten Analysendesign als dem heutigenh Tab. 7- 1 1 sind einige Beispiele aufgefuhrt.
396
7 Umfung,Ablnufrihrmcr, zeitlii her Abluuf und K o ~ t e nder Vulidierung
Tab. 7-11 Notwendigcs Analysendesign fur die Belange der Analytik in der Zukunft (Auswahl). Anal ysendesign
Ergebnis, Vorteile
Vollstandige Extraktion der Analyten aus diversen Matrices und dies bei relativ geringem Optimierungsaufwand durch Anwendung spezieller Extraktionstechniken wie uberkritische, Mikrowellen-, heilk und beschleunigte Extraktion
Weitgehendst matrix-unabhangige Analytik
Mijglichst umfangreiches spezifisches Datenmaterial der betreffenden Analyten und Erstellung von kombinierten 3D-Modellen aus spektroskopischen, chroinatographischen und physikalischcn Daten
Relativ einfache Identifizierung von Komponenten, der Bedarf an Referenzsubstanzcn nimmt ah.
On-line und real-time Analytik zur Umweltund ProzeBkontrolle Systcme mit multifunktionalen chemischen Sensoren, Fiberglasoptik und Massenspektronietern, optischen Spcktrometern und Separationssystemen in miniaturisierter Form
Sicheres, schnelles, kosteneffektives ProzeMund Urnweltmonitoring
Anwendung von temperatur-programmierbaren, selbstkalibrierenden, nicht verschmutzbaren, Multiclement-SensorArrays
Sensor-Array in1 Multiphasen/Multikomponenten ProteRstrom fcst installiert
Komhinierte on-line Systeme, die folgende Schritte crlauben: Probenvorbereitung, Gruppentrcnnung, Kornponentcntrennung, Detektion, evtl. Fraktionierung und Datenanalyse
Schnelle, prilzisc und selektive Trcnnung einzelner Komponenten, handling einer groDen Anzahl von Proben miiglich
VGllig automatische, robuste, selhstkalibriercnde und volktiindig vernetzte analytische S y s t e m fiir die Routine
Zuverlassige, prazise und kostengunstigc Analytik, Parallclbcstimniungen
Implementierung vorhandener Informationen und hewahrter Modelle in das analytische System, d. h. Verkniipfung von informationstheorctischen Erkenntnissen mit dem MeBwcrt. Das bedeutet konkret, Einbindung folgender tools in d a s h w . mit dcm analytischc(n) Instrument: kunstliche Intelligenz, neuronale Netzwcrke, on-line Datenverdichtung nach dcr Fuzzy-Logic und anschlielknd Vergleich der Daten via Internet mit abgelegten Daten - evtl. nach einer automatischen Auawahl der in Frage kommenden Datenbank(en), Analyse der Rohdaten nach hijheren Ordnungen mit Hilfe von genctischen Algorithmen
Vielfiltigc Vorteile, nachfolgend werden zwei genannt. 1. Die ,,Unmengen" an Daten, die hei kom-
plexen Proben anfallcn und auch zu deren Charakterisierung notwendig sind, werden ,,handelbar". Mit Hilfe von leistungsstarken Computern k6nnen aus den Daten AnalysenStrategien cntwickelt werden (OAD, Optimiertes Analysendesign), um die Anzahl der Messungen zu reduziercn.
2. In einer zweitcn Phase werden automatisch die in Frage kommenden Gerate ausgewahlt und gesteucrt, die Daten werden erneut bcwcrtet usw.
7.4 Wie geht es weiterP
397
Zusammenfassend sieht die mittei- bis langfristige Entwicklung in etwa folgendermaBen aus: Weitere Verlagerung der ProzeO-lQualitltskontrollevom Labor hin zur Produktionsstatte - moglichst on-line oder sogar in-line, automatisiert und in Ruckkoppelung mit dem ProzeB. On-linehn-line Messungen werden immer mehr zu einem integralen Teil des Produktionsprozesses. Eine Reihe von Messungen erfolgt weitgehend matrix-unabhangig. Probenvorbereitungsschritte werden in der Routineanalytik immer rarer. Einzelne Molekule und Molekulgruppen werden zu identifizieren sein. Daruber hinaus werden auch kleine Anderungen des physikalischen und chemischen Zustandes durch sehr schnelle Spektroskopie und durch Einsatz von Sensorenarrays erfal3bar. Die Analysenzeit nimmt im Vergleich zu heute um ca. Faktor 10-100 oder sogar mehr ab. Makromolekulare Strukturen werden routinemaRig aufgeklart z. B. mit Hilfe der Kristallographie und der Resonanzspektroskopie. Durch die Implementierung von Sensoren und schneller, hochauflosender Spektroskopie in on-linehn-line Anwendungen wird fur eine wachsende Zahl von Fallen der klassische Ansatz: Probenahme, Trennung, Detektion entfallen. In Kurze konnten SEVA-Sensoren (JEVA": Selbstvalidierung) industriell eingesetzt werden. SEVA-Sensorsysteme generieren im Bedarfsfall anhand von gespeicherten historischen Daten und mit Hilfe eines Algorithmus einen validierten Unsicherheitsfaktor, der - wahrend der ProzeB lauft - den tatsachlichen Wert, z. B. Temperatur, einschatzt. Die traditionellen Trenntechniken verlieren langsam aber stetig an Bedeutung. Dort wo es sinnvoll und moglich ist, erfolgt eine Verlagerung von der ,,Chemie", z. B. der Chromatographie, zu der ,,Physik", z. B. der Spektroskopie. Erste Anzeichen dafur findet man bei der Kopplung LC-MS(MS). Dort ist der ,,LC"Term bereits heute vielfach der ,,unwichtigere" Part. In Bereichen wie Eingangskontrolle, ProzeBmonitoring, Grenzwertbestimmung sind spezifische Prufungen (NIRS, Farbreaktionen, Sensoren) im Aufmarsch. Die Spezifitat sowohl im Sinne der Spektroskopie als auch in Form von spezifischen Wechselwirkungen an Oberflachen wird immer mehr Beachtung genieBen. Fur die Routine werden robuste ISK-Prozesse angestrebt. Das avisierte Ziel heil3t Maximierung des Terms (In~~rmutionsdichte pro Zeiteinheit).
Dies ist zu erreichen durch ein permanentes Hinterfragen der erzielten Effektivitat (d. h. Wirksamkeit: richtige Auswahl der Mittel, ,,mache ich das Richtige?") und Effizienz (d. h. Wirtschaftlichkeit: richtiger Einsatz der Mittel, ,,mache ich es richtig?") [4]. Das Tempo fur diese Veranderungen hangt naturgemal3 von vielen Faktoren ab. So wird u. a. von g r o k r Bedeutung sein, in welchem M a k Reglementierungen weiterhin als Bremse fungieren und wie durch den wirtschaftlichen Druck das technisch Machbare auch tatsachlich realisiert wird. Sollte nun das oben vorgestellte Szenario tatsachlich eintreten, so sahe der zukunftige Validierungsbedarf wie folgt aus: Uberall dort, wo ,,Chemie" im Spiel ist, wird die Selekfivitufein zentrales Thema bleiben. Die Suche nach Analyten in geringsten Mengen wird weiter gehen, somit bleibt die Erfussungs-/Bestimmungsgrenzeebenfalls ein
398
7 Umfting, Ahlciufschemci, 7eitlicher Ahluuf und Kosten der Wilidieutitq
zentrales Thema. In dem MaBe wie das analytische Instrumentarium komplexer oder auch nur vielfaltiger wird gebuhrt der Gerltequalifizierung besondere Beachtung. Aspekte wie erweiterte Unsicherheit und Methodenstabilitiit gewinnen an Bedeutung.
Fuzit und Aushlick: Die Differenzierung zwischen Trenntechniken - in der Zukunft verstarkt im Kopplungsmodus und/oder in miniaturisierter Form - und Bestimmungsmethoden wird immer st&kere Konturen aufweisen. Es wird mit einer Verlagerung von den Ersteren zu den Zweiten erwartet. Ein schnelles ROI (,,return of Investment") rechtfertigt diesbezuglich auch hohe Investitionen. Wachsende Bedeutung fur die Analytik der Zukunft aus Validierungssicht werden nach Ansicht des Autors die Elemente ,,Robustheit" und ,,Spezifitat" erlangen. Damit wird den Forderungen in den zwei Bereichen Routine und Forschung Rechnung getragen. Nur Verfahren bzw. Verfahrenkombinationen rnit diesen Charakteristika werden bedeutsam bleiben oder werden. Ein moglicher Einwand konnte hier lauten; Linearitat und Nachweisgrenze (Bestimmungsgrenze) werden auch zukunftig wichtige Forderungen darstellen. Selbstverstindlich bleibt das so. Doch dazu folgende zwei Gedanken: Bei einem robusten Verfahren schwanken die Signalwerte fur eine bestimmte Konzentration nur gering. Fur die mich interessierenden Konzentrationsniveaus bekomme ich immer wieder die gleichen Signalwerte, es existiert also eine charakteristische konstante Korrelation zwischen Konzentration und Signal. Und exakt das ist, was zahlt! Die Forderung nach ,,Linearitat" wird somit unwichtiger bzw. unnotig. Moglicherweise sind einzelne Messungen in Form von Stichproben ausreichend, s. Abb. 7- 12. Gelingt es weiterhin, spezifische Messungen durchzufuhren, gestaltet sich der ,,Kampf' um Nachweisgrenzen einfacher. Im Spurenbereich nimmt rnit dem Grad der Spezifitat die Wichtigkeit des Elements ,,Prazision" ab. Somit kann indirekt die Nachweisgrenze (Bestimmungsgrenze) herabgesetzt werden. So in der Natur: In biologischen Systemen herrscht eine Spezifitat, deren Grad wir erst jetzt langsam beginnen zu begreifen. Und schlieBlich geht es dort oft um winzigste Mengen! In dem MaBe, wie wir Spezifitat voraussetzen konnen, in gleichem MaBe wird auch die Frage nach der Richtigkeit immer unkritischer. Kommen wir nach diesem Austlug in die (nahekrne?) Zukunft wieder zum ,,Jetzt" und iiberlegen uns, was wir heute eventuell andern konnten. Ein Beispiel wie man bewahrte, aber unter ganzheitlicher Sicht vielleicht nicht ganz optimale Pfade verlassen kann, wird nachfolgend von Dr. Stephan Kuppers, Schering AG, Berlin vorgestellt. Es geht um die Implernentierung eines Qualitatsprozesses fur die Routinebestirnmung von Restlosemitteln in Pharmawirkstoffen und deren Zwischenprodukten. Die Prufung von Restlosemitteln in der pharmazeutischen Industrie wird derzeit in der Regel mit der Gaschromatographie durchgefuhrt. Dazu wird die Probe in einem guten Losernittel, typischerweise Wasser, DMF oder DMA gelost. Es wird ein Standard hergestellt, indem man das oder die gesuchten Losemittel ebenfalls in dem gleichen Losemittel in der Konzentration der Spezifikationsgrenze lost. Die gaschromatographische Analyse erfolgt meist mit der Kapillar-GC. Die meisten Pharmakopoe-Methoden schlagen als Saule die DB 624 vor. Da die DB 624 eine hohe Trennselektivitat aufweist, kann rnit einem Temperaturprogramm fast der gesamte Bereich der verwendeten Losemittel abgedeckt werden. Die
7.4 Wie geht es wuiter?
399
Tab. 7-12 Klassischer Ablauf einer Losemittelanalyse. Unsicherhei tsquellen Einwiegen des Standards Einwiegen der Proben Analyse der Standards (min. 10 lnjektionen und der Proben im GC) Auswertung der Standards und der Proben System Suitability Auswertung Dokumentation
Auswertung erfolgt in der Regel mit einer Auswertesoftware, die die gesuchten Losemittel quantifiziert. Neben der Dokumentation folgt jetzt die manuelle Priifung, ob unbekannte Losemittel in der Chromatographie beobachtet werden. Falls dem so ist mu13 erneut analysiert und quantifiziert werden. Der Arbeitsaufwand fur eine spezifikationsgerechte Probe gemal3 diesem Ablauf (Tab. 7-12) betragt ca. 70 min. Die Methode ist technisch gesehen bei Verwendung eines Headspace-Samplers zur Probenaufgabe extrem stabil. Retentionszeiten weisen z. T. uber ein Jahr einen Variationskoeffizienten von nur ca. 0,l % auf. Die Saule selbst weist keine nachweisbaren Verluste an Selektivitat oder Auflosung auf. Zwei regulatorische Forderungen stellen fur diesen Prozea ein Problem dar: der Nachweis der Eignung des Gesamtsystems fur die beabsichtigte Verwendung (Systemeignungstest) - die Forderung nach der Verwendung kalibrierter Gerate.
-
Als Systemeignung wird haufig die Standardabweichung fur eine Mehrfachinjektion limitiert. Die Systemeignung 1aBt sich im Prinzip jedoch nur an der Analyse eines Referenzmaterials mit einem akzeptierten Wert nachweisen, da der oben genannte ,,system suitability test" lediglich die Reproduzierbarkeit der Standards nachweist. Dieser Nachweis gilt zudem nur fur ein Losemittel und einen Tag. In Dimensionen der Messunsicherheit gesprochen werden lediglich die Unsicherheitsbeitrage der Wagung und des Samplings berucksichtigt, nicht jedoch zeitabhangige Unsicherheitsbeitrage. Die Kalibrierung eines Gerates wird zwar im Prinzip heute von den Gerateherstellern als ,,kostenintensiver" Service angeboten. Es bestehen jedoch auch in diesem Fall zwei Dilemas: die Kalibrierung bezieht sich nicht auf die verwendete Methode, sondern auf die Herstellerspezifi kationen des Gerates - die Kalibrierung ist nur fur den ,,Augenblick" der Durchfuhrung gultig. -
Insbesondere bei der Geratekalibrierung wird somit haufig ein kosten- und zeitaufwendiges ,,Muster ohne Wert" erzeugt, da diese nicht in Zusammenhang mit der beabsichtigen
Anwendung gebracht wird. Besonders dann, wenn die Durchfiihrttng ( 7 . B. jiihrlich) am GC durchgefuhrt wird, ohne daB eine Korrelation zwischen Geratekalibrierung und Methode hergestellt wird. Im folgenden wird ein systematisch auf Qualitiit aufbauender ProzeR vorgeschlagen. Am Beginn eines Qualitltsprozesses steht die Kalibrierung des Geriites durch den Hersteller. Hierbei weist der Hersteller nach, da13 das Gerat den Herstellerspezifikationen entspricht. Diese findet am I.Tag eines Analysenzyklus (z. B. ein Jahr) statt. Nach der Kalibrierung des Geriites findet die Kalibrierung fur die Methode statt. Dazu wird ein Liisemittelgemisch mit allen zu erwartenden Liisemitteln zur Kalibrierung verwendet. Da dieser Prot.eB nicht tiiglich, sondern einmalig pro Jahr erfolgt kann problemlos eine Kalibrierung mit 100 Standardinjektionen erfolgen (statt tlglich mit 10).Es wird dadurch eine sehr vie1 kleinere Standardabweichung gefunden und die Verringerung des zufiilligen Fehlers fuhrt zudem zu einem Kalibrierfaktor, der deutlich naher am sogenannten ,.wahren Wert" liegt. Abb. 7-13. -
Nach der Kalibrierung der Methode wird deren Gultigkeit durch die Analyse eines Referenzmaterials durchgefuhrt (Systemeignungstest). Die Sechsfachbestimmung ergibt einen Nachweis der Richtigkeit und die Standardabweichung zeigt die Schwankungsbreite des Systems an. Letztere sollte sich nicht wesentlich von der Unsicherheit des Referenzmaterials unterscheiden. Ah jetzt kann die Analyse der Proben beginnen. Eine Prufung des Status des Gesamtsystems in regelmiil3igenAbstanden (z. B. tiiglich) schliel3t den Prozel3 ab. Die tlgliche Statusprufung kann durch die einmalige Analyse des
,,wahrer Wert"
+
It
n
fur die Probenberechnung verwendete Kalibrierungsfaktoren
Abh. 7-13 Zur Qualitat der Analytik in Ahhiingigkcit von dcr Hauligkeit der Kalibrierung
7.4 Wie geht es weiter?
401
Referenzmaterials erfolgen. Der gefundene Wert wird in eine Regelkarte eingetragen und zeigt die Systemeignung an. Eine Rekalibrierung des Gerates oder der Methode kann solange unterbleiben wie der ,,under control" Status nachgewiesen werden kann (praktisch: wenn der gefundene Gehalt fur das Referenzmaterial innerhalb der Regelgrenzen liegt, kann mit der Messung von Proben unter Verwendung der Kalibrierung fortgefahren werden). Als Einsparung wird die tagliche Kalibrierung erreicht. Die Verwendung eines zertifizierten Referenzmaterials als Qualitatskontrollprobe hat hierbei mehrere Vorteile: Es wird eine Ruckfuhrung der Methode auf nationale Normale durchgefuhrt. Dabei wird ein Richtigkeitsnachweis fur die Methode in das System eingefuhrt. Die Eintragung des erhaltenen MeBwertes in eine Regelkarte erlaubt den Nachweis der Stabilitat der Methode uber langere Zeit und erhoht damit den Aussagegehalt des Analysenwertes bei Entwicklungs- und Produktionsprozessen, bei denen Aussage aus Daten uber einen langeren Zeitraum gewonnen werden. Der Vergleich zwischen verschiedenen Labors und den Daten, die in den verschiedenen Labors erzeugt werden, ist sehr einfach, wenn alle Labors das gleiche Referenzmaterial verwenden. Es wird zudem eine sinnvolle Einbindung der Kalibrierung des Gerates erreicht. Die Qualitat des Gesamtsystems wird in mehreren Dimensionen verbessert:
- die Prazision der Kalibrierung nimmt zu
die Richtigkeit ersetzt als Systemeignung einen Reproduzierbarkeitstest. die Regelkarte zeigt die Wiederholbarkeit des Verfahrens an - die Analysendauer (Antwortzeit zwischen Probeneingang und Ergebnisausgang) wird halbiert, da nicht mehr taglich kalibriert werden mu13 - die Kosten sinken deutlich. -
Die Details des Qualitatsprozesses finden sich in Tab. 7-13. Tab. 7-14 zeigt die beiden Prozesse im Detail mit den zugehorigen Aufwanden und Unsicherheitsquellen.
402
7 Umfung,Ablui!f.\(hemu, ieitlicher Abbuf und Koyten der Kilidierunx
Tab. 7-13 Optimierter Prozcl.3 fur die Liisemittelanalytik. ~
~
Unsicherhei tsquellen 1. Kalenderwoche des Analysenzyklus -
Geratekalibrierung durch den Hersteller
-
Einwiegen von 2 Standards mit allen erwarteten Losemitteln (Gesamtstandards)
-
Analyse des Gesamtstandards (ca. 100 Injektionen) zur Bestimmung der Kalibrierfaktoren
-
Einwiegen und sechsfach Analyse des Referenzmaterials
-
Dokumentation des Status des Systems, Anlegen ciner Regelkarte
2.-SO. Kalenderwoche, taglicher Ablauf Einwiegen und analysieren des Referenzmaterials
-
Einwiegen und analysieren der Proben
-
System Suitability Auswertung, Regelkarte!
-
Dokumentation der Ergebnisse
Tab. 7-14 Vcrgleich der Prozesse in Bezug auf charakteristische Kcnngrokn. Charakteristische KenngriiUe
alter ProzeB ~~
minimale Antwortzeit* (Dauer fur Einwaage, Analyse u. Auswertung u. Dokumentation)
neuer ProLeR ~
340 min.
125 min.
I 0 min.
35 min.*'K
Unsicherheitsbeitrag der Standards Kosten pro Analyse (Einwaagen, Auswertung und Dokumentation) Unsicherheitsquellen regulatorische KenngrdBen
* ohne Verzicht auf GMP-Konfomitat und Qualitat im Sinne von Priizision und Richtigkeit ** zuhPtzlich mussen 30 Stunden Arbeitszeit vom Beginn dec MeBzyklus an auf alle Proben vertcilt werden. Bei Verwcndung des Gesamtstandards laBt sich die Auswertung stark automatisicrcn.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
8
Uber die Einsatzmoglichkeit der statistischen ProzelSkontrolle, SPC, in der Analytik
Rolf Staal, Aventis, Frankfurt
8.1
Validierung - und was kommt danach?
In den vorhergegangenen Abschnitten wurde auf die praktischen Aspekte der Validierung ausfuhrlich eingegangen. Im folgenden sol1 die Frage gestellt werden, was mit einem validierten ProzeB, einer validierten Vorgehensweise oder einer validierten Praktik in der Zeit nach der Validierung passiert. Prozesse als Validierungsobjekte Das, was einer vdlidierung unterzogen wird, kann auch als ProzeB betrachtet werden, da in praktisch allen Fallen der Mensch, die Methode, das Material und die Maschine mehr oder weniger stark beteiligt sind. Als Beispiel hierfur wird erwahnt: Die Reinigung einer Produktionsanlage zur Herstellung von Dragees, die Analysenmethode zur Bestimmung des Wirkstoffgehaltes, die Vorgehensweise zur Stichprobenauswahl in der Qualitatssicherung. In allen Fallen ist das Ergebnis des Prozesses ein Produkt oder eine Dienstleistung oder eine Kombination aus Produkt und Dienstleistung. Diese Prozesse laufen wiederholt ab, wobei zwischendurch kleinere oder grol3ere Abstande liegen konnen, in denen andere Prozesse oder parallele Prozesse ablaufen. So werden z. B. bestimmte Dragees in Kampagnen hergestellt, da die Kapazitat der Maschinen grol3er ist als der Bedarf. Dafur werden in der Zeit zwischen den Kampagnen andere Produkte in den Anlagen hergestellt. Ein weiteres Beispiel kann man sich im Labor vorstellen, in welchem fur die Zeit der Produktion eine ganz bestimmte Analysenmethode zur Anwendung kommt. Bei allen kontinuierlichen und bei den hier erwiihnten unterbrochenen (diskontinuierlichen) Prozessen geht man davon aus, daB sie sich in beabsichtigter Weise verhalten und die Ergebnisse den Erwartungen entsprechen. Wenn Prozesse einmal validiert sind, verbleiben sie in einem solchen Zustand? Wenn ja, wie lange? Was passiert mit den Alterungserscheinungen, Materialermudungen, Korrosion, Abnutzungen, VerschleiS? Welche Hinweise oder Indikatoren gibt es, rechtzeitig Information zu erhalten, wenn sich Prozesse andern oder anfangen, sich zu andern?
404
8 Ubvr die Einsntmiiglichkeit der statistischen ProzeJlkontrollr. SPC, in der Analytik
Der Faktor Zeit wahrend und nach der Validierung Wie bereits weiter oben erwiihnt, besteht die Validierung - auf hohem Abstraktionsniveau ausgedruckt - in der Feststellung der Giiltigkeifeines Prozesses. Die damit verbundenen Tatigkeiten finden in einem bestimmten Zeitraum statt. Wurde die Validierung so breit angelegt, daB alle Parameter, welche einen EinfluB auf das Ergebnis ausiiben konnen, eine Chance gehabt haben, am ProzeB teilzunehmen? Hat die Zeit der Validierung hierfur ausgereicht? 1st eine Extrapolation von dieser Kurzzeitbetrachtung auf die Zukunft statthaft und sinnvoll? Hat man wahrend der Zeit der Validierung die Prozesse auf seine Vorhersagbarkeit hin untersucht? 1st der ProzeB frei von unnaturlicher Variabilitat bzw. ist der ProzeR in statistischer Kontrolle, ISK? Neben dieser Kurzzeitbetrachtung der Vaiidierungsphase kann aul3erdem die Zeit nach der Validierung einen erheblichen EinfluB auf die Prozesse ausuben, was sich bei den Maschinen und Anlagen, der Methode, dem zur Anwendung kommenden Material und auch bei den am ProzeB beteiligten Mitarbeitern ausdrucken kann. Die Maschine Kommen nach der Validierung eventuell Maschinen und Anlagen oder Anlagenteile zum Einsatz, welche nicht direkt der Validierung unterzogen wurden? Man denke z. B. an die Anzahl von MeRburetten, Glaskolben, Wageeinrichtungen, Filtrationsautomaten, Anlagen zur Probenahme und man denke auch an die Nachbarlaboratorien, Zweigniederlassungen, welche diesen ProzeB benutzen. Ferner unterliegen alle Prozesse und damit auch die zur Anwendung kommenden Maschinen und Anlagen Alterungsprozessen. Werden die Einflusse der Alterungsprozesse zurn richtigen Zeitpunkt erkannt und haben sie einen EinfluB auf das Ergebnis des (validierten) Prozesses? Die Methode Hiiufig werden in der Industrie MeBsysteme, Analysen- und Bestimmungsmethoden nach einer Norm oder sonstigen Regelwerken festgelegt. Diese existieren haufig uber einen langen Zeitraum. Wahrenddessen kann aber die Spezifikation durchaus geandert werden. Haufig werden die Bandbreiten enger gesetzt. Reicht dann immer noch die Prazision des (validierten) MeBverfahrens aus, urn gesicherte Ergebnisse zu liefern? 1st die Schwankungsbreite des MeBverfahrens unter I5 % der Schwankungsbreite der Spezifikation, der ProzeBschwankungsbreite oder des Grenzwertes? Sind alle Parameter der Methode, welche einen EinfluB auf das Ergebnis haben konnen, bekannt und sind diese so geregelt, daB sie das Ergebnis nicht unvorhersagbar beeinflussen? Wurde die Methode bei der Validierung auf unnaturliche Variabilitat gepruft? War die Methode und ist sie immer noch in statistischer Kontrolle? Das Material Die bei den Prozessen zur Anwendung kommenden Materialien werden, sofern es sich um Vorprodukte, Wirkstoffe, Reagenzien, Referenzmaterialien handelt, entsprechenden Prufungen unterzogen. Auch hier darf die Frage gestellt werden, ob diese Materialien sich
8. I Validierung - und was kommt dunach?
40.5
uber die Zeit andern. Dies konnen z. B. langsame Zersetzungsprozesse sein oder Anderungen, welche sich aus dem Verbrauch ergeben, wenn Ersatzmaterial besorgt wird. Ferner sei an die Prufungsintervalle erinnert. Haufig wird ein KompromiB zwischen Aufwand und Risiko gefunden. Einerseits mochte man das Risiko gering halten, dies wurde kurze Prufintervalle, verbunden mit hohem Aufwand bedeuten. Andererseits mochte man den Aufwand minimieren, was jedoch ein erhohtes Risiko bedeutet. Falls sich uber die Zeit Anderungen vom eingesetzten Material ergeben, ist man durchaus bestrebt, diese rechtzeitig zu erfahren, um entsprechende Korrekturen durchzufuhren. Faktor Mensch Auch die Mitarbeiter sind manchmal Ursache fur ProzeBanderungen, wobei diese moglicherweise sich erst im Laufe der Zeit bemerkbar machen konnen. Vielleicht sind die Personen, welche zum spateren Zeitpunkt an den Prozessen beteiligt sind, nicht identisch mit jenen, die zur Zeit der Validierung beteiligt waren. Weiterhin gibt es unterschiedliche Ausbildungen, Urlaubszeiten, temporare Mitarbeiter, - Grunde fur ProzeBanderungen. Auch darf die Frage gestellt werden, ob die Sorgfalt und Aufmerksamkeit bei der Validierung identisch ist mit der Sorgfalt und Aufmerksamkeit der spateren ProzeRroutine.
8.1.1
Konsequenzen - das Werkzeug statistische ProzeBkontrolle, SPC
Die Validierungsaktivitaten geben zutreffende Aussagen uber die untersuchten Prozesse fur den Zeitraum der Validierung und fur die gewahlten Validierungsbedingungen. Die Konstanz der validierten Prozesse, besonders fur die Zukunft, muB kritisch gesehen werden, da Alterungsprozesse standig auf alle Prozesse einwirken. Unbekannt ist hierbei haufig, wann sich diese Alterungsprozesse auf das Ergebnis der Prozesse bemerkbar machen, d. h. ihr EinfluB signifikant wird. Die statistische ProzeBkontrolle (SPC) ist ein Handwerkszeug, um die Variabilitat eines Prozesses uber die Zeit zu beschreiben, zu messen, zu beurteilen und zu verringern. Ein ProzeB wird definiert als eine Anzahl gezielter, sich wiederholender Vorgange, deren Zusammenwirken zu einem angestrebten Resultat fuhren soll, s. Abb. 8-1. Man unterscheidet kontinuierliche und diskontinuierliche, Fertigungs- und Dienstleistungsprozesse. EingangsgroRen bei diesen Prozessen sind, wie oben dargestellt, der Mensch, die Methode, die Maschine und das Material. Die Beurteilung eines Prozesses erfolgt durch das standige Messen des ProzeBergebnisses sowie die Interpretation dieser Daten. Auch wenn die EingangsgroBen konstant gehalten werden, wird das Ergebnis, bei genugender Prazision des MeBverfahrens, eine gewisse Streuung aufweisen. Diese Streuung oder naturliche Variabilitat wird idealerweise dem Zufallsprinzip entsprechen und uber die Zeit konstant sein. Ein solcher (stochastischer) ProzeB ist mathematisch beschreibbar und wurde ein vorhersagbares Verhalten haben. Dieser ProzeB ist dann in statistischer Kontrolle, es handelt sich um einen ISK-ProzeB. Die Natur wirkt standig auf alle Prozesse ein und versucht z. B. durch Alterungsvorgange zusatzlich zu der naturlichen Variabilitat noch die sogenannte unnaturliche Variabilitat zu erzeugen. Man denke an die Elektrode, welche nach einer Zeit der Benutzung eine
-
406
8 Uber die Einsatzmnglichkeit der stotistischen ProzeJkontrolle. SPC, in der Anulytik
ProzeO
Mensch
Methode
Material
Maschine
FertigungsprozeR DienstleistungsprozeR Kontinuierlicher ProzeR
___)
Ergebnis
Diskontinuierlicher ProzeR
lnpuf
output
Abb. 8-1 Schema eines Prozesses.
gelnderte Steilheit und eine Nullpunktverschiebung aufweist. Oder man stelle sich einen Katalysator vor, der ganz langsam durch Spurengifte in seiner Wirkung nachlaBt, bis die katalytische Wirkung sich signifikant andert. Auch die Kugellager in einem PKW sind dem Alterungsprozefi unterworfen und werden nach einigen hunderttausend Kilometern versagen und damit ihre Variabilitat stark andern. Diese unnaturliche Variabilitat ist nicht vorhersagbar und mathematisch nicht beschreibbar. Verfugt ein ProzeB zusatzlich uber diese unnaturliche Variabilitat, so ist er nicht vorhersagbar, nicht in statistischer Kontrolle, es handelt sich dann um einen NISK-ProzeJ. In der Praxis wird die statistische ProzeBkontrolle nach Shewhart benutzt, um die Prozesse zu beurteilen und standig zu verbessern. Neben der naturlichen Variabilitat wird unnaturliche Variabilitat in der von Shewhart entwickelten Regelkarte angezeigt. 1st der ProzeB nicht in statistischer Kontrolle, so werden, gegebenenfalls mit Hilfe weiterer Problemlosungsmethoden, die Ursachen fur die unnaturliche Variabilitat erarbeitet und eliminiert. Dieses stlndige Suchen und Entfernen der Ursachen fur unnaturliche Variabilitat fuhrt schliefilich zu einem ProzeB, der frei von unnaturlicher Variabilitat ist. Dann verfugt man uber einen ISK-ProzeB. Die Regelkarte kann dann als ,,FrLihwarnsystem" genutzt werden, um das erneute Auftreten der unnaturlichen Variabilitat rechtzeitig zu erkennen. Diese Vorgehensweise Ilfit sich auf Prozesse der Analytik ubertragen. Auch Analysenprozesse sind den Alterungsprozessen unterworfen und verfugen neben der naturlichen Variabilitat manchmal noch uber unnaturliche Variabilitat. Daraus folgt, daB es vorhersagbare (ISK) und nicht vorhersagbare (NISK) Analysenprozesse geben kann. Man konnte auch formulieren, dab der vorhersagbare (ISK) AnalysenprozeB ein Ergebnis liefert, welches, mit einer Wahrscheinlichkeit von 99,73 %, dem tatsachlichen Wert entspricht. Verfugt der AnalysenprozeB jedoch zusatzlich zur naturlichen Variabilitat auch noch uber die unnaturliche Variabilitat, dann ist der AnalysenprozeB nicht vorhersagbar, das Analysenergebnis entspricht nicht zwangslaufig dern tatsachlichen Wert. Der Kunde oder
8. I Validierung - und
wtis
kommt dtmtrch?
407
Auftraggeber interessiert sich nicht nur fur ein Ergebnis, sondern ebenfalls fur die ZuverIassigkeit bzw. Qualitat der Methode in Abhangigkeit von der Zeit. Er fragt, wie grol3 ist das Vertrauen, das er dem Ergebnis entgegenbringen kann bzw. darf. Naturlich gibt es vertrauensbildende Mahahmen sowohl auf der kommunikativen Ebene als auch auf der technischen Seite z. B. durch Kontrollinstrumente. Bereits Hunt und Wilson, Gardner und Funk haben 1989-1991 auf die Bedeutung der Regelkarten in der Analytik in dem Committee Draft 13530 hingewiesen. Die Dienstleistungsprozesse in der Analytik, z. B. eines analytischen Labors, beginnen mit dem Auftrag und enden mit dem Ubermitteln des Ergebnisses an den Auftraggeber. Dazwischen konnte man noch folgende Einzelschritte oder Teilprozesse erwiihnen: Eingang und Registrierung des Probenmaterials, Entscheidung der anzuwendenden Analysenmethode, Probenvorbereitung, Vorbereitung der Maschinen und Gerate, Durchfiihrung der Analyse, Ergebnisberechnung, Dokumentation, Abrechnung und Gutschrift. Der GesamtprozeD wird durch die Bestimmung eines Standards, entweder separat oder durch eine Aufstockung, oder durch eine Doppelbestimmung auf seine Variabilitat hin beurteilt. Diese Analysenergebnisse, 20 bis maximal 30 Stichproben, werden als Vorlauf in der Regelkarte registriert und dienen zum Berechnen der Eingriffsgrenzen, Abb. 8-2 und 8-3. Diese Eingriffsgrenzen werden dann anschliel3end zur laufenden Uberprufung des Prozesses, unter Verwendung statistischer Regeln verwendet, Abb. 8-4 bis 8-6. Bei Anwendung einer Einzelwertregelkarte mit gleitender Spannweite stellen die Eingriffsgrenzen gleichzeitig die naturliche Variabilitat dar. Bei Einhaltung dieser Grenzen ist diese Breite dann die Schwankungsbreite des Prozesses, Abb. 8-2. Treffen die statistischen Regeln zu, so ist aul3er der naturlichen Variabilitat auch noch die unnaturliche Variabilitiit vorhanden, welche den Prozefiverlauf unvorhersagbar andert, (s. Abb. 8-6).
Abb. 8-2 Einzelwert-Regelkartemit gleitender Spannweite, Messwert: Prozent weiRe Kugeln.
Eingriffsgrenzenfur Einzelwert-Regelkarten mit gleitender Spannweite (2 Werte) (Eingriffsgrenzen S, = 99,72 "/.) Mittelwert - 104 R =29
Mittl. Spannweite 3 S = 2,660
R
= 3,69 = 9,55
OEGX= X + 3 s
= 92,68
Mittellinie,
= 83,13
UEG,=
X -3 S R
OEGR = 3,268 MittellinieR=
= 73,58 = 11,73
R
= 3,59
Prufung auf uberhohte Grenzen: 1st die Spannweitenkarte auOer Kontrolle?
nein
ja 0
Sind 213 oder mehr Punkte der Spannweiten unterhalb von
R?
nein El
ja
Falls eine der Fragen rnit ja beantwortet wurde, mussen revidierte Grenzen nach den folgenden Formeln ermittelt werden. Median Spannweite: R
=
3 S = 3,144 /?
-
Falls 3,144 R groOer als 2,660 R ist, so 1st die Verzerrung minimal und es kann auf revidierte Grenzen verzichtet werden. OEGXrev=
X
UEG,
X-3s
=
t
3s
-
-
rev
OEGrev= 3,865R
-
MittellinieRrev = R
-
Abb. 8-3 EingrifJigren;.cn fur Einzelwert-Regelkarten rnit gleitendcr Spannweitc (2 Wcrie), Eingriffsgrcnze 3 s - 99.72
8,l Vulidierung - und was kommt dunuch?
409
Die oben dargelegte Vorgehensweise, die statistische ProzeDkontrolle SPC, wurde erfolgreich in verschiedenen Laboratorien bei Analysenverfahren angewandt und sol1 kurz an vier Beispielen erlautert werden.
Beispiel I : Bei der Produktion einer Wirksubstanz wird eine Reinheit von 99,O % garantiert. Im Betriebslabor wurde die Analysenmethode untersucht, indem eine bestimmte Ware einmal pro Tag an dreiljig verschiedenen Tagen analysiert wurde. Die Auswertung der Analysenergebnisse zeigte einen vorhersagbaren ISK-Prozel3. Allerdings war die Schwankungsbreite des Prozesses mit 0,s % sehr groB. Dies fiihrt systembedingt zu Unsicherheiten bei Analysenergebnissen, welche zwischen 98,s % und 99,s % liegen. Eine Uberarbeitung der Analysenmethode fiihrte zu einer Reduzierung der natiirlichen Variabilitat um 60 %.
*
Beispiel 2: Eine neue, automatische, Titrationsanlage wurde im Labor mit der Standardware getestet. Die Ergebnisse wurden wieder mit der Regelkarte ausgewertet. Diese zeigte zwar eine etwas geringere natiirliche Variabilitat, jedoch waren zusatzlich verschiedene unnatiirliche Variabilitaten zu erkennen. Auch ein Hinzuziehen der Herstellerfirma konnte diese Situation nicht verbessern, da alle Eingriffe in die Anlage und angebliche Verbesserungen nicht zu einer Beseitigung der unnatiirlichen Variabilitat fiihrten. Die Anlage wurde daher zuriickgegeben.
Pr oieO
R-R
Reaelkarte
(%arahlet i s t i h
M aOe i i i he t I
Karton-Nr.: I ris t r i i inen t ,
R R
Spannweitenspur R (Abb. 8-6, unten): 1. Ein Punkt (oder mehr) auoerhalb der OEGR 2. Zwei Drittel der Punkte unterhalb von R MeOwertspur X bzw.
X
(Abb. 8-6, oben):
3. Ein Punkt oder mehrere auOerhalb von OEG oder UEG (+ 3 s)
4. Sieben oder mehr aufeinanderfolgende Punkte steigend oder fallend: Trend! 5. Acht oder mehr aufeinanderfolgende Punkte auf einer Seite von bzw. : Versehiebung! 6. Mindestens zwei von drei aufeinanderfolgenden Punkten auoerhalb von 2/3 von OEG oder UEG (+ 2 s) 7 . Mindestens vier von funf aufeinanderfolgenden Punkten auOerhalb von 1/3 von OEG oder UEG (+ 1 s)
x
x
Zusatzliche Prufungen: Liegt ein Ablesefehler vor? Liegt ein Ubertragungsfehlervor? Liegt ein Eintragungsfehler vor? Trifft eine der 7 obengenannten Bedingungenzu, so liegen spezielle Ursachen vor und der ProzeO ist auOer statistischer Kontrolle. Es mussen entsprechende Maonahmen getroffen werden. Abb. 8-5 Statistischc Rcgeln m r Beurteilung, oh ein ProzeB auRcr siaiistischcr Kontrollc isi.
8.I Validierung - und was kommt danccrh?
41 1
,54596 ,47297 0
10
20
30
40
Oberprufung Abb. 8-6 Ein Beispiel fur sporadisch auftretende Prozeheranderungen.
Beispiel 3: In einem analytischen Labor einer chemischen Fabrik wurden u. a. fur die Produktion und fur die Abwasserreinigungsanlage Cyanidbestimmungen durchgefuhrt. Diese Analysenmethode wurde als erster ProzeB fur die Anwendung von SPC ausgewahlt. In regelmaBigen Abstiinden wurde eine Standardlosung Cyanid bestimmt. Die Analysenergebnisse wurden in einer Einzelwertkarte mit gleitender Spannweite ausgewertet. Diese Aufzeichnung deutete auf Anwesenheit von unnaturliche Variabilitat. Nach mehreren Erkenntnissen aus den Aufzeichnungen und entsprechenden Korrekturen war aus dem NISK-ProzeB ein ISK-ProzeB mit einer geringeren naturlichen Variabilitlt geworden. Nach einer entsprechenden Kontrollphase wurde die Zeit zwischen den Kontrollen verlangert, d. h. der Aufwand fur die Kontrollmessungen wurde signifikant gesenkt. Diese Vorgehensweise wurde dann auf andere Analysenmethoden ubertragen. Treten bei Kunden Analysenwerte auf, die nicht den Erwartungen entsprechen, dann wird in den Regelkarten fur die Analysenmethode nachgesehen, ob diese noch in statistischer Kontrolle ist. Wenn dies bestatigt wird, liegt die Ursache fur den unerwarteten Analysenwert mit grol3er Wahrscheinlichkeit beim Kunden.
Beispiel 4: In einem Produktionsbetrieb wird das Rohmaterial, ein Gas kontinuierlich auf Verunreinigungen durch Wasserstoff gemessen. Wochentlich wird das AnalysenmeBgerlt einmal uberpruft, indem ein Eichgas mit einer gegebenen Konzentration an Wasserstoff angeschlossen wird. Die MeRergebnisse des Eichgases werden vor der Justierung abgelesen und mit einer Regelkarte ausgewertet. Einerseits erkennt man in Abb. 8-6 sporadisch auftretende Prozefianderungen in der Analysenmethode, d. h. es gibt eine unnaturliche Variabilitat, wobei die Ursachen dafur zu diesem Zeitpunkt unbekannt waren. Andererseits erkennt man ein Potential der Analysenmethode, welche eine sehr geringe naturliche Variabilitat darstellt. Diesen ProzeR, aber mit einer sehr geringen Schwankungsbreite, wurde man erhalten, wenn man die Ursachen fur die unnaturliche Variabilitat erkennen und entfernen wiirde. Der resultierende ISK-ProzeR wurde dann auRerdem eine hohere Stabilitat aufweisen und die wiichentlichen Uberpriifungen konnten sicherlich auf einmal monatlich umgestellt werden, was zu einer wesentlichen Reduzierung des Prufaufwandes fuhren wiirde. Der AnalysenprozeR unterliegt ferner der Uberjustierung. Diese kann verhindert werden, indem beim Justieren eine Regelkarte verwendet wird. Liegt die beobachtete Abweichung innerhalb der Eingriffsgrenzen und fuhrt nicht zu einer Regelverletzung, so sollte auf eine Korrektur ganz verzichtet werden. Dazu naheres in Abschnitt 8.3.
8.1.2 Vorteile durch die Anwendung der statistischen ProzeBkontrolle Durch die Anwendung der statistischen ProzeBkontrolle wird der ProzeB standig uberwacht. Die Interpretation historischer Daten anhand einer Regelkarte rnit Hilfe statistischer Regeln IaRt eine Vorhersage zu. Man erkennt sowohl die inharente, naturliche Variabilitat, als auch eventuell vorhandene zusatzliche, unnaturliche Variabilitiit, die den ProzeR nicht vorhersagbar macht. Hierdurch ergibt sich eine sehr hohe Transparenz des Prozesses. Diese Information des ,,Routineprozesses" ist fur den Kunden, Behorde und Auftraggeber als Zusatzinformation zur Validierung von vitaler Bedeutung. In der Praxis werden haufig die zum Fuhren der Regelkarte erforderlichen Messungen oder Bestimmungen im Rahmen der Qualitatssicherung bereits praktisch durchgefuhrt. Auch werden hlufig Doppel- oder Mehrfachmessungen durchgefuhrt. In anderen Fallen wird manchmal ein Standard bzw. eine Qualitatskontrollprobe zur Routinemessung rnit gemessen. In diesen Fallen kann die Regelkarte direkt rnit den MeRergebnissen angelegt werden, es brauchen keine zusatzlichen Bestimmungen durchgefuhrt zu werden. Hier ist nur das Auswerten vorhandener Daten, das Fuhren von Regelkarten neu. Da bei den zu kontrollierenden Prozessen meistens das Ergebnis der Prozesse selbst mittels der Regelkarte ausgewertet wird, sind alle Faktoren, welche einen EinfluR auf den ProzeR ausuben konnen, mit in der Beobachtung enthalten. Das bedeutet, daR Anderungen bei Maschinen und Anlagen, bei der Methode, bei den zur Anwendung kommenden Materialien und auch bei den Mitarbeitem erkannt werden, wenn sie einen EinfluR auf das ProzeRergebni s besit zen. Ein Vergleich von Routineprozessen zwischen unterschiedlichen Anwendern, Mitanbietern oder Schwesterorganisationen erfolgt durch den Vergleich der Regelkarten, da die-
8. I Vulidierung - und wus kommt dunuch?
4 13
se sehr empfindlich auf ProzeBanderungen ansprechen. Fur diesen standigen Vergleich sind somit keine zusatzlichen Aufwendungen notwendig. Ein weiterer Vorteil liegt in dem Einbeziehen der Mitarbeiter in den ProzeB der standigen Verbesserung, falls die Fiihrungskrafte dies beabsichtigen und unterstutzen. Die Ubertragung von neuen Prozessen (Herstell- und MeBverfahren) von der Entwicklung in die Routine wird durch den Einsatz der statistischen ProzeBkontrolle erleichtert. SchlieSlich wird die ProzeBtransparenz erzeugt, welche eine Voraussetzung fur ein Benchmarking darstellt. Damit werden die Voraussetzungen fur eine hohere Qualitat, verbunden mit einer Reduzierung der Kosten, geschaffen.
8.1.3 Schwierigkeiten bei der Anwendung der statistischen ProzeQkontrolle Obwohl die statistische ProzeBkontrolle in vielen Landern bereits mit Erfolg eingesetzt wird, wird sie als Instrument zur ProzeBverbesserung und ProzeBuberwachung mit dem Ziel, vorhersagbare Prozesse zu gestalten, die in statistischer Kontrolle sind, in der deutschen Industrie vergleichbar wenig genutzt. Jahrelang geubte Praktiken lassen haufig keine Neuerungen zu. Es ist manchmal einfacher, die neuen, ungeubten Alternativen oder Hilfen abzulehnen. Auch das NIH-Syndrom (not invented here-syndrome) spricht gegen die Anwendung. In manchen Fallen mag auch die Angst vor dem Ungewissen oder vor einem vermeintlich ungunstigen Aufwandmutzen-Verhaltnis besonders bei den Fuhrungskraften eine Rolle spielen. Variabilitat des Prozesses, Variabilitat des MeRverfahrens Eine besondere Bedeutung erhalten die Analysenmethoden bei der Anwendung der statistischen ProzeBkontrolle in der Produktion oder allgemein bei der Beurteilung von Prozessen. Haufig basieren die Qualitatskriterien auf Analysenmethoden: ProzeB: Herstellung von Methylenchlorid, Qualitatskriterium: Spuren von Tetrachlorkohlenstoff im Methylenchlorid. AnalysenprozeB: Kapillar-GC - ProzeB Wirkstoffherstellung Qualitatskriterium: Prozent Reinheit AnalysenprozeB: HPLC ProzeB: Zwischenproduktherstellung Qualitatskriterium: Prozent Gesamtverunreinigung AnalysenprozeB: HPLC, GC ProzeB: Biologischer AbbauprozeS organischer Verbindungen Qualitatskriterium: Chemischer Sauerstoffbedarf Analysenprozek CSB -
Diese Liste konnte beliebig erweitert werden. Wie in Abb. 8-7 dargestellt, setzt sich die Gesamtvariabilitat ( VRK),die Resultierende, welche in der Regelkarte dargestellt wird, aus
4 14
8 Uber die Einsrit~miiRlichkeitder stutistischen ProzeJkontrolle, SPC, in der Analytik
Verknupfung des Prozesses mit dem MeRverfahren
V i K = V i V + v;
im
v,= vMv=0,151 -
VMV
V,
VP
VRK resultierende Variabilitat (visualisiert in der Regelkarte)
V ~ "Variabilitat des MeBverfahrens Vp
Variabilitat des Herstellprozesses
Abb. 8-7 Verknupfung des Prozesses mi1 dem MeRverfahren.
zwei Teilen zusammen. Der eine Teil ist bedingt durch den ProduktionsprozeR ( V J , der zweite Teil der Variabilitat leitet sich vom Meherfahren ( VMv) ab. Es handelt sich hier um nichts anderes als die Anwendung des bekannten Pythagoras'schen Lehrsatzes. Falls die Regelkarte einen ISK-ProzeB zeigt, so ist das MeDverfahren frei von unnaturlicher Variabilitat. Zur Beurteilung von Prozessen sollte daher das MeBverfahren maximal 15 %I der Variabilitat des Prozesses aufweisen. Dies ist in der Praxis leider selten der Fall. Ferner sollte das MeBverfahren vorhersagbar, also frei von unnaturlicher Variabilitat, oder ganz einfach ISK sein. Diese Forderung ist um so wichtiger, je naher die Variabilitat des MeDverfahrens an die Variabilitat des Prozesses herankommt. In der chemischen Industrie sind die MeBverfahren oftmals Analysenmethoden. Es wird bei der Anwendung der statistischen ProzeBkontrolle daher gleichzeitig die Anwendung von SPC bei der Analysenmethode gefordert. Bei der Festlegung von Grenzwerten z. B. bei der Reinhaltung von Luft, Wasser und Boden spielen obige Uberlegungen ebenfalls eine Rolle. So sollten die zur Anwendung kommenden Analysenmethoden vorhersagbar und in statistischer Kontrolle sein. Die Grenzwerte sollten ferner aufierhalb der natiirlichen Variabilitat liegen, um eine einwandfreie Interpretation zu gewahrleisten. Bei der Anwendung von standardisierten oder nach anerkannten Normen festgelegte Analysenmethoden konnten diese an Hand von Regelkarten miteinander verglichen werden. Neben der Aussage ISK oder NISK interessiert die Lage des Mittelwertes bei einer vorgegebenen Testsubstanz und daruber hinaus die Spannweite. Die Regelkarte stellt somit ein einfaches, leicht zu handhabendes Instrument zum Vergleich von Analysenmethoden dar,
8.2 Analysenergebnisse a n Spez~kation.FRrenzen
8.2
4 15
Analysenergebnisse an Spezifikationsgrenzen
Die Zuverlassigkeit von Analysenergebnissen und insbesondere von Ergebnissen an Spezifikationsgrenzen erfordert ein Systemdenken, das neben der Analytik auch die Anwendung der Analytik mit einschlieBt. Durch die hohe Spezialisierung, verbunden rnit der standigen Zunahme der Komplexitat der Verfahren und Methoden gewinnt die Funktionalitat leider manchmal eine hohe Prioritat. Zur Bewaltigung der heutigen Aufgaben sind mehr und mehr funktionsubergreifende Konzepte und funktionsubergreifendes Denken erforderlich. Da Analysen selten zum Selbstzweck durchgefuhrt werden, beurteilen die Analysenwerte haufig Prozesse oder Systeme. In der chemischen Industrie sind die Bestimmung der Verunreinigungen im fliissigen Sauerstoff oder die Bestimmung des Wirkstoffgehaltes einer Tablette oder die Analysenrnethode zur Bestimmung des Cholesteringehaltes eines Patienten Prozesse. Dagegen ist der ProzeB der Herstellung des flussigen Sauerstoffes innerhalb der Spezifikationen einschlieljlich der dazu notwendigen Analysen ein System. Der HerstellprozeB ist rnit dem AnalysenprozeB unmittelbar verknupft. Probleme, welche im System auftreten, sollten daher funktionsubergreifend bearbeitet bzw. gelost werden. Bei der Interpretation von Analysenergbnissen treten haufig Voreingenommenheiten auf. Werte, die in der Mitte der Spezifikationsbreite anfallen werden weniger haufig angezweifelt, als Werte, die in der Nahe, innerhalb und aul3erhalb der Spezifikationsgrenzen liegen. Dabei ist der Vergleich der Analysenwerte rnit den Spezifikationsgrenzen nicht immer ausreichend, besonders im Sinne der Fehlerverhutung. Liegt ein Wert auBerhalb der Spezifikation, so ist es bereits zu spat und Kosten treten auf: Durch Uberarbeitung der Ware oder im ungunstigsten Falle durch Kosten der Entsorgung und der verlorengegangene Verkaufser10s. Wichtig ist die Frage, wie sieht unser ProzeB aus und wie konnen wir eine Wiederholung in Zukunft vermeiden. Daher sollte es das Ziel sein, ein fahiges System zu entwickeln oder anzustreben, das reproduzierbar, oder besser ausgedriickt, das in statistischer Kontrolle ist. Dieses fahige System liegt innerhalb der Spezifikationen und verfugt uber entsprechende Pufferzonen. Aus der Beziehung zwischen dem ,,MeBverfahren" und der Anwendung in der Analytik, (sei hier der Einfachheit halber immer der ,,ProduktionsprozeB" genannt), mul3te man bei einer Spezifikationsuberschreitung nach oben oder unten stets fragen, ob die Ursache in der Analytik liegt oder im ProduktionsprozeB, s. Abb. 8-7. Die Analysenmethode kann nur dann als Ursache ausgeschlossen werden, wenn sie in statistischer Kontrolle ist und wenn der gefundene Analysenwert drei Standardabweichungen (3 srea,)entfernt und innerhalb der Spezifikationen liegt. Daher sollte die Schwankungsbreite der Analysenmethode maximal 15 Prozent der Schwankungsbreite der Spezifikationen oder der ProzeBstreubreite des Produktionsprozesses betragen. Erwahnt werden sol1 an dieser Stelle, dal3 die Standardabweichung der Analysenmethode wahrend der Validierung (sva,)haufig nicht identisch ist rnit der realen Standardabweichung des Routineanalysenverfahrens. Es wurden in der Praxis Faktoren bis 3,2 beobachtet. Erst das Gesamtsystem nach dem Pythagoras'schen Lehrsatz in Verbindung mit den Spezifikationen lUt die Betrachtung zu, wann ein Analysenwert in der Nahe der Spezifikationsgrenzen liegt. Eine zentrale Rolle spielt hier das Analysenverfahren in der Routine.
4 16
8 Uher die Einsntzmiigiichkeit der sratistischen Pro:ejlkontroile, SPC, in der Analytik
Die zwei wesentlichen Fragen fur den RoutineanalysenprozeB sind: a) 1st der RoutineanalysenprozeB in statistischer Kontrolle und b) 1st der RoutineanaIysenprozeB fahig? Eine Antwort auf die Frage, o b der RoutineanalysenprozeB in statistischer Kontrolle ist, kann nur die Regelkarte geben, siehe Abschnitt 8.1. Die Beschreibung eines Prozesses iiber einen Zeitraum rnit Hilfe des Mittelwertes und der Standardabweichung ist nicht ausreichend [65].Falls sich nun mit Hilfe der SPC ein NISK-Analysenprozeh herausstellt, kann er mit den Methoden der statistischen Prozeflkontrolle signifikant verbessert werden. Die Frage, ob ein RoutineanalysenprozeB auch fahig ist, setzt einen ISK-ProzeB voraus, da nur der Vergleich der naturlichen ProzeBgrenzen eines konstanten, vorhersagbaren Prozesses mit den Spezifikationen sinnvoll ist. Die gestellte Forderung besagt, die Analysenschwankungsbreite darf 15 % der Spezifikationsbreite nicht uberschreiten. Hierdurch wird der Unsicherheitsbereich in der Nahe der Spezitikationen auf ein Minimum beschrankt. Fallt in solchen Fallen ein Analysenwert in diesen Graubereich (3 xrea,), so muB eine zweite Analyse durchgefuhrt werden. Der Mittelwert dieser Doppelbestimmung wird dann rnit den Spezifikationen verglichen. Der Graubereich reduziert sich dann um den Faktor 1 dn. Fallt dieser Mittelwert in den reduzierten Graubereich, wird eine dritte Analyse durchgefuhrt und der Graubereich entsprechend dem oben erwiihnten Faktor reduziert. Dies fuhrt bei extremer Nahe zu den Spezifikationsgrenzen zu einer sehr hohen Anzahl von Analysen. Angestrebt wird daher ein Gesamtsystem, das innerhalb der Spezifikationen liegt, ein vorhersagbares Verhalten aufweist, d. h. in statistischer Kontrolle ist und noch genugend Spielraum aufweist, d. h. das Gesamtsystem ist fahig. Mogliche Auswirkungen, die sich durch Analysenmethoden ergeben, die nicht ,,fahig" oder ..nicht in statistischer Kontrolle" sind, werden in Abb. 8-8 wiedergegeben. Mogliche Auswirkungen ,,Nicht fahiger (ISK) Prufprozesse" Keine exakte Beurteilung der einzelnen Chargen (Manche Chargen werden zu gut, rnanche werden zu schlecht beurteilt) Keine exakte Zusammenstellung der Mischungen (Die Qualitat der Mischung entspricht manchmal nicht der ennrarteten Qualitat) (Hierfur rnuO entsprechende Ware rnit entsprechender Qualitat vorgehalten werden) Keine exakte Beurteilung der Mischung (Manchrnal wird eine gute Mischung zu schlecht beurteilt, zusatzlich unnotige Einstellung im Betrieb, manchrnal wird zu schlechte Mischung beurteilt, evtl. Kundenreklarnation) Homogenitatsprufung am Bunker (Grofle ,,lnhornogenitat"wird rnanchrnal nur von der Prufrnethode vorgetauscht) (Langere, uberflussige Mischzeiten) (Standard-Mischzeit ist wahrscheinlich zu lang) Zusammenfassung: Verrneidbare Kosten durch zusatzliche Prufungen Verrneidbare Kosten und niedrige Kapazitat der Anlagen Verrneidbare Kosten durch hohe Lagerbestande Verrneidbare Kundenreklarnationen
Abb. 8-8 Mdgliche Auswirkungen ,,nicht fahiger (ISK) Priifprozesse".
8.2 Analysenergebnisse an Spezifikationsgrenzen
4 17
SPC in der Fertiaung Produktion
Zielsetzung
Prufung
Prozenauswahl
Charakteristikenfestlegen
.I. SPC-Team
JI
RK fuhren Fortschritt berichten
Abb. 8-9 SPC in der Fertigung.
+
MeRverfahrenfestlegen
SPC-Team
JI
RK fuhren Fortschritt berichten
4 18
8 Uber die Einsutzrniiglichkeit der statistischen Prozeflkontrolle, SPC, in der Anulytik
Tab. 8-1 SPC und Analysenvcrfahren
ohne SPC:
rnit SPC: ISK und fahige Analysenverfahren
Kapazitat gesamt: fur Kontrollproben fur Analysen
100 %
100 %
Uberjustierung bei Relativmessungen
vorhanden (hohe Streuung)
nicht vorhanden (niedrige Streuung)
Transparenz des Anal ysenprozesses
gering
hoch
Kosten
hoch
gering
Reklamationen
vorhanden
keine
Cycle time
lang
kurz
~
20 %
4 Yo
80 %
96 %
Die Verknupfung der Fertigungsprozesse und der Analysenprozesse rnit den entsprechenden Konsequenzen sind in Abb. 8-9 dargestellt. AbschlieBend werden in Tab. 8-1 die Vorteile bei dem Einsatz der SPC aufgefuhrt.
8.3
Die Gefahren der Uberjustierung in der Analytik und deren Beseitigung
Bei der Analyse einer Substanz nach einer validierten Analysenmethode wird man ein Ergebnis erhalten, das den tatsachlichen Gegebenheiten entspricht. Wiederholt man diese Analyse derselben Substanz, so erhalt man ein ganz ahnliches Ergebnis, jedoch kein identisches. Rein statistisch gedacht, erhalt man den exakten Wert erst durch den Mittelwert von unendlich vielen Analysen (Erwartungswert). Dies ist jedoch nicht praktikabel und daher gibt man sich manchmal mit Dreifachbestimmungen, manchmal rnit Doppelbestimmungen und haufig auch mit Einzelbestimmungen zufrieden. Besonders in den Fallen, in denen die Schwankungsbreite des Analysenprozesses sehr klein ist, geht man ein geringes Risiko durch die Einzelbestimmung ein, daR der gefundene Wert nicht exakt rnit dem wirklichen Wert ubereinstimmt. In der Praxis kommt es ab und zu auch vor, daB aufgrund von historischen Gegebenheiten oder von entsprechenden Beobachtungen nicht der Absolutwert bestimmt wird, sondern der Relativwert. So wird z. B. bei der Qualitatsbestimmung von Pigmenten haufig ein Standard zusatzlich zu den Proben gemessen. Das Ergebnis wird dann aus dem Vergleich der Probe rnit dem Standard ermittelt. Diese sogenannten Relativmessungen basieren demnach immer auf einer Vergleichsmessung rnit einer Referenz.
8.3 Die Gefahren der Uberjustierung in der Analytik und deren Beseitigung
4 19
Ferner ist es in der Pigmentindustrie, aber auch z. B. in der Chromatographie gangige Praxis, die Messung des Standards immer parallel zu den Proben zu messen, d. h. die Bestimmung des Standards erfolgt jedesmal wieder neu. Die Begriindung dafur sind eventuelle Schwankungen des MeSverfahrens. Wenn eine Schwankung auftritt, so wird argumentiert, dann wird diese sowohl bei der Probe als auch beim Standard auftreten. Ein Beweis in Form von harten Fakten dafiir ist jedoch bei genauer Untersuchung selten zu finden. Betrachtet man dieses System der Relativmessungen einmal genauer, so mu6 man feststellen, daS die Messung des Standards immer rnit einer gewissen Schwankung erfolgt. Man konnte sogar eine Haufigkeitsverteilung der Messungen des Standards erstellen. Daraus kann man ableiten, daB in einigen Fallen der tatsachliche Wert gemessen wird, aber in manchen Fallen dieser Wert auch fehlerhaft ist. Leider erkennt man an dem gefundenen Zahlenwert nicht, wieweit dieser Wert von dem tatsachlichen Wert entfernt liegt. Trotzdem wird in den meisten Fallen der gefundene Wert fur den Standard als der tatsachliche Wert des Standards fur die Bestimmung bei der Relativmessung zugrunde gelegt. Die durch die Relativmessung ermittelten Werte fur die Proben sind demnach zum Teil ein wenig zu hoch, zum Teil ein wenig zu niedrig und zum Teil ziemlich genau. Diese Situation kann mit dem Quinconx, einem Nagelbrett simuliert werden, Abb. 8- 10. Wie in Abb. 8-10 dargestellt, konnen Kugeln aus einem Trichter nacheinander durch die Hindernisse der funf auf Liicke gesetzten Reihen von Nageln fallen und dann in den Kammern aufgefangen werden. In diesem Beispiel wurde die erste Kugel zwei Kammern links vom Zentrum aufgefangen. Daher wurde der Schieber (zwecks ,,Korrektur") unterhalb des Trichters um zwei Einheiten nach rechts verschoben. Die nachste Kugel wurde eine Kammer links vom Zentrum aufgefangen. Wieder erfolgte eine ,,Korrektur" durch den Schieber um eine Einheit nach rechts. Die dritte Kugel fie1 in die dritte Kammer rechts vom Zentrum, es erfolgte eine ,,Korrektur" durch den Schieber um drei Einheiten nach links, der Schieber hat wieder seine urspriingliche Position erreicht. Diese Simulation wurde mit insgesamt 30 Kugeln durchgefuhrt. Das Ergebnis ist in Abb. 8-10 zu sehen: Die Verteilungskurve ist recht flach.
............... .............. ............... .............. ...............
Abb. 8-10 Simulation einer Relativmessung rnit dem Quinconx mit Korrektur.
420
8 Uber die EinsritzmiiRlichkeit der statistischen ProzeJkontrolk?, SPC, in der Ancilytik
............... .............. ............... .............. ...............
Abb. 8-11 Simulation einer Relativmessung mit dem Quinconx ohne Korrektur.
Im zweiten Versuch wird ahnlich verfahren, jedoch mit einem kleinen Unterschied. Hier wird der Schieber unterhalb des Trichters nicht verschoben, auch wenn die gefallene Kugel nicht direkt im Zentrum landet. Das Ergebnis ist in Abb. 8-1 1 wiedergegeben. Man erkennt ganz deutlich die engere Verteilungskurve. Die Erkenntnis fur die Praxis ist demnach, daB durch die standig neue Messung des Standards eine groBe Streuung erreicht wird! Daraus folgt, daB das Ergebnis der Einzelmessung in manchen Fallen dem tatsachlichen Wert entspricht, in manchen Fallen der gefundene Wert ein wenig zu hoch ist und in manchen Fallen der gefundene Wert ein wenig zu niedrig ist. Da jedoch in allen Fallen die Einzelmessung als Basis fur die Bestimmung der Probe genommen wird, bedeutet dies ebenfalls, daB durch die Relativmessung die gefundenen Ergebnisse in manchen Fallen recht exakt liegen, in manchen Fallen diese ein wenig zu hoch und in manchen Fallen zu niedrig liegen. Auf eine mathematische Ableitung sol1 hier der Kurze wegen verzichtet werden. Fur den Praktiker ergibt sich die Frage, wie man diese uberhohte Schwankung, verursacht durch die Relativmessung, verhindern kann. Naturlich kann man den Mittelwert einer Reihe von Ergebnissen zugrunde legen, aber was passiert, wenn der AnalysenprozeR sich tatsachlich einmal andert? Man kann daher auf eine Kontrollprobe, also auf die Messung der Standardprobe nicht ganz verzichten. Es wird hier ein Instrument benotigt, das klar unterscheidet zwischen der naturlichen, inharenten Streuung, welche dem ProzeB inne eigen ist und der Streuung, welche nicht Bestandteil des Prozesses ist und auf ganz bestimmte Ursachen beruht. Dieses Instrument ist wie wir gesehen haben die Regelkarte nach Shewhart. Die Vorgehensweise ist dabei recht einfach und bedarf auch recht wenig an zusatzlicher Arbeit oder Ressourcen. Da der Standard sowieso gemessen wird, werden diese Werte in die Regelkarte eingetragen, die naturlichen Prozeagrenzen ermittelt oder im Falle einer Mehrfachmessung die Eingriffsgrenzen bestimmt. Diese Regelkarte mit der Spannweitenspur gibt
8.3 Die Gefahren der Uberjustierung in der Analytik und deren Beseitigung
42 1
bereits Auskunft uber den ProzeB, ob nur die naturliche, inharente Variabilitat vorhanden ist, oder ob zusatzlich auch noch unnaturliche Variabilitat vorhanden ist, welche auf spezielle Ursachen zuruckzufiihren ist. Falls letzteres der Fall ist, so sollte in Gruppenarbeit die Ursache erarbeitet werden und auf dieser neuen Erkenntnis die Korrektur abgeleitet. Nach der Erstellung von diesem sogenannten Voriauf kann die Vorgehensweise verbessert werden. Bei der Durchfuhrung einer Bestimmung mit der Messung des Standards wird der gefundene Wert des Standards in die Regelkarte eingetragen und auf Regelverletzungen gepruft. Falls keine Regelverletzung auftritt, kann der im Vorlauf gefundene Mittelwert als ProzelJmittelwert fur die Relativmessung akzeptiert werden. Durch diese Vorgehensweise wird mit der Regelkarte der AnalysenprozeB laufend uberwacht, eine Uberjustierung jedoch vermieden. Wenn sich ein AnalysenprozeB herausstellt, der frei von unnaturlicher Variabilitat ist, d. h. es treten keine Regelverletzungen auf, dann hat man einen vorhersagbaren AnalysenprozeB. In diesem Falle kann auf eine Relativmessung verzichtet werden oder sie sollte wenigstens in groBeren Zeitabstanden erfolgen -, da der zu erwartende Mittelwert des Standards vorhersagbar ist. Hierdurch werden Kosten gespart und zusatzliche Kapazitat gewonnen [ 12 I]. AulJerdem entfallt die Uberjustierung.
Halten wir fest: 1. Der Fehler, der aus einer taglichen Kalibrierung resultiert, ist in der Regel groRer als der Fehler, der durch die normalen Schwankungen auftritt. Voraussetzung dafur ist allerdings ein ISK-ProzeR. Ein solcher ist unbedingt anzustreben. 2. Durch die tagliche Kalibrierung wird eine Vergleichbarkeit der Meflwerte unter Umstanden unmoglich. Diese Tatsache trifft auf viele Methoden zu. Der zusatzliche Aufwand bei dieser Vorgehensweise besteht lediglich zu Beginn des Lebenszyklus der Methode in der Auswertung der Ergebnisse der Messung des Standards mit einer Regelkarte. Durch die Einbindung der Mitarbeiter wird der Aspekt der standigen Verbesserung und Kostenreduzierung unterstutzt.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
9
Schatzen der MerSunsicherheit/ Ergebnisunsicherheit
Stephan Kiippers, Schering AG, Berlin
Ergebnisunsicherheit - eine Einleitung
9.1
Priifungen bilden die Grundlage von Entscheidungen. Fur eine Entscheidung ist die Kenntnis der Unsicherheit des aus der Messung erhaltenen Zahlenwertes unerlalich [ 1201. Zur Verdeutlichung sol1 Abb. 9-1 [ 1211 dienen:
nicht
OK
Spezifikationsgrenze
OK I
A
B
C
D
Abb. 9-1 Graphische Darstellung von MeRpunkten, den zugehorigen MeRunsicherheiten (als Bereich um den MeRpunkt herum dargestellt) und einer Spezifikationsgrenze.
Im Fall A und D liegen eindeutige Situationen vor. In den Fallen B und C schlieat das Interval1 der Mehnsicherheit die Spezifikationsgrenze rnit ein. Eine eindeutige Aussage ist somit nicht mehr moglich. In vielen Fallen fuhrt der Wert C zu der Forderung, eine Wiederholungsmessung durchzufuhren. Man hofft, dann einen Wert innerhalb des ,,MeRbalkens" (Unsicherheitsbereichs), jedoch unterhalb des Grenzwertes zu finden. Dieser Ansatz ist zwar nachvollziehbar, jedoch nicht sachlich begrundbar. Im Fall B besteht ebenfalls die Moglichkeit, daa das Produkt die geforderte Qualitat nicht erfullt. Oft wird jedoch in einen solchen Fall nach der Devise ,,Gluck gehabt" gehandelt. Diese Situation fuhrt zu der von Behorden und Kunden der Analyselabors erhobenen Forderung, daR jedes Verfahren vor Verwendung zu validieren ist. Generell ist diese Forderung zu unterstutzen, wobei die eigentliche Forderung lauten
424
9 Schiitzm der MeJun Ticherheit
sollte, die Zuverlassigkeit des Verfahrens nachzuweisen und den Gultigkeitsbereich der Aussagen des Analysenverfahrens zu beschreiben. Das Problem, das zumindest in Forschung und Entwicklung auftritt, 1st in der fehlenden Zeit zwischen Methodenentwicklung und Beginn der Probenmessungen zu sehen. Daher werden Verfahren teilweise nicht oder zumindestens oft sehr spat validiert. Es sind daher oft bereits viele Entscheidungen auf der Basis von Werten des Typs B und C getroffen worden, ohne das dies sinnvoll gewesen ist. Es ist zudem problematisch die Spezifikationen festzulegen, wenn die Unsicherheit des MeRverfahrens nicht bekannt ist. Haufig werden dann oft Grenzen festgelegt, die das Analysenverfahren nicht einhalten kann [ 1221. Einen Losungsansatz bietet die regelbasierte Schatzung der Messunsicherheit evtl. gefolgt von der Beobachtung der Qualitat des Analysenverfahrens mit Hilfe von Regelkarten.
9.2
Grundlagen
In der IS0 17025 wird die Validierung wie folgt definiert, siehe auch Abschnitt 1. ,,Die Validierung ist die Bestatigung durch Untersuchung und Bereitstellung eines Nachweises, daR die besonderen Anforderungen fur einen speziellen beabsichtigten Gebrauch erfullt werden." Die Vorgehensweise zur Durchfuhrung von Validierungen wird wie folgt festgelegt: Charakterisierung des Prufverfahrens: Ermittlung der benotigten Merkrnalswerte des Prufverfahrens. - Vergleich der Qualitatsanforderungen: Vergleich der bei der Charakterisierung ermittelten Merkmalswerte mit der sich aus den Qualitatsanforderungen des Kunden ergebenden Prufaufgabe. (Was mu$. meine Methode leisten?) - Nachweis der Erfullung: Fiihrung eines Nachweises, daB die Qualitatsanforderungen in diesem speziellen Fall erfullt worden sind. -
Als Methoden zur Ermittlung der geforderten Charakterisierung des Priifverfahrens werden folgende Methoden genannt: I . Systernatische Beurteilung der Faktoren, die das analytische Ergebnis beeinflussen konnen 2 . Kalibrierung niit ReferenznormenReferenzmaterialien und gleichzeitige Untersuchung der EinfluRgroRen 3. Vergleich der Ergebnisse, die mit einem weiteren Verfahren ermittelt wurden 4. Vergleichsmessungen zwischen Laboratorien (Laborvergleichsversuche, Ringversuche) 5. Geordnete Schatzung der Ergebnisunsicherheit auf der Grundlage von Wissen und Erfahrung.
Mit dem Wort Validierung wird oft die unter 1. erwahnte Festlegung und systematische Untersuchung der EinfluRgroRen zur Charakterisierung des Prufverfahrens verstanden. Die
9.2 Grundlagen
425
systematische Untersuchung von EinfluBgroRen ist jedoch nur eine von funf Methoden zur Charakterisierung eines Priifverfahrens, siehe Abschnitt 1. Besonders in Zeiten hohen Wettbewerbsdrucks muB daher darauf hingewiesen werden, daB in allen Normen und Guides gefordert wird, den Validierungsaufwand der Anwendung des MeBergebnisses anzupassen. Es ist daher bei der Entscheidung fur die Methode zur Ermittlung der Merkmalswerte die Frage zu stellen: Was ist das Schlimmste was passieren kann, wenn aus dem MeBergebnis falsche Schlusse gezogen werden? Wenn ausschliealich ein geringer finanzieller Verlust durch eine falsche Entscheidung verursacht werden kann, ist der Aufwand fur die Validierung entsprechend gering zu halten. Hangen hingegen z. B. Menschenleben von Fehlentscheidungen aufgrund des Analysenergebnisses ab (wie dies in der Pharmaanalytik der Fall sein kann), ist ein entsprechend hoher Validierungsaufwand gerechtfertigt, allerdings nicht zwingend notwendig. Eine qualitativ eindeutige Aussage soll mit geringem Aufwand erreicht werden. Auswahl und Umfang der Validierung stehen somit im Ermessen des Labors, mussen aber einem Fachbegutachter als dem Stand der Technik angemessen erscheinen [123,124]. Die oben genannte [ 1241 regelbasierte Schatzung der MeBunsicherheit ist in den letzten Jahren in den internationalen Normen schrittweise etabliert worden - so in der neuen IS0 17025 - und hat inzwischen Eingang in die Praxis gefunden. Der klassische Ansatz zur Charakterisierung von Prufverfahren basierte auf einer Unterscheidung von systematischen und zufalligen Fehlern. Je nach Blickpunkt wurden systematische Fehler durch Modelle beschrieben und durch exakte Berechnungen quantifiziert oder, wenn systematische Fehler nicht exakt beschreibbar waren, fanden sie nur unzureichenden Eingang in das Ergebnis. Die zufalligen Fehler wurden oft nur als Standardabweichung des apparativen Teils berucksichtigt. Da jedoch Ergebnisse fur Entscheidungen herangezogen werden, murj klar definiert werden, welchen EinfluB die analytischen Unsicherheiten auf die Aussagekraft der Entscheidung haben. Es wird heute zunehmend nicht mehr zwischen systematischen und zufalligen Fehlern unterschieden, sondern es wird die Summe der Beitrage betrachtet, durch die die Qualitat des Ergebnisses beeintrachtigt wird. Diese Summe wird als ,,Unsicherheit" bzw. ,,MeBunsicherheit" oder ,,Ergebnisunsicherheit" bezeichnet. Man spricht entsprechend von Teilunsicherheiten fur einen Teil einer Messung (z. B. fur die Probenvorbereitung) und von der ,,Gesamtunsicherheit". In den neueren Normen wird zudem ausdrucklich darauf hingewiesen, daB die Schatzung von Unsicherheiten eine gleichberechtigte Methode zur Bestimmung der Unsicherheit neben den statistischen Methoden ist. Das Leitmotiv der neueren Normen lautet daher [121]:
Besser alle wesentlichen Unsicherheiten mit akzeptabler Genauigkeit erfassen, als einzelne Unsicherheiten mit extremer Genauigkeit (und andere gar nicht). Wie aus diesem Leitmotiv bereits zu erkennen, wird das Wort ,,Fehler" vermieden. Der Blick soll weg geleitet werden von der Frage: Wer macht etwas falsch? oder: Was ist defekt?, hin zu der Frage: Welchen EinfluB hat die ,,Unsicherheit beim Messen" auf die Aussage des Ergebnisses? Zusatzlich findet sich in den neueren Normen nicht mehr der Begriff des ,,wahren Wertes". Der ,,wahre Wert" ist als generell nicht ermittelbar anzusehen. Es sol1 vielmehr versucht werden, eine Aussage uber den Bereich zu machen, in dem sich das Ergebnis mit
426
9 Schiirzen der MeJunsicherheit
hoher Wahrscheinlichkeit finden Iafit. Dieser Bereich mu13 in einem vernunftigen Verhaltnis zur Aussage des MeRergebnisses stehen. Bemerkung: Es sol1 an dieser Stelle darauf hingewiesen werden, daR ein Fehler als bekannt und identifizierbar angesehen wird und demzufolge beseitigt, vermieden oder mit Hilfe von Berechnungen korrigiert werden kann. Die Unsicherheit mu13 hingegen als unbekannt betrachtet werden. In der statistischen Prozefikontrolle mit Regelkarten (siehe unten) wird in gleicher Weise zwischen der naturlichen (unvermeidbaren) Variabilitat und der unnaturlichen Variabilitat (den Fehlern) unterschieden. Die Angabe von Messunsicherheiten ist seit 1993 bei MeRverfahren von der I S 0 empfohlen. Seit Anfang der 90er Jahre haben sich neben IS0 auch die in Eurachem zusammengeschlossenen analytischen Chemiker mit der Umsetzung des MeRunsicherheitsansatzesbei der chemischen Analyse beschaftigt. Seit 1995 ist der Ansatz bei quantitativen analytischen Verfahren in der Chromatographie [z. B. 1251 und der Spektroskopie 1126, 1271 erwahnt worden. Die Anwender kommen aus allen Bereichen. Es sind sowohl Universitaten, als auch nationale Behorden und Forschungslabors in der Industrie [ 122,1251 unter den Anwendern zu finden. Grundlagen und weitere Beispiele konnen in deutscher Sprache in [ 1281 nachgelesen werden. Seit ca. 1997 sind die nationalen Institutionen - z. B. in Deutschland die BAM in Berlin - im Rahmen von Projekten bemiiht, das Konzept auch auf qualitative Verfahren anzuwenden. Ein Beispiel fur ein qualitatives Prufverfahren, das auf diese Art untersucht wird, ist die visuelle Beurteilung von Schweihahten durch das menschliche Auge [ 1291. Zu den Verfahren zur Bestimmung der MeBunsicherheit besteht neben den bekannten statistischen Verfahren, wie z. B. Wiederholmessungen, die Moglichkeit auf das vorhandene Wissen des Analysenlabors zuruckzugreifen und auf der Basis von vorher festgelegten Regeln die Unsicherheit abzuschatzen. Das Verfahren zur Messunsicherheitsabschatzung wird im folgenden beschrieben und an Beispielen diskutiert. Als Voraussetzung fur die Schatzung von MeRunsicherheiten sind zu nennen: das Analysenverfahren mu8 durch das Labor beherrscht werden und - das Labor mu13 die Schatzungen so begriinden konnen, daR die Grunde von einem Fachgutachter nachvollzogen werden konnen. Dazu mussen die Schatzungen nach festen Regeln erfolgen. -
Die Schritte (Regeln) der Mehnsicherheitsabschatzung sind [ 130,13 I ] 1. Alle potentiellen Unsicherheitsquellen rniissen identifiziert und aufgelistet werden.
Dies erfolgt durch eine ProzeRanalyse, bei der alle Schritte des Prozesses erfaBt werden. Es werden auch solche Schritte aufgelistet, auf die der Analytiker keinen EinfluR hat bzw. die nicht vom Analytiker beurteilt werden konnen. Sehr komplexe Prozesse werden in ubersichtliche Teilprozesse unterteilt. Wenn eine Probenvorbereitung z. B. aus einem Aufschlu13, einer Derivatisierung und einem anschlieRenden Aufstockexperiment besteht wird nicht die Probenvorbereitung als Unsicherheitsquelle aufgeli-
9.2 Grundlugen
421
stet sondern jeder ,,ubersichtliche" TeilprozeB, i m Beispiel der AufschluB, die Derivatisierung und das Aufstockexperiment [ 1391.
2. Die einzelnen Unsicherheitsbeitrage der Prozesse werden abgeschiitzt und nach wesenttichen und un wesentlichen Anteilen sortiert. Falls tabellierte Standardunsicherheiten fur einzelne Prozessschritte vorliegen, sollen diese venvendet werden. Wenn ein Labor auf einem neuen Gebiet Abschatzungen vornimmt bzw. noch keine Erfahrung in der Abschatzung hat, empfiehlt sich das Anlegen einer eigenen Tabelle mit Standardunsicherheiten. Wenn diese Standardunsicherheiten gepflegt werden, kann mit wenig Aufwand ein Instrument geschaffen werden, das zuverlassig und schnell die Abschatzung von Unsicherheiten bei neuen Methoden zulaBt. Als Methoden zur erstmaligen Ermittlung von Standardunsicherheiten sind statistische Verfahren gleichberechtigt neben regelbasierten Schatzungen einsetzbx (siehe Tab. 9- 1). Tab. 9-1 Verfahrensschritte, Unsicherheitsquellen und Bestimmungsmethoden fur die Ermittlung von MeBunsicherheiten bei chemischen Analysen.
Verfahrensschritt des Anal ysenverfahrens
Quelle der Unsicherheit
Probenziehung
Heterogenitat der Probe Heterogenitat der Probenziehung Zersetzung der Probe bei Transport u. Lagerung Verlust/Zunahme an Komponenten (z. B. Verlust an Lomis, Zunahme an Wasser) Verunreinigungen z. B. an GefaBen Wagung, Verdiinnung, Veraschung unvollstandiges Losen Zersetzung in Losung Verunreinigungen in GefaBen Dissoziation 0.a. wegen pH-Wert
~
Probenvorbereitung
~
Bestimmungsmethode ~~
~~
Mehrfachanalyse einer Probe mit Varianzanalyse und eindeutiger Statistik; bei Informationen uber die Substanzklasse bzw. den Reaktionstyp s Schatzung Mehrfachanalyse einer Probe wie oben bzw. aufgrund von vorhandenen Infos Schatzung
Kalibrierung
Unsicherheitsbeitrag des Standards Wagung u. Verdiinnung Kalibrierung u. Probe stark unterschiedliche Gehalte Unsicherheit der Kalibrierungsmethode
Infos aus der Standardcharakterisierung bzw. aus der Regelkarte fur den ,,Vergleich" s Schatzung unumganglich
Analyse
Linearitat des Detektors Samplerunsicherheit SelektivitatBtorungen (z. B. Peak unter Hauptpeak, Stor-Ion bei Titration)
technische Infos des Gerates bzw. des Geratekalibrierung Selektivitatstest mil vorhandenen Infos und Schatzung
Auswertung
Rechnungsfehler (z. B. Rundung) Falsches mathematisches Model (z. B. Eichkurve nicht linear) Integrationsbeitrag (z. B. Basislinie)
~
Schatzung aufgrund von Infos aus Messungen + Schatzung aus Infos der Computervalidierung 3 Schatzung
428
9 SchiitTen der MeJunsicherheit
Fur die Tabellierung von Gerateunsicherheiten konnen die Daten von Geratekalibrierungen herangezogen werden, da hierbei in der Regel ein Reproduzierbarkeitstest durchgefuhrt wird. Als praktisch hat sich der Vorschlag [ 1241 erwiesen, einen minimalen und einen maximalen Beitrag eines Teilprozesses zur Gesamtunsicherheit zu schatzen und in einem zweiten Schritt anhand der Kriterien, oh Erfahrung vorhanden ist, wie hoch die Zahl der analysierten Proben ist und ob zusatzlich 5uBere Probleme auftreten (z. B. Zeitdruck), zwischen den Extremen zu wichten 11251, s. auch Abschnitt 1. 3. Priifung uuf Korrelationen durchfihren. Kovarianzen sind Unsicherheitsbeitrage, die nicht auf eine Unsicherheitsquelle zuruckzufuhren sind, sondern nur durch den kombinierten Beitrag mehrerer Unsicherheitsquellen erinittelt werden konnen.
4. Die Standurdunsicherheiten werden in der Regel gemu$’ quudrutischer Addition addiert. Die Fehlerfortpflanzung gemaB quadratischer Addition ist nicht prinzipiell gultig, kann jedoch als Regelfall betrachtet werden.
5. Die Standurdunsicherheit wird zusammen mit deem MeJergebnis arzgegeben. Dabei kann die Unsicherheit mit einem Faktor (Uberdeckungsfaktor oder Erweiterungsfaktor, analog zum Vertrauenbereich bei 95 %) multipliziert werden. Der Uberdeckungsfaktor ist eine Zahl, die fur chromatographische und spektroskopische Verfahren rnit externer Eichung meistens zwischen 2 und 3 liegt. Die Standardunsicherheit gibt analog zur Standardabweichung nur einen Bereich an, in dem das Ergebnis rnit hoher Wahrscheinlichkeit zu finden ist. Die Standardabweichung gibt im Fall einer gausformigen Verteilung der Ergebnisse um den Mittelwert mit 68 %-iger Wahrscheinlichkeit den Bereich an, in dem das MeBergebnis zu fnden ist. Bei der Schatzung der Unsicherheit ist das Problem komplizierter, da keine gausformige Verteilung vorliegen muJ3. Es mu8 daher eine sinnvolle Annahme gemacht werden, in welchem Interval1 der MeBwert zu finden ist. Aufgrund von theoretischen Ableitungen, die rnit praktischen Untersuchungen uberpruft wurden [ 121,1271, sind Uberdeckungsfaktoren von 2,5 fur Messungen mit Kalibrierungen mit einer Kalibriersubstanz oder Standardabweichungen in der Chromatographie eine sinnvolle Annahme. In unserem Labor haben wir auf die Verwendung des Uberdeckungsfaktors verzichtet und bei der Schatzung jeder Teilunsicherheit einen entsprechend mit ca. 2,5 multiplizierten Wert als Schatzwert angenommen (siehe Beispiele l und 3 ) . 6. Das Vorgehen zur Abschiitzung ist vollstiindig und transparent zu dokumentieren. Innerhalb eines Labors ist zudem auf die Verbreitung von Auswertungsschritten zu achten, urn Schatzungen nachvollziehbar zu machen und sicherzustellen, daR Abschatzungen von verschiedenen Personen zu ahnlichen Ergebnissen fuhren. Fur die Chromatographie sind fur diesen Zweck in [ 1251 zwei einfache Formblatter vorgeschlagen, deren Ausfullen in wenigen Minuten erledigt werden kann.
9.3 Beispiele
429
Tab. 9-2 Vereinfachtes Schema des Ablaufs der AAS-Bestimmung von Metallen in Klarschlamm. Kalibrationsmessung
Probenmessung
Qualitatskon troll probe
Probenvnrbereitung
Stammlosung: herstellen und verdiinnen, Unsicherheitsbeitrage: Wiegen und Volumenmessung, Beitrag des Referenzmaterials
Feststofiprobe: Probe einwiegen, losen und verdunnen, Unsicherheitsbeitrage: Wiegen und Volumenmessung
Referenzmaterial: Probe einwiegen, losen und verdiinnen, Unsicherheitsbeitrage: gleich wie Probe
Messung
Gerateunsicherheit
Gerateunsicherheit
Gerateunsicherheit
Auswertung
Mittelwertbildung
Mittelwertbildung
Mittelwertbildung
Bewertung
Korrektur rnit Ergebnis der Kontrollmessung, Unsicherheitsbeitrag der Qualitatskontrollprobe
In Tab. 9-2 (modifiziert aus [ 1321) ist eine Liste mit TeilprozeBen, zugehorigen Unsicherheitsquellen und Bestimmungsmoglichkeiten fur die erstmalige Bestimmung von Teilunsicherheiten aufgefuhrt.
9.3
Beispiele
Je eine praktische Anwendung des Konzeptes aus der Chromatographie [ I251 und der Spektroskopie [ 1261 sollen der Verdeutlichung dienen. Als drittes Beispiel ist die Unsicherheitsabschatzung der Karl-Fischer-Wasserbestimmung als Beispiel fur ein physikalisches Messverfahren gezeigt.
9.3.1 Beispiel aus der Chromatographie Aufgahe: Eine Probe HexanNasser-Emulsion wird auf den Gehalt an N-Benzylaziridin gepruft. Die Probe darf max. 100 ppm der toxischen Substanz enthalten. Das Analysenverfahren besteht aus folgenden Schritten - Probenvorbereitung:
Probenziehung; Zugabe von Ethanol zu der Probe; Schutteln bzw. homogenisieren der Probe im Ultraschallbad; Einwiegen eines Probenaquivalents; Verdunnen der Probe.
9 SiJiiit:en drr Mejumichcrheit
430 -
-
Analyse: HPLC-Analyse von N-Benzylaziridin mittels Gradientenmethode unter Anwendung eines externen Standards. Auswertung: Auswertung der Standards und der Probe mit Hilfe eines computergestutzten Auswerteprogramms.
Es wurden folgende Unsicherheitsquellen identifiziert: 1. Inhomogenitat verursacht durch die Probenziehung 2. Unsicherheit der Probenhomogenisierung 3. Wiegen und Verdunnen der Probe 4. Analysenunsicherheit (Gesamtbeitrag der Analysengerate zur Unsicherheit) 5. Unsicherheitsbeitrag der Integration.
Abbildung 9-2 zeigt die Chromatogramme fur den Standard und eine Probe mit 100 ppm. Nach der Vernichtung von N-Benzylaziridin weisen die Proben zwischen 0 und 10 ppm auf.
I I
c
E C
c 5
% 00
10
15 Time (min)
20
25
30
__.---
/ 5
10
15 20 Time (min)
25
30
Abb. 9-2 Chromatogramme der Analyse von N-Benzylaziridingehalt: a) Chromatogramm des Standards b) Chromatogramm eincr Probe mit hohem N-BenzylaLiridingehaIt.
9.3 Beispiele
431
Es wurden zu den Punkten folgende Teilunsicherheiten abgeschatzt: min. Unsicherheit
max. Unsicherheit
zu 1.
nicht abschatzbar
nicht abschatzbar
zu 2. zu 3. zu 4. zu 5.
2,o % 0,5 % 0,5 % 2,o %
5,O % I,0 % I,O 96 10,o 9%
2,9 %
11,3 %
Summe (Addition der Fehlerquadrate und anschlieljendes Wurzelziehen)
Der Unsicherheitsbeitrag zu 1. kann nicht geschatzt werden. Er wird trotzdem in die Aufstellung aufgenommen. Fur den Kunden wird damit sichtbar, daR hier ein weiterer ,,Fehler" verborgen sein kann. Als Entscheidungsregeln fur die Wichtung zwischen minimalem und maximalem Wert der Unsicherheit sind fur das betreffende Labor folgende Punkte festgelegt [ 1251: - Wieviele Proben miissen analysiert werden? - Hat der Mitarbeiter die notige Erfahrung? - Erfolgt die Analyse unter auBerem Druck (z. B. Zeitdruck, wenn der Kunde auf das Ergebnis wartet)? Die mittlere Messunsicherheit fur das Messverfahren wurde rnit ca. 8 % ermittelt. Dies stimmt recht gut mit dem Ergebnis der mittleren Standardabweichung von 8,6 % iiber 19 Analysen einer Kontrollprobe iiberein. Die Fehlerabschatzung konnte aufgrund des vorhandenen Know-hows im Labor unabhangig von den Proben ermittelt und dem Auftraggeber vor dem Beginn der Routinebearbeitung mitgeteilt werden.
9.3.2 Beispiel aus der Spektroskopie Aufgabe: Analyse von Feststoffproben, z. B. Kliirschlamm, rnit dem Ziel der Kupferbestimmung mit der AAS. Das Analysenverfahren laBt sich analog zu Tab. 9-2 beschreiben (s. Abschnitt 9.2). Kalibrierung : Die Kalibrierung erfolgt rnit einer Bezugslosung. Es wird eine Mehrpunkteichung mit einer Verdunnungsreihe durchgefiihrt. Dazu mu13 ein zertifiziertes Referenzmaterial eingewogen, gelost und verdunnt werden. Analyse: Die Probe wird nach AufschluB und Verdiinnen analysiert. Richtigkeitskontrolle: Die Richtigkeitskontrolle erfolgt durch die Analyse eines zertifizierten Referenzmaterials unter identischen Bedingungen wie die unbekannte Probe.
432
9 Schutzen drr MeJunsicherheit
Es wurden folgende Unsicherheitsquellen identifiziert: 1 . Unsicherheitsbeitrag der Kalibriermessung, Wage- und Verdunnungsschritte, Geratebeitrag und Unsicherheitsbeitrag des Referenzmaterials (siehe unten). Fur die Kalibrierung gilt, daR die Unsicherheiten mit der Anzahl der Messungen kleiner werden. 2. Unsicherheit der Probenmessung und des Messverfahrens. Es gelten die gleichen Unsicherheitsquellen wie unter 1 . Da der Aufwand jedoch hierbei aufgrund eines Aufschlusses hoch ist und die Probenmenge teilweise begrenzt ist, kann bei der Messung nicht durch eine hohere Anzahl Messungen der Unsicherheitsbeitrag verringert werden. 3. Unsicherheit der Messung der Qualitatskontrollprobe. Neben der Unsicherheit der Messung, die die gleichen Beitrage liefert wie oben, wird das Ergebnis der eigentlichen Messung mit dem Faktor aus der Qualitatsprobe ,,Soil" dividiert durch ,,Gefunden" multipliziert. 4. Beitrag des zertifizierten Referenzmaterials zur Gesamtunsicherheit. Das ist ein Beitrag, der bei allen Messungen einflieBt. 5. Bei den ersten drei Unsicherheitsquellen handelt es sich um AAS-Messungen, die immer die gleichen Beitriige zur Unsicherheit liefern, wobei unterschiedlich oft Fehler aus Verdiinnungen und Wagungen und der Geratefehler auftreten. Unsicherhei tsbeitrag in mg/kg
zu I . xu 2. xu 3.
1,37 1,44
I1,5
%U 4.
0,47
Summe (aus der Fehlerlortptlanzung unter Beriicksichtigung der unterschiedlichen Wichtung der Anzahl der Messungen bei Kalibriermessung, Probenmessung und Qualitatskontrolle [ 1261)
8,3 %,
Im ersten Beispiel ist zwischen maximalen und minimalen Unsicherheitsbeitragen unterschieden. Dies ist bei der Schatzung sehr hilfreich. Messunsicherheiten konnen jedoch auch ganz oder teilweise mit Hilfe statistischer Methoden, z.B: Mehrfachmessungen und die Bestimmungen der Standardabweichungen ermittelt werden. Dies ist im Fall der AASBestimmung z. T. durchgefuhrt worden, wobei auf die Unterscheidung zwischen max. und min. Unsicherheit und einer Entscheidung zwischen diesen beiden nach den Umgebungsbedingungen verzichtet wurde. Bei dem zweiten Beispiel fallt zudem auf, daR die Beitrage zur Unsicherheit alle beriicksichtigt werden miissen, da die Gesamtunsicherheit nicht die lineare Addition von aufeinanderfolgenden Schritten darstellt sondern durch parallele Prozesse zustande kommt (siehe Abb. 8-5). Bei der max. Unsicherheit im ersten Beispiel stellte die Auswertung die wichtigste Unsicherheit dar. Irn 1 . Beispiel konnte zur Vereinfachung daher auf unwichtige, kleine Beitrage verzichtet werden, wohingegen im 2. Beispiel alle Beitrage beriicksichtigt werden mussen.
9.3 Beispiele
433
9.3.3 Beispiel eines physikalischen Messverfahrens (Karl-FischerWassertitration) Aufgabe: Eine Probe wird mit Hilfe der Karl-Fischer-Wassertitration auf den Gehalt an Wasser gepruft. Das Analysenverfahren besteht aus folgenden Schritten: - Vorbereitung der Messzelle:
Die Messzelle wird z. B. mit 20 ml Methanol gefullt und rnit dem Titrationsreagenz trocken titriert. - Probenbearbei tung : Eine Probe wird eingewogen, in die Messzelle iiberfuhrt und anschliel3end titriert. - Auswertung : Die Auswertung erfolgt rnit Hilfe eines Computerprogramms, das automatisch den aktuellen Titergehalt mit dem Verbrauch multipliziert und durch die Einwaage dividiert. wurden folgende Unsicherheitsquellen identifiziert: Wagefehler bei der Probeneinwaage Eintrag von Wasser bei der Uberfuhrung der Probe in die Messzelle Aufnahme von Wasser durch die Probe wahrend und nach der Wagung und wahrend des Probenlosens 4. Volumenfehler bei der Titration durch zu grol3e Schrittweite bei der Volumenzugabe durch das Gerat, falsche Widerstandsmessung zur Endpunktsbestimmung, falsche Endpunktserkennung durch das Gerat (Softwareunsicherheit, alles zusammen: Gerateunsicherheit) 5. Titerfehler: Der Unsicherheitsbeitrag des Titers hangt von der Hygroskopizitat des verwendeten Losemittels fur die Probe ab. Da die verwendeten Losemittel unterschiedlich sind, ist unten ein sehr weiter Bereich angegeben. Es 1. 2. 3.
Es wurden zu den Punkten folgende Teilunsicherheiten abgeschatzt: min. Unsicherheit
max. Unsicherheit
zu 1.
0,01 %
0,s %
zu 2.
0, 1 %
0,2 %
zu 3.
su bstanzabhangig
substanzabhangig
zu 4.
0,1 %
0,s %
zu 5 .
0.2 %
1.0 %
Summe (siehe Beispiel 1)
0,25 %
1,24 %
Der Unsicherheitsbeitrag zu 3. mu13 substanzabhangig gepriift werden. Er wird aufgenommen, damit fur alle Beteiligten sichtbar wird, da13 hier ein weiterer ,,Fehler" verborgen sein kann.
434
9 Schiitien drr Me@nsicherheit
Als Entscheidungsregeln fur die Wichtung zwischen minimalem und maximalem Wert der Unsicherheit sind fur das betreffende Labor folgende Punkte festgelegt [ 1251: - wieviele Proben mussen analysiert werden, - hat der Mitarbeiter die notige Erfahrung, - erfolgt die Analyse unter auBerem Druck (z. B. Zeitdruck wenn der Kunde auf das Ergebnis wartet)?
In diesem Fall kann angenommen werden, dalj viele Proben analysiert werden mussen und die notige Erfahrung vorliegt. In der Regel wird jedoch eine Wasserbestimmung unter erhohtem Zeitdruck durchgefuhrt. Dies fuhrt zu der Annahme, daR eine Unsicherheit von ca. 0,5 % vorliegt. Bei den relativ kleinen Wassergehalten, die in der taglichen Praxis unseres Labors vorliegen, werden in der Tat sehr kleine Werte fur die Abweichung zwischen mehreren MeRwerten fur die gleiche Substanz gefunden. Falls groRere Abweichungen auftreten, ist dies ein Hinweis auf das tatsachliche Auftreten eines Fehlers oder auf Probleme, die spezifischen Eigenschaften der Substanz zu zuordnen sind. Ein Softwaretool zur Unterstiitzung der Ermittlung von Mehnsicherheiten bei Titrationen ist ebenso in Arbeit [ 1401 wie eins fur die HPLC [ 1411.
9.4
Zusammenfassung und Empfehlung
Die Schiitzung der Messunsicherheit auf Basis fester Regeln ist ein Verfahren zur Ermittlung der Merkmalswerte eines Analysenverfahrens. Die Schatzung der MeRunsicherheit kann wie oben erwiihnt, zeitlich der erste Schritt der Validierung sein. Es folgt ein Vergleich der erhaltenen Unsicherheit mit der Spezifikation und der anschlieflende Nachweis, dal3 die Methode die an sie gestellten Forderungen erfullt. Mit eindeutig definierten Spezifikationen und einem schriftlich gut dokumentierten Analysenverfahren, kann eine Validierung somit mit einem sehr geringen Aufwand durchgefuhrt werden. Die Voraussetzung 1st hierbei lediglich, da13 das Labor die eingesetzten Verfahren gut kennt. In der Regel werden in einem Labor oft analoge Verfahren eingesetzt, deren Verfahrensschritte sich immer wiederholen. Bei geschickter Durchfuhrung von Validierungen 1aRt sich zudem Validierung zur Bestimmung von Teilunsicherheiten benutzen [ 133, 1421. In diesem Fall kann bei allen Verfahrensschritten, die bereits vorher Teil einer Validierung waren auf ,,harte" Zahlen zuruckgegriffen werden. Es mussen somit im L a d e der Zeit fur nur wenige Verfahrensschritte Unsicherheiten abgeschatzt werden. In der Monitoring-Gruppe bei Schering werden Zwischenprodukte der chemischen Synthese von Pharmawirkstoffen untersucht. Es wird generell die Frage nach dem Gehalt der bekannten Hauptkomponente gestellt. Die Bearbeitung erfolgt z. B. mit chromatographischen oder elektrophoretischen Methoden. So ist in unserem Labor das Grundprinzip: Probenvorbereitung, chromatographische bzw. elektrophoretische Analyse und Auswertung immer gleich. Die Probenvorbereitung variiert zwar, dennoch liegen auch hier immer gleiche Prinzipien vor. Zum Teil besteht die Probenvorbereitung ausschlierjlich aus einem Wlgeund einem Verdiinnungsschritt. Die Unsicherheitsbeitrage fur diese beiden Schritte sind immer gleich und bekannt. Bei dem oben genannten Beispiel kommt lediglich eine weitere
9.4 Zusarnrnenfassung und Ernpfehlung
435
Verdunnung hinzu. Die Analyse wird bei LC-Trennungen oft rnit einem externem Standard durchgefuhrt. Die Unsicherheitsbeitrage sind auch hierbei immer gleich und bekannt. Die verwendeten mobilen Phasen haben verschieden grolje Unsicherheitsbeitrage. Es wurde bei der Etablierung der Messunsicherheitsabschatzung sehr bald klar, daS es einfach (z. B. isokratische Methode mit Acetonitril-Wasser-Gemischen) und schwierig herzustellende mobile Phasen (z. B. Gradientenmethode mit Phosphatpuffer, Aminkomponente und eingestelltem pH-Wert, wobei der B-Eluent einen hoheren organischen Anteil enthalt) gibt. Auch hier finden sich die gleichen Unsicherheitsbeitrage sehr schnell immer wieder. Die Gerateunsicherheiten sind aufgrund von Geratekalibrierungen ebenfalls bekannt. Bei der Kapillarelektrophorese und der GC ist die Injektion ein gewichtiger Unsicherheitsbeitrag. Jedoch auch hier stellte sich heraus, daS die Gerateunsicherheit sehr schnell in zwei Kategorien teilen 1aSt: mit internem oder mit externem Standard. Bei der Auswertung ist in unserem Labor ebenfalls festzustellen, daS sich der Unsicherheitsbeitrag der Auswertung in zwei Kategorien teilen lieS: Gehaltsbestimmungen der Hauptkomponente und Spurenbestimmungen. In dem Augenblick, in dem Spezifikationsgrenzen festgelegt werden, kann die Ermittlung der Merkmalswerte des Verfahrens in kurzer Zeit rnit Hilfe der Messunsicherheitsabschatzung erfolgen. Ein Vergleich rnit der Spezifikation ergibt dann sofort, ob das Verfahren geeignet (valide) ist. Bei diesem Vorgehen ist es somit moglich, bereits nach wenigen Durchfuhrungen des Analysenverfahrens durch einfache Dokumentation der Abschatzung, eine Validierung zur Verfugung zu stellen. Eine interessante Anwendung der Messunsicherheitsabschatzung ergibt sich, wenn ein zweiter unabhangiger Experte ebenfalls eine Abschatzung der Unsicherheiten vornimmt, und der Ersteller der Methode und der unabhangige Experte die Ergebnisse ihrer Schatzungen diskutieren. Durch den zweiten Beobachter und die anschlieflende Diskussion konnen leicht versteckte Schwierigkeiten eines Verfahrens zu einem sehr fruhen Zeitpunkt aufgedeckt werden. An dieser Stelle sei an Abb. 9-1 erinnert. Das Dilemma von Grenzfallen ist nur teilweise gelost. Eine Probe, bei der ein MeSpunkt des Typs B oder C erhalten wird, ist jetzt identifiziert. Es ist dem Auftraggeber somit bekannt, wann keine Entscheidung getroffen werden kann oder darf. Es ergeben sich zwei Moglichkeiten fur das weitere Vorgehen. Falls eine Entscheidung getroffen werden mu& besteht die Moglichkeit, eine Methode mit geringerer Unsicherheit anzuwenden bzw. die wichtigste(n) Unsicherheitsbeitrage durch geeignete MaBnahmen zu reduzieren. Bei dem erwahnten chromatographischen Beispiel besteht die Moglichkeit, den ersten und zweiten Unsicherheitsbeitrag durch VergroSerung der Probenziehung und der Verwendung groSerer Volumina fur die Homogenisierung zu reduzieren. Der Unsicherheitsbeitrag der Integration laRt sich durch eine manuelle Integration verringem. Als zweite Moglichkeit zum Umgang rnit den Situationen B und C sollte in Betracht gezogen werden, keine Entscheidung aus dem MeSergebnis abzuleiten. Mit dem hier gezeigten Ansatz erhalt man sehr schnell eine validierte Aussage. Die Frage des Auftraggebers an ein Analysenlabor lautet jedoch nicht: ,,War die Analysenmethode valide, als sie zum ersten Ma1 angewendet wurde?" sondern vielmehr: ,,Ist das heute erstellte Analysenergebnis geeignet fur die Entscheidung, die heute getroffen werden soll?", z. B. ,,Kann diese Produktcharge in den Verkauf gehen?" Dazu ist eine permanente Revalidierung des Verfahrens notig. Die Messunsicherheitsabschatzung hat unter anderem den Vorteil, daS sie zu Beginn eines Prozesses durchgefuhrt werden kann und somit eine
436
9 Schiitzen der Mefiunsicherheit
Basis fur die Kontrolle der nun definierten Qualitat liefert. Diese Kontrolle der Qualitat, die als kontinuierliche Revalidierung des Verfahrens betrachtet werden kann, kann durch Regelkarten erfolgen.
9.5
Statistische ProzeBkontrolle
Die Regelkarte ist das Kernstuck der statistischen ProzeRkontrolle (SPC). Wird eine Aufgabe wiederholt angewandt, werden z. B. rnit der gleichen Methode immer wieder Proben analysiert, so kann man diese immer wiederkehrende Analyse als einen ProzeB bezeichnen. Jeder ProzeR hat eine naturliche Schwankungsbreite und kann zusatzlich ,,AusreiBer" oder Trends haben. Die Methode zur Kontrolle eines solchen Prozesses auf AusreiRer und Trends bezeichnet man als ,,Statistkche ProzeBkontrolle" oder kurz SPC. Die statistische ProzeBkontrolle wird oft als ein Qualitatsverbesserungswerkzeug zur stetigen Reduzierung der Schwankungsbreite eines Prozesses verwendet [ 1341. Die Methoden der SPC haben seit den funfziger Jahren besonders in Japan Anwendung gefunden und sind einer der wichtigsten Stutzen des japanischen Modells der kontinuierlichen Verbesserung. Die Regelkarte hat hierbei die Aufgabe, zwischen unnaturlicher Variabilitat (AusreiBer) und naturlicher Variabilitat (die Schwankungsbreite, die immer da ist) zu unterscheiden und somit festzustellen: ,,Wann liegt ein wirklicher AusreiRer vor" und zum zweiten kann die Regelkarte GroBe und Umfang der Unsicherheit eines Prozesses (naturliche Variabilitat) beschreiben. Die Regelkarte ist zudem ein Werkzeug, das hervorragend geeignet ist, Trends und TendenZen fruhzeitig zu erkennen. In Abschnitt 8 wurde ausfuhrlich auf das Werkzeug ,,SPC" eingegangen. Nachfolgend sol1 die Anwendung an einem Beispiel demonstriert werden. Eine immer wieder angewendete Analysenmethode, namlich die oben beschriebene Methode zur Bestimmung von N-Benzylaziridin in Ruckstanden, ist ein Beispiel fur einen ProzeB. Somit kann die Regelkarte zeigen, ob die Schatzung am Anfang richtig war und ob die Schatzung noch immer richtig ist. Die Regelkarte ist somit die permanente Revalidierung, die vom Kunden fur die Aussage benotigt wird, ob die Charge des Produktes aufgrund des Analysenergebnisses in den Verkauf gehen kann oder nicht. Das praktische Vorgehen ist recht einfach. Eine typische Produktionscharge wird als Qualitltskontrollprobe verwendet. Es empfiehlt sich, eine groBere Menge einer typischen Substanz fur die Durchfuhrung der Analysen der nachsten Jahre als Ruckstellmuster zu verwenden. Der Hersteller sollte, gefragt werden unter welchen Bedingungen die Substanz problemlos uber Jahre lagerbar ist. Bei der oben erwlhnten Ruckstandsbestimmung wurde eine Mutterlauge eines Ruckstandes, der kein N-Benzylaziridin enthielt, mit ca. 100 ppm versetzt und im Tiefkuhler gelagert. Diese Kontrollprobe wird mit jeder Routineanalyse wie eine Probe analysiert. Das erhaltene Ergebnis wird in einer Regelkarte wie in Abb. 9-3 eingetragen. Es folgt die Prufung, ob eine der statistische Regeln in Abb. 8-5 verletzt sind. 1st dies nicht der Fall, kann das Verfahren weiterhin als valide betrachtet werden. Die oben gezeigten Beispiele verwenden sogenannte Einzelwertregelkarten. Das bedeutet, daB der jeweils bei der Kontrollmessung erhaltene MeBwert ohne weitere Rechenoperationen in die Regelkarte eingetragen wird. Neben den Einzelwertregelkarten gibt es wei-
9.5 Stutistische Prozesskontrolle
a)
437
%
120
+0bere EIngriffsgrenze
110
+Untere Eingriffsgrenze
100 I
90 80 70
b)
35 30 25
20 15 10 5
1 2 3 4 5 6 7 8 9 101112131415161718 Wiederholung
A
I+-Abweichung
Kontrollprobe
I
tere Typen von Regelkarten, auf die hier nicht eingegangen werden soll. Fur Interessierte sei auf die Literatur verwiesen [135, 1361. In der Praxis kann eine Regelkarte am besten von Hand auf einem vorgedruckten Formular gefuhrt werden. Es werden dabei der aktuelle Merjwert und die Differenz zur letzten Messung als Zahl in den beiden oberen Spalten erfal3t. AnschlieBend werden beide Werte in den Graphikteil als Punkt oder Kreuz eingetragen und mit dem letzten Messwert verbunden. Die Erfassung von Bemerkungen (z. B. ,,neue Saule fur HPLC" oder ,,Saulendruck 350 bar"), die fur spatere Auswertung enorm wichtig sein konnen, erfolgt zwischen den Zahlenspalten und dem Graphikteil. Die Uber-
438
9 Schiitxn der Me@nsicherheit
prufung auf Regelverletzungen schlieBt die Benutzung der Regelkarten ab. Falls die Kontrolle von Prozessen erfolgen soll, die mit hoherer Frequenz auftreten, kann mit Hilfe eines Vorlaufs der ersten ca. 20-30 Werte die Ermittlung von Eingriffsgrenzen erfolgen. Die Berechnung der Grenzen kann mit Hilfe von einfachen Rechenregeln [ 1371 durchgefuhrt werden. Diese Grenzen, die fur die Anwendung einiger der statistischen Regeln unablassig sind, sollten farbig in die Regelkarte eingetragen werden. Regelkartenformulare mit Arbeitsanweisung auf der Ruckseite sind seit kurzen kommerziell z. B. uber Rekaform, Gartenfeldstr. 18, 65527 Niedernhausen verfugbar. Zusatzlich gibt es PC-Programme, die das Fuhren von Regelkarten in elektronischer Form, z. B. [ 1381 erlauben. Die PC-Programme haben den Vorteil grol3e Zahlenmengen einfach verarbeiten zu konnen. Der Nachteil besteht in der auch auf groRen PC-Bildschirmen rnangelhaften Ubersichtlichkeit.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
10 SchluBwort
Das Ziel eines Labors ist, sein Produkt, die analytische Dienstleistung, zu verkaufen - auch morgen. Dazu tragen mehrere Faktoren bei, die nicht Gegenstand dieses Buches waren: Permanente Weiterbildung, modernes Management, das seine Vorbildfunktion wahrnimmt, Wille und Konnen zu permanenter Optimierung aller Prozesse, kompromil3lose Kundenorientierung, konstruktive Unzufriedenheit, Qualitatsmanagement, das zu den gesteckten Zielen pafit und nicht umgekehrt. Diese - und weitere - Faktoren erst ermoglichen eine permanente Qualitatsverbesserung, der Garant dafur, daB die analytische Dienstleistung sowohl verkaufbar bleibt als auch ihrer gesellschaftlichen Verantwortung gerecht wird. Die Validierung und anschlieBend Charakterisierung einer Methode konnen bei eben geschilderten Bemuhungen um das gesteckte Ziel ein wichtiges Werkzeug sein, weil dadurch Starken und Schwachen quantifizierbar werden, ein Tatbestand, der weitere Optimierungen ermoglicht. Noch einmal: Das Verkaufen der Dienstleistung ist das ausschlieBliche Ziel. So kann beispielsweise eine qualifizierte Einrichtung (Labor plus Personal) die Notwendigkeit einer Validierung ad absurdum fuhren, weil sie sich fur einen Schnelltest entscheidet und diese Entscheidung gebuhrend vertritt: Der Schnelltest genugt den Anforderungen, bei Bed& wird auf ein Standardverfahren verwiesen, mit dem die Ergebnisse bereits verifiziert wurden. Oder sie arbeitet mit vorhersagbaren, beherrschten Analysenprozessen, die ein Minimum an Tests benotigen. Oder sie stellt sich und dem Kunden ,,intelligente" Fragen, deren Beantwortung einem vereinfachten, sehr spezifischen Analysen- und damit Validierungsdesign genugen. Fallt nun die Entscheidung - wie auch immer - fur eine Validierung, so mu0 der Umfang und der Durchfiihrungsmodus bewuBt und individuell festgelegt werden. Darauf wurde in diesem Buch von mehreren Autoren ausfuhrlich eingegangen. Zur Eignung und damit Beurteilung einer Methode gehoren neben den ublichen Validierungselementen noch weitere Aspekte, die in der Regel im Rahmen einer ,,klassischen"Validierung keine oder nur eine untergeordnete Rolle spielen z. B. - Relevanz der Probe - Zeitaufwand - Kosten - Schwierigkeitsgrad Sicherheit Diese Aspekte sollten ebenfalls gebuhrend bedacht werden. Das Berufsbild des Analytikers hat sich gewandelt, er wird immer mehr zum Berater, der ,,Messende" wird zum ,,Priifenden". Als Berater muB er versuchen, die wahren, vielleicht nicht einmal ausgesprochenen Wunsche des Kunden zu verstehen, um sie erfullen zu
konnen. AnschlieBend mu8 er den Kunden uber samtliche Aspekte der Aufgabenstellung offen und umfassend informieren. Nicht unbedingt aus ethischen Grunden, reine Vernunftsuberlegungen diktieren eine solche Haltung. Wie jeder Berater unterliegt auch der Analytiker Zwangen: Kosten- und Zeitdruck, Personalmangel, Behnrdenanforderungen etc. Die tagliche Herausforderung liegt darin, die gegebenen Moglichkeiten optimal zu nutzen. Aber wie? Zur vernunftigen Analytik gehoren .,geeignete" Menschen, geeignete Maschinen und geeignetes Material. Und naturlich MuBe. .,Harte" Faktoren wie moderne Gerateausstattung, analytisches Konnen etc. sind meist vorhanden oder relativ leicht von auBen einzukaufen. Das weit groBere Potential zur ProblemlSsung liegt in den ,,weichen" Faktoren wie Kommunikationsfahigkeit, Transparenz, Flexibilitiit, s o ~ i a l eKompetenz, Verantwortung und die Bereitschaft, sich und die unmittelbare Umgebung zu andern. In der Entwicklung dieser Schlusselqualifikationen liegt unsere Chance.
Handbuch Validierung in der Analytik
A Anhang
A1
Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Abkurzungen (Auswahl)
AAS:
Atom Absorptions Spektroskopie
AES:
Atom Emmissions Spektroskopie
AOAC:
Association of Official Analytical Chemists
BAM:
Bundesanstalt fur Materialforschung und -prufung
BfArM:
Bundesinstitut fur Arzneimittel und Medizinprodukte (ehemals Bundesgesundheitsamt, BGA)
BGA:
Bundesgesundheitsamt
BgVV:
Bundesinstitut fur gesundheitlichen Verbraucherschutz und Veterinarmedizin
B P:
British Pharmacopoe
BPI:
Bundesverband der pharmazeutischen Industrie
CE:
Capillary Electrophoresis (Kapillarelektrophorese)
CEC:
Capillary Electrochromatography (Kapillarelektrochromatographie)
DAB:
Deutsches Arzneimittel Buch
DACH:
Deutsche Akkreditierungsstelle Chemie GmbH
DAD:
Dioden Array Detektor
DAR
Deutscher Akkreditierungs Rat
DEV:
Deutsche Einheits Verfahren
DIN:
Deutsche Industrie Norm
EAL:
European Cooperation for Accreditation of Laboratories
EC:
European Community
EN:
Euronorm
EP:
European Pharmacopoe
EPA:
Environment Protection Agency (Umweltbehorde in den USA)
Euro Pharm:
Europiiische Pharmakopbe
FDA:
Food and Drug Administration (,,machtige" Kontroll- und Bewertungsbehorde fur Lebens- und Arzneimittel in den USA)
GLP:
Good Laboratory Practice (Gute Labor Praxis)
GMP und cCMP: Good Manufacturing Practice und current Good Manufacturing Practice (Gute Herstellpraxis) HPB:
Health Protection Branche (kanadisches Pendant zu FDA)
HPLC:
High Performance Liquid Chromatography
ICH:
International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use (maRgeblich fur USA, EU und Japan)
ICP:
Induced Couple Plasma
ILAC:
International Laboratory Accreditation Conference
IQC:
Internal Quality Control
ISK:
In Statistischer Kontrolle
ISO:
International Organisation of Standardisation
J P:
Japan Pharmacopoe
LC-MS:
Liquid Chromatography - Mass Spectrometry (HPLC-MS Kopplung)
MALDI:
Matrix Assistant Laser Desorption Ionisation
MS:
Mass Spectroscopy (Massen-Spektroskopie)
n:
number, Anzahl der Werte
NAMAS:
National Accreditation of Measurement and Sampling (GroRbritannien)
NATA:
National Association of Testing Authorities (Australien)
NIRS:
Nahe Infra Rot Spektroskopie
NISK:
Nicht In Statistischer Kontrolle
NMR:
Nuclear Magnetic Resonance
OSG:
Obere Spezifikationsgrenze
P:
von: Propability = Wahrscheinlichkeit (Signifikanzniveau)
PIC:
Pharmaceutical Industry Conference
QM:
Qualitiitsmanagement
A1 Abkurzungen (Auswahl)
443
QS:
Qualitatssicherung
RF:
Rontgenfluoreszenz
RIA:
Radio Imrnuno Assay
RP:
Reversed Phase
S: (T:
Sekunde, Standardabweichung (endliche Werte, Stichprobe) unendliche Werte, n -+ 00
SPC:
Statistische ProzeBkontrolle
SQC:
Statistische Qualitatskontrolle
SQS:
Statistische Qualitatssicherung
U:
Unsicherheit
USG:
Untere Spezifikationsgrenze
USP:
United States Pharmacopoe
VICH:
International Cooperation on Harmonisation of Technical Requirements for Registration of Veterinary Medicinal Products
Vk::
Variationskoeffzient
WELAC:
Western European Laboratory Accreditation Cooperation (Akkreditierer von Kalibrierlaboratorien)
-
X
Mittelwert
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
A2
Definitionen und Erlauterungen von Begriffen aus den Bereichen ,,Validierung" und ,,Qualitatssicherung"
In einer Reihe von Regelwerken und sonxtigen Schriftstiicken finden sich Definitionen, Erlauterungen und Kommentare von Begriffen aus den Bereichen Validierung, Statistik und Qualitatssicherung. Interessierte Leser seien auf folgende Quellen hingewiesen, siehe auch,,Literatur", Abschnitt A9 -
-
-
-
DIN 32645,1994 DIN 38402, A41, A42, AS 1 DIN I S 0 11453, 1992 I S 0 8402 ( 1994) Quality management and quality assurance-vocabulary DIN 55350 Teil 11, 12, 13 und 23, 1989 Dln 1319-3, 1996 DIN 1319-4, 1999 VDEh: Handbuch fur das Eisenhuttenlaboratorium, Band 5,1985 DIN/ISO 6879, 1984 Euro-Norm, No. 5-86 VDI Richtlinien, VDI 2449, Blatt 2,1987 VDI Arbeitsgruppe, VDI 2499/ I , 1987 FachnormenausschuR Medizin, DIN 58936, Teil 1-3, 1975 ICH Topic Q2A Validation of Analytical Methods Definitions and Terminology DINK05725 Internationales Worterbuch der Metrologie, 2. Auflage, Beuth Verlag GmbH, Berlin 1994 DIN I S 0 17025 2000
Nachfolgend sind einige Begriffe erlautert. Gibt es zu einem bestimmten Begriff verwandte Begriffe wird mit einem * darauf hingewiesen. Die Definition bzw. Erlauterung findet sich dann an der entsprechenden Stelle. + deutet an, daR auch dieser Begriff in der Auflistung zu finden ist. SchlieBlich weisen die Zahlen aufdie entsprechenden Kapitel im Buch. Der Hinweis auf ein Regelwerk z. B. DIN bedeutet, daR dieser Begriff u. a. dort definiert wird. Der Text in der rechten Spalte entspricht nicht unbedingt dem exakten Wortlaut dieser Quelle.
A2 Dejinitionen und Erlauterungen von Begriffen
445
Akkreditierung
Akkreditierung ist die Bestatigung, darj eine Stelle kompetent ist, ihre Aufgaben durchzufuhren. Akkreditiert werden konnen Priiflaboratorien, Kalibrierlaboratorien und Zertifizierstellen. (Akkreditierung = Kompetenzbestatigung)
Alternativverfahren
Von den anerkannten Referenzverfahren abweichende Analysenverfahren. Sie sind schneller undoder kostengunstiger, zeigen Ergebnisse mit meist eingeschrankter Qualitat und decken teilweise andere Fragestellungen ab. Alternativverfahren gliedern sich in Orientierungstests, Feldrnethoden und Laborvergleichsverfahren.
Arbeitsbereich oder Merjbereich, dynamischer Arbeitsbereich (3.10)
Das ist der Konzentrationsbereich fur gultige, quantitative Aussagen uber Linearitat (+), Richtigkeit (4)und Prazision (+) des Ermittlungsverfahrens.
Arithmetischer Mittelwert, fruher auch ,,Durchschnitt", oder einfach ,,Mittelwed' DIN 55350 Teil23
Summe der Beobachtungswerte dividiert durch Anzahl der Beobachtungswerte:
Beglaubigtes oder zertifiziertes Referenzmaterial: I S 0 Guide 20, Abschnitt 30.2.2 und update IS0 Guide 30 (* Referenzmaterial, Primastandard)
Referenzmaterial, von dem ein Eigenschaftswert oder mehrere durch ein technisch gultiges Verfahren beglaubigt wurde. Der Eigenschaftswert weist eine bekannte Merjunsicherheit bei einem gegebenen Signifikanzniveau auf. Dem Verfahren liegt ein Zertifikat bei oder es wird auf andere Dokumentationen verwiesen, die von einer Zertifizierungsstelie herausgegeben wurden.
Belastungstest
Versuch(e) zur Errnittlung der Bandbreiten aller kritischer Verfahrensparameter innerhalb derer das Verfahren gemal3 vorher festgelegten Qualitatskriterien durchgefuhrt werden kann.
Beobachtungswert DIN IS0 5725
Als Ergebnis einer Beobachtung festgestellter Merkmalswert. Anm.: Es handelt sich urn einen einzelnen Wert, erhalten aus einer einzelnen Beobachtung.
Bestimmungsgrenze, selten: Quantifizierungsgrenze (3.9)
Geringster Gehalt, der mit einer vorgegebenen Wahrscheinlichkeit quantitativ erfarjt werden kann, in der Regel die dreifache Nachweisgrenze.
446
A Anhang
Bias
AusmaB der systematischen Abweichung des Analytwertes bezogen auf einen Referenzwert. Wird manchma1 als relative Abweichung in Prozent angegeben:
Blindprobe DIN 32645
Probe, die den betreffenden Analyten nachweislich nicht enthalt, sonst aber weitgehend mit der Probe identisch ist.
Cochran-Test (3.3.6.4) DIN IS0 5725
Statistischer Test, der ,,AusreiBer" in der Varianz der einzelfnen Labordatensatze ermittelt.
,,current validation" (Validierung wahrend eines laufenden Prozesses)
Parallele Abarbeitung; z. B. Validierungstests an zwei von drei Partien wahrend eines laufenden (Produktions-) Prozesses, d. h. wahrend der Nutzung des Prozesses.
DIN
DIN (Deutsches Institut fur Normung e. V.) ist Trager der nationalen Normungsarbeit. Es beteiligt sich uber CEN, CENELEC an der europaischen und uber IS0 an der internationalen Normung.
Dixon-Test (3.3.6.1) DIN I S 0 5725
Statistischer Test, der uberpruft, ob ein einzelner MeBwert aus einem Labordatensatz unter der Normalverteilungsannahme (GauB-Verteilung) ein ,,AusreiBer" ist.
____
Dosieren, DIN 1319, Teil 1
Dosieren heiBt, aus einer Stoffportion festgelegte Teilmengen herauszunehmen (abtrennen). Unter Dosieren versteht man auch das Hinzufugen bestimmter Stoffportionen beim Herstellen eines Stoffgemisches mit vorgegebener Zusammensetzung oder mit vorgegebenen Eigenschaften.
Eichen DIN 1319, Teil 1
Das Eichen eines MeBgerates (auch einer MaBverkorperung) urnfafit die von der zustandigen Eichbehorde nach den Eichvorschriften vorzunehmenden Prufungen und die Stempelung. Durch die Prufung wird festgestellt, ob das vorgelegte MeRgerat den Eichvorschriften entspricht, d. h. ob es den an seine Beschaffenheit und seine mefitechnischen Eigenschaften zu stellenden Anforderungen genugt, insbesondere ob die Betrage der Mefiabweichungen die Fehlergrenze (n) nicht uberschreiten.
A2 Definitionen und Erlauterungen von Begriffen
447
Empfindlichkeit (3.7)
Fahigkeit einer Methode, zwischen zwei kleinen Konzentrationen zu unterscheiden; Steigung der Kalibrierkurve.
Entscheidungsgrenze
Geringster Gehalt des Analyten, der bei tatsachlicher Anwesenheit mit angemessener statistischer Sicherheit nachgewiesen wird und entsprechend den Kriterien der Methode identifiziert werden kann.
~
= Erfassungsgrenze (+) (3.9)
Amtsblatt der Europaischen Gemeinschaft Nr. L 223 (* Nachweisgrenze)
Ergebnisabweichung DIN 55350 Teil 13
Erfassungsgrenze = Entscheidungsgrenze
(+I (3.9) DIN 32645 I S 0 11843-1
Anm.: Im erwahnten Amtsblatt der EU entspricht die Entscheidungsgrenze der dreifachen (sonst zweifachen) Nachweisgrenze (+) Unterschied zwischen einem Ermittlungsergebnis und dem Bezugswert, wobei dieser je nach Festlegung oder Vereinbarung der wahre (+), der richtige (+) oder der Erwartungswert (+) sein kann. Die Erfassungsgrenze ist der kleinste Gehalt einer gegebenen Probe bei dem mit der Wahrscheinlichkeit 100 -@ (50 <@100) ein Nachweis moglich ist. Akzeptiert man eine Irrtumswahrscheinlichkeit von 50 %, ist die Erfassungsgrenze gleich der Nachweisgrenze; in der Regel wird jedoch als Erfassungsgrenze die zweifache Nachweisgrenze angenommen.
Ergebnisunsicherheit DIN 55350 Teil 13 Standardunsicherheit U (+) erweiterte Unsicherheit (+)
Geschatzter Betrag zur Kennzeichnung eines Wertebereichs, innerhalb dessen der Bezugswert mit einer vorgegebenen Wahrscheinlichkeit liegt (in der Regel der Erwartungswert). Sie wird angegeben zwischen der unteren bzw. der oberen Grenze dieses Wertebereichs.
Ermittlungsergebnis DIN I S 0 5725
Durch die Anwendung eines festgelegten Ermittlungsverfahrens festgestellter Merkmalswert. Anm.: Das Ermittlungsverfahren kann festlegen, dal3 eine Anzahl von individuellen Beobachtungen anzustellen sind und ihr Mittelwert als Ergebnis zu melden ist. Also kann ein einzelnes Ermittlungsergebnis ein aus mehreren Beobachtungswerten berechnetes Ergebnis sein.
448
A Anhang
Erwartungswert (* Mittelwert) DIN 55350, Teil 13,21
Unbekannter Mittelwert der Grundgesamtheit. Als bester Naherungswert gilt der Mittelwert ails einer hinreichend grol3en Zahl wiederholter Messungen bzw. als mittleres Ermittlungsergebnis, welches bei unendlicher Wiederholung der Messung hatte gewonnen werden konnen.
Erweiterte Unsicherheit
Vielfaches der kombinierten Standardunsicherheit. Deren Multiplikation mit einem Erweiterungsfaktor k ergibt ein Vertrauensintervall, von dern erwartet wird, daR es den GroRteil der der MeBgroBe zugeordneten Werte umfal3t. UE = k Uge5 UE ist ein Ma13 fur zufiillige plus systernatische Fehler
Erweiterungsfaktor (3.3.3.7)
Zahlenfaktor, mit dem die kombinierte Standardunsicherheit (+) multipliziert wird, um eine erweiterte Unsicherheit (4)zu erhalten. Typischer Bereich ist zwischen 2 und 3.
EURACHEM
Wurde als Vereinigung chemisch-analytisch orientierter Pruflaboratorien in EU und ERA-Landern gebildet. Die Zielsetzungen entsprechen im wesentlichen denen von EUROLAB, Fokus jedoch ist die Analytik.
EUROLAB
Wurde gegrundet mit dem Ziel, die Zusammenarbeit zwischen Pruflaboratorien generell zu fordern und durch Harmonisierung von Qualitatsanforderungen und QSMaBnahmen Vertrauen im Hinblick auf die gegenseitige Anerkennung von Priifresultaten zu schaffen.
Exakter Wert (* wahrer Wert, richtiger Wert) DIN 55350, Teil 13
Der wahre Wert eines mathernatisch theoretischen Merkmals.
Fehler
Abweichung eines Merkmalwertes vom Sollwert.
F-Test (3.3.6.4)
Statistischer Test, der die Varianz aller individuellen Resultate vergleicht und abschiitzt.
Anm.: Bei einern numerischen Berechnungsverfahren wird sich als Ermittlungsergebnis jedoch nicht immer der exakte Wert ergeben. Beispielsweise ist der exakte Wert von rI = 3,1416 ... und der Wert der universellen Gaskonstante R = 8,3 143.. . J/Wmol.
A 2 Definitionen und Erlauterungen von Begriffen
Funktionale Qualifizierung (OQ)
449
Beweisfuhrung, daO nach der Installation und Kalibrierung die Spezifikationen in einem reprasentativen Arbeitsbereich (z. B. Konzentrations-, Temperaturbereich) eingehalten werden. Anm.:In der Praxis sind oft die Grenzen zwischen IQ (+) und OQ flieBend.
Genauigkeit (3.3)
Ausmal3 der Ubereinstimmung zwischen dem richtigen (wahren) und dem MeBwert. Anm.: Somit ist Genauigkeit ein qualitatives MaO fur systematische und zufallige Fehler, also stellt sie den Oberbegriff fur Richtigkeit (4und ) Prazision (4)dar. Ein Ergebnis ist genau, wenn es frei von zufalligen und systematischen Fehlern ist. Da in der Vergangenheit ,,Genauigkeit" der ,,Prazision" oder sogar der ,,Richtigkeit" gleichgesetzt wurde, was zu vielen MiBverstandnissen gefuhrt hat, wird empfohlen, den Begriff Genauigkeit in Zusammenhang mit der Validierung zu vermeiden.
Gesamtvalidierung
Sie beinhaltet eine Serie von Tests, um die Leistungsfahigkeit einer computerisierten Anlage unter realen Bedingungen zu prufen. Oft besteht sie aus zwei Stufen: System- und anschliefiend Methodenkalibrierung.
Gewichteter Mittelwert
Summe der Produkte aus Beobachtungswerten und ihrem Gewicht dividiert durch die Summe der Gewichte, wobei das Gewicht eine jeweils dem Beobachtungswert zugeordnete nicht negative Zahl ist:
DIN 55350 Teil23
2 2
WjXi
i=o
Wi
i=O
Wobei Wi 2 0 das dem Beobachtungswert xi zugeordnete Gewicht ist. Anm.: Friiher auch ,,gewichteter Durchschnitt".
450
A Anhung
Installationsqualifizierung (IQ) (2.3)
Abnahmetests bei Installation des Gerates, die sowohl regulatorische Anforderungen als auch Design-Spezifikationen mit einbeziehen. Auch Uberprufung, ob die Empfehlungen des Herstellers bei der Installation beachtet wurden.
Interne Qualitatskontrolle
MaBnahmen zur Uberwachung der Qualitatlzuverlassigkeit von Routinedaten. Das ist also der ,,final check" fur den gesamten analytischen ProzeB incl. Kalibrierung. Dies erfolgt z. B. mit Hilfe von Kontrollkarten. 1995 zuerst von der IUPAC empfohlen, gewinnt dieser Ansatz langsam an Bedeutung.
Justierbarkeit (,,adjustment"), selten: Methodenanpassung
Umfang an kleineren Anderungen in einer Methode, deren EinfluB auf das Ergebnis durch einen Systemeignungstest uberwacht wird. Das Ziel ist, die Notwendigkeit von Revalidierungen kritisch zu beurteilen - um deren Zahl auf ein Minimum zu reduzieren.
Justierbarkeitsgrenzen oder -bereich (,,adjustment limits")
Durch gezielte Verfahrensanderungen experimentell ermittelter Schwankungsbereich eines MeBergebnisses. Bei etwaigen Verfahrensanderungen im Routinebetrieb, die nicht zur Uberschreitung dieses Bereichs fuhren, ist Revalidierung nicht notig.
Justieren (Abgleichen) DIN 1319, Teil 1
Justieren im Bereich der MeBtechnik heiRt, ein MeBgerat (auch eine MaBverkorperung) so einstellen oder abgleichen, daB die MeBabweichungen moglichst klein werden, oder daB die Betrage der MeBabweichungen die Fehlergrenzen nicht uberschreiten. Das Justieren erfordert also einen Eingriff, der das MeBgerat oder die MaBverkorperung meist bleibend verandert.
Kalibrieren (Einmessen) DIN 1319, Teil 1
Kalibrieren im Bereich der MeBtechnik heist, die MeBabweichungen am fertigen MeBgerat feststellen. Beim Kalibrieren erfolgt kein technischer Eingriff am MeBgerat. Bei anzeigenden Mefigeraten wird durch das Kalibrieren die MeBabweichung zwischen der Anzeige und dem richtigen oder als richtig geltenden Wert festgestellt.
Kalibrierung oder Kalibration (1.2.5) DIN 1319Teil 1
Beziehung zwischen den durch ein MeBgerat angezeigten Werten und den entsprechenden bekannten Konzentrationen (Mengen) eines Referenzstandards.
A2 Definitionen und Erlauterungen von Begriffen
45 1
Klassieren DIN 1319 Teil 1
Klassieren heifit, in bestimmter Hinsicht gleichartige Elemente einer Menge den vorgegebenen oder vereinbarten Klassen eines Merkmales zuordnen. Das Festlegen der Klassen und das Feststellen von Haufigkeiten in den Klassen gehort mit zum Klassieren.
Kombinierte Standardunsicherheit (1.4, 3.4.3)
Gesamtunsicherheit eines Ergebnisses; zu ermitteln als Quadratwurzel aus der Summe der Varianzen aller Einflusse:
Uges= Ju:
+ u*2 + ...
Uges ist ein Ma6 fur allerlei zufallige Fehler. Konstanter systematischer Fehler
Von der Konzentration des Analyten unabhangiger, konstanter Fehler.
Kritische Differenz
Differenz zwischen zwei Analysenwerten, die mit einer vorgegebenen statistischen Sicherheit als signifikant angesehen werden muB.
Kritischer Vergleichdifferenzbetrag, fruher: ,,kritische Vergleichsdifferenz" DIN I S 0 5725
Betrag, unter dem der Absolutwert der Differenz zwischen zwei unter Vergleichbedingungen gewonnenen Ergebnissen mit einer vorgegebenen Wahrscheinlichkeit erwartet werden kann.
Leistungsqualifizierung (PQ) (2.3)
Uberprufung des Gesamtsystems (Beweisfiihrung) mit Hilfe realer Proben auf Einhaltung der geforderten Spezifikationen.
~
~~
Linearitat
Fahigkeit eines Verfahrensleiner Methode, innerhalb eines bestimmten Konzentrationsbereichs MeBergebnisse zu generieren, deren Abhangigkeit von der Konzentration bzw. Menge des Analytes in der Probe durch eine Geradengleichung (lineare Regression) zu beschreiben ist.
Median oder Zentralwert DIN 55350 Teil21,23
Wert, der eine aufsteigende MeBwertreihe in zwei gleich groBe Teilmengen teilt.
Merkmalsniveau DIN IS0 5725
Der Mittelwert der Ermitttlungsergebnisse aller Labors fur ein bestimmtes untersuchtes Material oder Objekt.
MeBbereich siehe Arbeitsbereich (+)
452
A Anhang
MeBeinrichtung * Prufmittel, * MeBgerat
(-+I DGQ-Schrift I 1-04
Gesamtheit aller MeBgerate und zusatzlicher Einrichtungen zur Erzielung eines MeBergebnisses. Anmerkung 1: Zusatzliche Einrichtungen sind Hilfsgerate, die nicht unmittelbar zur Aufnahme, Umformung und Ausgabe dienen (Beispiele: Einrichtung fur Hilfsenergie, Ableselupe, Thermostat). Anmerkung 2: Im einfachsten Fall besteht die MeBeinrichtung aus einem einzigen MeBgerat.
MeBgeriit * MeBeinrichtung, * Prufmittel (+) DGQ-Schrift 1 1-04
Gerat, das allein oder in Verbindung mit anderen Einrichtungen fur die Messung einer MeRgroBe vorgesehen ist. Anmerkung 1 : Auch MaBverkorperungen sind Me& gerate. Anmerkung 2: Ein Gerat ist auch dann ein MeBgerat, wenn seine Aufgabe ubertragen, umgeformt, bearbeitet oder gespeichert wird und nicht zur direkten Aufnahme durch den Beobachter geeignet ist (Beispiele: MeBumformer, Strom- und Spannungswandler, MeBumsetzer, MeBverstarker). Anmerkung 3 : Ein Meagerit kann auch MeBobjekt sein, z. B. bei seiner Kalibrierung.
MeRunsicherheit ( 1.4, 3.4.3) DIN 55350 Teil 13 DIN 1319 Teil3
Ergebnisunsicherheit eines MeBwertes. Das ist also ein quantitativer Genauigkeitsgrad in der MeBtechnik. Das entspricht dem Interval1 fur Werte um den wahren Wert fur ein gegebenes Signifikanzniveau.
Methode, analytische
Bemerkung: Diese Definition, sowie jene von ,,Verfahren" (+) und ,,Prufvorschrift" (+) geben die Auffassung des Autors wieder und decken sich mit dem ublichen Sprachgebrauch. Andere Auslegungen sind durchaus moglich. Anwendung einer TechniWeines physikalischen oder chemischen Prinzips, um eine Messung durchfuhren zu konnen. Beispiel: RP-Chromatographie fur die Trennung von PAK's.
Modul- oder modulare Validierung
Hiermit wird die Validierung oder genauer die Kalibrierung einzelner Module eines computerisierten Analysengeriites verstanden.
A2 Definitionen und Erliiuterungen von Begrifen
453
Nachweisgrenze (3.9) DIN 32645 I S 0 11843-1
Geringster Gehalt, der noch nachgewiesen werden kann (Qualitative Ja/Nein-Aussage, Irrtum 50 %). Er gilt als nachgewiesen, wenn das Signal des Analyten sich signifikant vom Leerwert unterscheidet.
Prazision, fruher auch: ,,Wiederholgenauigkeit" (3.3) DIN I S 0 5725
AusmaB der Ubereinstimmung von MeRwerten. Qualitdtives MaB fur die Streuung von Ergebnissen, also ein MaB fur das Vorhandensein von zufalligen Fehlern. Abhangig davon, unter welchen Bedingungen die Ergebnisse ermittelt werden, unterscheidet man zwischen Wiederhol- (+) und Vergleichsprazision (+); nach DIN 55350, Teil 13: Qualitative Bezeichnung fur das AusmaB der gegenseitigen Annaherung voneinander unabhangiger Ermittlungsergebnisse bei mehrfacher Anwendung eines festgelegten Ermittlungsverfahrens unter vorgegebenen Bedingungen.
Primarstandard IS0 Guide 30 (* Referenzstandard)
Ein Standard mit der hochsten metrologischen Qualitat
Progressive Validierung
Validierung uber einen langeren Zeitraum von Kontrollkarten)
Proportionaler systematischer Fehler
Von der Konzentration des Analyten abhangiger konstanter Fehler (+)
Prospektive (vorausschauende) Validierung
Validierung, die vor Nutzung des Prozesses abgeschlossen ist (vorausschauend)
Prufeinrichtung
Begriff der GLP, Bezeichnung fur Me& oder Pruflabor
Prufen DIN 1319, Teil 1
Priifen heist feststellen, ob der Prufgegenstand (Probekorper, Probe, MeBgerat) eine oder mehrere vorgegebene (vereinbarte, vorgeschriebene, erwartete) Bedingungen erfullt. Mit dem Prufen ist daher immer der Vergleich mit vorgegebenen Bedingungen verbunden.
Prufhilfsmittel DGQ-Schrift 11-04
Zu den Prufhhilfsmitteln gehoren beispielsweise Rechnerprogramme zur Durchfuhrung von Qualitatsprufungen, Anlegefelder fur automatische Mehrfachpriifungen usw.
(2.
B. Einsatz
454
A Anhang
Prufmittel * MeBeinrichtung, * MeBgerat (+) DGQ-Schrift 11-04
Prufmittel sind MeBeinrichtungen (+), die fur Qualitatsprufungen eingesetzt sind. Anmerkung: Im Bereich der chemischen Analytik werden in Erweiterung der DGQ-Definitionen haufig auch Chemikalien, Reagenzien und Standards als Prufmittel definiert. Eine Unterteilung in physikalische und chemisehe Prufmittel ist hier also sinnvoll.
Reproduzierbarkeit (3.3)
Prazision unter Vergleichsbedingungen
Retrospektive Validierung
Validierung bereits bestehender Prozesse anhand historischer Daten
Richtiger Wert, fruher: ,,Sollwert", ,,Zielwert" DIN 55350 Teil I3
Wert fur Vergleichszwecke, dessen Abweichung vom wahren (+) Wert fur den Vergleichszweck als vernachlassigbar betrachtet wird. Der richtige Wert ist somit ein Naherungswert fur den wahren Wert.
Prufmitteluberwachung DGQ-Schrift 1 1-04
Gesamtheit der systematischen Tatigkeiten der Kalibrierung, Justierung, Eichung sowie der Instandhaltung von Prufmitteln und Prufhilfsmitteln.
Prufung EN 45020/12.1
Nach DINEN 45001 Oberbegriff fur Messungen, Untersuchungen, Analysen usw. Technischer Vorgang, der aus dem Bestimmen eines oder mehrerer Merkmale eines bestimmten Erzeugnisses, Verfahrens oder einer Dienstleistung besteht und gemaB einer vorgeschriebenen Verfahrensweise durchzufuhren ist.
Prufvorschrift (s. Bemerkung unter ,,Methode")
Genaue Anleitung in schriftlicher Form, die notwendig ist, um eine Methode korrekt anwenden zu konnen.
Qualifizierung (2.3)
Uberprufung der Funktionstuchtigkeit des Gerates. Diese Uberprufung umfal3t die Kalibrierung und bei Bedarf das Justieren (+) von Me&, Steuer- und Regeleinrichtung: Kann vereinfacht als die ,,Validierung" des MeBgerates ohne Analysengut angesehen werden.
Qualitatskontrollprobe
Typische Probe, die wiederholt innerhalb von Serien naturlicher Proben analysiert wird. Sie dient dazu, die Systemstabilitat zu uberwachen und unerwunschte Drift bei der Ausfuhrung der Analyse aufzudecken.
A2 Definitionen und Erluuterungen von Begriffen
455
Referenzmaterial IS0 Guide 20, Abschnitt 3.2.1 und update IS0 Guide 30 (* beglaubigtes Referenzmaterial)
Stabiles, homogenes Material oder eine Substanz, von der eine oder mehrere Eigenschaften ausreichend bekannt sind, so daB es (sie) zur Kalibrierung von Apparaten, zur Beurteilung einer Meamethode oder zur Zuweisung von Werten an Materialien benutzt werden kann.
Referenzverfahren
In der Regel Normen oder Richtlinien (DIN, DEV, ISO, CEN, VDI) im Rahmen rechtlicher Regelungen.
Relative Richtigkeit (* Richtigkeit)
Vergleich eines Ergebnisses nach einer neuen Methode mit dem Ergebnis (identische Probe!) nach einer Referenzmethode.
Relative Verfahrensstandardabweichung oder Verfahrensvariationskoeffizient (3.7.2.4)
Auf die Mitte des Arbeitsbereichs normierte Verfahrensstandardabweichung (+) sxo V,,) = . 100%
X
Reproduzierbarkeit (3.3)
Prazision unter Vergleichsbedingungen
Retrospektive Validierung
Validierung bereits bestehender Prozesse anhand historischer Daten
Revalidierung * Justierbarkeit
Fortschreitende Validierung bei Verfahrensanderung.
Richtiger Wert, fruher: ,,Sollwert", ,,Zielwert" DIN 55350 Teil 13
Wert fur Vergleichszwecke, dessen Abweichung vom wahren (+) Wert fur den Vergleichszweck als vernachlassigbar betrachtet wird. Der richtige Wert ist somit ein Naherungswert fur den wahren Wert.
Richtigkeit, fruher ,,Treffgenauigkeit" (3.4)
Sie beschreibt die Ubereinstimmung des erhaltenen Analysenwertes (Mittelwertes) mit einem als richtig akzeptierten Wert. Anm.: Sie ist also die qualitative Bezeichnung fur den Abstand zwischen erhaltenem und richtigem Wert; je kleiner die systematischen Fehler sind, um so ,,richtiger" arbeitet das Ermittlungsverfahren.
456
A Anhang
Robustheit (3.5)
Qualitatives MaR, inwieweit variierende Bedingungen (Methodenparameter, Personal, techn. Auariistungen, Laboratorien etc.) das Analysenergebnis verandern. Oder: Fahigkeit eines Verfahrendeiner Methode, Ergebnisse zu liefern, die nicht oder unwesentlich durch Veranderungen der Umgebung, der experimentellen Bedingungen usw. verfalscht werden.
Ruckfuhrbarkeit
Die Eigenschaft eines MeRresultats, welches mit angemessenen Standards (,,&don") durch eine ununterbrochene Reihe von Vergleichen verbunden ist.
scientific validation
Dieser Begriff wird in F & E-Bereichen verwendet. Im Gegensatz zu einer ,,formalen" Validierung wird hier bei neuen (Forschungs-)SubstanZen nur ein Tell der Tests durchgefuhrt, in der Regel: Wiederholprazision, Linearitat, Wiederfindungsrate, Nachweisgrenze und Stabilitat von Losungen.
Sekundiirstandard
Ein Standard, dessen Eigenschaftswert durch Vergleich mit einem Primarstandard festgelegt wurde.
Selektivitat (3.6) (* Spezifitiit)
Die Selektivitat beschreibt das AusmaB, mit dem mehrere Analyten in einer Mischung ohne Interferenzen in Gegenwart weiterer Mischungskomponenten bestimmt werden konnen.
Sortieren DIN I3 19, Teil 1
Sortieren (Auslesen) heist, verschiedenartige Elemente einer Menge nach ihrer Verschiedenartigkeit (nach vorgegebenen Sorten, Arten, Merkmalen oder Merkmalswerten) trennen.
Spannweite DIN 55350 Teil23
GroRter minus kleinster Beobachtungswert
SPC (auch SQC)
Statistische ProzeBkontrolle auch Statistische Qualitatskontrolle. Im Gegensatz zur SPR (+) keine on-lineRegelung, sondern die retrospektive Analyse der ProzeBergebnisse auch am nicht beherrschten Prozessen als Zeitverteilungsreihe mit der Vorgabe, beim Uber- oder Unterschreiten von vorgegebenen Werten Ursachenforschung zu betreiben und den ProzeRablauf zu andern.
A2 Dejinitionen und Erliiuterungen von Begri@en
457
Spezifikationsqualifizierung, SQ (2.3)
Spezifikationskatalog mit den Anforderungen des Kunden.
Spezifitat (3.6)
Die Spezifitat beschreibt das AusrnaB, mit dem ein Analyt in einer kornplexen Mischung ohne InterferenZen in Gegenwart weiterer Mischungskomponenten bestimrnt werden kann.
(* Selektivitat)
SPR
Statistische ProzeBregelung, on-line-Regelung eines Prozesses, bei dem alle qualitatsbestimmenden Parameter wahrend des Prozesses auf den Verlauf innerhalb statistisch vorgegebener Regelgrenzen uberpruft werden. Fur alle diese Parameter wird eine nur rein zufallige Verteilung ihrer Einzelwerte zugelassen. Das Ergebnis ist ein beherrschter ProzeB, bei dem das ProzeBergebnis ausschliefllich statistischen Verteilungen und nicht systematischen Storungen unterworfen ist.
Standardabweichung (3.2)
Positive Quadratwurzel aus der Varianz (+): s
Standardunsicherheit ~~~
=
D
Unsicherheit eines MeBergebnisses ausgedruckt als Standardabweichung. ~
Stochastisch unabhangige Prozesse (3.3.4.3)
Prozesse, bei denen die einzelnen Schritte des Prozesses sich gegenseitig nicht beeinflussen. Dac bedeutet, ein Fehler, der im Schritt A gemacht wurde, keinen EinfluB auf den Fehler hat, der moglicherweise wahrend des Schrittes B passiert.
Systematische Fehler
Konstante Differenz zwischen dern richtigen und aus der Messung erhaltenen Mittelwert.
Treffgenauigkeit
Fruher Synonym zu ,,Richtigkeit" (+), wird kaum noch benutzt.
Unabhangiges Analysenverfahren
Analysenverfahren sind dann unabhangig, wenn ihre Analysenprinzipien vollig voneinander verschieden sind.
Untere Grenze des praktischen Arbeitsbereiches (uGpA)
Dieser Begriff wird von der Deutschen Fettgesellschaft, DFG, vorgeschlagen. Niedrigste Konzentration des Analyten, die das Labor bei der Ausarbeitung der Methode verwendet hatte oder von der abgeschiitzt werden konnte, daB die Methode zufriedenstellende Ergebnisse (auswertbare MeBsignale) liefern wurde. Anmerkung: uGpA ist keine statistisch abgeleitete GroBe, sondern eine hilfsweise Abschatzung. wenn Nachweis- bzw. Bestimmungsgrenze nicht eigens ermittelt wurde.
Validation Master Plan, VMP(4) * Validierungsplan
Dokument mit Informationen uber das Validierungsprogramm im Unternehmen mit Zeit- und Prioritatenvorgaben, Verantwortlichkeiten etc.
Validierung ( I .2. I .) 1SO 8402 (* Verifizierung, Qualifizierung)
Bestatigen aufgrund einer Untersuchung und durch Bereitstellen eines Nachweises, daR die besonderen Forderungen fur einen speziellen beabsichtigten Gebrauch erfullt worden sind.
Validierungsbericht (2.2)
Dokument uber die durchgefuhrten Validierungsaktivitaten incl. Validierungsdaten und SchluDfolgerungen
Validierungskit
Vom Hersteller angebotene Software- Programme, Testprotokolle sowie weitere Hilfsmittel ( 2 . B. HPLCSaulen aus unterschiedlichen Chargen. Referenzstandards), urn ein Gerat bzw. Applikation zu testen (zu .,validieren").
Validierungsplan (2.1 ) * Validation master plan, VMP
Plan fur die notwendigen Tatigkeiten im Labor, um die Parameter der zu validierenden Methode zu ermitteln
VarianL (3.2) DIN 55350 Teil 23
Summe der quadrierten Abweichungen der Beobachtungswerte von ihrem arithmetischen Mittelwert dividiert durch die um 1 verminderte Anzahl der Beobachtungswerte:
A2 Definitionen und Erluuterungen von Begrigen
Variationskoeffizient oder relative Standardabweichung (3.3) DIN 55350 Teil 23
459
Quantitatives Marj fur die Prazision. Standardabweichung dividiert durch den Betrag des arithmetischen Mittelwerts:
Anmerkung: Der Variationskoeffizient wird meist in Prozent angegeben. S
v, = - .
1x1
Verfahren, Analysenverfahren (s. Bemerkung unter ,,Methode") DIN 38402 Teil 51
100
Gesamtheit aller Schritte wie Probenahme, Probenvorbereitung, Trennung bzw. Messung, Datengenerierung, die zur Ermittlung eines Ergebnisses notwendig sind. Beispiel: PAK-Bestimmung in Schlamm. Probenahme, Probenaufarbeitung, Extraktion, Aliquotieren, Kalibrierung, HPLC-Messung, Quantifizierung.
Verfahrensstabilitat (3.5.2.2)
Stabilitat eines Verfahrens in Abhangigkeit von der Zeit. Anmerkung: Ein Marj dafur kann beispielsweise die Differenz der Standardabweichung zum Zeitpunkt t = 0 und der nach 12, 24 Stunden usw. sein. Kann zur Robustheit gehorend angesehen werden.
Verfahrensstandardabweichung (3.7.2.4) * relative
Quotient aus Reststandardabweichung (der linearen oder quadratischen Regression) und Steigung 3,"
=
-sY, . b
wichtiges Gutekriterium einer Methode Vergleichsbedingungen (3.3)
Wiederholung der gleichen Messung an einem identischen Objekt unter verschiedenen auBeren Bedingungen.
Vergleichsgrenze, fruher: ,,Vergleichbarkeit" DIN 55350 Teil 13
Kritischer Vergleichsdifferenzbetrag (+) fur zwei Ermittlungsergebnisse und fur eine vorgegebene Wahrscheinlichkeit von 95 %
460
A Anhang
Vergleichsprazision oder Vergleichbarkeit, Reproduzierbarkeit, selten: Ubertragbarkeit (3.3)
Prazision bei den wiederholten Anwendungen eines festgelegten Verfahrens am identischen Objekt (Probe) durch verschiedene Analytiker, mit verschiedenen Geraten in verschiedenen Laboratorien (Vergleichsbedingungen +). Anmerkung: Der im Laboralltag haufig verwendete Begriff ,,Reproduzierbarkeit" fuhrt haufig zu Mifiverstandnissen (,,Die Reproduzierbarkeit der Retentionszeiten war gut", gemeint sind hier wahrscheinlich Wiederholbedingungen) und sollte vermieden werden.
Vergleichstandardabweichung (3.3) DIN 55350 Teil 13
Standardabweichung (+) der Ermittlungsergebnisse unter Vergleichsbedingungen (+Vergleichsprazision). Anmerkung: die Vergleichstandardabweichung ist ein Streuungsparameter fur Ermittlungsergebnisse und daher ein Ma13 fur die Vergleichsprazision.
Verifizierung (1.2.2.) I S 0 8402 (* Validierung, Qualifizierung)
Bestatigen aufgrund einer Untersuchung und durch Bereitstellen eines Nachweises, dafi festgelegte Forderungen erfullt worden sind.
Vertrauensbereich oder Konfidenzintervall (3.4.3)
Wertebereich, innerhalb dessen der Bezugswert mit einer vorgegebenen Wahrscheinlichkeit (meist 95 %) liegt. Obergrenze: X
+u
Untergrenze: X
-
u
X : um den systematischen Fehler berichtigter Mittelwert eines Analysenergebnisses. u: Ergebnisunsicherheit (oder Mefiunsicherheit)
Wahrer Wert (* richtiger, exakter Wert) DIN 55350 Teil 13
Tatsachlicher, aber unbekannter Merkmalswert unter den bei der Ermittlung herrschenden Bedingungen.
Wahrscheinlicher Wert
Statistisch berechenbare Wahrscheinlichkeit mit der der Mittelwert einer zunehmenden Zahl von Wiederholuntersuchungen sich dem Mittelwert unendlich vieler Wiederholuntersuchungen asymmetrisch nahert.
Anmerkung: Das ist ein ideeller Wert, da er sich nur dann feststellen IieBe, wenn samtliche Abweichungen vermieden werden konnten.
A2 Definiiionen und Erliiuterungen von Begriffen
46 1
Wiederfindungsrate oder Wiederfindung (3.8)
Verhaltnis des unter Wiederholbedingungen erhaltenen Mittelwertes zum tatsachlichen Gehalt einer Komponente in der Probe.
Wiederholbedingungen (3.3)
Wiederholung der gleichen Messung an einem identischen Objekt, unter identischen Bedingungen, zu einem spateren Zeitpunkt.
Wiederholgenauigkeit
Fruher Synonym zu ,,Prazision" (+), wird kaum noch benutzt.
Wiederholgrenze, fruher: ,,Wiederholbarkeit" (3.3) DIN 55350 Teil 13
Kritischer Wiederholdifferenzbetrag (-+) fur zwei einzelne Ermittlungsergebnisse und fur eine Wahrscheinlichkeit von 95 %.
Wiederholprazision oder: Wiederholbarkeit, Prazision unter Wiederholbedingungen (3.3)
Prazision bei der wiederholten Anwendung eines festgelegten Verfahrens am identischen Objekt (Probe) durch den selben Analytiker, in kurzen Zeitabstanden, mit dem selben Gerat, im selben Labor (Wiederholbedingungen -+).
Wiederholstandardabweichung
Standardabweichung (-+) der Ermittlungsergebnisse unter Wiederholbedingungen und daher ein MaB fur die Wiederholprazision.
Zahlen DIN 13 19,Teil I
Zahlen ist das Ermitteln der Anzahl von jeweils in bestimmter Hinsicht gleichartigen Elementen oder Ereignissen (z. B. Gegenstanden, elektrischen Impulsen, Umdrehungen, Partikeln beim radioaktiven Zerfall), die bei dem zu untersuchenden MeBobjekt in Erscheinung treten.
Zertifizierung
Zertifizierung ist die Feststellung, daB ein Produkt, ein Qualitatsmanagmentsystem oder bestimmtes Personal rnit speziellen Kriterien, die in einer Norm oder einem anderen Dokument festgelegt sind, ubereinstimmen (Zertifizierung = Konformitatsfeststellung).
Zufallige Fehler
Sie beruhen auf MeBwertschwankungen, ,,Streuungen", die entweder naturgesetzliche, meBtechnische, aber auch personell-subjektive Grunde haben konnen. Als Ma13 fur diese MeBwertstreuung dient die Standardabweichung.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
462
A Anlzang
A3
Englische Ubersetzung einiger wichtiger Begriffe zum Komplex ,,Validierung" (Auswahl)
Deutsche Bezeichnung
Englische Bezeichnung
Anal ysenmethode
analytical method
Arbeitsbereich oder (dynamischer) MeRbereich
range
Bestimmungsgrenze oder Quantifizierungsgrenze
limit of quantitation, LOQ oder limit of determination, selten: detection sensitivity
Empfindlichkeit
sensitivity
Erfassungsgrenze = Entscheidungsgrenze
limit of decision
Ergebnisabweichung
error of result
~
~
~
~
Ergebnisunsicherheit
uncertainty of the result
Ermittlungsergebnis
result of determination
Erwartungswert
expectation value
Erweiterungsfaktor
coverage factor
Cenauigkeit
accuracy
Crenzwert
limiting value
Konventionswert
convetional true value
Laborprgzision
intermediate precision
Linearer Bereich
linear range
Linearitiit oder Kalibrierfunktion
linearity
MeBunsicherheit
uncertainty of the measurement
Methodenfahigkeit
method capability
Methodenrobustheit
robustness
Methodenstabilitat
method stability
Mittelwert
mean value
A3 Englische Ubersetzung einiger wichtiger Begriffe
463
Deutsche Bezeichnung
Englische Bezeichnung
Nachweisgrenze I
limit of detection, LOD
Prazision
precision
Priifung
test
Priifverfahren
test procedure
Richtigkeit
trueness, accuracy of the mean oder einfach accuracy
Richtiger Wert
conventional true value
Robustheit
robustnesslruggedness
Riickfiihrbarkeit
traceability
Riickverfolgbarkeit
trackability
Selektivitat
selectivity
Spezifitat (wird oft synonym mit ,,Selektivitat" verwendet)
specificity
Stabilitat
stability
Standardabweichung
standard deviation
Systematische Ergebnisunsicherheit
systematic error of result
Variationskoeffizient
coefficient of variation
Vergleichsprazision oder Vergleichbarkeit
reproducibility
Vertrauensbereich des Mittelwertes
confidence interval of the mean value
Wahrer Wert
true value
Wiederfindung oder Wiederfindungsrate
recovery
Wiederholprazision oder Wiederholbarkeit
repeatability
~
1
Selten wird im Englischen auch der Terminus Method Detection Limit, MDL, benutzt, um den Unterschied in der Nachweisgrenze von Gerat und Methode zu unterstreichen.
Handbuch Validierung in der Analytik
464
A Anhang
A4
Register der Rechenbeispiele
Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Abschn. Seite Test auf Normalverteilung nach David
3.3.1
54
Vergleich zweier MeBwertreihen bei gleichem Mittelwert
3.3.4.1
59
Vergleich zweier MeBwertreihen bei gleicher Standardabweichung
3.3.4.2
60
Ermittlung der Standardabweichung bei Doppelbestimmungen
3.3.4.2
61
Vergleich zweier Methoden iiber die Varianz der einzelnen Schritte
3.3.4.3
63
Vergleich zweier Methoden bei unterschiedlicher Streuung des Geriites
3.3.4.3
64
AusreiBertest nach Dixon
3.3.6.1
68
AusreiBertest nach Grubbs
3.3.6.1
70
AusreiBertest nach Henning
3.3.6.1
71
Vergleich zweier MeBwertreihen uber die Varianzenhomogenitat, F-Test
3.3.6.4
75
Vergleich dreier MeBwertreihen iiber die Varianzenhomogenitat, Cochran-Test
3.3.6.4
76
,,Sammelbeispiel" mit folgenden Tests: nach David, nach Dixon, nach Neumann, Wiederholgrenze, Ergebnisunsicherheit, Vertrauensbereich
3.3.6.5
79
Ermittlung des Variationskoeffizienten einer Nebenkomponente
3.3.7.1
81
,,Erlaubter" Variationskoeffizient bei einer Gehaltsbestimmung
3.3.7.1
82
Soll/Ist-Vergleich uber den t-Test
3.4.2.1
90
Prufung auf Richtigkeit nach dem Doerffel-Test
3.4.2.1
91
Wilcoxon-Rangzahlentest
3.4.2.1
91
Prufung auf Richtigkeit durch Methodenverdeich (Differenzen t-Test)
3.4.2.2
95
A4 Register der Rechenbeispiele
465
Erweiterte Unsicherheit
3.4.3
103
Ermittlung des Vertrauensintervalls
3.4.3
104
Vertrauensintervalle bei einer Wirkstoff-Produktion
3.4.3
Pififung auf Verfahrensstabilitat bei der Gehaltsbestimrnung einer Nebenkomponente
3.5.2.2
Beispiel zur Prufung auf Linearitat
3.7.2.6
113
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
A5 -
Statistische Tabellen
David Untere Schranken
N
Obere Schranken
5%
1%
0,l %
5%
1%
2,15 2,28 2,40 250 2,59 2,67
2,02 2,15 2,26 2 3 2,44 2,s I
I ,83 I ,83 1,87 137 I .90 1,90
2,83 3,16 3,46 3,74 4,OO 4,24
2,80 3,16 3,46 3,74 4,OO 4,24
2.74 2.80 236 2,92 2,97
2,58 2,64 2,70 2.75 2,80
1,92 I ,92 1,93 1,93 1,94
4,47 4,69 4,90 5,lO 5,29
4,O 1 4,13 4,24 434 4,44
3.80 3,9 I 4,00 4.09 4.17
2,84 2,823 2,92 2,96 2,99
I ,94 I ,94 1,94 1,95 1,95
5,48 5,66 5,83
19 20
3,Ol 3,06 3,10 3,14 3,18
6,OO 6,16
4,52 4,60 4,67 4,74 4,80
4,24 4,3 I 437 4,43 4,49
25 30 35 40 45
3,34 3,47 338 3.67 3,75
3,15 3,27 3,38 3,47 335
1,96 1,97 1,97 1.98 1,98
6,93 7.62 8.25 8,83 9.38
5,06 5,26 5,42 536 5,67
4.7 I 439 5.04 5.16 5.26
50 55 60 65 70
333 3,90 3,96 4,Ol 4,06
3,62 3,69 3,75 3,80 3,85
I ,98 1,98 I ,98 1,98 I ,99
9,90 10,39 10,86
535
11,75
5,77 536 5,94 6,O I 6,07
75 80 85 90 95
4,11 4,16 4,20 4,24 4,27
3,90 3,94 3,99 4,02 4,06
I ,99 1,99 1,99 I ,99 1,99
12,17 1237 12,96 13,34 13,71
6,13 6,18 6,23 6,27 6,32
5,68 5.73 5,78 532 536
I00 1 50 200 500
4,3 1 459 4,78 5,37
4,lO 4,38 439 5,13
I ,99 1,99 2,oo 2,oo
14.07 17,26 19,95 3 159
636 6,64 6,84 7,42
5.90 6.18 6,39 6,94
5 6 7 8 9 10
II 12 13 14 15
16 17 18
11,31
0,I % 230 3,10
334 334 3.72 3,88
5,43 5,s 1 537 5,63
A5 Siatistische Tabellen
467
- Dixonl
n
Prufwert
Kritischer Wert zurn Signifikanzniveau a
5%
1%
0,94 1 0,765 0,642
0,988 0,889 0,780
0,554 0,512 0,477
0,683 0,635 0,597
0,576 0,546 0,521
0,679 0,642 0,6 15
0,546 0,525 0,507 0,490 0,475 0,462 0,450 0,440 0,430 0,42 1 0,4 13 0,406
0,641 0,616 0,595 0,577 0,561 0,547 0,535 0,524 0,5 14 0,505 0,497 0,489
P = 0,95
P = 0,99
0,94 0,77 0,64 0,56 0,5 1 0,48
0.9 0,89 0,76 0,70 0,64 0,58
X(n) -X(n-l)
8 9 10
X(n)
- X(2)
oder %2) - X(1)
+n) - X ( n - z )
11 12 13
X ( n ) - X(2)
oder -93) -X(u X(n-1) - X ( ~ )
14 15 16 17 18 19 20 21 22 23 24 25 n
3 4 5 6 7 8
X(n) -X(n-2) X ( n ) - X(3)
oder X(3)
-91)
X ( n - 2 ) -'(I)
P = 0,90 0,89 0,68 0,56 0,48 0,43 0,40
1 Merke: Tabellenwerte aus unterschiedlichen Literaturstellen konnen aufgrund der unterschiedlich verwendeten Berechnungsformeln etwas variieren, z. B. fur n = 8, 0,554 bzw. 0,48 (P = 0,95) und 0,683 bzw. 0 3 8 (P = 0,99).
468
A Anhang
p einseitig . ..
90 %
95 %
99 %
1,148 1,425 1,602 1,729 1,828 1,909 1,977
1,153 1,463 1,672 1,822 1,938 2,032 2,110
1,155 1,492 1,749 1,944 2,097 2,22 1 2,323
10 11 12 13 14 15 16 17 18 19 20
2,036 2,088 2,134 2,175 2,2 13 2,247 2,279 2,309 2,335 2,36 1 2,385
2,176 2,234 2,285 2,33 1 2,37 1 2,409 2,443 2,475 2,504 2,532 2,557
2,410 2,485 2,550 2,607 2,659 2,705 2,747 2,785 2,821 2,854 2,884
21 22 23 24 25 26 27 28 29 30
2,408 2,429 2,448 2,467 2,486 2,502 2,519 2,534 2,549 2,563
2,580 2,603 2,624 2,644 2,663 2,68 1 2,698 2,714 2,730 2,745
2,9 12 2,939 2,963 2,987 3,009 3,029 3,049 3,068 3,085 3, I03
Pzweiseitig
-80 %
90 %
98 %
N
A5 Stutistische Tubellen -
Neumann n
a = 0,05
n
a = 0,05
4 5
0,7805 0,8204
34 35
1,451 1 1.4585
6 7 8 9 10
0,8902 0,9359 0,9825 1,0244 1,0523
36 37 38 39 40
1,4656 1,4726 1,4793 1,4858 1.492 1
11 12 13 14 15
1,0965 1,1276 1,1558 1,1816 1,2053
41 42 43 44 45
1,4982 1,5041 1,5038 1,5154 1,5206
16 17 18 19 20
1,2272 1,2473 1,2660 1,2834 1,2996
46 47 48 49 50
1,5257 1,5305 1,5351 1,5395 1,5437
21 22 23 24 25
1,3148 1,3290 1,3425 1,3552 1,3671
51 52 53 54 55
1,5477 1,5518 1,5557 1,5596 1,5634
26 27 28 29 30
1,3785 1,3892 1,3994 1,4091 1,4183
56 57 58 59 60
1,5670 1,5707 1,5743 1,5779 1,5814
31 32 33
1,4270 1,4354 1,4434
to
2,0000
469
2
3 6
7 8
9
10
12
15
2,99 2,98 2,96 2,95 2,93
2,92 2,84 2,76 2,68 2,60
3,49 3,47 3,44 3,42 3,40
3,39 3.37 3,35 3,34 3,33
3,32 3,23 3,15 3,07 3,OO
4,35 4,32 4,30 4.28 4,26
4,24 4,23 4,21 4,20 4,18
4,17 4,08 4,OO 3,92 3,84
20 21 22 23 24
25 26 27 28 39
30 40 60 120
2,Ol 1,92 134 1,75 1,67
2,09 2,OO 1,92 133 1,75 2.21 2,12 2,04 1,96 1,88
2,27 2,18 2,lO 2.02 1,94
233 2,25 2,17 2,09 2,Ol
2.53 2,45 2,37 2,29 2,21
2,69 2,61 2,53 2,45 2,37
2,42 2,34 2,25 2,17 2,lO
2,09 2,07 2.06 2,04 2,03
2,16 2,15 2,13 2,12 2,lO 2,24 2,22 2,20 2,19 2,18 2,213 2.27 2,25 2,24 2,22
2.34 2.32 2,31 2,29 2.28
2,40 2,39 2,37 236 2,35
2,60 2,59 2,57 2,56 255
2,76 2,74 2,73 2,71 2,70
2,49 2,47 2,46 2,45 2,43
2,20 2,18 2,15 2,13 2,11
2,28 2,25 2,23 2,2O 2,18
2,35 232 2,30 2,27 2,25
2,39 2,37 2.34 232 2,30
2,45 2,42 2,40 2,37 2,36
251 2,49 2,46 2,44 2,42
2,6O 237 235 253 251
2,71 2,68 2,66 2.64 2,62
2,87 2,84 2.82 2,80 2,78
3.10 3,07 3,OS 3,03 3,Ol
3,512
355
2,40 2,35 2,31 2.27 2,23
2,48 2,42 2.38 2.34 2,31
2,54 2,49 2,45 2,41 2,38
2,59 234 2,49 2,46 2,42
2,64 259 255 251 2,48
2,71 2,66 2,61 2,58 2,54
2,79 2,74 2,70 2,66 2,63
2,90 2,85 2,81 2,77 2,74
3,06 3,Ol 2,96 2,93 2,90
15 16 17 18 19
2,85 2,72 2,62 2,53 2,46
2,16 2,08 1,99 1,91 1,133
2,98 2,85 2,75 2,67 2,60
2,91 2,79 2,69 2,60 2,53
3.02 2,90 2,80 2,71 2,155
3,07 2,95 235 2.77 2,70
3.14 3,Ol 2,91 2,83 2,76
3,22 2,09 3.00 2,92 2,85
3,29 3,24 3,20 3,16 3,13
3,68 3,63 359
454 4,49 4,45 4,41 4,38
13 14
m
5
3,33 3,20 3,ll 3,03 2,96
3.48 3,36 3.26 3.18 3,ll
3,71 339 3.49 3,41 3.34
4,lO 3,98 3,89 3,81 3,74
10 11 12
4
20
24 30
40 60
120 00
1,32
1,39
1,50
1,74 1,64 1,53 1.43
1,79 1,69 1,59 1,84 1,74 1,65 13.5 1,46 1,89 1,79 1,70 1,61 1,52
1,93 1,84 1,75 1,66 157
1.82 130 1.79 l,77 1,75
137 1,85 1,84 132 131 1,92 1.90 1,88 1,87 135
1,96 1,95 1.93 1,91 1,90 2,01 1,99 1,97 1,96 1,94
1,95
1.92 139 1.86 134
1,99 1,96 1,94 1,91 139 2,04 2,Ol 1,98 1,96 1,94
2,08 2,OS 2,03 2,Ol 1.98
2,12 2,lO 2,07 2,OS 2,03
2,16 2,l 1 2,06 2.02 1,98
2,20 2,15 2,IO 2,06 2,03 2,25 2,19 2,lS 2,11 2.07
2,29 2,24 2,19 2,15 2,11 2,33 2,28 2,23 2,19 2,16
2,62 2,49 238 2,30 2,22 2,70 2.57 2.47 2,38 2,31
2,74 2,61 231 2,42 2 3
2,77 2,65 2,54 2,46 2,39
2,66 253 2,43 2,34 2,27
2,07 2,Ol 1,96 1,92 1.88 1.84
2,11 2,06 2,Ol 1,97 1,93 190 187
1,78 1.76 1,73 1,71 1,69 1.67 1,65 1,64
1,77 1,75 1,73 1,71 1,70
151 1,39 1,25 1,OO
IS8 1,47 1,3S 1,22
1,62
1,68
184
1,81 1,79
181
2,54 2,40 2,30 2,21 2,13 2.58 2,45 2,34 2,25 2,18
161,4 199,s 215.7 224.6 230,2 234,O 2363 238,9 240.5 241,9 243,9 245,9 248,O 249.1 250,l 251,l 252,2 253,3 254,3 18,Sl 19,OO 19.16 19.25 19.30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19.45 19,45 19,46 19,47 19,48 19,49 19,SO 10.13 9 5 5 9,28 9,12 9,Ol 8,94 8,89 8 3 5 8.81 8,79 8,74 8,70 8,66 8.64 8,62 8.59 8,57 8 5 5 8,53 7,71 6,94 6.59 6.39 6,26 6,115 6,09 6,04 6.00 5,96 5,91 5 3 6 5,80 5.77 5.75 5,72 5/59 5,66 5,63 4 3 3 4 3 0 4.46 4.43 4,40 4,36 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4.56 6,61 5,79 5.41 5,19 5,OS 5,99 5.14 4.76 4.53 4.39 4,28 4,21 4,15 4,lO 4,06 4,OO 3,94 3,87 3 3 4 3,81 3,77 3,74 3,70 3,67 5 3 9 4,74 4.35 4.12 397 3,87 3,79 3.73 3,68 3,64 3 5 7 3 5 1 3,44 3,41 3,38 3,34 3,30 3.27 3.23 3,44 3,39 33.5 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93 5,32 4.46 4.07 3,84 3.69 3 5 8 3,SO 5,12 4,26 3.86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3.01 2,94 2,90 2 3 6 2 3 3 2,79 2,75 2.71
1
4,96 4,84 4,75 4,67 4,60
5 6 7 8 9
2 3 4
1
f.
8
-
h
'' 8
I
4
5
6
7 8
6.36 6,23 6,11 6,01 5,93
5.85 5.78 5,72 5,66 5,61
5.57 553 5,49 5,45 5,42
5,39 5.18 4.98 4,79 4,61
8,68 853 8,40 8,29 8,18
8,lO 8,02 7.95 7.88 7.82
7,77 7,72 7,68 7,64 7.60
7,56 7,3 1 7,08 6,85 6,63
15 16 17
19
20 21 22 23 24
25 26 27 28 39
30 40 60 120
m
18
7,56 7,21 6.93 6,70 6,51
10,04 9.65 9,33 9,07 836
10 11 12 13 14
4,43 4.37 4,31 4,26 4,22
4,94 4,87 4,82 4.76 4,72
4.51 4.31 4.13 3,95 3.78
4,68 4,64 4,60 437 434
4,02 333 3,65 3,48 3,32
4,18 4,14 4,11 4,07 4,04
4.56 4,44 4.34 4,25 4,17
4,89 4,77 4,67 438 430
5,42 5,29 5.18 5,09 5,Ol
3,70 331 3,34 3,17 3.02
335 3,82 3,78 3,75 3,73
4,lO 4,04 3,99 3,94 3,90
5,64 5,32 5,06 4,86 4.69
5,99 5,67 5,41 5,21 5.04
6.55 6,22 5.95 5,74 5,56
3,47 3,29 3,12 2,96 2.80
3,63 339 3,56 3,53 350 3.30 3.12 2,95 2,79 2,64
3.46 3.42 3,39 3,36 3.33 3.17 2,99 2,82 2,66 251
3.32 3.29 3,16 3,23 3,20
356 3.51 3,45 3,41 3.36
3,70 3,64 339 354 350
3,87 3,81 3,76 3,71 3,67
4,OO 339 3.79 3,71 3,63
4,14 4,03 3,93 3,84 3,77
4,32 4,20 4,lO 4,Ol 3,94
5,06 4,74 4,SO 4,30 4,14
5.20 4,89 4,64 4,44 4,28
5,39 5.07 4,82 4,65 4,46
3,07 2,89 2,72 2,56 2,41
3,22 3,18 3,15 3,12 3,09
3,46 3,40 3,35 3,30 3,26
339 3,78 3,68 3,60 3,52
4.94 4,63 4,39 4,19 4,03
6022 99,39 27,351 14,66
9
2,98 2,80 2,63 2,47 2,32
3,13 3,09 3,06 3,03 3,OO
3,37 3,31 3,26 3,21 3,17
3,80 3,69 3,59 3,51 ,343
4,85 4,54 4.30 4,lO 3,94
6056 99.40 27.23 14,55
10
16,26 13.27 12,06 11.39 10,97 10.67 10,46 10,29 10,16 10,OS 13,75 10.92 9,78 9,15 8,75 8,47 8.26 8,lO 7,98 7.87 12,25 9.55 8,45 7,85 7,46 7,19 6,99 6,84 6.72 6,62 11,26 8,65 7 5 9 7,Ol 6,63 6,37 6,18 6,03 5,91 5,81 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26
3
5 6 7 8 9
2
4052 4999,5 5403 5625 5764 5859 5928 5982 98.50 99,OO 99,17 99,25 99,30 99,33 99,36 99,37 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27.49 2 1,20 18.00 16.69 15,98 1552 15,21 14,98 14,80
1
1 2 3 4
f,
15
20
2.84 2,66 230 2,34 2,18
2,99 2.96 2,93 2,90 2,87
3,23 3,17 3,12 3,07 3,03
3,67 335 3,46 3,37 3,30
4.71 4,40 4.16 3,96 3,80
5,11
9.89 7,72 6,47 5,67
30
2,78 2.72 2,67 2,62 2,58 2,54 250 2,47 2,44 2,41
2,86 2.80 2,75 2,70 2,66 2,62 2,58 25.5 252 2,49 2,94 2,88 2,83 2,78 2,74
3,09 3.03 2,98 2,93 2,89
2,70 2.52 2.35 2,19 2,04
235 231 2,78 2,75 2,73
1.88
235 2,37 2,20 2,03
2,70 2,66 2.63 2,60 237
2.39 2,20 2,03 1,86 1,70
3,21 3,lO 3,OO 2,92 2.84
3,29 3,18 3,08 3,OO 2,92 3.37 3.26 3,16 3,08 3.00
3.52 3,41 3,31 3,23 3,15
2.47 2,29 2,12 1,95 1,79
4,25 3,94 3,70 3,51 3.35
4,33 4,02 3,78 359 3,43
4,41 4,lO 3.86 3,66 3.51
456 4,25 4,Ol 3,82 3.66
9.55 7,40 6,16 5.36 431
9,38 7.23 5,99 5,20 4,65
9.72 756 6,31 532 4,96
40
60
120 a,
2,30 2,11 1,94 1,76 1,59
2,21 2,02 1.84 1.66 1,47
2,61 2.55 2.50 2.45 2,40 2,36 2,33 2.29 2,26 2.23
3,05 2,93 2,83 2,75 2,67
3,13 3,02 2,92 2,84 2,76 2,69 2,64 258 254 2,49 2,45 2,42 2,38 2,35 2,33
4,08 3,78 334 3,34 3,18
9,20 7.06 5.82 5.03 4,48
4,17 3,86 3,62 3,43 3,27
9,29 7,14 5,91 5,12 437
2,l I 1,92 1,73 153 1,32
252 2,46 2,40 2.35 2,31 2,27 2,23 2.20 2.17 2,14
2.96 3.84 2.75 2.66 2.58
4,OO 3,69 3.45 3,25 3.09
9,11 6,97 5,74 4,95 4,40
2,Ol 1,80 1.60 l,38 1.00
2,42 2,36 2,31 2,26 2,21 2,17 2,13 2,lO 2,06 2.03
2.87 2.75 2.65 2,57 2.49
3.91 3.60 3,36 3,17 3.00
9.02 638 5.65 4.86 4.31
6235 6261 6287 6313 6339 6339 99.46 99,47 99,47 99.48 99,49 99,50 26.60 2650 26,41 26.32 26,22 26,13 13,93 13,84 13,75 13.65 13,56 13,46
24
9,47 7,31 6,07 5,28 4,73
6106 6157 6209 99,42 99,43 99,45 27.05 2637 26.69 14.37 14,20 14,02
12
8
-
6
2
I
A1
I
8.=.
R
4
P
K6
3
Fa 5
z
0,
472 -
A Anhung
Cochran ( a = 0,05)
f 1
2
3
4
5
6
7
8
2 3 4
0,9YX5
0,9750
0.9392
0,9057
O,X772
o,x534
0,8332
0.8 I59
0.80 I0
0.7880
0,7341
0,6602
0,9669
0,8709
0,7977
0,7457
0,707 I
0,677 I
0,6530
0,6333
O,6 I67
0,6025
0,5466
0,4748
0.9065
0,7679
0,684 I
0,6287
0,5895
0,5598
0,5365
0.5 I75
0,so I 7
0,4xx4
0,4366
0.3720
5
0.84 I 2
0,6839
0,598 I
0,544 I
0,5065
0,4783
0,4564
0.43x7
0,424 I
0,4l I X
0,3645
0,3066
6 7
0.7xox
0,6161
0.5321
0,4803
0,4447
0,4 I x4
0,39XO
0,3x17
03x2
0,3568
0.3 I35
0.26 I 2
0,727 I
0,56 I 2
0,4800 0,4307
0,3974
0,3726
0,3535
0,33x4
0,3259
0,3 I54
0.2756
0,2278
8 9
0,679X
0.5 IS7
0.4377
0.39 10
0,3595
0,3362
0.3 1 x5
0,3043
0,2926
0,2829
0,2462
0,2022
O.63X5
0,4775
0,4027
0,3584
0,32X6
0.3067
0.2901
0,2768
0,2659
0,256X
0.2226
0,I820
10
0.6020
0,4450
0,3733
0,33 I I
0,3029
0,2823
0,2666
0,2541
0,2439
0,2353
0,2032
0,I655
12
034 10
0.3Y24
0.3264
0,2880
0,2624
0.2439
0,229')
0.2 Ix7
0,209x
0,2020
0,1737
0,1403
IS
0.4709
0,3346
0,2758
0.24 I 9
0.2 I95
0.2034
0, I9 I I
0, Ix I5
0, I736
0 , I67 I
0 , I429
(I. I I44
20
0.3894
0,2705
0,2205
0 , I92 I
0.1735
0.1602
0, I501
0,1422
0, I357
0, I303
0,1103
o.ox79
24
0.3434
0,2754
0, I907
0 , 1656
0. 1493
0.1374
O,I2X6
0 ,I2 16
0, I I60
0, I I I3
0.0942
0,0743
30
0.2929
0.I9X0
0. I 5 Y 3
0, 1377
0, I237
0, I I37
0, I06 I
0,1002
0,0958
0,092 I
0,077 I
0,m04
40
0,2370
0, I576
0, I259
O.lOX2
0,096X
O,OXX7
O,OX27
0,07XO
0,0745
0.07 I3
0,0595
,0462
60 120
0, I737
0.1 131
0,0695
0.0765
0,0682
0,0623
O,OSX3
0,0552
0,0520
0,0497
0,Wl I
0.03 16
0,099x
0,0632
0,0495 0.04 I9
0.037 I
0,0337
0.03 I2
0,0292
0,0279
0,0266
0.02 I 8
0,o I65
k
9 1 0 1 6 3 6
A5 Statisrische Tabellen -
t-Tabelle (zweiseitig)
f
P=95%
P=99%
P = 99,9 %
1 2 3 4 5
12,706 4,303 3,182 2,776 2,57 1
63,657 9,925 5,841 4,604 4,032
636,619 3 1,598 12,924 8,610 6,869
6 7 8 9 10
2,447 2,365 2,306 2,262 2,228
3,707 3,499 3,355 3,250 3.169
5,959 5,408 5,041 4,78 1 4,587
11
12 13 14 15
2,201 2,179 2,160 2,145 2,131
3,106 3,055 3,016 2,1977 2,947
4,437 4,3 18 4,22 1 4,140 4,073
16 17 18 19 20
2,120 2,110 2,101 2,093 2,086
2,92 1 2,898 2,878 2,861 2,845
4,O 15 3,965 3,922 3,883 3,850
21 22 23 24 25
2,080 2,074 2,069 2,064 2,060
2,83 1 2,819 2,807 2,797 2.787
3,819 3,792 3,767 3,745 3,725
26 27 28 29 30
2,056 2,052 2,048 2,045 2,042
2,779 2,77 1 2,763 2,756 2,750
3,707 3,690 3,674 3,659 3,646
00
1,960
2,576
3,291
473
474 -
A Anhang
Wilcoxon n 4 5 6 7 8 9 10
11 12 13 14 15 16 17 18 19 20
wn; 0,01
0 0 0 1 2 4 6 8 10 13 16 20 24 28 33 38 44
wn; 0,025
0 0 1 3 4 6 9
II 14 18 22 26 30 35 41 47 53
wn: 0.05
wn: 0.10
0 1 3 4 6 9 11 14 18 22 26 31 36 42 48 54 61
3 4 6 9 11 15 18 22 27 32 37 43 49 56 63 70
1
wn: 0.90
%; 0,95
wn; 0,975
wn: 0,99
8 11 16 21 26 33 39 47 55 63 72 82 92 103 114 126 139
9 13 17 23 29 35 43 51 59 68 78 88 99 I10 122 135 148
10
10
14 19 24 31 38 45 54 62 72 82 93 105 117 I29 142 156
14 20 26 33 40 48 57 66 77 88 99 111 124 137 151
165
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
A4 Softwareprogramme zur Methodenvalidierung und Qualitatssicherung
A6
475
Softwareprogramme zur Methodenvalidierung und Qualitatssicherung (Auswahl)
In einer Reihe von Standard-Auswerteprogrammen fur die instrumentelle Analytik sind vom Hersteller Module implementiert, die statistische Operationen erlauben. Daneben werden eigenstandige Softwareprogramme speziell fur die Validierung, Qualitatssicherung und statistische Prozelkontrolle offeriert. In nachfolgender Auflistung sind nur Programme aufgenommen, die von Firmen im deutschsprachigen Raum (die Programme sind nicht alle in deutsch!) angeboten werden. Programme, die nur statistische Berechnungen beinhalten, wurden nicht berucksichtigt. Die Daten zu einigen Herstellern wurden freundlicherweise von Dr. Christian Gertz, Chemisches Untersuchungsamt Hagen, zur Verfugung gestellt. aquaaqs Richard-Wagner-Weg 7 3 8302 Wolfenbuttel Tel./Fax 0533 11340545
AQS-Programm
APPLICA GmbH Gerhard-Rohlfs-Strale 16 A 28757 Bremen Tel. 04211657271 Fax 04211657272 eMail:
[email protected] http:llwww.velix.comlas
Valoo
Sulzer Infra Pharma Engineering Hausserstrale 36 69 1 15 Heidelberg Tel. 0622U13875-0 Fax 06221-601685
AVENIO
Ingenieurburo Stefan Denz Feuerschwenden 60 87471 Durach Tel./Fax 0831165373
WinAQS 1.5
476
A Anhong
DIMATEC Eschenburg 37/39 D-45276 Essen Tel. 0201/50 28 60 Fax 020 1 36 08 eMail:
[email protected] http://www.dimatec.de
AQS-Software
Elcometer Instruments GmbH Himmlingstr. 18 73434 Aalen Tel. 07366/919283 Fax 07366/9 19286 eMail:
[email protected] http://www.elcometer.com
SPC Start Set
Fachhochschule Giessen-Friedberg Abt. Umwelttechnologie c/o Dipl.-Ing. Gerhild Donnevert Wiesenstr. 14 D-35390 Giessen Tel. 0641/309 2334 Fax 064 1/309 29 17 eMail: gerhiId.donnevert@ mni.fl-giessen.de http://www.ztm.uni-giessen.de/fhgi/zw.htm G. Greulich Software Adlergasse 4 792 19 Staufen Fax. 07633500 327
Winstat
headwork-consulting GmbH Bonner Talweg 55 531 13 Bonn Tel. 0228/9141100 Fax 0228/9 141 109 eMail: Validat99@ headwork-consulting.de http://www.headwork-consuIting.de
Validat
A6 Softwureprogrumme zur Methodenvulidierung und Qualitutssicherung
isomehr GmbH Altenkesseler Str. 17 D-66 115 Saarbriicken Tel. 068 119762 744 Fax 068 119762 745 eMail:
[email protected] http:llwww.isomehr.com
Procontrol
Merck KgaA Frankfurter StraBe 6427 1 Darmstadt Tel. 061511720 Fax 06 1511722000 eMail: service @merck.de http:/lwww.merc k.de
Validation Manager
NOVIA GmbH RosenstraBe 16 D-66125 Saarbriicken Tel. 06897197540 Fax 06897/9754 15 eMail:
[email protected] http:llwww.novia.de
MVA
Enrico Obst Polmannstr. 49 41366 Schwalmtal Tel. 02 163/30593 Fax 02 1 6313 1408
Aqcontrol
Perkin-Elmer GmbH Bodenseewerk Postfach 10 18 6 1 D-88647 Uberlingen Tel. 075511919 125 Fax 075511919 139 http:l/www.perkinelmer.de
SQS
Dr. Herbert Steiner GbR BreitstraBe 3 D-42555 Velbert Tel. 02052184064 bzw. 0297318 1621 Fax 0205217492 http:llwww.prolab.net
AQS Base
477
Umex GmbH Go\chwit7er\tr. 61-63 0 I 2 I7 Dre\den Tel. 035 1/87 18 296 Fax 035 1/87 1 8 439 eMail:
[email protected]
STATGRAPHICS
Vedewa Hausmannstr. 103 B 701 88 Stuttgart Tel. 07 I 1/925 560 Fax 071 1/925 515 Dr. Jurgen Vogelgesang Avenue de Janvier, 9 B- I200 Brussel
Kalibo
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
A7 Niitzliche Adressen (Auswuhl)
A7
479
Nutzliche Adressen (Auswahl)
Adressen von Institutionen, die Richtlinien, Inforrnationen, Ernpfehlungen und Kornrnentare zum Therna Validierung herausgeben bzw. uber die solche zu beziehen sind: American National Standards Institute 1430 Broadway New York NY 1001 8 USA Association of Official Analytical Chemists 11 11 North 19'h Street Suite 210 Arlington VA 22209 USA Beuth-Verlag BurggrafenstraBe 6 10787 Berlin Tel. 0301260 1 2260 Fax 030/260 1 1260 Bundesanstalt fur Materialforschung und -priifung (BAM) Sekretariat Eurolab D Unter den Eichen 87 D- 12205 Berlin Tel. 030/8 104-37 13 Fax: 030/8104- 1947 eMail:
[email protected] http://www.dar.bam.de Bundesanstalt fur Meterialforschung und -priifung (BAM) Geschaftsstelle DAR (Deutscher Akkreditierungs Rat) Unter den Eichen 87 D- 12205 Berlin Tel. 030-8 104-1942 Fax: 030/8104-1947 eMail:
[email protected] http://www.dar.barn.de
480
A Anlimg
Bundesinstitut fur Arzneimittel und Medizinprodukte, BfArM (vormals Bundesgesundheitsamt), Genthiner StraBe 38 10785 Berlin Tel. 030145483-0 Fax: 030/45483-207 Bundesinstitut fur gesundheitlichen Verbraucherschutz und Veterinarmedizin (BgVV) Thielallee 88-92 D-I4195 Berlin Tel. 030/84120 Fax: 030184 12-474 1 http://www.bgvv.de Bundesverband der Pharmazeutischen Industrie e. V. (BPI) KarlstralJe 2 1 60329 FrankfurtJMain Tel. 069-2556-0 Fax: 069-237813 Deutsche Akkreditierungsstelle Chemie GmbH (DACH) Hamburger Allee 26-28 60486 Frankfurt am Main Tel. 069-7917734 Fax 069-79 17736 eMail:
[email protected] Eidgenossische Materialprufungs- und Forschungsanstalt (EMPA) Lerchenfeldstr. 5 Postfach 755 CH-9014 St. Gallen Tel. + 41 71 274 7474 Fax:+ 41 71 274 7499 eMail:
[email protected] http://www.empa-sg.ch EURACHEM Secretariat PO Box 46 Teddington, Middlesex TW 1 1 OLY UK
A7 Nutzliche Adressen (Auswahl)
FDA 5600 Fischers Lane Rockville, MD 20857 USA Tel. "3011594-5700 Fax: "3011594-0499 http:llwww.fda.gov Food and Agriculture Organisation of the United Nations (FAO) Via delle Terme di Caracalla 1-0010 Roma GDCh Sekretariat Eurachem D Postfach 90 04 40 D-60444 Frankfurt Tel. 069179-17 326 Fax: 069179-17 475 eMail:
[email protected] http:/lwww.gdch.de/eura.htm GDCh Geschaftsstelle Postfach 90 04 40 D-60444 Frankfurt Tel. 069179-17 327 eMail:
[email protected] http://www.gdch.de ICH Secretariat c/o FPMA 30, Rue de St. Jean Postfach 9 CH-1211 Genf 18
IS0 Central Secetariat 1, rue de Varamb6 CH-1211 Genf 20 NATA (National Association of Testing Authorities, Australia) Public Affairs Tel. + 61 2 9736 8222 Fax+61 297435311
48 1
482
A Anhang
OECD Publication and Information Center August-Bebel-Allee 6 D-53 175 Bonn Tel. 02281959- 1210 eMail:
[email protected] http://www.oecd.org US EPA Publication Distribution Section Mailcode 3204 401 MSt. SW Washington DC 20460 USA Tel. + 1 202 260 5797 http://www.epa.gov VICH Secretariat c/o COMISA rue Defacqz 1 B-1000 Bruxelles (Belgium) Tel. + 32 2 54101 I 1 Fax + 32 2 54101 19 Einen schnellen Uberblick uber Aktuelles zur Validierung kann man sich durch das Internet verschaffen. Das Wort ,,validation" wird in vielen Suchmaschinen gefuhrt, so dalj man in jedem Fall fundig wird. An konkreten Adressen waren folgende zu empfehlen: http://iso.ch http://www.dar.bam.de http://www.e pa.gov http://www.eudra.org/emea.html http://www. fdzi.gov http://www.ifpma.org http://www.labcompliance.com http://www.lgc.co.ukest/best.htm http://www.metrodata.de http://www.validierung.de http://www.westgard.com
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
A 8 Publikutionen zum Themu Validierung in der Anulytik (Auswuhl)
A8
483
Publikationen zum Thema Validierung in der Analytik (Auswahl)
In folgenden Werken (*) wird das Thema ,,Methodenvalidierung" oder Teile davon als selbstandiges Thema behandelt. In den anderen Titeln sind einzelne Kapitel enthalten, die sich mit dem Thema befassen bzw. es handelt sich urn diverse Quellen, in denen bestimmte Begriffe der Qualitatssicherung und der Statistik ausfuhrlich erlautert werden. Die Bezugsquellen der mit ( 1) versehenen Titel finden sich bei ,,Nutzliche Adressen", s. A 8 mit (2) bei ,,Weiterbildung", s. A 10.
* Amtsblatt der Europaischen Gemeinschaften, Richtlinie 96146EG der Kommission vom 16. Juli 1996 (Nr. L214) und Anhang vom 23.08.1996 Arbeitskreis EurachemlD, ,,Richtlinien zur Interpretation der Normen-Sene EN 45000 und IS0 Guide 25", FrankfudMain, 1993, (BAM) ( 1 ) Bundesanzeiger Verlagsgesellschaft mbH, Postfach 10 05 34,50445 Koln Commission Guidance Document on Residue Analytical Methods, Doc. 8064/VI/97 rev 1 of 09/04/98 * DACH, Technische Mitteilungen Nummer 2, ,,Validierung im Priifwesen - Hinweise fur Pruflaboratorien und Begutachter", Frankfurt/Main, 1995, DACH (1) Directive 91/414/EEC, Annexes I1 und 111, EU-Kommission, 1996 * Diverse ICH-Guidelines, wie z. B. Definitions and Terminology Q2A, Methology Q2B, Consensus Guideline 11/96, Impurities in New Drug Products, Residual Solvents und weitere; ICH (1). Eine freie Ubersetzung des ICH-Papiers ,,Validation of analytical procedures - Methology" ins Deutsche kann bei NOVIA GmbH bezogen werden (2) EPA Data Reporting for Environmental Chemistry Methods, Public Draft, 7 12-C-96-348, 4/1996, EPA (1) EPA, Guidelines for the Validation of Analytical Methods for Pesticides, Pesticides Safety Directorate, 12.04.1994, EPA (1) * General Chapter <1225>, Validation of Compendia1 Methods, United States Pharmacopeia XXIII, National Formulary, XVIII, Rockville, Maryland, The United States Pharmacopeial Convention Inc., 1995, 1610-1612, FDA (1) * ,,Guide to Inspections of Validation of Cleaning Processes", Interpharm Press ICH-Guidelines, PHARMEUROPA, Vol. 8, Nr. 1, Marz 1996 * International Validation Forum Inc., ,,Validation Compliance Biannual", Marcel Dekker Inc., New York, 1996 Internationales Worterbuch der Metrologie, 2. Auflage 1974, Beuth Verlag GmbH, Berlin * I S 0 5725 (1994), Precision of Test Methods I S 0 8402 ( 1 994) Quality management and quality assurance-vocabulary * ISO-Guide 1 5/DINISO 17025, ,,General Requirements for the Competence of Testing and Calibration Laboratories", 1998 und in deutsch: DINISOflEC 17025: 1998- 10 ,,Allgemeine Anforderungen an die Kompetenz von Priif- und Kalibrierlaboratorien", BeuthVerlag ( I ) * Method Validation, Technical Note No. 17, NATA, 1990 Official Methods of Analysis, AOAC International, 16 th Ed., 1996
484
A Anhang
The rules governing medicinal products in the european union III/5382/96 Eudra/G/96/010 (Volume 3A, 1998, p. 119-125) * ,,Validation Documentation Inspection Guide" (Unofficial FDA Draft), Interpharm Press * Validation of Test Methods, EAL-EUROLAB, Permanent Liaison Group (PLG), 1996 @AM) ( 1) VICH-Guideline ,,Validation of Analytical Procedures: Methology", step 7, 10/98; VICH ( 1 )
* C. V. DeSain, C. V. Sutton, ,,Validation for Medical Device and Diagnostic Manufacturers", Interpharm Press K. Doerffel, ,,Statistik in der analytischen Chemie", VEB Verlag fur Grundstoffindustrie, Leipzig, 1987, ISBN 3-342-00202-6 W. Funk, V. Dammann, G. Donnervert, ,,Qualitatssicherung in der Analytischen Chemie", VCH, Weinheim, 1994, ISBN 3-527-28291-2 * W. Gibson, K. Powell-Evans, ,,Validation Fundamentals", Interpharm Press W. Gottwald, ,,Statistik fur Anwender", Wiley VCH, Weinheim, 1999, ISBN 3-527-29780-4 J. M. Green, ,,A practical Guide to Analytical Method Validation, Anal. Chem., 1996 (68) 305A-309A H. Gunzler (Hrsg.), ,,Akkreditierung und Qualitatssicherung in der Analytischen Chemie", Springer Verlag, Heidelberg, 1994, ISBN 3-540-58 136-7 * L. Huber, ,,Validation and Qualification in Analytical Laboratories", Interpharm Press, ISBN 1-57491-080-9 S. Kromidas (Hrsg.), ,,Qualitat im analytischen Labor", VCH, Weinheim, 1995, ISBN 3527-28683-7 J. C. Miller, J. N. Miller, ,,Statistics for Analytical Chemistry", Ellis Horwood PTR Prentice Hall, London, ISBN 0-1 30-30990-7 T. Schueppe, R. H. Muller, ,,Qualitatsmanagement und Validierung in der pharmazeutischen Praxis", EDITIOKANTOR Verlag, Aulendorf, 1999, ISBN 3-87 193-2 17-5 * H. Sucker, ,,Praxis der Validierung", Wissenschaftliche Verlagsgesellschaft mbH, 1987, ISBN 3-8047-0707-6 * M. E. Swartz,I. S. Krull, ,,Analytical Method Development andvalidation", Marcel Dekker Inc., New York, 1997, ISBN 0-8247-01 15-1 K. Taube, ,,Statistik in der Qualitltssicherung", Vieweg Verlag, BraunschweigNiesbaden, 1996, ISBN 3-528-03838-1 G. Wingate, ,,Validating Automated Manufacturing an Laboratory Applications", Interpharm Press
Es folgt eine Auswahl von Publikationen nach Themen sortiert:
AS Publikationen zurn Thema Widierung in der Anulytik (Auswahl)
485
Computervalidierung M. Anisfeld, A, Davis, Jnterpharm Computer Validation Monograph Series", Interpharm Press ASTM Committee E-49.07 ,,Validation and Qualification of Computerized Laboratory Data Acquisition System", LDAS, (Standard Guide for Validation of LIMS) AVP, Interpretation des Annex 11 ,,Computerized Systems" zum EU-GMP-Leitfaden, 1996 (Entwurf), 32 Seiten, AVP (2) BLAK-GLP, GLP und Datenverarbeitung, Konsenspapier, 1996, Bundesanzeiger ( 1) P. Bosshard, ,,GLP-gerechte Qualifizierung und Validierung computergestutzter Systerne", Vortrag, 4. GLP-Tage Saarbrucken, 1999, NOVIA GmbH (2) G. Christ et al., ,,Validierung von Auswertungssoftware", Einsatz computergestutzter Systeme bei GLP-Priifungen", Vorschlage der Projektgruppe GLP und EDV des Arbeitskreises GLP im Verband der Chemischen Industrie e. V., Pharm. Ind. 59, I , 24-29.2, 116-120, 1997 M. E. Double, M. McKendry, ,,Computer Validation Compliance", Interpharm Press EA Guidelines for the use of computers and computer systems in accredited laboratories, Version 3, 1998 EPA, Good Automated Laboratory Practices, Principles and Guidance to Regulations for Ensuring Data Integrity in Automated Laboratory Operations, with Implementation Guide, 1995 Edition, Research Triangle Park, NC, USA, EPA ( I ) EU, EG-Leitfaden einer Guten Herstellungspraxis fur Arzneimittel, mit Annex 1 1: Computergestutzte Systeme, Auterhoff, 4. Aufl. ECV - Editio Cantor Verlag, Aulendorf ( 1 995), Bezugsquelle: Editio Cantor Verlag, Postfach 1255, D-88322 Aulendorf, Tel. 07525-9400, eMail:
[email protected] FDA, ,,General Principles of Software Validation", Draft Guidance for Industry, 1997, FDA (1) L. Huber, ,,Qualification and Validation of Software and Computer Systems in Laboratories", Accred Qua1 Assur 3: 2-5, 1998 L. Huber, Validierung computergesteuerter Analysensysteme, Springer Verlag, Berlin, 1996, ISBN 3-540-60849-4 OECD, The Application of the principles of GLP to computerized systems, Series on principles of good laboratory practice and compliance monitoring, GLP consensus document number 10, Environmental monograph 1 16, Paris, 1995, OECD (1) OECD, Compliance of laboratory suppliers with GLP principles, Series on principles of good laboratory practice and compliance monitoring, number 5 , GLP consensus document, environment monograph No. 49, Paris, 1992 PDA Technical Paper Number 3 1 :Validation and qualification of Computerized Laboratory Data Acquisition Systems (LDAS), November 1999 (www.pda.org) Pharmaceutical Manufactures Association: Computer System Validation. Pharmaceutical Technology (1989) T. Stokes, ,,The Survive and Thrive Guide to Computer Validation", Interpharm Press T. Stokes, R. C. Branning, K. G. Chapman, H. Hambloch, A. J. Trill, ,,Good Computer Validation Practices", Interpharm Press
486
A Anhang
UK Pharmaceutical Industry Computer System Validation Forum (PICSVF), Good automated manufacturing practice in the pharmaceutical industry (GAMP), Validation of automated systems in pharmaceutical manufacture. Pharmaceutical Industry Supplier Guidance, Jan 1995, Buch oder Diskette. Bezugsquelle: ISPE, Fax.: +31-70-345 66 75 H.-D. Unkelbach, P. Bosshard, H. Wolf, Computervalidierung in Labor und Betrieb, WileyVCH, Weinheim, 1998, ISBN 3-527-2889 1-0 ,,Validation of Computer Related Systems (PDA)", Interpharm Press M. Vollmer, ,,Validierung von Pharma-Software", CHEManager 5/98, GIT-Verlag
TrenntechnikedSpektroskopie K. D. Altria, D. R. Rudd, ,,An overview of method validation and system suitability aspects in capillary electrophoresis", Chromatographia, Volume 41, Issue: 5-6, p. 325-33 I , 1995 K. D. Altria, ,,Current applications in the analysis of pharmaceuticals by capillary electrophoresis I", Anal. Chem. 17 (4) (1998);204-214 K. D. Altria, ,,Method validation in capillary electrophoresis" in High performance capillary electrophoresis: A series of monographs on analytical chemistry and his applications 146 (1998):557-579 E. Assidjo et al., ,,Validation procedures of sedimentation field-flow fractionation techniques for biological applications", J. of Chrom. B 709 (2) (1998): 197-207 J. P. Conzen, ,,Methodenvalidierung in der quantitativen NIR-Spektroskopie", GIT, 2, 1998 E. W. Clurczak, ,,Validation of spectroscopic methods in pharmaceutical analyses", Pharmaceutical Technology/22/3 (92-IOO), 1998 E. W. Clurczak, ,,Validation of spectroscopic techniques", Pharmaceutical Technology/22/ 4 ( 4 4 4 8 ) , 1998 A. G. I. Daas, J. H. Mc B. Miller, ,,Relationship Between Content Limits, System Suitability for Precision and AcceptanceRejection Criteria for Assays Using Chromatographic Methods", PHARMEUROPA Vol. 1 1, No. 4, 1999 C. M. Decley, R. A. Spragg, ,,Systemvalidierung fur analytische FTIR-Untersuchungen", CLB, 2, 1996 FDA, Technical Review Guide, ,,Validation of Chromatographic Methods", Rockville, 1994, FDA (1) Ph. Hubert et al., ,,The SFSTP guide on the validation of chromatographic methods for drug bioanalysis: from the Washington Conference to the laboratory", Analytica Chimica Acta, 391, 135-148, 1999 D. R. Jenke, ,,Chromatographic method validation: a review of current practices an procedures, I General concepts and quidelines, I1 Guidelines for primary validation parameters", J. Liq. Chromatogr. Relat. Tech., Volume 19, Issue:5, p. 719-757, 1996, I11 Rugedness, revalidation and system suitability, Instrum. sci. Technol., Volume 26, 1, p. 19-35, 1998 R. B. Kirsch, ,,Validation of analytical methods used in pharmaceutical cleaning assessment and validation", Pharmaceutical Technology/22/2 (40-46), 1998
A8 Publikutionen zum Themu Validierung in der Anulytik (Auswuhl)
487
M. Lauwaars, ,,Methods validation: AOAC's three validation systems", Accred. Qual. Assur 3: 32-35, 1998 G. Lieck, ,,Nachweisgrenze und Rauschen", LaborPraxis, 6, 1998 J. L. Virlichie, A. Ayache, ,,A ruggedness test model and its application for HPCL method validation", S. T. P PHARMA PRATIQUES 5 (1) 49-60, 1995
Auswahl interessanter Artikel zu speziellen Themen G. Auterhoff, ,,PIC-Empfehlungen zur Validierung, Recommendations on Validation Master Plan, Installation and Operational Qualification, Non-Sterile Process Validation, Cleaning Validation", Pharm. Ind. 61, Nr. 1 I , 1999 H. G. Brittain, ,,Validation of nonchromatographic analytical methodology", Pharmaceutical Technology/22/3 (82-90), 1998 P. Bruce, P. Minkkinen, M. L. Riekkola, ,,Practical method validation: Validation sufficient for an analysis method", Mikrochimica Acta 128 (1-2) (1998):93-106 L. Briiggemann, ,,Berechnung ausgewahlter Qualitiitsmerkmale von Anal ysenverfahren", GIT, 7, 1998 D. A. Burns, E. W. Ciurczak, ,,Handbook for Near-Infrared Spectroscopy", Practical Spectroscopy Series, Volume 13, Marcel Dekker, 1992 S. Burke, ,,Analysis of Variance", Scientific Data Management, 3, 1998: p. 3 6 4 1 D. Coleman, J. Auses, N. Grams, ,,Regulation - From an industry perspective or Relationships between detection limits, quantitation limits, and significant digits", Chemometrics and Intelligent Laboratory Systems, 37, p. 71-80, 1997 K. Danzer, ,,Selectivity and specifity in analytical chemistry. General considerations and attempt of a definition", in press. Draft Guidance for Industry on Investigating 00s Test Results for Pharmaceutical Production, FDA, 1998 K. Esbensen et al., ,,Multivariate Analysis in Practice", C A M 0 SA, 1996 J. W. A. Findlay et al., ,,Validation of immunoassays for bioanalysis: a pharmaceutical industry perspective", Journal of Pharmaceutical and Biomedical Analysis, 2 1, 12491273,2000 P. Gowiketal, ,,in-house-Validierung in der Spurenanalytik", Nachr. Chem. Tech. Lab. 46 (1998) Nr. 9 H. Hausler, M. Niehorster, K. P. Worns, ,,Zum Umgang mit Normabweichungen in der Laborpraxis, Moglichkeiten der Umsetzung vom GMP-Vorgaben bei sog. Out of Specification (00s)-Testergebnissen", Pharm. Ind. 61, Nr. 10, 1999 S. J. Haswell, ,,Practical Guide to Chemometrics", Marcel Dekker, 1992 U. Hillebrand, ,,Varianzhomogenitat bei der Kalibration von Analysenverfahren", Labor Praxis, 2, 2000 W. Honvitz, ,,Calibration curves can be curves", Inside Laboratory Management AOAC International, April 1998, P. 4 B. Julicher, P. Gowik, S. Uhlig, ,,Assessment of detection methods in trace analysis by menas of a statistically based in-house validation concept", Analyst 123 (2) (1998): 173179
488
A Anhnng
M. Kunkel, J . Bohler, E. Keller, A. W. Frahm, ,,Titrimetric determinations of Cremophor EL in aqueous solutions and biofluids Part 1 : Validation of the potentiometric titration method", Pharmazie 53 (5) (1998):314-321 H. Martens, T. Naes, ,,Multivariate Calibration", John Wiley & Sons, New York, 1989 D. L. Massart, B. G. M. Vandeginste, S. N. Deming, Y. Michotte, L. Kaufmann, ,,Chmometrics, a textbok", Data handling in Science and Technology, Volume 2, Elsevier, 1988 K. Metzger, ,,Qualifizierung und Validierung bei der Herstellung pharmazeutischer Wirkstoffe und Zubereitungen", Pharm. hid. 61, Nr. 10, 1999 M. Otto, ,,Chemometrie, Statistik und Computereinsatz in der Analytik", Wiley-VCH, Weinheim, 1997 Sonderteil ,,Separation Techniques" in Pharmeuropa Vol. 10, Nr. 3, September 1998 M. Thompson, R. Wood, ,,Harmonised guidelines for internal quality control in analytical chemistry laboratories", Pure & Appl. Chem., Vol. 67, No. 4, pp. 649-666, 1995 M. Winterstein, K. Geyer, E, Strelle, ,,Gleichwertigkeitstest nach GRUBBS - ohne Mehrfacbestiinmung oder Kalibrierfunktion", GIT, 1 1, 1999 R. L. Wong, D. Mytych, S. Jacobs, R. Bordens, S. J. Swanson, ,,Validation parameters for a novel biosensor assay which simultaneously measures serum concentrations of a humanized monoclonal antibody and detects induces antibodies", Journal of immunological Methods 209 (1) (1997): 1-15 Hinweis: In der Zeitschrift Accreditation and Quality Assurance (Accred. Qual Assur), Springer Verlag (http://www.link.springer.de/linMservice/journals/), erscheinen nahezu in jeder Ausgabe Artikel zu den Themen Validierung und Qualitatssicherung
MeBunsicherheit, Ergebnisunsicherheit Angabe der Unsicherheit in der quantitativen Prufung EAL-(323, Dokument DAR-EM 25, BAM (1) A Practical Guide to Analytical MethodValidation, Analytical Chemistry, (68) 305A-309A L. Bruggemann, ,,Berechnung der Messunsicherheit", GIT Labor-Fachzeitschrift, 3,2000 DAR ,,Die Ermittlung der MeOunsicherheit in der analytischen Chemie" erscheint 1999 im Beuth Verlag ( 1 ) DKD-3, Angabe der Mehnsicherheit bei Kalibrierungen, Deutsche Ausgabe 1998, Wirtschaftsverlag, Bremerhaven DKD-3-E 1 Angabe der MeOunsicherheit beim Kalibrieren, Beispiele, PTB (Hrsg.), Wirtschaftsverlag NW EURACHEMKITAC Guide, ,,Quantifying Uncertainty in Analytical Measurement", Second Edition, Draft: June 1999 W. Hasselbarth, ,,Measurement uncertainty procedures revisited: Direct determination of uncertainty and bias handling", Accred. Qual Assur. 3 (1998) 41 8 4 2 2 W. Kessel, ,,European and International Standards for Statements of Uncertainty", Eng. Sci. Educ. J., Vol. 7, No. 5, Oktober 1998, pp. 201-207
A8 Publikarionen zum Thema Validierung in der Analytik (Auswuhl)
489
B. King, Accred Qual Assur (1999), 4: 27 S. Kuppers, Accred Qual Assur (1998), 3: 4 1 2 4 1 5 S. Kuppers, ,,Is the estimation of meausurement uncertainty a viable alternative to validation?" Accred Qual Assur 3 (1 998) 4 12-415 Leitfaden zur Angabe der Unsicherheit beim Messen, 1. Auflage 1995, Beuth Verlag GmbH (1) V. R. Meyer, ,,Mesunsicherheit in der HPLC: Das Ursachen-Wirkungs-Diagramm", Poster, Analytica-Conference, 2000, zu erhalten, bei
[email protected] B. Renger, ,,MeBunsicherheit analytischer Verfahren und ihre Auswirkungen auf Spezifikationsgrenzen, Vortrag, Analytiker-Tage, Mannheim, 1998, NOVIA GmbH (2) B. Ruchti, ,,Grenzwerte und Ergebnisunsicherheit", Labor Praxis, 3, 2000 M. Thompson et al., Guidelines for the use of Recovery Information in Analytical Meansurement zu erhalten uber: http://www.vtt.fi/ket/eurachem/publications.htm. Eine deutsche Ubersetzung des EURACHEM-Dokuments ,,Quantifying Uncertainty in Analytical Measurement" kann bezogen werden von: Univ. Prof. Dip1.-Ing. Dr. Wolfhard Wegscheider, Montanuniversitat Leoben, Franz-Josef-StraBe 18, A-8700 Leoben, Tel. + 43 3842/402-341, Fax -543, e-mail:
[email protected] Unsicherheit von Priifergebnissen: Dokument DAR-EM 22, BAM (1) K. Weise, W. Wager, ,,MeBunsicherheit und MeBdatenauswerfung", Wiley-VCH Verlag, Weinheim, 1999, ISBN 3-527-29610-7
Handbuch Validierung in der Analytik
490
A Atihmg
A9
Weiterbi ldung
Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Einige Hersteller analytischer Geriite bieten Weiterbildungsveranstaltungen an, in denen das Thema ,,Validierung" angesprochen wird. Das geschieht h h f i g in Zusammenhang mit einer Software oder einem Gerlt, in diesen Fiillen geht es also eher um Qualitizierung. Einige Verblnde bzw. behordliche Stellen/Institutionen veranstalten unregelmiiRig Seminare zum Therna Validierung, z. B. GDCh Frankfurt, BAM Berlin, BPI Frankfurt, EMPA St. Gallen (Schweiz). Folgende UnternehmenNereine bieten regelmlRig deutschsprachige, herstellerunabhlngige Schulungen zum Thema Validierung an: Arbeitsgemeinschaft fur pharmazeutische Verfahrenstechnik (APV) e. V. Kurfurstenstr. 59 55 1 18 Mainz Tel. 06 I3 1/97690 Fax 06 1 3 1/9769 69 eMail: apvoapv-mainz.de http://www.apv-mainz.de Bodenseewerk Perkin Elmer GrnbH Postfach 10 17 61 88647 Uberlingen Tel. 0755 1/8 10 Fax 07551/919139 http://www.perkinelmer.de Concept Heidelberg P. 0. Box 10 17 64 69007 Heidelberg Tel. 06221/84440 Fax 0622 1 /844484 eMail:
[email protected] http://www.concept-heidelberg.de Haus der Technik e. V. HollestralJe 1 45 127 Essen Tel. 0201/18031 Fax 020 1 / 1803 269 http:l/www.hdt-essen.de
A 9 Weirerbildung
Dr. Kiinkner & Partner GmbH Altenkesseler Str. 17 661 15 Saarbriicken Tel. 068 1 19762 23 1 Fax 068119762 235 eMail:
[email protected] http:l/www.klinkner.de NOVIA GmbH RosenstraBe 16 66 125 Saarbrucken Tel. 06897197540 Fax 068971975415 eMail:
[email protected] http:llwww.novia.de
PTS R. Schnettler Postfach 43 08 59737 Arnsberg Tel. 0293215 1477 Fax 02932151674 eMail:
[email protected] http:llwww.pts-aktuell .de
49 1
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Literatur
131 [41
151 161 171
[81 191
H. Sucker, P. Fuchs, H. Feltkamp, ,,Pharmazeutische Qualitatskontrolle", Georg Thieme Verlag, Stuttgart, 1983. R. Klinkner, ,,Begriffsdefinition Validierung", Vortrag, Haus der Technik, Essen, 1997. S. Kromidas (Hrsg.), ,,Qualitat im analytischen Labor", VCH Verlag, Weinheim, 1995. J. Guardiola, S. Kromidas, ,,Das analytische Labor", QZ, 4 I, 1996. J. S. Morkowski, ,,Step by step assessment of the uncertainty of a test result", 2. EUROLAB Symposium, Florence, 1994. J. S. Morkowski, ,,Charakterisierung von Prufverfahren", Report #159410 of Swiss Federal Laboratories for Materials Testing and Research, Dubendorf, 1995. U. Huckfeldt, J. S. Morkowski, ,,Ermittlung der Unsicherheiten von Emissionsmessungen durch geordnetes Schatzen - eine Alternative zu Vergleichsmessungen", Gefahrstoffe, Reinhaltung der Luft 59 (1999) Nr. 3 - Marz, S. 17-23. ,,Amandment of Certain Requirements for Finished Pharmaceuticals Proposed Rules", Federal Register, Vol. 61, Nr. 87, S. 20103-201 15, 1996. A. Rios, M. ValcBrel, ,,A view of uncertainty at the bench analytical level", Accred. Qual. Assur., 3, 1998. T. Scheidmeir: Vortrag ,,Validation Master Plan", anlaBlich der PTS- Validierungskonferenz, Ulm, 1997. PIC-Empfehlungen fur die Validierung, Pharm. Ind. 58, Nr. 4,1996. P. Bedson, M. Sargent ,,The development and application of quidance on equipment qualification of analytical instruments", Accred Qual Assur, 1 : 265-274, 1996. Analytical Methods Committee, Analyst 122, 387-392, 1997. S. Kromidas, ,,Tests zur Uberpriifung einer HPLC-Apparatur", LaborPraxis, 9,1996. F. Arnold, Qualifizierung von Chromatographiegeraten, GIT, 11, 1998. G. Maldener, ,,Validierung in der Pharmazeutischen Industrie: Analytische Methoden - Prozesse - Datenverarbeitungssysteme", Vortrag Deutsch-Ungarisches Chromatographie-Symposium in Memoriam I. Hallsz, Saarbriicken 1997. A. Mihandru, In Proceedings of the 3'd International Conference on Computers and Communications, IEEE Computer Society Press, Silver Spring, Maryland, USA, 1984. J. Moore, P. Solanki, R. D. McDowall, ,,Validation of quantitative liquid chromatography - mass spectrometry software for Good Laboratory Practice compliance", Chemom. Intell. Lab. Syst. Volume: 31, Issue: I , p. 43-46, 1995. M. Streater, N. D. Pathirama, S. Wheeler, ,,Validation studies in the r egeneration of ion-exchange celluloses", J. Chromatogr., A, Volume: 702, Issue: 1-2, p. 59-68, 1995.
494
Literutur
R. Curren, L. Bruner, A. Goldberg, E. Walum, ,,Validation and acute toxicity testing'', Environmental Health Perspectives, 106/2 (4 19425), 1998. E. Zeiger, W. S. Stokes, ,,Validating new toxicology tests for regulatory acceptance", Regulatory Toxicology and Pharmacology, 27/1 (32-37), 1998. L. Bruner, G. Can; R. Curren, M. Chamberlain, ,,Validation of alternative methods for toxicity testing", Environmental Health Perspectives, I06/2 (477484), 1998. D. Mark, ,,Major progress in the validation of aerosol measurements", Anal. Proc. (London), Volume: 32, Issue: 4, p. 159-160, 1995. A. Kayali, 0. Sogut, B. Tuncel, ,,Some considerations on analytical methods validation: bioavailability, bioequivalence and pharmacokinetic studies", Eur J Drug Metab Pharmacokinet., VOL 20, Spec. Issue, 1995. Zur Bezugsquelle fur ICH-Richtlinien siehe ,,Nutzliche Adressen", A 8. B. Renger, ,,Nicht spezifikationskonforme Analysenergebnisse/Out of Specification Test Results", Pharm. Ind. 61, Nr. 11, 1999. Draft Guidance fur Industry on Investigating 00s Test Results fur Pharmaceutical Production, FDA, 1998. W. Gottwald, Seminarunterlagen ,,Statistik fur Chromatographie- und Spektroskopieanwender", NOVIA GmbH, Saarbrucken. J. Ermer, ,,Handbuch zum Softwareprogramm MVA", NOVIA GmbH, Saarbrukken. Guidelines for Collaborative study Procedure to Validate Characteristics of a Method of Analysis, Final Draft, J. ASSOC. OFF ANAL. CHEM. Vol. 72, No. 4, 1989. W. Horwitz, ,,Evaluation of Analytical Methods for Regulation of Foods and Drugs", Anal. Chem. 54,67 A-76 A, 1982. W. Funk, V. Dammann, G. Donnevert, ,,Qualitatssicherung in der Analytischen Che134 mie", VCH, Weinheim, 1994. I331 DIN (Hrsg.), Leitfaden zur Angabe der Unsicherheit beim Messen, Beuth Verlag GmbH, Berlin, 1995. M. Haustein, ,,Erfahrungsbericht zur Validierung im praktischen Laborbetrieb", Vortrag, Haus der Technik, Essen, 1997. Dertinger, Glnshirt, Steinigen, ,,GAP, Praxisgerechtes Arbeiten in pharmazeutischanalytischen Laboratorien", Wissenschaftliche Verlagsgesellschaft mbH, Stuttgart, 1984. 1361 R. Klinkner, ,,Die Validierungselemente", Vortrag, Haus der Technik, Essen, 1997. 1371 S. L. R. Ellison, A. Williams, ,,Measurement uncertainty and its implications for collaborative study method validation and method performance parameters", Accred Qua1 Assur, 3, 1998. R. E. Kaiser, ,,Die Standard-Uncertainty", Vortrag InCom, Dusseldorf, 1999. D. Stauffer, Firmenschrift ,,Validierung in der Chromatographie", La Roche, Basel, 1999. M. Mulholland, ,,Ruggedness testing in analytical chemistry", trends in analytical chemistry, vol. 7, no 10, 1988. A. Ayache, J. Virlichie, ,,Application of a model to the study of the ruggedness study to the validation of an HPLC analysis method', STP Pharma Prat, Vol. 5 , ISS 2, p. 37-60, 1995.
Literatur
495
P. Chaminade, S. Feraud, A. Baillet, D. Ferrier, ,,Validation of an HPLC analytical method. Ruggedness test and method validation", STP Pharma Prat, Vol. 5 , ISS 1, p.17-38, 1995. M. Glienke, Schering AG, Berlin, private Mitteilung. G. Eberz, H.-G. Rast, K. Burger, W. Kreiss, C. Weisemann, ,,Bioactivity Screening by Chromatography-BioluminescenceCoupling", Chromatographia Vol. 43, No. 1/2, July 1996. S. Kromidas, ,,HPLCTips", Band 1, 2. Auflage, Hoppenstedt Verlag, Darmstadt, 1998. T. Konig, Dissertation, Institut fur Angewandte Physikalische Chemie, Saarbrukken, 1986. S. Kromidas, ,,HPLC-Tips", Band 2, in Vorbereitung S. Kromidas, unveroffentlichte Ergebnisse. J. C. Miller, J. N. Miller, ,,Statistics for Analytical Chemistry", Ellis Horwood PTR Prentice Hall, London. S. Schomer, ,,Analytische Qualitatssicherung, Kalibrierung und MeBunsicherheit", GIT, 9, 1996. W. Gottwald, Seminarunterlagen ,,Validierung in der Analytik", NOVIA GmbH, Saarbrucken W. Funk, V. Dammann, C. Vonderheid, G. Oehlmann, ,,Statistische Methoden in der Wasseranalytik", VCH Verlag Weinheim, 1985. Deutsche Einheitsverfahren zur Wasser-, Abwasser- und Schlammanalytik: Strategien fur die Durchfiihrung von Wasseranalysen, 2 1. Lieferung, VCH, Weinheim, 1989. 1541 DIN 32 645: ,,Nachweis-, Erfassungs- und Bestimmungsgrenze", Beuth Verlag, Berlin, 1994. D. Rinne, W. Leger, ,,Qualitatsziele fur die Schwermetallbestimmung mit atomspektrometrischen Methoden", Vom Wasser, 74,91-105, 1990. U. Hillebrand, ,,Der F-Test und die Kalibrierfunktion", GIT, 8, 1999. M. S. Bartlett, ,,Properties of Sufficiency an Statistical Tests", Proc. Roy. SOC.A 160, 268, 1937. W. Gottwald, ,,Statistik fur Anwender", Wiley-VCH Verlag, Weinheim, 1999. J. M. Green, ,,A Practical Guide to Analytical Method Validation", Analytical Chemistry News & Features, p. 305 A, 1996. B. Fichtl, Universitatsklinik Munchen, personliche Mitteilung L. Sachs, ,,Angewandte Statistik", 7. Auflage, Springer, Heidelberg 1992 J. Kleiner, ,,Die Verfahrensstandardabweichung,eine KenngroBe zur Absicherung von Routineanalysen", Vortrag, InCom, Diisseldorf, 1998. 1631 J. Ermer, ,,Validierung analytischer Methoden", Vortrag, PTS-Validierungskonferenz, Ulm, 1997. Broschure der Hoechst AG, ,,Statistkche ProzeBfuhrung (SPC)", 1993. R. Staal, Seminarunterlagen ,,Grundlagen von SPC mit Problemlosungsmethoden", 1998. S. Kromidas, Seminarunterlagen ,,Validierung in der Analytik", 1999, NOVIA GmbH. Saarbrucken
496
1741
1771 1781
1821 [831 1841 I85 I
1861
Litrrliritr
S. Noack, ,,Algorithmus zur Driftkorrektur bei der ICP-Spektrometrie". Stahl und Eisen, 1 10,99-06, 1990. K. H. Muhvich, ,,Comments On Container/Closure Integrity Testing", PDA Letter, 14-15, 1997. D. K. Morton et al., S. T. Yang, L. 0. Wilken in a compilation of papers from the PDA Journal of Pharmaceutical Science and technology, ,,Container/Closure Integrity Assessment", PDA, doc. No.: CMP 1, Baltimore, USA, 1996. L. Huber, ,,Validierung computergesteuerter Analysensysteme", Springer Verlag, Berlin, 1996. L. Huber, ,,Validierung und Qualifizierung computerisierter Systeme in analytischen Labors", Q-DOC 01505, Klinkner & Partner, Saarbrucken, 1998. L. Huber, ,,Qualification and validation of software and computer systems in laboratories", Accred. Qual. Assur., 3, 1998. OECD, ,,Compliance of laboratory suppliers with GLP principles", Series on principles of good laboratory practice and compliance monitoring, number 5 , GLP consensus document, environment monograph No. 49, Paris, 1992. ISO/IEC 17025, ,,Allgemeine Anforderungen an die Kompetenz von Pruf- und Kalibrierlaboratorien", Beuth Verlag, Berlin, 2000. ENV 13530 ( 1997), ,,Wasserbeschaffenheit - Richtlinie zur analytischen Qualitiitssicherung in der Wasseranalytik". DEV (Lief. 1997). Jtrategien fur die Wasseranalytik: Verfahrensentwicklung. Validierung und Qualitatssicherung in der Routine". LAWA-AQS-Merkblatter, Erich Schmidt Verlag, 1998. DIN 38 402 - Teil A 5 1 ( 1986), ,,Kalibrierung von Analysenverfahren, Auswertung von Analysenergebnissen und lineare Kalibrierfunktionen fur die Bestimmung von Verfahrenskenngrofien", Beuth Verlag, Berlin. DIN 32 645 (1994), Beuth Verlag, Berlin. IS0 8466- 1 ( 1990), ,,Water quality - calibration and evaluation of analytical methods and estimation of performance characteristics. Part 1 : Statistical evaluation of the linear function". I S 0 5725- 1 bis -6 (1994), ,,Accuracy (trueness and precision) of measurement methods and results". DIN 38 402 - Teil A 41 und - A 42 ( 1984), ,,Ringversuche, Planung und Organisation und Auswertung". Meyers GroRes Konversations-Lexikon, 6. Aufl., Bd. 19. Leipzig und Wien 1908 Erlauterungen des BGA zum Antrag auf Zulassung eines Arzneimittels (Febr. 1988). The Rules Governing Medicinal Products in the European Community, Volume 3, Addendum ( 1990). DER Guideline on Validation of Chromatographic Methods, Reviewer Guidance of Chromatographic Methods, US Food and Drug Administration, Center for Drugs and Biologics, Department of Health and Human Services (1994). Guidelines for Submitting Samples and Analytical Data for Methods Validation, US Food and Drug Administration, Center for Drugs and Biologics, Department of Health and Human Service (1987).
Literatur
497
United States Pharmacopeia, Section < 1225> ,,Validation of Compendia1Methods", United States Pharmacopeial Convention, Rockville (1995). ,,Acceptable Methods", Drug Directorate Guidelines, National Health and Welfare, Health Protection Branch, Health and Welfare Canada (1992). Current Good Manufacturing Practice for Finished Pharmaceuticals (cGMP's), US Food and Drug Administration, Code of Federal Regulations, Section 2 11.222 (Draft 1996). International Conference on the Harmonization of Technical Requirements for the Registration of Pharmaceuticals for Human Use (ICH). Q2A: Validation of Analytical Methods (Definitions and Terminology) (October 1994). ICH: Q2B, Analytical Validation - Methodology (November 1996). ICH: Q3A, Impurities in New Drug Substances (March 1995,revised October 1999, step 2). ICH: Q3B, Impurities in New Drug Products (November 1996, revised October 1999, step 2). ICH: Q3C, Residual Solvents (July 1997). ICH: Q6A, Specifications: Test Procedures and Acceptance Criteria for New Drug Substances and New Drug Products, Chemical Substances (October 1999) ICH: Q6B, Specifications: Test Procedures and Acceptance Criteria for BiotechnologicalD3iological Products (March 1999) B.-A. Persson, J. Vessmann, R. D. McDowall: Is your method specific or just selective? LC-GC International, March 1998, p. 160-164. Pure Appl. Chem. 35 (1983), p. 553-556. C. M. Riley: Statistical parameters and analytical figures of merit. In: Development and Validation of Analytical Methods. Eds. C. M. Riley and T. W. Rosanske, Elsevier, Oxford 1996, p. 15. V. R. Meyer: Quantitation of chromatographic peaks in the 0.1 to 1.0 % Range, Chromatographia, 40 (1995), 15-22. R. E. Kaiser: Gas-Chromatographie, Geest & Portig, Leipzig 1960, 33. S. Ebel: Validation of analysis methods, Freseniums J. Anal. Chem. 342 (1992), 769-778. J. Ermer, P.-G. Kibat: A quality concept for impurities during drug development use of the hyphenated LC-MS technique, Pharmaceutical Science & Technology Today, 1 (1998), p. 76-82. 1051 J. Ermer: The use of hyphenated LC-MS technique for characterisation of impurity profiles during drug development, J. Pharm. Biomed. Anal., 18 (1998), 707-714. 1061 H. Fabre et al.: Validation of a capillary electrophoresis procedure for the determination of calcium in calcium acamprosate, J. Chromatogr. A, 772 (1997), 265-269. Analytical Methods Committee: ,,Uses (Proper and Improper) of Correlation Coefficients", Analyst, 113 (1988), 1469-1471. American Society for Testing and Materials, ASTM Designation E 1303-89,ASTM, Philadelphia 1989. J. Hartung, B. Elpelt, K.-H. Klolsener: Statistik, Lehr- und Handbuch der angewandten Statistik, 7. Aufl., Oldenbourg Verl. Munchen 1989.
498
Literutur
[ 1 101 International Standard IS0 5725: Precision of test methods - Determination of repeat-
ability and reproducibility for a standard test method by inter-laboratory tests (1986). [ 11 11 G. Wachter, J. Kleiner, U. Lernhardt: Statistik in der Analytischen Qualitatssiche-
rung, CLB Chemie in Labor und Biotechnik 49 (1998). [ I 1 la] Teil 6: Die Nachweis- und Erfassungsgrenze nach der Leerwertmethode, H. 8, 297-299. [ I 1 lb] Teil7: Die Nachweis- und Erfassungsgrenze nach der Kalibrierkurvenmethode, H. 9, 336-3 1. [ 1 1 Ic] Teil 8: Die Bestimmungsgrenze, H. 10,380-384. [ 1 121
Pharmacopeial Forum 24 (1998), 6582-6589. [ 1 131 F. Questier, Y. Vander Heyden, D. L. Massart: RTS, a software package for the experimental set-up and interpretation of ruggedness tests, Journal de Pharmacie de Belgique 53 (1998), 244. [ 1 141 W. B. Furmann, J. G. Dorsey, L. R. Snyder: System Suitability Tests in Regulatory Liquid and Gas Chromatographic Methods: Adjustments Versus Modifications, Pharm. Technol. Europe, Juni 1998,30-33. [ 1 151 PA/PH/Exp. MG (98) 1 ANP, Separation Techniques, Pharmeuropa 10 (1998), 396-403. [ 1161 MVA - Methoden Validierung in der Analytik (PC-Programm, Windows NT), Fa. NOVIA GmbH, Saarbrucken. [ 1 171 J. Guardiola, Firma Braun-Melsungen, private Mitteilung. [ 1 181 S. Kromidas, J. Guardiola, H. Schelling, F. J. Huther, unveroffentlichte Ergebnisse. [ 1 191 P. Hailey, ,,Validation of Non-Chromatographic Procedures", Vortrag wahrend der ,,International Conference on Validation of Analytical Procedures", London, 1998. [ 1201 J. Morkowski, Prasentation auf dem NOVIA-Forum ,,Qualitat in der Analytik", Mannheim 1995; und Testing for the Years 2000, Proceedings, 2nd Eurolab-Symposium, Florenz 1994. [ 12I] Tagungsband Technische Anforderungen an das Qualitatsnianagement und bei der Akkreditierung von Pruflaboratorien, Eurolab Deutschland, Dr. M. Golze, Unter den Eichen 87, 12205 Berlin. [ 1221 B. Renger, Pharm. Tech. Eur. 9 (1997) (6) 36. [ 1231 DACH, Deutsche Akkreditierungsstelle Chemie GmbH, Frankfurt, Techn. Mitteilung Nr. 2, 06/1995. [ 1241 J. S. Morkowski, Validierung im Prufwesen, Proceedings Eurolab Workshop Stuttgart, September 1994. [ 1251 S. Kuppers, Accred Qua1 Assur (1997) 2: 30-35 und 338-341. [ 1261 U. Kurfurst, A. Rehnert, H. Hollenbach, B. Peil, Git Fachz. Lab. 7/95, S. 662. [ 1271 U. Kurfurst, A. Rehnert, H. Muntau, Spectrochimica Acta Part B 51 (1996), 229. [ 1281 Leitfaden zur Angabe der Unsicherheit beim Messen, DIN 1995, Beuth Verlag, Berlin. [ 1291 Tagungsband Ergebnisunsicherheit von Priifungen und Analysen, Eurolab Deutschland, M. Golze, Unter den Eichen 87, 12205 Berlin. [ 1301 Guide to the Expression of Uncertainty in Measurement. ISO, Genf 1993 (ISBN 92-67-10188-9).
Literutur
499
[ 1311 Quantifying Uncertainty in Analytical Measurement. Eurachem 1996, s. auch unter
Literatur, ,,MeBunsicherheit", Anhang A 8.
[ 1321 M. Buzoianu, Y. Aboul-Enein Hassan, Accred Qual Assur (1997) 2: 11-17. [ 1331 A. Henrion, G. Dube, W. Richter, Fres. J. Anal. Chem. 358 (1997), 506.
[134] R. Staal, Seminar on SPC, Berlin, 1996. [ 1351 J. P. Blasing (Hrsg.), Handbuch der statistischen Qualitatskontrolle, Ges. f. Management u. Technologie, Munchen 1989. [ 1361 D. Wheeler, D. S. Chambers, Understanding Statistical Process Control, Statistical
Process Control Inc. Keith Press, Knoxville, Tennessee, USA, 1986.
[ 1371 R. Staal andV. Buch, TQM-Leitfaden fur Produktions- und Verfahrenstechnik, Sprin[ 1381 [ 1391 [ 1401 [ 1411 [ 1421
ger Verlag, Heidelberg. Statgraphics von Mangulistics. M. Rosslin, Accred Qual Assur (2000),5: 88-94. S. Noack, Accred Qual Assur (1998), 3: 436. V. R. Meyer, personliche Mitteilung. V. Barwick, S. Elbson, Accred Qual Assur (2000), 5: 47-53.
Handbuch Validierung in der Analytik Stavros Kromidas Copvriaht 0 2000 WILEY-VCH Verlaa GmbH
Sachwortregister A Ableitungschromatographie 130 Achsenabschnitt 147 aquidistant 145 Analysenfunktion 212 Anwendbarkeit 102, 10.5 Arbeitsbereich 147, 195 Asymmetriefaktor 128 - Abhangigkeit von der Peakhohe Aufstockungsexperimente 185 AusreiBertests 60
B
Ergebnisunsicherheit 16, 87 ff., 424 Definition 16 - Schatzung der 23 ff. -
F F-Test 65 129
Bartlett-Test 150 Basisvalidierung 308 BestimmtheitsmaB 150 Bestimmungsgrenze 187 ff. Beurteilung von Zahlen und Zahlenreihen 97 - Tests 97 Blindwert; positiver, negativer 146
C Charakterisierung 12, 27 analytischer Methoden 17 ff. Definition 12 chemische Verschiebung 242 Cochran-Test 67 D Datenanalyse, multivariate David-Test 48 Differenz-t-Test 83 Dixon-Test 6 1 Doerffel-Test 79 E Eichen 13 Einpunktkalibrierung 346 Elementbilanzierung 86 Entscheidungsgrenze 189 Erfassungsgrenze I87 ff.
302
G Genauigkeit 47 - graphische Darstellung 47 Geratequalifizierung 34 ff., 39 - design qualification, DQ 35 - equipment qualification, EQ 36 - funktionale Qualifizierung, OQ 36 - funktionale Spezifikation 35 - Installationsqualifizierung, IQ 36 - Leistungsqualifizierung, PQ 37 gewichtete lineare Regression 179 ff. Grubbs-Test 62 H Henning-Test 63 Horwitz-Tabelle 73 HPLC-Parameter 1 14 - Anderung der Zeitkonstante 114 - gegenseitige Beeinflussung 115 I ICH-Guidelines 320 ICH-Richtlinien 320, 325
J
Justieren
13
K Kalibrationssatz 303 Kalibrieren 1 3 Kalibrierfunktion 134, 2 12 Kalibrierung FlieRscherna zur 157 - und Linearitat 160 Kalibrierwertmethode 190
502
Suchwortregister
Kopplung 119 Chroniatographie - Spektroskopie Korrelationsanalyse 134 Korrelationskoeffizient 147 ff.
-
P
I2 I
Prazision 46 ff. graphische Darstellung 47 Laborprazision 49 MeBprazision 51 Methodenprazision 5 1 Vergleichsprazision 49 Wiederholprazision 49 Produkt-Lebenszyklus 38 Prognoseintervall 144 Proportionalitat 135 ProzeBfahigkeit 195 ff., 202 Prufen 13 Prufmitteluberwachung cines Titrationsgerates 273 -
L Leerwertmethode 190 Linearitat I33 ff. Beispiel zur Prufung auf Kriterien fur 176 Prufung 177 f. Linearitatstest 136 Durchfuhrung 136 Linienuberlagemngen 246
163
Q
M Mandeltest 139 Massenbilanzen 86 Matrixeffekt 145 Messen 13 MeBergebnisunscharfc 308 MeBtechnik 14 Grundbegriffe 14 MeRunsicherheit 16, 87 ff. Mefiunsicherheitsabschatzung 426 MeRwertreihe 69 Tests zur Bewertung 69 Vcrgleichbarkeit 231 MeBwertunsicherheit 308 Methodenfahigkeit 186 ff. korrigierter Methodenfahigkeitsindex I98 Methodenfahigkeitsindex 196 - Spezifikationsgrenze und Methodenfahigkeit 200 ff. Methodenrobustheit 102 Methodenvalidierung 36 Prufpunkte 44 Methodenvergleich 85 Prufung auf Richtigkeit 85 mikrobiologische lntegritatsprufung 259 Modultest 293
N Nachweisgrenzc 187 ff. Neumann, Trendtest nach Normalisierung 346
64
Qualifikation 1 1 Qualifizierung 1 1, 27 Mikrotiterplattenphotometer Qualitatssicherung 3 ff. Begriffe 3 ff., 444
262
R Referenzmaterialien fur die Massenspektroskopie 240 fur die UV-Spektroskopie 240 Referenzstandard 78 Regression I34 relative Verfahrensstandardabweichung 15 1 Residualanalyse 140 Residuen 138 graphische Darstellung 140 Reste 138 Reststandardabweichung 139 Retentionszeit 128 Vergleich 234 Revalidierung 207, 357, 364 Richtigkeit 77 ff. graphische Darstellung 47 Schema zur Uberprufung der 100 Robustheit 101 ff. ,,robustness" 101 ,,ruggedness" 10 1 charakteristische Parameter zur Prufung auf 109 Robustheit in der HPLC 110 ff. okonomische Uberprufung 115 Uberprufung I13 -
~
Suchwortregister Robustheitstests 107 ff. - zeitlicher Ablauf 107 ff.
-
S Selektivitat 116 ff., 332 inderHPLC 117ff. Prufung auf, bekannte Proben 117 Prufung auf, unbekannte Proben 1 18 Uberprufung 132 Selektivitat in der HPLC 126 - Uberprufung 126 Sensitivitatsplot 176 Sollwert-t-Test 78 Spezifikationsgrenze 5 I Spezifitat 116, 332 statistische ProzeRkontrolle 405, 436 statistische Regeln 410 Stochastisch unabhangige Prozesse 56 Storungen spektrale und nicht apektrale 250 Student (t-Test)-Test 78 Systemeignungstest 37, 356 - ,,V"-Modell 37 ff. Systemtest 37, 293 -
T Tailing 127 Ursachen
128
U Uberjustierung 4 18 Ungenauigkeit 309 Unprazision 309 Unrichtigkeit 309 Unsicherheitsquelle 87 Untergrundermittlung 25 1
w
V Validation-Master-Plan (VMP) Validierung 4 Ablaufscherna 367
Begriffe 444 Definitionen 4 ff. Dokumentation 328 - Fehler 223 genormter Verfahren 8 Grundsatze 1 Grundvoraussetzungen 15, 3 1 - prospektive 208 retrospektive 208 Umfang 367 von Anwendungsprogrammen 296 von Macros 298 - von Software 218 Validierungsbericht 33 Validierungshierarchie 3 I8 Validierungskosten 384 Validierungsparameter, Uberblick der 44 Zusammenhang 197 Validierungsplan der Sterilitftsprufung 254 - fur mikrobiologische Dichtigkeitspriifungen 257 Validierungsprozedur 2 Ablauf 2 Validierungssatz 303 Variabilitat - des MeRverfahrens 41 3 des Prozesses 413 Varianzhomogenitat, Test auf 66 Verfahrensstabilitat 102 f. Verfahrensstandardabweichung 150 Verifizierung 1 1 - von Chromatographiesoftware 296
35
Wiederfindung 184 Wiederfindungsrate I84 Ermittlung 185 Richtwerte 187 Wiederholgrenze 65 Wilcoxon-Test 80
503