Title:
Prognostische Marker für die Vorhersage des fünfjährigen progressionsfreien Überlebens von Patienten mit Kolonkarzinomen basierend auf Expressionsprofilen von biologischen Proben
Kind Code:
A1


Abstract:

Die Erfindung betrifft die Verwendung von Genexpressionsprofilen zur Vorhersage des fünfjährigen progressions- bzw. rezidivfreien Überlebens von Patienten, denen ein kolorektales Karzinom im UICC Stadium I oder II entfernt wurde.




Inventors:
Hinzmann, Bernd, Dr. (Berlin, 13127, DE)
Clevert, Djörk-Arné (Berlin, 10437, DE)
Adams, Hans-Peter, Dr. (Potsdam, 14469, DE)
Mayr, (Dr., 10435 Berlin, DE)
Application Number:
DE102006035392
Publication Date:
10/16/2008
Filing Date:
11/02/2006
Assignee:
Signature Diagnostics AG (Potsdam, 14469, DE)
International Classes:



Foreign References:
5445934
5532128
5556752
5242974
5384261
5405783
5412087
5424186
5429807
5436327
5472672
5527681
5529756
5545331
5554501
5561071
5571639
5593839
5599695
5624711
5658734
5700637
Other References:
Hawkins et al. (2002) Gastroenterology 122: 1376-1387
Noura et al. (2002) J Clin Oncol 20: 4232
Zhou et al. (2002) Lancet 359: 219-225
Eschrich et al. (2005) J Clin Oncol. 2005 May 20; 23(15): 3526-35
W. R. Pearson (1990) Rapid and Sensitive Sequence Comparison with FASTP and FASTA Methods in Enzymology 183: 63-98.
Hochreiter (2006), Bioinformatics 22(8): 943-9
Efron (1979) Bootstrap Methods - Another Look at the Jackknifing, Ann. Statist. 7, 1-6
Birkenkamp-Demtroder K, Christensen LL, Olesen SH, et al. Gene expression in colorectal cancer. Cancer Res 2002; 62: 4352-63
Hochreiter et al. (2006), Bioinformatics 22(8): 943-9
Efron (1979) Bootstrap Methods - Another Look at the Jackknifing, Ann. Statist. 7, 1-6
Claims:
1. Verfahren zur Vorhersage der Wahrscheinlichkeit des Auftretens von Rezidiven eines kolorektalen Karzinoms oder von Metastasen in entfernten Organen innerhalb der ersten fünf Jahre in Patienten, deren primärer Tumor chirurgisch entfernt wurde, umfassend die Bestimmung eines Genexpressionsprofils von 29 Markergenen (wie dargestellt in SEQ ID NOs: 1 bis 29) oder einer Auswahl daraus.

2. Verfahren nach Anspruch 1, bei dem das Expressionsprofil der Markergene mit einem Referenzmuster verglichen wird, welches indikativ für ein Wiederauftreten des Kolonkarzinoms eines Patienten ist

3. Verfahren nach Anspruch 2, wobei der Vergleich der Expessionsprofile mit einem Verfahren zur Mustererkennung durchgeführt wird.

4. Verfahren nach Anspruche 3, bei dem die Mustererkennungsmethode aus einem zweifach geschachtelten Bootstrap-Ansatz in Kombination mit einer Decision-Tree-Analyse für Bestimmung der Einzelrelevanz der Gene besteht.

5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem ein primäres Kolonkarzinom untersucht wird.

6. Verfahren nach einem der Ansprüche 1 bis 5, bei dem ein primäres Kolonkarzinom der Stadien UICC-I oder UICC-II untersucht wird.

7. Verfahren nach einem der Ansprüche 1 bis 6, bei dem das Expressionsprofil von Markergenen, wie definiert in den SEQ ID NOs: 1 bis 10 oder beliebigen, minimal zwei Gene enthaltenen Kombinationen, bestimmt wird.

8. Verfahren nach einem der Ansprüche 1 bis 6 bei dem das Expressionsprofil von mindestens zwei Genen von sieben Markergenen, wie definiert in den SEQ ID NOs 1 bis 7, oder anderen beliebigen Kombinationen daraus bestimmt wird.

9. Verfahren nach einem der Ansprüche 1 bis 8, bei dem die Bestimmung des Expressionsprofils die Bestimmung mindestens eines Markergens umfasst, das mindestens 90% Identität zu einem der in SEQ ID NO: 1 bis 29 dargestellten Markergene ist.

10. Verfahren nach einem der Ansprüche 1 bis 9, wobei das Expressionsprofil der Markergene aus einer Probe des Patienten gewonnen wird.

11. Verfahren nach Anspruch 10, wobei das Expressionsprofil der Markergene durch die Messung der Quantität an Markergen-mRNA bestimmt wird.

12. Das prognostische Portfolio bestehend aus den Genen mit den Nukleinsäuresequenzen SEQ ID NO 1 bis SEQ ID NO 29, ihren reverskomplementären Sequenzen oder Teilen dieser Sequenzen oder Kombinationen daraus, welche geeignet sind, die differentielle Expression der im Portfolio enthaltenen Sequenzen zu detektieren.

13. Ein cDNA oder Oligonukleotid-Mikroarray welches Sequenzen gemäß Anspruch 12 enthält.

14. Ein Kit zur Bestimmung der Wahrscheinlichkeit des Auftretens von Rezidiven oder Metastasen in entfernten Organen eines Patienten mit Darmkrebs, welches Material zur Detektion von Nukleinsäuresequenzen gemäß Anspruch 12 enthält.

15. Ein Kit zur Bestimmung der Wahrscheinlichkeit des Auftretens von Rezidiven oder Metastasen in entfernten Organen eines Patienten mit Darmkrebs, welches Material zur Detektion von Nukleinsäuresequenzen gemäß Anspruch 12 unter Anderem ein Mikroarray gemäß Anspruch 13 enthält.

16. Ein Kit gemäß Anspruch 15 welcher die Genexpression der Gene mit den SEQ ID NOs 1 bis 10 nachweist.

17. Ein Kit gemäß Anspruch 15 welcher die Genexpression der Gene mit den SEQ ID NOs 1 bis 7 nachweist.

18. Verfahren nach Anspruch 10, wobei die Quantität von Markergen-mRNA mittels Genchiptechnologie, (RT-)PCR, Northern Hybridisierung, Dot-Blotting oder in situ Hybridisierung bestimmt wird.

19. Hilfsmittel zur Erfassung des Zustandes eines Kolokarzinoms welche Materialien zur Identifizierung von Nukleinsäuren gemäß Anspruch 12 enthalten.

Description:
Zusammenfassung der Erfindung

Die Erfindung umfasst ein Verfahren zur Vorhersage (Prädiktion) der Wahrscheinlichkeit der Wiederkehr bzw. der Progression von Darmkrebs innerhalb der ersten fünf Jahre in Patienten, die mit Darmkrebs im UICC Stadium I und II diagnostiziert wurden und deren primärer Tumor chirurgisch vollständig (R0) entfernt (resiziert) wurde. Das erfindungsgemäße Verfahren beinhaltet die Bestimmung und Analyse des Expressionsprofiles von 29 oder weniger Markergenen in einer Gewebeprobe des bei der Operation entfernten primären Tumors des Patienten. Mit Hilfe des Verfahrens wird das Potential eines primären Kolonkarzinoms zur späteren Ausbildung eines Zweittumors bzw. von Tochtergeschwülsten (Metastasen) in entfernten Organen innerhalb der ersten fünf Jahre nach der chirurgischen Resektion des primären Tumors bestimmt. Das Verfahren erlaubt, anders ausgedrückt, die Vorhersage der fünfjährigen progressionfreien Überlebenswahrscheinlichkeit von Kolonkrebspatienten durch Bestimmung eines Genexpressionsprofils von 29 Markergenen oder einer Auswahl daraus sowie der sich anschließenden bioinformatischen Auswertung. Die 29 Gene sind durch ihre Sequenzen wie dargestellt in den SEQ ID NOs: 1 bis 29 definiert. Ein Aspekt der Erfindung betrifft ein spezifisches Genexpressionsprofil einer Untergruppe von neun Genen aus den 29 Markergenen. Ein anderer Aspekt der Erfindung betrifft ein Genexpressionprofil von sieben Genen aus den 29 Markergenen. Die Genauigkeit der Vorhersage der Wahrscheinlichkeit für die Ausbildung eines Rezidivs (Zweittumor) oder von Metastasen beträgt im Fall des Expressionsprofils aus sieben Genen 80%. Ebenfalls offenbart werden Kits zur Durchführung des erfinderischen Verfahrens und diagnostische Kits. Weitere Ausführungsformen der Erfindung betreffen die Verwendung der hierin offenbarten Markergene und/oder der hierin offenbarten Kombinationen von Markergenen.

Hintergrund der Erfindung und Stand der Technik

Darmkrebs, auch als kolorektales Karzinom bezeichnet, stellt die dritthäufigste Tumorentität in westlichen Ländern dar. In Deutschland erkranken jedes Jahr etwa 66.000 Patienten an Darmkrebs. Das kolorektale Karzinom ist eine heterogene Krankheit mit komplexer Ursache. Darmkrebspatienten werden aufgrund von histopathologischen und klinischen Kriterien in vier klinische Stadien, UICC I-IV, eingeteilt. Die TNM-Klassifikation ist weit verbreitet und wird neben anderen Parametern verwendet, um die Patienten in die vier klinischen Stadien einzuteilen.

Patienten mit Darmkrebs im Stadium I haben in der Regel einen TNM-Status von T1/2N0M0. Bei diesen Patienten sind keine regionalen Lymphknoten mit Metastasen befallen (N = 0) und es sind auch keine Metastasen in entfernten Organen festgestellt und histologisch gesichert worden (M = 0).

Patienten mit Darmkrebs im Stadium II haben einen TNM-Status von T3,4N0M0. Obwohl der Primärtumor deutlich größer ist als im Stadium I und auch bereits die Darmwand durchdrungen hat, sind bei diesen Patienten keine Metastasen in den regionalen Lymphknoten und keine Metastasen in anderen Organen festgestellt worden.

Etwa die Hälfte aller Patienten, in Deutschland etwa 33.000 Patienten, haben Darmkrebs im Stadium I und II. Die chirurgische Resektion von Tumoren in den klinischen Stadien I und II ist sehr effektiv und führt zu Heilungsraten von 95% im UICC Stadium I und 75% im Stadium II. Jedoch kommt es innerhalb von 5 Jahren nach der operativen Entfernung des Primärtumors bei etwa 10% der Darmkrebspatienten im Stadium I und bei 20–30% der Darmkrebspatienten im Stadium II zu einer Wiederkehr der Erkrankung in Form der Bildung von Zweittumoren im Darm oder von Metastasen in entfernten Organen, hauptsächlich in der Leber aber auch in der Lunge.

Patienten im Stadium III haben einen TNM-Status T1-4N1-2M0. Für Patienten im Stadium III ist typisch, dass regionale Lymphknoten bereits mit Metastasen befallen sind, jedoch keine Metastasen in entfernten Organen festgestellt wurden. Das Vorhandensein von befallenen Lymphknoten im UICC Stadium III erhöht die Wahrscheinlichkeit der Wiederkehr der Erkrankung bzw. der Bildung von Metastasen in anderen Organen. Etwa 60% der Patienten im Stadium III müssen mit Rezidiven und Metastasen innerhalb von fünf Jahren nach der chirurgischen Entfernung des Primärtumors rechnen. Aufgrund dieser hohen Rezidivrate bekommen Patienten im Stadium III nach den Richtlinien der deutschen Krebsgesellschaft in der Regel eine begleitende (adjuvante) Chemotherapie. In der Regel werden 5-Fluoruracil und Leucovorin oder Oxaliplatin, 5-Fluoruracil und Leucovorin verabreicht. Die adjuvante Chemotherapie verringert das Auftreten von Rezidiven um etwa 10–20%, so dass in der Regel nur etwa 40–50% der Stadium III Patienten nach Operation und adjuvanter Chemotherapie innerhalb der ersten 5 Jahre ein Rezidiv erleiden.

Darmkrebspatienten, bei denen bereits Metastasen in entfernten Organen festgestellt und histologisch gesichert wurden, sind im klinischen Stadium IV und haben nur eine relativ geringe 5-Jahresüberlebenswahrscheinlichkeit. In Deutschland betrifft dies etwa 20.000 Patienten. Bei diesen Patienten treten synchron oder metachron Lungen- oder Lebermetastasen auf. Bei etwa ca. 4.000 der Patienten im Stadium IV sind eine Entfernung des primären Tumors und eine kurative Metastasenresektion (RO) technisch möglich, die mit einer 5-Jahres-Überlebensrate von ca. 30% einhergeht. Bei den übrigen 16.000 Patienten im Stadium IV ist aus verschiedensten Gründen (multinodulär, ungünstige Lokalisation der Metastasen an Gefäßen und Gallengängen, extrahepatisch eine Resektion nicht möglich. In diesen Fällen sind palliative Therapieoptionen indiziert. Ziel der palliativen chemotherapeutischen Behandlung ist neben der Aufrechterhaltung einer guten Lebensqualität die Verlängerung der Überlebenszeit.

Es gibt eine Reihe von Problemen bei der Klassifikation und Stadiumeinteilung der Darmkrebspatienten. Die Einteilung von Patienten in das Stadium I und II ist nicht genau. Etwa 10% der Stadium I Patienten und etwa 25% der Stadium II Patienten erleiden innerhalb von 5 Jahren, die Mehrzahl bereits innerhalb von zwei Jahren nach operativer Entfernung des Primärtumors ein Rezidiv. Allein in Deutschland betrifft dies etwa 6000–8000 Patienten jährlich. Es gibt keine Möglichkeit, die Patienten mit hoher Rezidivwahrscheinlichkeit aus der homogen erscheinenden Gruppe herauszufinden. Seit längerer Zeit wird in Fachkreisen darüber diskutiert, ob man Patienten im Stadium II grundsätzlich eine begleitende (adjuvante) Chemotherapie verabreicht. Wegen der relativ geringen Rezidivwahrscheinlichkeit von 25% bei Stadium II Patienten ist der Nutzen einer solchen Therapie im Voraus nur schwer zu bestimmen und bleibt deshalb kontrovers diskutiert. Ungefähr 75% aller Patienten im Stadium II würden von einer adjuvanten Chemotherapie nicht profitieren. Die Kosten wären enorm hoch.

Basierend auf prädiktiven Markern könnte eine individuelle Therapieentscheidung gefällt werden. In diesem Zusammenhang gab es viele Versuche, neue Marker zu finden, welche Patienten mit erhöhtem Progressionsrisiko identifizieren. Hawkins et al. (2002) Gastroenterology 122: 1376-1387 untersuchten in diesem Zusammenhang Mikrosatelliteninstabilität und Promotermethylierung. Noura et al. (2002) J Clin Oncol 20: 4232 – benutzten einen RT-PCR basierten Nachweis von Lymphknotenmikrometastasen. Zhou et al. (2002) Lancet 359: 219-225 untersuchten Allelungleichgewichte, um Rezidive in Kolonkarzinomen vorher sagen zu können. Eschrich et al. (2005) J Clin Oncol. 2005 May 20; 23(15): 3526-35 benutzten cDNA Microarrays, um die Überlebenswahrscheinlichkeit von Kolon-Krebspatienten vorherzusagen.

Allen in der Literatur untersuchten Markern ist gemeinsam, dass sie bisher nicht als Grundlage prognostischer Assays in der klinischen Praxis angewendet werden, da sie nicht unabhängig validiert sind. Eine mögliche Ursache dafür könnte darin liegen, dass die Progression und Metastasierung des Kolonkarzinoms eine Folge verschiedenster genetischer Ereignisse ist, welche innerhalb des malignen Epithels stattfinden, oder durch modifizierende Ereignisse des umgebenden stromalen Gewebes induziert werden.. Um die potentielle Komplexität des Fortschreitens der Erkrankung verstehen zu können, bedarf es einer umfassenderen Analyse der zu Grunde liegenden molekularen Ereignisse.

Technisches Problem der Erfindung

Das der Erfindung zugrunde liegende technische Problem besteht in der Bereitstellung einer verlässlichen Diagnostik, die zu verbesserten individuellen Therapien führen kann.

Das technische Problem ist durch die Bereitstellung der hierin offenbarten Ausführungsformen und im Besonderen durch die die Erfindung charakterisierenden Ansprüche gelöst. Die Erfindung umfasst daher ein Verfahren zur Vorhersage der Wahrscheinlichkeit eines Rezidivs (Zweittumtor, Metastasen in entfernten Organen) innerhalb der ersten fünf Jahre nach der chirurgischen Entfernung der primären Tumoren von Darmkrebspatienten im UICC Stadium I und II.

Die Erfindung bezieht sich auf die Bestimmumg von Expressionsprofilen bestimmter Gene, die bei Karzinomen insbesondere gastro-intestinalen und besonders bevorzugt bei primären kolorektalen Karzinomen von Bedeutung sind. In diesem Zusammenhang lehrt die Erfindung ein Testsystem zur (in vitro) Detektion des Progressionsrisikos eines vorstehend genannten Karzinoms, enthaltend eine Methode zur quantitativen Messung des Expressionsprofils bestimmter Markergene in bestimmten Tumorgewebeproben sowie bioinformatische Auswertemethoden, um daraus die Wahrscheinlichkeit der Bildung von Rezidiven (Zweittumore und Metastasen) für einen Patienten zu berechnen, bei welchem ein Kolonkarzinom diagnostiziert oder behandelt wird. Die 29 Markergene der Erfindung sind insbesondere in der Tabelle 1 definiert und werden durch ihre entsprechenden Sequenzen oder weitere synonyme Identifikatoren in der Tabelle charakterisiert. Dabei handelt es sich um: ME2 (malic enzyme 2, NAD(+)-dependent, mitochondrial) [Affymetrix Nummer 210154_at] SEQ_ID_1, CXCL13 (chemokine (C-X-C motif) ligand 13 (B-cell chemoattractant)) [Affymetrix Nummer 205242_at] SEQ_ID_2, SLC25A11 (solute carrier family 25 (mitochondrial carrier) [Affymetrix Nummer 207088_s_at] SEQ_ID_3, FAS (Fas (TNF receptor superfamily, member 6)) [Affymetrix Nummer 215719_x_at] SEQ_ID_4, TOMM20 (translocase of outer mitochondrial membrane 20 homolog (yeast)) [Affymetrix Nummer 212773_s_at] SEQ_ID_5, CXCL10 (chemokine (C-X-C motif) ligand 10) [Affymetrix Nummer 204533_at] SEQ_ID_6, FLJ10986 (NA) [Affymetrix Nummer 219718_at] SEQ_ID_7, KIFAP3 (kinesin-associated Protein 3) [Affymetrix Nummer 203333_at] SEQ_ID_8, AGPAT5 (1-acylglycerol-3-Phosphate O-acyltransferase 5 (lysophosphatidic acid acyltransferase, epsilon)) [Affymetrix Nummer 218096_at] SEQ_ID_9, NA (NA) [Affymetrix Nummer AFFX-r2-Hs18SrRNA-5_at] SEQ_ID_10, PAM (peptidylglycine alpha-amidating monooxygenase) [Affymetrix Nummer 202336_s_at] SEQ_ID_11, IFT20 (intraflagellar transport 20 homolog (Chlamydomonas)) [Affymetrix Nummer 210312_s_at] SEQ_ID_12, SLC25A11 (solute carrier family 25 (mitochondrial carrier) [Affymetrix Nummer 209003_at] SEQ_ID_13, HNRPD (heterogeneous nuclear ribonucleoprotein D (AU-rich element RNA binding Protein 1, 37kDa)) [Affymetrix Nummer 221481_x_at] SEQ_ID_14, CXCL9 (chemokine (C-X-C motif) ligand 9) [Affymetrix Nummer 203915_at] SEQ_ID_15, GMFB (glia maturation factor, beta) [Affymetrix Nummer 202543_s_at] SEQ_ID_16, PAM (peptidylglycine alpha-amidating monooxygenase) [Affymetrix Nummer 212958_x_at] SEQ_ID_17, CD7 (CD7 antigen (p41)) [Affymetrix Nummer 214551_s_at] SEQ_ID_18, HADHSC (L-3-hydroxyacyl-Coenzyme A dehydrogenase, short chain) [Affymetrix Nummer 201036_s_at] SEQ_ID_19, CDC42BPA (CDC42 binding Protein kinase alpha (DMPK-like)) [Affymetrix Nummer 214464_at] SEQ_ID_20, MRC1 (mannose receptor, C type 1) [Affymetrix Nummer 204438_at] SEQ_ID_21, ME2 (malic enzyme 2, NAD(+)-dependent, mitochondrial) [Affymetrix Nummer 209397_at] SEQ_ID_22, STAT1 (signal transducer and activator of transcription 1, 91kDa) [Affymetrix Nummer AFFX-HUMISGF3A/M97935_MB_at] SEQ_ID_23, HIST1H2BG (histone 1, H2bg) [Affymetrix Nummer 210387_at] SEQ_ID_24, WARS (tryptophanyl-tRNA synthetase) [Affymetrix Nummer 200628_s_at] SEQ_ID_25, EIF4A1 (eukaryotic translation initiation factor 4A, isoform 1) [Affymetrix Nummer 201530_x_at] SEQ_ID_26, RPL36A (ribosomal Protein L36a) [Affymetrix Nummer 201406_at] SEQ_ID_27, H2AFX (H2A histone family, member X) [Affymetrix Nummer 205436_s_at] SEQ_ID_28, COX5A (cytochrome c oxidase subunit Va) [Affymetrix Nummer 203663_s_at] SEQ_ID_29.

Die Vorhersage (Prädiktion) von Zweittumoren und Metastasen eines primären kolorektalen Karzinoms ist für den Kliniker von besonderer Relevanz, da es die weitere Behandlung des Patienten entscheidend beeinflussen kann. Finden sich keine Metastasen (weder Lymphknotenmetastasen noch Fernmetastasen) handelt es sich um das UICC Stadium I oder II. Diese Tumore werden, wenn es Kolonkarzinome sind, ausschließlich mittels Operation behandelt. Eine weitere, adjuvante Chemotherapie ist (außerhalb klinischer Studien) nicht vorgesehen. Finden sich dagegen Lymphknotenmetastasen (UICC Stadium III), so wird gemäß den Leitlinien der Deutschen Krebsgesellschaft und anderer internationaler Gesellschaften eine postoperative adjuvante Chemotherapie gefordert. Durch die ajduvante Chemotherapie ergibt sich ein krankheitsfreies 3 Jahres Überleben der Patienten im UICC Stadium III von etwa 80%, ohne anschließende Chemotherapie liegt das 3 Jahres Überleben nur bei etwa 60%. Auch das Gesamtüberleben wird durch die adjuvanten Chemotherapie signifikant beeinflusst. Beim Rektumkarzinom ist es ebenfalls von entscheidender Bedeutung, ob bereits Lymphknotenmetastasen vorliegen. In diesen Fällen wird die präoperative Radiochemotherapie empfohlen, da sie das Auftreten von Lokalrezidiven im Rektum signifikant vermindert. Zudem können durch eine präoperative Radiochemotherapie signifikant mehr Patienten kontinenzerhaltend operiert werden, was bei diesen Patienten zu einer wesentlichen Verbesserung der postoperativen Lebensqualität beiträgt.

Im Zusammenhang mit dieser Erfindung bezeichnet der Begriff "kolorektales Karzinom" insbesondere polypoide, plateauförmige, ulzeröse und flächenhafte (szirrhöse) Formen, die histologisch in solide, schleimbildende oder drüsige Adenokarzinome, Siegelringzellenkarzinome, squamöse, adenosquamöse, kribriforme, plattenepithelartige oder undifferenzierte Karzinome entsprechend der WHO-Klassifikation typisiert werden. (Becker, Hohenberger, Junginger, Schlag. Chirurgische Onkologie. Thieme, Stuttgart 2002)

Im Zusammenhang mit der Erfindung umfasst der Begriff "Genexpressionsprofil" sowohl die Bestimmung von "Expressionsprofilen", als auch der einzelnen "Expressionsniveaus" der entsprechenden Gene. Der Begriff "Expressionsniveau", als auch der Begriff "Expressionsprofil" umfasst erfindungsgemäß sowohl die Quantität des Genprodukts, als auch seine qualitative Veränderungen wie z. B. Methylierungen, Glykosylierungen, Phosphorylierungen u. s. w. Somit wird bei der Bestimmung des "Expressionsprofils" im Zusammenhang mit der Erfindung im Wesentlichen auf die Quantität der entsprechenden Genprodukte (RNA/Protein) geachtet. Das Expressionsniveau wird gegebenenfalls mit dem anderer Individuen verglichen. Entsprechende Ausführungsbeispiele sind im experimentellen Teil belegt und auch insbesondere in den Tabellen dargestellt.

Die Bestimmung der Expressionsprofile der hierin dargestellten Gene (Genabschnitte) wird insbesondere in Geweben und/oder einzelnen Zellen des Gewebes durchgeführt. Verfahren zur Bestimmung des Expressionsprofils umfassen daher (im Sinne dieser Erfindung) z. B. in situ-Hybridisierungen, PCR basierte Methoden (z. B. Taqman) oder Mikroarray basierte Verfahren (siehe auch experimenteller Teil der Erfindung).

In einer besonderen Ausführungsform umfasst die Erfindung das oben genannte Verfahren, wobei das Expressionsprofil von mindestens einem oder beliebigen Kombinationen der 29 Markergene, die durch SEQ ID NO 1 bis SEQ ID NO 29 eindeutig beschrieben sind, bestimmt wird.

In einer weiteren bevorzugten Ausführungsform umfasst die Erfindung das oben genannte Verfahren, wobei das Expressionsprofil von einer beliebigen Kombinationen aus dem Subset von zehn Markergenen, wie in SEQ ID NO 1 bis SEQ ID NO 10 dargestellt, bestimmt wird.

In einer weiteren besonders bevorzugten Ausführungsform umfasst die Erfindung das oben genannte Verfahren, wobei das Expressionsprofil von einer beliebigen Kombinationen aus dem Subset der sieben Markergene, wie in SEQ ID NO 1 bis SEQ ID NO 7 dargestellt, bestimmt wird.

Wie im Weiteren definiert wird, umfasst der Begriff Markergene im Sinne dieser Erfindung nicht nur die spezifischen Gensequenzen (oder die entsprechenden Genprodukte) wie in den spezifischen Nucleotidsequenzen dargestellt, sondern auch Gensequenzen, die eine hohe Homologie zu diesen Sequenzen aufweisen. Weiterhin sind die revers-komplementären Sequenzen der definierten Markergene eingeschlossen. Hochhomologe Sequenzen umfassen Sequenzen, die mindestens 80%, vorzugsweise mindestens 90%, am meisten bevorzugt mindestens 95% homolog zu den in den SEQ ID NOS: 1 bis 29 dargestellten Sequenzen sind.

Im Kontext dieser Erfindung umfassen solche hochhomologen Sequenzen auch Sequenzen, die Genprodukte (z. B. RNA oder Proteine) codieren, welche zumindest 80% identisch zu den definierten Genprodukten der SEQ ID NOS: 1 bis 29 sind. Der Begriff Markergen im Zusammenhang mit dieser Erfindung umfasst erfindungsgemäß ein Gen oder einen Genabschnitt, der mindestens 90% homolog, mehr bevorzugt mindestens 95% homolog, mehr bevorzugt mindestens 98% homolog, am meisten bevorzugt mindestens 100% homolog zu den in den SEQ ID NO 1 bis SEQ ID NO 29 dargestellten Sequenzen in Form von Desoxyribonnukleotiden oder entsprechenden Ribonunkleotiden bzw. den daraus abgeleiteten Proteinen ist.

Unter einem aus den 29 Markergenen (definiert in den SEQ ID NOs 1 bis 29, in Tabelle 1) abgeleiteten Proteinen wird in dieser Erfindung erfindungsgemäß ein Protein, ein Proteinfragment oder ein Polypeptid verstanden, das im nativen Leserahmen (in frame) translatiert wurde.

Die Sequenzidentität kann konventionell durch Verwendung von Computerprogrammen wie z. B. dem FASTA-Programm (W. R. Pearson (1990) Rapid and Sensitive Sequence Comparison with FASTP and FASTA Methods in Enzymology 183: 63-98.), download z. B. als Service des EBI in Hinxton, bestimmt werden. Bei der Anwendung von FASTA oder einem anderen Sequenz-Alignment-Programm zur Bestimmung, ob eine bestimmte Sequenz beispielsweise zu 95% identisch ist mit einer Referenzsequenz der vorliegenden Erfindung, werden die Parameter vorzugsweise so eingestellt, dass der Prozentanteil der Identität über die gesamte Länge der Referenzsequenz berechnet wird und dass Homologielücken (so genannte gaps) von bis zu 5% der Gesamtzahl der Nukleotide in der Referenzsequenz erlaubt sind. Wichtige Programmparameter wie z. B. GAP PENALTIES und KTUP werden auf dem Standardwerten belassen.

In einer besonderen Ausführungsform können die entsprechenden Markergene nicht nur in Tumor- sondern auch in anderen biologischen Proben, wie z. B. im Blut, Blutserum, Stuhl oder anderen Körperflüssigkeiten (Bauchhöhlen-Ascites, Lymphflüssigkeit) bestimmt werden. Dementsprechend ist die vorliegende Erfindung nicht limitiert auf die Untersuchung von gefrorenem oder frischem Tumorgewebe. Die erfindungsgemäßen Ergebnisse können ebenfalls durch die Untersuchung von fixiertem Tumorgewebe zum Beispiel Paraffinmaterial, erhalten werden. In fixiertem Material werden insbesondere auch vorzugsweise andere Detektionsverfahren zum Nachweis der Gene/Genexpressionsprodukte genutzt, z. B. RNA spezifische Primer im Rahmen einer real-time PCR.

Wie auch in den Ausführungsbeispielen der Erfindung dargestellt, wird das Expressionsprofil der hier offenbarten 29 Markergene (oder einer Auswahl daraus), vorzugsweise, durch die Messung der Quantität der mRNA der Markergene bestimmt. Diese Quantität der mRNA der Markergene kann z. B. mittels Genchiptechnologie, (RT-)PCR (zum Beispiel auch an fixiertem Material), Northern Hybridisierung, Dot-Blotting oder in situ Hybridisierung bestimmt werden. Weiterhin kann das erfinderische Verfahren auch durchgeführt werden, indem der Fachmann die Genprodukte auf Protein- oder Peptidebene misst. Somit umfasst die Erfindung auch die hier beschriebenen Verfahren, bei denen die Genexpressionsprodukte in Form ihrer synthetisierten Proteine (oder Peptide) bestimmt werden. Hierbei kann sowohl die Quantität, als auch die Qualität (z. B. Modifikationen, wie Phosphorylierungen oder Glycosylierungen) bestimmt werden. Vorzugsweise wird in diesem Zusammenhang jedoch das Expressionsprofil der Markergene durch die Messung der Polypeptidquantität der Markergene bestimmt und, falls gewünscht, mit einem Referenzwert der jeweiligen Vergleichsprobe(n) verglichen. Die Polypeptidquantität der Markergene kann durch ELISA, RIA, (Immuno-)Blotting, FACS oder immunhistochemische Methoden bestimmt werden.

Die in der vorliegenden Erfindung besonders vorzugsweise verwendete Mikroarray Technologie erlaubt die gleichzeitige Messung des mRNA Expressionsniveaus von vielen Tausend Genen und stellt somit ein wichtiges Hilfsmittel dar, um differentielle Expression zwischen zwei biologischen Proben oder Gruppen von biologischen Proben zu bestimmen. Analysen können aber auch, wie dem Fachmann bekannt, durch einzelne reverse Transkriptase-PCR, kompetetive PCR, „real time PCR", „differential display RT-PCR, Northern.Blot-Analyse und andere verwandte Verfahren durchgeführt werden.

Am Besten ist es jedoch, die komplementäre DNA (cDNA) bzw. komplementäre RNA (cRNA), welche ausgehend von der zu untersuchenden RNA produziert wird, mit Hilfe von Mikroarrays zu untersuchen. Eine große Zahl von verschiedenen Arrays sowie deren Herstellung sind dem Fachmann bekannt und beispielsweise in den US Patenten 5,445,934; 5,532,128; 5,556,752; 5,242,974; 5,384,261; 5,405,783; 5,412,087; 5,424,186; 5,429,807; 5,436,327; 5,472,672; 5,527,681; 5,529,756; 5,545331; 5,554,501; 5,561,071; 5,571,639; 5,593,839; 5,599,695;5,624,711; 5,658,734; und 5,700,637 dargestellt.

In einer weiteren Ausführungsform umfasst die Erfindung die wohl definierte Abfolge von Analysenschritten welche letztendlich zur Entdeckung Markergensignaturen führt, mit denen die Test- von der Kontrollgruppe unterscheidenden werden kann. Diese bisher in dieser Form noch nicht beschriebene Methode setzt sich wie in den Ausführungsbeispielen detaillierter beschrieben und in skizziert wie folgt zusammen:
Die Rohdaten der Biochips werden zunächst mit FARMS wie von von Hochreiter (2006), Bioinformatics 22(8): 943-9, gezeigt kondensiert und anschließend in einem zweifach geschachtelten Bootstrap-Ansatz, [Efron (1979) Bootstrap Methods – Another Look at the Jackknifing, Ann. Statist. 7, 1-6, in der äußeren Schleife in Test- und Trainigsdaten aufgeteilt. In der inneren Bootstrap-Schleife wird für die Trainingsdaten durch eine Decision-Tree-Analyse die Featurerelevanz aus den Daten extrahiert. Dazu werden in mehreren Bootstrap-Iterationen jeweils eine bestimmte Zahl von zu klassifizierenden Proben zufällig gezogen und der Einfluss eines Features aus dessen Beitrag zum Klassifikationsfehler ermittelt: Steigt der Fehler durch Permutieren der Werte eines Features, während die Werte aller anderen Features unverändert blieben, so wird dieses stärker gewichtet. Anhand einer Häufigkeitstabelle werden die am häufigsten gewählten Features ermittelt und für die Prognose der Testdaten durch eine Support-Vector-Machine oder anderweitige dem Fachmann bekannte Klassifikationsalgorithmen wie z. B. Kassifikations- und Regressionsbäume, Penalized Logistic Regression, Sparse Linear Discriminant Analysis, Fisher Linear Discriminant Analysis, K-Nearest Neighbors, Shrunken Centroids und Artificial Neural Networks in der äußeren Bootstrap-Schleife verwendet.

Ein Feature stellt in diesem Zusammenhang einen bestimmten Messpunkt für ein zu untersuchendes Gen dar, welches sich auf der Biochipoberfläche befindet und mit der zu untersuchenden markierten Probe hybridisiert und somit ein Intenstätssignal liefert. Die vorliegende Erfindung betrifft ebenfalls ein Kit zur Durchführung der hier beschrieben Verfahren, wobei das Kit spezifische DNA- oder RNA-Sonden, Primer (auch Primerpaare), Antikörper, Aptamere zur Bestimmung von mindestens einem der 29 Markergene, die in SEQ ID NO: 1 bis 29 dargestellt sind, oder zur Bestimmung von mindestens einem Genprodukt der 29 Markergene die von den Sequnzen in SEQ ID NO: 1 bis 29 kodiert werden, umfasst. Das Kit ist vorzugsweise ein diagnostisches Kit. Als Kit im Sinne der Erfindung wird auch ein beliebiges Mikroarray oder im Speziellen ein "Affymetrix-Genchip" bezeichnet. Das Kit kann alle oder einige der für die Durchführung des Assays benötigten Materialien sowie die erforderlichen Instruktionen enthalten.

Gegenstand der Erfindung sind auch Darstellungen der Markergensignaturen, welche für die Behandlung, die Diagnose und die Prognose der oben genannten Erkrankungen nützlich sind. Diese Genprofildarstellungen sind auf Medien reduziert, welche maschinenlesbar sind wie z. B. computerlesbare Medien (magnetische Medien, optische Medien u. s. w.). Die Gegenstände der Erfindung können CD ROMs sein, welche Computerprogramme für den Vergleich mit dem gespeicherten 29-Gen-Expressionsprofil, welches oben beschrieben wurde, enthalten. Ebenso können die erfindungsgemäßen Gegenstände digital gespeicherte Expressionsprofile enthalten, sodass diese mit Expressionsdaten von Patienten verglichen werden können. Alternativ können solche Profile in einem anderen gegenständlichem Format gespeichert werden. Eine grafische Darstellung ist beispielsweise ein solches Format.

Im Folgenden soll die Erfindung genauer auf der Basis der Sequenzen, Tabellen und Beispiele beschrieben werden, ohne darauf begrenzt zu werden.

Die Tabellen zeigen:
Tabelle 1 enthält die 29 Markergene, die in der vorliegenden Erfindung Erfindung differentiell zwischen Patienten mit und ohne Rezidiv des primär aufgetretenen Kolonkarzinoms rxpremiert sind
Tabelle 2 zeigt die Vorhersagewahrscheinlichkeit des fünfjährigen progressionsfreien Überlebens für das ausgewählte Patientenkollektiv (insgesamt 55 davon 23 mit Rezidiv) in Abhängigkeit von der verwendeten Markergenanzahl.

zeigt den Boxplot der Expressionwerte der besten 10 Gene aus der Markergenliste für die Patientengruppen mit oder ohne Rezdiv innerhalb der ersten fünf Jahre nach der Operation.

zeigt die Vorhersagewahrscheinlichkeit für das Auftreten eines Rezidivs innerhalb von fünf Jahren nach einer primären Kolonkarzinomdiagnose in Abhängigkeit von der verwendeten Markergenanzahl.

zeigt schematisch das methodische Vorgehen, welches zur Erstellung des Markergenprofils führt.

zeigt die Nukleinsäuresequenzen der 29 Markergene

Patienten und Tumor Charakterisierung

Das Patientenkollektiv für die Entwicklung der Signatur bestand aus 55 Patienten, 34 Männer und 21 Frauen, bei denen ein kolorektales Karzinom diagnostiziert wurde. Diese Patienten wurden im Zeitraum August 1988 bis Juni 1998 operiert, um das kolorektale Karzinom total zu entfernen. Das Alter der Patienten zum Zeitpunkt der Operation reichte von 33 Jahre bis 87 Jahre, das mittlere Alter betrug 63,4 Jahre. Unter den 55 entfernten Karzinomen wurden 11 als Tumore im UICC Stadium I (TNM – Klassifikation: pT1 oder pT2 und pN0 und pM0) und 44 als Tumore im UICC Stadium II klassifiziert (TNM – Klassifikation: pT3 oder pT4 und pN0 und pM0).

Die Gesamtbeobachtungszeit der Patienten, das ist die Zeit von der ersten durchgeführten Operation bis zur letzten Beobachtung eines Patienten, betrug im Mittel 11,25 Jahre, das Minimum war 6,36 Jahre, das Maximum war 16,53 Jahre. Innerhalb der ersten fünf Jahre nach der Operation wurde bei 23 Patienten eine Progression der Erkrankung diagnostiziert, 32 Patienten blieben innerhalb der ersten fünf Jahre nach ihrer Operation progressionsfrei.

Beispiel 1: RNA Extraktion und Target Labeling

Die Tumoren wurden homogenisiert und die RNA wurde mittels des RNeasy Mini Kit (Qiagen, Hilden, Deutschland). isoliert und in 55 μl Wasser aufgenommen. Die cRNA Präparation wurde wie bereits beschrieben (Birkenkamp-Demtroder K, Christensen LL, Olesen SH, et al. Gene expression in colorectal cancer. Cancer Res 2002; 62: 4352-63) durchgeführt. Doppelsträngige cDNA wurde mittels eines OligodT-T7 primer (Eurogentec, Köln, Germany) synthetisiert und anschließend mit Hilfe des Promega RiboMax T7-kit (Promega, Madison, Wisconsin) und Biotin-NTP Markierungsmix (Loxo, Dossenheim, Germany) transkribiert. Fünfzehn Mikrogramm cRNA wurden anschließend bei 95°C 35 Minuten lang fragmentiert.

Beispiel 2: Mikroarray Experimente

Die cRNA wmit dem B2-Kontrolloligonukleotid (Affymetrix, Santa Clara, CA), eukaryotischen Hybridisierungskontrollen (Affymetrix, Santa Clara, CA), Heringssperm (Promega, Madison, Wisconsin), Hybridisierungspuffer and BSA auf ein finales Volumen von 300 μl aufgefüllt und auf einen Mikroarraychip U133A (Affymetrix, Santa Clara, CA) 16 Stunden lang bei 45°C hybridisiert. Die Wasch- and Incubationsschritte mit Streptavidin (Roche, Mannheim), biotinyliertem Ziege-anti Streptavidin Antikörper (Serva, Heidelberg), Ziege-IgG (Sigma, Taufkirchen) and Streptavidin-Phycoerythrin Konjugat (Molecular Probes, Leiden, Niederlande) wurde in einer Affymetrix Fluidics Station entsprechend dem Herstellerprotokoll durchgeführt.

Die Arrays wurden anschließend mit einem HP-Argon-Ionenlaser basiertem konfokalem Mikroskop gescannt und die digitalisierten Bilddaten wurden mit Hilfe der Affymetrix® Mikroarray Suite 5.0 Software prozessiert. Die Genechips wurden dabei einer Qualitätskontrolle unterzogen um Scans mit abnormalen Charakteristika zu entfernen. Die Kriterien waren: zu hoher oder zu niedriger dynamischer Bereich, Hohe Sättigung der „perfect matches", hohes Pixelrauschen, „grid misalignment" Probleme and ein niedriges mittleres Signal zu Rausch Verhältnis.

Beispiel: 3 Bioinformatische Auswertung

Die statistische Datenanalyse wurde mit der Open-Source Software R, Version 2.3 und den Bioconductor Paketen, Version 1.8 ausgeführt. Beginnend mit 55 CEL-Files wurden die Gen-Expressionswerte durch FARMS [Hochreiter et al. (2006), Bioinformatics 22(8): 943-9], Kondensierung bestimmt.

Basierend auf den klinischen Daten von 55 Patienten wurde das Klassifikationsproblem „Klassifikation der vorliegenden Expressionsdaten nach Progression" formuliert und analysiert. Das Datenset stammte von 23 rezidivierenden und 32 nicht-rezidivierenden Patienten. Die in der Erfindung beschriebenen Markergene wurden, wie in gezeigt, mit einem zweifach geschachteltem Bootstrap-Ansatz [Efron (1979) Bootstrap Methods – Another Look at the Jackknifing, Ann. Statist. 7, 1-6], bestimmt. In der äußeren Schleife mit 50 Iterationen wurden die Daten in 2 Test- und 53 Trainingsdaten zufällig partitioniert. Anhand der Trainingsdaten wurde in der inneren Bootstrap-Schleife durch eine Decision-Tree-Analyse die Featurerelevanz aus den Daten extrahiert. Dazu wurden in 50 Bootstrapp-Iterationen jeweils 10 Samples zufällig gezogen und der Einfluss eines Features aus dessen Beitrag zum Klassifikationsfehler ermittelt: Stieg der Fehler durch Permutieren der Werte eines Features, während die Werte aller anderen Features unverändert blieben, so wurde dieses stärker gewichtet. Anhand einer Häufigkeitstabelle wurden die 30 am häufigsten gewählten Features ermittelt und für die Prognose der Testdaten durch eine Support-Vector-Machine mit linearen Kernel (Hyperparameter Cost = 10) in der äußeren Bootstrapp-Schleife verwendet. Nach 100 Iterationen wurde die durchschnittliche, prospektive Klassifikationsrate und die Häufigkeiten der gefundenen Features bestimmt. Die -Gensignaturen beinhalten nur Features, die mit großer Häufigkeit in allen Ziehungen relevant waren und wurden entsprechend der relativen Häufigkeit sortiert. In der retrospektiven „Leave-One-Out-Cross Validation" (LOOCV) der Signaturen wurden im Fall von sieben verwendeten Features 80% der Datensätze richtig klassifiziert. (siehe auch Tabelle 2) Tabelle 1: Markergene die ein Vorhersage zwischen progressionfreiem Überleben und Progression der Erkrankung innerhalb der ersten fünf Jahre nach der Entfernung des primären Kolonkarzinoms (PFS5) ermöglichen; Die Frequenz stellt die Häufigkeit dar mit der dieses Feature in den jeweiligen inneren Schleifen (100) einen großen Beitrag zum Klassifikationsfehler lieferte. (siehe auch Beschreibung im Beispiel 3)

Sequenz_IDAffy_IDHUGO_IDRefSeq Acc. No.Frequenz1210154_atME2NM_0023960,82282205242_atCXCL13NM_0064190,65123207088_s_atSLC25A11NM_0035620,62984215719_x_atFASNM_0000430,59185212773_s_atTOMM20NM_0147650,56066204533_atCXCL10NM_0015650,46827219718_atFLJ10986NM_0182910,42968203333_atKIFAP3NM_0149700,36469218096_atAGPAT5NM_0183610,355410AFFX-r2-Hs18SrRNA-5_atNAM100980,354610AFFX-HUMRGE/M10098_5_atNAM10098_50,34311202336_s_atPAMNM_0009190,314412210312_s_atIFT20NM_1748870,312613209003_atSLC25A11NM_0035620,303814221481_x_atHNRPDNM_0010038100,29815203915_atCXCL9NM_0024160,283616202543_s_atGMFBNM_0041240,274817212958_x_atPAMNM_0009190,26518214551_s_atCD7NM_0061370,264619201036_s_atHADHSCNM_0053270,252220214464_atCDC42BPANM_0036070,2221204438_atMRC1NM_0024380,210222209397_atME2NM_0023960,20523AFFX-HUMISGF3A/M97935_MB_atSTAT1NM_0073150,203224210387_atHISTIH2BGNM_0035180,199825200628_s_atWARSNM_0041840,196626201530_x_atEIF4A1NM_0014160,19627201406_atRPL36ANM_0210290,187228205436_s_atH2AFXNM_0021050,18129203663_s_atCOX5ANM_0042550,1682
SEQ_IDHUGO_IDSensitivitätSpezifizitätPPVNPVKlassifikationsate1ME2NANANANANA2CXCL130,720,610,720,610,673SLC25A110,750,700,770,670,734FAS0,720,740,790,650,735TOMM200,780,740,810,710,766CXCL100,750,780,830,690,767FLJ109860,780,830,860,730,808KIFAP30,750,740,800,680,759AGPAT50,720,830,850,680,7610NA0,780,780,830,720,7810NA0,780,830,860,730,8011PAM0,750,780,830,690,7612IFT200,780,610,740,670,7113SLC25A110,750,610,730,640,6914HNRPD0,720,700,770,640,7115CXCL90,750,700,770,670,7316GMFB0,750,650,750,650,7117PAM0,750,650,750,650,7118CD70,780,700,780,700,7519HADHSC0,780,740,810,710,7620CDC42BPA0,780,740,810,710,7621MRC10,810,650,760,710,7522ME20,810,650,760,710,7523STAT10,840,650,770,750,7624HISTIH2BG0,810,650,760,710,7525WARS0,780,700,780,700,7526EIF4A10,780,700,780,700,7527RPL36A0,810,700,790,730,7628H2AFX0,780,610,740,670,7129COX5A0,840,700,790,760,78

SEQUENCE LISTING

ZITATE ENTHALTEN IN DER BESCHREIBUNG

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.

Zitierte Patentliteratur

  • - US 5445934 [0028]
  • - US 5532128 [0028]
  • - US 5556752 [0028]
  • - US 5242974 [0028]
  • - US 5384261 [0028]
  • - US 5405783 [0028]
  • - US 5412087 [0028]
  • - US 5424186 [0028]
  • - US 5429807 [0028]
  • - US 5436327 [0028]
  • - US 5472672 [0028]
  • - US 5527681 [0028]
  • - US 5529756 [0028]
  • - US 5545331 [0028]
  • - US 5554501 [0028]
  • - US 5561071 [0028]
  • - US 5571639 [0028]
  • - US 5593839 [0028]
  • - US 5599695 [0028]
  • - US 5624711 [0028]
  • - US 5658734 [0028]
  • - US 5700637 [0028]

Zitierte Nicht-Patentliteratur

  • - Hawkins et al. (2002) Gastroenterology 122: 1376-1387 [0009]
  • - Noura et al. (2002) J Clin Oncol 20: 4232 [0009]
  • - Zhou et al. (2002) Lancet 359: 219-225 [0009]
  • - Eschrich et al. (2005) J Clin Oncol. 2005 May 20; 23(15): 3526-35 [0009]
  • - W. R. Pearson (1990) Rapid and Sensitive Sequence Comparison with FASTP and FASTA Methods in Enzymology 183: 63-98. [0024]
  • - Hochreiter (2006), Bioinformatics 22(8): 943-9 [0029]
  • - Efron (1979) Bootstrap Methods – Another Look at the Jackknifing, Ann. Statist. 7, 1-6 [0029]
  • - Birkenkamp-Demtroder K, Christensen LL, Olesen SH, et al. Gene expression in colorectal cancer. Cancer Res 2002; 62: 4352-63 [0040]
  • - Hochreiter et al. (2006), Bioinformatics 22(8): 943-9 [0043]
  • - Efron (1979) Bootstrap Methods – Another Look at the Jackknifing, Ann. Statist. 7, 1-6 [0044]