Title:
Selektion kodierender Nukleinsäure-Konstrukte auf Abwesenheit von Frameshift-Mutationen
Kind Code:
B3


Abstract:

Die vorliegende Erfindung betrifft ein Verfahren zur Bestimmung von Frameshift-Mutationen in kodierenden Nukleinsäuresequenzen.




Inventors:
Liss, Michael (Regensburg, 93059, DE)
Notka, Frank (Regensburg, 93059, DE)
Daubert, Daniela (Landshut, 84028, DE)
Benkel, Claudia (Regensburg, 93047, DE)
Application Number:
DE102009011253
Publication Date:
07/22/2010
Filing Date:
03/02/2009
Assignee:
Geneart AG (Regensburg, 93053, DE)
International Classes:



Other References:
OHASHI-KUNIHIRO, S. u.a.: A novel vector for positive selection of inserts harboring an open reading frame by translational coupling. Biotechniques (Dezember 2007) 43 (6) 751-754
NAGASE, T. u.a.: Exploration of human ORFeome: high-througput preparation of ORF clones and efficient characterization of their protein products. DNA Res. (02.03.2008) 15 (3) 137-49
CABANTOUS, S. u.a.: New molecular reporters for rapid protein folding assays. PLoS ONE (11.05.2008) 3(6): e2387
Attorney, Agent or Firm:
Weickmann & Weickmann (München, 81679)
Claims:
1. Verfahren zur Bestimmung von Frameshift-Mutationen in kodierenden Zielnukleinsäuren, welches die Schritte umfasst:
(i) Bereitstellen einer Wirtszelle, umfassend eine doppelsträngige Nukleinsäure, welche eine kodierende Zielnukleinsäure und eine dazu komplementäre, kodierende Gegenstrangnukleinsäure umfasst, worin die Gegenstrangnukleinsäure über einen Linker mit einem Reportergen in 3'-Position verknüpft ist;
(ii) Bewirken der Expression der Gegenstrangnukleinsäure; und
(iii) Bestimmen, ob in der Wirtszelle eine Expression des Reportergens erfolgt,
worin die Expression des Reportergens anzeigt, dass die Zielnukleinsäure keine Frameshift-Mutation aufweist,
dadurch gekennzeichnet,
dass der Linker eine translationelle Kopplersequenz aufweist, die ein Stoppkodon in frame zu dem Leserahmen der Gegenstrangnukleinsäure und ein Startkodon umfasst, wobei das Reportergen in frame zu dem Startkodon liegt.

2. Verfahren nach Anspruch 1, wobei der Linker in den um +1 und –1 verschobenen Leserahmen stromaufwärts des Stoppkodons der translationellen Koppler-Sequenz gelegene weitere Stoppkodons aufweist.

3. Verfahren nach Anspruch 2, wobei der Abstand von den weiteren Stoppkodons zu dem Startkodon der translationellen Kopplersequenz so gewählt ist, dass keine translationelle Kopplung erfolgt, vorzugsweise mindestens 30 Basenpaare, insbesondere mindestens 50 Basenpaare.

4. Verfahren nach einem der Ansprüche 1 bis 3, wobei Start- und Stoppkodon der translationellen Kopplersequenz unmittelbar aneinander anschließen.

5. Verfahren nach einem der Ansprüche 1 bis 3, wobei Start- und Stoppkodon der translationellen Kopplersequenz miteinander überlappen.

6. Verfahren nach einem der Ansprüche 1 bis 3, wobei Start- und Stoppkodon der translationellen Kopplersequenz einen Abstand voneinander aufweisen, der so gewählt ist, dass eine translationelle Kopplung ermöglicht wird, vorzugsweise einen Abstand von nicht mehr als 10 Basenpaaren.

7. Verfahren nach einem der Ansprüche 1 bis 6, worin die Gegenstrangnukleinsäure weiterhin in operativer Verknüpfung mit einer Expressionskontrollsequenz in 5'-Position vorliegt.

8. Verfahren nach einem der Ansprüche 1 bis 7,
worin Schritt (i) umfasst:
– Einbringen eines Expressionsvektors, umfassend die doppelsträngige Nukleinsäure, welche eine kodierende Zielnukleinsäure und eine dazu komplementäre, kodierende Gegenstrangnukleinsäure umfasst, in eine Wirtszelle, wobei die Gegenstrangnukleinsäure in dem Expressionsvektor über einen Linker mit einem Reportergen in 3'-Position verknüpft ist.

9. Verfahren nach Anspruch 8, worin die Gegenstrangnukleinsäure in dem Expressionsvektor in operativer Verknüpfung mit einer Expressionskontrollsequenz in 5' Position vorliegt.

10. Verfahren nach einem der Ansprüche 8 oder 9, worin in Schritt (i) ein Expressionsvektor verwendet wird, der zusätzlich mindestens ein Selektionsmarkergen umfasst.

11. Verfahren nach Anspruch 10, worin das Selektionsmarkergen konstitutiv exprimiert wird.

12. Verfahren nach einem der vorhergehenden Ansprüche, worin die Gegenstrangnukleinsäure so optimiert wird, dass sie keine Stopp-Kodons umfasst.

13. Verfahren nach einem der vorhergehenden Ansprüche, worin die Nukleinsäuresequenz aus genomischen Sequenzen, cDNA-Sequenzen, oder cDNA-Fragmenten stammt.

14. Verfahren nach einem der vorhergehenden Ansprüche, worin die Nukleinsäuresequenz aus einer Bibliothek, die eine Kollektion von Sequenzen enthält, stammt.

15. Verfahren nach einem der vorhergehenden Ansprüche, worin die Zielnukleinsäuresequenz aus einer normalisierten cDNA-Bibliothek stammt.

16. Verfahren nach einem der vorhergehenden Ansprüche, worin als Expressionsvektor ein Plasmid verwendet wird.

17. Verfahren nach einem der vorhergehenden Ansprüche, worin als Wirtszelle eine eukaryotische Zelle verwendet werden.

18. Verfahren nach einem der Ansprüche 8 bis 17, worin das Einbringen des Expressionsvektors durch Calciumphosphat-Copräzipitation, Lipofektion, Elektroporation, Partikelbeschuss oder virale Infektion erfolgt.

19. Verfahren nach einem der vorhergehenden Ansprüche, worin das Reportergen ein für ein nachweisbares Genprodukt codierendes Gen enthält.

20. Verfahren nach Anspruch 19, worin das Reportergen ein Antibiotika-Resistenzgen wie etwa Kanamycin-Resistenz umfasst.

21. Verfahren nach Anspruch 19, worin das nachweisbare Genprodukt aus Fluoreszenzproteinen wie vorzugsweise GFP ausgewählt wird.

22. Verfahren nach Anspruch 19, worin das nachweisbare Genprodukt eine colorimetrisch messbare Reaktion katalysiert.

23. Verfahren nach einem der vorhergehenden Ansprüche, worin die Bestimmung in Schritt (iii) durch Fluoreszenzcytometrie oder Imaging-Assays erfolgt.

Description:

Die vorliegende Erfindung betrifft ein Verfahren zur Bestimmung von Frameshift-Mutationen in kodierenden Nukleinsäuresequenzen.

Genetische Information ist in kodierenden Nukleinsäuren in Form von Basentriplets oder Kodons organisiert. Bei der Gensynthese treten jedoch häufig Fehler in Form unterschiedlicher Arten von Mutationen auf. Bei den Mutationen handelt es sich großteils um Einzelbasendeletionen und Insertionen (ca. 90%). Im Gegensatz zu den meisten Substitutionen führen nahezu alle Insertionen und Deletionen zu so genannten Frameshifts. Geht eine Base eines Gens im Rahmen einer Mutation verloren (Deletion) oder wird eine Base hinzugefügt (Insertion), so verändert sich das Leseraster der nachfolgenden Basentriplets. Eine Frameshift-Mutation hat biologisch wesentlich größere Auswirkungen als eine Substitution. Ab der Insertion/Deletion werden andere Aminosäuren kodiert und es kommt meist zu einem Abbruch der Translation durch out-of-frame Stoppkodons.

Mit zunehmender Länge eines synthetisierten Gens steigt die Wahrscheinlichkeit für das Auftreten einer Mutation stark an. Der Großteil der ungewollten Mutationen kommt durch das Fehlen oder die Insertion von Einzelbasen in Oligonukleotiden zustande. Die Wahrscheinlichkeit einer Substitution einer Base liegt bei der Synthese von Genen oder Genbibliotheken bei etwa 0,1–0,2‰ pro Position, die Wahrscheinlichkeit für eine Insertion/Deletion liegt bei 1,0–1,5‰ pro Position. Beispielsweise beobachteten Kong et al., Nucleic Acid Res. (2007), 35:e61, bei der Chipbasierten Gensynthese eine Deletionsrate von 1,48‰ pro Position und eine Substitutionsrate von 0,3‰ pro Position. Etwa die Hälfte der Substitutionen kommt wiederum durch PCR-Fehler zustande.

Die bei Insertionen und Deletionen auftretende Verschiebung des Leserasters kann genutzt werden, um über einen Reportervektor solche Nukleinsäure-Fragmente zu selektieren, deren Leseraster intakt ist. So offenbart die europäische Patentanmeldung EP 0 872 560 A1 ein Verfahren zur Bestimmung von Frameshift-Mutationen, bei dem mittels homologer Rekombination ein Konstrukt erzeugt wird, das einen Promotor, ein zu untersuchendes Gen und im gleichen Leseraster mit dem zu untersuchenden Gen ein Reportergen enthält. Bei der Expression des Leserasters wird ein Fusionsprotein erhalten, welches die Reportergenfunktion beinhaltet. Dieses kann über phänotypische Eigenschaften nachgewiesen werden.

Problematisch ist allerdings, dass das zu untersuchende Gen für die in EP 0 872 560 A1 beschriebene Vorgehensweise keine internen Stoppkodons innerhalb des offenen Leserasters (ORF) aufweisen darf. Dies ist jedoch bei vielen synthetisierten Genen der Fall.

Angesichts der obigen Problematik und aufgrund der Notwendigkeit, auch für Nukleinsäuren, welche interne Stoppkodons umfassen, ungewollte Leserastermutationen zu detektieren bzw. auszuselektieren, wurde in dem deutschen Patent DE 10 2007 052 344 B3 ein Verfahren zur Bestimmung von Frameshift-Mutationen in kodierenden Zielnukleinsäuren offenbart, welches die Schritte umfasst:

  • (i) Bereitstellen einer Wirtszelle, umfassend eine doppelsträngige Nukleinsäure, welche eine kodierende Zielnukleinsäure und eine dazu komplementäre, kodierende Gegenstrangnukleinsäure umfasst, worin die Gegenstrangnukleinsäure in operativer Verknüpfung mit einem Reportergen in 3' Position vorliegt;
  • (ii) Bewirken der Expression der Gegenstrangnukleinsäure; und
  • (iii) Bestimmen, ob in der Wirtszelle eine Expression des Reportergens erfolgt,
worin die Expression des Reportergens anzeigt, dass die Zielnukleinsäure keine Frameshift-Mutation aufweist.

Der Begriff „keine Frameshift-Mutation” ist dabei so zu verstehen, dass die Zielnukleinsäure entweder überhaupt keine Frameshift-Mutation aufweist oder dass in der Zielnukleinsäure mehrere Mutationen vorliegen, die für sich betrachtet, zu einer Verschiebung des Leserahmens führen würden, die sich aber gegenseitig wieder aufheben. Beispielsweise kann in der Zielnukleinsäure eine Kombination von Insertionen und Deletionen vorliegen, die sich aber gegenseitig wieder aufheben, so dass keine Änderung des Leserasters auftritt und das Reportergen weiter korrekt abgelesen werden kann.

Das Prinzip der DE 10 2007 052 344 B3 besteht darin, dass für die Bestimmung von Frameshift-Mutationen anstelle der kodierenden Zielnukleinsäure eine dazu komplementäre kodierende Gegenstrangnukleinsäure genutzt werden kann.

Der Begriff „kodierend” ist in diesem Zusammenhang so zu verstehen, dass die Gegenstrangnukleinsäure so beschaffen ist, dass sie die Expression des 3' verknüpften Reportergens ermöglicht. Die Gegenstrangnukleinsäure muss zu diesem Zweck aber nicht unbedingt durch einen offenen Leserahmen definiert sein.

Bei der Durchführung des Verfahrens wird zunächst eine Wirtszelle bereitgestellt, die eine doppelsträngige Nukleinsäure umfasst, welche eine kodierende Zielnukleinsäure und eine dazu komplementäre, kodierende Gegenstrangnukleinsäure enthält. Bei der Zielnukleinsäure handelt es sich vorzugsweise um eine synthetisch erzeugte Sequenz. Die Gegenstrangnukleinsäure ist in der Wirtszelle operativ mit einem Reportergen verknüpft, welches sich stromabwärts in 3'-Position befindet.

Wenn die Gegenstrangnukleinsäure intakt ist, d. h. keine Mutationen wie insbesondere Insertionen oder Deletionen aufweist, die eine Änderung des Leserasters zur Folge haben, so wird bei der Expression ein Fusionspolypeptid erhalten, das die von der Gegenstrangnukleinsäure kodierte Aminosäuresequenz sowie C-terminal davon die Aminosäuresequenz des von dem Reportergen kodierten Produkts aufweist. Wenn die Gegenstrangnukleinsäure dagegen eine Frameshift-Mutation aufweist, d. h. insbesondere eine Insertion oder Deletion, durch die sich das Leseraster ändert, so führt diese Verschiebung des Leserasters dazu, dass das Reportergen nicht in-frame zu der kodierenden Gegenstrangnukleinsäure liegt. Folglich wird das Reportergen nicht exprimiert. Der Reporter wird also nur dann exprimiert, wenn das Leseraster des Gegenstrangs intakt ist.

Wenn die Gegenstrangnukleinsäure keine Frameshift-Mutationen aufweist, so kann daraus geschlossen werden, dass auch die komplementäre Zielnukleinsäure selbst intakt ist und keine Frameshift-Mutationen aufweist.

Das Verfahren der DE 10 2007 052 344 B3 beruht darauf, dass nur bei Abwesenheit von Frameshift-Mutationen die Translation des Gegenstrangs zu einem Fusionsprotein führt, welches den Reporter umfasst. Unter Umständen weist ein solches Fusionsprotein jedoch aufgrund seiner Größe ein hohes Molekulargewicht auf und kann in Form von denaturierten Aggregaten in der Zelle vorliegen. Die Expression und Funktionalität des Reporters kann also auch bei Einfügen von korrekten Leserahmen durch die Eigenschaften des gebildeten Polypeptids beeinflusst oder sogar inhibiert werden. Dies kann insbesondere bei relativ großen kodierenden Zielnukleinsäuren und entsprechenden Gegenstrangnukleinsäuren zu einer Verringerung der Effizienz des Verfahrens führen.

Angesichts dieser Problematik wurde die in DE 10 2007 052 344 B3 offenbarte Vorgehensweise von den Erfindern weiterentwickelt. Überraschenderweise wurde herausgefunden, dass die im Fachbereich bekannte Strategie der translationellen Kopplung in dem Verfahren der DE 10 2007 052 344 B3 zur operativen Verknüpfung der kodierenden Gegenstrangnukleinsäure mit einem Reportergen in 3'-Position genutzt werden kann.

Das Phänomen der konjugierten Translation oder der translationellen Kopplung ist ein Regulierungsmechanismus, bei dem die Translation eines stromaufwärtigen Gens die Translation eines stromabwärtigen Gens reguliert. Eine Theorie zur Erklärung dieses Phänoms geht davon aus, dass das Ribosom von dem translatierten stromaufwärtigen Gen an das stromabwärtige Gen über ein Translationskopplungssignal übergeben wird, welches als schwache Ribosomenbindungsstelle fungiert. Dabei erfolgt keine erneute Ribosomenanbindung, sondern das Ribosom kann nach Beendigung der Translation des stromaufwärts gelegenen Gens die Sequenz scannen und die Translation des stromabwärtigen Gens auslösen. Die translationelle Kopplung zwischen zwei Cistrons wird also über dasselbe Ribosom vermittelt. Das Ribosom beendet die Translation an einem Stoppkodon in der stromaufwärts gelegenen Sequenz und scannt daraufhin die stromabwärtige Sequenz, wobei es bei einem Startkodon in der Nähe dieses Stoppkodons mit der erneuten Translation beginnt. Dieser Scannvorgang des Ribosoms erfolgt in beide Richtungen, so dass die Fortsetzung der Synthese an einem Startkodon ausgelöst werden kann, welches mit dem Stoppkodon der vorhergehenden kodierenden Sequenz überlappt.

Die translationelle Kopplung wurde erstmals von Oppenheim 1980 für das Tryptophan-Operon in E. coli beschrieben (D. S. Oppenheim und C. Yanowski (1980), Genetics 95:789–795). Der Effekt beruht darauf, dass die Translation nach einem Stoppkodon bei einem direkt darauf folgenden Startkodon wieder einsetzt. Dabei entstehen zwei getrennte Polypeptidketten. Voraussetzung für die Synthese des zweiten Polypeptids ist korrektes Ablesen des ersten Leserahmens bis hin zum Stoppkodon.

WO 2008/077881 A1 beschreibt ein Verfahren zur Selektion von Genen einer Genbibliothek auf eine verbesserte Expressionsleistung, wobei die verbesserte Expression mittels eines Reportergens quantifiziert wird, welches durch translationelle Kopplung mit dem entsprechenden Gen synthetisiert wird. Gleichzeitig werden durch dieses Verfahren Gene mit offenem Leserahmen identifiziert. Als Reporter werden z. B. Resistenzgene oder GFP genannt. Es wird zudem darauf hingewiesen, dass das Startkodon des Reportergens sowohl mit dem Stoppkodon des offenen Leserahmens überlappen als auch einen Abstand von bis zu 500 Nukleotiden aufweisen kann.

WO 2008/051619 A1 beschreibt ein Verfahren zum Screening von DNA-Bibliotheken zur Identifikation von DNA-Fragmenten mit offenem Leserahmen, die weder interne ribosomale Bindestellen noch interne Stoppkodons aufweisen. Zur Selektion der Sequenzen werden Reporterproteine verwendet, die nicht durch kovalente Fusion mit dem entsprechenden Leserahmen, sondern durch translationelle Kopplung synthetisiert werden, um eine Fehlfaltung bzw. Fehlfunktion eines entsprechenden Fusionsproteins zu verhindern. Das Dokument offenbart zudem zwei Vektorvarianten, die entweder eine positive Selektion von offenen Leserahmen ohne Stoppkodons über Resistenzmarker ermöglichen, oder eine negative Selektion von offenen Leserahmen mit internen ribosomalen Bindestellen über Expression eines Toxins bewirken.

Ohashi-Kunihiro et al. (Biotechniques (2007) 43(6):741–2, 754) beschreiben ebenfalls die Selektion von DNA-Fragmenten mit offenem Leserahmen durch translationelle Kopplung mit einem Resistenzmarker, der nur in Abwesenheit von internen Stoppkodons exprimiert wird. Zudem wird der optimale Abstand des offenen Leserahmens zu dem Resistenzmarker ermittelt.

Cabantous et al. (PLoS one 3(6):e2387) beschreibt ein GFP-Reportersystem, welches dazu geeignet ist eine Frameshift-Mutation in einer kodierenden Zielnukleinsäure anzuzeigen, wobei GFP im Falle einer Frameshift-Mutante durch translatioriale Kopplung exprimiert wird.

In der vorliegenden Erfindung wurde nun überraschenderweise herausgefunden, dass die Strategie der translationellen Kopplung in dem in DE 10 2007 052 344 B3 offenbarten Verfahren zur Selektion kodierender Nukleinsäurekonstrukte auf Abwesenheit von Frameshift-Mutationen genutzt werden kann. Im Gegensatz zu den im Stand der Technik beschriebenen Verfahren wird im erfindungsgemäßen Verfahren jedoch der offene Leserahmen des Gegenstrangs der kodierenden Zielnukleinsäure durch translationelle Kopplung selektioniert.

Die Erfindung stellt daher ein Verfahren zur Bestimmung von Frameshift-Mutationen in kodierenden Zielnukleinsäuren bereit, welches die Schritte umfasst:

  • (i) Bereitstellen einer Wirtszelle, umfassend eine doppelsträngige Nukleinsäure, welche eine kodierende Zielnukleinsäure und eine dazu komplementäre kodierende Gegenstrangnukleinsäure umfasst, worin die Gegenstrangnukleinsäure über einen Linker mit einem Reportergen in 3'-Position verknüpft ist;
  • (ii) Bewirken der Expression der Gegenstrangnukleinsäure; und
  • (iii) Bestimmen, ob in der Wirtszelle eine Expression des Reportergens erfolgt,
worin die Expression des Reportergens anzeigt, dass die Zielnukleinsäure keine Frameshift-Mutation aufweist,
dadurch gekennzeichnet,
dass der Linker eine translationelle Kopplersequenz aufweist, die ein Stoppkodon in frame zu dem Leserahmen der Gegenstrangnukleinsäure und ein Startkodon umfasst, wobei das Reportergen in frame zu dem Startkodon liegt.

Wenn die Gegenstrangnukleinsäure (und damit auch die komplementäre Zielnukleinsäure) keine Frameshift-Mutation aufweist, so ist ein korrektes Ablesen des Gegenstrangs bis hin zu dem Stoppkodon der translationellen Kopplersequenz in dem in 3'-Position angebundenen Linker möglich. An dem darauf folgenden Startkodon der translationellen Kopplersequenz setzt dann die Translation wieder ein. Da das Startkodon in dem erfindungsgemäß eingesetzten Linker in frame zu einem darauf folgenden Reportergen liegt, wird in diesem Fall auch das Reportergen translatiert.

Durch die Nutzung der translationellen Kopplung in dem Verfahren der vorliegenden Erfindung entstehen somit das Expressionsprodukt der zu überprüfenden Gegenstrangnukleinsäure und des Reportergens als getrennte Polypeptidketten.

Mit Hilfe des erfindungsgemäßen Verfahrens gelingt es, selbst bei Vorliegen von internen Stoppkodons in einer Zielnukleinsäure Frameshift-Mutationen unter Nutzung der Gegenstrangnukleinsäure mittels eines Reportergens zu bestimmen. Interne Stoppkodons der Zielnukleinsäure werden bei der Nutzung des Leserasters im Gegenstrang als Leu bzw. Ser translatiert. Die Nutzung eines Leserasters im Gegenstrang hat weiterhin den Vorteil, dass eine mögliche Toxizität des von der eigentlichen Zielnukleinsäure kodierten Proteins für die Wirtszelle nicht relevant ist, da nur der Gegenstrang translatiert wird.

Für die Durchführung des erfindungsgemäßen Verfahrens ist eine kodierende Gegenstrangnukleinsäure erforderlich. Ein Leseraster im Gegenstrang kann gegebenenfalls durch entsprechende Optimierung der Gegenstrangsequenz erreicht werden. In einer bevorzugten Ausführungsform weist die Gegenstrangnukleinsäure keine internen Stoppkodons auf. Die komplementären Kodons zu den drei Stoppkodons sind relativ selten, daher enthält ein Leseraster im Gegenstrang in der Regel keine Stoppkodons. Vorzugsweise wird die Gegenstrangnukleinsäure gegebenenfalls so optimiert, dass keine internen Stoppkodons enthalten sind.

Eine translationelle Kopplersequenz umfasst erfindungsgemäß ein Stoppkodon, welches in frame zu der Gegenstrangnukleinsäure angeordnet ist, und ein darauffolgendes Startkodon, welches in frame zu dem Reportergen angeordnet ist. Der Abstand zwischen Stoppkodon und Startkodon ist so gewählt, dass eine translationelle Kopplung ermöglicht wird. Vorzugsweise beträgt der Abstand nicht mehr als 10 Basenpaare.

In einer Ausführungsform der vorliegenden Erfindung schließen Startkodon und Stoppkodon der translationellen Kopplersequenz unmittelbar aneinander an. Beispielsweise kann die translationelle Kopplersequenz zwei getrennte Kodons, z. B. TAA ATG umfassen. In einer anderen Ausführungsform überlappen Startkodon und Stoppkodon der translationellen Kopplersequenz miteinander. Ein Beispiel für eine Überlappung des Stoppkodons mit dem Startkodon ist die translationelle Kopplersequenz TAATG.

Durch die erfindungsgemäße Kopplung der Translation auf genetischer Ebene bei gleichzeitiger Entkopplung der entstehenden Polypeptidketten ist eine signifikante Verbesserung des Verfahren zur Identifikation von korrekten Leserahmen gegeben. Das System bleibt unabhängig von der Faltung der durch die Gegenstrangnukleinsäure gebildeten Polypeptidkette.

In einer bevorzugten Ausführungsform der Erfindung enthält der Linker in den um +1 und –1 verschobenen Leserahmen stromaufwärts des Stoppkodons der translationellen Kopplersequenz gelegene weitere Stoppkodons. Diese Stoppkodons gewährleisten, dass die Translation der verschobenen Leserahmen vor dem Erreichen des Stoppkodons der translationellen Kopplersequenz abgebrochen wird. Der Abstand der weiteren Stoppkodons von dem Startkodon der translationellen Kopplersequenz wird dabei vorzugsweise so gewählt, dass keine translationelle Kopplung erfolgt. Als besonders geeignet hat sich ein Abstand von mindestens 30 Basenpaaren, vorzugsweise mindestens 50 Basenpaaren erwiesen.

Die Vorgehensweise in dem erfindungsgemäßen Verfahren zur Bestimmung von Frameshift-Mutationen entspricht im Übrigen dem Verfahren der DE 10 2007 052 344 B3.

In einer bevorzugten Ausführungsform ist die Gegenstrangnukleinsäure in der Wirtszelle in 3'-Position über einen Linker mit einem Reportergen verknüpft und in 5'-Position operativ mit einer Expressionskontrollsequenz verknüpft.

Eine Expressionskontrollsequenz ist eine Nukleinsäuresequenz, welche die Transkription und Translation kontrolliert und reguliert. Die Expressionskontrollsequenz kann in der Wirtszelle konstitutiv oder regulierbar aktiv sein. Die Formulierung „operativ verknüpft” schließt ein geeignetes Startsignal (z. B. ATG oder AUG) vor der zu exprimierenden Nukleinsäuresequenz und die Beibehaltung des korrekten Leserasters ein, sodass die Expression der Nukleinsäuresequenz unter der Kontrolle der Expressionskontrollsequenz und die Erzeugung des von der Nukleinsäuresequenz kodierten Produktes ermöglicht wird. Wenn eine Nukleinsäure kein geeignetes Startsignal enthält, so kann ein solches Startsignal vor der Nukleinsäure eingefügt werden.

Die Bereitstellung einer Wirtszelle in Schritt (i) des Verfahrens beinhaltet in einer Ausführungsform das Einbringen eines Expressionsvektors in eine Wirtszelle, wobei der Expressionsvektor die doppelsträngige Nukleinsäure umfasst, welche eine kodierende Zielnukleinsäure und eine dazu komplementäre kodierende Gegenstrangnukleinsäure umfasst. In dem Expressionsvektor ist die Gegenstrangnukleinsäure vorzugsweise mit einem Linker in 3'-Position verbunden, welcher die translationelle Kopplersequenz umfasst.

Expressionsvektoren sind dem Fachmann auf dem Gebiet der Molekularbiologie bekannt und beispielsweise in Sambrook et al., Molecular Cloning, A Laborstory Manual (1989), Cold Spring Harbour, Laborstory Press, beschrieben. Als Expressionsvektor kann beispielsweise ein Plasmid oder ein viraler Vektor verwendet werden.

Vorzugsweise ist die Gegenstrangnukleinsäure in dem Expressionsvektor operativ mit einer Expressionskontrollsequenz in 5'-Position verknüpft. In einer besonders bevorzugten Ausführungsform ist die Gegenstrangnukleinsäure in dem Expressionsvektor in 3'-Position über einen Linker mit einem Reportergen verknüpft und in 5'-Position mit einer Expressionskontrollsequenz operativ verknüpft.

Ein Expressionsvektor kann auf beliebige Weise erzeugt werden, beispielsweise durch Kultivierung in Wirtszellen, vorzugsweise in Bakterienzellen wie etwa E. coli-Zellen. Zweckmäßigerweise beinhaltet der Expressionsvektor Elemente, die eine Replikation und Selektion in der Wirtszelle ermöglichen. Alternativ kann ein Expressionsvektor auch in vitro durch Amplifikation in ausreichender Menge erzeugt werden, beispielsweise durch Polymerase-Kettenreaktion (PCR), Ligase-Kettenreaktion (LCR) oder Rolling-Circle-Amplifikation.

Als Wirtszellen können prokaryotische oder eukaryotische Zellen oder Mikroorganismen verwendet werden. Bei den Wirtszellen kann es sich um Wildtyp-Varianten handeln oder es können mutierte oder genetisch manipulierte Wirtszellen verwendet werden.

Als Reportergen kann ein für ein nachweisbares Genprodukt kodierendes Gen verwendet werden. Beispielsweise kann das Reportergen ein Antibiotika-Resistenzgen, vorzugsweise Kanamycin-Resistenz umfassen. In einer anderen Ausführungsform kann ein Reportergen verwendet werden, welches für ein Fluoreszenzprotein wie etwa GFP kodiert. Weiterhin kann ein Reportergen verwendet werden, das für ein Enzym kodiert, durch das eine colorimetrisch messbare Reaktion katalysiert wird (z. B. β-Galaktosidase). In einer weiteren Ausführungsform kann das Reportergen für ein Genprodukt kodieren, welches mit einer in der Wirtszelle vorhandenen Nukleinsäuresequenz oder mit einem in der Wirtszelle exprimierten Genprodukt wechselwirkt, wodurch es zu einer messbaren Veränderung einer Stoffwechselleistung kommt.

Das Einbringen von Expressionsvektor und gegebenenfalls Reportervektor in die Wirtszelle erfolgt nach im Stand der Technik bekannten Verfahren, beispielsweise durch (Co)Transfektion, (Co)Transformation oder (Co)Infektion von Zellen. Vorzugsweise wird das Verfahren so gewählt, dass die doppelsträngige Nukleinsäure in die Wirtszelle eingebracht wird, sodass in der Wirtszelle die Gegenstrangsequenz über den Linker, welcher eine translationelle Kopplersequenz umfasst, mit dem Reportergen verknüpft ist.

Bei eukaryotischen Wirtszellen kann die Transfektion bzw. Cotransfektion beispielsweise durch Calciumphosphat-Copräzipitation, Lipofektion, Elektroporation, Partikelbeschuss, Verwendung von Bakterienproteinen oder durch virale Infektion über Retroviren, Adenoviren etc. erfolgen.

In einer bevorzugten Ausführungsform wird in Schritt (i) des Verfahrens ein Vektor bereitgestellt, der zusätzlich zu dem über einen Linker mit der Gegenstrangnukleinsäure verknüpften Reportergen mindestens ein Selektionsmarkergen umfasst. Das mindestens eine Selektionsmarkergen ist ausgewählt aus beliebigen für ein nachweisbares Genprodukt kodierenden Genen, wobei das Genprodukt vorzugsweise von dem Genprodukt des Reportergens verschieden ist. Beispielsweise kann das Selektionsmarkergen ein Antibiotikaresistenzgen wie etwa β-Lactamase für Ampicilinresistenz umfassen. Alternativ kann als Selektionsmarkergen ein für ein Fluoreszenzprotein wie etwa GFP kodierendes Gen verwendet werden.

Über das Selektionsmarkergen kann unabhängig von dem Reportergen eine Selektion erfolgen. Beispielsweise kann ein Konstrukt nach erfolgter Selektion auf das erste Reportergen (beispielsweise auf Kanamycinresistenz) über Selektion mittels des weiteren Selektionsmarkergens (z. B. für Ampicillinresistenz) weiter hochamplifiziert werden. Darüber hinaus besteht die Möglichkeit, Konstrukte die eine Frameshift-Mutation enthalten (z. B. eine absichtliche Frameshift-Mutation) durch Selektion über das zweite Selektionsmarkergen weiter zu amplifizieren.

Schließlich kann das zweite Selektionsmarkergen dazu beitragen, die Existenz des Reportergens im Zusammenhang mit einer stattgefundenen Selektion zu verschleiern, um so das Verfahren vor Nachahmung zu schützen.

Schritt (ii) des Verfahrens beinhaltet das Bewirken der Expression der Gegenstrangnukleinsäure in der Wirtszelle. Hierzu wird die Wirtszelle unter geeigneten Bedingungen kultiviert, die eine Expression der Gegenstrangnukleinsäure erlauben.

Schritt (iii) beinhaltet die Bestimmung, ob in der Wirtszelle eine Expression des Reportergens erfolgt. Die Bestimmung beruht darauf, dass ein von dem Reportervektor codiertes Genprodukt nachgewiesen wird. Die Bestimmung kann abhängig von dem verwendeten Reportergen grundsätzlich die Bestimmung beliebiger phänotypisch erkennbarer Effekte umfassen, beispielsweise morphologische Veränderungen, Änderungen des Wachstumsverhaltens, etc. Wenn das Reportergen beispielsweise ein Fluoreszenzprotein wie GFP kodiert, so kann das Vorhandensein und/oder die Intensität der Lumineszenz z. B. mittels Fluoreszenzcytometrie oder Imaging-Assays bestimmt werden. Wenn als Reportergen ein Antibiotika-Resistenzgen verwendet wird, so kann die Bestimmung auf Grundlage des Wachstums von Wirtszellen in Gegenwart von Antibiotika erfolgen.

In einer Ausführungsform kann eine Zielnukleinsäure aus zwei, drei oder mehreren Teilfragmenten zusammengesetzt sein. Beispielsweise können bei einem Konstrukt mit 3 kB zunächst drei Teilfragmente aus Oligonukleotiden hergestellt werden und diese Teilfragmente dann z. B. über Fusions-PCR zu einem 3 kB-Fragment fusioniert werden. Ein so fusioniertes Konstrukt aus zwei oder mehreren Teilfragmenten kann dann direkt in einen Expressionsvektor ligiert werden.

Da mit dem Verfahren Frameshift-Mutationen, aber keine Mutationen unter Erhalt des Leserasters bestimmt werden können, wird bei der Synthese der Zielnukleinsäure durch PCR vorzugsweise der Amplifikationsprimer zu einem möglichst späten Zeitpunkt zugegeben, um die Anzahl der Amplifikationsschritte möglichst klein zu halten. Je höher die Anzahl amplifizierbarer Volllängenmoleküle, desto weniger durch PCR zustande gekommene Mutationen sind im PCR-Produkt enthalten.

Um Substitutionen noch weiter zu verringern, kann beispielsweise Ofloxazin nach der Transformation eingesetzt werden. Ofloxazin ist ein Gyrasehemmer, der die DNA-Replikation hemmt, Wirtszellen wie E. coli-Zellen jedoch kurzfristig nicht tötet. Während dieses Zeitraums besteht für eine Wirtszelle die Möglichkeit, Heterodimere über einen internen Reparaturmechanismus zu spalten. Vorzugsweise kann Ofloxazin im Medium nach der Elektroporation oder Hitzeschocktransformation enthalten sein (0,5–1 h bei 37°C). Im Anschluss werden die Zellen abzentrifugiert, das Medium zusammen mit dem Ofloxazin entfernt und die Zellen werden ausplattiert.

Figuren

1 zeigt die Plasmidkarte eines Expressionsvektors gemäß DE 10 2007 052 344 B3. Als Reportergen ist Kanamycin-Resistenz stromabwärts der Gegenstrangnukleinsäure MCS enthalten.

2 zeigt eine Teilsequenz eines Vektors pFroup1 zur Verwendung in dem Verfahren der Erfindung. Die Gegenstrangnukleinsäure (Insert) wurde über einen Linker mit einem Kanamycinresistenzgen (kan2) verknüpft. Der gezeigte Linker enthält in den zu dem Leserahmen der Gegenstrangsequenz um +1 und um –1 verschobenen Leserahmen jeweils mehrere Stoppkodons. Weiter enthält der Linker eine translationelle Kopplersequenz (TAA ATG), deren Stoppkodon in frame zu dem Leserahmen der Gegenstrangnukleinsäure liegt, und deren Startkodon in frame zu dem Kanamycinresistenzgen liegt.

3 zeigt den Aufbau der erfindungsgemäßen Vektoren pFroup1 und pFroup2. Beide sind für die Verwendung in E. coli konzipiert. Das Plasmid verleiht der Wirtszelle eine Ampicilinresistenz, unabhängig von einem Insert, so dass eine problemlose Vermehrung sichergestellt ist. Das zu untersuchende Insert wird über die Schnittstellen KpnI und SacI in den Vektor kloniert. Die Expression steht unter der Kontrolle eines konstitutiven Promotors.

4 ist eine Darstellung der Kopplung von Insert und kan2. N-terminal wird an das Insert ein Linker fusioniert, der im +1 und –1 Leserahmen Stopps trägt (out-of-frame Stopps). Bei Deletionen und Insertionen, die den Leserahmen verschieben, wird die Translation an dieser Stelle abgebrochen. Nur bei korrekter Translation des Inserts erfolgt eine Synthese des Resistenzmarkers über translationelle Kopplung, die in diesem Fall zur Kanamycinresistenz der Wirtszelle führt.

5 zeigt das Ergebnis einer Immunoblot-Analyse des Expressionsprodukts einer für GFP kodierenden Nukleinsäuresequenz, die in die Plasmide pFroup1 und 2 eingefügt wurde. Das in den transformierten Zellen synthetisierte GFP wurde mittels Immunoblot untersucht, um nachzuweisen, dass über die translationelle Kopplung nicht ein großes Fusionsprotein gebildet wird, sondern zwei getrennte Polypeptidketten entstehen. Als Kontrolle dienten Zellen, die mit GFPrev, der Gegenstrangnukleinsäure von GFP, welche für ein nonsense-Polypeptid kodiert, oder MBP transformiert wurden. Freies GFP hat eine Größe von 40 kDa (weißer Pfeil), das GFP-Kan2 Fusionsprotein wäre 70 kDa groß (schwarzer Pfeil). Als Positivkontrolle (+) ist GFP aus einem Vergleichsvektor aufgetragen. Da hier N-terminal kein Linker vorhanden ist, ist es nur ca. 30 kDa groß. Sowohl in pFroup1 als auch in pFroup2 funktioniert die translationelle Kopplung. Somit wird kein detektierbares Kan2 Fusionsprotein gebildet.

Die Erfindung soll durch das nachstehende Ausführungsbeispiel weiter veranschaulicht werden.

Beispiel

Es wurden die in 24 veranschaulichten Vektoren pFroup1 und 2 synthetisiert, in denen eine zu untersuchende Nukleinsäure (Insert) über einen Linker, der eine translationelle Kopplersequenz umfasst, mit einem Reportergen verknüpft ist. Die Vektoren unterscheiden sich in der Art der translationellen Kopplung. Bei pFroup1 bestehen Stopp und Start aus zwei getrennten Kodons (TAA ATG). Bei pFroup2 überlappt das Stoppkodon mit dem Startkodon (TAATG). An der Position des Inserts kann eine beliebige, auf Frameshift-Mutationen zu überprüfende Nukleinsäure eingefügt werden.

Zur Überprüfung der Funktionsfähigkeit der erfindungsgemäßen Vektoren wurden zunächst gezielt Modell-Inserts getestet. Dabei wurde eine für das grün fluoreszierende Protein (GFP) kodierende Nukleinsäuresequenz, die dazu revers komplementäre Sequenz (GFPrev) und ein Teil des Maltose bindenden Proteins (MBP) als Insert in pFroup1 und 2 eingefügt. Die Sequenzen GFP und GFPrev haben ein korrektes Leseraster, das Insert MBP hat keine durch drei teilbare Sequenz, also keinen korrekten Leserahmen.

Die Funktionsweise der Vektoren wurde zunächst im Wachstumstest gezeigt. E. coli-Wirtszellen, welche die Vektoren pFroup-GFP und pFroup-GFPrev enthalten, zeigten Resistenz gegenüber Ampicillin und Kanamycin. Der Vektor pFroup-MBP verleiht der Wirtszelle keine Kanamycin-Resistenz, da hier aufgrund des inkorrekten Leserahmens durch den vorzeitigen Abbruch der Translation im Linkerbereich das Polypeptid Kan2 nicht gebildet wird. Um auszuschließen, dass die Kanamycinresistenz des Konstrukts pFroup-GFP auf der Ausbildung eines Fusionsproteins aus GFP und Kan2 beruht (das könnte in pFroup1 durch Überlesen des Stopp-Codons geschehen), wurde das synthetisierte GFP mittels Immunoblot-Analyse untersucht (5). Es konnte das freie GFP, jedoch nicht ein sehr viel größeres GFP-Kan2 Fusionsprotein detektiert werden. Somit war eine korrekte Funktionsweise der translationellen Kopplung in den entwickelten Vektoren pFroup1 und 2 gegeben.

Es folgt ein Sequenzprotokoll nach WIPO St. 25.Dieses kann von der amtlichen Veröffentlichungsplattform des DPMA heruntergeladen werden.