Palindrome im Erbgut: Aufbau des CRISPR-Abschnitts
„O Genie, der Herr ehre dein Ego!“ Was klingt wie ein schwülstiger Gedichtvers, ist ein Palindrom-Satz – also ein Satz, der sich vorwärts und rückwärts lesen lässt. Am Anfang der CRISPR-Revolution stand die Entdeckung vieler aufeinanderfolgender Palindrom-Sequenzen in einem Erbgutabschnitts eines Bakteriums. Die Buchstaben des genetischen Codes, die vier Basenmoleküle Adenin, Cytosin, Thymin und Guanin, besitzen dieselbe Reihenfolge wie im zweiten komplementären DNA-Strang – dort allerdings in entgegengesetzter Richtung gelesen. Daher auch der Zungenbrecher-Name CRISPR („Clustered Regularly Interspaced Short Palindromic Repeats”), also “gehäuft auftretende, regelmäßig unterbrochene, kurze Palindrom-Wiederholungen“.
Anders als Palindrom-Worte in der menschlichen Sprache wie „Rentner“ oder „Lagerregal“, die durchaus Bedeutung besitzen, ergeben Palindrome im Wortschatz der Genetik keinen Sinn, lassen sich also nicht in funktionstüchtige Proteine übersetzen. Trotzdem sind sie nicht bedeutungslos. DNA-schneidende Proteine nutzen nämlich häufig Palindrom-Abschnitte als Erkennungssequenz, an denen sie das Erbgutmolekül durchtrennen. Dies können kurze vier, sechs oder acht Basenpaare-lange Abschnitte sein, manche Schneideproteine benötigen 20 und mehr Basenpaare.
Aus den Palindrom-Sequenzen des CRISPR-Bereichs werden RNA-Moleküle ausgelesen, die eine sehr stabile Anordnung annehmen (Sekundärstruktur). Sie sind zwischen 23 und 47 Basenpaare lang. Zwischen diesen Abschnitten liegen ähnlich lange variable Regionen. Sie stammen ursprünglich aus dem Erbgut von in die Bakterienzelle eingedrungene Fremd-DNA und werden auch als „spacer“ bezeichnet.
Zu dem CRISPR-Bereich gehört ein Promotor, der dafür sorgt, dass der CRISPR-Bereich abgelesen und in die sogenannte CRISPR-RNA (crRNA) übersetzt werden kann. Benachbart davon liegen dahinter weitere Gene, die sogenannten CRISPR-assoziierten Gene (Cas). Sie liefern die Bauanleitung für die Cas-Proteine – also die Enzyme, die den DNA-Strang durchtrennen. Auf die CRISPR- und „spacer“-Sequenzen folgt ein Abschnitt für ein als tracrRNA bezeichnetes RNA-Molekül, das die Schneidemoleküle zusammen mit der crRNA zu ihren Zielorten auf der Viren-DNA führt.