Meine Merkliste
my.bionity.com  
Login  

Nukleotidsequenz



  Die Nukleotidsequenz oder Basensequenz ist in der Genetik die Abfolge der Nukleotide einer Nukleinsäure. Bei DNA-Sequenzen werden für die vier Basen Adenin, Guanin, Thymin und Cytosin die Symbole A, G, T und C verwendet. RNA-Sequenzen werden auf die gleiche Weise dargestellt, die Nukleinbase Thymin ist hier allerdings durch Uracil ersetzt. Daher setzen sich RNA-Sequenzen aus den Symbolen A, C, G und U zusammen.

Übereinkunftsgemäß wird die Nukleotidsequenz vom 5'-Ende zum 3'-Ende des Stranges gelesen, in der gleichen Richtung, in der die Polymerase die Nukleinsäure synthetisiert.

Bestimmung

Eine DNA-Sequenz wird durch DNA-Sequenzierung ermittelt. DNA-Sequenzen werden unter anderem in großen öffentlichen Genom-Datenbanken wie z. B. GenBank gespeichert.

Statistische Analyse

Aufgrund der Darstellung als Symbolfolge lässt sich die DNA statistisch gut untersuchen. Es kann beispielsweise die Häufigkeit so genannter n-Tupel, d. h. das Vorkommen von Teilwörtern der Länge n untersucht werden. So taucht im menschlichen Genom im Mittel die Folge "CG" deutlich seltener auf als alle anderen 2er-Wörter. Die lokalen Häufigkeitsverteilungen verschiedener Nukleotidwörter können erste Hinweise auf die Funktionen bestimmter DNA-Abschnitte geben (CpG-Inseln, Stoppcodons, Sequenzenden von Introns).

Siehe auch

 
Dieser Artikel basiert auf dem Artikel Nukleotidsequenz aus der freien Enzyklopädie Wikipedia und steht unter der GNU-Lizenz für freie Dokumentation. In der Wikipedia ist eine Liste der Autoren verfügbar.
Ihr Bowser ist nicht aktuell. Microsoft Internet Explorer 6.0 unterstützt einige Funktionen auf ie.DE nicht.