Ako nájsť reverzný doplnok sekvencie DNA?
Reverzný komplement sekvencie DNA znamená obsah opačného vlákna v molekule DNA. Molekuly DNA sú konštruované ako také, pretože každý nukleotid má komplementárny nukleotid na druhom vlákne, ku ktorému existuje nekovalentná väzba.
Metóda 1 z 2: ručne
- 1Sledujte sekvenciu dozadu, začínajúc od posledného nukleotidu v sekvencii.
- 2Keď prechádzate cez každý nukleotid, pridajte jeho komplementárny nukleotid do nasledujúceho riadku, pričom začnite doplnený reťazec z ľavej strany stránky. Pamätajte si, že guanín (G) sa viaže na cytozín (C) a adenín (A) sa viaže na tymín (T).
Metóda 2 z 2: programovo (python 2)
- 1Vytvorte alebo prijmite vstupný súbor. Tento článok predpokladá, že vstup je vo formáte FASTA s jedinou sekvenciou na súbor. Nasledujúce kroky tiež predpokladajú, že všetky nukleotidy sú ATGC bázy.
- 2Prečítajte si v súbore. Pre formát FASTA:
- Zlikvidujte prvý riadok súboru.
- Odstráňte všetky zostávajúce nové riadky a ostatné prázdne medzery.
def init (sekvencia): s otvoreným (argv [1]) ako vstup: sekvencia = "".join ([line.strip () pre riadok v input.readlines () [1:]]) návratová sekvencia
- 3Vytvorte hašovaciu tabuľku, ktorá mapuje každý nukleotid k jeho doplnku.
doplnok = {'A': 'T', 'C': 'G', 'G': 'C', 'T': 'A'}
- 4Opakujte sekvenciu a použite vyhľadávanie v hashovacej tabuľke na vytvorenie komplementárnej sekvencie. Prevráťte výsledný vektor.
def reverse_complement (seq): bases = [plement [base] for base in seq] bases = reversed (bases) return bases
- 5Vytlačte obsah vektora. =
result = reverse_complement (seq) print '.join (result)
- Ak počítate spätný doplnok ručne, dvakrát ho skontrolujte! Vynechať pár báz alebo použiť nesprávny doplnok môže byť jednoduché, najmä ak čítate dlhý sled na papieri.
Prečítajte si tiež: Ako určiť smer vetra?