Ako určiť obsah GC v sekvencii DNA?
Obsah guanín-cytozínu alebo obsah GC v sekvencii DNA udáva percento párov nukleotidových báz, kde je guanín naviazaný na cytozín. DNA s vyšším obsahom GC sa bude ťažšie rozpadať.
Metóda 1 z 2: ručne
- 1Sledujte sekvenciu a zhodujte počet nukleotidov cytozínu (C) alebo guanínu (G).
- 2Rozdeľte počet cytozínových a guanínových nukleotidov celkovým počtom párov báz v sekvencii.
Metóda 2 z 2: programovo (python 2)
- 1Vytvorte alebo prijmite vstupný súbor. Tento článok predpokladá, že vstup je vo formáte FASTA s jedinou sekvenciou na súbor.
- 2Prečítajte si v súbore. Pre formát FASTA:
- Zlikvidujte prvý riadok súboru.
- Odstráňte všetky zostávajúce nové riadky a ostatné prázdne medzery.
def init (sekvencia): s otvoreným (argv [1]) ako vstup: sekvencia = "".join ([line.strip () pre riadok v input.readlines () [1:]]) návratová sekvencia
- 3Vytvorte počítadlo. Opakujte údaje a zvyšujte počet svojich počítadiel, keď narazíte na akékoľvek guanínové alebo cytozínové nukleotidy.4
def Obsah GC (sekvencia): GCcount = 0 pre písmeno v poradí: v prípade písmeno == "G" alebo písmeno == "C": GCcount + = 1 návrat GCcount
- 5Rozdeľte počet GC celkovou dĺžkou sekvencie a výsledok zadajte v percentuálnom formáte.6
def main (): skript, vstup = argv sekvencia = "" sekvencia = init (sekvencia) print "% 0,2f"% (float (GCcontent (sekvencia)) / len (sekvencia))
- Ak obsah GC vypočítavate ručne, dvakrát si to skontrolujte! Zle sa dá zle vypočítať, najmä ak analyzujete dlhú sekvenciu na papieri.
Prečítajte si tiež: Ako písať zlomky?