Porcentaje GC

Escribe un script de python que calcule el contenido GC en porcentaje de la siguiente secuencia de ADN:

ATGCAAATTGTGTGTGCATAATTTATATAGGCTAGAATAGAATCGCTA

Fragmentos de Restriccion

Dada la siguiente secuencia de ADN

ACTGATCGATTACGTATAGTAGAATTCTATCATACATATATATCGATGCGTTCAT

Esta secuencia contiene un sitio de restricción reconocido por la enzima EcorRI, la cual corta el motivo  G*AATTC ( el asterisco indica el sitio exacto del corte). Escribe un programa que calcule el tamaño de los dos fragmentos que se produciran en las secuencia de ADN tras ser digerida con EcoRI

Splicing de intrones

Consideremos la siguiente secuencia de ADN eucariota en la que estamos interesados

ATCGATCGATCGATCGACTGACTAGTCATAGCTATGCATGTAGCTACTCGATCGATCGATCGATCGATCGATCGATCGATCGATCATGCTATCATCGATCGATATCGATGCATCGACTACTAT

Esta secuencia contiene dos exones (region codificante) y un intron (region no codificante). El primer exon comienza al desde la posicion cero de la secuencia hasta la posición 63. El segundo exon hace lo propio desde la base 91 hasta el final de la secuencia.

Cuestiones.

a)Escribe un script que imprima en pantalla solo la región codificante,

b) que calcule el porcentaje de DNA que supone esa secuencia codificante sobre el total del dicho gen,

c) que escriba al final la secuencia de ADN indicando en minúscula el intron y mayúscula los exones dentro de la misma secuencia

Recuerda que si usas Python 2 debes añadir la siguiente linea al comienzo de tu código para habilitar las operaciones de división

from _future_ import division

d) el script debe generar dos archivos uno con las dos secuencias en formato fasta conteniendo los exones y otro archivo conteniendo en formato fasta el intron tal y como sigue:

exones.fasta

>exon1
agcta...
>exon2
agtcgatca

intrones.fasta

>intron
atgctacg....