Recordad que el código genético (véase problema P36671) es un
conjunto de reglas que traduce secuencias de nucleótidos a proteínas.
Cuando se trabaja con ADN en lugar de ARN mensajero, las secuencias de
nucleótidos cambian la base U por la base
T.
A menudo, como reacción de resistencia contra los fármacos, los virus mutan su ADN manteniendo su funcionalidad, es decir, sintetizando la misma proteína. Por ejemplo, si un virus tuviera la secuencia
(1) GCCAATGACTAAGGCCTAAAGA
entonces sintetizaría la proteína Thr–Lys–Ala. Si el virus mutara a la secuencia (2)
(1)
GCCAATGACTAAGGCCTAAAGA
(2)
GCCAATGACCAACGCCTAAAGA
(solo ha cambiado la décima base), este continuaría sintetizando Thr–Lys–Ala. En este caso, decimos que se ha producido una (o más) mutaciones equivalentes.
En cambio, si el virus mutara a la secuencia (3)
(1)
GCCAATGACTAAGGCCTAAAGA
(3)
GCCAATGTCTAAGACCTAAAGA
(solo la octava y la decimocuarta bases), entonces sintetizaría
Ser–Lys–Thr, lo que se nota indicando
Thr-1-Ser,Ala-3-Thr (el número indica en qué codón se ha
producido la mutación).
Hagan un programa que indique si pares de secuencias de ADN
representan mutaciones equivalentes y que, en caso negativo, indique qué
mutaciones se han producido. El programa también debe decir cuántas
bases son diferentes entre el codón ATG y el codón de
Stop.
La entrada comienza con un natural
.
Después, vienen
pares de secuencias de ADN de la misma longitud. Cada secuencia de ADN
está formada por una cadena de caracteres ‘A’,
‘C’, ‘T’ y ‘G’ en una línea sin
espacios.
Todas las secuencias de ADN tienen un codón ATG antes de
un codón de Stop. El codón ATG y el codón de
Stop nunca mutan en ningún par de secuencias ni ninguna
mutación puede introducir un nuevo codón de Stop. Los pares de
secuencias siempre tienen la misma longitud.
Para cada par de secuencias de ADN de la entrada, hay que indicar si son o no son equivalentes. En el caso de que no sean equivalentes, hay que indicar todos los cambios que han producido las mutaciones según la notación estándar descrita anteriormente. El número de bases diferentes se debe escribir al final de la línea, entre paréntesis.
Seguid el formato del ejemplo.
Input
4 GCCAATGACTAAGGCCTAAAGA GCCAATGACCAAGGCCTAAAGA GCCAATGACTAAGGCCTAAAGA GCCAATGTCTAAGACCTAAAGA GCCAATGACTAAGGCCTAAAGA GCCAATGTCTAAAACCTAAAGA GCCAATGACTAAGGCCTAAAGA GCCAATGACTAAGGCCTAAAGA
Output
Equivalents (1) Thr-1-Ser,Ala-3-Thr (2) Thr-1-Ser,Ala-3-Thr (3) Equivalents (0)