miércoles, 1 de diciembre de 2010

CLAVES ORIGINALES

EL ALMACENAMIENTO GENÉTICO Un post más para reafirmar nuestra teoría del porqué del funcionamiento de sólo un muy bajo porcentaje de nuestro cerebro, y el porqué de unas cuantas cosas más, que pronto publicaremos en este blog.
Mientras tanto, seguimos subiendo noticias respecto al almacenamiento genético/bacterial.
Hace poco tiempo, los chinos anunciaron que habían podido almacenar 90 gigas dentro de una bacteria ( ver nuestro post del 29/11 ) Ahora los norteamericanos hicieron público su propio desarrollo de un nuevo método de almacenamiento de datos que convierte la información en secuencias de ADN y permite almacenar el contenido de un equipo completo de
disco duro en algunos gramos de la bacteria E. coli, y sólo para empezar.
Como parece que finalmente los científicos han hecho foco correcto sobre este tema vamos a ampliar un poco más las explicaciones técnicas del porqué de esta elección:
Incluso las bacterias más simples tienen largas cadenas de ADN con toneladas de bases disponibles para el cifrado de datos, y son por su naturaleza, mucho más resistente al daño ( son
las más resistentes sobrevivientes de la naturaleza -…¿¿de la naturaleza??... - ) y con mucho
mayor capacidad de almacenamiento que los soportes electrónicos tradicionales.
Capaces de sobrevivir a casi cualquier desastre frente a los cuales un soporte electrónico
quedaría sólo en el recuerdo, por reproducción natural las bacterias tienden a crear una enorme cantidad de copias extra de la data, lo cual las hace ideales para preservar o recuperar la informa
ción almacenada.
La elección de los científicos se basó ( acertadísimamente ) en todas esas características sumado al hecho de que cargar data dentro de las bacterias es bastante sencillo, a saber: hay cuatro bases del ADN que pueden ser utilizados para hacer las cadenas de ADN: adenina, citosina, guanina y timina, básicamente un número cuaternario.
Pongamos como ejemplo una palabra; "iGEM" para ingresarla en el código de ADN.
Usando la tabla ASCII para convertir cada una de las letras individuales en un valor numérico (i = 105, G = 71, etc), luego se pueden cambiar desde la base-10 a la base-4 (105 = 1221, 71 = 0.113 , etc.) Por último, los números se pueden cambiar por sus equivalentes de bases de ADN, con 0, 1, 2 y 3 sustituido con A, T, C y G. Y así se convierte en iGEM ATCTATTGATTTATGT, que sería la data en bruto a ingresar.
Luego mediante unos pocos algoritmos se elimina la información redundante y repetitiva ahorrando toneladas de espacio y una repetición nociva en la secuencia de ADN.
Sin embargo, como estas cadenas de ADN no son suficientes como para almacenar información compleja como una fotografía o un libro, la mejor solución disponible por ahora es la fragmentación de los datos en pequeñas piezas y extenderlas entre las diferentes células mediante un sistema que permite identificar los fragmentos y así poderlos recuperar en el orden correcto.
Por lo tanto, se creó una estructura de tres partes para todo el ADN: cabecera, mensaje, y suma de comprobación.
El encabezado es una secuencia base de 8 de largo dividido en cuatro niveles de información de identificación – como en un correo serían zona, región, zona y distrito - que permitirá volver a poner en orden cada fragmento
El mensaje lleva los datos en sí y la suma de comprobación proporciona una repetición de la cabecera original, que es útil en el control de las mutaciones de menor importancia en la bacteria.
¿Cómo se recupera esta info encriptada colocad
a en tan enormecantidad de células de bacterias ?
Se toma el ADN y se lo ejecuta a través de lo que se conoce como la secuenciación de alto rendimiento de próxima generación, o NGS. Este tipo particular de secuencia analiza y compara varias copias de la misma secuencia y luego usa la selección por volumen mayoritario para determinar qué bases son correctas y determina además si algunas partes de los datos se han deteriorado. A continuación, los algoritmos de compresión son invertidos restaurando los datos en bruto en su forma original.
Y finalmente como último paso se colocan los fragmentos juntos en el orden correcto para que las hebras de ADN puedan ser traducidas de nuevo a datos útiles.
Otra consecuencia natural de este proceso es que quien no posee los datos del cifrado e intente leer las secuencias se encontrará con fórmulas sin el menor sentido, por lo cual la propia compresión obra como poderosísimo password de encriptación y seguridad.
Con un solo gramo de células de E.Colli puede almacenar hasta 900.000 gigabytes (o 900 terabytes) de datos, es decir, estas bacterias tienen 900 veces más capacidad de almacenamiento que los más modernos discos duros comerciales actuales.
En el caso de la E.Coli obviamente se utilizaron las cepas no virulentas de la bacteria

No hay comentarios:

Publicar un comentario