Uso del ADN para el Proceso de Datos: Confluencia entre Biotecnología e Informática

AutorKay Beese

¿ Necesitamos una tecnología informática no basada en los semiconductores ?

La vertiginosa evolución de la informática oculta el hecho de que aún hay muchos problemas matemáticos importantes que los ordenadores convencionales no son capaces de resolver en un plazo razonable. Un modelo para tales "problemas duros" es el llamado "problema del vendedor ambulante"; la tarea de determinar la ruta más corta entre un número de ciudades. A medida que crece el número de las ciudades, el número de posibles rutas crece como n!, o n factorial, siendo n el número de ciudades. Si un ordenador utiliza 5 segundos en resolver un ejemplo de 10 ciudades, consumiría unos 100.000 años en resolver uno de 20 ciudades (Matthews, 1995). Este ejemplo pertenece al importante grupo de los problemas NP (tiempo polinomio no determinista), los cuales se consideran "inherentemente insolubles", lo cual quiere decir que se cree que no existe el algoritmo polinomio determinista que los resuelva de una manera eficiente. La confección de los horarios (rutas ferroviarias, aéreas; programas docentes) pertenecen típicamente a este grupo y la optimización podría ahorrar una cantidad enorme de recursos. El diseño de las redes, la minimización del espacio de almacenamiento y el diseño molecular no son más que unos ejemplos más (véase Garey & Johnson 1979).

(The "Travelling Salesman" Problem

El problema del "Vendedor Ambulante"

(the number of possible paths connecting all cities)

la cantidad de posibles rutas entre todas las ciudades

(number of possible routes)

número de posibles rutas

(number of cities)

número de ciudades

(... grows rapidly with the number of cities)

(... crece rápidamente en función del número de ciudades)

Fig 1. El problema del vendedor ambulante es un típico problema NP. El número de posibles rutas para visitar una vez la totalidad de un número determinado de ciudades crece como n! (n factorial, siendo n el número de ciudades) si para cada par hay una sola conexión.

Si bien los ordenadores de vanguardia pueden realizar con facilidad 100 millones de instrucciones por segundo, el número de procesadores conectados en paralelo es pequeño (hasta mil). Pero la resolución de los problemas NP exige un enfoque basado en un elevado grado de paralelismo. La tecnología de la circuitería integrada está rozando sus límites físicos y técnicos. Es más, al cortar a la mitad el tamaño, los costes de producción aumentan en un factor de cinco, lo cual significa que el desarrollo de los ordenadores clásicos alcanzará su tope económico mucho antes de llegar a los límites físicos (Birge 1995, Lloyd 1995).

English Spanish

Different Computer Concepts .. Diferentes Conceptos Informáticos - sus Ventajas y Desventajas

Concept Concepto

speed velocidad

parallelism paralelismo

technology tecnología

stage etapa

Silicon chip computer Ordenador de chip de silicio

rather fast .. bastante rápido

100mio MIPS

limited limitado

1000 processors 1000 procesadores

simple sencilla

standard estándar

DNA computer Ordenador ADN

slow lento

huge (1020) enorme (1020)

complicated complicada

model modelo

Optical computer Ordenador óptico

very fast muy rápido

limited limitado

simple sencilla

reality realidad

Quantum computer Ordenador Cuántico

fast rápido

huge enorme

complicated complicada

theory teoría

Tabla 1: los ordenadores de chip de silicio y los ordenadores ópticos no tienen parangón en términos de velocidad de tratamiento, pero nuevos conceptos permiten un grado todavía desconocido de tratamiento en paralelo.

El elevadísimo grado de paralelismo que caracteriza los bioordenadores puede aplicarse a la solución de problemas difíciles

Hay ideas para un tratamiento de datos más eficiente

En años recientes se han desarrollado algunas ideas nuevas para el uso de los fenómenos naturales no electrónicos para la computación eficiente y real. Se han tratado teóricamente varios conceptos para aumentar el grado de paralelismo, con énfasis especial sobre los mecanismos de mecánica cuántica (Lloyd 1995) o biomoleculares (Rooß y Wagner 1995, Birge 1995). Si bien la computación mecánica-cuántica está todavía en la etapa teórica, el cálculo con ADN se ha convertido en realidad.

... y fue aplicado con éxito a finales de 1994 en EE.UU.

Octubre 1994 - Comienza la era de la computación con ADN

En octubre de 1994, Leonard Adleman de la Universidad de California del Sur demostró en un experimento muy útil cómo una serie de reacciones de ADN podía resolver en un instante un problema estrechamente relacionado con el del vendedor ambulante, a saber el problema del camino Hamiltoniano, el cual requería el descubrimiento de un camino continuo que vinculara todos las (siete) ciudades (Adleman 1994, Bass 1995). 1 La idea general era usar un gran número de cadenas de ADN como "procesadores" que computaban en paralelo (véase la fig.2; para los detalles técnicos véase Adleman and Beaver 1995). El diseño de este experimento precisaba no sólo un entendimiento del problema matemático sino también unos conocimientos detallados de la estructura, los mecanismos moleculares y las técnicas del ADN (síntesis de ADN, hibridización, PCR, purificación de afinidad, PCR graduado, etc.)

1). El problema del camino Hamiltoniano trata de la identificación de un camino que enlace la primera y la última ciudad designadas (nodos), visitando cada ciudad una vez solamente, en un esquema en el que las ciudades están representadas por nodos, y las líneas que enlazan los nodos representan los caminos de sentido único admisibles entre los nodos.

Fig. 2

El Experimento Adleman

(archivo Pincel)

Fig.2: El principio del experimento informático con ADN de Adleman, ideado para encontrar un camino que enlace siete ciudades. Se establecen de antemano las ciudades de partida y llegada, así como las posibles conexiones y su sentido.

Sistemas basados en el uso de biomoléculas en minúsculas probetas pueden, en teoría, realizar un billón de billones (según el uso anglosajón del término) de operaciones a la vez, mucho más de lo que son capaces todos los ordenadores del mundo trabajando conjuntamente. Un attomolde oligonucleotides hubiera bastado para el experimento de Adleman. No obstante, el ejemplo del vendedor ambulante sólo puede servir de modelo para problemas económicamente más importantes, y el uso a fuerza bruta del algoritmo en este caso sería demasiado ineficiente para un problema que involucre muchas ciudades. ¿ No ha sido más que una curiosa anécdota este experimento en la historia de la informática ?

No parece así, aun cuando muchos investigadores dudan de que la biocomputación pueda aplicarse jamás a gran escala. Richard Lipton (1994) demostró que Adleman había resuelto un problema NP completo, lo cual significa que tal sistema - un ordenador ADN - puede adaptarse para resolver cualquier problema NP. Dada la enorme importancia económica de tales problemas, parece que vale la pena comprobar la factibilidad del enfoque.

Si bien no se prevé la incorporación inmediata de los bioordenadores, sí pueden ser factibles las máquinas híbridas

La probeta de ADN, ¿ reemplazará al chip de silicio ?

Nadie aboga por el ordenador puramente biomolecular. El sistema ideado por Adleman estaba diseñado para resolver unos problemas muy específicos - del tipo NP. Otros cálculos pueden realizarse más eficazmente con ordenadores convencionales. Si bien muchos problemas computacionales (incluso problemas no de NP) pueden resolverse por el camino de un paralelismo masivo, las máquinas híbridas que combinan el ADN y los sistemas de semiconductores parecen mucho más factibles que el bioordenador puro. Hasta los sistemas híbridos podrían ser cincuenta veces más pequeños y hasta cien veces más rápidos que los ordenadores actuales (Birge 1995).

... con la ayuda de la automatización y la miniaturización

Valiéndose de la tecnología actual, el experimento Adleman precisa una semana de trabajo de laboratorio, y este plazo debería crecer linealmente en función del número de ciudades. Para cada problema la composición de la cadena de ensayo de ADN tiene que diseñarse específicamente. Es obvio que sólo una automatización de estos procesos en ordenadores de sobremesa pequeños hará practicable la biocomputación. Se está desarrollando para usos biomédicos la automatización de los procesos y la miniaturización de los dispositivos hasta el tamaño del chip, pero también estas técnicas podrían aplicarse al proceso de datos biomolecular. Los requisitos en términos de tamaño, velocidad, fiabilidad y robustez son muy similares.

¿ Hasta dónde ha llegado la tecnología en Europa, EE.UU., y el Japón ?

El proceso de datos biomolecular está lejos de estar operacional y es demasiado temprano saber qué rumbo tomarán los ordenadores biomoleculares. Parece que en términos de una aproximación práctica a la biocomputación, no se ha publicado nada desde que Adleman presentara su experimento en el otoño de 1994, ni en EE.UU, el Japón o Europa. Sin embargo, aún sin ser perceptible para la mayoría de los científicos, los progresos en este campo parecen ser rápidos; los laboratorios intentan resolver problemas cada más difíciles y diseñar un tipo de ordenador ADN universal. Representantes de empresas norteamericanas (AT&T Bell Laboratories) y japonesas (NEC) ya han expresado su interés en estos acontecimientos (Kolata 1995).

La falta de cooperación entre las disciplinas impide futuros desarrollos

La investigación europea está al día por lo que se refiere a la evaluación teórica del potencial de la biocomputación (p.ej. Universidad de Würzburg, véase Rooß & Wagner 1995), y hay un interés muy extendido en el tema. Sin embargo, debido a la falta de cooperación entre los tecnólogos de la información y los geneticistas moleculares, no se ha demostrado empíricamente la factibilidad de los conceptos teóricos.

La necesidad de explorar la colaboración multidisciplinaria para no quedar excluido

Las consecuencias para la financiación de proyectos de I + D

La 'Multidisciplinaridad' es una palabra mágica para los responsables de la I + D, pero suele ser una continuación de los enfoques convencionales que simplemente los hace más eficientes a través de la cooperación de diferentes especialistas. La investigación de la computación ADN deja muy atrás tales conceptos. La investigación biológica y la informática han sido por su aproximación totalmente divergentes. La biología busca comprender sistemas plenamente formados, mientras que el desarrollo de la informática comienza desde la base. Solamente en algunas ocasiones, como en el caso de los algoritmos genéticos, han podido los científicos de la informática valerse de los trucos del oficio de la naturaleza (Levy 1995).

De no progresar hacia la experimentación práctica y el desarrollo técnico - como en otros campos de la tecnología informática - podría perderse un mercado potencial frente a los competidores norteamericanos y japoneses. Los conocimientos y destrezas existen en Europa, y su fusión podría conducir a un gran adelanto. Los programas de investigación actuales raramente contemplan la financiación de tales proyectos, pero una adaptación en este sentido parece prometedora. La explotación comercial precisa la pronta intervención por parte de la I + D industrial, enfocada a la automatización de la síntesis y análisis del ADN.

Referencias

Adleman, L.M., 1994, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, pp 1021-1024.

Bass, T.A., 1995, Gene Genie, manuscrito inédito.

Beaver, D., 1995, Computing with DNA, manuscrito inédito.

Birge, R.R., 1995, Computer aus Proteinen. Spektrum der Wissenschaft, Noviembre de 1995, pp 30-36,

Garey, M.R. & Johnson, D.S., 1979, Computers and Intractability - A Guide to the Theory of NP-Completeness, W.H.Freeman & Co. Nueva York.

Kolata, G., 1995, A Vat of DNA May Become the Fast Computer of the Future, N.Y. Times News Service.

Leutwyler, K., 1995, Calculating with DNA, Scientific American, Septiembre de 1995.

Levy, S., 1995, Computers Go Bio, Newsweek 1 de Mayo, p.48.

Lipton, R.J., 1994, Speeding up Computations via Molecular Biology, manuscrito inédito disponible en World Wide Web en http://www.cs.princeton.edu/~rjl/

Lipton, R.J., 1995, DNA Solution of Hard Computational Problems, Science, Tomo 268, 28 de abril de 1995,pp 542-545

Lloyd, S., 1995, Quantum-Mechanical Computers, Scientific American, Octubre de 1995, pp 44-50.

Matthews, R., 1995, Hard Maths ? No Problem.

Rooß, D. & Wagner, K.W. 1995, On the Power of DNA-Computers, manuscrito inédito disponible en World Wide Web en http://haegar.informatik.uni-wuerzburg.de/pub/TRS/ro-wa95.ps.gz.

Frases Clave: I + D interdisciplinaria, biocomputación, proceso de datos en paralelo, problemas NP

Autor y Contacto: K.Beese, IPTS

tel +34-(9)5-44 88 324. Fax +34-(9)5-44 88 326

e-mail: kay.beese@jrc.es

The IPTS Report, is the refereed techno-economic journal of the IPTS,

edited by D. Kyriakou, published monthly in English, French, German and

Spanish.

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR