Artículos

Pero a ver, ¿qué es esto de bioinformática?

whatbioinformatica

¿Qué es la bioinformática? ¿Y tú me lo preguntas?
Bioinformática eres tú.

Gustavo Adolfo Bécquer, PhD.

Pues sí, siendo este el blog que es, la lógica me obliga a que la primera entrada sea precisamente para explicar qué narices es esto de la bioinformática.

La bioinformática es una disciplina relativamente nueva y no ampliamente conocida en la sociedad (pare empezar, el corrector me marca la palabrita como incorrecta y me lo corrige por “informática”).

Antes de empezar con definiciones sacadas de la wikipedia mi propia definición, he hecho un pequeño sondeo por twitter para saber qué pensaba la gente que era la bioinformática, y me he encontrado con esto:

Captura de pantalla de 2015-03-16 09:06:06

Como podéis ver, la mini-encuesta fue un éxito: dos personas contestaron correctamente (tres, si contamos la opción de que yo soy evoco a bioinformática), a grandes rasgos en lo que consiste la disciplina estudiada. Así que, como cuatro personas es una muestra muy significativa, podemos concluir que el 50% de la población sabe lo que es la bioinformática.

Ahora en serio…

Así que bueno, ¿qué es esto de bioinformática? Antes de empezar a definir conceptos, analicemos un poco el background sobre el que nos movemos. Actualmente, y sobretodo con la entrada en el siglo XXI, hemos vivido una informatización en todos los sectores: administración pública, hospitales, educación, etc. Ahora parece imposible concebir algún área en la que no exista algún tipo de soporte informático, y la biología/biomedicina no iba a ser distinta.

La bioinformática apareció por la necesidad de almacenar y manejar los datos obtenidos por diferentes técnicas experimentales en el laboratorio, pero con el tiempo y gracias a los grandes avances de los últimos años en materia de secuenciación de genomas e identificación de patrones de expresión de genes, ha adquirido nuevas dimensionalidades y áreas de investigación.

Análisis de secuencias y de genomas

Con el Proyecto Genoma Humano se cumplió un hito en la ciencia: conseguir secuenciar los 3.164.700.000 de bases nitrogenadas que contiene el ADN del ser humano. Desde entonces, las técnicas de secuenciación han avanzado y se han perfeccionado muchísimo, hasta el punto en el que han aparecido proyectos masivos cuya intención es secuenciar el ADN de miles de individuos. Obviamente, el objetivo no es solo obtener una lista increíblemente larga de pares de bases, si no encontrar diferencias entre individuos, identificar nuevos genes y precisar sus funciones.

Pero la secuenciación no solo se aplica en un contexto del genoma completo, si no que cada vez más se incluyen técnicas de secuenciación para el diagnóstico y la selección de tratamiento para diferentes tipos de cáncer. Además, no solo nos interesa secuenciar el genoma de los humanos. También se han secuenciado los genomas de otras especies, sobretodo de aquellas que pueden servirnos como organismos modelo para estudiar funciones de genes y tratamientos para distintas enfermadades. Ya os podéis imaginar la increíble magnitud que tiene todo esto de la secuenciación.

Con la cantidad ingente de datos que se obtienen mediante todas estas técnicas, solo hay una forma posible de analizar los elementos obtenidos: mediante la informática. Pero el problema informático no solo se limita a analizar, comparar y anotar secuencias, si no también a cómo almacenar tantos datos y ponerlos a disposición de cualquiera que quiera consultarlos (por aquella máxima de compartir el conocimiento con el objetivo de avanzar). Actualmente, nos encontramos con una barrera tecnológica increíble, hasta el punto en que en muchos casos sale más a cuenta volver a secuenciar algo que almacenarlo en algún servidor, puesto que se necesita una gran cantidad de espacio.

Microarray.
Un microarray es un chip de ADN cuyo objetivo es determinar la expresión de un conjunto de genes determinados. Estos microarrays también generan gran cantidad de datos que posteriormente deben ser analizados con herramientas bioinformáticas.

Así pues, bajo este panorama, encontramos que la bioinformática se encarga de tareas indispensables en el tratamiento de toda la información obtenida. Para ello, nos podemos servir de herramientas variopintas en función de lo que cada investigador necesite obtener:

  • Herramientas de alineamiento de secuencias (por pares o múltiples), para encontrar similitudes entre secuencias de distintas especies hasta lograr reconstruir un árbol filogenético y generar nuevas teorías de evolución. Estos alineamientos también nos sirven para comparar genes con funciones desconocidas con otros cuyas funciones conocemos y así poder llegar a inferir sus posibles funciones de acuerdo con las similitudes que presentan.
  • Herramientas para detectar patrones de expresión. Esto será especialmente interesante en casos de cáncer, puesto que cada tipo y subtipo tiene unos patrones de expresión genética determinados, muy diferentes a los de un tejido sano. Así pues, estas técnicas nos ayudarán al diagnóstico y a la elección del tratamiento adecuado.
  • Herramientas para análisis de datos obtenidos. Usualmente se han usado técnicas simples de estadística para el manejo de datos biológicos, la confirmación de hipótesis y la extracción de correlaciones significativas entre variables. Con el tiempo y la generación de datos cada vez más masivos, se ha observado que las técnicas de machine learning son muy útiles para analizar estos datos y extraer hipótesis que luego pueden ser corroboradas o no por la estadística clásica.

Simulaciones y modelados moleculares

Pero el amplio y apasionante mundo de las secuencias de ADN no son la única área en la que trabaja la bioinformática. También encontramos otro área de interés, sobretodo para las empresas farmacéuticas: las simulaciones y modelados moleculares.

Estas técnicas consisten en simular el movimiento de una o varias moléculas (como su propio nombre indica) durante un lapso de tiempo que generalmente no supera unos pocos nano o milisegundos. La parte importante de esta herramienta consiste en calcular las fuerzas que actúan sobre cada átomo en cada intervalo de tiempo del orden de fentosegundos, por lo que podréis deducir que todos estos miles de millones de cálculos tienen un coste computacional muy elevado, así que aquí también nos encontramos con una barrera tecnológica.

Modelado y simulaciones moleculares.
El modelado molecular y las simulaciones permiten observar moléculas de distinta índole en disolución acuosa, para poder estudiar su comportamiento a niveles que no pueden conseguirse de forma experimental.

La utilidad de las técnicas de simulación y modelado molecular también abarca diferentes ámbitos y tiene diferentes aplicaciones, entre ellas:

  • Búsqueda de nuevos fármacos potenciales. Mediante técnicas de simulación molecular se pueden testear gran cantidad de moléculas (una por una) contra aquella diana farmacológica que queramos estudiar, para poder seleccionar aquellas moléculas que obtengan mejores resultados en cuanto a afinidad. Estas moléculas seleccionadas luego podrán pasar a la fase experimental en el laboratorio. Este paso previo de simulación, nos permite descartar moléculas que no obtendrían buenos resultados en el laboratorio, por lo que el ahorro de tiempo y material es elevado.
  • Estudio de comportamiento de moléculas y proteínas en disolución. Estos estudios permiten observar procesos imposibles de determinar en el laboratorio, tales como el plegamiento de las proteínas. Este proceso es extremadamente interesante, puesto que las proteínas pasan de una estructura primaria (una secuencia lineal de aminoácidos) a una estructura terciaria y, en ocasiones, cuaternaria, en la que adquieren una conformación específica. Hay miles de conformaciones posibles para una proteína, pero solo una ellas es la correcta y la hará biológicamente activa. Por este motivo, es muy interesante determinar cómo es posible que la proteína llegue a plegarse de la forma correcta, eligiendo el camino que la llevará a esta conformación activa.
  • Modelado de estructuras terciarias a partir de proteínas similares. En este caso partimos de una secuencia de aminoácidos y de ADN, que sabemos que codifica para una proteína, pero que no tenemos idea de qué conformación pueden adoptar. Mediante comparación entre proteínas similares, pero de distintas especies, podemos modelar nuestra secuencia y convertirla en una estructura terciaria.

En definitiva…

Con esto han quedado descritas dos de las principales ramas en las que trabaja la bioinformática, pero todavía quedan muchísimas más: básicamente cualquier elemento que una la biología y/o biomedicina con la informática, puede englobarse en el término que aquí estamos estudiando.

Si queréis un poco más de información, y sin que sirva de precedente, aquí tenéis un enlace a la página de la Wikipedia, en la que encontraréis una información más detallada sobre las principales líneas de investigación en bioinformática y referencias muy interesantes sobre el tema.

Sin más dilación, yo me despido por el momento esperando qué os haya quedado más claro que la bioinformática no tiene nada que ver con el mundo Digimon, muy a mi pesar.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s