sábado, 26 de abril de 2014

Google ingresa en la era de la secuenciación masiva.

Estamos viviendo un punto de inflexión en la historia en el cual aumenta exponencialmente la posibilidad de recolectar gran cantidad de información acerca de las secuencias del genoma de los individuos, junto con la información clínica necesaria. Mediante la comprensión de la relación entre los genotipos y fenotipos podemos descubrir los mecanismos de la enfermedad, desarrollar diagnósticos - predicciones de riesgo y aumentar el conocimiento para el descubrimiento de nuevos fármacos. Dominar la temática implica manejar un conjunto de datos muy grandes, más grande de lo que cualquier centro de investigación puede recoger por su cuenta. La secuenciación del genoma de una sola persona puede llegar a generar mas de 100 gigabytes de datos en bruto y,  para estudiar los datos de millones de muestras, estos pueden llegar a sumar mas de 100 petabytes, una cifra que requiere de una potencia de calculo realmente inalcanzable para muchos científicos. En tal sentido Google y la Alianza Global para la Genómica y Salud presentaron su primer proyecto conjunto: Google Genomics. El proyecto presenta una nueva API (Application Programming Interface) tendiente a permitir a los investigadores acceder a la potente nube de Google para compartir y procesar la información genómica y clínica (la API es pública de código abierto)...
El proyecto Google Genomics surge en un contexto en el cual Craig Venter acaba de anunciar la creación de una nueva compañía denominada Human Longevity Inc (HLI) cuyo objetivo es secuenciar 40.000 genomas al año para dar soluciones en el área de la salud y el Centro del Genoma de Nueva York anuncia un convenio con IBM para utilizar el poderoso sistema informático Watson en el diagnóstico y la elección de los tratamientos más adecuados para el cáncer.
Cuando el río suena…

Lectura complementaria:
I Simposio Internacional de Secuenciación Masiva del ADN.