La bioinformática es un campo interdisciplinario que se encuentra en la intersección entre las “ciencias de la vida” y de la “informática”, proporciona las herramientas y recursos necesarios para favorecer la investigación biológica. Este campo comprende la investigación y desarrollo de herramientas útiles para llegar a entender el flujo de información desde los genes a las estructuras moleculares, a su función bioquímica hasta su conducta biológica. Una definición generalmente aceptada es: “Bioinformática es un campo de la ciencia en el cual confluyen varias disciplinas tales como: biología, computación y tecnología de la información. El fin último de este campo es facilitar el descubrimiento de nuevas ideas biológicas así como crear perspectivas globales a partir de las cuales se puedan discernir principios unificadores en biología. Al comienzo de la “revolución genómica”, el concepto de bioinformática se refería sólo a la creación y mantenimiento de base de datos donde se almacena información biológica, tales como secuencias de nucleótidos y aminoácidos.
El progresivo desarrollo de métodos automatizados de preparación de muestras de ácido desoxirribonucléico, su secuenciación y posterior lectura ha permitido afrontar, a lo largo de la última década, diversos proyectos de secuenciación a gran escala. Algunos datos para entender la magnitud del proyecto son: (1) El genoma humano contiene unos 3000 millones de pares de bases. (2) Contiene unos 100000 genes. (3) Sólo un 10% del genoma codifica proteínas. (4) Se conoce la localización de unos 3000 genes. (5) Existen 24 pares de cromosomas; el menor tiene unos 50 millones de pares de bases, el mayor unos 250 millones. (6) Si se reunieran, los datos del genoma ocuparían 1000 libros de 200 páginas. (7) La diversidad genética humana: 5.000 millones de personas que se diferencian en un 0,1% de su material genético. Esto genera un catálogo de diferencias en secuencias teórico de 5000 billones de registros. Como se puede apreciar en algunos de estos datos, los últimos avances en la investigación en ciencias biomédicas están produciendo un enorme crecimiento en el volumen y la complejidad de la información biológica disponible. Las tecnologías de la información y las comunicaciones son cruciales para posibilitar el almacenamiento e interpretación de estos datos en los centros de investigación. La gran magnitud de la información a manejar se incrementa teniendo en cuenta que para llegar a reconocer dónde comienzan y terminan los genes e identificar sus exones, intrones y secuencias reguladoras se requieren comparaciones entre secuencias de diversas especies. El mapa de secuencias generado por el proyecto se utiliza como fuente primaria de información para la biología humana y la medicina.
La genómica funcional se ocupa de describir la función biológica de los genes mediante el conocimiento de su actividad en: (1) Los rasgos que determinan. (2) La regulación a la que se ven sometidos. (3) La interacción con otros genes. (4) La identificación de un patrón de comportamiento en un gen, dependiendo de las condiciones que le circundan. (5) La actividad que desarrolla el gen cuando está alterado en relación a su actividad normal. La genómica funcional, tradicionalmente, ha asociado rasgos o características visibles, conocidas como fenotipo, con el gen o los genes que los producían, los genotipos. Los avances en los procesos biotecnológicos han permitido determinar qué genes están implicados, la naturaleza de la interacción y el tiempo en la asociación gen-rasgo. Cada célula del organismo tiene el mismo material genético durante toda su vida. Sin embargo, la expresión del gen o su actividad varía de unas células a otras, de unos estadios de desarrollo a otros, en procesos normales o patológicos y en función de las condiciones ambientales. Sólo entendiendo los pormenores de la expresión génica se entienden los procesos biológicos moleculares en los que intervienen los genes. Como ayuda a este propósito, la técnica de los chips de ácido desoxirribonucleico permite el análisis de muchos genes, bajo diferentes condiciones experimentales, en un solo experimento. Además, un rasgo puede venir determinado por un gen o varios genes pueden determinar un solo rasgo. Si se altera esos genes, se reflejará en la característica que expresan.
La genómica funcional es un campo de la biología molecular que se propone utilizar la vasta acumulación de datos producidos por los proyectos de genómica, como los “proyectos genoma” de los distintos organismos, para describir las funciones e interacciones entre genes y proteínas. A diferencia de la genómica y la proteómica, la genómica funcional se centra en los aspectos dinámicos de los genes, como su transcripción, la traducción las interacciones proteína-proteína, en oposición a los aspectos estáticos de la información genómica como la secuencia del ácido desoxirribonucleico o su estructura.
En la genómica funcional se utiliza principalmente técnicas de alto rendimiento para describir la abundancia de productos génicos como el ácido ribonucleico mensajero y las proteínas. Algunas plataformas tecnológicas típicas son: (1) Microchips de ácido desoxirribonucleico. Un chip de ácido desoxirribonucleico es una superficie sólida a la cual se unen una serie de fragmentos de ácido desoxirribonucleico. Las superficies empleadas para fijar el ácido desoxirribonucleico son muy variables y pueden ser vidrio, plástico e incluso chips de silicio. Los arreglos de ácido desoxirribonucleico son utilizadas para averiguar la expresión de genes, monitorizándose los niveles de miles de ellos de forma simultanea. La tecnología del chip de ácido desoxirribonucleico es un desarrollo de una técnica muy usada en biología molecular, el “Southern blot”. Con esta tecnología es posible observar de forma casi instantánea la expresión de todos los genes del genoma de un organismo. De tal forma que suelen ser utilizados para identificar genes que producen ciertas enfermedades mediante la comparación de los niveles de expresión entre células sanas y células que están desarrollando ciertos tipos de enfermedades. (2) Análisis en serie de la expresión génica. Es una técnica de la biología molecular que permite conocer y cuantificar la expresión de los genes en la célula, mediante la medición del ácido ribonucleico mensajero que está presente en un momento determinado. Esto permite crear perfiles de expresión de cada célula en determinadas situaciones, ya sea en circunstancias normales de la célula o en momentos en que se ve afectada por alguna enfermedad. De esta manera se pueden comparar estos perfiles y determinar que genes están siendo apagados o activados, y así determinar cual puede ser la causa de esto. (3) Electroforesis bidimensional en gel. Es un grupo de técnicas empleadas por los científicos para separar moléculas basándose en propiedades como el tamaño, la forma o el punto isoeléctrico. La electroforesis en gel se utiliza generalmente con propósitos analíticos, pero puede ser una técnica preparativa para purificar moléculas parcialmente antes de aplicar una espectroscopia de masas, una clonación o una secuenciación de ácido desoxirribonucleico. (4) Espectrometría de masas. Es una técnica experimental que permite la medición de iones derivados de moléculas. El espectrómetro de masas es un instrumento que permite analizar con gran precisión la composición de diferentes elementos químicos e isótopos atómicos, separando los núcleos atómicos en función de su relación masa-carga. Puede utilizarse para identificar los diferentes elementos químicos que forman un compuesto, o para determinar el contenido isotópico de diferentes elementos en un mismo compuesto. Es una técnica hibrida que se encuentra con frecuencia como detector de un cromatógrafo de gases.
Dada la gran cantidad de datos producidos por estas técnicas y la pretensión de encontrar pautas biológicas significativas en ellos, la bioinformática es crucial para este tipo de análisis. Ejemplos de técnicas de este tipo son el agrupamiento de datos o el análisis de componentes principales para un aprendizaje automático sin supervisión, detección de clases, así como redes neuronales artificiales o máquinas de soporte vectorial para aprendizaje automático supervisado, predicción de clases, clasificación estadística.
De manera general, todas las técnicas que estudian el flujo de la información genética al nivel del ácido desoxirribonucleico, o sea, el genoma, conforman lo que se conoce actualmente bajo el nombre de genómica. La identificación de los elementos estructurales dentro de los genes, tales como los exones y los intrones, los elementos reguladores, etc. se denomina genómica estructural. La genómica funcional es entonces, el estudio del funcionamiento de estos elementos estructurales. El desarrollo de la genómica funcional ha sido posible, en gran medida, gracias al desarrollo de los microchips de ácido desoxirribonucleico y ácido ribonucleico.
El progresivo desarrollo de métodos automatizados de preparación de muestras de ácido desoxirribonucléico, su secuenciación y posterior lectura ha permitido afrontar, a lo largo de la última década, diversos proyectos de secuenciación a gran escala. Algunos datos para entender la magnitud del proyecto son: (1) El genoma humano contiene unos 3000 millones de pares de bases. (2) Contiene unos 100000 genes. (3) Sólo un 10% del genoma codifica proteínas. (4) Se conoce la localización de unos 3000 genes. (5) Existen 24 pares de cromosomas; el menor tiene unos 50 millones de pares de bases, el mayor unos 250 millones. (6) Si se reunieran, los datos del genoma ocuparían 1000 libros de 200 páginas. (7) La diversidad genética humana: 5.000 millones de personas que se diferencian en un 0,1% de su material genético. Esto genera un catálogo de diferencias en secuencias teórico de 5000 billones de registros. Como se puede apreciar en algunos de estos datos, los últimos avances en la investigación en ciencias biomédicas están produciendo un enorme crecimiento en el volumen y la complejidad de la información biológica disponible. Las tecnologías de la información y las comunicaciones son cruciales para posibilitar el almacenamiento e interpretación de estos datos en los centros de investigación. La gran magnitud de la información a manejar se incrementa teniendo en cuenta que para llegar a reconocer dónde comienzan y terminan los genes e identificar sus exones, intrones y secuencias reguladoras se requieren comparaciones entre secuencias de diversas especies. El mapa de secuencias generado por el proyecto se utiliza como fuente primaria de información para la biología humana y la medicina.
La genómica funcional se ocupa de describir la función biológica de los genes mediante el conocimiento de su actividad en: (1) Los rasgos que determinan. (2) La regulación a la que se ven sometidos. (3) La interacción con otros genes. (4) La identificación de un patrón de comportamiento en un gen, dependiendo de las condiciones que le circundan. (5) La actividad que desarrolla el gen cuando está alterado en relación a su actividad normal. La genómica funcional, tradicionalmente, ha asociado rasgos o características visibles, conocidas como fenotipo, con el gen o los genes que los producían, los genotipos. Los avances en los procesos biotecnológicos han permitido determinar qué genes están implicados, la naturaleza de la interacción y el tiempo en la asociación gen-rasgo. Cada célula del organismo tiene el mismo material genético durante toda su vida. Sin embargo, la expresión del gen o su actividad varía de unas células a otras, de unos estadios de desarrollo a otros, en procesos normales o patológicos y en función de las condiciones ambientales. Sólo entendiendo los pormenores de la expresión génica se entienden los procesos biológicos moleculares en los que intervienen los genes. Como ayuda a este propósito, la técnica de los chips de ácido desoxirribonucleico permite el análisis de muchos genes, bajo diferentes condiciones experimentales, en un solo experimento. Además, un rasgo puede venir determinado por un gen o varios genes pueden determinar un solo rasgo. Si se altera esos genes, se reflejará en la característica que expresan.
La genómica funcional es un campo de la biología molecular que se propone utilizar la vasta acumulación de datos producidos por los proyectos de genómica, como los “proyectos genoma” de los distintos organismos, para describir las funciones e interacciones entre genes y proteínas. A diferencia de la genómica y la proteómica, la genómica funcional se centra en los aspectos dinámicos de los genes, como su transcripción, la traducción las interacciones proteína-proteína, en oposición a los aspectos estáticos de la información genómica como la secuencia del ácido desoxirribonucleico o su estructura.
En la genómica funcional se utiliza principalmente técnicas de alto rendimiento para describir la abundancia de productos génicos como el ácido ribonucleico mensajero y las proteínas. Algunas plataformas tecnológicas típicas son: (1) Microchips de ácido desoxirribonucleico. Un chip de ácido desoxirribonucleico es una superficie sólida a la cual se unen una serie de fragmentos de ácido desoxirribonucleico. Las superficies empleadas para fijar el ácido desoxirribonucleico son muy variables y pueden ser vidrio, plástico e incluso chips de silicio. Los arreglos de ácido desoxirribonucleico son utilizadas para averiguar la expresión de genes, monitorizándose los niveles de miles de ellos de forma simultanea. La tecnología del chip de ácido desoxirribonucleico es un desarrollo de una técnica muy usada en biología molecular, el “Southern blot”. Con esta tecnología es posible observar de forma casi instantánea la expresión de todos los genes del genoma de un organismo. De tal forma que suelen ser utilizados para identificar genes que producen ciertas enfermedades mediante la comparación de los niveles de expresión entre células sanas y células que están desarrollando ciertos tipos de enfermedades. (2) Análisis en serie de la expresión génica. Es una técnica de la biología molecular que permite conocer y cuantificar la expresión de los genes en la célula, mediante la medición del ácido ribonucleico mensajero que está presente en un momento determinado. Esto permite crear perfiles de expresión de cada célula en determinadas situaciones, ya sea en circunstancias normales de la célula o en momentos en que se ve afectada por alguna enfermedad. De esta manera se pueden comparar estos perfiles y determinar que genes están siendo apagados o activados, y así determinar cual puede ser la causa de esto. (3) Electroforesis bidimensional en gel. Es un grupo de técnicas empleadas por los científicos para separar moléculas basándose en propiedades como el tamaño, la forma o el punto isoeléctrico. La electroforesis en gel se utiliza generalmente con propósitos analíticos, pero puede ser una técnica preparativa para purificar moléculas parcialmente antes de aplicar una espectroscopia de masas, una clonación o una secuenciación de ácido desoxirribonucleico. (4) Espectrometría de masas. Es una técnica experimental que permite la medición de iones derivados de moléculas. El espectrómetro de masas es un instrumento que permite analizar con gran precisión la composición de diferentes elementos químicos e isótopos atómicos, separando los núcleos atómicos en función de su relación masa-carga. Puede utilizarse para identificar los diferentes elementos químicos que forman un compuesto, o para determinar el contenido isotópico de diferentes elementos en un mismo compuesto. Es una técnica hibrida que se encuentra con frecuencia como detector de un cromatógrafo de gases.
Dada la gran cantidad de datos producidos por estas técnicas y la pretensión de encontrar pautas biológicas significativas en ellos, la bioinformática es crucial para este tipo de análisis. Ejemplos de técnicas de este tipo son el agrupamiento de datos o el análisis de componentes principales para un aprendizaje automático sin supervisión, detección de clases, así como redes neuronales artificiales o máquinas de soporte vectorial para aprendizaje automático supervisado, predicción de clases, clasificación estadística.
De manera general, todas las técnicas que estudian el flujo de la información genética al nivel del ácido desoxirribonucleico, o sea, el genoma, conforman lo que se conoce actualmente bajo el nombre de genómica. La identificación de los elementos estructurales dentro de los genes, tales como los exones y los intrones, los elementos reguladores, etc. se denomina genómica estructural. La genómica funcional es entonces, el estudio del funcionamiento de estos elementos estructurales. El desarrollo de la genómica funcional ha sido posible, en gran medida, gracias al desarrollo de los microchips de ácido desoxirribonucleico y ácido ribonucleico.
Guillermo Choque Aspiazu
http://www.eldiario.net/
Julio 7 de 2008