Este trabajo se sitúa en el marco de un proyecto de investigación de excelencia que la Consejería de Economía, Innovación y Ciencia ha incentivado con 291.012 euros.
En los últimos años, el secuenciado sistemático del genoma de gran variedad de organismos, como microbios, hongos, plantas y animales, ha puesto a disposición de los investigadores una cantidad de información sin precedentes en cuanto a tamaño, complejidad y usos potenciales.
No obstante, el procesado de esta información para poder distinguir aquellas partes útiles del genoma, es decir, las que codifican proteínas, de las que no contienen información de interés es una tarea compleja. Hasta ahora, separar unas secuencias de otras se ha realizado mediante la comparación con genomas de especies similares o mediante métodos estadísticos. Sin embargo, ambas opciones cuentan con una serie de limitaciones que han llevado a los investigadores de la UCO a proponer como alternativa técnicas de computación evolutiva, es decir, estrategias de Inteligencia Artificial que se aplican en problemas donde no hay una formulación matemática que permita la aplicación de otras técnicas clásicas. “Por ejemplo, si tenemos que detectar un gen relacionado con una enfermedad producida porque no hay una correcta transcripción de una secuencia, la flexibilidad de la computación evolutiva nos podría permitir detectar el punto en el que se ha producido una escisión alternativa en la cadena genética, y por tanto, dónde está el problema”, explica el responsable del proyecto, Nicolás García Pedrajas.
Dada su utilidad, los expertos aplican computación evolutiva al campo del reconocimiento estructural de genes. La información de los genomas (el conjunto de genes) de las especies que se han secuenciado son de acceso libre para la comunidad científica. No obstante, esa cantidad de datos debe ser descifrada para averiguar qué partes de todo el material se corresponden con genes, es decir, cuáles cuentan con una función en el organismo. De esta forma, los investigadores cordobeses han desarrollado un programa informático que descifra secuencias genéticas, es decir, traduce el código y separa los genes de los trozos sin función codificante. “Así predecimos la estructura de los genes, es decir, los localizamos dentro de todo el material genético, que para nosotros son datos”, explica García Pedrajas.
Una vez perfeccionen el sistema de predicción los expertos pretenden implementar una plataforma bajo la filosofía del software libre y accesible desde Internet para que todos los investigadores de las áreas de conocimiento relacionadas puedan compartir ideas, métodos y algoritmos.
Innova Press