Interés científico - Complejidad Técnica y Justificación

Las plantas por su naturaleza sésil no pueden escapar de sus enemigos o condiciones adversas por lo que necesitan desarrollar estrategias que mejoren sus posibilidades de supervivencia. Así, las plantas han generado decenas de miles de compuestos químicos que usan para protegerse de la competencia de otros vegetales, para combatir las infecciones, y para hacer frente a cambios de condiciones en su medio ambiente. En consecuencia, las especies vegetales tienen, en general, un genoma de mayor tamaño y más complejo que las especies animales exhibiendo una enorme diversidad en tamaño y estructura. Por ello, la información genómica de los organismos vegetales es per se una fuente importante de conocimiento biológico y eventual beneficio económico. Y si bien el número de genomas de plantas secuenciados es reducido (~60) y en un mundo con ~370.000 vegetales conocidos sólo ~80.000 especies tienen al menos una secuencia en la base de datos GenBank, se está avanzando a pasos agigantados en los últimos años, gracias al progreso en las tecnologías de NGS en paralelo al crecimiento sostenido en la capacidad de trabajo computacional en Big-Data, y se proyecta, que en un salto cuantitativo, estén disponibles unos ~191 genomas en el futuro próximo (http://www.ncbi.nlm.nih.gov/genome/browse/), y miles en la próxima década.

Este salto ha sido, por un lado, fruto del avance tecnológico que ha permitido por ejemplo, que un consorcio de ~300 investigadores de 14 países fuera necesario para secuenciar el genoma de 0,9Gb de tomate (~35X) publicado en 2012, y que el último genoma publicado en 2014 de su pariente la berenjena, ha sido generado por un grupo de sólo 11 investigadores de un único centro de investigación (1,1Gb, ~120X). Por otro lado, este salto tecnológico ha sido acompañado por una exponencial disminución en el costo asociado a estos proyectos, desde los U$S 50,000,000 destinados a Arabidopsis en el año 2000, a los menos de U$S 60,000 preliminarmente sugeridos en secuenciación del presente proyecto.

Sin embargo, la fracción del genoma no transcripto de yerba mate está aún muy poco caracterizada. La base de datos global del NCBI (National Center for Biotechnology Information) presenta tan solo 80 secuencias de I. paraguariensis, las cuales en su mayoría derivan de análisis de marcadores moleculares y pertenecen a la categoría de microsatélites (SSRs). Además se registra el aporte de Gottlieb & Poggio (2010, 2014) quienes ingresaron 7 Kpb de secuencias derivadas de RDA en la base de datos GSS (Genome Survey Sequence). Estas secuencias están en su mayoría no caracterizadas por falta de referencias, y representan una pequeña fracción del genoma que las autoras estimaron en 1670 Mpb. Además, en dicho trabajo se pudo establecer la prevalencia de secuencias de ADN altamente repetitivo en el genoma de la yerba mate, respecto de otra especie co-genérica.

Si se contase con información de secuencia genómica disponible sería posible, en primer lugar, integrarla con la información provista por los experimentos de mapeo genético y transcriptómica, de manera de aprovechar en forma óptima las ventajas que ofrecen estas tecnologías a la caracterización y mejoramiento moleculares. La información derivada del genoma permitiría, entre otros logros: 1) desarrollar marcadores moleculares eficientes que posibilitarían densificar el mapa genético de yerba velozmente y facilitarían el hallazgo de marcadores ligados a caracteres de interés; 2) contar con las secuencias de todos los promotores génicos, que tienen potencial para ser utilizados como herramientas tecnológicas; 3) disponer de información sobre la posición de los intrones en los genes de interés, con posibilidad de determinar si la presencia de variantes alélicas puede estar asociada a eventos de splicing alternativo; 4) diseñar arreglos de tipo “tiling“, que permitirían un análisis detallado de la expresión y el paisaje epigenético en sectores específicos o en el genoma global.

Más aún, la generación de un genoma de yerba mate sería un gran avance en la genómica y la genética de la especie desde un punto de vista económico, ecológico y evolutivo. Proporcionaría las bases de comparación holísticas de los procesos de desarrollo conservados en plantas, la identificación de una amplia gama de funciones de genes específicos de yerba y el establecimiento e implementación sistemática de protocolos de identificación y caracterización de genes para el mejoramiento del cultivo.

Proporcionaría también, información detallada sobre las bases genéticas de las similitudes y diferencias de los diversos cultivos. Se instrumentaría como una herramienta de acceso directo y eficiente a una comprensión mucho más profunda del desarrollo de la planta y las respuestas ambientales, y permitiría develar la estructura y dinámica del genoma como un todo.

La obtención del genoma de la yerba mate utilizando RRHH e infraestructura nacional, posibilitará también el desarrollo de novedosas líneas de investigación que redundarán en aportes al sector productivo. Asimismo, sentará las bases para que futuros proyectos genómicos sean desarrollados en el ámbito nacional.

Los genomas secuenciados y ensamblados han redefinido las ideas actuales sobre la evolución y duplicación genómica que moldeó la estructura actual y la dinámica de los genomas de angiospermas. Así también, los genomas de plantas han permitido la primera generación de genómica funcional que ha ayudado a definir las funciones de cientos de genes, y un acceso sin precedentes a los marcadores de secuencia, proporcionado los más robustos modelos actuales de la historia evolutiva vegetal.

Otra información importante que nace del ensamble de un genoma vegetal es en lo que hace a la identificación de procesos de duplicación génica y que incorporan la redundancia funcional y son imprescindibles en cualquier proceso de mejoramiento vegetal.

Al comparar la organización del genoma, los genes y las regiones intergénicas de yerba mate con los genomas de referencia disponibles de otras especies se podrá identificar regiones altamente conservadas y/o de rápida evolución. Tales regiones se espera que produzcan datos esenciales sobre la evolución del genoma, la especiación y domesticación que ha tenido la especie.

Muchas de las características que distinguen árboles de otros organismos, especialmente sus grandes tamaños y períodos generacionales, presentan desafíos para el estudio de los mecanismos celulares y moleculares que subyacen a la biología única de esta especie. En ese marco, el genoma de la yerba mate se presentará como una posibilidad interesante para explorar hipótesis que vinculen la secuencia del genoma a características asociadas al desarrollo de biomasa, al movimiento de agua y nutrientes, al desarrollo sostenido del cultivo, y a los procesos involucrados en enfermedades en este cultivo perenne.

Más en esta categoría: