Anotación de secuencias repetidas

  • La herramienta más generalizada en la identificación de repeats es Repeat Masker que incorpora la data de Repbase.
  • Un viejo software puede emplearse en búsqueda de repeticiones en tándem: TRF.
  • Para Transposones y LINES se ha utilizado TransposonPSI y MITEs el software MITE-Hunter.
  • Para la identificación de novo de TEs se pueden explorar RepeatScout, LTR_Finder, PILER, RECON, LTR_STRUC.
  • Tools complementarias serían LTRharvest y findltr; también utilización de análisis basados en Hidden Markov Models como HMMER con los siguientes dominios pfam: Reverse Transcriptase (RT) (PF00078, PF07727), Integrase (INT) (PF00665, PF00552, PF02022), RNaseH (RH) (PF00075), GAG (PF03732) y AP (PF00026, PF00077).
  • La mayoría de estos programas están incorporados en la pipeline REPET, la que genera una anotación consenso, basada tanto en predicciones de novo como basadas en databases.
Más en esta categoría: