Definiciones Clave en Genética y Genómica

GEN

Se puede definir desde dos puntos de vista:

Herencia: según este modelo, un gen es la unidad física y funcional de herencia que porta información de una generación a la siguiente, y que está relacionada con el fenotipo. Este es el modelo clásico de definición.
Molecular: este modelo afirma que un gen es una región localizable en el genoma, correspondiente a una unidad de herencia, que está asociada con secuencias reguladoras (que pueden estar muy lejos del transcrito y decidir cuándo y cuánto se manifiesta un gen), regiones que se transcriben y/u otras regiones de la secuencia funcional (que pueden no transcribirse). Es decir, es una sección de nuestro genoma que posteriormente dará ARN funcional y ARN que se va a transcribir y dar un péptido.

GENOMA HUMANO

Es la información genética propia de nuestra especie, es decir, los 24 cromosomas lineales: 22 autosomas y 2 sexuales (X, Y). Además, también hemos de incluir el cromosoma mitocondrial. El genoma de un individuo es la información específica de una persona, es decir, la información de sus células. Todos los seres humanos tenemos un genoma diploide, pues recibimos un juego de cromosomas por parte del progenitor masculino y otro del progenitor femenino.

PSEUDOGENES

Son secuencias de ADN que se asemejan mucho a la presente en uno de los genes de un organismo, pero no se consideran como tal por haber fallos en la copia de esos genes.

ELEMENTOS REPETIDOS DISPERSOS

Estos elementos son relativamente inactivos, entre otros aspectos porque estas secuencias sufren modificaciones inactivadoras típicas de la heterocromatina, pero todavía pueden provocar enfermedades genéticas de novo, modificaciones somáticas e incluso, evolución.

Secuencia LINE: medio millón de copias: 6000 pares de bases en humanos. Esta secuencia se encuentra activa desde hace 150 millones de años. Su subfamilia más numerosa es la L1. Se estima una transposición (mutación) cada 200 nacimientos.
Secuencia SINE-1: más de medio millón de copias: 300 pares de bases en humanos. Se encuentra activa desde hace 65 millones de años. En humanos se conocen también como la familia Alu por representar la secuencia diana para la endonucleasa de restricción Alu. Se calcula una transposición cada 20-200 nacimientos.
Secuencia SVA: exclusivo de homínidos: 2000 pares de bases. Activo desde hace 25 millones de años. En humanos se han encontrado más de 3000 copias por genoma. Se calcula una transposición cada 800 nacimientos.

POLIMORFISMO

Es un cambio en la secuencia de ADN (una aparición de 2 o más alternativas para una secuencia genética), que por sí mismo no produce enfermedad ni patología, y que además está en más del 1% de la población. A partir de esta definición, vamos a encontrar dos conceptos adicionales. Pueden ser neutros y no tener ningún efecto, pero ciertas combinaciones de polimorfismos pueden favorecer el desarrollo de algunas patologías o, por el contrario, aportar protección.

MUTACIÓN

Variante génica entre individuos que por sí misma produce enfermedad y es habitual que esté en menos del 1% de la población, pero puede estar en frecuencia mayor, por ejemplo, la mutación recesiva que subyace a la fibrosis quística.

VARIANTES RARAS

Son cambios de secuencia entre individuos de la misma especie que por sí mismos no producen enfermedad, pero que aparecen en menos del 1% de la población, por lo que sus efectos son muy difíciles de encontrar.

SINGLE NUCLEOTIDE POLYMORPHISM (SNP)

Son los polimorfismos más conocidos. Son cambios en un único nucleótido en la secuencia de ADN. Normalmente en los seres humanos intervienen dos bases: algunos SNP se dan en la A (adenina) y otros están en la G (guanina). La mayor parte son neutros; otros producen un cambio de aminoácido, dando lugar a aminoácidos con el mismo efecto, o que vayan a un promotor y se altere ligeramente la velocidad de transcripción, por ejemplo. Pueden estar en genes codificantes o decodificantes, y su proporción es del 0,01%, pero hay regiones donde esa proporción es mayor que en otras.

HAPLOTIPO

Es una secuencia de ADN, segmento de un cromosoma, que abarca un conjunto de SNPs que se transmiten de padres a hijos siempre juntos, en bloque. Si se habla de haplotipo, se debe especificar a qué región cromosómica se refiere. En cada subpoblación hay diferentes haplotipos para cada región cromosómica. Un individuo tiene dos copias para cada región cromosómica, luego puede tener dos haplotipos distintos para esa región. Si se conoce el haplotipo para una región determinada, entonces conocemos todos los SNPs de la misma, es decir, su secuencia. No se tienen en cuenta las variantes raras o las mutaciones que pasan desapercibidas si no se secuencian. Pero sí va a haber mutaciones que van asociadas a haplotipos concretos.

Tag SNPs

Son un tipo de polimorfismos de variación de un único nucleótido (SNP) en una región del genoma con alto desequilibrio de ligamiento (la asociación no aleatoria de los alelos en dos o más loci). Es posible identificar la variación genética sin conocer el genotipo de cada SNP en una región cromosómica. Las Tag-SNPs son útiles en estudios de asociación de SNP de todo el genoma en el que se estudiaría el genotipo de cientos de miles de SNPs a través de todo el genoma.

STR

Polimorfismos de repeticiones en tándem cortas. Son secuencias de ADN muy polimórficas, pues no nos encontramos frente a dos alelos, sino más; lo que hace que haya una mayor probabilidad de que los individuos sean diferentes. Son repeticiones de 1 a 5 pares de bases. Hay dos tipos: el principal consiste en una serie de hebras que son susceptibles de mutaciones (secuencias de 3 o 4 pares de bases) que en ciertas familias sufren inestabilidad, lo que provoca que se amplifiquen el número de copias, pudiendo dar lugar a una mutación, que además es inestable, y que se va aumentando con el paso de las generaciones, dando lugar a un patrón de herencia que se llama anticipación.

ANTICIPACIÓN

Fenómeno que consiste en que tras la identificación del primer individuo afectado en la genealogía, en el árbol familiar, se puede observar en las siguientes genealogías (poder no significa que siempre vaya a ocurrir) un empeoramiento progresivo de la enfermedad, que puede consistir o en una edad de aparición más temprana o en un agravamiento de los signos clínicos de la patología, o bien la aparición de síntomas nuevos. En algunas genealogías tiene un empeoramiento muy grave y en otras puede que resulte inocuo. Puede ser o por alteraciones en los genes TERC, TERT y disquerina de la telomerasa, o por expansión y acumulación de tripletes.

CODIS

Sistema de Índice Combinado de ADN (CODIS, en sus siglas en inglés) es el término genérico utilizado para describir el programa del FBI de apoyo a las bases de datos de ADN de justicia penal, así como el software que se utiliza para ejecutar estas bases de datos. Consiste en la identificación de 13 STRs distribuidos en distintos cromosomas, de tal forma que permite la identificación inequívoca de un individuo, puesto que lo que se hace es multiplicar probabilidades. Se han elegido estas frecuencias porque se amplifican muy rápidamente e incluso cuando se han degradado. El proceso comienza con la diferenciación de los polimorfismos con una amplificación inicial y luego se hace un electroferograma que es una electroforesis de los genes marcados con clorocromos unidos a los primeros. Para identificar el sexo, existe un polimorfismo que está relacionado con el gen de la melogenina, presente en el cromosoma Y en la región no homóloga, de tal forma que siempre se encuentra en varones.

VNTR

Número variable de repeticiones en tándem (del inglés Variable Number of Tandem Repeats) o minisatélites, son repeticiones de secuencias de 9 a 100 pares de bases que se utilizan como marcador molecular. El número de repeticiones es variable, pero en general es menor a 1000. Son más grandes y se encuentran en los extremos de los cromosomas. También son muy polimórficas y son las secuencias minisatélites. Se amplifican mal y cuando el ADN está degradado da muchos problemas, y por eso se han sustituido por los STRs. A esto se le solía llamar la huella genética. El mecanismo consiste en: extracción de sangre y el ADN de sus células, por restricción enzimática se corta el ADN en fragmentos. Estos fragmentos los separamos por electroforesis. Posteriormente, ponemos una membrana de nylon. Se añade ADN radioactivo que se une al ADN que hemos extraído previamente. Se forma un patrón de bandas y por rayos X se obtiene el bandeado.

CNV

Variación en el número de copias. Son variaciones estructurales genómicas que surgen de delecciones (pérdidas) o duplicaciones (ganancias), y como resultado se produce un cambio en el número de copias de la región genómica respectiva. Muchas enfermedades genéticas hereditarias son el resultado de mutaciones estructurales o CNVs. Además, hay algunas CNVs que intervienen en: proteger contra el VIH, aumentar la susceptibilidad al LES y otras enfermedades autoinmunes, se han asociado con el autismo, con la esquizofrenia, la dificultad de aprendizaje idiopática, la diabetes, determinadas cardiopatías…

CNP

Polimorfismos del número de copias. Son comunes en la población general, que se producen con una frecuencia global de más del 1%. Son generalmente pequeños (la mayoría de menos de 10 kilobases de longitud) y que a menudo se enriquecen de los genes que codifican proteínas importantes en la desintoxicación de drogas y la inmunidad. Hay CNPs asociadas a la respuesta inmune frente a enfermedades genéticas complejas, incluyendo la psoriasis, la enfermedad de Crohn o la glomerulonefritis.

Asier Bombín Martín
Universidad Complutense de Madrid
1A – Medicina – 2014

GEN