Biología 2 C201: Semana 9-2019

Por M en C Rafael Govea Villaseñor
Versión 1.1
13/10/2019
(en construcción)

¿Qué son los genes y cómo funcionan?

Empecemos señalando que las células son la unidad de la Vida. La Vida es una compleja red de procesos que resultan de la interacción de moléculas y macromoléculas que reaccionan entre sí gracias a que éstas (las células) son sistemas abiertos que toman sustancias y energía de su entorno, transforman a ambas y a otras les dejan salir.

Pequeña ventana a la red de reacciones químicas que ocurren en las células

Las células existen, autoconstruyen, autorregulan y se reproducen gracias a la acción conjunta de unas decenas de pequeñas moléculas inorgánicas (PMI), alrededor de mil pequeñas moléculas orgánicas (PMO), cientos de oligomoléculas (péptidos, oligonucleótidos y oligosacáridos) y miles de macromoléculas (proteínas, ácidos nucleicos y polisacáridos). Conformando complejos multimoleculares y organelos que realizan las funciones celulares:

El gif animado muestra las sustancias que participan en la generación de fuerza en las moléculas del citoesqueleto de una célula muscular

Lo que es una célula y los procesos que puede realizar dependen de la información genética (el conjunto de sus genes, Genoma) que contiene. Las células a lo largo de su evolución han adquirido la información (genes) que les permite aumentar su orden interno a costa de desordenar su medio. La Vida es la expresión de dicha información que se almacena y se transfiere de unas moléculas a otras.

La madeja en esta microfotografía electrónica muestra a la única molécula circular de ADN de la bacteria Escherichia coli.

La información genética se almacena a largo plazo en el Ácido Desoxirribonucleico (ADN) y consiste en las instrucciones para construir las macromoléculas que participan en casi todos los procesos celulares, los diversos tipos de ARN y las Proteínas. Un gen es una secuencia de monómeros (incluyendo sus variantes en diferentes linajes) que codifica la elaboración de macromoléculas funcionales. Éstas macromoléculas interaccionan entre sí conformando los procesos vitales.

Cada línea representa una interacción entre macromoléculas, los puntos (proteína >>> ARN) 3200 asociaciones entre 1700 proteínas.

La secuencia de pares de bases del ADN almacena también la información de cuándo, cuánto, dónde y en respuesta a qué circunstancias del entorno se deben producir las decenas de miles de especies diferentes de proteínas y ARNs que cada célula requiere para vivir.

Los pares de bases C=G, G=C, T=A y A=T son las "letras" químicas usadas para escribir la información genética.

Las macromoléculas se asocian por complementaridad de superficies determinando los procesos celulares. Formando complejas redes de interacciones que terminan construyendo a los organismos y su fenotipo.

2 moléculas proteicas y un trozo de ADN. Factores de transcripción unidos a su secuencia específica.

Un gen entonces es una secuencia de pares de bases que codifica la síntesis de una molécula de ARN funcional. La mayoría son ARN mensajeros que a su vez codifican la síntesis de moléculas de Proteína. Los genes tienen una porción regulatoria (que indica cuándo y como se lee el gen) y otra estructural (que dicta el orden de los monómeros). Estructura de un gen eucariótico:

El gen se transcribe en ARN, luego se corta y pega uniendo las secuencias codificadoras de aminoácidos (exones) pra formar el ARN mensajero que dirige la elaboración de la proteína.

Así pues, el fluir normal de la información genética en la célula sigue el siguiente esquema:

El ADN almacena información usando 4 "letras químicas" que son las bases nitogenadas G (guanina), A (adenina), C (citosina) y T (timina) de sus nucleótidos. El ADN es una doble hélice hecha de pares de bases de nucleótidos A=T y G=C que unen sendas cadenas de nucleótidos mediante enlaces fosfodiéster:

El ADN tiene dos cadenas complementarias de nucleótidos que son moldes recíprocos: La cadena sentido en dirección 5' ---> 3' y la cadena antisentido en dirección opuesta 3' ---> 5'.

La síntesis de una cadena de ADN requiere una cadena molde y los 4 nucleótidos activados, es decir en forma de: dGTP, dATP, dCTP y dTTP. La adición de cada nucléotido sólo ocurre en el extremo 3' de cada cadena.

Toda célula procede de otra célula progenitora y recibe de ella su información genética. Así pues, antes de cada división celular ocurre la Replicación del ADN. Las dos cadenas del ADN se separan y sirven de molde para rehacer las cadenas complementarias:

La G empareja a la C, la A a la T y viceversa:

5'TATgCgTAAAgCTTC3'

__________3'TTCgAAg5'

--->
5'TATgCgTAAAgCTTC3'

3'ATACgCATTTCgAAg5'

--->

5'TATgC3'____________

3'ATACgCATTTCgAAg5'

Así se forman dos moléculas idénticas a la original aunque cada una de ellas tiene una cadena vieja y otra nueva (replicación es semiconservativa). De ese modo cada célula hija tendrá la información para fabricar las macromoléculas necesarias para funcionar.

Cuando la célula requiere de una proteína o de un ARN funcional, entonces copia el gen correspondiente, pero usando un "alfabeto" distinto. En vez de GACT del ADN usa GACU del ARN.

El proceso se llama transcripción del ADN porque se escribe la misma información, pero usando un conjunto de "signos" un poco distinto. En vez de T se usa U.

Como puedes ver en la imagen de arriba, la cadena antisentido es el molde para elaborar el ARN que crece por su extremo 3'.

Copia a un procesador de textos la siguiente molécula de ADN y debajo de la cadena antisentido escribe la secuencia de ribonucleótidos de unidos durante la transcripción del ADN. Luego envíame tu ejercicio a mi correo electrónico.

Escribo 4 nucleótidos de ejemplo y el símbolo de la guanina con "ge minúscula" para no confundir con la C de la citosina.

Muestro la cadena sentido en naranja, la cadena antisentido en verde y el ARN en azul.

5'TATgCgTAAAgCTTCgCTACgATCCgTAgCUCgACCATCgA3'

3'ATACgCATTTCgAAgCgATgCTAggCATCGAgCTggTAGCT5'

5'UAUg...

En las células, muchas de las moléculas de ARN fabricadas son de ARNr que se ensamblan con decenas de proteínas para constituir los ribosomas (las "máquinas" que fabrican proteínas) catalizando la formación del enlace peptídico, otras son de ARNt (de transferencia) cuya función es transportar cada uno de los 20 tipos de aminoácidos proteícos al ribosoma.

Las moléculas ARN mencionadas antes se llaman no codificantes (nc) porque no dirigen la síntesis de proteínas como el ARNm (m = mensajero. Recientemente se han descubierto muchas moléculas de ARNnc distintas que participan en la regulación de distintas fases del flujo de información y también en la defensa antiviral de las células.

La mayoría de las moléculas de ARN parecen pertenecer a la clase codificante, el ARNm. Estos, son una especie de "planos" de las proteínas que contienen el nombre (o codón) de cada uno de los aminoácidos que deben de ser unidos para fabricar los miles de proteínas que requiere una célula para funcionar.

En el ARNm se encuentra codificada la secuencia de aminoácidos que debe unir el ribosoma como una serie de tripletes de nucleótidos llamados codones. Hay 64 codones posibles y sólo 20 aminoácidos proteicos. Así que hay codones sinónimos para casi todos los aminoácidos.

Por ejemplo: el codón GGG = glicina, GGU = glicina y UUU = fenilalanina o UUC = fenilalanina.

El esquema que contiene todos los codones y su equivalencia se llama código genético que es prácticamente Universal. En el esquema se especifican en círculos concéntricos la primera "letra": G, A, C o U; la segunda: G, A, C o U, la tercera "letra" de cada codón (también G, A, C o U) y el aminoácido que codifica.

En el esquema circular mostrado abajo, los codones se muestran radialmente desde el centro hacia afuera. Los aminoácidos se escriben con su símbolo de 3 letras. Los colores muestran el tipo de aminoácido:

Por ejemplo:

Ahora, traduce en la hoja 12 del CET el pequeño trozo de ARN que simula ser un ARNm. Usa el código genético. Busca el codón de inicio y a partir de ese triplete coloca el símbolo de tres letras del aminoácido correspondiente. Precisamente como se muestra en la figura de arriba. Luego envía el ejercicio junto con el anterior a mi correo.

5'UAACGAUgUUAgCggUgAUgUggCUAUggggCUAUUAAG3'
Proteína:

En 1985 se secuenció el primer genoma de un organismo, el de la eubacteria Haemophilus influenzae con 1.83 Mpb de ADN, 1765 genes codificando para 1610 proteínas y 155 ARNs (https://www.ncbi.nlm.nih.gov/genome/genomes/165?).

Haemophilus influenzae al microscopio electrónico de barrido, 24,000x de David M Phillips

En la actualidad tenemos secuencias genómicas completas, borrador o parciales de 370 487 especies de organismos diferentes en las cuales se han reconocido de cientos a decenas de miles de genes. (https://gold.jgi.doe.gov/organisms?page=3&count=25) Obviamente la anotación de cada uno de esos genes es compleja.

Por ello para fines didácticos solamente usamos letras escritas en itálicas. Las letras mayúsculas o con el exponente (w = wild o +) se refieren a las variantes de genes (alelos) dominantes y con el exponente (-) a los genes alelos recesivos. Por ejemplo A, a, B, b, D, d, Rh+, Rh-, Pur+ y Pur-.

Referencias:

Biología 2 C201

miércoles, 9 de octubre de 2019

Semana 9-2019

¿Qué son los genes y cómo funcionan?

1 comentario:

Datos personales

FEEDJIT Live Traffic Map