domingo, 7 de noviembre de 2021

Semana 10 del semestre 2021B

 Por M en C Rafael Govea Villaseñor

Versión 3.0
2020-11-07


La biodiversidad surge de la evolución de las especies





Genética y Evolución

Avanzamos con su curso y entramos a los contenidos del tercer corte, Genética y Evolución. Explicaremos cómo y qué se hereda cuando los organismos se reproducen y las consecuencias para la especie cuando se suceden las generaciones a lo largo de periodos de tiempo prolongados.


Cariotipo humano, el conjunto de cromosomas de una célula

Relaciones evolutivas de las especies vivas y extintas de elefantes



En caso de requerirlo puede verse el video de una clase con los contenidos de ésta página, piquen en el vínculo.



¿Qué son los genes y cómo funcionan?

Empecemos señalando que las células son la unidad de la Vida. La Vida es una compleja red de procesos que resultan de la interacción de moléculas y macromoléculas que reaccionan entre sí gracias a que éstas (las células) son sistemas abiertos que toman sustancias y energía de su entorno, transforman a ambas y a otras les dejan salir.


Pequeña ventana a la red de reacciones químicas que ocurren en las células


Las células existen, se autoconstruyen, autorregulan y se reproducen gracias a la acción conjunta de unas decenas de pequeñas moléculas inorgánicas (PMI), alrededor de mil pequeñas moléculas orgánicas (PMO), cientos o miles de oligomoléculas (péptidos, oligonucleótidos y oligosacáridos) y miles, decenas de miles e incluso, a más de cien mil macromoléculas diferentes según la especie (proteínas, ácidos nucleicos y polisacáridos). Conformando complejos multimoleculares y organelos que realizan las funciones celulares.

Por ejemplo en los músculos estriados la unidad anatómica y funcional que genera movimiento y fuerza es el Sarcómero, el cual es un complejo multimolecular constituido por diversas proteínas. 
Miofibrillas y Sarcómero

Estructura molecular del Sarcómero


El gif animado muestra las sustancias que participan en la generación de fuerza en las moléculas del citoesqueleto de una célula muscular

Como lo saben de biología 1, cada una de estas proteínas son fabricadas por los ribosomas de acuerdo a las instrucciones de un gen de los miles que contiene el ADN de la célula. 

Así pues, lo que es una célula y los procesos que puede realizar dependen de la información genética (el conjunto de sus genes, Genoma) que contiene. Las células a lo largo de su evolución han adquirido la información (los genes) que les permite aumentar su orden interno a costa de desordenar su medio. La Vida es la expresión de dicha información que se almacena y se transfiere de unas moléculas a otras.
La madeja en esta microfotografía electrónica muestra a la única molécula circular de ADN de la bacteria Escherichia coli.

Genoma de E coli cepa 958 (5.1 Mpb, 4982 + 7(3ARNr +89ARNt) genes



La información genética se almacena a largo plazo en el Ácido Desoxirribonucleico (ADN) y consiste en las instrucciones para construir las macromoléculas que participan en casi todos los procesos celulares, los diversos tipos de ARN y las Proteínas. 
Cromosomas desenrollados dentro del núcleo celular (ratón).

Estructuras a diferente tamaño de la Información genética





Un gen es una secuencia de monómeros (incluyendo sus variantes en diferentes linajes) que codifica la elaboración de macromoléculas funcionales. Éstas macromoléculas interaccionan entre sí conformando los procesos vitales.
Cada línea representa una interacción entre macromoléculas, los puntos (proteína >>> ARN)  3200 asociaciones entre 1700 proteínas. Cada proteína tiene su gen. (Stelzl U et al 2005 Cell 122(6)957-68  https://doi.org/10.1016/j.cell.2005.08.029)




La secuencia de pares de bases del ADN almacena también la información de cuándo, cuánto, dónde y en respuesta a qué circunstancias del entorno se deben producir las decenas de miles de especies diferentes de proteínas y ARNs que cada célula requiere para vivir.
Los pares de bases C=G, G=C, T=A y A=T son las "letras" químicas usadas para escribir la información genética.






Las macromoléculas se asocian por complementaridad de superficies determinando los procesos celulares. Formando complejas redes de interacciones que terminan construyendo a los organismos y su fenotipo (la apariencia, físico, forma o funcionamiento dado).
2 moléculas proteicas y un trozo de ADN. Factores de transcripción unidos a su secuencia específica.

S cerevisiae 12Mpb, unos 6 Kgenes en 16 cromosomas






Un gen entonces es una secuencia de pares de bases que codifica la síntesis de una molécula de ARN funcional. La mayoría son ARN mensajeros que a su vez codifican la síntesis de moléculas de Proteína. Los genes tienen una porción regulatoria (que indica cuándo y cómo se lee el gen) y otra estructural (que dicta el orden de los monómeros). Estructura de un gen eucariótico:
El gen se transcribe en ARN, luego se corta y pega uniendo las secuencias codificadoras de aminoácidos (exones) pra formar el ARN mensajero que dirige la elaboración de la proteína.




Así pues, el fluir normal de la información genética en la célula (eucariótica) sigue el siguiente esquema:







En las células procarióticas es más directo, antes de terminar la transcripción, ya se está traduciendo. Porque sus genes no están interrumpidos por secuencias no codificantes (intrones):
Diferencia esencial entre las células procarióticas y las eucarióticas.




El ADN almacena información usando 4 "letras químicas" que son las bases nitrogenadas G (guanina), A (adenina), C (citosina) y T (timina) de sus nucleótidos.  El ADN es una doble hélice hecha de pares de bases de nucleótidos A=T y G=C que unen sendas cadenas de nucleótidos mediante enlaces fosfodiéster. 






El ADN tiene dos cadenas complementarias de nucleótidos que son moldes recíprocos: La cadena sentido en dirección 5' ---> 3' y la cadena antisentido en dirección opuesta 3' ---> 5'. 
De allí que la información en el ADN está almacenada 2 veces, una en cada cadena:





La síntesis de una cadena de ADN requiere una cadena molde y los 4 nucleótidos activados, es decir en forma de: dGTP, dATP, dCTP y dTTP. La adición de cada nucleótido sólo ocurre en el extremo 3' de cada cadena. Así que la síntesis ocurre en sentido 5' a 3'




Toda célula procede de otra célula progenitora y recibe de ella su información genética. Así pues, como ya lo estudiamos, antes de cada división celular ocurre la Replicación del ADN. Las dos cadenas del ADN se separan y sirven de molde para rehacer las cadenas complementarias:

La G empareja a la C, la A a la T y viceversa:



                                                 5'TATgCgTAAAgCTTC3'
                                                 __________3'TTCgAAg5'

                                     --->
5'TATgCgTAAAgCTTC3'
3'ATACgCATTTCgAAg5'
                                    --->
                                                5'TATgC3'____________
                                                3'ATACgCATTTCgAAg5'



Así se forman dos moléculas idénticas a la original aunque cada una de ellas tiene una cadena vieja y otra nueva. La replicación es semiconservativa. De ese modo cada célula hija tendrá la información para fabricar las macromoléculas necesarias para funcionar.
Replicación semiconservativa (cadenas vieja-nueva)



Cuando la célula requiere de una proteína o de un ARN funcional, entonces copia el gen correspondiente, pero usando un "alfabeto" distinto. En vez de GACT del ADN usa GACU del ARN. 

El proceso se llama transcripción del ADN porque se escribe la misma información, pero usando un conjunto de "signos" un poco distinto. En vez de T se usa U.


Noten que cada T en la cadena sentido está representada por una U en el ARNm. El ARNm se elabora tomando como molde a la cadena antisentido 3' --> 5'.


Como puedes ver en la imagen de arriba, la cadena antisentido es el molde para elaborar el ARN que crece por su extremo 3'. 
Transcripción del ADN




Copia al archivo de texto de la asignación la siguiente molécula de ADN y debajo de la cadena antisentido escribe la secuencia de ribonucleótidos de unidos durante la transcripción del ADN. Regresa la tarea de inmediato.

Nota que yo empecé el ejercicio, continúa tú. Ya escribí 4 nucleótidos de ejemplo y el símbolo de la guanina con "ge minúscula" para no confundir con la C de la citosina.

Muestro la cadena sentido en naranja, la cadena antisentido en verde y el ARN en azul.

5'TATgCgTAAAgCTTCgCTACgATCCgTAgCUCgACCATCgA3'
3'ATACgCATTTCgAAgCgATgCTAggCATCGAgCTggTAGCT5'
5'UAUg...


En las células, muchas de las moléculas de ARN fabricadas son de ARNr (r = ribosomal) que se ensamblan con decenas de proteínas para constituir los ribosomas (las "máquinas" que fabrican proteínas) catalizando la formación del enlace peptídico, otras son de ARNt (t de transferencia) cuya función es transportar cada uno de los 20 tipos de aminoácidos proteicos al ribosoma.

Las moléculas ARN mencionadas se llaman no codificantes (nc) porque no dirigen la síntesis de proteínas como el ARNm (m = mensajero. Recientemente se han descubierto muchas moléculas de ARNnc distintas que participan en la regulación de distintas fases del flujo de información y también en la defensa antiviral de las células.

La mayoría de las moléculas de ARN parecen pertenecer a la clase codificante, el ARNm. Estos, son una especie de "planos lineales" de las proteínas que contienen el nombre (o codón) de cada uno de los aminoácidos que deben de ser unidos para fabricar los miles de proteínas que requiere una célula para funcionar.



En el ARNm se encuentra codificada la secuencia de aminoácidos que debe unir el ribosoma como una serie de tripletes de nucleótidos llamados codones. Hay 64 codones posibles y sólo 20 aminoácidos proteicos. Así que hay codones sinónimos para casi todos los aminoácidos. 

Por ejemplo: el codón GGG = glicina, GGU = glicina y UUU = fenilalanina o UUC = fenilalanina. 


El esquema que contiene todos los codones y su equivalencia se llama código genético que es prácticamente Universal. En el esquema se especifican en círculos concéntricos la primera "letra": G, A, C o U; la segunda: G, A, C o U, la tercera "letra" de cada codón (también G, A, C o U) y el aminoácido que codifica. 

En el esquema circular mostrado abajo, los codones se muestran radialmente desde el centro hacia afuera. Los aminoácidos se escriben con su  símbolo de 3 letras. Los colores muestran el tipo de aminoácido:





Por ejemplo:



Ahora, traduce en la asignación de TEAMS el pequeño trozo de ARN que simula ser ARNm. Usa el código genético. Busca el codón de inicio y a partir de ese triplete coloca el símbolo de tres letras del aminoácido correspondiente. Precisamente como se muestra en la figura de arriba. Luego envía el ejercicio.


5'UAACGAUgUUAgCggUgAUgUggCUAUggggCUAUUAAG3'
Proteína:







 




En 1985 se secuenció el primer genoma de un organismo, el de la eubacteria Haemophilus influenzae con 1.83 Mpb de ADN, 1765 genes codificando para 1610 proteínas y 155 ARNs (https://www.ncbi.nlm.nih.gov/genome/genomes/165?).
Haemophilus influenzae al microscopio electrónico de barrido, 24,000x de David M Phillips




Las entidades biológicas, células, organismos y virus tienen un genoma. Por ejemplo él del virus SARS-CoV-2 se secuenció unos cuantos días después de su descubrimiento en pacientes de COVID en Wuhan, China (diciembre de 2019). Así nos enteramos que es una molécula de ARN 5' a 3' de unos 30 Kb.
Se muestran 6 genes de los 15 ó 16 que tiene.




El gen de la espícula del coronavirus es muy importante porque la proteína por él codificada le permite al virus adherirse a la membrana de algunas de nuestras célula e iniciar la invasión de su citosol. De ahí que muchas de las más de 150 candidatos a vacuna en estudio incluidas las aprobadas en uso de emergencia intentan dirigir la respuesta inmune a esta proteína, en particular al sitio de unión con la ACE-2, la proteína membranal de nuestras células que le sirve de anclaje.
Virus SARS-CoV-2 unido a la proteína que usa para iniciar la invasión




Los genes tienen miles o decenas de miles pb de longitud, el gen S del coronavirus es de 3822 bases que codifican para 1274 aminoácidos. En el vínculo se muestra el primer registro de dicho gen del virus secuenciado en China en diciembre de 2019. 



En la actualidad tenemos secuencias genómicas completas, borrador, variantes o parciales de 418 918 especies de organismos diferentes en las cuales se han reconocido de cientos a decenas de miles de genes. (https://gold.jgi.doe.gov/organisms?page=3&count=25 visitado el 07/11/2021) Obviamente el nombre de cada uno de esos genes es compleja y críptica.
Gráfica del número de clases de seres vivos que tienen especies con genomas secuenciados. Resalté la rebanada de nuestra clase, mamíferos, 1149 especies con genoma completo o parcialmente secuenciado.




Importante:
Para nombrar los genes con fines didácticos solamente usamos letras escritas en itálicas. Las letras mayúsculas o con el exponente (w = wild o +) se refieren a las variantes de genes (alelos) dominantes y con el exponente (-) a los genes alelos recesivos. Por ejemplo A, a, B, b, D, d, Rh+, Rh-, Pur+ y Pur-. En cambio, los productos (ARNs, proteínas y rasgos) usan el mismo nombre con letras normales
Ejemplo de genes alelos en un par de cromosomas homólogos





Enlace para cuestionario: 



No hay comentarios:

Publicar un comentario