Uma mina de ouro: RNAs não-codificadores

 Chris Bonato, 2016  gaia@aprendendobiologia.com.br

fluxo unidirecional

Tudo começou quando Francis Crick  propôs o Dogma Central da Biologia mostrando o papel das moléculas de RNA (mensageiro, transportador e ribossômico) no processo unidirecional de transferência da informação do gene à proteína.

Foi uma longa e entusiasmada caminhada até o momento que se estabeleceu a técnica de sequenciamento do DNA na década de 1990. De lá para cá uma enorme quantidade de genomas de diferentes espécies foi sequenciada e depositada em bancos de dados de livre acesso permitindo que pesquisadores do mundo todo mergulhassem na busca de novos genes e de seus mRNAs, visando a descoberta de novas proteínas.

Bilhões de nucleotídeos estavam à disposição para serem analisados. O que é uma tarefa formidável. Resolveram então delinear atalhos computacionais para caçar genes canônicos cujos mRNAs apresentassem traços característicos, tais como promotores, sítios de corte exon/intron em eucariotos e, logicamente, ORFs.

ORFnew

ORF é um segmento de DNA que apresenta um quadro aberto de leitura, ou seja, uma sequência de códons especificando aminoácidos, sem nenhum códon de parada interrompendo a sequência. Tal sequência é ladeada pelo códon de iniciação (ATG) no terminal 5´ e por um dos códons de parada (TAG, TAA, TGA) no terminal 3´.

Apesar de ser frequente encontrar ORFs em qualquer segmento de RNA, nem sempre as ORFs codificam proteínas de fato. Então para filtrar o que seria um lixo, os pesquisadores  estabeleceram algoritmos com ponto de corte de 300 nucleotídeos que poderiam potencialmente codificar 100 aminoácidos. Assim, pequenas ORFs (sORFs) foram descartadas como lixo computacional de sorte que a possibilidade da existência de pequenos peptídeos foi esquecida.

Além disto, algumas questões técnicas contribuíram para o esquecimento das pequenas ORFs e de seus micropeptídeos. Por exemplo, nas triagens mutagênicas aleatórias  em organismos modelo, a probabilidade das sORFs serem atingidas é menor do que a das ORFs maiores, daí a dificuldade de se detectar o efeito mutagênico sobre sORFs. Em relação à proteínas, no método de separação e identificação de proteínas por eletroforese os micropeptídeos são perdidos porque escapam do fundo dos géis e na espectrometria de massa existe um passo de lavagem, nos protocolos utilizados, que retém apenas proteínas maiores. Nada favorável às sORFs.

Em 2002, pesquisadores do Max Planck Institute for Plant Breeding Research (Cologne, Germany) trabalhavam com um RNA supostamente não codificador de 679 nucleotídeos.  RNAs não codificadores com mais de 200 nucleotídeos são considerados longos e denominados lncRNA. O RNA transcrito do gene que eles estudavam era denominado early nodulin 40 (ENOD40) e continha pequenos quadros de leitura aberta (sORFs) os quais eram tão pequenos que haviam sido ignorados como potenciais codificadores. No entanto, quando os pesquisadores de Cologne examinaram o RNA mais atentamente, se deram conta que duas das sORFs de fato codificavam minúsculos peptídeos: um de 12 e outro de 24 aminoácidos. . Confirmaram ainda que estes peptídeos eram sintetizados na planta e estavam envolvidos no controle do uso de sacarose nos nódulos fixadores de nitrogênio (H.Röhrig et al., 2002).

 Estava aberta a corrida do ouro!

Alguns anos depois o grupo de Yuji Kageyama, então no National Institute for Basic Biology (Okazaki, Japan), descobriu, numa triagem por lncRNAs de embriões de Drosophila, que ao suprimir a expressão dos lncRNAs individualmente,  a supressão de um deles produziu um fenótipo evidente, afetando certas características da cutícula dos embriões o que os tornou semelhantes a grãos de arroz lisos. Em função disto o RNA recebeu o nome de “polished rice” (pri). O gene pri codifica 4 minúsculos peptídeos, três de 11 aminoácidos e um de 32, todos envolvidos na ativação de fatores de transcrição chaves ao processo de desenvolvimento da mosca, mais especificamente, na morfogênese epitelial regulando a organização de  feixes específicos de F-actina (Kondo et al., 2007).

A partir de então, muitos outros lncRNAs foram transferidos para a posição de mRNAs após se constatar que abrigavam sORFs codificadoras de micropeptídeos. Dado o vasto numero de lncRNAs – a maioria sem função conhecida – a possibilidade de encontrar outros que codifiquem micropeptídeos é grande.

Em fevereiro de 2014, por exemplo, Andrea Pauli, então, estudante de pós-graduação no laboratório de Alex Schier na Universidade de Harvard, procurava  lncRNAs que pudessem estar envolvidos no processo de desenvolvimento do peixe zebra (zebrafish), e acabou identificando  um que codificava um micropeptídeo de 58 aminoácidos (Toddler) o qual funcionava como proteína sinalizadora, necessária aos movimentos celulares durante a gastrulação. Aparentemente Toddler agiria como um “motógeno”, um sinal que promove a migração celular (A. Pauli et al., 2014).

Em 2015, Anderson e colaboradores estudando  lncRNAs expressos no coração e músculo esquelético de embriões de camundongos descobriram que um deles codificava um micropeptídeo de 46 aa que reduz a performance muscular inibindo uma bomba de cálcio chave. Nomearam-no Myoregulina.

Este ano, Nelson et al. descobriram um outro micropeptídeo de 34 aa, proveniente de um lncRNA. O peptídeo, denominado DWORF (dwarf open reading frame), estimula a performance muscular ativando a mesma bomba de cálcio que é inibida pela Myoregulina.

 A caça destes minúsculos tesouros continua. Os poucos que tiveram as funções esclarecidas mostram sua participação na  sinalização de diversos eventos celulares fundamentais.  Afinal, tamanho não é documento, mas contribuiu para que permanecessem desconhecidos por tanto tempo, talvez pelo nosso viés preferencial à coisas maiores.

 Referências:

R. Willians, “Noncoding RNAs not so Noncoding”, The Scientist, June 1, 2016.

H. Röhrig et al., “Soybean ENOD40 encodes two peptides that bind to sucrose synthase”, PNAS, 99:1915-20, 2002.

T. Kondo et al., “Small peptide regulators of actin-based cell morphogenesis encoded by a polycistronic mRNA,” Nature Cell Biology, 9, 660–665, 2007.

A. Pauli et al.,”Toddler: an embryonic signal that promotes cell movement via Apelin receptors,” Science, 343 (6172), 2014.

D.M. Anderson et al., “A micropeptide encoded by a putative long noncoding RNA regulates muscle performance,” Cell, 160:595-606, 2015.

B.R. Nelson et al., “A peptide encoded by a transcript annotated as long noncoding RNA enhances SERCA activity in muscle”, Science, 351(6270), 2016