Resumo: | Associar os genomas de seres vivos com estruturas matemáticas auxilia na compreensão de como a vida é formada. Um código matemático que transcreve a sequência de DNA pode ser utilizado para sua identificação, possibilitando a localização de mutações negativas e, assim, através de experimentos práticos, corrigir essas mutações. Este trabalho objetiva aplicar conceitos matemáticos no estudo de mutações genéticas, compreendendo conceitos básicos sobre genética, além de estudar estruturas algébricas de grupos, anéis, corpos e extensões de corpos, compreender os conceitos principais associados aos códigos corretores de erros, estudar as características principais dos códigos BCH, aplicar códigos BCH no estudo de mutações genéticas, entender os passos do algoritmo para identificar sequências de DNA e analisar algumas sequências de DNA associadas a mutações. Um algoritmo será utilizado para identificar sequências de DNA com um tamanho de 63 nucleotídeos, satisfazendo a relação 2^r - 1 , sendo r=6 um número natural. Apesar do algoritmo auxiliar na localização de mutações negativas, ainda não é possível alterá-las, necessitando de estudos mais aprofundados, a fim de reestabelecer a estrutura molecular normal do DNA.
|
Referência 1: | egundo Matoso (2014), a teoria de códigos surgiu na década de 40, a partir do matemático Claude Elwood
Shannon, ao apresentar modelos de códigos que poderiam corrigir erros num sistema de comunicação,
reduzindo ruídos sem sacrificar a transmissão. Shannon, em 1948, determinou a teoria fundamental de um
sistema de comunicação digital, provando que “a mensagem gerada por uma fonte de informação pode ser
compactada até o limite da entropia da fonte”, possibilitando codificar a mensagem, transmitindo-a livre de
erros a uma taxa máxima permitida pelo canal (MATOSO; QUEIROZ, 2013).
De acordo com Matoso e Queiroz (2013), a transferência de informação genética, que é armazenada através
de duas fitas complementares compostas por letras de um alfabeto de quatro símbolos, ao longo do tempo,
pode ser melhor compreendida por meio da teoria da informação, desenvolvida pelo homem. Conforme Gupta
(2013), a teoria da informação trata de enviar as informações (transmissão) e armazenar, determinando limites
do que pode ou não ser feito, porém sem explicar como fazer.
Códigos vêm sendo estudados e aprimorados por pesquisadores, principalmente aqueles com propriedades de
espaço vetorial sobre corpos finitos, que são os códigos lineares (MATOSO, 2014). Os trabalhos no contexto
atual exploram “analogias entre o fluxo de informação biológica e o sistema de comunicação” (MATOSO;
QUEIROZ, 2013).
Consoante com Matoso (2014), os primeiros a encontrarem uma relação matemática entre um código numérico
e a sequência de DNA foram pesquisadores da Universidade Estadual de Campinas (Unicamp) e da
Universidade de São Paulo (USP), que descobriram “a existência de um código matemático que transcreve a
sequência de DNA”. Assim, conforme Matoso e Queiroz (2013), o algoritmo pode ser utilizado para
identificação de sequências de DNA, possibilitando a localização de mutações negativas.
O DNA armazena informações em um alfabeto de tamanho 4 {A, C, G, T}. Cada letra
representa as bases nucleotídicas adenina (A), citosina (C), guanina (G) e timina (T). Quando
uma célula decide produzir uma proteína, ela lê a porção do DNA que codifica essa proteína.
A porção do DNA que codifica uma determinada proteína é chamada de gene dessa proteína.
A leitura do gene é feita por uma molécula especial chamada RNA polimerase (mais uma
proteína), que então produz uma transcrição da sequência de DNA na forma de uma fita de
RNA mensageiro. O RNA é o ácido ribonucleico, uma substância que é como o DNA, pois
é composto de quatro nucleotídeos, que por sua vez são feitos de bases orgânicas e fosfato
de ribose. Mas a ribose no RNA tem um átomo de oxigênio particular onde a ribose no DNA
não tem. mRNA tem um alfabeto de tamanho 4, {A, C, G, U}, semelhante a DNA, mas a
uracila (U) está no lugar da timina (T). Um polímero é uma molécula que é construída como
uma cadeia de moléculas menores, ou monômeros. As proteínas são polímeros com os
monômeros como aminoácidos. Assim, as proteínas têm um alfabeto de tamanho 20, {todos
os 20 aminoácidos}. O código genético é um mapeamento de mRNA para aminoácidos. Cada
aminoácido é feito de três nucleotídeos chamados de tripleto ou códon. O processo de criação
de um mRNA a partir de DNA é chamado de transcrição, e o processo de produção de
proteína a partir de mRNA é chamado de tradução (GUPTA, 2006).
Por conseguinte, segundo Faria (2011), no processo de tradução, com a síntese de uma cadeia polipeptídica,
através da decodificação do RNA mensageiro, se as proteínas forem dobradas incorretamente, logo são
eliminadas por um sistema de verificação de erros das células. Erros de cópia do material durante a divisão
celular, por exposição à radiação ultravioleta ou ionizante, mutagênicos químicos, ou vírus podem provocar
mutações no DNA, alterando as sequências dos nucleotídeos e, consequentemente, gerando variações no
conjunto de genes da população, ou até mesmo hiper mutação, quando as células causam mutações deliberadas.
No caso das mutações desfavoráveis, ao causarem erros na sequência de proteínas, se estas possuírem papel
importante, podem resultar em uma doença (doença genética).
Ao descobrirem que as bases nitrogenadas seguem uma lógica matemática de organização, experimentos
práticos podem ser realizados para confirmar que a molécula de DNA mutada pode ser transformada e, assim,
corrigir mutações como, por exemplo, a volta da produção de insulina pelo organismo (MATOSO, 2014). Os
códigos corretores de erros (CCEs) visam à transmissão de informações fidedignas, corrigindo-as quando
necessário (MATOSO; QUEIROZ, 2013). Segundo Matoso e Queiroz (2013), os códigos de blocos não
possuem memória, sendo o ponto de partida um conjunto A, finito ou não, chamado alfabeto. É caracterizado
por seu comprimento, dimensão e sua distância mínima. Uma estrutura linear pode ser mais adequada,
diminuindo a complexidade do codificador, ao se tratar de palavras-código e comprimentos grandes. Códigos
cíclicos sobre anéis do tipo ℤ |