Penalidade para lacunas
Penalidade para lacunas[1] ou Penalidade para gaps[2] (gap penalty) são usadas durante o alinhamento de seqüências. O esquema de penalidade para lacunas contribui para a pontuação geral de alinhamentos e, portanto, o tamanho da penalidade para espaços em relação às entradas na matriz de similaridade afeta o alinhamento que é finalmente selecionado. Selecionando uma penalidade maior para lacunas ou espaços fará com que caracteres menos favoráveis sejam alinhados, buscando o algoritmo a evitar a criação de muitas lacunas.
Penalidade para Lacunas Constante
A Penalidade constante para lacunas é o tipo mais simples de penalidade para lacunas. O único parâmetro, w, é adicionado à pontuação do alinhamento quando a lacuna é aberta pela primeira vez. Isto significa que qualquer lacuna recebe a mesma penalidade, independentemente do seu tamanho.
Penalidade para Lacunas Linear
Penalidades para lacunas linear tem apenas um parâmetro, w, que é uma penalidade por unidade de comprimento.[3] Essa é quase sempre negativa, de modo que o alinhamento com menos lacunas é favorecido sobre o alinhamento com mais lacunas. Sob uma penalidade para lacunas linear, a penalidade total para uma lacuna grande é a mesma que para muitas lacunas pequenas.
Denotando a função linear por , para , e a penalidade associada com uma lacuna de espaços temos
- ,
onde g é o valor absoluto do escore associado a um espaço.
Penalidade para Lacunas Afim
O modelo de penalidade para lacunas afim[Nota 1] penaliza inserções e deleções usando uma função linear em que um termo é o comprimento independente, e a outra é o comprimento dependente.[4] Algumas seqüências são mais propensas a ter uma grande lacuna, em vez de muitas lacunas pequenas. Por exemplo, uma seqüência biológica é muito mais propensa a ter uma grande lacuna de comprimento 10, devido a um único evento de inserção ou deleção, do que ter 10 pequenas lacunas de comprimento 1. Penalidades para Lacunas Afim usam uma penalidade de lacunas de abertura (opening), o, e uma penalidade de lacunas de extensão e. Uma lacuna de comprimento l é então dada uma penalidade o + (l-1)e. De modo que as lacunas são desencorajadas, o é quase sempre negativo. Porque algumas lacunas grandes são melhores do que muitas lacunas pequenas, e, apesar de negativo, quase sempre é menos negativo do que o, de modo a incentivar a extensão da lacuna, ao invés da introdução de uma lacuna.
Denotando a função afim por , para , e a penalidade associada com uma lacuna de espaços temos
- ,
onde g é o valor absoluto do escore associado a um espaço, é o custo do primeiro espaço e é o custo dos espaços adicionais. Considera-se . Desta forma podemos denotar a função como:
Penalidade para Lacunas Não-Linear
Embora o modelo de penalidade para lacunas afim seja o mais comumente usado nos dias de hoje, alguns estudos indicam que penalidades para lacunas não-lineares podem trazer vantagens sobre o modelo afim.[5][6][7] Waterman em seu artigo infere que uma deleção de, por exemplo, 14 bases, não deveria ser pensada como quatorze deleções simples independentes, mas como provavelmente um único evento de deleção que portanto pesaria bem menos que a soma dos pesos das quatorze deleções somadas individualmente. para modelar melhor esta realidade, Waterman propõe funções com concavidade para baixo como por exemplo[8]:
Penalidade para Lacunas Arbitrária
Needleman e Wunsch em seu artigo sobre o algoritmo Needleman-Wunsch apontam que o procedimento recursivo pode acomodar fórmulas de penalização de lacunas arbitrárias:
Um fator de penalidade, um número subtraído de cada lacuna feita, pode ser avaliado como uma barreira para permissão de lacunas. O fator de penalidade poderia ser uma função do comprimento e/ou direção da lacuna. Nenhuma lacuna seria permitida na operação, salvo se o benefício de permitir essa lacuna ultrapassasse a barreira.[9] [página 444]
Gunsfeld fornece uma questão exemplificando um problema da penalização de lacunas arbitrária.[4] Supondo por exemplo que:
Então uma lacuna de comprimento 10 teria peso 1000000 se fosse considerada uma simples lacuna, mas teria peso 2 se fossem consideradas duas lacunas adjacentes. Quel seria o modelo de lacunas adequado?
Leituras adicionais
- Predefinição:Citar jornal
- Predefinição:Citar jornal
- Predefinição:Citar jornal
- Predefinição:Citar jornal
- Predefinição:Citar jornal
- Predefinição:Citar jornal
- Predefinição:Citar jornal
- Predefinição:Citar jornal
Notas
- ↑ Nome dado em razão da relação com a função afim. Dan Gusfield, p. 240 afirma que o modelo "afim" é algumas vezes chamados modelo "linear" e que ele próprio prefere assim. Mas o termo "afim" se tornou o termo dominante na literatura biológica e "linear" usualmente se refere a função afim com h = 0.