|
Estudo computacional de 1H-imidazol-2-il-pirimidina-4,6-diaminas para a identificação de potenciais precursores de novos agentes antimaláricos Computacional study of 1H-imidazol-2-yl-pyrimidine-4,6-diamines for identification of potential parent compounds of new antimalarial agents |
Marina Gabriela Birck; Luana Janaína Campos; Eduardo Borges de Melo*
Centro de Ciências Médicas e Farmacêuticas, Universidade Estadual do Oeste do Paraná, 85819-110, Cascavel - PR, Brasil Recebido em 24/10/2015 *e-mail: eduardo.b.de.melo@gmail.com The aim of this study was develop in silico studies with a data set of 1H-imidazol-2-yl-pyrimidine-4,6-diamines derivatives described as antimalarial agents with the intention of obtain data and tools useful in the development of new drugs of this class. A QSAR model was developed using topological, geometrical and electronic molecular descriptors with aid of the OPS/PLS approach. The data set was also used for pharmacophoric modeling, that was used in the ZINC database for found compounds that show good fit with the model. Due to the similarity between the four selected hits in the virtual screening with the data set, the obtained equation was used for predict the potential antimalarial activity. All hits were within the applicablity domain of the QSAR model, and showed adquates Monge's leadlikeness score and predicted safety profiles. INTRODUÇÃO A malária é uma doença tropical infecciosa e uma das patologias mais prevalentes no mundo, afetando cerca de 207 milhões de pessoas, principalmente das regiões tropicais e subtropicais, e em especial do continente africano. As principais vítimas são crianças menores de 5 anos. Na região das Américas, o Brasil possui o maior número de casos da doença, sendo a região amazônica responsável por 99,9% dos casos do país. Apesar de a Organização Mundial de Saúde (OMS) não considerar mais esta doença como negligenciada, o Ministério da Saúde ainda a considera dentro desta categoria, ao lado da dengue, doença de Chagas, esquistossomose, hanseníase, leishmaniose e tuberculose, entre outras.1-9 Esta doença é causada por parasitas do gênero Plasmodium (P. falciparum, P. vivax, P. ovale e P. malariae), transmitidos ao homem pela picada de fêmeas de mosquitos do gênero Anopheles.6,8 Dentre as espécies, o P. falciparum é responsável pelas formas mais sérias da doença,10 enquanto o P. vivax, mais leve, é a principal espécie circulando no Brasil.7 De modo geral, essa patologia é caracterizada por acessos intermitentes de febre, calafrios e cefaleia.11 Alguns dos principais fármacos utilizados no tratamento dessa patologia são a mefloquina, cloroquina, pirimetamina, derivados de artemisinina e alguns antibióticos (clindamicina e doxiciclina) (Figura 1). No Brasil, diversos esquemas terapêuticos são realizados, de acordo com a necessidade de cada paciente e a região do país.7,12 Porém, os parasitas (em especial o P. falciparum) podem adquirir mecanismos de resistência à boa parte dos medicamentos, tornando mais difícil o tratamento, incluindo contra a artemisinina. Já no caso da malária causada pelo P. vivax, estudos recentes vêm mostrando um agravamento da doença, em especial devido a surgimento de cepas resistentes a cloroquina.13-15
Figura 1. Exemplos de fármacos atualmente utilizados no tratamento da malária6,16
Devido à atual necessidade de novos agentes terapêuticos para o tratamento de diversas doenças, os métodos de planejamento de fármacos auxiliados por computador (CADD: Computer-Aided Drug Design) são amplamente utilizados. Essa estratégia possibilita a redução de custos e de tempo para obtenção de resultados positivos, além de reduzir o uso de animais de laboratório e melhorar o gerenciamento ambiental dos sistemas produtivos, devido a menor produção de resíduos químicos e biológicos.17 Dentre esses métodos, está a modelagem molecular, que investiga estruturas tridimensionais e propriedades moleculares através de técnicas de visualização gráfica,18 e os estudos de relação estrutura-atividade quantitativa (QSAR: quantitative structure-activity relationships). O objetivo desta abordagem é a obtenção de modelos multiparamétricos que quantifiquem variáveis dependentes, representadas por atividades biológicas, efeitos tóxicos ou propriedades físico-químicas, em termos das propriedades moleculares dos compostos em análise, para fins de predição.19 Assim, o objetivo deste trabalho foi a realização de estudos de modelagem molecular e QSAR, com base em um conjunto de 42 derivados de 1H-imidazol-2-il-pirimidina-4,6-diaminas descritas por Deng et al.20 como agentes antimaláricos. O melhor modelo obtido é apresentado como uma potencial ferramenta de apoio para estudos de triagem virtual (que possibilitou a identificação de quatro novos hits em um banco de dados virtual) e síntese de novos derivados, motivo pelo qual o modelo foi submetido a uma série de testes de validação.
PARTE EXPERIMENTAL Conjunto de dados Deng et al.20 sintetizaram e testaram a atividade de 42 derivados de 1H-imidazol-2-il-pirimidina-4,6-diaminas (Figura 2 e Material Suplementar, Tabela 1S), sendo que todos apresentaram atividade antimalárica contra cepa de P. falciparum sensível à cloroquina (3D7) em seu estágio eritrocítico. Os valores da atividade antimalárica, disponibilizados em EC50 (capacidade de matar 50% dos parasitas, em µmol L-1), foram convertidos em seus respectivos pEC50 (-logEC50). Com isto, foi obtido um intervalo de atividade 2,205 unidades logaritimicas (5,264 a 7,469).
Figura 2. Estrutura de uma 1H-2-il-pirimidina-4,6-diaminas (composto 1, pEC50= 6,361). O conjunto completo, incluindo os valores de EC50 e pEC50 de cada amostra, está disponível no Material Suplementar, Tabela 1S
Modelagem molecular O conjunto de dados foi construído no programa HyperChem 7 a partir de uma estrutura cristalográfica congênere a série, obtida no Crystallography Open Database (http://www.crystallography.net, código 2017299).21 Todas as geometrias foram otimizadas em mecânica molecular (MM+) no mesmo programa. Na sequência, os arquivos de saída foram convertidos para arquivos de entrada do programa Gaussian 09 utilizando o Open Babel,22 no qual as geometrias foram otimizadas pelo método semi-empírico Austin Model 1 (AM1). Descritores moleculares Os seguintes descritores eletrônicos foram obtidos no programa GaussView 5: cargas parciais de Mulliken da estrutura comum a todos os derivados (Figura 3), energia total (ET), o momento de dipolo total (D) e nos eixos x (DX), y (DY) e z (DZ), e as energias dos orbitais moleculares (EHOMO-1, EHOMO, ELUMO e ELUMO+1). Além disso, utilizando os quatro descritores de orbitais moleculares e as equações descritas por Todeschini e Consonni,23 foram obtidos mais 10 descritores relacionados à reatividade: índice de eletrofilicidade (ω), índice de eletrofilicidade no estado fundamental (ωgs), eletronegatividade molecular (χ), dureza molecular (η), moleza molecular (S), potencial de ionização (IP), índice de energia de ativação (AEI), afinidade eletrônica (EA), diferença entre EHOMO e ELUMO (GAP) e fração da energia EHOMO/ELUMO (f(H/L)). O conjunto de descritores moleculares foi completado utilizando o programa Dragon 6.0,24 no qual foram obtidos mais 4855 descritores, distribuídos entre diversas classes (constitucionais, topológicos, geométricos, moleculares e outros). No total, foram gerados 4887 descritores moleculares.
Figura 3. Estrutura comum ao conjunto de dados
Ainda no Dragon 6.0 foram utilizados filtros de redução de variáveis para eliminar descritores que não apresentassem informações relevantes ao modelo. Foram removidos descritores que não apresentassem variação ou quase sem variação, e descritores que apresentassem alta correlação (> 0,9) com outro do conjunto. Também foi realizada uma redução manual para remover variáveis que ainda apresentassem pouca variação. Após estas etapas, restaram 627 variáveis. A matriz final formanda pelos 32 descritores eletrônicos e 627 descritores das demais classes foi submetida a mais uma etapa de redução, utilizando o programa QSAR modeling25 (download: http://lqta.iqm.unicamp.br). Neste programa, foram excluídos aqueles descritores que apresentassem correlação absoluta com a atividade biológica (|r|) abaixo de 0,2, gerando uma matriz com 339 variáveis. Essa etapa buscou eliminar descritores pouco correlacionados com a atividade biológica e que não possuíssem informações relevantes para construção do modelo. Estudo QSAR Seleção de variáveis e construção dos modelos Os processos de seleção de variáveis visam eliminar descritores redundantes ou irrelevantes para um modelo em relação à atividade biológica em estudo. Esse processo é normalmente conduzido de modo automatizado, devido ao grande número de descritores atualmente utilizados em estudos QSAR. Essa etapa também foi realizada no QSAR modeling, utilizando a seleção de preditores ordenados (OPS: ordered predictors selection).25 Este método utiliza regressão por quadrados parciais mínimos (PLS: partial least squares) para atribuir importância a cada descritor com base em vetores informativos (vetor de correlação, vetor de regressão, e produtos entre ambos). São realizadas sucessivas regressões e diversos modelos são gerados, sendo estes classificados com base em parâmetros estatísticos. Este método de regressão correlaciona a matriz X (descritores) com o vetor Y (atividade biológica), de modo que as novas coordenadas são otimizadas para estimar Y, utilizando variáveis latentes (VLs). As melhores combinações encontradas são utilizadas para construção de modelos também utilizando PLS. Em ambas as etapas, os resultados foram autoescalados, processo básico de pré-processamento utilizado em estudos QSAR, pois os diferentes descritores geralmente possuem escalas numéricas diferentes, e assim é necessário minimizar a influência de variáveis dominantes.19,25 O método OPS foi utilizado considerando inicialmente o valor do erro médio quadrático da validação cruzada (RMSECV: root mean square error of cross-validation). Em seguida, foram utilizados os valores do coeficiente de determinação da validação cruzada (Q2LOO). Com isso, buscou-se obter modelos com o baixo erro e com capacidade de previsão otimizada. Validação dos modelos Os modelos QSAR são representados por meio de uma equação matemática que correlaciona as propriedades físico-químicas dos compostos com suas atividades biológicas. Essa equação deve ter significância estatística e bom poder de predição, deve ser robusta e não deve apresentar informações decorrentes de correlações espúrias.25 Para isso, os modelos devem ser estatisticamente validados. Normalmente, este processo é dividido em validação interna e externa. A validação interna avalia o grau de ajuste do modelo, o grau de significância e sua capacidade de previsão.26 Dentre esses parâmetros, encontram-se o coeficiente de determinação (R2), o erro médio quadrático de calibração (RMSEC: root mean square error of calibration), o teste F (Fp,n-p-1) com 95% de significância (α=0,05), o Q2LOO e o RMSECV. Estes dois últimos parâmetros são obtidos pelo método clássico de validação cruzada deixe-um-de-fora (LOO: leave-one-out). Também podem ser utilizadas as medidas RmSquare relacionadas a validação cruzada, denominados média (average rm2(LOO)-scaled) e variação de rm2 modificado (Δrm2(LOO)-scaled). O modelo obtido deve ser capaz de explicar ao menos 60% da variabilidade total dos valores observados da atividade biológica (R2 > 0,6) e de prever ao menos 50% da variabilidade (Q2LOO > 0,5)25-27. Para os parâmetros RmSquare, espera-se resultados > 0,5 para average rm2(LOO)-scaled, e < 0,2 para Δrm2(LOO)-scaled. Também é importante observar o valor da diferença entre R2 e Q2LOO: resultados entre 0,2 e 0,3 indicam que o modelo apresenta sobreajuste de dados.27 Alguns autores recomendam diferenças ainda menores.28 Na etapa de validação interna, também deve ser medida a presença de correlações ao acaso entre os descritores e a atividade biológica através do teste conhecido como randomização do y, onde os valores do vetor y são aleatorizados e a matriz X é mantida fixa, construindo assim novos modelos, os quais devem ser ruins. Também se deve medir a robustez, utilizando para isto a validação cruzada deixe-vários-de-fora (LNO: leave-N-out). Esse processo visa avaliar se o modelo possui a capacidade de resistir a pequenas e deliberadas variações em sua composição.25,24 Para verificar a qualidade do conjunto de dados, utiliza-se o teste de detecção de amostras anômalas (outliers), assegurando assim que as amostras formam um conjunto homogêneo. A remoção destes compostos pode melhorar a qualidade do modelo. Porém, como modelos QSAR são modelos reducionistas, recomenda-se evitar a retirada quando possível, em especial para conjuntos com poucas amostras. A presença deste tipo de amostra foi avaliada com base nos valores de influência (leverage) e nos valores dos resíduos studentizados.19,25 A validação externa, por sua vez, permite analisar com maior eficácia a capacidade de predição do modelo. Para isso, é escolhido e retirado um sub-conjunto de amostras, sendo este denominado conjunto de teste. Depois, através do modelo construído com as amostras restantes, formadas pelo denominado conjunto de treinamento, é calculada a atividade biológica deste conjunto menor. Finalmente, o valor experimental é comparado com o valor previsto pelo modelo.19,29 A divisão em conjunto de treinamento e conjunto de teste (este equivalente a 21% do conjunto de dados) foi realizada manualmente, de modo que os compostos selecionados representassem tanto a faixa de variação da atividade biológica quanto a variabilidade estrutural do conjunto de dados. Nesta etapa foram utilizados os programas XternalValidation (http://dtclab.webs.com/software-tools), sendo obtidos o coeficiente de determinação da validação externa (R2pred), average rm2(pred)-scaled e Δrm2(pred)-scaled. Espera-se resultados com valores > 0,5 para os dois primeiros e < 0,2 para o último. Também foram utilizados os parâmetros de Golbaikh e Tropsha, baseados em inclinações de retas, as quais foram obtidas por regressão feita entre os valores observados e preditos (k) e entre os preditos e observados (k'), e a avaliação da diferença absoluta entre os valores dos coeficientes de determinação centrados na origem das duas regressões (|R20-R'20|). Os valores de k e k' devem ser maiores ou iguais a 0,85 e menores ou iguais a 1,15, e a diferença entre R20 e R'20 deve ser menor que 0,3.29,30 Modelagem farmacofórica Paralelo ao estudo QSAR, foi realizado um estudo de modelagem farmacofórica baseada em ligante, visando encontrar um modelo que representasse as características comuns essenciais ao conjunto de dados. Nesta etapa, foi utilizado o servidor on-line PharmaGist (http://bioinfo3d.cs.tau.ac.il/PharmaGist). Este programa gera como arquivos de saída candidatos a farmacóforos computados com base em múltiplos alinhamentos flexíveis dos compostos de entrada.31-33 Como este servidor opera com conjuntos de dados de até 32 moléculas, foram selecionados os 32 derivados mais ativos do conjunto para formar o sub-conjunto desta etapa. O derivado mais ativo (40) foi escolhido como a molécula pivô, a qual o programa sobrepõe cada estrutura a este e alinha o maior número possível de características em comum com o pivô, resultando em diversos farmacóforos. Após a construção dos modelos, é realizada a inspeção dos resultados visando selecionar o farmacóforo com maior pontuação (maior número de características em comum). Triagem virtual O farmacóforo selecionado foi utilizado em estudo de triagem virtual. Este estudo teve por objetivo identificar novas moléculas que apresentassem o mesmo farmacóforo selecionado, constituindo potenciais novos compostos antimaláricos. A ferramenta utilizada para esta pesquisa foi o servidor ZINCPharmer34 (http://zincpharmer.csb.pitt.edu), o qual é compatível com o arquivo de saída gerado pelo PharmaGist (formato mol2), permitindo uma busca rápida e interativa de compostos.35 As buscas são realizadas exclusivamente no banco de dados ZINC (http://zinc.docking.org), que possui uma extensa coleção de moléculas comercialmente disponíveis.34 O processo de triagem foi realizado utilizando os seguintes filtros: i) número de diferentes orientações de uma mesma conformação (Max hits per Conf) = 1; ii) número de diferentes orientações de diferentes conformações de uma mesma molécula (Max hits per Mol) = 1; iii) especificação do valor máximo de desvio médio da raiz quadrada (RMSD: root mean square deviation) que os compostos resultantes podem possuir (Max RMSD) = 0.32; iv) peso molecular entre 200 e 450; e v) número de ligações rotáveis na molécula de 1 a 9.36,37 Na sequência, foi avaliado o risco que cada uma destas moléculas apresenta de causar efeitos mutagênicos, carcinogênicos e de toxicidade sobre o desenvolvimento. Para isto, foi utilizada a plataforma VEGA-QSAR38 (download: http://www.vega-qsar.eu/download.html), e cada um destes efeitos em potencial foi predito utilizando o algoritimo CAESAR.39
RESULTADOS E DISCUSSÃO QSAR A partir da matriz com 339 descritores, o processo de seleção de variáveis utilizando o método OPS levou a um modelo PLS (representado pela equação 1, com coeficientes autoescalados) formado por três VLs (Tabela 1), sendo estas por sua vez originadas a partir de sete descritores moleculares (valores disponíveis no Material Suplementar, Tabela 2S). As VLs acumularam 57,997% da variância relevante codificada nos descritores (VL1: 30,307%; VL2: 14,261%; VL3: 13,429%), sendo que nenhum outlier foi indentificado. O modelo é capaz de explicar 83,7% e predizer 69,0% da variância. Considerando os valores de R2 e Q2LOO, a diferença entre eles (0,147) encontra-se dentro do limite sugerido por Ferreria e Kiralj,27 o que é uma indicação de que o modelo não apresenta sobreajuste de dados. O resultado do teste F (51.350) foi bem maior que seu valor de referência tabelado (2.922, para p= 3, e n-p-1= 30), indicando que a informação calibrada pela Equação 1 é realmente significativa. Os resultados dos testes rm2(LOO)-scaled são consistentes com os limites sugeridos, e assim auxiliam a confirmar que o modelo possui uma capacidade preditiva interna aceitável. A equação de regressão multivarida não escalada, obtida a partir dos dados autoescalados no programa QSAR Modeling, é apresentada na equação 2.
Para o teste de validação leave-N-out, utilizado como medida da robustez, recomenda-se a retirada de cerca de 20 a 30% do número de amostras. O modelo não deve apresentar oscilação no valor de Q2LNO superior a 0,1.27 Para esse estudo, foram retiradas 10 amostras (~30%). Considerando os resultados apresentados na Figura 4A, duas observações podem ser feitas: (i) a média dos valores de Q2LNO (0,678) é semelhante a Q2LOO; e (ii) a diferença de cada valor de Q2LNO em relação ao valor de Q2LOO não foi maior que 0,1. Portanto, o modelo foi considerado robusto. Já os resultados esperados para o teste de randomização do y, usado para medir a possibilidade de ocorrência de correlação ao acaso, correspondem a interceptos < 0,3 e < 0,05 para as novas regressões de R2 e Q2LOO, respectivamente.19 Os resultados deste teste, apresentados na Figura 4B, mostram que o modelo apresenta correlação real entre os descritores selecionados e a atividade biológica, uma vez que apresentaram os valores do intercepto dentro dos intervalos esperados.
Na Tabela 2 são apresentados os resultados obtidos na etapa de validação externa. Os resultados dos parâmetros estatísticos adotados mostram que o modelo obteve valores de R2pred, average rm2(pred)-scaled, Δrm2)(pred)-scaled, k, k' e |R02-R'02| adequados aos limites propostos na literatura,40 ou seja, todos os modelos possuem potencial para gerar atividade antimalárica predita com bom grau de confiabilidade.
Para confirmar a qualidade da capacidade de predição externa do modelo, assim como a robustez do modelo, o conjunto de dados foi dividido em outros 10 diferentes conjuntos de teste. O procedimento de separação foi realizado da mesma forma que para o conjunto original. Os resultados médios dos parâmetros estatísticos utilizados também são apresentados na Tabela 2 (resultados detalhados: Material Suplementar, Tabela 3S). Os valores apresentam-se equivalentes aqueles obtidos com o conjunto de teste original, com diferenças localizadas na segunda casa decimal ou menores. Estes resultados indicam que a qualidade da predição externa do modelo é adequada, assim como a robustez do modelo. Dos resultados individuais, apenas um conjunto (4, 7, 17, 19, 20, 27, 34, 35 e 36) apresentou os parâmetros RmSquare e o parâmetro |R02-R'02| de Golbraikh-Tropsha levemente fora dos limites, também da ordem da segunda casa decimal ou menores em relação aos limites adotados. Dois outros conjuntos apresentaram o parâmetro Δrm2)(pred)-scaled nesta situação, enquanto um terceiro apresentou R2pred apenas 0,021 unidades abaixo do limite recomendado. Apesar da boa qualidade estatísitca que o modelo apresentou, é desejável que modelos QSAR possam ser interpretados quanto ao significado dos descritores moleculares selecionados, que codificam as propriedades físico-químicas das moléculas em relação a atividade biológica em estudo. Normalmente, esta é uma tarefa difícil, já que muitos dos descritores normalmente utilizados, como topológios e geométricos (que normalmente são citados como relacionados com forma, tamanho, grau de ramificação, etc) são de difícil interpretação. Mesmo que a não interpretação de um modelo não impeça sua utilização para fins de predição, caso seja possível interpretá-lo, reforça a utilidade da equação obtida para explicar o problema em estudo.23,41-44 Outro fato importante a ser considerado neste estudo é que o mecanismo de ação dos compostos estudados contra o P. falciparum 3D7 não é conhecido. Assim, a interpretação mecanística pode ser baseada apenas nos descritores moleculares selecionados, seus significados gerais e por comparação com os resultados de outros estudos QSAR. Também é interessante observar se a seleção de determinados descritores pode ser justificada pelos dados de estrutra atividade experimental descritos no artigo original.20 Os descritores selecionados (Tabela 3) podem ser divididos em duas categorias: de difícil e fácil interpretação. Na primeira classe encontram-se os descritores 3D-MoRSE,45 Mor21s, Mor30e, Mor05m e Mor15p. Na segunda, o descritor eletrônico AEI, o descritor eletrotopológico SsOH e o descritor topológico F06[C-N].
Os valores dos coeficientes de regressão autoescalados (equação 1) mostram que os descritores mais importantes no modelo são F06[C-N] e AEI, que possuem praticamente o mesmo valor, e o descritor menos importante é Mor30e. É interessante observar que os compostos mais ativos tendem a apresentar maior número de nitrogênios em sua estrutura química, em especial como parte de cadeias lateriais longas (como 11, 14, 15, 17, 23 e 40, entre outros), o que consequentemente aumenta o número de vezes que a distância topológica (lag) de seis ligações estará presente em cada derivado e, consequentemente, o valor do descritor F06[C-N]. Isto indica que esta caracaterística estrutural realmente é relevante para a atividade antimalárica destes compostos, e é corroborada pelos resultados apresentados no artigo original,20 que também destaca a influência de átomos de nitrogênio na potência destes derivados. AEI é um descritor molecular definido como a soma das energias de HOMO e HOMO-1 (EHOMO e EHOMO-1),23 descrito originalmente por Aptula et al.46 Considerando o modo de obtenção deste descritor, sua interpretação pode ser feita de modo análogo ao descritor EHOMO.47-50 Basicamente, quanto maior o valor de AEI, maior será a tendência das moléculas doarem elétrons, sendo então razoavelmente mais reativos do que os derivados com menores valores. Assim, quanto mais átomos de nitrogênio disponíveis na estrutura (i.e., quanto mais pares de elétrons livres na estrutura), mais ativo será o derivado. É possível observar uma razoável correlação entre AEI e o descritor F06[C-N] (r=0,445) o que, somado a outros estudos QSAR que utilizaram EHOMO,47-50 dão suporte a esta proposta. Finalmente, apesar de AEI apresentar uma faixa de variação estreita (-0,654 a -0,688), a informação contida neste é suficiente para descrever esta característica do conjunto de dados, o que é auxiliado com o uso do autoescalamento dos dados, procedimento padrão em estudos QSAR, que amplia a faixa para -2,667 a 0,032. É interessante observar que os compostos mais potentes (como 26 e 40) tendem a possuir em suas cadeias laterais cadeias alquílicas com nitrogênios não aromáticos ou próximos de átomos ricos em elétrons π (como em amidas), enquanto nos menos potentes (como 7, 9, 20 e 37) ocorre apenas a situação contrária. Considerando o fato de que o par de elétrons livres de um nitrogênio pode interagir com sistemas p vizinhos, pode-se propor que nos átomos não aromáticos estes pares estarão mais disponíveis para agir como aceptores de ligação hidrogênio.51 Essa também pode ser a razão do descritor SsOH ser desfavorável à atividade, como pode ser visto nos compostos 13, 21 e 37: a presença de hidroxila, um substituinte mais eletronegativo do que o nitrogênio, pode dificultar a doação de carga por parte dos átomos de nitrogênio próximos a eles, dificultando a formação de ligações hidrogênio. Os descritores 3D-MoRSE são descritores geométricos que codificam a estrutura molecular utilizando como base difração eletrônica.45 Segundo Ramírez-Galicia et al.,52 esta classe de descritores pode codificar informações sobre a estrutura da molécula, porém sem as ambiguidades que ocorrem na teoria de grafos, apesar de serem de difícil interpretação. Mor30e é ponderado pela eletronegatividade atômica (e) dos átomos que formam a estrutura dos derivados, Mor15p pela polarizabilidade atômica, Mor21s pelo estado eletrotopológico (s) e Mor05m pela massa atômica (m). Os dois primeiros influenciam positivamente a atividade, o que pode estar relacionado a possível importância de ligações hidrogênio para a atividade. Já os dois últimos apresentam influência negativa. Para Mor21s, este significado pode estar relacionado com a interpretação feita para SsOH. Já Mor05m insere informações sobre a importância do tamanho para molécula para a atividade antimalárica. Sua seleção encontra algum apoio no estudo realizado com um conjunto de 4-aminoquinolinas por Najafi, Sobhanardakani e Marjani,53 que selecionaram um descritor relacionado, Mor06m, em um modelo também voltado para a descrição da atividade contra o P. falciparum 3D7, sendo que este apresentava o mesmo sinal de Mor05m. Farmacóforo e triagem virtual O modelo farmacofórico selecionado foi obtido a partir do alinhamento das 32 moléculas utilizadas nesta etapa. Este modelo (Figura 5) é formado por 6 características: 3 aromáticas (roxo), 2 doadoras (cinza) e 1 aceptora (laranja) de ligações hidrogênio. O arranjo foi escolhido porque abrange características de todas as moléculas, além de apresentar uma boa pontuação (79.867) em relação aos demais obtidos. Quando a triagem virtual foi realizada, obteve-se uma grande variedade de compostos (mais de 100 mil moléculas). É interessante observar que, apesar de diversos derivados apresentarem um quarto anel (ou substituinte com aneís), apenas três foram considerados relevantes em termos de similaridade entre o sub-conjunto de dados.
Figura 5. (a) Estrutura química da molécula mais ativa (pivô) com o farmacóforo; (b) farmacóforo. Figura construída no ZINCPharmer
A triagem com o uso de filtros no ZINCPharmer resultou em 107 compostos, os quais possuem características espaciais semelhantes ao farmacóforo. Quanto mais parecidas são essas características, maior a probabilidade desse composto apresentar atividade antimalárica, uma vez que aumentam as chances de possuírem as características estruturais necessárias para interagir com o sítio de ação. Na sequência, as representações estruturais dos compostos no formato Simplified Molecular Input Line Entry System (SMILES) foram utilizados para predição dos riscos de efeitos mutagênicos, carcinogênicos e de toxicidade para o desenvolvimento utilizando o algoritimo CAESAR. Dos 107 compostos, apenas cinco foram preditos como não detentores dos efeitos tóxicos considerados. Porém, uma das moléculas (ZINC59513039) apresentou o anel 1,3,5-triazina, muito comum em pesticidas da classe das atrazinas. Para sanar possíveis dúvidas, os cinco compostos também foram avaliados utilizando o servidor Osiris Property Explorer.55 A triazina foi prevista como detentor de potenciais efeitos mutagênicos, tumorogênicos, irritativos e sobre a reprodução, ao contrário dos demais, que foram aprovados nos quatro critérios. Assim, quatro compostos foram selecionados (Figura 6): ZINC40798818 (43), ZINC40685246 (44), ZINC40685468 (45) e ZINC40783160 (46). Todos podem ser classificados como piridmina-4,5,6-triaminas.
Figura 6. Estruturas da molécula pivô e dos compostos selecionados
A Figura 6 mostra a estrutura da molécula pivô e dos quatro compostos, e seus respectivos RMSD, enquanto a Figura 7 apresenta cada composto sobreposto ao farmacóforo. Os valores e sobreposição indicam que a complementariedade espacial é adequada. Em teoria, estes derivados possuem bom potencial para apresentar atividade antimalárica, somado a um bom perfil de segurança. O potencial de cada um como protótipo foi avaliado utilizando um escore (lead-like score) calculado no programa Dragon 6, baseado nos parâmetros propostos por Monge et al.54 Para os quatro compostos, foi obtido o valor ideal de 1. Ou seja, nenhum dos parâmetros moleculares utilizados para a obtenção do escore foi violado, indicando que os quatro compostos são protótipos em potencial.
Previsão da atividade Considerou-se que, devido à semelhança estrutural e tridimensional dos compostos com o conjunto de dados, o modelo QSAR poderia ser utilizado para predição da atividade antimlárica, podendo ser útil como ferramenta de apoio para estudos de triagem virtual ou mesmo síntese. Para isto, as quatro moléculas tiveram os mesmos descritores moleculares (Tabela 2) derivados pelas mesmas abordagens utilizadas previamente (valores também disponíveis no Material Suplementar, Tabela 2S). As atividades preditas, em pEC50, mostraram-se adequadas ao intervalo de linearidade do conjunto de dados: 7,427 para 43, 7,495 para 44, 6,322 para 45 e 5,600 para 46. Os compostos 43 e 44 apresentam atividade predita na mesma faixa (em torno de 0,038 µmol L-1 para 43, e 0,032 µmol L-1 para 44), colocando-se dentre a faixa de maior atividade do estudo. O composto 45, com valor de atividade prevista em torno de 0,476 µmol L-1, apresentou-se dentre os compostos localizados na faixa de atividade média. Já o composto 46, com EC50 predito em torno de 2,51 µmol L-1, colocou-se dentre os menos ativos. Para confirmar a confiabilidade das predições, foi determinado o domínio de aplicabilidade do modelo. O domínio de aplicabilidade Euclideano é baseado na verificação do grau de semelhança estrutural dos compostos em teste em relação aos utilizados para a construção do modelo real, através dos descritores moleculares, sem necessidade de uso de valores de atividade biológica para comparação. Assim, este método é adequado para o problema em análise. Para esta análise foi utilizado o programa gratuito Euclidean Applicabilty Domain 1.0 (download: http://teqip.jdvu.ac.in/QSAR_Tools). Verifica-se, utilizando a Figura 8, os compostos 43 a 46 encontram-se dentro do domínio do modelo. Assim, todos são estruturalmente representados pelo mesmo, e pode-se propor que os resultados calculados não são decorrentes de extrapolação.
Figura 8. Dominio de aplicabilidade Euclideano. Pontos brancos: conjunto de treinamento; pontos pretos: compostos 43 a 46
CONCLUSÃO Conclui-se, através deste trabalho, que o modelo QSAR obtido é significativo, robusto, não apresenta correlação ao acaso e possui boa capacidade de previsão. O mesmo conjunto de dados utilizado na construção dos modelos matemáticos foi empregado para obtenção de um farmacóforo que possui as características essenciais do conjunto de dados e pode ser utilizado como ferramenta de apoio para a triagem virtual. Nesta última etapa, foram encontrados quatro piridminas-4,5,6-triaminas estruturalmente relacionadas ao conjunto de dados que, de acordo com os filtros utilizados, apresentam baixo potencial para causar efeitos tóxicos, e que apresentam escores que permitem a classificação como potenciais compostos protótipos. O domínio de aplicabilidade indica que todas as estruturas são adequdamente representadas pelo espaço químico do modelo. Assim, os valores das atividades preditas podem ser considerados confiáveis. Estudos posteriores de ensaio poderão confirmar se cada derivado realmente é ativo contra a cepa 3D7 do P. falciparum. Caso ocorra, espera-se que a otimização da estutura química encontrada leve a uma nova classe química de agentes antimaláricos com potencial uso terapêutico.
MATERIAL SUPLEMENTAR A Tabela 1S (estruturas e atividades dos compostos do conjunto de dados), Tabela 2S (valores dos descritores) e Tabela 3S (qualidade estatísica externa obtida com os dez conjuntos diferentes gerados para a segunda validação externa) estão disponíveis em http://quimicanova.sbq.org.br, na forma de arquivo PDF, com acesso livre.
AGRADECIMENTOS Ao CNPq pela bolsa de iniciação científica de M. G. Birck; à CAPES pela bolsa de mestrado de L. J. de Campos; e à Fundação Araucária (protocolo 2010/7354) pelo apoio financeiro que viabilizou este estudo.
REFERÊNCIAS 1. Ministério da Saúde - Departamento de Ciência e Tecnologia; Rev. Saude Publica 2010, 44, 200. DOI: http://dx.doi.org/10.1590/S0034-89102010000100023 PMID: 20140346 2. Machado, C. M.; Martins, T. C.; Colturato, I.; Leite, M. S.; Simione, A. J.; Souza, M. P.; Mauad, M. A.; Colturato, V. R.; Rev. Inst. Med. Trop. S. Paulo 2009, 51, 309. DOI: http://dx.doi.org/10.1590/S0036-46652009000100009 3. Werneck, G. L.; Hasselmann, M. H.; Gouvêa, T. G.; Ciênc. Saúde Colet. 2011, 16, 39. DOI: http://dx.doi.org/10.1590/S1413-81232011000100009 4. Yamey, G.; Br. Med. J. 2002, 325, 176. DOI: http://dx.doi.org/10.1136/bmj.325.7357.176 5. http://www.who.int/mediacentre/factsheets/fs094/en/index.html, acessado em abril de 2016. 6. França T. C. C.; Santos, M. G.; Figueroa-Villar, J. D.; Quim Nova 2008, 31, 1271. DOI: http://dx.doi.org/10.1590/S0100-40422008000100004 7. Brasil. Ministério da Saúde. Secretaria de Vigilância em Saúde. Departamento de Vigilância Epidemiológica; Guia prático de tratamento da malária no Brasil, Brasília: Ministério da Saúde, 2010. 8. Oliveira, A. B.; Dolabela, M. F.; Braga, F. C.; Jácome, R. L. R. P.; Varotti, F. P.; Póvoa, M. M.; An. Acad. Bras. Cienc. 2009, 81, 715. DOI: http://dx.doi.org/10.1590/S0001-37652009000400011 PMID: 19893898 9. http://www.who.int/neglected_diseases/diseases/en, acessado em abril de 2016. 10. Lindoso, J. A. L.; Lindoso, A. A. B. P.; Rev. Inst. Med. Trop. S. Paulo 2009, 51, 247. DOI: http://dx.doi.org/10.1590/S0036-46652009000500003 11. Costa, A. P.; Bressan, C. S.; Pedro, R. S.; Valls-de-Souza, R.; Silva, S.; Souza, P. R.; Guaraldo, L.; Ferreira-da-Cruz, M. F.; Daniel-Ribeiro, C. T.; Brasil, P.; Rev. Soc. Bras. Med. Trop. 2010, 43, 571. DOI: http://dx.doi.org/10.1590/S0037-86822010000500020 12. Neves, D. P.; Melo, A. L.; Linardi, P. M.; Vitor, R. W. A.; Parasitologia humana, 11ª ed., Atheneu: São Paulo, 2005. 13. Price, R. N.; von Seidlein, L.; Valecha, N.; Nosten, F.; Baird, J. K.; White, N. J.; Lancet Infect. Dis. 2014, 14, 982. DOI: http://dx.doi.org/10.1016/S1473-3099(14)70855-2 PMID: 25213732 14. Santana Filho, F. S.; Arcanjo, A. R. L.; Chehuan, Y. M.; Costa, M. R.; Martinez-Espinosa, F. E.; Vieira, J. L.; Barbosa, M. G. V.; Alecrim, W. D.; Alecrim, M. G. C.; Emerg. Infect. Dis. 2007, 13, 1125. DOI: http://dx.doi.org/10.3201/eid1307.061386 15. Ashley, E. A.; Dhorda, M.; Fairhurst, R. M.; Amaratunga, C.; Lim, P.; Suon, S.; Sreng, S.; Anderson, J. M.; Mao, S.; Sam, B.; Sopha, C.; Chuor, C.M.; Nguon, C.; Sovannaroth, S.; Pukrittayakamee, S.; Jittamala, P.; Chotivanich, K.; Chutasmit, K.; Suchatsoonthorn, C.; Runcharoen, R.; Hien, T. T.; Thuy-Nhien, N. T.; Thanh, N. V.; Phu, N. H.; Htut, Y.; Han, K. T.; Aye, K. H.; Mokuolu, O. A.; Olaosebikan, R. R.; Folaranmi, O. O.; Mayxay, M.; Khanthavong, M.; Hongvanthong, B.; Newton, P. N.; Onyamboko, M. A.; Fanello, C. I.; Tshefu, A. K.; Mishra, N.; Valecha, N.; Phyo, A. P.; Nosten, F.; Yi, P.; Tripura, R.; Borrmann, S.; Bashraheil, M.; Peshu, J.; Faiz, M. A.; Ghose, A.; Hossain, M. A.; Samad, R.; Rahman, M. R.; Hasan, M. M.; Islam, A.; Miotto, O;. Amato, R.; MacInnis, B.; Stalker, J.; Kwiatkowski, D. P.; Bozdech, Z.; Jeeyapant, A.; Cheah, P. Y.; Sakulthaew, T.; Chalk, J.; Intharabut, B.; Silamut, K.; Lee, S. J.; Vihokhern, B.; Kunasol, C.; Imwong, M.; Tarning, J.; Taylor, W. J.; Yeung, S.; Woodrow, C. J.; Flegg, J. A.; Das, D.; Smith, J.; Venkatesan, M; Plowe, C. V.; Stepniewska, K.; Guerin, P. J.; Dondorp, A. M.; Day, N. P.; White, N. J.; Tracking Resistance to Artemisinin Collaboration (TRAC); N. Engl. J. Med. 2014, 371, 411. DOI: http://dx.doi.org/10.1056/NEJMoa1314981 PMID: 25075834 16. Silva, P.; Farmacologia Básica e Clínica, 8th ed., Rio de Janeiro: Guanabara Koogan, 2003. 17. Eriksson, L.; Jaworska, J.; Worth, A. P.; Cronin, M. T. D.; McDowell, R. M.; Gramatica, P.; Environ. Health Persp. 2003, 111, 1361. DOI: http://dx.doi.org/10.1289/ehp.5758 18. Sant'Anna, C. M. R.; Quim Nova 2002, 25, 505. DOI: http://dx.doi.org/10.1590/S0100-40422002000300027 19. Martins, J. P. A.; Química computacional aplicada a QSAR, Cenapad: Campinas, 2010. 20. Deng, X.; Nagle, A.; Wu, T.; Sakata, T.; Henson, K.; Chen, Z.; Kuhen, K.; Plouffe, D.; Winzeler, E.; Adrian, F.; Tuntland, T.; Chang, J.; Simerson, S.; Howard, S.; Ek, J.; Isbell, J.; Tully, D. C.; Chatterjee, A. K.; Gray, N. S.; Bioorg. Med. Chem. Lett. 2010, 20, 4027. DOI: http://dx.doi.org/10.1016/j.bmcl.2010.05.095 PMID: 20610151 21. Grazulis, S.; Daskevic, A.; Merkys, A.; Chateiner, D.; Lutterotti, L.; Quirós, M.; Serebryanaya, N. R.; Moeck, P.; Downs, R. T.; Bail, A. L.; Nucleic Acids Res. 2012, 40, D420. DOI: http://dx.doi.org/10.1093/nar/gkr900 PMID: 22070882 22. O'Boyle, N.; Banck, M., James, C. A.; Morley, C.; Vandermeersch, T.; Hutchison, G. R.; J. Cheminform. 2011, 3, 33. DOI: http://dx.doi.org/10.1186/1758-2946-3-10 PMID: 21982300 23. Todeschini, R.; Consonni, V.; Handbook of molecular descriptors, 11 ed., Wiley-VCH: Weinheim, 2000. 24. http://www.talete.mi.it/products/dragon_description.htm, acessado em abril de 2016. 25. Martins, J. P. A.; Ferreira, M. M. C.; Quim. Nova 2013, 36, 554; Teófilo, R. F.; Martins, J. P. A.; Ferreira, M. M. C.; J. Chemometr. 2009, 23, 32. DOI: http://dx.doi.org/10.1590/S0100-40422013000100027 26. Gaudio, A. C.; Zandonade, E.; Quim. Nova 2001, 24, 658. DOI: http://dx.doi.org/10.1590/S0100-40422001000500013 27. Kiralj, R.; Ferreira, M. M. C.; J. Braz. Chem. Soc. 2009, 20, 770. DOI: http://dx.doi.org/10.1590/S0103-50532009000400021 28. Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2012, 52, 2044. DOI: http://dx.doi.org/10.1021/ci300084j PMID: 22721530 29. Golbraikh, A.; Shen, M.; Xiao, Z.; Xiao, Y. D.; Lee, K. H.; J. Comput. Aided Mol. Des. 2003, 17, 241. DOI: http://dx.doi.org/10.1023/A:1025386326946 PMID: 13677490 30. Roy, K.; Chakraborty, P.; Mitra, I.; Ojha, P. K.; Kar, S.; Das, R. N.; J. Comput. Chem. 2013, 34, 1071. DOI: http://dx.doi.org/10.1002/jcc.23231 PMID: 23299630 31. Schneidman-Duhovny, D.; Dror, O.; Inbar, Y.; Nussinov, R.; Wolfson, H. J.; Nucleic Acids Res. 2008, 36, W223. DOI: http://dx.doi.org/10.1093/nar/gkn187 PMID: 18424800 32. Dror, O.; Schneidman-Duhovny, D.; Inbar, Y.; Nussinov, R.; Wolfson, H. J.; J. Chem. Inf. Model. 2009, 49, 2333. DOI: http://dx.doi.org/10.1021/ci900263d PMID: 19803502 33. Inbar, Y.; Schneidman-Duhovny, D.; Dror, O.; Nussinov, R.; Wolfson, H. J.; Proc. RECOMB 2007, 3692, 423. 34. Koes, D. R.; Camacho, C. J.; Nucleic Acids Res. 2012, 40, W409. DOI: http://dx.doi.org/10.1093/nar/gks378 PMID: 22553363 35. Koes, D. R.; Camacho, C. J.; J. Chem. Inf. Model. 2011, 51, 1307. DOI: http://dx.doi.org/10.1021/ci200097m PMID: 21604800 36. Montanari, C. A.; Química Medicinal: Métodos e Fundamentos em Planejamento de Fármacos, Edusp: São Paulo, 2011. 37. Oprea, T. I.; J. Mol. Graph. Model. 2000, 18, 512. DOI: http://dx.doi.org/10.1016/S1093-3263(00)00066-8 PMID: 11143566 38. http://ceur-ws.org/Vol-1107/paper8.pdf, acessado em janeiro de 2016. 39. http://www.caesar-project.eu, acessado em janeiro de 2016. 40. Roy, K.; Chakraborty, P.; Mitra, I.; Ojha, P. K.; Kar, S.; Das, R. N.; J. Comput. Chem. 2013, 34, 1071. DOI: http://dx.doi.org/10.1002/jcc.23231 PMID: 23299630 41. http://www.oecd.org/env/guidance-document-on-the-validation-of-quantitative-structure-activity-relationship-q-sar-models-9789264085442-en.htm, acessado em abril de 2016. 42. Luan, F.; Melo, A.; Borges, F.; Cordeiro, M. N. D. S.; Bioorg. Med. Chem. 2011, 19, 6853. DOI: http://dx.doi.org/10.1016/j.bmc.2011.09.032 PMID: 21992803 43. Katritzky, A. R.; Petrukhin, R.; Tatham, D.; Basak, S.; Benfenati, E.; Karelson, M.; Maran, U.; J. Chem. Inf. Comp. Sci. 2001, 41, 679. DOI: http://dx.doi.org/10.1021/ci000134w 44. Melagraki, G.; Afantitis, A.; Sarimveis, H.; Koutentis, P.A.; Markopoulos, J.; Igglessi-Markopoulou, O.; J. Comput. Aided. Mol. Des. 2007, 21, 251. DOI: http://dx.doi.org/10.1007/s10822-007-9112-4 PMID: 17377847 45. Schuur, J. H.; Selzer, P.; Gasteiger, J.; J. Chem. Inf. Comput. Sci. 1996, 36, 334. DOI: http://dx.doi.org/10.1021/ci950164c 46. Aptula, A. O.; Roberts, D. W.; Cronin, M. T. D.; Schultz, T. W.; Chem. Res. Toxicol. 2005, 18, 844. DOI: http://dx.doi.org/10.1021/tx049666n PMID: 15892578 47. Morley, J. O.; Matthews, T. P.; Bioorg. Med. Chem. 2006, 14, 8099. DOI: http://dx.doi.org/10.1016/j.bmc.2006.07.032 PMID: 16887355 48. Nikolic, K. M.; QSAR Comb. Sci. 2007, 26, 358. DOI: http://dx.doi.org/10.1002/qsar.200610013 49. Silakari, P.; Shrivastava, S. D.; Silakari, G.; Kohli, D. V.; Rambabu, G.; Srivastava, S.; Shrivastava, S. K.; Silakari, O.; Eur. J. Med. Chem. 2008, 43, 1559. DOI: http://dx.doi.org/10.1016/j.ejmech.2007.02.013 PMID: 18023931 50. de Melo, E. B.; Ferreira, M. M. C. Eur. J. Med. Chem. 2009, 44, 3577. DOI: http://dx.doi.org/10.1016/j.ejmech.2009.03.001 PMID: 19327872 51. Patrick, G. L. An Introduction to Medicnal Chemistry, 4th ed., Oxford Universtity Press: New York, 2009. 52. Ramírez-Galicia, G.; Martínez-Pacheco, H.; Garduño-Juárez, R.; Deeb, O.; Med. Chem. Res. 2012, 21, 2501. DOI: http://dx.doi.org/10.1007/s00044-011-9767-1 53. Najafi, A.; Sobhanardakani, S.; Marjani, M.; E-J. Chem. 2013, Article ID 560415. 54. Monge, A.; Arrault, A.; Marot, C.; Morin-Allory, L.; Mol. Div. 2006, 10, 389. DOI: http://dx.doi.org/10.1007/s11030-006-9033-5 55. Brito, M.A.; Rev. Eletr. Farm. 2010, 7, 22. |
On-line version ISSN 1678-7064 Printed version ISSN 0100-4042
Qu�mica Nova
Publica��es da Sociedade Brasileira de Qu�mica
Caixa Postal: 26037
05513-970 S�o Paulo - SP
Tel/Fax: +55.11.3032.2299/+55.11.3814.3602
Free access