QUIMIOINFORMÁTICA: UMA INTRODUÇÃO

Alves, Vinicius M.; Braga, Rodolpho C.; Muratov, Eugene N.; Andrade, Carolina Horta

doi:10.21577/0100-4042.20170145

Resumo

Cheminformatics is an interdisciplinary field between chemistry and informatics, which has evolved considerably since its inception in the 1960s. Initially, the cheminformatics community dealt primarily with practical and technical aspects of chemical structure representation, manipulation, and processing, while modern research explores a new role: the exploration and interpretation of large chemical databases and the discovery of new compounds with desired activity and safety profiles. Despite the recent release of several hallmark reviews addressing methods and application of cheminformatics written in Portuguese, so far there are no scientific articles presenting cheminformatics research to the Brazilian scientific community yet. To address this gap, we aim to introduce the field of cheminformatics to both students and researchers in a simple and didactic way by narrating important historical facts and contextualizing information within the scope of various applications.

Keywords:
cheminformatics; QSAR; chemical similarity; structure representation, property prediction; virtual screening

INTRODUÇÃO

A quimioinformática é uma ciência interdisciplinar que utiliza recursos das ciências da computação e informação para resolver problemas da química.¹1 Gasteiger, J.; Engel, T.; Chemoinformatics: a textbook, Gasteiger, J.; Engel, T., eds.; Wiley-VCH Verlag GmbH & Co. KGaA: Weinheim, FRG, 2003. O termo quimioinformática foi cunhado por Frank Brown em 1998, definindo-a como “mistura de recursos de informação para transformar dados em informação e informação em conhecimento, no intuito de tomar decisões melhores e mais rápidas na área de identificação e otimização de compostos líderes”.²2 Brown, F. K.; Annu. Rep. Med. Chem. 1998, 33, 375. Em uma definição mais abrangente, em 1999, Greg Paris, então pesquisador da companhia farmacêutica Novartis, definiu a quimioinformática como “um termo genérico que engloba a concepção, criação, organização, gestão, recuperação, análise, disseminação, visualização e utilização de informação química”.³3 Warr, W. A.; Extract from 218th ACS National Meeting and Exposition New Orleans, Louisiana, August 22-26, 1999 http://www.warr.com/warrzone2000.html, acessada em outubro 2017.
http://www.warr.com/warrzone2000.html...

Apesar do nome recente, a quimioinformática não foi estabelecida ou fundada. Trata-se uma ciência que evoluiu e se consolidou ao longo de décadas.¹1 Gasteiger, J.; Engel, T.; Chemoinformatics: a textbook, Gasteiger, J.; Engel, T., eds.; Wiley-VCH Verlag GmbH & Co. KGaA: Weinheim, FRG, 2003.^,⁴4 Hann, M.; Green, R.; Curr. Opin. Chem. Biol. 1999, 3, 379. A revista científica mais importante da área, Journal of Chemical Information and Modeling, da American Chemical Society (ACS), existe desde 1961, chamada, na época, de Journal of Chemical Documentation (1961-1974) e, posteriormente, Journal of Chemical Information and Computer Sciences (1975-2005), chegando no nome atual em 2005 (http://pubs.acs.org/toc/jcisd8/current). Nesse intervalo, várias áreas que hoje compõem a quimioinformática foram se consolidando como (i) representação, visualização, manipulação e processamento de estruturas químicas, (ii) organização de bases de dados de estruturas químicas e (iii) estudos das relações quantitativas entre estrutura e atividade/propriedade (QSAR/QSPR, do inglês, quantitative structure-activity/property relationships).⁵5 Willett, P.; Wiley Interdiscip. Rev.: Comput. Mol. Sci. 2011, 1, 46.

O campo da quimioinformática evoluiu bastante, passando de aspectos práticos e técnicas de representação, manipulação e processamento de estruturas químicas individuais até o seu papel primordial na atualidade: exploração de bases de dados químicas e descoberta de novos compostos com atividade e/ou propriedade desejadas. Ao se explorar bases de dados é possível extrair várias informações que auxiliam na compreensão do comportamento de determinado grupo de compostos e é possível gerar modelos computacionais que são utilizados para predizer a atividade de moléculas que carecem de dados experimentais, ou seja, dados de ensaios in vitro e in vivo.⁶6 Fourches, D.; Em Application of Computational Techniques in Pharmacy and Medicine; Gorb, L., Kuz’min, V., Muratov, E., eds.; Springer Netherlands: Dordrecht, 2014, cap. 16.^,⁷7 Gasteiger, J.; Molecules 2016, 21, 151.

Essa mudança de cenário se deve, principalmente, à grande quantidade de dados biológicos e químicos produzidos graças a evolução de ensaios de biológicos de alta vazão (HTS, do inglês, High Throughput Screening) e da química combinatória.⁸8 Zhu, H.; Zhang, J.; Kim, M. T.; Boison, A.; Sedykh, A.; Moran, K.; Chem. Res. Toxicol. 2014, 27, 1643. A quantidade de dados cresceu tanto que, atualmente, tornou-se inviável extrair informação de bases de dados e, principalmente, transformar essa informação em conhecimento sem o uso de um computador.⁶6 Fourches, D.; Em Application of Computational Techniques in Pharmacy and Medicine; Gorb, L., Kuz’min, V., Muratov, E., eds.; Springer Netherlands: Dordrecht, 2014, cap. 16.^,⁹9 Tetko, I. V; Engkvist, O.; Chen, H.; Future Med. Chem. 2016, 8, 1801. Ainda na década de 1960, quando os primeiros estudos de relação quantitativa estrutura entre atividade foram publicados, as análises eram realizadas a poucos compostos de séries congêneres e as equações deduzidas manualmente. Atualmente, modelos de QSAR/QSPR são gerados usando milhares de compostos e descritores moleculares, aplicando-se os mais variáveis algoritmos computacionais.¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.

É importante ressaltar que a quimioinformática está altamente relacionada e comumente converge com outras subáreas da química que trabalham com computadores,¹¹11 Wild, D.; Introducing cheminformatics: an intensive self-guided study, 2nd ed., McGraw-Hill Open Publishing, 2013. como a química computacional,⁵5 Willett, P.; Wiley Interdiscip. Rev.: Comput. Mol. Sci. 2011, 1, 46. que aplica de métodos de química teórica para se calcular a estrutura e propriedades de moléculas; a modelagem molecular,¹²12 Hinchliffe, A.; Molecular Modelling for Beginners, Wiley: West Sussex, 2003. que usa gráficos 3D e técnicas de otimização para ajudar a compreender a natureza e ação de compostos químicos e proteínas; e o planejamento de fármacos auxiliado por computador,¹³13 Young, D. C.; Computational drug design: A guide for computational and medicinal chemists, John Wiley & Sons, Inc.: Hoboken , 2009, vol. 14. que diz respeito ao uso de técnicas computacionais para auxiliar na descoberta e planejamento de novas moléculas bioativas.

Nas últimas duas décadas, foram publicados artigos de revisão sobre QSAR/QSPR,¹⁴14 Tavares, L. C.; Quim. Nova 2004, 27, 631.^,¹⁵15 Gaudio, A. C.; Zandonade, E.; Quim. Nova 2001, 24, 658. artigos abordando metodologias de QSAR/QSPR,¹⁶16 Ferreira, M. M. C.; Montanari, C. A.; Gaudio, A. C.; Quim. Nova 2002, 25, 439.

17 Arroio, A.; Honório, K. M.; da Silva, A. B. F.; Quim. Nova 2010, 33, 694.

18 Montanari, M. L. C.; Montanari, C. A.; Gaudio, A. C.; Quim. Nova 2002, 25, 231.

19 Cormanich, R. A.; Nunes, C. A.; Freitas, M. P.; Quim. Nova 2012, 35, 1157.^-²⁰20 Martins, J. P. A.; Ferreira, M. M. C.; Quim. Nova 2013, 36, 554. e de suas aplicações,²¹21 Freitas, H. F.; Paz, O. S.; Castilho, M. S.; Quim. Nova 2009, 32, 2114.

22 Almeida, V. L. de; Lopes, J. C. D.; Oliveira, S. R.; Donnici, C. L.; Montanari, C. A.; Quim. Nova 2010, 33, 1482.

23 Andrade, J. G.; Freitas, H. F.; Castilho, M. S.; Quim. Nova 2012, 35, 466.^-²⁴24 Walter, M. E.; Almeida, V. L.; Nunes, R. J.; Quim. Nova 2013, 36, 691. além de revisões sobre modelagem molecular²⁵25 Carvalho, I.; Pupo, M. T.; Borges, Á. D. L.; Bernardes, L. S. C.; Quim. Nova 2003, 26, 428.

26 Sant’Anna, C. M. R.; Rev. Virtual Quim. 2009, 1, 49.

27 Barreiro, E. J.; Rodrigues, C. R.; Albuquerque, M. G.; Sant’Anna, C. M. R.; Alencastro, R. B.; Quim. Nova 1997, 20, 1.^-²⁸28 Andrade, C. H.; Trossini, G. H. G.; Ferreira, E. I.; Rev. Eletronica Farm. 2010, VII, 1. em língua portuguesa. Contudo, não existe até o presente momento nenhum artigo científico que apresente a quimioinformática ao público acadêmico e científico em português. Este artigo de revisão visa apresentar a quimioinformática de uma forma simples e didática. A intenção dos autores é que esse artigo sirva de material introdutório em aulas de modelagem molecular e química medicinal e/ou computacional, e como um primeiro contato tanto para alunos de graduação quanto de pós-graduação, assim como para pesquisadores que tenham interesse em se aventurar nessa área da ciência.

REPRESENTAÇÃO DE ESTRUTURAS QUÍMICAS

Representação gráfica

A representação gráfica de um composto químico demonstra como seus átomos estão dispostos e conectados entre si (Figura 1 A, representação bidimensional e Figura 1 B, representação tridimensional). Representações gráficas são úteis para que compostos sejam visualizados e compreendidos por seres humanos, mas são ineficientes para um computador capturar e processar a informação contida naquela representação.²⁹29 Brecher, J.; Pure Appl. Chem. 2006, 78. Diversas representações computacionais de estruturas químicas já foram propostas. Aqui descrevemos as mais inovadoras e importantes. Em 1949, William Wiswesser propôs um método de representação estrutural através de linhas, denominado de Wiswesser Line Notation (WLN). A notação de linhas de Wiswesser foi utilizada por anos, se mostrando inovadora na triagem de subestruturas, mas esse método não produzia um código canônico (único) para cada estrutura e não era fácil de ser gerado, dando espaço à outras representações unidimensionais (1D).³⁰30 Wiswesser, W. J.; J. Chem. Inf. Model. 1982, 22, 88.

Figura 1
Métodos de representação de estruturas químicas, utilizando o ácido acetilsalicílico (Aspirina) como exemplo

Na década de 1960, Harry Morgan desenvolveu um algoritmo capaz de representar estruturas químicas de forma única.³¹31 Morgan, H. L.; J. Chem. Doc. 1965, 5, 107. Esse algoritmo representou um importante passo na representação de estruturas, pois foi essencial para criar um registro numérico único automatizado para cada estrutura química que fosse depositada no Sistema de Registros Químicos do Chemical Abstract Service (CAS),³²32 CAS History; https://www.cas.org/about-cas/cas-history, acessada em outubro 2017.
https://www.cas.org/about-cas/cas-histor... que pertence à Sociedade Americana de Química.³³33 Figueras, J.; J. Chem. Inf. Model. 1993, 33, 717. Esse sistema representou um marco na pesquisa química, por ser uma forma simples de se identificar substâncias químicas, o que é essencial para a construção de bases de dados de compostos.

Foi na década de 1980 que David Weininger, fundador da Daylight Chemical Information Systems, Inc., propôs a primeira versão do SMILES (do inglês, Simplified Molecular-Input Line-Entry System) (Figura 1C). Weininger também considerou a teoria dos grafos para propor seu sistema de representação de estruturas. Cada átomo é representado por seu símbolo na tabela periódica, parênteses são usados para indicar pontos de ramificação e os rótulos numéricos designam pontos de conexão de anéis. A gramática básica do SMILES também inclui informações isotópicas, configuração sobre ligações duplas e quiralidade, conhecido como SMILES isomérico.³⁴34 Weininger, D.; J. Chem. Inf. Model. 1988, 28, 31.^,³⁵35 Anderson, E.; Veith, G. D.; Weininger, D.; SMILES: a line notation and computerized interpreter for chemical structureshttps://cfpub.epa.gov/si/si_public_record_report.cfmdirEntryId=33186?, acessada em outubro 2017.
https://cfpub.epa.gov/si/si_public_recor... Desde sua criação, o SMILES foi modificado e expandido pela Daylight para incluir novos recursos, denominando-o de SMARTS (do inglês, SMiles ARbitrary Target Specification).³⁶36 Daylight Inc.; SMARTS - A Language for Describing Molecular Patterns http://www.daylight.com/dayhtml/doc/theory/theory.smarts.html, acessada em outubro 2017.
http://www.daylight.com/dayhtml/doc/theo... Posteriormente, a IUPAC (do inglês, International Union of Pure and Applied Chemistry) desenvolveu sua própria notação linear para representar estruturas químicas, o InChIKey (do inglês, International Union of Pure and Applied ChemistryKey), baseado no seu identificador InChI.³⁷37 Pletnev, I.; Erin, A.; McNaught, A.; Blinov, K.; Tchekhovskoi, D.; Heller, S.; J. Cheminform. 2012, 4, 39.

Nessa mesma época, diversos formatos CT (Chemical Table³⁸38 Dalby, A.; Nourse, J. G.; Hounshell, W. D.; Gushurst, A. K. I.; Grier, D. L.; Leland, B. A.; Laufer, J.; J. Chem. Inf. Model. 1992, 32, 244. ou Connection Table³⁹39 Elsevier MDL; CTFile Formats, Elsevier: San Leandro, 2005.) foram desenvolvidos pela Molecular Design Limited (MDL), sendo o MDL MOL (ou molfile) e MDL SDF (ou SDfile) os mais utilizados (Figura 1D). Esses formatos representam as estruturas químicas como se fossem grafos e as informações são armazenadas em uma tabela. A teoria dos grafos descreve a relação de objetos em determinado conjunto através de vértices. Em arquivos CT, os átomos mais pesados que o hidrogênio correspondem aos vértices e ligações químicas às arestas.³⁸38 Dalby, A.; Nourse, J. G.; Hounshell, W. D.; Gushurst, A. K. I.; Grier, D. L.; Leland, B. A.; Laufer, J.; J. Chem. Inf. Model. 1992, 32, 244.^,³⁹39 Elsevier MDL; CTFile Formats, Elsevier: San Leandro, 2005. Existem vários softwares que interpretam essa informação e representam as estruturas químicas graficamente. Softwares como o MarvinView (https://www.chemaxon.com/) e PyMOL (http://pymol.org/), interpretam essa informação e representam as estruturas químicas graficamente.

Existem atualmente vários softwares e plataformas na web para que o usuário possa desenhar e visualizar representações de estruturas químicas, denominados editores moleculares. Um dos editores moleculares mais conhecidos, o ChemDraw⁴⁰40 Mills, N.; J. Am. Chem. Soc. 2006, 128, 13649. (http://www.cambridgesoft.com/software/overview.aspx), foi desenvolvido em 1985, sendo atualmente comercializado pela empresa PerkinElmer Inc. Alternativas gratuitas de livre acesso estão disponíveis e vem sendo amplamente utilizadas, como o MarvinSketch (https://www.chemaxon.com/) e Avogadro (https://avogadro.cc/). O JMSE⁴¹41 Bienfait, B.; Ertl, P.; J. Cheminform. 2013, 5, 24. (http://peter-ertl.com/jsme/) é um editor molecular escrito em JavaScript, que pode ser incorporado em outras ferramentas, como por exemplo, o OSRA (Optical Structure Recognition, https://cactus.nci.nih.gov/cgi-bin/osra/index.cgi), programa projetado para converter representações gráficas de estruturas químicas, como aparecem em artigos de revistas, documentos de patentes, livros didáticos, revistas comerciais, em formatos interpretáveis por um computador, como SMILES ou SDfile. Uma lista completa de editores moleculares para diversas plataformas (Windows, macOS, Linux, Java, editores online e aplicativos para celular) pode ser encontrada na página de editores moleculares do Wikipedia (https://en.wikipedia.org/wiki/Molecule_editor).

Descritores moleculares

Para que uma estrutura química seja compreendida e processada por um computador, ela precisa ser descrita em uma sequência numérica única. Descritores moleculares representam estruturas químicas incorporando muito mais informação do que os métodos anteriores. Um descritor molecular é o resultado final de um procedimento matemático e lógico que transforma informação química codificada em uma representação simbólica de uma molécula em um número útil ou é o resultado de algum experimento padronizado.⁴²42 Consonni, V.; Todeschini, R.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht, 2010, cap. 3. Os descritores são dispostos em uma matriz (Tabela 1) ou em um vetor de bits (bit vector ou STD logic vector). Como pode-se observar na Tabela 1, os dados de atividade/propriedade (Y_n) são armazenados na coluna “Atividade/Propriedade” e cada descritor segue em uma nova coluna, de forma que todos os descritores (Xn) de um determinado composto estejam na mesma linha.⁴³43 Cronin, M. T.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht , 2010, cap. 1.

Thumbnail

Tabela 1
Representação genérica de uma matriz de dados contendo atividade/propriedade biológica e descritores moleculares para um estudo de QSAR/QSPR

Diferentes tipos de descritores químicos refletem diferentes níveis de representação estrutural. Esses descritores podem ser classificados quanto à sua “dimensionalidade” em unidimensionais (1D), baseados em propriedades físico-químicas e da fórmula molecular (ex., massa molecular, refratividade molar, logP, entre outros); bidimensionais (2D), que descrevem propriedades que podem ser calculadas de uma representação 2D (ex., número de átomos, número de ligações, índices de conectividade, entre outros); e tridimensionais (3D), que dependem da conformação 3D das moléculas (ex., volume de Van der Waals, área de superfície acessível ao solvente, entre outros).⁴⁴44 Xue, L.; Bajorath, J.; Comb. Chem. High Throughput Screening 2000, 3, 363. Outros níveis de representação, como descritores 4D, propostos por Hopfinger et al.,⁴⁵45 Hopfinger, A. J.; Wang, S.; Tokarski, J. S.; Jin, B.; Albuquerque, M.; Madhav, P. J.; Duraiswami, C.; J. Am. Chem. Soc. 1997, 119, 10509. constituem uma abordagem 3D que utiliza uma a conformação obtida por meio de simulação de dinâmica molecular. Os descritores 5D propostos por Vedani e Dobler⁴⁶46 Vedani, A.; Dobler, M.; J. Med. Chem. 2002, 45, 2139. foram uma extensão do 4D proposto por Hopfinger et al.,⁴⁵45 Hopfinger, A. J.; Wang, S.; Tokarski, J. S.; Jin, B.; Albuquerque, M.; Madhav, P. J.; Duraiswami, C.; J. Am. Chem. Soc. 1997, 119, 10509. adicionando liberdade conformacional, permitindo assim uma representação múltipla da topologia dos ligantes no sítio ativo. O mesmo grupo propôs em seguida descritores 6D, que consideram vários modelos de solvatação simultaneamente.⁴⁷47 Vedani, A.; Dobler, M.; Lill, M. A.; J. Med. Chem. 2005, 48, 3700.

Outra classificação diz respeito à natureza desses descritores, podendo ser: (i) constitucionais, que são derivados da composição atômica do composto (ex., peso molecular, números de átomos e ligações); (i) topológicos (ex., índice de conteúdo de informações de ligações); (iii) geométricos, que são derivados de coordenadas 3D (ex., volume molecular, área de superfície polar, entre outros); (iv)eletrostáticos, que são derivados das cargas parciais (ex., índices de polaridade, carga parciais, entre outros); e (v) mecânico-quânticos, que são derivados das funções de onda dos elétrons (ex., energia dos orbitais moleculares).⁴⁸48 Todeschini, R.; Consonni, V.; Handbook of Molecular Descriptors, Todeschini, R., Consonni, V., eds.; Wiley: Weinheim, 2000. Vários programas de computador estão disponíveis para o cálculo de descritores moleculares, como DRAGON ^® (Talete SRL, Milan, Italy), CDK ^® (http://www.rguha.net/code/java/cdkdesc.html), CODESSA ^® (http://www.semichem.com/codessa/), RDKit (http://www.rdkit.org/), entre outros.

BASES DE DADOS

Atualmente, existem várias bases de dados de compostos químicos que trazem diversas informações relevantes para as mais diversas áreas da química. Como exemplo, as bases de dados ChemSpider (http://www.chemspider.com/) e Chemicalize (http://chemicalize.com/) trazem relevantes informações relacionadas à estrutura das moléculas, como nome químico, nome comercial, identificadores (e.g., número do CAS), propriedades físicas, espectro interativo, referências na literatura e fornecedores de produtos químicos. O SciFinder (https://scifinder.cas.org/) traz informações estruturais, reações químicas e publicações científicas e patentes relacionadas às mais de 100 milhões de estruturas químicas depositadas no CAS (https://www.cas.org/), base de dados de compostos químicos da American Chemical Society, fundada em 1907.⁴⁹49 Chemical Abstracts Service; Introduction to CAS: a division of the American Chemical Society. A KnowItAll U (http://www.knowitallu.com/) provê acesso a mais de 2 milhões de espectros, incluindo infravermelho, ressonância magnética nuclear, massas, etc.

Algumas bases de dados trazem informações biológicas para estruturas químicas, como resultados de ensaios in vitro, in vivo e principalmente resultados de triagem de alta vazão (HCS/HTS). Como exemplo, cita-se a ChEMBL⁵⁰50 Willighagen, E. L.; Waagmeester, A.; Spjuth, O.; Ansell, P.; Williams, A. J.; Tkachenko, V.; Hastings, J.; Chen, B.; Wild, D. J.; J. Cheminform. 2013, 5, 23.^,⁵¹51 Gaulton, A.; Bellis, L. J.; Bento, A. P.; Chambers, J.; Davies, M.; Hersey, A.; Light, Y.; McGlinchey, S.; Michalovich, D.; Al-Lazikani, B.; Overington, J. P.; Nucleic Acids Res. 2012, 40, D1100. (https://www.ebi.ac.uk/chembl/) e PubChem⁵²52 Wang, Y.; Xiao, J.; Suzek, T. O.; Zhang, J.; Wang, J.; Zhou, Z.; Han, L.; Karapetyan, K.; Dracheva, S.; Shoemaker, B. A.; Bolton, E.; Gindulyte, A.; Bryant, S. H.; Nucleic Acids Res. 2012, 40, D400.^,⁵³53 Canny, S. A.; Cruz, Y.; Southern, M. R.; Griffin, P. R.; Bioinformatics 2012, 28, 140. (http://pubchem.ncbi.nlm.nih.gov/). Essas últimas tiveram um crescimento excepcional nos últimos anos, principalmente devido à expansão dos ensaios de triagem de alta vazão e da química combinatória, que aceleraram a quantidade de dados biológicos produzidos para moléculas pequenas.⁸8 Zhu, H.; Zhang, J.; Kim, M. T.; Boison, A.; Sedykh, A.; Moran, K.; Chem. Res. Toxicol. 2014, 27, 1643. O DrugBank⁵⁴54 Wishart, D. S.; Knox, C.; Guo, A. C.; Shrivastava, S.; Hassanali, M.; Stothard, P.; Chang, Z.; Woolsey, J.; Nucleic Acids Res. 2006, 34, D668.^,⁵⁵55 Wishart, D. S.; Knox, C.; Guo, A. C.; Cheng, D.; Shrivastava, S.; Tzur, D.; Gautam, B.; Hassanali, M.; Nucleic Acids Res. 2008, 36, D901. (https://www.drugbank.ca/) é uma base de dados de fármacos aprovados com informações mais abrangentes, como estrutura química, propriedades físico-químicas calculadas e experimentais, uso terapêutico e informações mais detalhadas, como propriedades farmacocinéticas, toxicológicas, farmacodinâmicas e sobre seu alvo molecular, quando disponíveis.

Vale ainda mencionar bases de dados de macromoléculas, como o PDB (Protein Data Bank, https://www.rcsb.org/) e o BMRDB (Biological Magnetic Resonance Data Bank,http://www.bmrb.wisc.edu/), que são repositórios de proteínas, ácidos nucleicos e outras biomacromoléculas complexas que contribuem em estudos relacionados às ciências da saúde, planejamento de fármacos, agricultura, etc.⁵⁶56 Berman, H. M.; Westbrook, J.; Feng, Z.; Gilliland, G.; Bhat, T. N.; Weissig, H.; Shindyalov, I. N.; Bourne, P. E.; Nucleic Acids Res. 2000, 28, 235.^,⁵⁷57 Berman, H. M.; Bhat, T. N.; Bourne, P. E.; Feng, Z.; Gilliland, G.; Weissig, H.; Westbrook, J.; Nat. Struct. Biol. 2000, 7 Suppl, 957.

ANÁLISE DE SIMILARIDADE QUÍMICA

Frequentemente, moléculas semelhantes possuem propriedades semelhantes,⁵⁸58 Johnson, M. A.; Maggiora, G. M.; Concepts and applications of molecular similarity, John Wiley & Sons, Inc.: New York, 1990, vol. 13.^,⁵⁹59 Heikamp, K.; Bajorath, J.; J. Chem. Inf. Model. 2011, 51, 2254. mas isso nem sempre se aplica a todos os casos.⁶⁰60 Kubinyi, H.; Pespect. Drug Discovery Des. 1998, 9-11, 225. A similaridade química é um dos conceitos mais explorados em quimioinformática e em outras áreas da química, como a química medicinal⁶¹61 Maggiora, G.; Vogt, M.; Stumpfe, D.; Bajorath, J.; J. Med. Chem. 2014, 57, 3186. e toxicologia.⁶²62 Floris, M.; Manganaro, A.; Nicolotti, O.; Medda, R.; Mangiatordi, G. F.; Benfenati, E.; J. Cheminform. 2014, 6, 39. A análise de moléculas semelhantes é extremamente importante para se estabelecer relações entre estrutura e atividade ou propriedade (SAR, do inglês, Structure-Activity Relationships) e compreender o comportamento de determinado grupo de moléculas. Essa tarefa contribui para se encontrar erros experimentais e os denominados cliffs de atividade em subgrupos de moléculas. Um cliff de atividade é definido como um par de estruturas químicas semelhantes com atividade/propriedade muito diferentes.⁶³63 Maggiora, G. M.; J. Chem. Inf. Model. 2006, 46, 1535.^,⁶⁴64 Guha, R.; Van Drie, J. H.; J. Chem. Inf. Model. 2008, 48, 646. Essa análise, obviamente, pode ser feita manualmente por um bom químico, contudo, se torna inviável quando o conjunto de dados é demasiadamente grande.⁶¹61 Maggiora, G.; Vogt, M.; Stumpfe, D.; Bajorath, J.; J. Med. Chem. 2014, 57, 3186.

A similaridade química é calculada em um computador aplicando-se uma função de similaridade (também chamada de coeficiente de similaridade) a descritores moleculares.⁶¹61 Maggiora, G.; Vogt, M.; Stumpfe, D.; Bajorath, J.; J. Med. Chem. 2014, 57, 3186. Dentre as funções de similaridade mais utilizadas, podem-se citar o coeficiente de Tanimoto⁶⁵65 Rogers, D. J.; Tanimoto, T. T.; Science 1960, 132, 1115. (também conhecido como similaridade de Jaccard),⁶⁶66 Jaccard, P.; Bull. Soc. Vaudoise Sci. Nat. 1901, XXXVII, 83. e as distâncias Euclideana⁶⁷67 Ferreira, M. M. C.; Quimiometria: Conceitos, Métodos e Aplicações, UNICAMP: Campinas, 2015. e de Mahalanobis.⁶⁸68 Mahalanobis, P. C.; Proc. Natl. Inst. Sci. India 1936, 2, 49. Qualquer tipo de descritor pode ser utilizado na análise de similaridade, mas os descritores baseados em fragmentos moleculares, principalmente os do tipo impressão digital ou fingerprints, são os mais utilizados, por serem mais fáceis de se interpretar.⁶⁹69 Willett, P.; Drug Discov. Today 2006, 11, 1046.

Além do auxílio na compreensão das relações entre estrutura e atividade, o uso da similaridade molecular possui várias outras aplicações. Pode-se utilizar coeficientes de similaridade para se identificar o núcleo comum de um determinado número de estruturas para se fazer uma análise de pares moleculares combinados (do inglês, matched molecular pair analysis, MMPA). A MMPA é uma abordagem para se identificar e comparar pares de moléculas semelhantes de um conjunto de compostos e avaliar a mudança de propriedade associada.⁷⁰70 Kenny, P. W.; Sadowski, J.; Em Chemoinformatics in Drug Discovery.; Oprea, T. I., ed.; WILEY-VCH Verlag GmbH & Co. KGaA: Weinheim, 2005, cap. 11. Os pares combinados são moléculas que diferem apenas por uma subestrutura particular ou um fragmento bem definido. Portanto, a MMPA pode revelar mudanças nas propriedades biológicas entre estruturas com alta similaridade, que diferem por apenas um grupo químico. Por fim, podemos citar o uso da similaridade molecular em ferramentas de busca dentro das bases de dados químicas (ver seção anterior), além de catálogos de compostos químicos comerciais, como a ChemBridge (http://www.chembridge.com/) e Sigma-Aldrich (http://www.sigmaaldrich.com/).

RELAÇÕES QUANTITATIVAS ENTRE ESTRUTURA QUÍMICA E ATIVIDADE/PROPRIEDADE (QSAR/QSPR)

Breve história e evolução

A partir da década de 1930, com base nos conhecimentos acumulados em físico-química e química orgânica, a área de relações entre estrutura e atividade ou propriedade começou a avançar.⁷¹71 Hammett, L. P.; J. Am. Chem. Soc. 1937, 59, 96. Em 1940, o estudo publicado por Hammett representou um marco no entendimento de propriedades moleculares de compostos orgânicos e na história do QSAR.⁷²72 Hammett, L. P.; Physical organic chemistry: reaction rates, equilibria, and mechanisms, 1st ed., McGraw-Hill: New York, 1940. Ele avaliou a ionização de derivados do ácido benzoico e demonstrou, pela primeira vez, uma relação linear entre a variação dos grupos substituintes e a propriedade biológica estudada. Essa relação ficou conhecida como equação de Hammett.

Quase quatro décadas se passaram quando Hansch e Fujita⁷³73 Hansch, C.; Fujita, T.; J. Am. Chem. Soc. 1964, 86, 1616. consolidaram as bases dos estudos de QSAR/QSPR com um estudo inovador. Nesse estudo, os autores demonstraram que a atividade biológica poderia ser linearmente correlacionada com diferentes parâmetros físico-químicos, relacionados a efeitos hidrofóbicos, estéricos e eletrônicos. Na mesma época, Free e Wilson⁷⁴74 Free, S. M.; Wilson, J. W.; J. Med. Chem. 1964, 7, 395. desenvolveram uma abordagem para descrever a atividade biológica de compostos através de equações estabelecidas a partir da análise de séries congêneres. Na década de 1970, Kubinyi refinou o modelo de Hansch, desenvolvendo um modelo que descrevia a dependência não linear da atividade biológica sobre o caráter hidrofóbico.⁷⁵75 Kubinyi, H.; Arzneim. Forsch. 1977, 27, 750.

76 Kubinyi, H.; Farmaco Sci. 1979, 34, 248.^-⁷⁷77 Debnath, A. K.; Mini Rev. Med. Chem. 2001, 1, 187.

Na década de 1980, com os avanços em termos de hardware e software, o estudo das propriedades de estruturas tridimensionais (3D) tornou-se possível e então diversas abordagens de QSAR-3D foram propostas e desenvolvidas. Em 1980, Hopfinger e colaboradores desenvolveram um método baseado na forma molecular, denominado Análise da Forma Molecular (MSA, do inglês, Molecular Shape Analysis), o qual utiliza análise conformacional para obtenção de descritores 3D da forma molecular.⁷⁸78 Hopfinger, A. J.; J. Am. Chem. Soc. 1980, 102, 7196. Em 1988, Cramer, Patterson e Bunce desenvolveram a metodologia de Análise Comparativa de Campos Moleculares (CoMFA, do inglês, Comparative Molecular Fields Analysis).⁷⁹79 Cramer, R. D.; Patterson, D. E.; Bunce, J. D.; J. Am. Chem. Soc. 1988, 110, 5959. Essa técnica usa descritores 3D estéricos e eletrostáticos em campos moleculares, empregando o método dos mínimos quadrados parciais (PLS, do inglês, partial least squares) para estabelecer a relação com a atividade biológica. Em 1989, o CoMFA foi implementado na plataforma comercial SYBYL (http://www.tripos.com) e se tornou um dos métodos mais utilizados e difundidos nas últimas duas décadas.⁸⁰80 Zhang, L.; Tsai, K.-C.; Du, L.; Fang, H.; Li, M.; Xu, W.; Curr. Med. Chem. 2011, 18, 923. No entanto, o CoMFA possui um processo de modelagem lento, além de ser dependente do alinhamento e da conformação 3D (bioativa) das estruturas do conjunto de dados.¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977. Uma proposta similar ao CoMFA, mas que adicionou os efeitos de ligações de hidrogênio (doador e aceptor) e hidrofóbico foi desenvolvida pelo mesmo grupo e denominada de Análise Comparativa de Índices de Similaridade Molecular (CoMSIA, do inglês, Comparative Molecular Similarity Index Analysis),⁸¹81 Klebe, G.; Abraham, U.; Mietzner, T.; J. Med. Chem. 1994, 37, 4130. também implementado na plataforma SYBYL (http://www.tripos.com).

Outras metodologias de QSAR inovadoras foram desenvolvidas, como o QSAR-4D, proposto por Hopfinger e colaboradores.⁴⁵45 Hopfinger, A. J.; Wang, S.; Tokarski, J. S.; Jin, B.; Albuquerque, M.; Madhav, P. J.; Duraiswami, C.; J. Am. Chem. Soc. 1997, 119, 10509. Nesse método, os descritores são calculados para uma amostragem de conformações obtidas por meio de simulação de dinâmica molecular, reduzindo a dificuldade em encontrar a conformação bioativa. Posteriormente, extensões desse método foram propostas, como o Quasar QSAR-5D,⁴⁶46 Vedani, A.; Dobler, M.; J. Med. Chem. 2002, 45, 2139. que adiciona liberdade conformacional, permitindo uma representação múltipla da topologia dos ligantes no sítio ativo, e Quasar QSAR-6D, que considera vários modelos de solvatação simultaneamente.⁴⁷47 Vedani, A.; Dobler, M.; Lill, M. A.; J. Med. Chem. 2005, 48, 3700.

Desde o final dos anos 1990, métodos usados em QSAR/QSPR apresentaram vários avanços e crescente interesse de grupos de pesquisa e indústrias farmacêuticas.⁸²82 Cramer, R. D.; J. Comput. Aided. Mol. Des. 2012, 26, 35. Inúmeros descritores moleculares, métodos de aprendizado de máquina e parâmetros de validação foram desenvolvidos e vêm sendo aplicados. Os estudos de QSAR/QSPR consolidaram a quimioinformática como uma ciência capaz de transformar a informação química em conhecimento. Inicialmente, modelos de QSAR/QSPR eram utilizados principalmente para otimização de compostos químicos. Atualmente, o QSAR/QSPR tem sido utilizado desde as fases de descoberta e avaliação de compostos químicos, até otimização de compostos líderes, tendendo a ser cada vez mais empregado, devido ao aprimoramento de recursos computacionais e o crescente aumento da disponibilidade de dados químicos e biológicos de alta qualidade.¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.

Princípios

Um modelo de QSAR é uma equação matemática que relaciona a estrutura química com a propriedade biológica. A abordagem de QSAR consiste na aplicação de vários métodos estatísticos de análise de dados para desenvolver modelos que possam predizer corretamente determinada propriedade biológica de compostos baseados em sua estrutura química. Para se estabelecer essa relação, é necessário o cálculo de descritores moleculares e que a atividade biológica/propriedade tenha sido definida experimentalmente (Figura 2). O modelo de QSAR é a representação matemática final que, genericamente, pode ser definida através da Equação 1:

Equação 1

P_{i} = k^{'} (D_{1}, D_{2}, \dots, D_{n})

Figura 2
Esquema representando a geração de um modelo de QSAR/QSPR (modificado de ref. 83)

onde P_i é a atividade biológica ou propriedade da molécula, D₁, D₂, ..., D_n são propriedades estruturais (descritores) calculadas (ou, em alguns casos, medidas experimentalmente) e k’ é um peso definido pelo algoritmo computacional e atribuído aos descritores para se calcular as propriedades das moléculas.⁴³43 Cronin, M. T.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht , 2010, cap. 1.^,⁸³83 Tropsha, A.; Mol. Inform. 2010, 29, 476.

Para se desenvolver um modelo de QSAR não é necessário, obrigatoriamente, recursos computacionais. Essa equação pode ser derivada manualmente, contudo, dado a imensa quantidade de descritores moleculares e conjuntos de dados disponíveis, esse trabalho se tornou humanamente inviável sem o auxílio de um computador. Para contornar essa dificuldade, métodos de aprendizado de máquina têm sido amplamente empregados.⁸⁴84 Melville, J. L.; Burke, E. K.; Hirst, J. D.; Comb. Chem. High Throughput Screening 2009, 12, 332. Esses métodos estabelecem peso aos descritores, ajustando a equação que relaciona a estrutura química com a atividade biológica ou propriedade (Figura 2).⁸³83 Tropsha, A.; Mol. Inform. 2010, 29, 476.

O principal objetivo de um modelo de QSAR é avaliar compostos que carecem de dados experimentais (in vitro e in vivo). Essa abordagem possui aplicações na (i) identificação racional de novos ligantes/protótipos com atividade/propriedade desejada; (ii) otimização da atividade/propriedade; e na (iii) identificação de compostos potencialmente tóxicos.⁸³83 Tropsha, A.; Mol. Inform. 2010, 29, 476. Alguns trabalhos que demonstram a aplicação de modelos de QSAR no planejamento de fármacos e predição de toxicidade são comentados na seção Aplicações.

Os modelos de QSAR podem ser divididos em globais e locais. Modelos globais são gerados usando-se todo o conjunto treinamento. Nesse caso, podem existir subgrupos de moléculas que apresentam uma maior similaridade estrutural e, consequentemente, possuem características específicas. Esse subconjunto pode ser utilizado para se gerar modelos chamados de locais, ou seja, que usam um subconjunto de estruturas do conjunto de dados total baseados ou na similaridade química ou no mecanismo de ação. Apesar de modelos locais poderem contribuir com a elaboração de novas regras de relação estrutura-atividade, estudos mostram que, normalmente, não há melhorias na precisão do modelo quando se utilizam modelos de QSAR locais em comparação com modelos globais.⁸⁵85 Sheridan, R. P.; J. Chem. Inf. Model. 2014, 54, 1083.^,⁸⁶86 Helgee, E. A.; Carlsson, L.; Boyer, S.; Norinder, U.; J. Chem. Inf. Model. 2010, 50, 677.

Aprendizado de máquina

O aprendizado de máquina consiste em métodos de inteligência artificial que dizem respeito ao estudo e construção de sistemas que podem aprender com dados. Comumente, o processo é desenvolvido em três etapas: (i) representação dos dados, (ii) otimização da hipótese, e (iii) generalização.⁸⁷87 Welling, M.; A first encounter with Machine Learning, University of California: Irvine, 2011. Na geração de um modelo de QSAR/QSPR, os dados são representados na forma de uma matriz com a atividade/propriedade no eixo Y e os descritores no eixo X (Tabela 1).⁸³83 Tropsha, A.; Mol. Inform. 2010, 29, 476. Uma hipótese (equação) é gerada em via de se estabelecer uma relação dos descritores com a atividade biológica. Essa relação é otimizada em um determinado números de vezes, dependendo da função utilizada e do algoritmo selecionado. Em seguida, a capacidade de generalização da hipótese é testada, avaliando-se o conjunto teste. Nesse contexto, generalizar diz respeito à habilidade da equação final em predizer corretamente um exemplo/tarefa (no caso, a atividade/propriedade) não usado na construção dos modelos (conjunto teste).⁸⁷87 Welling, M.; A first encounter with Machine Learning, University of California: Irvine, 2011.

Os métodos de aprendizado são divididos em supervisionados e não supervisionados. No primeiro caso, os algoritmos são treinados com variável Y defnida na tentativa de gerar uma função matemática que generalize essa variável. Vários algoritmos de aprendizado supervisionados estão disponíveis atualmente, como random forest (RF),⁸⁸88 Breiman, L. E. O.; Mach. Learn. 2001, 45, 5.support vector machine (SVM),⁸⁹89 Cortes, C.; Vapnik, V.; Mach. Learn. 1995, 20, 273. redes neurais (NN)⁹⁰90 Dreiseitl, S.; Ohno-Machado, L.; J. Biomed. Inform. 2002, 35, 352. e deep learning (DL).⁹¹91 LeCun, Y.; Bengio, Y.; Hinton, G.; Nature 2015, 521, 436. Os modelos gerados usando métodos supervisionados, uma vez validados, constituem um ponto de partida para a avaliação e/ou seleção de compostos químicos que carecem de dados experimentais (ver seção Triagem virtual à frente).¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.

Os métodos não supervisionados são usados para identificar padrões nos conjuntos de dados com base apenas nos descritores, visto que a variável Y não é definida. Essa abordagem, quando aplicada aos conjuntos de dados químicos, identifica subgrupos homogêneos entre um conjunto de dados heterogêneo.⁶⁷67 Ferreira, M. M. C.; Quimiometria: Conceitos, Métodos e Aplicações, UNICAMP: Campinas, 2015. Alguns dos vários usos dessa abordagem incluem (i) a verificação da diversidade estrutural do conjunto de dados; (ii) a avaliação da consistência de dados experimentais; e (iii) a exploração de possíveis interferências que influenciam na atividade, contribuindo para a revelação de novas regras de SAR.⁹²92 Downs, G. M.; Barnard, J. M.; Em Reviews in Computational Chemistry; Lipkowitz, K. B., Boyd, D. B., eds.; John Wiley & Sons, Inc.: Hoboken , 2003, vol. 18, cap. 1.^,⁹³93 Mercier, D.; Clustering large datasets, http://ldc.usb.ve/~mcuriel/Cursos/WC/Transfer.pdf, acessada em outubro 2017.
http://ldc.usb.ve/~mcuriel/Cursos/WC/Tra... Algoritmos comumente utilizados nessa abordagem incluem análise de componentes principais (PCA, do inglês principal component analysis), análise de agrupamentos hierárquicos (HCA, do inglês hierarchical cluster analysis) e mapas auto-organizáveis (SOM, do inglês self-organizing maps).⁶⁷67 Ferreira, M. M. C.; Quimiometria: Conceitos, Métodos e Aplicações, UNICAMP: Campinas, 2015.

Boas práticas de desenvolvimento e validação

No início dos anos 2000 surgiu uma crescente preocupação com a qualidade das predições de modelos de QSAR gerados e publicados na literatura. Para garantir a qualidade dos modelos gerados, diretrizes e recomendações de boas práticas de desenvolvimento e validação de modelos de QSAR foram propostas.¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.^,⁸³83 Tropsha, A.; Mol. Inform. 2010, 29, 476.^,⁹⁴94 Dearden, J. C.; Cronin, M. T. D.; Kaiser, K. L. E.; SAR QSAR Environ. Res. 2009, 20, 241. Em 2004, a OECD (Organization for Economic Co-operation and Development) publicou princípios para validação de modelos de QSAR para o uso prático na regulamentação de compostos químicos. Esses princípios são: (i) atividade biológica ou propriedade definida; (ii) algoritmo claro; (iii) domínio de aplicabilidade (DA) definido; (iv) avaliação apropriada da robustez e preditividade; (v) e interpretação mecanística, que significa encontrar relações entre os descritores e a atividade biológica ou propriedade, em via de se compreender melhor o mecanismo de ação de uma estrutura química ou aprofundar o conhecimento biológico sobre a propriedade em estudo.⁹⁵95 OECD; OECD principles for the validation, for regulatory purposes, of (Quantitative) Structure-Activity Relationship models, http://www.oecd.org/chemicalsafety/risk-assessment/37849783.pdf, acessada em outubro 2017.
http://www.oecd.org/chemicalsafety/risk-... Em consideração a esses princípios, vários elementos-chave devem ser considerados durante o desenvolvimento e validação de modelos de QSAR/QSPR e serão discutidos a seguir.¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.^,⁸³83 Tropsha, A.; Mol. Inform. 2010, 29, 476.^,⁹⁴94 Dearden, J. C.; Cronin, M. T. D.; Kaiser, K. L. E.; SAR QSAR Environ. Res. 2009, 20, 241.

Preparo químico e biológico do conjunto de dados

Existe uma crescente preocupação sobre a irreprodutibilidade frequente de dados experimentais relatados em publicações científicas.⁹⁶96 Frye, S. V; Arkin, M. R.; Arrowsmith, C. H.; Conn, P. J.; Glicksman, M. A.; Hull-Ryde, E. A.; Slusher, B. S.; Nat. Rev. Drug Discov. 2015, 14, 733. Modelos computacionais são sensíveis à qualidade dos dados utilizados e, por consequência, o preparo do conjunto de dados é indispensável para tentar evitar que erros sejam propagados em outros estudos e/ou interfiram na preditividade dos modelos. Abordagens de quimioinformática auxiliam na identificação e remoção de amostras que contenham erros experimentais ou de anotação.⁹⁷97 Fourches, D.; Muratov, E.; Tropsha, A.; Nat. Chem. Biol. 2015, 11, 535. Esse processo inclui o preparo químico e biológico dos conjuntos de dados (Figura 3).

Figura 3
Fluxo geral de trabalho proposto para o preparo de conjuntos de dados (modificado de ref. 98)

Um fluxo de trabalho de preparo de conjunto de dados foi proposto por Fourches, Muratov e Tropsha (2010 e 2016).⁹⁸98 Fourches, D.; Muratov, E.; Tropsha, A.; J. Chem. Inf. Model. 2016, 56, 1243. Esse fluxo, bastante rigoroso, se inicia com o preparo químico do conjunto de dados (Figura 3, passo 1), que segue um protocolo previamente estabelecido⁹⁹99 Fourches, D.; Muratov, E.; Tropsha, A.; J. Chem. Inf. Model. 2010, 50, 1189. e permite a identificação e correção de erros nas estruturas químicas. Nessa etapa, misturas de componentes, compostos inorgânicos e organometálicos são removidos (quando não é possível calcular descritores para esses compostos). É feita a padronização de quimiotipos específicos, como anéis aromáticos, grupos nitro e formas tautoméricas. Contraíons são removidos e duplicatas identificadas (compostos repetidos) são analisadas e removidas (Figura 3, passo 2). A análise das duplicatas é importante pois permite avaliar a qualidade dos dados experimentais e remover estruturas químicas de registros duplicados com dados experimentais contraditórios, que afetam a qualidade dos modelos. Duplicatas presentes no conjunto teste superestimam a qualidade dos modelos. Uma inspeção manual é requerida ao final do processo para garantir que todas as estruturas estejam corretas. Em conjuntos de dados grandes, essa análise pode ser feita por amostragem.

Em seguida, realiza-se uma análise da variabilidade experimental intra- e interlabotarial (Figura 3, passo 3) e exclui-se de fontes de dados não confiáveis, ou seja, dados com alta variação nos valores dos ensaios (passo 4), a fim de aumentar a qualidade dos dados e contribuir na tomada de decisões sobre a combinação de dados de diferentes fontes. A detecção e análise dos “cliffs” de atividade⁶³63 Maggiora, G. M.; J. Chem. Inf. Model. 2006, 46, 1535. (passo 5) e o cálculo e ajuste do índice de modelabilidade¹⁰⁰100 Golbraikh, A.; Muratov, E.; Fourches, D.; Tropsha, A.; J. Chem. Inf. Model. 2014, 54, 1. do conjunto de dados (passo 6) estimam a viabilidade de obtenção de modelos preditivos para um determinado conjunto de dados e serve como indicadores adicionais de qualidade dos dados. A geração de modelos de QSAR de consenso (passo 7) é utilizada para tentar aumentar a confiança das predições de modelos individuais. Nessa etapa, gera-se modelos de QSAR independentes, com descritores moleculares e/ou algoritmos diferentes. O modelo de consenso é aquele que considera uma média das predições dos modelos independentes. Na última etapa (passo 8), dados biológicos incorretos podem ser identificados investigando-se compostos que tiveram atividade biológica predita muito diferente do valor experimental.

Detecção de amostras atípicas ou anômalas (“outliers”)

Amostras atípicas ou “outliers” são compostos que apresentam atividade/propriedade inesperada. Essas amostras podem resultar de erros experimentais, representar erros na estrutura química ou representarem “cliffs” de atividade. Um cliff de atividade representa estruturas químicas semelhantes com atividade/propriedade muito diferentes.⁶³63 Maggiora, G. M.; J. Chem. Inf. Model. 2006, 46, 1535.^,⁶⁴64 Guha, R.; Van Drie, J. H.; J. Chem. Inf. Model. 2008, 48, 646. Por esse motivo, amostras atípicas não devem ser removidas sem explicação, visto que sua remoção, frequentemente feita indiscriminadamente no passado para melhorar os parâmetros estatísticos do modelo, é considerada manipulação. A melhoria nos parâmetros estatísticos pode não representar melhoria real na preditividade externa do modelo. Se um composto possui um dado de atividade/propriedade dentro do intervalo do conjunto de dados e esse composto está dentro do domínio de aplicabilidade do conjunto de dados, ele não deve ser removido. Se o composto representar um cliff de atividade, sua má predição pelo modelo precisa ser interpretada e discutida.¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.

Validação dos modelos

A utilidade de um modelo de QSAR/QSPR depende de sua preditividade, ou seja, da sua capacidade em predizer determinada propriedade biológica com elevada taxa de acerto. O procedimento de validação serve para analisar a robustez e a preditividade de um modelo de QSAR. A validação é dividida em interna e externa. A validação interna é importante para determinar a robustez de um modelo, ou seja, a capacidade de reproduzir suas predições. Apesar da validação interna ser importante principalmente durante a geração dos modelos para se ajustar parâmetros do algoritmo, a real preditividade do modelo de QSAR/QSPR gerado só é avaliada usando-se um conjunto de validação externa, ou seja, que não foi utilizado para gerar, derivar, ou selecionar os modelos.¹⁰¹101 Golbraikh, A.; Tropsha, A.; J. Mol. Graph. Model. 2002, 20, 269.^,¹⁰²102 Gramatica, P.; QSAR Comb. Sci. 2007, 26, 694.

A validação interna normalmente é feita retirando-se um composto (leave-one-out) ou vários (leave-many-out) compostos do conjunto treinamento. Assim, um novo modelo é gerado e os compostos retirados são então preditos. Essa prática é realizada por um determinado número de vezes. O modelo final é gerado utilizando todo o conjunto treinamento. Já a validação externa é realizada separando-se parte dos compostos do conjunto modelagem para validação externa. Normalmente, separa-se entre 20% e 30% do conjunto de dados original. Um método ainda mais rigoroso de validação externa consiste no método de validação externa n-fold. Nesse caso, o conjunto de dados total é dividido em n partes. Uma das partes é utilizada como validação externa e as outras usadas para geração dos modelos. Isso é repetido n vezes, até que cada um dos n subconjuntos passe uma vez pelo conjunto de validação externa. Ao final, um consenso entre as predições individuais é realizado. A diferença entre a validação interna e externa, é que, na interna, o modelo final utiliza todos os compostos que foram utilizados para validação, ao passo que na validação externa, os compostos do conjunto de validação externa não são usados para gerar os modelos.¹⁰³103 Tropsha, A.; Gramatica, P.; Gombar, V. K.; QSAR Comb. Sci. 2003, 22, 69.^,¹⁰⁴104 Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2011, 51, 2320.

Um modelo é considerado rigorosamente validado quando ele atinge os requisitos mínimos de validação interna e externa. Diferentes métricas estatísticas foram propostas, sendo aquelas usadas para modelos contínuos diferentes das usadas para modelos categóricos. Um modelo contínuo é gerado quando a variável Y do conjunto de dados corresponde a uma escala numérica (p. ex., pIC50, ponto de fusão, ponto de ebulição, etc.). Um modelo categórico é gerado quando a variável Y é dividida em classes (p. ex., ativo/inativo, tóxico/não-tóxico, solúvel/insolúvel, etc.).

Um modelo continuo possui boa robustez quando seu coeficiente de correlação cruzada (R²2 Brown, F. K.; Annu. Rep. Med. Chem. 1998, 33, 375.) é maior que 0.7.¹⁰⁴104 Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2011, 51, 2320. Apesar de necessária, essa métrica é insuficiente para se avaliar a preditividade externa de um modelo,¹⁰¹101 Golbraikh, A.; Tropsha, A.; J. Mol. Graph. Model. 2002, 20, 269. por isso é necessário se avaliar o coeficiente de correlação de validação cruzada externa (Q²2 Brown, F. K.; Annu. Rep. Med. Chem. 1998, 33, 375.), que é considerado válido quando Q²2 Brown, F. K.; Annu. Rep. Med. Chem. 1998, 33, 375. ≥ 0.6.¹⁰⁴104 Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2011, 51, 2320. Os modelos categóricos são validados usando-se a acurácia balanceada (ou taxa de classificação correta),¹⁰⁵105 Wang, X. S.; Tang, H.; Golbraikh, A.; Tropsha, A.; J. Chem. Inf. Model. 2008, 48, 997. sensibilidade e especificidade¹⁰⁶106 Altman, D. G.; Bland, J. M.; BMJ 1994, 308, 1552. e os valores de preditividade positiva e negativa,¹⁰⁷107 Altman, D. G.; Bland, J. M.; BMJ 1994, 309, 102. sendo que todas essas métricas devem estar acima de 0.6. As métricas aqui citadas são as mais comuns em quimioinformática, contudo, existem várias outras que podem ser utilizadas em via de se garantir uma alta preditividade do modelo, como curva ROC (receiver operating characteristic),¹⁰⁸108 McClish, D. K.; Med. Decis. Making 1989, 9, 190. diferentes fórmulas para calcular o Q²2 Brown, F. K.; Annu. Rep. Med. Chem. 1998, 33, 375.,¹⁰⁴104 Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2011, 51, 2320.^,¹⁰⁹109 Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2012, 52, 2044. entre outras que podem ser encontradas na literatura.¹¹⁰110 Roy, K.; Mitra, I.; Comb. Chem. High Throughput Screening 2011, 14, 450.^,¹¹¹111 Roy, K.; Mitra, I.; Kar, S.; Ojha, P. K.; Das, R. N.; Kabir, H.; J. Chem. Inf. Model. 2012, 52, 396.

Por fim, vale mencionar a técnica de aleatorização da variávelY (Y-randomization), que é recomendada para se garantir que os resultados dos modelos de QSAR não sejam provenientes do acaso. Nesse procedimento, a variável Y é aleatorizada e novos modelos são gerados. Caso a preditividade dos modelos com variável Y aleatória seja melhor que os modelos de QSAR, os modelos devem ser descartados, uma vez que os descritores moleculares não descrevem bem Y.¹¹²112 Kuz’min, V. E.; Muratov, E. N.; Artemenko, A. G.; Varlamova, E. V.; Gorb, L.; Wang, J.; Leszczynski, J.; QSAR Comb. Sci. 2009, 28, 664.

Definição do domínio de aplicabilidade (DA)

O domínio de aplicabilidade ou domínio de aplicação é uma característica importante de qualquer modelo de QSAR.¹¹³113 Gadaleta, D.; Mangiatordi, G. F.; Catto, M.; Carotti, A.; Nicolotti, O.; International Journal of Quantitative Structure-Property Relationships 2016, 1, 45.^,¹¹⁴114 Mathea, M.; Klingspohn, W.; Baumann, K.; Mol. Inform. 2016, 35, 160. O DA representa o espaço químico definido pelo conjunto de moléculas do conjunto de treinamento de determinado modelo de QSAR. Predições são consideradas confiáveis quando a molécula predita se insere dentro do DA do modelo em questão. É importante ressaltar que o limite do DA é totalmente definido pelo tamanho e diversidade do conjunto utilizado para desenvolver os modelos. Quando a molécula está fora do domínio de um modelo, a predição pode ser incorreta, visto ela pode ser muito diferente e não ser completamente compreendida pelo modelo. Por esse motivo, a determinação do DA é uma etapa essencial para aceitabilidade de um modelo de QSAR.⁸³83 Tropsha, A.; Mol. Inform. 2010, 29, 476. Recentemente, um estudo¹¹⁵115 Alves, V. M.; Muratov, E. N.; Zakharov, A.; Muratov, N. N.; Andrade, C. H.; Tropsha, A.; Food Chem. Toxicol. 2017, no prelo. demonstrou que modelos de QSAR gerados para cosméticos, fármacos e pesticidas podem ser utilizados mutualmente, ou seja, um modelo desenvolvido usando principalmente fármacos e moléculas fármaco-semelhantes pode ser usado para se avaliar cosméticos e pesticidas. Contudo, é imprescindível que antes seja verificado se a molécula a ser avaliada computacionalmente está dentro do DA daquelas usadas para gerar o modelo em questão.

TRIAGEM VIRTUAL

A triagem virtual (VS, do inglês Virtual Screening) compreende o processo de triagem de bibliotecas de compostos químicos através de modelos computacionais com a finalidade de avaliar e/ou selecionar compostos com propriedades desejadas.¹¹⁶116 Schneider, G.; Nat. Rev. Drug Discov. 2010, 9, 273. Essa é uma abordagem bem estabelecida no moderno processo de planejamento e desenvolvimento de fármacos,¹¹⁶116 Schneider, G.; Nat. Rev. Drug Discov. 2010, 9, 273. assim como na avaliação de potenciais compostos perigosos ao meio ambiente.⁸8 Zhu, H.; Zhang, J.; Kim, M. T.; Boison, A.; Sedykh, A.; Moran, K.; Chem. Res. Toxicol. 2014, 27, 1643. A triagem virtual é uma alternativa rápida e de baixo custo para a triagem e seleção de hits,¹¹⁷117 Kessel, M.; Nat. Biotechnol. 2011, 29, 27. o que reduz o número de compostos selecionados para avaliação experimental.¹¹⁸118 Polgár, T.; Keseru, G. M.; Comb. Chem. High Throughput Screening 2011, 14, 889. Habitualmente, a taxa de sucesso da triagem de alta vazão (HTS, do inglês, High Throughput Screening) varia entre 0,01% e 0,14%, enquanto as taxas de sucesso para a VS geralmente varia entre 1% e 40%.¹¹⁹119 Truchon, J.-F.; Bayly, C. I.; J. Chem. Inf. Model. 2007, 47, 488.

120 Forli, S.; Molecules 2015, 20, 18732.^-¹²¹121 Clark, D. E.; Expert Opin. Drug Discovery 2008, 3, 841.

Os métodos computacionais usados para VS são normalmente divididos em métodos baseados no ligante (LBVS, do inglês, Ligand-based Virtual Screening) e na estrutura (SBVS, do inglês, Structure-based Virtual Screening).¹²²122 Ma, X. H.; Zhu, F.; Liu, X.; Shi, Z.; Zhang, J. X.; Yang, S. Y.; Wei, Y. Q.; Chen, Y. Z.; Curr. Med. Chem. 2012, 19, 5562. Abordagens baseadas no ligante usam estruturas químicas associadas a dados conhecidos para desenvolver modelos, tais como análise de similaridade,¹²³123 Eckert, H.; Bajorath, J.; Drug Discovery Today 2007, 12, 225. modelos de QSAR,⁸⁴84 Melville, J. L.; Burke, E. K.; Hirst, J. D.; Comb. Chem. High Throughput Screening 2009, 12, 332. e modelos farmacofóricos.¹²⁴124 Yang, S.-Y.; Drug Discovery Today 2010, 15, 444. Por outro lado, os métodos baseados na estrutura utilizam a estrutura tridimensional (3D) do alvo biológico. Neste caso, as moléculas são acopladas no sítio de ligação e classificadas com base na sua afinidade de ligação predita ou complementaridade. Modelos farmacofóricos e métodos baseados na estrutura estão fora do escopo desse artigo. Informações adicionais sobre essas técnicas podem ser encontradas na literatura.¹²⁰120 Forli, S.; Molecules 2015, 20, 18732.^,¹²⁵125 Braga, R. C.; Alves, V. M.; Silva, A. C.; Nascimento, M. N.; Silva, F. C.; Liao, L. M.; Andrade, C. H.; Curr. Top. Med. Chem. 2014, 14, 1899.

126 Braga, R. C.; Andrade, C. H.; Curr. Top. Med. Chem. 2013, 13, 1127.

127 Kar, S.; Roy, K.; Expert Opin. Drug Discovery 2013, 8, 245.^-¹²⁸128 Ripphausen, P.; Nisius, B.; Peltason, L.; Bajorath, J.; J. Med. Chem. 2010, 53, 8461.

Um método de triagem virtual que se popularizou bastante dentro da toxicologia computacional compreende o uso de alertas estruturais. Alertas estruturais¹²⁹129 OECD; Report of the workshop on structural alerts for the OECD (Q)SAR application toolbox, http://www.oecd.org/officialdocuments/publicdisplaydocumentpdf/?cote=env/jm/mono(2009)4&doclanguage=en, acessada em outubro 2017.
http://www.oecd.org/officialdocuments/pu... são subestruturas moleculares que estão associadas com determinada propriedade da molécula.¹³⁰130 Blagg, J.; Em Burger’s Medicinal Chemistry and Drug Discovery, John Wiley & Sons, Inc.: Hoboken , 2010. Comumente, alertas baseiam-se no conhecimento humano e são destinados a entender a base química do mecanismo de toxicidade ou, pelo menos, o evento molecular iniciante no caso de propriedades mais complexas.¹³¹131 Allen, T. E. H.; Goodman, J. M.; Gutsell, S.; Russell, P. J.; Chem. Res. Toxicol. 2014, 27, 2100.

Os alertas estruturais são usados para sinalizar potenciais perigos e agrupar compostos em categorias para propiciar a comparação de análogos químicos por interpolação.¹³²132 Enoch, S. J.; Roberts, D. W.; Em Chemical Toxicity Prediction: Category Formation and Read-Across; Cronin, M., Madden, J., Enoch, S., Roberts, D., eds.; Royal Society of Chemistry, 2013, cap. 2.^,¹³³133 ECHA; Agrupamento de substâncias e métodos comparativos por interpolação https://echa.europa.eu/pt/support/registration/how-to-avoid-unnecessary-testing-on-animals/grouping-of-substances-and-read-across, acessada em outubro 2017.
https://echa.europa.eu/pt/support/regist... Contudo, foi demonstrado que alertas estruturais são extremamente promíscuos.¹³⁴134 Alves, V.; Muratov, E.; Capuzzi, S.; Politi, R.; Low, Y.; Braga, R.; Zakharov, A. V.; Sedykh, A.; Mokshyna, E.; Farag, S.; Andrade, C.; Kuz’min, V.; Fourches, D.; Tropsha, A.; Green Chem. 2016, 18, 4348. Se usados sozinhos para predizer a toxicidade, podem ser prejudiciais tanto para a avaliação da segurança quanto no planejamento de fármacos. Entretanto, os alertas estruturais, quando validados estatisticamente por modelos de QSAR, podem contribuir para o planejamento de compostos mais seguros. Em resumo, alertas estruturais devem ser usados apenas como proposta de mecanismo de ação e somente quando validados um método estatístico robusto, no caso, modelos de QSAR.¹³⁴134 Alves, V.; Muratov, E.; Capuzzi, S.; Politi, R.; Low, Y.; Braga, R.; Zakharov, A. V.; Sedykh, A.; Mokshyna, E.; Farag, S.; Andrade, C.; Kuz’min, V.; Fourches, D.; Tropsha, A.; Green Chem. 2016, 18, 4348.

APLICAÇÕES DA QUIMIOINFORMÁTICA

As aplicações da quimioinformática são ilimitadas. Mesmo que seja uma área mais aplicada para a avaliação da segurança de compostos químicos, para fins ambientais e no processo de planejamento e desenvolvimento de fármacos,⁶6 Fourches, D.; Em Application of Computational Techniques in Pharmacy and Medicine; Gorb, L., Kuz’min, V., Muratov, E., eds.; Springer Netherlands: Dordrecht, 2014, cap. 16. a quimioinformática pode ser utilizada em todas as áreas da química. Contribui para a redução do custo do desenvolvimento de novas moléculas; redução do número de animais utilizados em ensaios experimentais, e promoção da química verde. Além disso, pode aumentar a eficiência do processo de pesquisa e desenvolvimento, pois diminui resíduos gerados, visto que compostos mais improváveis de terem sucesso são descartados antes de seguirem para ensaios experimentais.⁴³43 Cronin, M. T.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht , 2010, cap. 1.^,¹³⁵135 Varnek, A.; Baskin, I. I.; Mol. Inform. 2011, 30, 20.

Um fluxograma de aplicação da quimioinformática para o planejamento de moléculas de interesse encontra-se representado na Figura 4. Dados biológicos de compostos químicos provenientes de estudos experimentais (fase 0) estão sempre sendo publicados em artigos científicos e/ou depositados em repositórios de dados (fase 1). Esses dados servem de ponto de partida para os estudos de quimioinformática. Na fase 2, os dados químicos e biológicos são compilados, preparados e integrados. Em seguida (fase 3), a análise do conjunto de dados e de similaridade é realizada e os modelos de QSAR são gerados. Os modelos de QSAR gerados são então utilizados para triar virtualmente uma biblioteca com novos compostos e/ou compostos que nunca foram avaliados experimentalmente para a propriedade em estudo (fase 4). Na fase 5, os melhores hits são selecionados para avaliação experimental. Compostos avaliados com propriedades indesejadas são descartados. Os compostos selecionados podem ser sintetizados ou adquiridos de empresas especializadas, como a ChemBridge (http://www.chembridge.com/) e Sigma-Aldrich (https://www.sigmaaldrich.com/). Os compostos entram novamente na fase 0 (avaliação experimental), fechando o ciclo. A avaliação experimental é a melhor forma de validação de um modelo computacional. Após essa etapa, os compostos são utilizados para enriquecer os modelos disponíveis. Essa prática aumenta o espaço químico de cobertura dos modelos e contribui para aumentar a sua preditividade.¹⁰10 Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.

Figura 4
Aplicação da quimioinformática na avaliação, seleção e planejamento de compostos com propriedades otimizadas (modificado de ref 10).

Modelos de QSAR têm sido empregados com sucesso na triagem virtual para a descoberta de compostos promissores. Por exemplo, Neves e colaboradores¹³⁶136 Neves, B. J.; Dantas, R. F.; Senger, M. R.; Melo-Filho, C. C.; Valente, W. C. G.; de Almeida, A. C. M.; Rezende-Neto, J. M.; Lima, E. F. C.; Paveley, R.; Furnham, N.; Muratov, E.; Kamentsky, L.; Carpenter, A. E.; Braga, R. C.; Silva-Junior, F. P.; Andrade, C. H.; J. Med. Chem. 2016, 59, 7075. descobriram novos compostos com atividade contra Schistosoma mansoni integrando técnicas de QSAR e triagem de alta vazão. Em um estudo complementar, Melo-Filho e colaboradores¹³⁷137 Melo-Filho, C. C.; Dantas, R. F.; Braga, R. C.; Neves, B. J.; Senger, M. R.; Valente, W. C. G.; Rezende-Neto, J. M.; Chaves, W. T.; Muratov, E. N.; Paveley, R. A.; Furnham, N.; Kamentsky, L.; Carpenter, A. E.; Silva-Junior, F. P.; Andrade, C. H.; J. Chem. Inf. Model. 2016, 56, 1357. identificaram novos esqueletos moleculares com atividade esquistosomicida. Braga e colaboradores¹³⁸138 Braga, R. C.; Alves, V. M.; Silva, M. F. B.; Muratov, E.; Fourches, D.; Liao, L. M.; Tropsha, A.; Andrade, C. H.; Mol. Inform. 2015, 34, 698.^,¹³⁹139 Braga, R. C.; Alves, V. M.; Silva, M. F. B.; Muratov, E.; Fourches, D.; Tropsha, A.; Andrade, C. H.; Curr. Top. Med. Chem. 2014, 14, 1399. desenvolveram um servidor online baseado em QSAR para a predição de toxicidade cardíaca (bloqueio da hERG). Zhang e colaboradores¹⁴⁰140 Zhang, L.; Fourches, D.; Sedykh, A.; Zhu, H.; Golbraikh, A.; Ekins, S.; Clark, J.; Connelly, M. C.; Sigal, M.; Hodges, D.; Guiguemde, A.; Guy, R. K.; Tropsha, A.; J. Chem. Inf. Model. 2013, 53, 475. descobriram 25 novos compostos com atividade antimalárica e com baixa citotoxicidade, através do emprego de modelos de QSAR. Alves e colaboradores, analisando dados experimentais e de predições de modelos de QSAR, demonstraram baixa correlação entre as propriedades de permeabilidade e sensibilização cutânea,¹⁴¹141 Alves, V. M.; Muratov, E. N.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Toxicol. Appl. Pharmacol. 2015, 284, 273.^,¹⁴²142 Alves, V. M.; Muratov, E. N.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Toxicol. Appl. Pharmacol. 2015, 284, 262. descritas como correlacionadas na literatura.¹⁴³143 OECD; The Adverse Outcome Pathway for Skin Sensitisation Initiated by Covalent Binding to Proteins, http://www.oecd-ilibrary.org/environment/the-adverse-outcome-pathway-for-skin-sensitisation-initiated-by-covalent-binding-to-proteins_9789264221444-en, acessada em outubro 2017.
http://www.oecd-ilibrary.org/environment... Além disso, analisando-se dados experimentais de sensibilização cutânea de pele humana e dados do modelo animal preferencial realizado em camundongos, foi demonstrado que o modelo animal não descreve bem essa propriedade em seres humanos.¹⁴⁴144 Alves, V. M.; Capuzzi, S. J.; Muratov, E.; Braga, R. C.; Thornton, T.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Green Chem. 2016, 18, 6501.

Um recente e famoso caso da aplicação do QSAR para a descoberta de fármacos consistiu na descoberta de uma nova classe de inibidores potentes e seletivos do receptor androgênico com um novo mecanismo de ação, resultando no maior acordo de licenciamento acadêmico na história do Canadá, totalizando 142 milhões de dólares.¹⁴⁵145 Ban, F.; Dalal, K.; Li, H.; LeBlanc, E.; Rennie, P. S.; Cherkasov, A.; J. Chem. Inf. Model. 2017, 57, 1018. Nesse estudo, os autores empregaram vários métodos computacionais, dentre eles, modelos de QSAR-2D, 3D e 4D, modelos farmacofóricos e acoplamento molecular. Os autores trabalharam durante todo o projeto com experimentalistas em via de otimizar os modelos e as estruturas que eram propostas.

Além dos trabalhos citados, outros estudos inovadores que compreendem a aplicação da quimioinformática para modelagem de peptídeos,¹⁴⁶146 Lejon, T.; Strøm, M. B.; Svendsen, J. S.; J. Pept. Sci. 2001, 7, 74.^,¹⁴⁷147 Lejon, T.; Stiberg, T.; Strøm, M. B.; Svendsen, J. S.; J. Pept. Sci. 2004, 10, 329. misturas de componentes¹⁴⁸148 Muratov, E. N.; Varlamova, E. V.; Artemenko, A. G.; Polishchuk, P. G.; Nikolaeva-Glomb, L.; Galabov, A. S.; Kuz’Min, V. E.; Struct. Chem. 2013, 24, 1665.

149 Oprisiu, I.; Varlamova, E.; Muratov, E.; Artemenko, A.; Marcou, G.; Polishchuk, P.; Kuz’Min, V.; Varnek, A.; Mol. Inform. 2012, 31, 491.^-¹⁵⁰150 Muratov, E. N.; Varlamova, E. V.; Artemenko, A. G.; Polishchuk, P. G.; Kuz’min, V. E.; Mol. Inform. 2012, 31, 202. e nanopartículas¹⁵¹151 Fourches, D.; Pu, D.; Li, L.; Zhou, H.; Mu, Q.; Su, G.; Yan, B.; Tropsha, A.; Nanotoxicology 2016, 10, 374. também foram descritos. As aplicações dos princípios de QSAR/QSPR são várias, de forma que diversas derivações da nomenclatura têm surgido na literatura, como QSRR (quantitative structure-(chromatographic) retention relationships),¹⁵²152 Kaliszan, R.; Chem. Rev. 2007, 107, 3212. QNAR (quantitative nanostructure-activity relationships),¹⁵³153 Fourches, D.; Tropsha, A.; Em Nanotoxicology: Progress toward nanomedicine; Monteiro-Riviere, N. A., Lang Tran, C., eds.; CRC Press, 2014. QSTR (quantitative structure-toxicity relationships),¹⁵⁴154 Roy, K.; Ghosh, G.; J. Chem. Inf. Comput. Sci. 2004, 44, 559. entre outros.¹⁵⁵155 El-Kommos, M. E.; El-Gizawy, S. M.; Atia, N. N.; Hosny, N. M.; J. Fluoresc. 2015, 25, 1695.

156 Urbano-Cuadrado, M.; Carbó, J. J.; Maldonado, A. G.; Bo, C.; J. Chem. Inf. Model. 47, 2228.^-¹⁵⁷157 Garzia, A.; Villanti, A.; Tuccini, G.; J. Pharm. Sci. 1979, 68, 1081. Existem atualmente softwares para elucidação de estruturas químicas através de seus espectros de ressonância magnética nuclear, como ACD/Structure Elucidator Suite (http://www.acdlabs.com/products/com_iden/elucidation/struc_eluc/). Além disso, vários softwares como o MarvinSketch (https://www.chemaxon.com/) permitem cálculo de propriedades como lipofilicidade, solubilidade em água, além da predição de espectros de massa e de ressonância magnética nuclear.

Dessa maneira, observamos que métodos de quimioinformática têm sido amplamente aplicados para resolver problemas em várias áreas da química. A quimioinformática tem se consolidado em uma época em que repositórios de dados químicos e/ou biológicos com informação de livre acesso têm expandido rapidamente e sua utilidade e impacto na ciência tende a aumentar nas próximas décadas.⁶6 Fourches, D.; Em Application of Computational Techniques in Pharmacy and Medicine; Gorb, L., Kuz’min, V., Muratov, E., eds.; Springer Netherlands: Dordrecht, 2014, cap. 16.

CONSIDERAÇÕES FINAIS

A quimioinformática é uma ciência interdisciplinar que usa recursos computacionais e de tecnologia da informação para transformar informação química em conhecimento. Essa área se consolidou como uma área científica independente, evoluindo desde a década de 1960, quando lidava com aspectos práticos de representação, manipulação e processamento de estruturas químicas individuais até o seu papel primordial na atualidade: exploração de bases de dados químicos e biológicos para a descoberta de novos compostos com atividade ou propriedades desejadas.

A quimioinformática representa moléculas através de grafos armazenados em tabelas, linhas ou em descritores moleculares. Medidas de similaridade química ou relações hierárquicas entre estruturas químicas são utilizadas para se estabelecer relações entre estrutura-atividade e compreender o comportamento biológico de determinado grupo de compostos. Além disso, a quimioinformática utiliza métodos da inteligência artificial (aprendizado de máquina) para gerar modelos de QSAR que, quando devidamente validados, podem ser usados para predizer a atividade ou propriedade biológica de compostos que carecem de dados experimentais.

Neste artigo de revisão, nosso principal objetivo foi apresentar, pela primeira vez em língua portuguesa, a quimioinformática de forma simples e didática, abordando aspectos históricos, conceitos, métodos e também aplicações práticas e perspectivas do progresso dessa área específica da Química. Esperamos que este material possa servir de referência para estudantes, professores e pesquisadores que estão iniciando sua jornada ou se aventurando nessa área da ciência.

AGRADECIMENTOS

Os autores agradecem ao CNPq, à CAPES e à FAPEG pelo auxílio financeiro dos projetos do grupo de pesquisa e pelas bolsas concedidas. E.M. é professor na University of North Carolina at Chapel Hill (EUA) e atualmente é pesquisador visitante especial (PVE) no LabMol-UFG (CNPq # 400760/2014-2). C.H.A. é bolsista de produtividade em pesquisa do CNPq.

REFERÊNCIAS

¹
Gasteiger, J.; Engel, T.; Chemoinformatics: a textbook, Gasteiger, J.; Engel, T., eds.; Wiley-VCH Verlag GmbH & Co. KGaA: Weinheim, FRG, 2003.
²
Brown, F. K.; Annu. Rep. Med. Chem. 1998, 33, 375.
³
Warr, W. A.; Extract from 218th ACS National Meeting and Exposition New Orleans, Louisiana, August 22-26, 1999 http://www.warr.com/warrzone2000.html, acessada em outubro 2017.
» http://www.warr.com/warrzone2000.html
⁴
Hann, M.; Green, R.; Curr. Opin. Chem. Biol. 1999, 3, 379.
⁵
Willett, P.; Wiley Interdiscip. Rev.: Comput. Mol. Sci. 2011, 1, 46.
⁶
Fourches, D.; Em Application of Computational Techniques in Pharmacy and Medicine; Gorb, L., Kuz’min, V., Muratov, E., eds.; Springer Netherlands: Dordrecht, 2014, cap. 16.
⁷
Gasteiger, J.; Molecules 2016, 21, 151.
⁸
Zhu, H.; Zhang, J.; Kim, M. T.; Boison, A.; Sedykh, A.; Moran, K.; Chem. Res. Toxicol. 2014, 27, 1643.
⁹
Tetko, I. V; Engkvist, O.; Chen, H.; Future Med. Chem. 2016, 8, 1801.
¹⁰
Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.
¹¹
Wild, D.; Introducing cheminformatics: an intensive self-guided study, 2^nd ed., McGraw-Hill Open Publishing, 2013.
¹²
Hinchliffe, A.; Molecular Modelling for Beginners, Wiley: West Sussex, 2003.
¹³
Young, D. C.; Computational drug design: A guide for computational and medicinal chemists, John Wiley & Sons, Inc.: Hoboken , 2009, vol. 14.
¹⁴
Tavares, L. C.; Quim. Nova 2004, 27, 631.
¹⁵
Gaudio, A. C.; Zandonade, E.; Quim. Nova 2001, 24, 658.
¹⁶
Ferreira, M. M. C.; Montanari, C. A.; Gaudio, A. C.; Quim. Nova 2002, 25, 439.
¹⁷
Arroio, A.; Honório, K. M.; da Silva, A. B. F.; Quim. Nova 2010, 33, 694.
¹⁸
Montanari, M. L. C.; Montanari, C. A.; Gaudio, A. C.; Quim. Nova 2002, 25, 231.
¹⁹
Cormanich, R. A.; Nunes, C. A.; Freitas, M. P.; Quim. Nova 2012, 35, 1157.
²⁰
Martins, J. P. A.; Ferreira, M. M. C.; Quim. Nova 2013, 36, 554.
²¹
Freitas, H. F.; Paz, O. S.; Castilho, M. S.; Quim. Nova 2009, 32, 2114.
²²
Almeida, V. L. de; Lopes, J. C. D.; Oliveira, S. R.; Donnici, C. L.; Montanari, C. A.; Quim. Nova 2010, 33, 1482.
²³
Andrade, J. G.; Freitas, H. F.; Castilho, M. S.; Quim. Nova 2012, 35, 466.
²⁴
Walter, M. E.; Almeida, V. L.; Nunes, R. J.; Quim. Nova 2013, 36, 691.
²⁵
Carvalho, I.; Pupo, M. T.; Borges, Á. D. L.; Bernardes, L. S. C.; Quim. Nova 2003, 26, 428.
²⁶
Sant’Anna, C. M. R.; Rev. Virtual Quim. 2009, 1, 49.
²⁷
Barreiro, E. J.; Rodrigues, C. R.; Albuquerque, M. G.; Sant’Anna, C. M. R.; Alencastro, R. B.; Quim. Nova 1997, 20, 1.
²⁸
Andrade, C. H.; Trossini, G. H. G.; Ferreira, E. I.; Rev. Eletronica Farm. 2010, VII, 1.
²⁹
Brecher, J.; Pure Appl. Chem. 2006, 78
³⁰
Wiswesser, W. J.; J. Chem. Inf. Model. 1982, 22, 88.
³¹
Morgan, H. L.; J. Chem. Doc. 1965, 5, 107.
³²
CAS History; https://www.cas.org/about-cas/cas-history, acessada em outubro 2017.
» https://www.cas.org/about-cas/cas-history
³³
Figueras, J.; J. Chem. Inf. Model. 1993, 33, 717.
³⁴
Weininger, D.; J. Chem. Inf. Model. 1988, 28, 31.
³⁵
Anderson, E.; Veith, G. D.; Weininger, D.; SMILES: a line notation and computerized interpreter for chemical structureshttps://cfpub.epa.gov/si/si_public_record_report.cfmdirEntryId=33186?, acessada em outubro 2017.
» https://cfpub.epa.gov/si/si_public_record_report.cfmdirEntryId=33186?
³⁶
Daylight Inc.; SMARTS - A Language for Describing Molecular Patterns http://www.daylight.com/dayhtml/doc/theory/theory.smarts.html, acessada em outubro 2017.
» http://www.daylight.com/dayhtml/doc/theory/theory.smarts.html
³⁷
Pletnev, I.; Erin, A.; McNaught, A.; Blinov, K.; Tchekhovskoi, D.; Heller, S.; J. Cheminform. 2012, 4, 39.
³⁸
Dalby, A.; Nourse, J. G.; Hounshell, W. D.; Gushurst, A. K. I.; Grier, D. L.; Leland, B. A.; Laufer, J.; J. Chem. Inf. Model. 1992, 32, 244.
³⁹
Elsevier MDL; CTFile Formats, Elsevier: San Leandro, 2005.
⁴⁰
Mills, N.; J. Am. Chem. Soc. 2006, 128, 13649.
⁴¹
Bienfait, B.; Ertl, P.; J. Cheminform. 2013, 5, 24.
⁴²
Consonni, V.; Todeschini, R.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht, 2010, cap. 3.
⁴³
Cronin, M. T.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht , 2010, cap. 1.
⁴⁴
Xue, L.; Bajorath, J.; Comb. Chem. High Throughput Screening 2000, 3, 363.
⁴⁵
Hopfinger, A. J.; Wang, S.; Tokarski, J. S.; Jin, B.; Albuquerque, M.; Madhav, P. J.; Duraiswami, C.; J. Am. Chem. Soc. 1997, 119, 10509.
⁴⁶
Vedani, A.; Dobler, M.; J. Med. Chem. 2002, 45, 2139.
⁴⁷
Vedani, A.; Dobler, M.; Lill, M. A.; J. Med. Chem. 2005, 48, 3700.
⁴⁸
Todeschini, R.; Consonni, V.; Handbook of Molecular Descriptors, Todeschini, R., Consonni, V., eds.; Wiley: Weinheim, 2000.
⁴⁹
Chemical Abstracts Service; Introduction to CAS: a division of the American Chemical Society
⁵⁰
Willighagen, E. L.; Waagmeester, A.; Spjuth, O.; Ansell, P.; Williams, A. J.; Tkachenko, V.; Hastings, J.; Chen, B.; Wild, D. J.; J. Cheminform. 2013, 5, 23.
⁵¹
Gaulton, A.; Bellis, L. J.; Bento, A. P.; Chambers, J.; Davies, M.; Hersey, A.; Light, Y.; McGlinchey, S.; Michalovich, D.; Al-Lazikani, B.; Overington, J. P.; Nucleic Acids Res. 2012, 40, D1100.
⁵²
Wang, Y.; Xiao, J.; Suzek, T. O.; Zhang, J.; Wang, J.; Zhou, Z.; Han, L.; Karapetyan, K.; Dracheva, S.; Shoemaker, B. A.; Bolton, E.; Gindulyte, A.; Bryant, S. H.; Nucleic Acids Res. 2012, 40, D400.
⁵³
Canny, S. A.; Cruz, Y.; Southern, M. R.; Griffin, P. R.; Bioinformatics 2012, 28, 140.
⁵⁴
Wishart, D. S.; Knox, C.; Guo, A. C.; Shrivastava, S.; Hassanali, M.; Stothard, P.; Chang, Z.; Woolsey, J.; Nucleic Acids Res. 2006, 34, D668.
⁵⁵
Wishart, D. S.; Knox, C.; Guo, A. C.; Cheng, D.; Shrivastava, S.; Tzur, D.; Gautam, B.; Hassanali, M.; Nucleic Acids Res. 2008, 36, D901.
⁵⁶
Berman, H. M.; Westbrook, J.; Feng, Z.; Gilliland, G.; Bhat, T. N.; Weissig, H.; Shindyalov, I. N.; Bourne, P. E.; Nucleic Acids Res. 2000, 28, 235.
⁵⁷
Berman, H. M.; Bhat, T. N.; Bourne, P. E.; Feng, Z.; Gilliland, G.; Weissig, H.; Westbrook, J.; Nat. Struct. Biol. 2000, 7 Suppl, 957.
⁵⁸
Johnson, M. A.; Maggiora, G. M.; Concepts and applications of molecular similarity, John Wiley & Sons, Inc.: New York, 1990, vol. 13.
⁵⁹
Heikamp, K.; Bajorath, J.; J. Chem. Inf. Model. 2011, 51, 2254.
⁶⁰
Kubinyi, H.; Pespect. Drug Discovery Des. 1998, 9-11, 225.
⁶¹
Maggiora, G.; Vogt, M.; Stumpfe, D.; Bajorath, J.; J. Med. Chem. 2014, 57, 3186.
⁶²
Floris, M.; Manganaro, A.; Nicolotti, O.; Medda, R.; Mangiatordi, G. F.; Benfenati, E.; J. Cheminform. 2014, 6, 39.
⁶³
Maggiora, G. M.; J. Chem. Inf. Model. 2006, 46, 1535.
⁶⁴
Guha, R.; Van Drie, J. H.; J. Chem. Inf. Model. 2008, 48, 646.
⁶⁵
Rogers, D. J.; Tanimoto, T. T.; Science 1960, 132, 1115.
⁶⁶
Jaccard, P.; Bull. Soc. Vaudoise Sci. Nat. 1901, XXXVII, 83.
⁶⁷
Ferreira, M. M. C.; Quimiometria: Conceitos, Métodos e Aplicações, UNICAMP: Campinas, 2015.
⁶⁸
Mahalanobis, P. C.; Proc. Natl. Inst. Sci. India 1936, 2, 49.
⁶⁹
Willett, P.; Drug Discov. Today 2006, 11, 1046.
⁷⁰
Kenny, P. W.; Sadowski, J.; Em Chemoinformatics in Drug Discovery.; Oprea, T. I., ed.; WILEY-VCH Verlag GmbH & Co. KGaA: Weinheim, 2005, cap. 11.
⁷¹
Hammett, L. P.; J. Am. Chem. Soc. 1937, 59, 96.
⁷²
Hammett, L. P.; Physical organic chemistry: reaction rates, equilibria, and mechanisms, 1^st ed., McGraw-Hill: New York, 1940.
⁷³
Hansch, C.; Fujita, T.; J. Am. Chem. Soc. 1964, 86, 1616.
⁷⁴
Free, S. M.; Wilson, J. W.; J. Med. Chem. 1964, 7, 395.
⁷⁵
Kubinyi, H.; Arzneim. Forsch. 1977, 27, 750.
⁷⁶
Kubinyi, H.; Farmaco Sci. 1979, 34, 248.
⁷⁷
Debnath, A. K.; Mini Rev. Med. Chem. 2001, 1, 187.
⁷⁸
Hopfinger, A. J.; J. Am. Chem. Soc. 1980, 102, 7196.
⁷⁹
Cramer, R. D.; Patterson, D. E.; Bunce, J. D.; J. Am. Chem. Soc. 1988, 110, 5959.
⁸⁰
Zhang, L.; Tsai, K.-C.; Du, L.; Fang, H.; Li, M.; Xu, W.; Curr. Med. Chem. 2011, 18, 923.
⁸¹
Klebe, G.; Abraham, U.; Mietzner, T.; J. Med. Chem. 1994, 37, 4130.
⁸²
Cramer, R. D.; J. Comput. Aided. Mol. Des. 2012, 26, 35.
⁸³
Tropsha, A.; Mol. Inform. 2010, 29, 476.
⁸⁴
Melville, J. L.; Burke, E. K.; Hirst, J. D.; Comb. Chem. High Throughput Screening 2009, 12, 332.
⁸⁵
Sheridan, R. P.; J. Chem. Inf. Model. 2014, 54, 1083.
⁸⁶
Helgee, E. A.; Carlsson, L.; Boyer, S.; Norinder, U.; J. Chem. Inf. Model. 2010, 50, 677.
⁸⁷
Welling, M.; A first encounter with Machine Learning, University of California: Irvine, 2011.
⁸⁸
Breiman, L. E. O.; Mach. Learn. 2001, 45, 5.
⁸⁹
Cortes, C.; Vapnik, V.; Mach. Learn. 1995, 20, 273.
⁹⁰
Dreiseitl, S.; Ohno-Machado, L.; J. Biomed. Inform. 2002, 35, 352.
⁹¹
LeCun, Y.; Bengio, Y.; Hinton, G.; Nature 2015, 521, 436.
⁹²
Downs, G. M.; Barnard, J. M.; Em Reviews in Computational Chemistry; Lipkowitz, K. B., Boyd, D. B., eds.; John Wiley & Sons, Inc.: Hoboken , 2003, vol. 18, cap. 1.
⁹³
Mercier, D.; Clustering large datasets, http://ldc.usb.ve/~mcuriel/Cursos/WC/Transfer.pdf, acessada em outubro 2017.
» http://ldc.usb.ve/~mcuriel/Cursos/WC/Transfer.pdf
⁹⁴
Dearden, J. C.; Cronin, M. T. D.; Kaiser, K. L. E.; SAR QSAR Environ. Res. 2009, 20, 241.
⁹⁵
OECD; OECD principles for the validation, for regulatory purposes, of (Quantitative) Structure-Activity Relationship models, http://www.oecd.org/chemicalsafety/risk-assessment/37849783.pdf, acessada em outubro 2017.
» http://www.oecd.org/chemicalsafety/risk-assessment/37849783.pdf
⁹⁶
Frye, S. V; Arkin, M. R.; Arrowsmith, C. H.; Conn, P. J.; Glicksman, M. A.; Hull-Ryde, E. A.; Slusher, B. S.; Nat. Rev. Drug Discov. 2015, 14, 733.
⁹⁷
Fourches, D.; Muratov, E.; Tropsha, A.; Nat. Chem. Biol. 2015, 11, 535.
⁹⁸
Fourches, D.; Muratov, E.; Tropsha, A.; J. Chem. Inf. Model. 2016, 56, 1243.
⁹⁹
Fourches, D.; Muratov, E.; Tropsha, A.; J. Chem. Inf. Model. 2010, 50, 1189.
¹⁰⁰
Golbraikh, A.; Muratov, E.; Fourches, D.; Tropsha, A.; J. Chem. Inf. Model. 2014, 54, 1.
¹⁰¹
Golbraikh, A.; Tropsha, A.; J. Mol. Graph. Model. 2002, 20, 269.
¹⁰²
Gramatica, P.; QSAR Comb. Sci. 2007, 26, 694.
¹⁰³
Tropsha, A.; Gramatica, P.; Gombar, V. K.; QSAR Comb. Sci. 2003, 22, 69.
¹⁰⁴
Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2011, 51, 2320.
¹⁰⁵
Wang, X. S.; Tang, H.; Golbraikh, A.; Tropsha, A.; J. Chem. Inf. Model. 2008, 48, 997.
¹⁰⁶
Altman, D. G.; Bland, J. M.; BMJ 1994, 308, 1552.
¹⁰⁷
Altman, D. G.; Bland, J. M.; BMJ 1994, 309, 102.
¹⁰⁸
McClish, D. K.; Med. Decis. Making 1989, 9, 190.
¹⁰⁹
Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2012, 52, 2044.
¹¹⁰
Roy, K.; Mitra, I.; Comb. Chem. High Throughput Screening 2011, 14, 450.
¹¹¹
Roy, K.; Mitra, I.; Kar, S.; Ojha, P. K.; Das, R. N.; Kabir, H.; J. Chem. Inf. Model. 2012, 52, 396.
¹¹²
Kuz’min, V. E.; Muratov, E. N.; Artemenko, A. G.; Varlamova, E. V.; Gorb, L.; Wang, J.; Leszczynski, J.; QSAR Comb. Sci. 2009, 28, 664.
¹¹³
Gadaleta, D.; Mangiatordi, G. F.; Catto, M.; Carotti, A.; Nicolotti, O.; International Journal of Quantitative Structure-Property Relationships 2016, 1, 45.
¹¹⁴
Mathea, M.; Klingspohn, W.; Baumann, K.; Mol. Inform. 2016, 35, 160.
¹¹⁵
Alves, V. M.; Muratov, E. N.; Zakharov, A.; Muratov, N. N.; Andrade, C. H.; Tropsha, A.; Food Chem. Toxicol. 2017, no prelo.
¹¹⁶
Schneider, G.; Nat. Rev. Drug Discov. 2010, 9, 273.
¹¹⁷
Kessel, M.; Nat. Biotechnol. 2011, 29, 27.
¹¹⁸
Polgár, T.; Keseru, G. M.; Comb. Chem. High Throughput Screening 2011, 14, 889.
¹¹⁹
Truchon, J.-F.; Bayly, C. I.; J. Chem. Inf. Model. 2007, 47, 488.
¹²⁰
Forli, S.; Molecules 2015, 20, 18732.
¹²¹
Clark, D. E.; Expert Opin. Drug Discovery 2008, 3, 841.
¹²²
Ma, X. H.; Zhu, F.; Liu, X.; Shi, Z.; Zhang, J. X.; Yang, S. Y.; Wei, Y. Q.; Chen, Y. Z.; Curr. Med. Chem. 2012, 19, 5562.
¹²³
Eckert, H.; Bajorath, J.; Drug Discovery Today 2007, 12, 225.
¹²⁴
Yang, S.-Y.; Drug Discovery Today 2010, 15, 444.
¹²⁵
Braga, R. C.; Alves, V. M.; Silva, A. C.; Nascimento, M. N.; Silva, F. C.; Liao, L. M.; Andrade, C. H.; Curr. Top. Med. Chem. 2014, 14, 1899.
¹²⁶
Braga, R. C.; Andrade, C. H.; Curr. Top. Med. Chem. 2013, 13, 1127.
¹²⁷
Kar, S.; Roy, K.; Expert Opin. Drug Discovery 2013, 8, 245.
¹²⁸
Ripphausen, P.; Nisius, B.; Peltason, L.; Bajorath, J.; J. Med. Chem. 2010, 53, 8461.
¹²⁹
OECD; Report of the workshop on structural alerts for the OECD (Q)SAR application toolbox, http://www.oecd.org/officialdocuments/publicdisplaydocumentpdf/?cote=env/jm/mono(2009)4&doclanguage=en, acessada em outubro 2017.
» http://www.oecd.org/officialdocuments/publicdisplaydocumentpdf/?cote=env/jm/mono(2009)4&doclanguage=en
¹³⁰
Blagg, J.; Em Burger’s Medicinal Chemistry and Drug Discovery, John Wiley & Sons, Inc.: Hoboken , 2010.
¹³¹
Allen, T. E. H.; Goodman, J. M.; Gutsell, S.; Russell, P. J.; Chem. Res. Toxicol. 2014, 27, 2100.
¹³²
Enoch, S. J.; Roberts, D. W.; Em Chemical Toxicity Prediction: Category Formation and Read-Across; Cronin, M., Madden, J., Enoch, S., Roberts, D., eds.; Royal Society of Chemistry, 2013, cap. 2.
¹³³
ECHA; Agrupamento de substâncias e métodos comparativos por interpolação https://echa.europa.eu/pt/support/registration/how-to-avoid-unnecessary-testing-on-animals/grouping-of-substances-and-read-across, acessada em outubro 2017.
» https://echa.europa.eu/pt/support/registration/how-to-avoid-unnecessary-testing-on-animals/grouping-of-substances-and-read-across
¹³⁴
Alves, V.; Muratov, E.; Capuzzi, S.; Politi, R.; Low, Y.; Braga, R.; Zakharov, A. V.; Sedykh, A.; Mokshyna, E.; Farag, S.; Andrade, C.; Kuz’min, V.; Fourches, D.; Tropsha, A.; Green Chem. 2016, 18, 4348.
¹³⁵
Varnek, A.; Baskin, I. I.; Mol. Inform. 2011, 30, 20.
¹³⁶
Neves, B. J.; Dantas, R. F.; Senger, M. R.; Melo-Filho, C. C.; Valente, W. C. G.; de Almeida, A. C. M.; Rezende-Neto, J. M.; Lima, E. F. C.; Paveley, R.; Furnham, N.; Muratov, E.; Kamentsky, L.; Carpenter, A. E.; Braga, R. C.; Silva-Junior, F. P.; Andrade, C. H.; J. Med. Chem. 2016, 59, 7075.
¹³⁷
Melo-Filho, C. C.; Dantas, R. F.; Braga, R. C.; Neves, B. J.; Senger, M. R.; Valente, W. C. G.; Rezende-Neto, J. M.; Chaves, W. T.; Muratov, E. N.; Paveley, R. A.; Furnham, N.; Kamentsky, L.; Carpenter, A. E.; Silva-Junior, F. P.; Andrade, C. H.; J. Chem. Inf. Model. 2016, 56, 1357.
¹³⁸
Braga, R. C.; Alves, V. M.; Silva, M. F. B.; Muratov, E.; Fourches, D.; Liao, L. M.; Tropsha, A.; Andrade, C. H.; Mol. Inform. 2015, 34, 698.
¹³⁹
Braga, R. C.; Alves, V. M.; Silva, M. F. B.; Muratov, E.; Fourches, D.; Tropsha, A.; Andrade, C. H.; Curr. Top. Med. Chem. 2014, 14, 1399.
¹⁴⁰
Zhang, L.; Fourches, D.; Sedykh, A.; Zhu, H.; Golbraikh, A.; Ekins, S.; Clark, J.; Connelly, M. C.; Sigal, M.; Hodges, D.; Guiguemde, A.; Guy, R. K.; Tropsha, A.; J. Chem. Inf. Model. 2013, 53, 475.
¹⁴¹
Alves, V. M.; Muratov, E. N.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Toxicol. Appl. Pharmacol. 2015, 284, 273.
¹⁴²
Alves, V. M.; Muratov, E. N.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Toxicol. Appl. Pharmacol. 2015, 284, 262.
¹⁴³
OECD; The Adverse Outcome Pathway for Skin Sensitisation Initiated by Covalent Binding to Proteins, http://www.oecd-ilibrary.org/environment/the-adverse-outcome-pathway-for-skin-sensitisation-initiated-by-covalent-binding-to-proteins_9789264221444-en, acessada em outubro 2017.
» http://www.oecd-ilibrary.org/environment/the-adverse-outcome-pathway-for-skin-sensitisation-initiated-by-covalent-binding-to-proteins_9789264221444-en
¹⁴⁴
Alves, V. M.; Capuzzi, S. J.; Muratov, E.; Braga, R. C.; Thornton, T.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Green Chem. 2016, 18, 6501.
¹⁴⁵
Ban, F.; Dalal, K.; Li, H.; LeBlanc, E.; Rennie, P. S.; Cherkasov, A.; J. Chem. Inf. Model. 2017, 57, 1018.
¹⁴⁶
Lejon, T.; Strøm, M. B.; Svendsen, J. S.; J. Pept. Sci. 2001, 7, 74.
¹⁴⁷
Lejon, T.; Stiberg, T.; Strøm, M. B.; Svendsen, J. S.; J. Pept. Sci. 2004, 10, 329.
¹⁴⁸
Muratov, E. N.; Varlamova, E. V.; Artemenko, A. G.; Polishchuk, P. G.; Nikolaeva-Glomb, L.; Galabov, A. S.; Kuz’Min, V. E.; Struct. Chem. 2013, 24, 1665.
¹⁴⁹
Oprisiu, I.; Varlamova, E.; Muratov, E.; Artemenko, A.; Marcou, G.; Polishchuk, P.; Kuz’Min, V.; Varnek, A.; Mol. Inform. 2012, 31, 491.
¹⁵⁰
Muratov, E. N.; Varlamova, E. V.; Artemenko, A. G.; Polishchuk, P. G.; Kuz’min, V. E.; Mol. Inform. 2012, 31, 202.
¹⁵¹
Fourches, D.; Pu, D.; Li, L.; Zhou, H.; Mu, Q.; Su, G.; Yan, B.; Tropsha, A.; Nanotoxicology 2016, 10, 374.
¹⁵²
Kaliszan, R.; Chem. Rev. 2007, 107, 3212.
¹⁵³
Fourches, D.; Tropsha, A.; Em Nanotoxicology: Progress toward nanomedicine; Monteiro-Riviere, N. A., Lang Tran, C., eds.; CRC Press, 2014.
¹⁵⁴
Roy, K.; Ghosh, G.; J. Chem. Inf. Comput. Sci. 2004, 44, 559.
¹⁵⁵
El-Kommos, M. E.; El-Gizawy, S. M.; Atia, N. N.; Hosny, N. M.; J. Fluoresc. 2015, 25, 1695.
¹⁵⁶
Urbano-Cuadrado, M.; Carbó, J. J.; Maldonado, A. G.; Bo, C.; J. Chem. Inf. Model. 47, 2228.
¹⁵⁷
Garzia, A.; Villanti, A.; Tuccini, G.; J. Pharm. Sci. 1979, 68, 1081.

Datas de Publicação

Publicação nesta coleção
Fev 2018

Histórico

Recebido
11 Jun 2017
Aceito
13 Set 2017

Este é um artigo publicado em acesso aberto (Open Access) sob a licença Creative Commons Attribution, que permite uso, distribuição e reprodução em qualquer meio, sem restrições desde que o trabalho original seja corretamente citado.

[1] ¹
Gasteiger, J.; Engel, T.; Chemoinformatics: a textbook, Gasteiger, J.; Engel, T., eds.; Wiley-VCH Verlag GmbH & Co. KGaA: Weinheim, FRG, 2003.

[2] ²
Brown, F. K.; Annu. Rep. Med. Chem. 1998, 33, 375.

[3] ³
Warr, W. A.; Extract from 218th ACS National Meeting and Exposition New Orleans, Louisiana, August 22-26, 1999 http://www.warr.com/warrzone2000.html, acessada em outubro 2017.
» http://www.warr.com/warrzone2000.html

[4] ⁴
Hann, M.; Green, R.; Curr. Opin. Chem. Biol. 1999, 3, 379.

[5] ⁵
Willett, P.; Wiley Interdiscip. Rev.: Comput. Mol. Sci. 2011, 1, 46.

[6] ⁶
Fourches, D.; Em Application of Computational Techniques in Pharmacy and Medicine; Gorb, L., Kuz’min, V., Muratov, E., eds.; Springer Netherlands: Dordrecht, 2014, cap. 16.

[7] ⁷
Gasteiger, J.; Molecules 2016, 21, 151.

[8] ⁸
Zhu, H.; Zhang, J.; Kim, M. T.; Boison, A.; Sedykh, A.; Moran, K.; Chem. Res. Toxicol. 2014, 27, 1643.

[9] ⁹
Tetko, I. V; Engkvist, O.; Chen, H.; Future Med. Chem. 2016, 8, 1801.

[10] ¹⁰
Cherkasov, A.; Muratov, E. N.; Fourches, D.; Varnek, A.; Baskin, I. I.; Cronin, M.; Dearden, J.; Gramatica, P.; Martin, Y. C.; Todeschini, R.; Consonni, V.; Kuz’min, V. E.; Cramer, R.; Benigni, R.; Yang, C.; Rathman, J.; Terfloth, L.; Gasteiger, J.; Richard, A.; Tropsha, A.; J. Med. Chem. 2014, 57, 4977.

[11] ¹¹
Wild, D.; Introducing cheminformatics: an intensive self-guided study, 2^nd ed., McGraw-Hill Open Publishing, 2013.

[12] ¹²
Hinchliffe, A.; Molecular Modelling for Beginners, Wiley: West Sussex, 2003.

[13] ¹³
Young, D. C.; Computational drug design: A guide for computational and medicinal chemists, John Wiley & Sons, Inc.: Hoboken , 2009, vol. 14.

[14] ¹⁴
Tavares, L. C.; Quim. Nova 2004, 27, 631.

[15] ¹⁵
Gaudio, A. C.; Zandonade, E.; Quim. Nova 2001, 24, 658.

[16] ¹⁶
Ferreira, M. M. C.; Montanari, C. A.; Gaudio, A. C.; Quim. Nova 2002, 25, 439.

[17] ¹⁷
Arroio, A.; Honório, K. M.; da Silva, A. B. F.; Quim. Nova 2010, 33, 694.

[18] ¹⁸
Montanari, M. L. C.; Montanari, C. A.; Gaudio, A. C.; Quim. Nova 2002, 25, 231.

[19] ¹⁹
Cormanich, R. A.; Nunes, C. A.; Freitas, M. P.; Quim. Nova 2012, 35, 1157.

[20] ²⁰
Martins, J. P. A.; Ferreira, M. M. C.; Quim. Nova 2013, 36, 554.

[21] ²¹
Freitas, H. F.; Paz, O. S.; Castilho, M. S.; Quim. Nova 2009, 32, 2114.

[22] ²²
Almeida, V. L. de; Lopes, J. C. D.; Oliveira, S. R.; Donnici, C. L.; Montanari, C. A.; Quim. Nova 2010, 33, 1482.

[23] ²³
Andrade, J. G.; Freitas, H. F.; Castilho, M. S.; Quim. Nova 2012, 35, 466.

[24] ²⁴
Walter, M. E.; Almeida, V. L.; Nunes, R. J.; Quim. Nova 2013, 36, 691.

[25] ²⁵
Carvalho, I.; Pupo, M. T.; Borges, Á. D. L.; Bernardes, L. S. C.; Quim. Nova 2003, 26, 428.

[26] ²⁶
Sant’Anna, C. M. R.; Rev. Virtual Quim. 2009, 1, 49.

[27] ²⁷
Barreiro, E. J.; Rodrigues, C. R.; Albuquerque, M. G.; Sant’Anna, C. M. R.; Alencastro, R. B.; Quim. Nova 1997, 20, 1.

[28] ²⁸
Andrade, C. H.; Trossini, G. H. G.; Ferreira, E. I.; Rev. Eletronica Farm. 2010, VII, 1.

[29] ²⁹
Brecher, J.; Pure Appl. Chem. 2006, 78

[30] ³⁰
Wiswesser, W. J.; J. Chem. Inf. Model. 1982, 22, 88.

[31] ³¹
Morgan, H. L.; J. Chem. Doc. 1965, 5, 107.

[32] ³²
CAS History; https://www.cas.org/about-cas/cas-history, acessada em outubro 2017.
» https://www.cas.org/about-cas/cas-history

[33] ³³
Figueras, J.; J. Chem. Inf. Model. 1993, 33, 717.

[34] ³⁴
Weininger, D.; J. Chem. Inf. Model. 1988, 28, 31.

[35] ³⁵
Anderson, E.; Veith, G. D.; Weininger, D.; SMILES: a line notation and computerized interpreter for chemical structureshttps://cfpub.epa.gov/si/si_public_record_report.cfmdirEntryId=33186?, acessada em outubro 2017.
» https://cfpub.epa.gov/si/si_public_record_report.cfmdirEntryId=33186?

[36] ³⁶
Daylight Inc.; SMARTS - A Language for Describing Molecular Patterns http://www.daylight.com/dayhtml/doc/theory/theory.smarts.html, acessada em outubro 2017.
» http://www.daylight.com/dayhtml/doc/theory/theory.smarts.html

[37] ³⁷
Pletnev, I.; Erin, A.; McNaught, A.; Blinov, K.; Tchekhovskoi, D.; Heller, S.; J. Cheminform. 2012, 4, 39.

[38] ³⁸
Dalby, A.; Nourse, J. G.; Hounshell, W. D.; Gushurst, A. K. I.; Grier, D. L.; Leland, B. A.; Laufer, J.; J. Chem. Inf. Model. 1992, 32, 244.

[39] ³⁹
Elsevier MDL; CTFile Formats, Elsevier: San Leandro, 2005.

[40] ⁴⁰
Mills, N.; J. Am. Chem. Soc. 2006, 128, 13649.

[41] ⁴¹
Bienfait, B.; Ertl, P.; J. Cheminform. 2013, 5, 24.

[42] ⁴²
Consonni, V.; Todeschini, R.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht, 2010, cap. 3.

[43] ⁴³
Cronin, M. T.; Em Recent Advances in QSAR Studies; Puzyn, T., Leszczynski, J., Cronin, M. T., eds.; Springer: Dordrecht , 2010, cap. 1.

[44] ⁴⁴
Xue, L.; Bajorath, J.; Comb. Chem. High Throughput Screening 2000, 3, 363.

[45] ⁴⁵
Hopfinger, A. J.; Wang, S.; Tokarski, J. S.; Jin, B.; Albuquerque, M.; Madhav, P. J.; Duraiswami, C.; J. Am. Chem. Soc. 1997, 119, 10509.

[46] ⁴⁶
Vedani, A.; Dobler, M.; J. Med. Chem. 2002, 45, 2139.

[47] ⁴⁷
Vedani, A.; Dobler, M.; Lill, M. A.; J. Med. Chem. 2005, 48, 3700.

[48] ⁴⁸
Todeschini, R.; Consonni, V.; Handbook of Molecular Descriptors, Todeschini, R., Consonni, V., eds.; Wiley: Weinheim, 2000.

[49] ⁴⁹
Chemical Abstracts Service; Introduction to CAS: a division of the American Chemical Society

[50] ⁵⁰
Willighagen, E. L.; Waagmeester, A.; Spjuth, O.; Ansell, P.; Williams, A. J.; Tkachenko, V.; Hastings, J.; Chen, B.; Wild, D. J.; J. Cheminform. 2013, 5, 23.

[51] ⁵¹
Gaulton, A.; Bellis, L. J.; Bento, A. P.; Chambers, J.; Davies, M.; Hersey, A.; Light, Y.; McGlinchey, S.; Michalovich, D.; Al-Lazikani, B.; Overington, J. P.; Nucleic Acids Res. 2012, 40, D1100.

[52] ⁵²
Wang, Y.; Xiao, J.; Suzek, T. O.; Zhang, J.; Wang, J.; Zhou, Z.; Han, L.; Karapetyan, K.; Dracheva, S.; Shoemaker, B. A.; Bolton, E.; Gindulyte, A.; Bryant, S. H.; Nucleic Acids Res. 2012, 40, D400.

[53] ⁵³
Canny, S. A.; Cruz, Y.; Southern, M. R.; Griffin, P. R.; Bioinformatics 2012, 28, 140.

[54] ⁵⁴
Wishart, D. S.; Knox, C.; Guo, A. C.; Shrivastava, S.; Hassanali, M.; Stothard, P.; Chang, Z.; Woolsey, J.; Nucleic Acids Res. 2006, 34, D668.

[55] ⁵⁵
Wishart, D. S.; Knox, C.; Guo, A. C.; Cheng, D.; Shrivastava, S.; Tzur, D.; Gautam, B.; Hassanali, M.; Nucleic Acids Res. 2008, 36, D901.

[56] ⁵⁶
Berman, H. M.; Westbrook, J.; Feng, Z.; Gilliland, G.; Bhat, T. N.; Weissig, H.; Shindyalov, I. N.; Bourne, P. E.; Nucleic Acids Res. 2000, 28, 235.

[57] ⁵⁷
Berman, H. M.; Bhat, T. N.; Bourne, P. E.; Feng, Z.; Gilliland, G.; Weissig, H.; Westbrook, J.; Nat. Struct. Biol. 2000, 7 Suppl, 957.

[58] ⁵⁸
Johnson, M. A.; Maggiora, G. M.; Concepts and applications of molecular similarity, John Wiley & Sons, Inc.: New York, 1990, vol. 13.

[59] ⁵⁹
Heikamp, K.; Bajorath, J.; J. Chem. Inf. Model. 2011, 51, 2254.

[60] ⁶⁰
Kubinyi, H.; Pespect. Drug Discovery Des. 1998, 9-11, 225.

[61] ⁶¹
Maggiora, G.; Vogt, M.; Stumpfe, D.; Bajorath, J.; J. Med. Chem. 2014, 57, 3186.

[62] ⁶²
Floris, M.; Manganaro, A.; Nicolotti, O.; Medda, R.; Mangiatordi, G. F.; Benfenati, E.; J. Cheminform. 2014, 6, 39.

[63] ⁶³
Maggiora, G. M.; J. Chem. Inf. Model. 2006, 46, 1535.

[64] ⁶⁴
Guha, R.; Van Drie, J. H.; J. Chem. Inf. Model. 2008, 48, 646.

[65] ⁶⁵
Rogers, D. J.; Tanimoto, T. T.; Science 1960, 132, 1115.

[66] ⁶⁶
Jaccard, P.; Bull. Soc. Vaudoise Sci. Nat. 1901, XXXVII, 83.

[67] ⁶⁷
Ferreira, M. M. C.; Quimiometria: Conceitos, Métodos e Aplicações, UNICAMP: Campinas, 2015.

[68] ⁶⁸
Mahalanobis, P. C.; Proc. Natl. Inst. Sci. India 1936, 2, 49.

[69] ⁶⁹
Willett, P.; Drug Discov. Today 2006, 11, 1046.

[70] ⁷⁰
Kenny, P. W.; Sadowski, J.; Em Chemoinformatics in Drug Discovery.; Oprea, T. I., ed.; WILEY-VCH Verlag GmbH & Co. KGaA: Weinheim, 2005, cap. 11.

[71] ⁷¹
Hammett, L. P.; J. Am. Chem. Soc. 1937, 59, 96.

[72] ⁷²
Hammett, L. P.; Physical organic chemistry: reaction rates, equilibria, and mechanisms, 1^st ed., McGraw-Hill: New York, 1940.

[73] ⁷³
Hansch, C.; Fujita, T.; J. Am. Chem. Soc. 1964, 86, 1616.

[74] ⁷⁴
Free, S. M.; Wilson, J. W.; J. Med. Chem. 1964, 7, 395.

[75] ⁷⁵
Kubinyi, H.; Arzneim. Forsch. 1977, 27, 750.

[76] ⁷⁶
Kubinyi, H.; Farmaco Sci. 1979, 34, 248.

[77] ⁷⁷
Debnath, A. K.; Mini Rev. Med. Chem. 2001, 1, 187.

[78] ⁷⁸
Hopfinger, A. J.; J. Am. Chem. Soc. 1980, 102, 7196.

[79] ⁷⁹
Cramer, R. D.; Patterson, D. E.; Bunce, J. D.; J. Am. Chem. Soc. 1988, 110, 5959.

[80] ⁸⁰
Zhang, L.; Tsai, K.-C.; Du, L.; Fang, H.; Li, M.; Xu, W.; Curr. Med. Chem. 2011, 18, 923.

[81] ⁸¹
Klebe, G.; Abraham, U.; Mietzner, T.; J. Med. Chem. 1994, 37, 4130.

[82] ⁸²
Cramer, R. D.; J. Comput. Aided. Mol. Des. 2012, 26, 35.

[83] ⁸³
Tropsha, A.; Mol. Inform. 2010, 29, 476.

[84] ⁸⁴
Melville, J. L.; Burke, E. K.; Hirst, J. D.; Comb. Chem. High Throughput Screening 2009, 12, 332.

[85] ⁸⁵
Sheridan, R. P.; J. Chem. Inf. Model. 2014, 54, 1083.

[86] ⁸⁶
Helgee, E. A.; Carlsson, L.; Boyer, S.; Norinder, U.; J. Chem. Inf. Model. 2010, 50, 677.

[87] ⁸⁷
Welling, M.; A first encounter with Machine Learning, University of California: Irvine, 2011.

[88] ⁸⁸
Breiman, L. E. O.; Mach. Learn. 2001, 45, 5.

[89] ⁸⁹
Cortes, C.; Vapnik, V.; Mach. Learn. 1995, 20, 273.

[90] ⁹⁰
Dreiseitl, S.; Ohno-Machado, L.; J. Biomed. Inform. 2002, 35, 352.

[91] ⁹¹
LeCun, Y.; Bengio, Y.; Hinton, G.; Nature 2015, 521, 436.

[92] ⁹²
Downs, G. M.; Barnard, J. M.; Em Reviews in Computational Chemistry; Lipkowitz, K. B., Boyd, D. B., eds.; John Wiley & Sons, Inc.: Hoboken , 2003, vol. 18, cap. 1.

[93] ⁹³
Mercier, D.; Clustering large datasets, http://ldc.usb.ve/~mcuriel/Cursos/WC/Transfer.pdf, acessada em outubro 2017.
» http://ldc.usb.ve/~mcuriel/Cursos/WC/Transfer.pdf

[94] ⁹⁴
Dearden, J. C.; Cronin, M. T. D.; Kaiser, K. L. E.; SAR QSAR Environ. Res. 2009, 20, 241.

[95] ⁹⁵
OECD; OECD principles for the validation, for regulatory purposes, of (Quantitative) Structure-Activity Relationship models, http://www.oecd.org/chemicalsafety/risk-assessment/37849783.pdf, acessada em outubro 2017.
» http://www.oecd.org/chemicalsafety/risk-assessment/37849783.pdf

[96] ⁹⁶
Frye, S. V; Arkin, M. R.; Arrowsmith, C. H.; Conn, P. J.; Glicksman, M. A.; Hull-Ryde, E. A.; Slusher, B. S.; Nat. Rev. Drug Discov. 2015, 14, 733.

[97] ⁹⁷
Fourches, D.; Muratov, E.; Tropsha, A.; Nat. Chem. Biol. 2015, 11, 535.

[98] ⁹⁸
Fourches, D.; Muratov, E.; Tropsha, A.; J. Chem. Inf. Model. 2016, 56, 1243.

[99] ⁹⁹
Fourches, D.; Muratov, E.; Tropsha, A.; J. Chem. Inf. Model. 2010, 50, 1189.

[100] ¹⁰⁰
Golbraikh, A.; Muratov, E.; Fourches, D.; Tropsha, A.; J. Chem. Inf. Model. 2014, 54, 1.

[101] ¹⁰¹
Golbraikh, A.; Tropsha, A.; J. Mol. Graph. Model. 2002, 20, 269.

[102] ¹⁰²
Gramatica, P.; QSAR Comb. Sci. 2007, 26, 694.

[103] ¹⁰³
Tropsha, A.; Gramatica, P.; Gombar, V. K.; QSAR Comb. Sci. 2003, 22, 69.

[104] ¹⁰⁴
Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2011, 51, 2320.

[105] ¹⁰⁵
Wang, X. S.; Tang, H.; Golbraikh, A.; Tropsha, A.; J. Chem. Inf. Model. 2008, 48, 997.

[106] ¹⁰⁶
Altman, D. G.; Bland, J. M.; BMJ 1994, 308, 1552.

[107] ¹⁰⁷
Altman, D. G.; Bland, J. M.; BMJ 1994, 309, 102.

[108] ¹⁰⁸
McClish, D. K.; Med. Decis. Making 1989, 9, 190.

[109] ¹⁰⁹
Chirico, N.; Gramatica, P.; J. Chem. Inf. Model. 2012, 52, 2044.

[110] ¹¹⁰
Roy, K.; Mitra, I.; Comb. Chem. High Throughput Screening 2011, 14, 450.

[111] ¹¹¹
Roy, K.; Mitra, I.; Kar, S.; Ojha, P. K.; Das, R. N.; Kabir, H.; J. Chem. Inf. Model. 2012, 52, 396.

[112] ¹¹²
Kuz’min, V. E.; Muratov, E. N.; Artemenko, A. G.; Varlamova, E. V.; Gorb, L.; Wang, J.; Leszczynski, J.; QSAR Comb. Sci. 2009, 28, 664.

[113] ¹¹³
Gadaleta, D.; Mangiatordi, G. F.; Catto, M.; Carotti, A.; Nicolotti, O.; International Journal of Quantitative Structure-Property Relationships 2016, 1, 45.

[114] ¹¹⁴
Mathea, M.; Klingspohn, W.; Baumann, K.; Mol. Inform. 2016, 35, 160.

[115] ¹¹⁵
Alves, V. M.; Muratov, E. N.; Zakharov, A.; Muratov, N. N.; Andrade, C. H.; Tropsha, A.; Food Chem. Toxicol. 2017, no prelo.

[116] ¹¹⁶
Schneider, G.; Nat. Rev. Drug Discov. 2010, 9, 273.

[117] ¹¹⁷
Kessel, M.; Nat. Biotechnol. 2011, 29, 27.

[118] ¹¹⁸
Polgár, T.; Keseru, G. M.; Comb. Chem. High Throughput Screening 2011, 14, 889.

[119] ¹¹⁹
Truchon, J.-F.; Bayly, C. I.; J. Chem. Inf. Model. 2007, 47, 488.

[120] ¹²⁰
Forli, S.; Molecules 2015, 20, 18732.

[121] ¹²¹
Clark, D. E.; Expert Opin. Drug Discovery 2008, 3, 841.

[122] ¹²²
Ma, X. H.; Zhu, F.; Liu, X.; Shi, Z.; Zhang, J. X.; Yang, S. Y.; Wei, Y. Q.; Chen, Y. Z.; Curr. Med. Chem. 2012, 19, 5562.

[123] ¹²³
Eckert, H.; Bajorath, J.; Drug Discovery Today 2007, 12, 225.

[124] ¹²⁴
Yang, S.-Y.; Drug Discovery Today 2010, 15, 444.

[125] ¹²⁵
Braga, R. C.; Alves, V. M.; Silva, A. C.; Nascimento, M. N.; Silva, F. C.; Liao, L. M.; Andrade, C. H.; Curr. Top. Med. Chem. 2014, 14, 1899.

[126] ¹²⁶
Braga, R. C.; Andrade, C. H.; Curr. Top. Med. Chem. 2013, 13, 1127.

[127] ¹²⁷
Kar, S.; Roy, K.; Expert Opin. Drug Discovery 2013, 8, 245.

[128] ¹²⁸
Ripphausen, P.; Nisius, B.; Peltason, L.; Bajorath, J.; J. Med. Chem. 2010, 53, 8461.

[129] ¹²⁹
OECD; Report of the workshop on structural alerts for the OECD (Q)SAR application toolbox, http://www.oecd.org/officialdocuments/publicdisplaydocumentpdf/?cote=env/jm/mono(2009)4&doclanguage=en, acessada em outubro 2017.
» http://www.oecd.org/officialdocuments/publicdisplaydocumentpdf/?cote=env/jm/mono(2009)4&doclanguage=en

[130] ¹³⁰
Blagg, J.; Em Burger’s Medicinal Chemistry and Drug Discovery, John Wiley & Sons, Inc.: Hoboken , 2010.

[131] ¹³¹
Allen, T. E. H.; Goodman, J. M.; Gutsell, S.; Russell, P. J.; Chem. Res. Toxicol. 2014, 27, 2100.

[132] ¹³²
Enoch, S. J.; Roberts, D. W.; Em Chemical Toxicity Prediction: Category Formation and Read-Across; Cronin, M., Madden, J., Enoch, S., Roberts, D., eds.; Royal Society of Chemistry, 2013, cap. 2.

[133] ¹³³
ECHA; Agrupamento de substâncias e métodos comparativos por interpolação https://echa.europa.eu/pt/support/registration/how-to-avoid-unnecessary-testing-on-animals/grouping-of-substances-and-read-across, acessada em outubro 2017.
» https://echa.europa.eu/pt/support/registration/how-to-avoid-unnecessary-testing-on-animals/grouping-of-substances-and-read-across

[134] ¹³⁴
Alves, V.; Muratov, E.; Capuzzi, S.; Politi, R.; Low, Y.; Braga, R.; Zakharov, A. V.; Sedykh, A.; Mokshyna, E.; Farag, S.; Andrade, C.; Kuz’min, V.; Fourches, D.; Tropsha, A.; Green Chem. 2016, 18, 4348.

[135] ¹³⁵
Varnek, A.; Baskin, I. I.; Mol. Inform. 2011, 30, 20.

[136] ¹³⁶
Neves, B. J.; Dantas, R. F.; Senger, M. R.; Melo-Filho, C. C.; Valente, W. C. G.; de Almeida, A. C. M.; Rezende-Neto, J. M.; Lima, E. F. C.; Paveley, R.; Furnham, N.; Muratov, E.; Kamentsky, L.; Carpenter, A. E.; Braga, R. C.; Silva-Junior, F. P.; Andrade, C. H.; J. Med. Chem. 2016, 59, 7075.

[137] ¹³⁷
Melo-Filho, C. C.; Dantas, R. F.; Braga, R. C.; Neves, B. J.; Senger, M. R.; Valente, W. C. G.; Rezende-Neto, J. M.; Chaves, W. T.; Muratov, E. N.; Paveley, R. A.; Furnham, N.; Kamentsky, L.; Carpenter, A. E.; Silva-Junior, F. P.; Andrade, C. H.; J. Chem. Inf. Model. 2016, 56, 1357.

[138] ¹³⁸
Braga, R. C.; Alves, V. M.; Silva, M. F. B.; Muratov, E.; Fourches, D.; Liao, L. M.; Tropsha, A.; Andrade, C. H.; Mol. Inform. 2015, 34, 698.

[139] ¹³⁹
Braga, R. C.; Alves, V. M.; Silva, M. F. B.; Muratov, E.; Fourches, D.; Tropsha, A.; Andrade, C. H.; Curr. Top. Med. Chem. 2014, 14, 1399.

[140] ¹⁴⁰
Zhang, L.; Fourches, D.; Sedykh, A.; Zhu, H.; Golbraikh, A.; Ekins, S.; Clark, J.; Connelly, M. C.; Sigal, M.; Hodges, D.; Guiguemde, A.; Guy, R. K.; Tropsha, A.; J. Chem. Inf. Model. 2013, 53, 475.

[141] ¹⁴¹
Alves, V. M.; Muratov, E. N.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Toxicol. Appl. Pharmacol. 2015, 284, 273.

[142] ¹⁴²
Alves, V. M.; Muratov, E. N.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Toxicol. Appl. Pharmacol. 2015, 284, 262.

[143] ¹⁴³
OECD; The Adverse Outcome Pathway for Skin Sensitisation Initiated by Covalent Binding to Proteins, http://www.oecd-ilibrary.org/environment/the-adverse-outcome-pathway-for-skin-sensitisation-initiated-by-covalent-binding-to-proteins_9789264221444-en, acessada em outubro 2017.
» http://www.oecd-ilibrary.org/environment/the-adverse-outcome-pathway-for-skin-sensitisation-initiated-by-covalent-binding-to-proteins_9789264221444-en

[144] ¹⁴⁴
Alves, V. M.; Capuzzi, S. J.; Muratov, E.; Braga, R. C.; Thornton, T.; Fourches, D.; Strickland, J.; Kleinstreuer, N.; Andrade, C. H.; Tropsha, A.; Green Chem. 2016, 18, 6501.

[145] ¹⁴⁵
Ban, F.; Dalal, K.; Li, H.; LeBlanc, E.; Rennie, P. S.; Cherkasov, A.; J. Chem. Inf. Model. 2017, 57, 1018.

[146] ¹⁴⁶
Lejon, T.; Strøm, M. B.; Svendsen, J. S.; J. Pept. Sci. 2001, 7, 74.

[147] ¹⁴⁷
Lejon, T.; Stiberg, T.; Strøm, M. B.; Svendsen, J. S.; J. Pept. Sci. 2004, 10, 329.

[148] ¹⁴⁸
Muratov, E. N.; Varlamova, E. V.; Artemenko, A. G.; Polishchuk, P. G.; Nikolaeva-Glomb, L.; Galabov, A. S.; Kuz’Min, V. E.; Struct. Chem. 2013, 24, 1665.

[149] ¹⁴⁹
Oprisiu, I.; Varlamova, E.; Muratov, E.; Artemenko, A.; Marcou, G.; Polishchuk, P.; Kuz’Min, V.; Varnek, A.; Mol. Inform. 2012, 31, 491.

[150] ¹⁵⁰
Muratov, E. N.; Varlamova, E. V.; Artemenko, A. G.; Polishchuk, P. G.; Kuz’min, V. E.; Mol. Inform. 2012, 31, 202.

[151] ¹⁵¹
Fourches, D.; Pu, D.; Li, L.; Zhou, H.; Mu, Q.; Su, G.; Yan, B.; Tropsha, A.; Nanotoxicology 2016, 10, 374.

[152] ¹⁵²
Kaliszan, R.; Chem. Rev. 2007, 107, 3212.

[153] ¹⁵³
Fourches, D.; Tropsha, A.; Em Nanotoxicology: Progress toward nanomedicine; Monteiro-Riviere, N. A., Lang Tran, C., eds.; CRC Press, 2014.

[154] ¹⁵⁴
Roy, K.; Ghosh, G.; J. Chem. Inf. Comput. Sci. 2004, 44, 559.

[155] ¹⁵⁵
El-Kommos, M. E.; El-Gizawy, S. M.; Atia, N. N.; Hosny, N. M.; J. Fluoresc. 2015, 25, 1695.

[156] ¹⁵⁶
Urbano-Cuadrado, M.; Carbó, J. J.; Maldonado, A. G.; Bo, C.; J. Chem. Inf. Model. 47, 2228.

[157] ¹⁵⁷
Garzia, A.; Villanti, A.; Tuccini, G.; J. Pharm. Sci. 1979, 68, 1081.

Identificador químico	Atividade/Propriedade	Descritor 1	Descritor 2	Descritor 3	...	Descritor n
Composto 1	Y₁	X₁₁	X₁₂	X₁₃	...	X_1n
Composto 2	Y₂	X₂₁	X₂₂	X₂₃	...	X_2n
Composto 3	Y₃	X₃₁	X₃₂	X₃₃	...	X_3n
...	...	...	...	...	...	...
Composto n	Y_n	X_n₁	X_n₂	X_n₃	...	X_nn

Brasil