Informations

La conversion MOL2 en PDBQT via OpenBabel et MGLTools supprime les atomes d'hydrogène

La conversion MOL2 en PDBQT via OpenBabel et MGLTools supprime les atomes d'hydrogène


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

J'essaie de convertir un fichier MOL2 (comprend des charges partielles et des atomes d'hydrogène) en un fichier PDBQT pour une nouvelle notation dans AutoDock Vina. Cependant, les deux approches que j'ai essayées ne conservent pas les atomes d'hydrogène du fichier MOL2 (le fichier PDBQT ne contient pas d'atomes d'hydrogène).

La commande que j'ai utilisée pour OpenBabel est

babel -i mol2 mon.mol2 -o mon.pdbqt

Quand je regarde la documentation, ils ont un indicateur "-d" dédié pour supprimer les hydrogènes. Donc je suppose que cela ne devrait pas arriver par défaut?

La même chose se produit si j'utilise MGLTools

prepare_ligand4.py -l my.mol2

Des idées de ce qui pourrait se passer ici?

Merci pour ton aide!

ajoutera le fichier MOL2 si quelqu'un veut l'essayer :

@MOLÉCULE mymol2 25 25 0 0 0 PETITES CHARGES D'UTILISATEUR @ATOM 1 C1 -1,0341 29,2934 -14,5590 C.ar 1 <0> -0,1745 2 C2 -0,1917 29,9513 -13,6630 C.ar 1 <0> -0,1483 3 C3 -2,3919 29,1585 -14,2689 C.ar 1 <0> -0,1608 4 C4 -0,7068 30,4744 -12,4770 C.ar 1 <0> -0,0956 5 C5 -2,9070 29,6816 -13,0828 C.ar 1 <0> -0,1543 6 C6 -2,0573 30,3323 -12,2033 C.ar 1 <0> -0,0209 7 C7 - 5,0136 30,3602 -8,9792 C.2 1 <0> 0,9092 8 C8 -1,1556 29,8264 -9,1470 C.2 1 <0> 0,9071 9 C9 -2,6151 30,8987 -10,9189 C.3 1 <0> -0,0262 10 C10 -3,5221 30,2951 -8,6255 C.3 1 <0> -0,1568 11 C11 -2,5717 29,8912 -9,7583 C.3 1 <0> -0,1554 12 O1 -5,7013 31,2223 -8,3667 O.co2 1 <0> -0,8817 13 O2 -0,7003 30,9084 -8,6799 O. co2 1 <0> -0,8929 14 O3 -5,3714 29,5329 -9,8669 O.co2 1 <0> -0,8807 15 O4 -0,6188 28,6818 -9,1887 O.co2 1 <0> -0,8571 16 H1 -0,6331 28,8861 -15,4824 H 1 <0 > 0,0899 17 H2 0,8655 30,0564 -13,8891 H 1 <0> 0,1079 18 H3 -3,0478 28,6460 -14,9665 H 1 <0> 0,0917 19 H4 -0,0427 30,9855 -11,7849 H 1 <0> 0,2049 20 H5 -3,9661 29,5717 -12,8653 H 1 < 0> 0,1145 21 H6 -2,0757 31,8190 -10,6595 H 1 <0> 0,0142 22 H7 -3,6485 31,2140 -11,1119 H 1 <0> 0,0547 23 H8 -3,4370 29,5769 -7,7988 H 1 <0> -0,0109 24 H9 -3,2268 31,2722 -8,2199 H 1 <0> 0,0482 25 H10 -2,8394 28,8903 - 10,1212 H 1 <0> 0,0739 @OBLIGATOIRE 1 1 2 ar 2 1 3 ar 3 2 4 ar 4 3 5 ar 5 4 6 ar 6 5 6 ar 7 6 9 1 8 7 10 1 9 7 12 1 10 7 14 2 11 8 11 1 12 8 13 1 13 8 15 2 14 9 11 1 15 10 11 1 16 1 16 1 17 2 17 1 18 3 18 1 19 4 19 1 20 5 20 1 21 9 21 1 22 9 22 1 23 10 23 1 24 10 24 1 25 11 25 1 @STRUCTURE

ÉDITER:

La solution au problème avecprepare_ligand4.pyserait

prepare_ligand4.py -l my.mol2 -U """ -C

pour garder les charges partielles et les atomes d'hydrogène (bizarrement,-U ""n'a pas fonctionné pour moi:prepare_ligand4.py : l'option -U requiert un argument)


Vous avez vu ma dernière réponse à votre question ? vous pouvez le faire facilement, utilisez simplement

prepare_ligand4.py -l my.mol2 -A "hydrogènes"

A Babel :

babel mon.mol2 mon.pdbqt -xh

-x indique les options d'écriture des fichiers .pdbqt -h dit de garder les hydrogènes


La conversion MOL2 en PDBQT via OpenBabel et MGLTools supprime les atomes d'hydrogène - Biologie

Programmes et outils utiles pour la science des protéines

Je serais heureux d'entendre vos commentaires et suggestions. N'hésitez pas à m'envoyer un message via [twitter](https://twitter.com/rasbt), [email](mailto:[email protected]) ou [google+](https://plus.google. com/+Sebastian Raschka).

Docking protéine-ligand et scoring

Licence: libre, open-source (GNU GPL)

Un outil d'amarrage et de notation moléculaire qui utilise un champ de force « hybride » informatiquement (relativement) peu coûteux qui contient des termes basés sur la mécanique moléculaire ainsi que des termes empiriques. La prédiction des énergies de liaison absolues peut être moins précise par rapport aux méthodes plus coûteuses en calcul, purement basées sur le champ de force, mais cette approche semi-empirique est considérée comme bien adaptée pour les classements relatifs.

Il a été remplacé par AutoDock Vina, qui a remplacé le champ de force semi-empirique par une fonction de notation statistique entièrement basée sur la connaissance. Les auteurs soulignent la vitesse et la précision améliorées d'AutoDock Vina, cependant, AutoDock 4.2 fournit une sortie plus détaillée qui peut être utile pour certaines applications.

Huey, Ruth, Garrett M. Morris, Arthur J. Olson et David S. Goodsell. 2007. "Un champ de force d'énergie libre semi-empirique avec désolvatation basée sur la charge." Journal de chimie computationnelle 28 (6) : 1145–52. doi:10.1002/jcc.20634.

Utilisation pour le re-score :

Étant donné que la procédure comporte plusieurs étapes, veuillez fournir un exemple d'utilisation dans ce document séparé.

Exemple de sortie :

Licence: gratuit, open-source (licence Apache)

Le successeur d'AutoDock4.2 pour l'amarrage et la re-notation des complexes protéine-ligand avec une fonction de notation qui estime les affinités de liaison, ainsi que des termes individuels, tels que la contribution hydrophobe et la liaison hydrogène.

O. Trott, A. J. Olson, AutoDock Vina : amélioration de la vitesse et de la précision de l'amarrage avec une nouvelle fonction de notation, optimisation efficace et multithreading, Journal of Computational Chemistry 31 (2010) 455-461

Utilisation pour le re-score :

Où un fichier config.txt doit être préparé pour chaque complexe protéine-ligand, par exemple,

Les fichiers pdbqt requis peuvent être générés via, par exemple, OpenBabel ou MGLTools d'AutoDock.
Pour plus de détails, veuillez consulter la documentation de

Licence: gratuit sans aucune limitation (la redistribution nécessite une autorisation)

DrugScoreX est une nouvelle implémentation indépendante de DrugScore avec une plus grande précision pour la notation des complexes protéine-ligand. Sa fonction de notation est basée sur des potentiels statistiques.

DSX : une fonction de notation basée sur les connaissances pour l'évaluation des complexes protéine-ligand Gerd Neudert et Gerhard Klebe Journal of Chemical Information and Modeling 2011 51 (10), 2731-2745

Le répertoire avec les potentiels PDB est généralement situé dans le répertoire principal après le téléchargement de DrugScoreX

Licence: libre, open-source (GNU GPL)

Comme DrugScore, une fonction de notation pour les complexes protéine-ligand basée sur des potentiels statistiques. Il est disponible en version autonome (boîte à outils IMP) et en tant que serveur Web.

Les deux saveurs sont RankScore, qui est recommandé pour marquer différents ligands dans une interface de liaison aux protéines (par exemple, pour le criblage virtuel), et PoseScore, pour trouver la pose de liaison optimale d'un ensemble de leurres de ligand (c'est-à-dire, le même ligand dans différents orientations/conformations).

Fan H, Schneidman-Duhovny D, Irwin J, Dong GQ, Shoichet B, Sali A. Potentiel statistique pour la modélisation et le classement des interactions protéine-ligand. Modèle J Chem Inf. 2011, 51:3078-92.

Nécessite l'installation de la boîte à outils IMP

Où protein_ligand_pose_score.lib est utilisé pour noter différentes poses de ligand (PoseScore) pour le même complexe protéine-ligand, et protein_ligand_rank_score.lib (RankScore) est utilisé pour noter différents ligands pour une interface de liaison donnée.

(Sur un Mac, les fichiers de la bibliothèque se trouvent généralement dans : /usr/local/share/IMP/atom/protein_ligand_pose_score.lib et /usr/local/share/IMP/atom/protein_ligand_rank_score.lib )

« Deux fichiers de notation différents sont fournis : - protein_ligand_pose_score.lib à utiliser lorsque l'on veut trouver les poses les plus proches du natif d'un ligand à partir de nombreux leurres géométriques du même ligand - protein_ligand_rank_score.lib à utiliser lors du criblage d'une base de données de composés par rapport à un seul protéine pour choisir des liants putatifs"

(Sur un Mac, les fichiers de la bibliothèque se trouvent généralement dans : /usr/local/share/IMP/atom/protein_ligand_pose_score.lib et /usr/local/share/IMP/atom/protein_ligand_rank_score.lib )

Non disponible individuellement pour ligand_score , voir la version IMP (IMP 2.2.0).

Licence: Disponible gratuitement pour les institutions académiques, mais il y a des frais de licence pour les organisations industrielles.

DOCK 6 est un outil d'amarrage qui offre également plusieurs fonctions de notation différentes qui peuvent être utilisées pour re-noter des complexes protéine-ligand déjà amarrés. Vous trouverez ci-dessous un exemple d'utilisation du score Amber (vous trouverez plus de détails dans le manuel DOCK6 à l'adresse http://dock.compbio.ucsf.edu/DOCK_6/dock6_manual.htm#Scoring.

Le score d'ambre effectue une minimisation, une simulation de dynamique moléculaire, une minimisation d'énergie sur un complexe de ligands protéiques et un didacticiel plus détaillé sur la façon dont le score est calculé à partir des différents termes d'énergie sont disponibles sur http://dock.compbio.ucsf.edu/DOCK_6 /tutorials/amber_score/amber_score.htm.

Pour l'exemple suivant, supposons que nous ayons préparé la protéine et le ligand en conséquence, c'est-à-dire que nous avons supprimé les ligands, les métaux et les molécules d'eau du fichier PDB de la protéine et attribué les états de protonations corrects pour les résidus d'histidine.

(Le script perl prepare_amber.pl doit se trouver dans le répertoire des fichiers binaires DOCK6, dock6/bin )

Ensuite, nous créons un fichier dock.in qui a le contenu suivant :

Dans la dernière étape, nous utilisons l'exécutable dock6 pour re-noter le complexe à l'aide du fichier dock.in.

En bas du fichier dock.out, on retrouve les scores Amber :

Traitement des fichiers et de la structure des protéines

Licence: libre, open-source (GNU GPL)

Un outil de conversion pour différents formats de fichiers. Livré avec des binaires autonomes et des API pour divers langages de programmation.

O'Boyle, Noel M., Michael Banck, Craig A. James, Chris Morley, Tim Vandermeersch et Geoffrey R. Hutchison. « Open Babel : une boîte à outils chimique ouverte ». J Cheminée 3 (2011) : 33.

Licence: gratuit, mais pas de licence particulière fournie

Un outil en ligne de commande qui ajoute/supprime des atomes d'hydrogène aux/des protéines et des ligands au format PDB.

Word, et al. (1999) "Asparagine et glutamine : utilisation de contacts d'atomes d'hydrogène dans le choix de l'orientation d'amide de chaîne latérale" J. Mol. Biol. 285, 1735-1747.

Licence: licences commerciales et académiques

OpenEye OMEGA est un outil qui utilise une approche basée sur les connaissances pour générer des centaines de conformères à basse énergie d'une structure de ligand. L'accent est mis sur l'efficacité (environ 2 sec/molécule sur une machine avec un processeur 2,4 Ghz, 4 Go de RAM) et la qualité des conformères générés a été soigneusement validée.

L'approche pour la génération de conformères à basse énergie par OMEGA peut être décrite en 3 étapes de base : tout d'abord, la création d'une structure tridimensionnelle initiale basée sur une bibliothèque de fragments, la génération d'un grand ensemble de conformères basé sur le nombre d'angles de torsion de rotation , et l'échantillonnage à l'aide de critères géométriques et d'une fonction de notation énergétique basée sur un champ de force simplifié MMFF94.

Hawkins, Paul C. D., A. Geoffrey Skillman, Gregory L. Warren, Benjamin A. Ellingson et Matthew T. Stahl. « Génération de conformité avec OMEGA : algorithme et validation à l'aide de structures de haute qualité à partir de la banque de données de protéines et de la base de données structurelle de Cambridge ». Journal of Chemical Information and Modeling 50, no. 4 (26 avril 2010) : 572-84. doi: 10.1021/ci100031x.

  • -commentEnergy : écrit - l'énergie du conformateur en kcal/mol à écrire dans le champ commentaire pour chaque conformère.
  • -warts true : génère des titres uniques pour les conformères (en ajoutant un trait de soulignement et l'entier correspondant au numéro d'ordre de rang du conformère dans l'ensemble final).
  • omega2 --help simple : Récupère une liste de paramètres simples
  • omega2 --help all : Obtenir une liste complète des paramètres

Version: Oméga v. 3.14

Licence: licences commerciales et académiques

OpenEye ROCS est un outil de superposition de structures chimiques avec une molécule cible basée sur des similitudes de forme et de chimie.

La génération rapide de superpositions et sa prise en charge du multitraitement en font un outil réalisable pour le criblage virtuel - OpenEye rapporte qu'environ 20 à 40 molécules par seconde peuvent être superposées à l'aide d'un seul processeur d'un ordinateur standard (processeur 2,4 Ghz, 4 Go de RAM).

Le résultat d'une analyse ROCS comprend les composés superposés dans des formats de structure communs tels que MOL2 ainsi qu'un fichier de rapport avec divers scores différents qui peuvent être utilisés pour classer les composés superposés en fonction des correspondances volumétriques et chimiques.


Introduction

Le criblage virtuel basé sur la structure (VS) est un outil puissant pour la recherche pharmacologique et scientifique fondamentale [1, 2]. Dans une campagne VS réussie, un programme d'amarrage pose des modèles de petites molécules dans une poche de liaison aux protéines, et une fonction de notation estime les affinités de liaison. Les expérimentateurs testent ensuite les composés les mieux notés pour vérifier la liaison. Les taux de réussite sont souvent meilleurs que ceux obtenus par le seul criblage à haut débit [2].

La première étape fondamentale d'un flux de travail VS est la prédiction de pose. Une prédiction précise dépend de modèles 3D de haute qualité des récepteurs protéiques et des ligands potentiels de petites molécules. Les bases de données de petites molécules stockent souvent des composés dans des formats qui incluent uniquement des informations sur le type d'atome et les liaisons (par exemple, SMILES). De plus, les entrées de la base de données ne décrivent généralement qu'une seule ionisation ou état tautomère par molécule, et elles peuvent manquer d'informations sur la chiralité et l'isomérisation cis/trans.

Bien qu'efficaces, les programmes commerciaux et open source disponibles pour le traitement et la conversion de ces représentations simples en modèles 3D entièrement énumérés ont leurs inconvénients. Les programmes commerciaux tels que OMEGA/QUACPAC d'OpenEye [3, 4] et LigPrep de Schrödinger (Schrödinger, LLC) ont des licences restrictives et peuvent être coûteux. Bien qu'OpenEye offre une licence académique gratuite, cette licence impose des restrictions substantielles en matière de commercialisation et de propriété intellectuelle. L'éligibilité aux licences est également régulièrement réévaluée, rendant l'accès à long terme incertain. Et les flux de travail qui intègrent des outils commerciaux ne peuvent généralement pas être distribués librement.

Les alternatives gratuites incluent Frog2 [5] et Balloon [6, 7]. Frog2 [5] est un programme Web open source qui ne nécessite aucune installation. Les utilisateurs doivent d'abord télécharger leurs composés au format SMILES sur le portail Web RPBS (http://bioserv.rpbs.univ-paris-diderot.fr/services/Frog2/) [8, 9]. Le serveur Frog2 attribue ensuite des coordonnées 3D et fournit un fichier téléchargeable contenant les résultats. En revanche, Balloon [6, 7] est un programme en ligne de commande qui peut être facilement et librement incorporé dans des flux de travail plus importants. Bien que Balloon soit gratuit, le code source n'est pas accessible au public et le programme ne prend pas en compte les formes isomères chirales et cis/trans alternatives. De plus, Frog2 et Balloon ignorent l'ionisation alternative et les formes tautomères manquent parfois des conformations annulaires à faible énergie et non aromatiques et génèrent des rotamères en excès au-delà de ceux nécessaires à l'amarrage des ligands flexibles.

Le populaire package de cheminformats open source Open Babel [10] comprend également plusieurs fichiers exécutables qui peuvent effectuer des étapes clés de préparation de petites molécules. Par exemple, le obabel l'exécutable accepte un -p (pH) paramètre qui ionise les molécules en fonction d'un pH spécifié par l'utilisateur. Les obabelgen3D (générer des coordonnées 3D) convertit également les représentations moléculaires en modèles 3D qui peuvent être optimisés davantage avec réduire au minimum. Mais il est difficile de générer des formes isomères tautomères, chirales et cis/trans alternatives à l'aide de l'interface de ligne de commande d'Open Babel. Les utilisateurs/programmeurs avancés doivent implémenter ces fonctionnalités séparément à l'aide de l'API de programmation d'Open Babel. Open Babel est également publié sous une licence copyleft (GNU General Public License, version 2), qui exige que toutes les œuvres dérivées soient également copyleft.

Pour répondre aux limitations des packages commerciaux et open source existants, nous présentons ici Gypsum-DL, un programme open source gratuit pour la préparation de bibliothèques de petites molécules. Au-delà de la simple attribution de coordonnées 3D, Gypsum-DL génère des modèles moléculaires avec des états d'ionisation, tautomères et isomères variables. Les poches de liaison aux protéines stabilisent souvent ces formes alternatives, même si leur prévalence est faible dans la solution en vrac. Gypsum-DL génère également des modèles avec d'autres conformations d'anneaux non aromatiques. Il est essentiel de prendre en compte d'autres conformations d'anneaux étant donné que la plupart des programmes d'amarrage de ligand flexible (par exemple, AutoDock Vina [12]) ne tiennent pas compte de toutes les géométries d'anneau de ligand possibles pendant le processus d'amarrage lui-même.

Nous utilisons 4463 complexes protéine-ligand de haute qualité de la base de données PDBBind (http://www.pdbbind.org.cn/) [13, 14] pour montrer que le traitement Gypsum-DL peut améliorer la prédiction de pose VS. Pour montrer davantage l'utilité, nous utilisons également Gypsum-DL pour traiter deux bibliothèques moléculaires virtuelles : (1) le NCI Diversity Set VI, un ensemble de composés disponibles gratuitement fournis par le National Cancer Institute (1558 molécules) et des acides aminés non naturels N-acylés énumérées à l'aide des schémas de réactions chimiques accessibles développés par l'initiative Distributed Drug Discovery (D3) (56 608 molécules) [15,16,17,18]. Ces bibliothèques virtuelles sont disponibles gratuitement pour une utilisation dans des projets VS.

Gypsum-DL sera un outil utile pour ceux qui sont engagés à la fois dans la recherche en science fondamentale et dans la découverte de médicaments. Une copie est disponible sur http://durrantlab.com/gypsum-dl/, publiée sous les termes de la licence Apache, version 2.0.


Mise en œuvre

L'algorithme LigGrep

LigGrep accepte en entrée (1) un fichier PDBQT ou PDB du récepteur cible du médicament utilisé pour l'amarrage, (2) un répertoire de fichiers PDBQT, PDB ou SDF contenant les poses amarrées des ligands candidats, et (3) un fichier JSON- fichier formaté décrivant les filtres spécifiés par l'utilisateur. Après avoir évalué chaque pose ancrée, il affiche les noms de tous les composés avec des poses qui satisfont à tous les filtres définis par l'utilisateur. Les sections suivantes décrivent chacune de ces étapes en détail.

Molécule réceptrice d'entrée

Le premier argument de ligne de commande de LigGrep est le chemin d'accès au fichier récepteur au format PDB/PDBQT utilisé pour l'amarrage. LigGrep utilise la bibliothèque Python Scoria [7] pour charger le fichier récepteur. Étant donné que Scoria est une bibliothèque purement Python avec une licence permissive, nous empaquetons une copie avec LigGrep lui-même pour plus de commodité.

Molécules de ligand d'entrée

Le deuxième argument de ligne de commande de LigGrep est le chemin d'accès à un répertoire contenant les fichiers composés ancrés. Pour s'adapter à une large gamme de programmes d'accueil, nous avons conçu LigGrep pour accepter les poses ancrées dans trois formats de fichiers courants. Ceux-ci incluent le format PDBQT pour accueillir des programmes d'accueil tels que AutoDock Vina [6], le format PDB pour accueillir des études de données volumineuses de poses cristallographiques et le format SDF pour accueillir des programmes tels que Schrödinger's Glide. Les chercheurs qui souhaitent examiner des poses prédites ou déterminées expérimentalement enregistrées dans d'autres formats peuvent convertir au format SDF à l'aide de programmes open source tels que Open Babel [8].

Dans de nombreux cas, les utilisateurs souhaiteront filtrer les poses en ne considérant qu'un seul atome de ligand (par exemple, "quelles poses placent un atome d'oxygène dans une région particulière de la poche de liaison ?"). Dans d'autres cas, les utilisateurs peuvent souhaiter filtrer les poses en utilisant des sous-structures de ligands plus complexes (par exemple, "quelles poses placent un groupe hydroxyle dans une région particulière ?"). Dans d'autres cas encore, des sous-structures avec des spécifications de liaison atomique spécifiques peuvent être critiques (par exemple, "quelle pose place un groupe phényle - mais pas un groupe cyclohexyle - dans une région particulière ?"). Les utilisateurs peuvent exécuter LigGrep dans trois modes (NONE, OPENBABEL et SMILES) en fonction de leurs besoins.

AUCUN mode. En mode AUCUN (--mode AUCUN), LigGrep n'attribue pas d'ordres de liaison au-delà de ceux décrits dans les fichiers composés amarrés eux-mêmes. Dans le cas des fichiers PDB/PDBQT, qui n'incluent aucune information sur l'ordre des liaisons, LigGrep suppose que tous les atomes sont hybrides sp 3 et que tous les atomes juxtaposés de manière appropriée sont connectés par des liaisons simples. Dans le cas des fichiers SDF, qui incluent des informations détaillées sur les liaisons atomiques, LigGrep attribue plutôt des ordres de liaison en fonction des informations présentes dans les fichiers SDF eux-mêmes. Le mode AUCUN est donc idéal pour (1) filtrer par un seul atome, (2) filtrer par une sous-structure dont les atomes ne sont connectés que par des liaisons simples, ou (3) appliquer des filtres de tout type à des poses ancrées au format SDF.

Mode SOURIRE. En mode SOURIRE (--mode SOURIRE), LigGrep attribue les ordres d'obligations aux fichiers composés ancrés au format PDB/PDBQT en considérant en plus les fichiers spécifiés par l'utilisateur au format SMILES. Le format SMILES (Simplified Molecular Input Line-entry System) est un format compact et largement utilisé qui code la connectivité et la chiralité d'une molécule sous la forme d'une simple chaîne de lettres et d'autres symboles sur une ligne. Pour exécuter LigGrep en mode SMILES, l'utilisateur doit enregistrer un fichier SMILES distinct pour chaque composé ancré au format PDB/PDBQT, dans le même répertoire composé. Chaque fichier SMILES doit avoir le même nom de fichier que le fichier PDB/PDBQT correspondant, plus l'extension « .smi ». Le mode SMILES est idéal lorsque (1) des chaînes SMILES sont disponibles ou peuvent être facilement générées, (2) les filtres impliquent des sous-structures avec des liaisons d'ordre supérieur (par exemple, double, triple, aromatique) et (3) les fichiers ancrés sont PDB/PDBQT formaté. Le mode SMILES n'est pas approprié pour les fichiers au format SDF car ceux-ci incluent déjà des informations sur la commande des obligations.

Mode OPENBABEL. En mode OPENBABEL (--mode OPENBABEL), LigGrep utilise l'Open Babel (obabel) exécutable [8] pour tenter d'attribuer des ordres d'hybridation d'atomes et de liaisons aux fichiers PDB/PDBQT composés ancrés. Les utilisateurs doivent spécifier le chemin d'accès à l'exécutable Open Babel à l'aide de LigGrep --babel_exec /CHEMIN/VERS/OBABEL paramètre. En interne, Open Babel convertit les fichiers PDB/PDBQT au format SDF, qui inclut des informations d'ordre de liaison que la bibliothèque Python RDKit [9] peut ensuite traiter. Malheureusement, les fichiers PDBQT n'incluent pas d'atomes d'hydrogène non polaires, ce qui complique ce processus. LigGrep exécute d'abord Open Babel en utilisant le -h option pour ajouter tous les atomes d'hydrogène manquants. Si cette affectation d'atome d'hydrogène ne correspond pas aux atomes présents dans le fichier PDB/PDBQT d'entrée, LigGrep réexécute Open Babel en utilisant le −p option, qui ajoute des atomes d'hydrogène comme il convient pour un pH neutre (7,4). Si cette deuxième tentative échoue, LigGrep émet un avertissement et passe au fichier composé ancré suivant.

Nous fournissons le mode OPENBABEL pour la commodité de l'utilisateur. Il permet aux utilisateurs de traiter les poses au format PDB/PDBQT à l'aide de filtres de sous-structure d'ordre supérieur, même lorsque les chaînes SMILES ne sont pas disponibles. Mais nous vous recommandons d'utiliser le mode OPENBABEL avec prudence. Compte tenu des ambiguïtés associées à l'attribution d'ordres d'hybridation et de liaison basés uniquement sur les coordonnées atomiques, LigGrep en mode OPENBABEL peut mal classer certains composés. De plus, le mode OPENBABEL n'est pas approprié lors du filtrage des poses au format SDF car les fichiers SDF incluent déjà des informations sur l'ordre de liaison.

Fichier de filtres d'entrée

Le troisième argument de ligne de commande de LigGrep est le chemin d'accès à un fichier JSON contenant une liste de filtres que les composés d'entrée doivent satisfaire (Fig. 1). Les filtres LigGrep ont quatre composants définis par l'utilisateur : (1) une spécification de sous-structure de ligand décrivant un ou plusieurs atomes liés, (2) un point dans l'espace 3D (le point de requête), (3) une coupure de distance et (4) un indicateur « exclure » ​​facultatif.

Exemple de fichier JSON contenant des filtres hypothétiques. Le filtre n°1 affiche un point de requête 3D spécifié par un atome récepteur. Le filtre n° 2 affiche un point de requête 3D spécifié par une coordonnée, avec l'indicateur d'exclusion défini

Identification des sous-structures de ligands. Pour déterminer si une pose ancrée donnée satisfait à la liste de filtres spécifiée par l'utilisateur, LigGrep utilise d'abord la bibliothèque RDKit Python [9] pour vérifier si la molécule contient les sous-structures nécessaires (c'est-à-dire les sous-structures associées à tous les filtres qui n'ont pas « exclure » drapeaux, fig. 1a). LigGrep rejette toutes les molécules qui ne contiennent pas chacune des sous-structures nécessaires. Les utilisateurs spécifient les sous-structures via la notation de spécification de cible arbitraire SMILES (SMARTS) (Fig. 1a et d), qui est syntaxiquement similaire à SMILES. Lors de l'utilisation de LigGrep dans RIEN mode pour filtrer les molécules ancrées au format PDB/PDBQT, les sous-structures doivent inclure uniquement des atomes hybrides sp 3 connectés par des liaisons simples (comme dans la figure 1a). Sinon, les chaînes SMARTS peuvent inclure des descriptions de sous-structures plus complexes (par exemple, des anneaux aromatiques, comme dans la figure 1d).

Identification du point de requête 3D. Pour chaque filtre spécifié, LigGrep identifie le point de requête 3D approprié en examinant les données JSON correspondantes. Si le filtre JSON contient la clé "coordinate", LigGrep construit le point de requête 3D directement à partir de la valeur correspondante, une liste contenant les coordonnées x, y et z (Fig. 1e). Si le filtre JSON contient la clé « receptorAtom », LigGrep construit le point de requête 3D en recherchant dans le fichier récepteur d'entrée un atome qui correspond à la chaîne fournie, à l'identifiant du résidu (resid) et au nom de l'atome (atomname) (Fig. 1b). Le point de requête 3D est ensuite défini sur la coordonnée de cet atome.

Accepter ou rejeter les composés amarrés en fonction des distances atomiques. Une fois que LigGrep a identifié les sous-structures de petites molécules et les points de requête 3D pertinents, il détermine si une pose ancrée donnée réussit ou échoue chaque filtre. S'il réussit tous les filtres, le nom du fichier composé est enregistré dans un fichier texte de sortie. S'il échoue à l'un des filtres, le nom de fichier composé n'est pas enregistré. Les filtres sont ainsi combinés à l'aide d'un opérateur booléen AND (conjonction), bien que les utilisateurs avancés familiarisés avec la notation SMARTS puissent également intégrer des opérateurs logiques supplémentaires dans leurs spécifications de sous-structure pour une logique imbriquée plus complexe.

Pour appliquer chaque filtre, LigGrep calcule d'abord la distance minimale entre tout atome de sous-structure de petite molécule et le point de requête 3D correspondant. Il compare ensuite cette distance calculée à la distance de coupure associée à chaque filtre (Fig. 1c). Par défaut, une pose ancrée donnée passe un filtre si elle positionne la sous-structure près du point de requête. Si l'utilisateur inclut un indicateur « exclure » ​​facultatif (Fig. 1f), une pose passe uniquement si elle ne positionne pas la sous-structure près du point de requête. Les critères spécifiques utilisés pour évaluer chaque filtre sont indiqués dans le tableau 1.

Dépendances et compatibilité

Nous avons testé LigGrep sur macOS, Ubuntu Linux et Windows 10 (tableau 2). LigGrep nécessite les bibliothèques Python tierces RDKit [9], NumPy [10] et SciPy [11], qui doivent être installées séparément. Il est livré pré-packagé avec la bibliothèque Scoria [7] pour plus de commodité. Lors de l'exécution de LigGrep dans le mode préféré NONE ou SMILES, l'exécutable Open Babel n'est pas requis. Les utilisateurs qui souhaitent utiliser le mode OPENBABEL doivent installer Open Babel séparément.

Benchmark des écrans virtuels

Préparation des récepteurs

Pour démontrer l'utilisation de LigGrep, nous avons effectué VS contre trois protéines : H. sapiens poly(ADP-ribose) polymérase 1 (hsPARP1), H. sapiens peptidyl-prolyl cis-trans isomérase interagissant avec NIMA 1 (HsPin1p), et S. cerevisiae hexokinase-2 (ScHxk2p). nous avons téléchargé hsPARP1, HsPin1p, et ScStructures cristallines Hxk2p (6BHV [12], 3TDB [13] et 1IG8 [14], respectivement) de la RCSB Protein Data Bank [15, 16]. Nous avons sélectionné le 6BHV HsPARP1 parce que son ligand co-cristallisé, le nucléotide benzamide adénine, était le plus grand en masse des 46 ligands co-cristallisés considérés (Fichier supplémentaire 1 : Tableau S1), et certaines études suggèrent que les conformations de poche de liaison plus grandes sont plus propices à VS [ 17, 18]. Nous avons sélectionné le 3TDB hsStructure Pin1p car son ligand co-cristallisé était le plus grand en masse des 27 considérés (Fichier supplémentaire 1 : Tableau S2). Enfin, nous avons sélectionné le 1IG8 Scstructure Hxk2p car c'est la seule ScStructure Hxk2p avec la séquence d'acides aminés correcte. Dans tous les cas, nous avons utilisé le serveur PDB2PQR [19,20,21] pour ajouter des atomes d'hydrogène à ces structures protéiques et optimiser leurs réseaux de liaisons hydrogène (paramètres par défaut, pH 7). Nous avons ensuite utilisé Open Babel [8] pour convertir les fichiers PQR protonés résultants au format PDB. Enfin, nous avons utilisé MGLTools 1.5.6 [22] pour convertir les fichiers PDB au format PDBQT, qui inclut les types d'atomes et les charges atomiques partielles.

Préparation des bibliothèques de petites molécules

Pour préparer une bibliothèque de petites molécules pour HsAmarrage PARP1, nous avons téléchargé les chaînes SMILES de 46 connues hsLigands PARP1 (Fichier complémentaire 1 : Tableau S1) et 1515 petites molécules diverses (présumés leurres). Les ligands connus ont été extraits de hsLes structures cristallines PARP1 déposées dans la RCSB Protein Data Bank et les leurres ont été extraits du NCI Diversity Set VI, un ensemble de composés disponibles gratuitement fournis par le National Cancer Institute (NCI) [23]. Nous avons créé une bibliothèque similaire de petites molécules de ligands connus et de leurres NCI pour hsDocking Pin1p, utilisant 27 co-cristallisés hsLigands Pin1p (Fichier supplémentaire 1 : Tableau S2). Pour ScAmarrage Hxk2p, nous avons identifié 41 analogues du glucose connus pour se lier aux protéines hexokinase et glucokinase de diverses espèces (présumées ScHxk2p ligands huit de la banque de données de protéines RCSB et 33 de la base de données BindingDB [24, 25] Fichier supplémentaire 1 : tableau S3). Comme ScHxk2p leurres, nous avons sélectionné 1652 analogues du glucose de poids moléculaire inférieur à 500 Daltons, issus des bases de données ChemDiv et eMolecules (présumés inactifs).

Nous avons utilisé le programme open source Gypsum-DL [4] pour générer des modèles 3D de petites molécules à partir de ces chaînes SMILES. Pour tenir compte de l'ionisation alternative, des formes tautomères, chirales, isomères et à conformation en anneau, nous avons demandé à Gypsum-DL de générer deux variantes moléculaires par composé d'entrée (min_ph: 7.4 max_ph: 7.4 pka_precision: 0). Nous avons également utilisé des Gypsum-DL --use_durrant_lab_filters flag pour supprimer les variantes moléculaires jugées improbables. Les fichiers PDB de petites molécules de sortie ont à nouveau été convertis au format PDBQT à l'aide de MGLTools 1.5.6 [22].

Amarrage

Pour préparer l'amarrage, nous avons utilisé AutoDockTools [22] et Webina [26] pour identifier une boîte d'amarrage centrée sur les poches de liaison au ligand des structures cristallines respectives. Dans le cas du 6BHV hsPARP1, nous avons retenu les quatre domaines catalytiques présents dans l'unité asymétrique 6BHV pour des raisons de simplicité, mais la boîte d'accueil (23 x 17 x 20 Å) ne comprenait que des atomes de chaîne A. Les hsPin1p et ScLes boîtes d'accueil Hxk2p étaient respectivement de 20 x 20 x 20 et 20 x 19 x 15 . Nous avons ancré tous les composés dans leurs récepteurs respectifs à l'aide d'AutoDock Vina [6], avec les paramètres par défaut de Vina.

Définition des filtres LigGrep

Pour construire des filtres LigGrep adaptés au HsPARP1 VS, PARP1 VS, nous avons examiné un tableau récemment publié des prévisions hsInteractions PARP1/ligand fréquemment identifiées dans une campagne CADD de novo à grande échelle [27]. Deux des interactions les plus fréquentes ont également été observées dans les structures cristallines de hsPARP1 lié à l'inhibiteur cliniquement approuvé niraparib (4R6E:A [28]) et à un 4(3HDérivé )-quinazolinone (1UK0:A [29]) : une liaison hydrogène avec G863, et une interaction (pi) - (pi) avec Y907. Sur la base de notre analyse de ces structures, nous avons défini deux filtres structurels (« receptorAtom ») pour capturer les deux interactions. Pour capturer la liaison hydrogène, nous avons exigé qu'un atome d'azote ou d'oxygène composé amarré (SMARTS : [#7,#8]) se situent à moins de 5,5 du carbone alpha G863 (résider: 863 nom de l'atome: CALIFORNIE). Pour capturer l'interaction (pi) - (pi), nous avons exigé qu'une liaison aromatique carbone-carbone à composé ancré (SMARTS : cc) se situent à moins de 5,5 de l'atome de carbone Y907 le plus distal (résider: 907 nom de l'atome: CZ).

Pour construire des filtres adaptés au hsPARP1 VS, nous avons examiné plusieurs ligands co-cristallisés déposés dans la banque de données de protéines RCSB. Beaucoup de ces sous-structures de type squelette peptidique (par exemple, les fragments d'acide imidazole et furane-carboxylique) près de l'endroit où les peptides endogènes se lient [30]. Nous avons donc défini un filtre de « coordonnées » pour identifier les poses ancrées qui ont positionné [N,O]CCO sous-structures à moins de 4,0 de cette position. Nous avons utilisé une chaîne SMARTS avec uniquement des atomes hybrides sp 3 (liaisons simples) pour assurer la compatibilité avec le mode NONE de LigGrep.

Pour construire des filtres adaptés au hsPin1p VS, nous avons à nouveau considéré des ligands connus. De nombreux ligands d'hexokinase sont des analogues du glucose, nous avons donc défini un seul filtre « coordonné » pour identifier les poses ancrées qui positionnaient un tétrahydro-2H-partie pyrane (C1OCCCC1) within 1.0 Å of the 3D position where glucose typically binds.

Measuring virtual screen performance

To evaluate the performance of our VS in terms of both the docked poses and the associated docking scores, we first selected a single candidate pose for each unique input molecule in our library. Given that Gypsum-DL generated up to two molecular variants for each molecule and that Vina predicted up to 9 poses for each variant, each unique molecule was associated with at most 18 poses. In practice this number was smaller on average because in some cases Gypsum-DL generated only one variant, and LigGrep (when applied) filtered out those poses that failed to meet our user-specified criteria. To assess the VS before applying LigGrep, we considered only each ligand’s single, top-scoring pose, without regard for pose geometry. To assess the VS after applying LigGrep, we considered the top-scoring pose from among the poses with geometries that matched our user-defined LigGrep filters.

Pose accuracy. To assess how well Vina predicts the poses of known HsPARP1 ligands, we used UCSF Chimera [31] to align the 46 apo HsPARP1 crystal structures listed in Additional file 1: Table S1 to the HsPARP1 structure used for docking. We then used the obrms program, included in the Open Babel package [8], to calculate the root-mean-square deviation (RMSD) between the top-scoring docked pose of each known ligand and the corresponding crystallographic pose (Additional file 1: Table S1). We used this same protocol to assess how well Vina predicts the poses of known HsPin1p and ScHxk2p ligands (Additional file 1: Tables S2 and S3), though in the case of ScHxk2p only one crystallographic ligand was available.

Scoring (ranking) accuracy. We used several methods to assess how well the three VS ranked known ligands above decoy molecules, both before and after applying LigGrep. First, we ordered the compounds of the three VS by their docking scores and calculated the percentile ranks of the known ligands (Additional file 1: Tables S1–S3). Second, we counted the number of positive-control compounds that ranked in the top 10, 20, and 40 compounds for each VS (Table 3). Third, we calculated enrichment factors. Given a VS of T total small molecules including (P_) positive-control compounds, the enrichment factor, (EF_) , of the m top-ranked compounds is the number of positive-control ligands present, (P_) , divided by the number of positive controls that would be expected if the compounds were randomly ordered, i.e., (EF_ = P_ / (nP_ / T)) . Finally, though LigGrep is best used to enrich the set of top-ranked compounds, we also assessed the impact of LigGrep filters on the entire set of ranked compounds using receiver operating characteristic (ROC) metrics (see Additional file 1: Figure S1).


Inhibitor discovery for the E. coli meningitis virulence factor IbeA from homology modeling and virtual screening

Escherichia coli (E. coli) K1 is the most common Gram-negative bacteria cause of neonatal meningitis. The penetration of E. coli through the blood–brain barrier is a key step of the meningitis pathogenesis. A host receptor protein, Caspr1, interacts with the E. coli virulence factor IbeA and thus facilitates bacterial penetration through the blood–brain barrier. Based on this result, we have now predicted the binding pattern between Caspr1 and IbeA by an integrated computational protocol. Based on the predicted model, we have identified a putative molecular binding pocket in IbeA, that directly bind with Caspr1. This evidence indicates that the IbeA (229–343aa) region might play a key role in mediating the bacteria invasion. Virtual screening with the molecular model was conducted to search for potential inhibitors from 213,279 commercially available chemical compounds. From the top 50 identified compounds, 9 demonstrated a direct binding ability to the residues within the Caspr1 binding site on IbeA. By using human brain microvascular endothelial cells (hBMEC) with E. coli strain RS218, four molecules were characterized that significantly attenuated the bacteria invasions at concentrations devoid of cell toxicity. Our study provides useful structural information for understanding the pathogenesis of neonatal meningitis, and have identified drug-like compounds that could be used to develop effective anti-meningitis agents.

Ceci est un aperçu du contenu de l'abonnement, accessible via votre institution.


Les références

Beura S and Chetti P 2020 In-silico strategies for probing chloroquine based inhibitors against SARS-CoV-2. J Biomol. Structurer. Dyna. https://doi.org/10.1080/07391102.2020.1772111

Bolton EE, Wang Y, Thiessen PA and Bryant SH 2008 PubChem: integrated platform of small molecules and biological activities. Annu. Rep. Comput. Chem. 4 217–241

Bowers KJ, Chow DE, Xu H, Dror RO, Eastwood MP, et al. 2006 Scalable algorithms for molecular dynamics simulations on commodity clusters. Proceedings of the 2006 ACM/IEEE Conference on Supercomputing (In IEEE)

Colombier M-A and Molina J-M 2018 Doravirine: a review. Cour. Avis. HIV AIDS 13 308–314

Coogan PF, Rosenberg L, Palmer JR, Strom BL, Zauber AG, Stolley PD and Shapiro S 2000 Phenolphthalein laxatives and risk of cancer. J. Natl. Cancer Inst. 92 1943–1944

Delorme D, Ducharme Y, Brideau C, Chan C-C, Chauret N, et al. 1996 Dioxabicyclooctanyl naphthalenenitriles as nonredox 5-lipoxygenase inhibitors: structure− activity relationship study directed toward the improvement of metabolic stability. J. Méd. Chem. 39 3951–3970

Drosten C, Günther S, Preiser W, van der Werf S, Brodt HR, et al. 2003 Identification of a novel coronavirus in patients with severe acute respiratory syndrome. N. Engl. J. Méd. 2003 348 1967–1976

Du J, Sun H, Xi L, Li J, Yang Y, Liu H and Yao X 2011 Molecular modeling study of checkpoint kinase 1 inhibitors by multiple docking strategies and prime/MM-GBSA calculation. J. Comput. Chem. 32 2800–2809

Gaginella TS, Mascolo N, Izzo AA, Autore G and Capasso F 1994 Nitric oxide as a mediator of bisacodyl and phenolphthalein laxative action: induction of nitric oxide synthase. J. Pharmacol. Exp. Là. 270 1239–1245

Genheden S and Ryde U 2015 The MM/PBSA and MM/GBSA methods to estimate ligand-binding affinities. Expert Opin. Drogue Discov. 10 449–461

Ghofrani HA, D’Armini AM, Grimminger F, Hoeper MM, Jansa P, et al. 2013 Riociguat for the treatment of chronic thromboembolic pulmonary hypertension N. Engl. J. Méd. 369 319–329

Ghofrani HA, Galiè N, Grimminger F, Grünig E, Humbert M, et al. 2013 Riociguat for the treatment of pulmonary arterial hypertension. N. Engl. J. Med. 369 330–340

Goto Y, Watanabe N, Kogawa N, Tsuchiya M, Takahashi O, Uchi H, Furue M and Hayashi H 2002 CX-659S: a novel diaminouracil derivative that has antioxidative and acute anti-inflammatory activities. EUR. J. Pharmacol. 438 189–196

Gui M, Song W, Zhou H, Xu J, Chen S, Xiang Y and Wang X 2017 Cryo-electron microscopy structures of the SARS-CoV spike glycoprotein reveal a prerequisite conformational state for receptor binding. Rés. 27 119–129

Hardcastle Jr G, Johnson D, Panetta C, Scott A and Sutherland S 1966 The preparation and structure of hetacillin. J. Org. Chem. 31 897–899

Hoy SM 2018 Talazoparib: first global approval. Médicaments 78 1939–1946

Kim S, Chen J, Cheng T, Gindulyte A, He J, He S, Li Q, Shoemaker BA, Thiessen PA, Yu B, Zaslavsky L, Zhang J and Bolton EE 2019 PubChem 2019 update: improved access to chemical data. Acides nucléiques Res. 47 D1102–D1109

Kollman PA, Massova I, Reyes C, Kuhn B, Huo S, et al. 2000 Calculating structures and free energies of complex molecules: combining molecular mechanics and continuum models. Acc. Chem. Rés. 33 889–897

Ksiazek TG, Erdman D, Goldsmith CS, Zaki SR, Peret T, et al. 2003 A novel coronavirus associated with severe acute respiratory syndrome. N. Engl. J. Méd. 348 1953–1966

Lan J, Ge J, Yu J, Shan S, Zhou H, Fan S, Zhang Q, Shi X, Wang Q, Zhang L and Wang X 2020 Structure of the SARS-CoV-2 spike receptor-binding domain bound to the ACE2 receptor. La nature 581 215–220

Li W, Moore MJ, Vasilieva N, Sui J, Wong SK, Berne MA, Somasundaran M, Sullivan JL, Luzuriaga K, Greenough TC, Choe H and Farzan M 2003 Angiotensin-converting enzyme 2 is a functional receptor for the SARS coronavirus. La nature 426 450–454

Li J, Abel R, Zhu K, Cao Y, Zhao S and Friesner RA 2011 The VSGB 2.0 model: a next generation energy model for high resolution protein structure modeling. Protéines. 79 2794–2812

Li F, Li W, Farzan M and Harrison SC 2005 Structure of SARS coronavirus spike receptor-binding domain complexed with receptor. Science 309 1864–1868

Lipinski CA 2004 Lead-and drug-like compounds: the rule-of-five revolution. Drogue Discov. Today Technol. 1 337–341

Lyne PD, Lamb ML and Saeh JC 2006 Accurate prediction of the relative potencies of members of a series of kinase inhibitors using molecular docking and MM-GBSA scoring. J. Méd. Chimie. 49 4805–4808

Malik A, Prahlad D, Kulkarni N, and Kayal A 2020 Interfacial Water Molecules Make RBD of SPIKE Protein and Human ACE2 to Stick Together. bioRxiv

Massova I and Kollman PA 2000 Combined molecular mechanical and continuum solvent approach (MM-PBSA/GBSA) to predict ligand binding. Perspect Drug Discov. Des. 18 113–135

Morris GM, Huey R, Lindstrom W, Sanner MF, Belew RK, Goodsell DS and Olson AJ 2009 AutoDock4 and AutoDockTools4: Automated docking with selective receptor flexibility. J. Comput. Chem. 30 2785–2791

Muid RE, Dale MM, Davis PD, Elliott LH, Hill CH, Kumar H, Lawton G, Twomey BM, Wadsworth J and Wilkinson SE 1991 A novel conformationally restricted protein kinase C inhibitor, Ro 31‐8425, inhibits human neutrophil superoxide generation by soluble, particulate and post‐receptor stimuli. FEBS Lett. 293 169–172

Nosten F, van Vugt M, Price R, Luxemburger C, Thway KL, Brockman A, McGready R, ter Kuile F, Looareesuwan S and White NJ 2000 Effects of artesunate-mefloquine combination on incidence of Plasmodium falciparum malaria and mefloquine resistance in western Thailand: a prospective study. Lancette 356 297–302

O’Boyle NM, Banck M, James CA, Morley C, Vandermeersch T and Hutchison GR 2011 Open Babel: An open chemical toolbox. J. Cheminform. 3 33

de Oliveira OV, Rocha GB, Paluch AS and Costa LT 2020 Repurposing approved drugs as inhibitors of SARS-CoV-2 S-protein from molecular modeling and virtual screening. J. Biomol. Structurer. Dyna. https://doi.org/10.1080/07391102.2020.1772885

Palmer KJ, Holliday SM and Brogden RN 1993 Mefloquine. Médicaments 45 430–475

Release Schrödinger 2017 4: Maestro, Schrödinger, LLC, New York, NY, 2017

Rider J 1971 Treatment of acute and chronic constipation with bisoxatin acetate and bisacodyl. Double-blind crossover study. Cour. Là. Rés. Clin. Exp. 13 386–392

Rino R, Vega M, Konrad S, P Gj, David C, Jang H, et al. 2004 Severe acute respiratory syndrome coronavirus. http://v3.espacenet.com/textdoc?DB=EPODOC&IDX=US2006257852

Roos K, Wu C, Damm W, Reboul M, Stevenson JM, et al.2019 OPLS3e: Extending Force Field Coverage for Drug-Like Small Molecules. J. Chem. Theory Comput. 15 1863-1874

Rothan HA and Byrareddy SN 2020 The epidemiology and pathogenesis of coronavirus disease (COVID-19) outbreak. J. Auto-immun. 109 102433

Sandeep S and McGregor K 2020 Energetics Based Modeling of Hydroxychloroquine and Azithromycin Binding to the SARS-CoV-2 Spike (S)Protein - ACE2 Complex. ChemRxiv

Sardana V, Burzynski J and Zalzal P 2017 Safety and efficacy of topical ketoprofen in transfersome gel in knee osteoarthritis: a systematic review. Musculoskeletal Care 15 114–121

Sardar R, Satish D, Birla S and Gupta D 2020 Comparative analyses of SAR-CoV2 genomes from different geographical locations and other coronavirus family genomes reveals unique features potentially consequential to host-virus interaction and pathogenesis. bioRxiv https://doi.org/10.1101/2020.03.21.001586

Schrodinger L 2017 The PyMol molecular graphics system, version 2.0. Schrödinger, LLC, New York, NY.

Shang J, Ye G, Shi K, Wan Y, Luo C, Aihara H, Geng Q, Auerbach A and Li F 2020 Structural basis of receptor recognition by SARS-CoV-2. La nature. 581 221-224

Smid P, Coolen HK, Keizer HG, van Hes R, de Moes J-P, et al. 2005 Synthesis, structure−activity relationships, and biological properties of 1-heteroaryl-4-[ω-(1 H-indol-3-yl) alkyl] piperazines, novel potential antipsychotics combining potent dopamine d2 receptor antagonism with potent serotonin reuptake inhibition. J. Méd. Chem. 48 6855–6869

Smith J and Hamilton-Miller J 1970 Hetacillin: a chemical and biological comparison with ampicillin. Chimiothérapie 15 366–378

Soleimani V, Delghandi PS, Moallem SA and Karimi G 2019 Safety and toxicity of silymarin, the major constituent of milk thistle extract: An updated review. Phytother. Rés. 33 1627–1638

Song W, Gui M, Wang X and Xiang Y 2018 Cryo-EM structure of the SARS coronavirus spike glycoprotein in complex with its host cell receptor ACE2. Pathog PLoS. 14 e1007236

Tortorici MA and Veesler D 2019 Structural insights into coronavirus entry. Av. Virus Res. 105 93–116

Trott O and Olson AJ 2010 AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. J. Comput. Chem. 31 455–461

Walls AC, Park Y-J, Tortorici MA, Wall A, McGuire AT and Veesler D 2020 Structure, function, and antigenicity of the SARS-CoV-2 spike glycoprotein. Cellule 181 281–292

Walls AC, Tortorici MA, Snijder J, Xiong X, Bosch BJ, Rey FA and Veesler D 2017 Tectonic conformational changes of a coronavirus spike glycoprotein promote membrane fusion. Proc. Natl. Acad. Sci. 114 11157–11162

Wan Y, Shang J, Graham R, Baric RS and Li F 2020 Receptor Recognition by the Novel Coronavirus from Wuhan: an Analysis Based on Decade-Long Structural Studies of SARS Coronavirus. J Virol. 94 e00127-20

Wang Q, Zhang Y, Wu L, Niu S, Song C, Zhang Z, Lu G, Qiao C, Hu Y, Yuen KY, Wang Q, Zhou H, Yan J and Qi J 2020 Structural and functional basis of SARS-CoV-2 entry by using human ACE2. Cellule 181 894–904

Wishart DS, Feunang YD, Guo AC, Lo EJ, Marcu A, et al.2018 DrugBank 5.0: a major update to the DrugBank database for 2018. Acides nucléiques Res. 46 D1074–D1082

Wu C, Liu Y, Yang Y, Zhang P, Zhong W, Wang Y, Wang Q, Xu Y, Li M, Li X, Zheng M, Chen L and Li H 2020 Analysis of therapeutic targets for SARS-CoV-2 and discovery of potential drugs by computational methods. Acta Pharm. Péché. B 10 766–788

Xia S, Liu M, Wang C, Xu W, Lan Q, Feng S, Qi F, Bao L, Du L, Liu S, Qin C, Sun F, Shi Z, Zhu Y, Jiang S and Lu L 2020a Inhibition of SARS-CoV-2 (previously 2019-nCoV) infection by a highly potent pan-coronavirus fusion inhibitor targeting its spike protein that harbors a high capacity to mediate membrane fusion. Rés. 30 343–355

Xia S, Zhu Y, Liu M, Lan Q, Xu W, Wu Y, Ying T, Liu S, Shi Z, Jiang S and Lu L 2020b Fusion mechanism of 2019-nCoV and fusion inhibitors targeting HR1 domain in spike protein. Mol cellulaire. Immunol. 17 765–767

Xiao X, Chakraborti S, Dimitrov AS, Gramatikoff K and Dimitrov DS 2003 The SARS-CoV S glycoprotein: expression and functional characterization. Biochimie. Biophys. Rés. Commun. 312 1159–1164

Xie Y, Zhang D, Zhang J and Yuan J 2019 Metabolism, transport and drug-drug interactions of silymarin. Molecules 24 3693

Yan R, Zhang Y, Li Y, Xia L, Guo Y, and Zhou Q 2020 Structural basis for the recognition of SARS-CoV-2 by full-length human ACE2. Science 367 1444–1448


Ertl P (2003) Cheminformatics analysis of organic substituents: identification of the most common substituents, calculation of substituent properties, and automatic identification of drug-like bioisosteric groups. J Chem Inf Comput Sci. https://doi.org/10.1021/ci0255782

Bohacek RS, McMartin C, Guida WC (1996) The art and practice of structure-based drug design: a molecular modeling perspective. Med Res Rev. https://doi.org/10.1002/(SICI)1098-1128(199601)16:1<3::AID-MED1>3.0.CO2-6

Polishchuk PG, Madzhidov TI, Varnek A (2013) Estimation of the size of drug-like chemical space based on GDB-17 data. J Comput Aided Mol Des. https://doi.org/10.1007/s10822-013-9672-4

Durrant JD, Amaro RE, McCammon JA (2009) Autogrow: a novel algorithm for protein inhibitor design. Chem Biol Drug Des 73(2):168–178. https://doi.org/10.1111/j.1747-0285.2008.00761.x

Durrant JD, Lindert S, McCammon JA (2013) Autogrow 3.0: an improved algorithm for chemically tractable, semi-automated protein inhibitor design. J Mol Graph Model 44:104–112. https://doi.org/10.1016/j.jmgm.2013.05.006

Sliwoski G, Kothiwale S, Meiler J, Lowe EW (2014) Computational methods in drug discovery. Pharmacol Rev. https://doi.org/10.1124/pr.112.007336

Degen J, Wegscheid-Gerlach C, Zaliani A, Rarey M (2008) On the art of compiling and using ’drug-like’ chemical fragment spaces. ChemMedChem. https://doi.org/10.1002/cmdc.200800178

Yu W, MacKerell AD (2017) Chap. 5. Computer-aided drug design methods. In: Sass P (ed) Antibiotics methods in molecular biology, vol 1520. Springer, Berlin, pp 85–106

Kawai K, Nagata N, Takahashi Y (2014) De novo design of drug-like molecules by a fragment-based molecular evolutionary approach. J Chem Inf Model. https://doi.org/10.1021/ci400418c

Alhossary A, Handoko SD, Mu Y, Kwoh CK (2015) Fast, accurate, and reliable molecular docking with QuickVina 2. Bioinformatics 31(13):2214–2216. https://doi.org/10.1093/bioinformatics/btv082

Ropp PJ, Spiegel JO, Walker JL, Green H, Morales GA, Milliken KA, Ringe JJ, Durrant JD (2019) Gypsum-dl: an open-source program for preparing small-molecule libraries for structure-based virtual screening. J Cheminform 11(1):34. https://doi.org/10.1186/s13321-019-0358-3

Kim G, Ison G, McKee AE, Zhang H, Tang S, Gwise T, Sridhara R, Lee E, Tzou A, Philip R et al (2015) Fda approval summary: olaparib monotherapy in patients with deleterious germline BRCA-mutated advanced ovarian cancer treated with three or more lines of chemotherapy. Clin Cancer Res 21(19):4257–4261

Balasubramaniam S, Beaver JA, Horton S, Fernandes LL, Tang S, Horne HN, Liu J, Liu C, Schrieber SJ, Yu J, Song P, Pierce W, Robertson KJ, Palmby TR, Chiu HJ, Lee EY, Philip R, Schuck R, Charlab R, Banerjee A, Chen XH, Wang X, Goldberg KB, Sridhara R, Kim G, Pazdur R (2017) FDA approval summary: rucaparib for the treatment of patients with deleterious BRCA mutation-associated advanced ovarian cancer. Clin Cancer Res 23(23):7165–7170. https://doi.org/10.1158/1078-0432.CCR-17-1337

Ison G, Howie LJ, Amiri-Kordestani L, Zhang L, Tang S, Sridhara R, Pierre V, Charlab R, Ramamoorthy A, Song P, Li F, Yu J, Manheng W, Palmby TR, Ghosh S, Horne HN, Lee EY, Philip R, Dave K, Chen XH, Kelly SL, Janoria KG, Banerjee A, Eradiri O, Dinin J, Goldberg KB, Pierce WF, Ibrahim A, Kluetz PG, Blumenthal GM, Beaver JA, Pazdur R (2018) FDA approval summary: niraparib for the maintenance treatment of patients with recurrent ovarian cancer in response to platinum-based chemotherapy. Clin Cancer Res 24(17):4066–4071. https://doi.org/10.1158/1078-0432.CCR-18-0042

Hoy SM (2018) Talazoparib: first global approval. Drugs 78(18):1939–1946. https://doi.org/10.1007/s40265-018-1026-z

Bitler BG, Watson ZL, Wheeler LJ, Behbakht K (2017) PARP inhibitors: clinical utility and possibilities of overcoming resistance. Gynecol Oncol 147(3):695–704. https://doi.org/10.1016/j.ygyno.2017.10.003

Patel AG, Sarkaria JN, Kaufmann SH (2011) Nonhomologous end joining drives poly(ADP-ribose) polymerase (PARP) inhibitor lethality in homologous recombination-deficient cells. Proc Nat Acad Sci USA 108(8):3406–3411. https://doi.org/10.1073/pnas.1013715108

Thorsell AG, Ekblad T, Karlberg T, Löw M, Pinto AF, Trésaugues L, Moche M, Cohen MS, Schüler H (2017) Structural basis for potency and promiscuity in poly(ADP-ribose) polymerase (PARP) and tankyrase inhibitors. J Med Chem. https://doi.org/10.1021/acs.jmedchem.6b00990

Dawicki-McKenna JM, Langelier M-F, DeNizio JE, Riccio AA, Cao CD, Karch KR, McCauley M, Steffen JD, Black BE, Pascal JM (2015) Parp-1 activation requires local unfolding of an autoinhibitory domain. Mol Cell 60(5):755–768. https://doi.org/10.1016/j.molcel.2015.10.013

Kinoshita T, Nakanishi I, Warizaya M, Iwashita A, Kido Y, Hattori K, Fujii T (2004) Inhibitor-induced structural change of the active site of human poly(ADP-ribose) polymerase. FEBS Lett 556(1–3):43–6. https://doi.org/10.1016/s0014-5793(03)01362-0

Trott O, Olson AJ (2009) Autodock vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. J Comput Chem 31(2):455–461. https://doi.org/10.1002/jcc.21334

Durrant JD, McCammon JA (2012) Autoclickchem: click chemistry in silico. PLoS Comput Biol. https://doi.org/10.1371/journal.pcbi.1002397

Hartenfeller M, Eberle M, Meier P, Nieto-Oberhuber C, Altmann KH, Schneider G, Jacoby E, Renner S (2011) A collection of robust organic synthesis reactions for in silico molecule design. J Chem Inf Model 51(12):3093–3098. https://doi.org/10.1021/ci200379p

Sterling T, Irwin JJ (2015) ZINC 15-ligand discovery for everyone. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.5b00559

Lindert S, Durrant JD, Mccammon JA (2012) LigMerge: a fast algorithm to generate models of novel potential ligands from sets of known binders. Chem Biol Drug Des 80(3):358–365. https://doi.org/10.1111/j.1747-0285.2012.01414.x

Landrum G RDKit: open-source cheminformatics. http://www.rdkit.org/

Ropp PJ, Kaminsky JC, Yablonski S, Durrant JD (2019) Dimorphite-DL: an open-source program for enumerating the ionization states of drug-like small molecules. J Cheminform 11(1):14. https://doi.org/10.1186/s13321-019-0336-9

Durrant JD, McCammon JA (2010) NNScore: a neural-network-based scoring function for the characterization of protein–ligand complexes. J Chem Inf Model 50(10):1865–1871. https://doi.org/10.1021/ci100244v

Durrant JD, McCammon JA (2011) Nnscore 2.0: a neural-network receptor-ligand scoring function. J Chem Inf Model 51(11):2897–2903. https://doi.org/10.1021/ci2003889

Reynolds CH, Tounge BA, Bembenek SD (2008) Ligand binding efficiency: trends, physical basis, and implications. J Med Chem 51(8):2432–2438

Landrum G (2011) Getting started with the RDKit in Python. https://www.rdkit.org/docs/GettingStartedInPython.html

Bajusz D, Rácz A, Héberger K (2015) Why is Tanimoto index an appropriate choice for fingerprint-based similarity calculations? J Cheminform. https://doi.org/10.1186/s13321-015-0069-3

Shukla A, Pandey HM, Mehrotra D (2015) Comparative review of selection techniques in genetic algorithm. In: 2015 international conference on futuristic trends on computational analysis and knowledge management (ABLAZE) (February), pp 515–519. https://doi.org/10.1109/ABLAZE.2015.7154916

Berman HM, Battistuz T, Bhat TN, Bluhm WF, Bourne PE, Burkhardt K, Feng Z, Gilliland GL, Iype L, Jain S, Fagan P, Marvin J, Padilla D, Ravichandran V, Schneider B, Thanki N, Weissig H, Westbrook JD, Zardecki C (2002) The protein data bank. Acta Crystallogr Sect D Biol Crystallogr. https://doi.org/10.1107/S0907444902003451

Dolinsky TJ, Nielsen JE, McCammon JA, Baker NA (2004) Pdb2pqr: an automated pipeline for the setup of Poisson-Boltzmann electrostatics calculations. Nucl Acids Res 32(Web Server issue):665–667. https://doi.org/10.1093/nar/gkh381

Dolinsky TJ, Czodrowski P, Li H, Nielsen JE, Jensen JH, Klebe G, Baker NA (2007) Pdb2pqr: expanding and upgrading automated preparation of biomolecular structures for molecular simulations. Nucl Acids Res 35(Web Server issue):522–525. https://doi.org/10.1093/nar/gkm276

O’Boyle NM, Banck M, James CA, Morley C, Vandermeersch T, Hutchison GR (2011) Open babel: an open chemical toolbox. J Cheminform. https://doi.org/10.1186/1758-2946-3-33

Ropp P, Friedman A, Durrant JD (2017) Scoria: a Python module for manipulating 3D molecular data. J Cheminform. https://doi.org/10.1186/s13321-017-0237-8

Durrant JD (2018) Blendmol: advanced macromolecular visualization in blender. Bioinformatics 35(13):2323–2325. https://doi.org/10.1093/bioinformatics/bty968

Alvesalo JK, Siiskonen A, Vainio MJ, Tammela PS, Vuorela PM (2006) Similarity based virtual screening: a tool for targeted library design. J Med Chem 49(7):2353–2356

de Souza Neto LR, Moreira-Filho JT, Neves BJ, Maidana RLBR, Guimarães ACR, Furnham N, Andrade CH, Silva FP Jr (2020) In silico strategies to support fragment-to-lead optimization in drug discovery. Front Chem 8:93

Chen X, Lin Y, Liu M, Gilson MK (2002) The binding database: data management and interface design. Bioinformatics 18(1):130–139. https://doi.org/10.1093/bioinformatics/18.1.130

Liu T, Lin Y, Wen X, Jorissen RN, Gilson MK (2007) BindingDB: a web-accessible database of experimentally determined protein–ligand binding affinities. Nucl Acids Res 35(Database issue):198–201. https://doi.org/10.1093/nar/gkl999

Butina D (1999) Unsupervised data base clustering based on daylight’s fingerprint and tanimoto similarity: a fast and automated way to cluster small and large data sets. J Chem Inf Comput Sci 39(4):747–750

Wang Y, Xiao J, Suzek TO, Zhang J, Wang J, Bryant SH (2009) Pubchem: a public information system for analyzing bioactivities of small molecules. Nucl Acids Res 37(Web Server issue):623–33. https://doi.org/10.1093/nar/gkp456

Van Houten B, Santa-Gonzalez GA, Camargo M (2018) DNA repair after oxidative stress: current challenges. Curr Opin Toxicol 7:9–16. https://doi.org/10.1016/j.cotox.2017.10.009

Hegde ML, Hazra TK, Mitra S (2008) Early steps in the dna base excision/single-strand interruption repair pathway in mammalian cells. Cell Res 18(1):27

Hoeijmakers JH (2001) Genome maintenance mechanisms for preventing cancer. Nature 411(6835):366

Chang HH, Pannunzio NR, Adachi N, Lieber MR (2017) Non-homologous DNA end joining and alternative pathways to double-strand break repair. Nat Rev Mol Cell Biol 18(8):495

Couto CA-M, Wang H-Y, Green JCA, Kiely R, Siddaway R, Borer C, Pears CJ, Lakin ND (2011) PARP regulates nonhomologous end joining through retention of Ku at double-strand breaks. J Cell Biol 194(3):367–375. https://doi.org/10.1083/jcb.201012132

Mark M, Wendling O, Wynshaw-boris JMEA (2001) Early embryonic lethality in PARP-1 Atm double-mutant mice suggests a functional synergy in cell proliferation during development. Microbiology 21(5):1828–1832. https://doi.org/10.1128/MCB.21.5.1828

Ira G, Pellicioll A, Balijja A, Wang X, Florani S, Carotenuto W, Liberi G, Bressan D, Wan L, Hollingsworth NM, Haber JE, Folani M (2004) DNA end resection, homologous recombination and DNA damage checkpoint activation require CDK1. Nature 431(7011):1011–1017. https://doi.org/10.1038/nature02964

Alemasova EE, Lavrik OI (2019) Poly (ADP-ribosyl) ation by PARP1: reaction mechanism and regulatory proteins. Nucl Acids Res 47(8):3811–3827

Ghose AK, Viswanadhan VN, Wendoloski JJ (1999) A knowledge-based approach in designing combinatorial or medicinal chemistry libraries for drug discovery. J Comb Chem 1(1):55–68. https://doi.org/10.1021/cc9800071

Chang MW, Ayeni C, Breuer S, Torbett BE (2010) Virtual screening for HIV protease inhibitors: a comparison of AutoDock 4 and Vina. PLoS ONE. https://doi.org/10.1371/journal.pone.0011955

Brenk R, Schipani A, James D, Krasowski A, Gilbert IH, Frearson J, Wyatt PG (2008) Lessons learnt from assembling screening libraries for drug discovery for neglected diseases. ChemMedChem 3(3):435–444. https://doi.org/10.1002/cmdc.200700139

Casas N (2015) Genetic algorithms for multimodal optimization: a review

Hattori K, Kido Y, Yamamoto H, Ishida J, Kamijo K, Murano K, Ohkubo M, Kinoshita T, Iwashita A, Mihara K, Yamazaki S, Matsuoka N, Teramura Y, Miyake H (2004) Rational approaches to discovery of orally active and brain-penetrable quinazolinone inhibitors of poly(ADP-ribose)polymerase. J Med Chem 47(17):4151–4. https://doi.org/10.1021/jm0499256

Ye N, Chen C-H, Chen T, Song Z, He J-X, Huan X-J, Song S-S, Liu Q, Chen Y, Ding J, Xu Y, Miao Z-H, Zhang A (2013) Design, synthesis, and biological evaluation of a series of benzo[de][1,7]naphthyridin-7(8h)-ones bearing a functionalized longer chain appendage as novel parp1 inhibitors. J Med Chem 56(7):2885–903. https://doi.org/10.1021/jm301825t

Lindgren AEG, Karlberg T, Thorsell A-G, Hesse M, Spjut S, Ekblad T, Andersson CD, Pinto AF, Weigelt J, Hottiger MO, Linusson A, Elofsson M, Schüler H (2013) PARP inhibitor with selectivity toward ADP-ribosyltransferase ARTD3/PARP3. ACS Chem Biol 8(8):1698–703. https://doi.org/10.1021/cb4002014

Patel MR, Bhatt A, Steffen JD, Chergui A, Murai J, Pommier Y, Pascal JM, Trombetta LD, Fronczek FR, Talele TT (2014) Discovery and structure-activity relationship of novel 2,3-dihydrobenzofuran-7-carboxamide and 2,3-dihydrobenzofuran-3(2h)-one-7-carboxamide derivatives as poly(adp-ribose)polymerase-1 inhibitors. J Med Chem 57(13):5579–601. https://doi.org/10.1021/jm5002502

Aoyagi-Scharber M, Gardberg AS, Yip BK, Wang B, Shen Y, Fitzpatrick PA (2014) Structural basis for the inhibition of poly(adp-ribose) polymerases 1 and 2 by bmn 673, a potent inhibitor derived from dihydropyridophthalazinone. Acta Crystallogr F Struct Biol Commun 70(Pt 9):1143–9. https://doi.org/10.1107/S2053230X14015088

Papeo G, Posteri H, Borghi D, Busel AA, Caprera F, Casale E, Ciomei M, Cirla A, Corti E, D’Anello M, Fasolini M, Forte B, Galvani A, Isacchi A, Khvat A, Krasavin MY, Lupi R, Orsini P, Perego R, Pesenti E, Pezzetta D, Rainoldi S, Riccardi-Sirtori F, Scolaro A, Sola F, Zuccotto F, Felder ER, Donati D, Montagnoli A (2015) Discovery of 2-[1-(4,4-difluorocyclohexyl)piperidin-4-yl]-6-fluoro-3-oxo-2,3-dihydro-1h-isoindole-4-carboxamide (nms-p118): a potent, orally available, and highly selective PARP-1 inhibitor for cancer therapy. J Med Chem 58(17):6875–98. https://doi.org/10.1021/acs.jmedchem.5b00680

Fu L, Wang S, Wang X, Wang P, Zheng Y, Yao D, Guo M, Zhang L, Ouyang L (2016) Crystal structure-based discovery of a novel synthesized parp1 inhibitor (ol-1) with apoptosis-inducing mechanisms in triple-negative breast cancer. Sci Rep 6(1):3. https://doi.org/10.1038/s41598-016-0007-2

Chen X, Huan X, Liu Q, Wang Y, He Q, Tan C, Chen Y, Ding J, Xu Y, Miao Z, Yang C (2018) Design and synthesis of 2-(4,5,6,7-tetrahydrothienopyridin-2-yl)-benzoimidazole carboxamides as novel orally efficacious poly(ADP-ribose)polymerase (PARP) inhibitors. Eur J Med Chem 145:389–403. https://doi.org/10.1016/j.ejmech.2018.01.018

Velagapudi UK, Langelier M-F, Delgado-Martin C, Diolaiti ME, Bakker S, Ashworth A, Patel BA, Shao X, Pascal JM, Talele TT (2019) Design and synthesis of poly (ADP-ribose) polymerase inhibitors: impact of adenosine pocket-binding motif appendage to the 3-oxo-2, 3-dihydrobenzofuran-7-carboxamide on potency and selectivity. J Med Chem 62:5330–5357

Wahlberg E, Karlberg T, Kouznetsova E, Markova N, Macchiarulo A, Thorsell A-G, Pol E, Frostell Å, Ekblad T, Öncü D et al (2012) Family-wide chemical profiling and structural analysis of PARP and tankyrase inhibitors. Nat Biotechnol 30(3):283

Upton K, Meyers M, Thorsell A-G, Karlberg T, Holechek J, Lease R, Schey G, Wolf E, Lucente A, Schüler H et al (2017) Design and synthesis of potent inhibitors of the mono (ADP-ribosyl) transferase, PARP14. Bioorg Med Chem Lett 27(13):2907–2911

Jagtap PG, Southan GJ, Baloglu E, Ram S, Mabley JG, Marton A, Salzman A, Szabo C (2004) The discovery and synthesis of novel adenosine substituted 2, 3-dihydro-1h-isoindol-1-ones: potent inhibitors of poly (ADP-ribose) polymerase-1 (PARP-1). Bioorg Med Chem Lett 14(1):81–85

Jagtap P, Szabó C (2005) Poly (ADP-ribose) polymerase and the therapeutic effects of its inhibitors. Nat Rev Drug Discov 4(5):421

Tanimoto T (1957) IBM technical report series. Signaler

Lipinski CA, Lombardo F, Dominy BW, Feeney PJ (1997) Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv Drug Deliv Rev 23(1–3):3–25. https://doi.org/10.1016/S0169-409x(96)00423-1

Durrant JD, McCammon JA (2011) BINANA: a novel algorithm for ligand-binding characterization. J Mol Graph Model 29(6):888–893. https://doi.org/10.1016/j.jmgm.2011.01.004

Du Y, Yamaguchi H, Wei Y, Hsu JL, Wang HL, Hsu YH, Lin WC, Yu WH, Leonard PG, Lee GR, Chen MK, Nakai K, Hsu MC, Chen CT, Sun Y, Wu Y, Chang WC, Huang WC, Liu CL, Chang YC, Chen CH, Park M, Jones P, Hortobagyi GN, Hung MC (2016) Blocking c-Met-mediated PARP1 phosphorylation enhances anti-tumor effects of PARP inhibitors. Nat Med. https://doi.org/10.1038/nm.4032

Wang R, Gao Y, Lai L (2000) Ligbuilder: a multi-purpose program for structure-based drug design. J Mol Model 6(7):498

Yuan Y, Pei J, Lai L (2011) Ligbuilder 2: a practical de novo drug design approach. J Chem Inform Model 51(5):1083–1091

Yuan Y, Pei J, Lai L (2020) Ligbuilder v3: a multi-target de novo drug design approach. Front Chem 8:142

Li Y, Zhao Y, Liu Z, Wang R (2011) Automatic tailoring and transplanting: a practical method that makes virtual screening more useful. ACS Publications, Washington

Li Y, Zhao Z, Liu Z, Su M, Wang R (2016) Autot&t v.2: an efficient and versatile tool for lead structure generation and optimization. J Chem Inform Model 56(2):435–453

Pearce BC, Langley DR, Kang J, Huang H, Kulkarni A (2009) E-novo: an automated workflow for efficient structure-based lead optimization. J Chem Inform Model 49(7):1797–1809

Fechner U, Schneider G (2006) Flux (1): a virtual synthesis scheme for fragment-based de novo design. J Chem Inform Model 46(2):699–707

Schürer SC, Tyagi P, Muskal SM (2005) Prospective exploration of synthetically feasible, medicinally relevant chemical space. J Chem Inform Model 45(2):239–248

Moore JW (2005) Maximizing discovery efficiency with a computationally driven fragment approach. Curr Opin Drug Disco Dev 8(3):355–364

Brown N, McKay B, Gilardoni F, Gasteiger J (2004) A graph-based genetic algorithm and its application to the multiobjective evolution of median molecules. J Chem Inform Comput Sci 44(3):1079–1087

Pierce AC, Rao G, Bemis GW (2004) Breed: generating novel inhibitors through hybridization of known ligands. application to CDK2, p38, and HIV protease. J Med Chem 47(11):2768–2775

Stultz CM, Karplus M (2000) Dynamic ligand design and combinatorial optimization: designing inhibitors to endothiapepsin. Proteins Struct Funct Bioinform 40(2):258–289

Pearlman DA, Murcko MA (1996) Concerts: dynamic connection of fragments as an approach to de novo ligand design. J Med Chem 39(8):1651–1663

Clark DE, Frenkel D, Levy SA, Li J, Murray CW, Robson B, Waszkowycz B, Westhead DR (1995) Pro ligand: an approach to de novo molecular design. 1. Application to the design of organic molecules. J Comput Aided Mol Des 9(1):13–32

Roe DC, Kuntz ID (1995) Builder v.2: improving the chemistry of a de novo design strategy. J Comput Aided Mol Des 9(3):269–282

Bohm H-J (1992) The computer program ludi: a new method for the de novo design of enzyme inhibitors. J Comput Aided Mol Des 6(1):61

Bohm HJ (1992) LUDI: rule-based automatic design of new substituents for enzyme inhibitor leads. J Comput Aided Mol Des 6(6):593–606

Chu He (2019) MoleGear: a java-based platform for evolutionary de novo molecular design. Molecules 24(7):1444. https://doi.org/10.3390/molecules24071444

Morris GM, Ruth H, Lindstrom W, Sanner MF, Belew RK, Goodsell DS, Olson AJ (2009) AutoDock4 and AutoDockTools4: automated docking with selective receptor flexibility. J Comput Chem. https://doi.org/10.1002/jcc.21256

Allen WJ, Fochtman BC, Balius TE, Rizzo RC (2017) Customizable de novo design strategies for DOCK: application to HIVgp41 and other therapeutic targets. J Comput Chem 38(30):2641–2663. https://doi.org/10.1002/jcc.25052

Allen WJ, Balius TE, Mukherjee S, Brozell SR, Moustakas DT, Lang PT, Case DA, Kuntz ID, Rizzo RC (2015) DOCK 6: impact of new features and current docking performance. J Comput Chem 36(15):1132–1156. https://doi.org/10.1002/jcc.23905

Dey F, Caflisch A (2008) Fragment-based de novo ligand design by multi-objective evolutionary optimization. Supporting Information. J Chem Inf Model 48(3):679–690

Kolb P, Caflisch A (2006) Automatic and efficient decomposition of two-dimensional structures of small molecules for fragment-based high-throughput docking. J Med Chem 49(25):7384–7392

Majeux N, Scarsi M, Apostolakis J, Ehrhardt C, Caflisch A (1999) Exhaustive docking of molecular fragments with electrostatic solvation. Proteins Struct Funct Bioinform 37(1):88–105

Budin N, Majeux N, Caflisch A (2001) Fragment-based flexible ligand docking by evolutionary optimization. Biol Chem 382(9):1365–1372

Olivecrona M, Blaschke T, Engkvist O, Chen H (2017) Molecular de-novo design through deep reinforcement learning. J Cheminform 9(1):48. https://doi.org/10.1186/s13321-017-0235-x

Skalic M, Jiménez Luna J, Sabbadin D, De Fabritiis G (2019) Shape-based generative modeling for de-novo drug design. J Chem Inf Model. https://doi.org/10.1021/acs.jcim.8b00263

Ascher D, Dubois PF, Hinsen K, James JH, Oliphant T (1999) Numerical python, UCRL-MA-128569 edn. Lawrence Livermore National Laboratory, Livermore

Oliphant TE (2006) Guide to NumPy. Brigham Young University, Provo

Jones E, Oliphant T, Peterson P (2001) Others: SciPy: Open source scientific tools for python. http://www.scipy.org

Hunter JD (2007) Matplotlib: a 2D graphics environment. Comput Sci Eng 9(3):90

Dalcin L, Paz R, Storti M, D’Elia J (2008) MPI for python: performance improvements and MPI-2 extensions. J Parallel Distrib Comput 68(5):655–662. https://doi.org/10.1016/j.jpdc.2007.09.005

Van De Waterbeemd H, Camenisch G, Folkers G, Chretien JR, Raevsky OA (1998) Estimation of blood–brain barrier crossing of drugs using molecular size and shape, and H-bonding descriptors. J Drug Target 6(2):151–165. https://doi.org/10.1177/0004563215595431

Mozziconacci J, Arnoult E, Baurin N, Marot C, Morin-Allory L (2003) Preparation of a molecular database from a set of 2 million compounds for virtual screening applications: gathering, structural analysis and filtering. In: 9th electronic computational chemistry conference, World Wide Web

Jadhav A, Ferreira RS, Klumpp C, Mott BT, Austin CP, Inglese J, Thomas CJ, Maloney DJ, Shoichet BK, Simeonov A (2010) Quantitative analyses of aggregation, autofluorescence, and reactivity artifacts in a screen for inhibitors of a thiol protease. J Med Chem 53(1):37–51. https://doi.org/10.1021/jm901070c

Doveston RG, Tosatti P, Dow M, Foley DJ, Li HY, Campbell AJ, House D, Churcher I, Marsden SP, Nelson A (2015) A unified lead-oriented synthesis of over fifty molecular scaffolds. Org Biomol Chem 13(3):859–865. https://doi.org/10.1039/c4ob02287d

Baell JB, Holloway GA (2010) New substructure filters for removal of pan assay interference compounds (PAINS) from screening libraries and for their exclusion in bioassays. J Med Chem 53(7):2719–2740. https://doi.org/10.1021/jm901137j


MOL2 to PDBQT conversion via OpenBabel and MGLTools removes hydrogen atoms - Biology

a Molecular Biophysics Unit, Indian Institute of Science, Bengaluru 560012, India
E-mail: [email protected]

Résumé

The ongoing global pandemic of COVID-19 has brought life to almost a standstill with the implementation of lockdowns and social distancing as some of the preventive measures in the absence of any approved specific therapeutic interventions. To combat this crisis, research communities worldwide are falling back on the existing repertoire of approved/investigational drugs to probe into their anti-coronavirus properties. In this report, we describe our unique efforts in identifying potential drugs that could be repurposed against the main protease of SARS-CoV-2 (SARS-CoV-2 M pro ). To achieve this goal, we have primarily exploited the principles of ‘neighbourhood behaviour’ in the protein 3D (workflow-I) and chemical 2D structural space (workflow-II) coupled with docking simulations and insights into the possible modes of action of the selected candidates from the available literature. This integrative approach culminated in prioritizing 29 potential repurpose-able agents (20 approved drugs and 9 investigational molecules) against SARS-CoV-2 M pro . Apart from the approved/investigational anti-viral drugs, other notable hits include anti-bacterial, anti-inflammatory, anti-cancer and anti-coagulant drugs. Our analysis suggests that some of these drugs have the potential to simultaneously modulate the functions of viral proteins and the host response system. Interestingly, many of these identified candidates (12 molecules from workflow-I and several molecules, belonging to the chemical classes of alkaloids, tetracyclines, peptidomimetics, from workflow-II) are suggested to possess anti-viral properties, which is supported by laboratory and clinical data. Furthermore, this work opens a new avenue of research to probe into the molecular mechanism of action of many drugs, which are known to demonstrate anti-viral activity but are so far not known to target viral proteases.


Databases handling

    . Relational database management system (RDBMS) data cartridge that provides fast, scalable, and efficient storage and searching solution for chemical information.Bingo intègre la chimie dans les bases de données Oracle, Microsoft SQL Server et PostgreSQL. Son indexation extensible est conçue pour permettre aux scientifiques de stocker, d'indexer et de rechercher des fragments chimiques avec des nombres et du texte dans un serveur de base de données relationnelle sous-jacent. Logiciel gratuit. Distribué par le logiciel GGA. . Intègre des capacités de gestion et de visualisation des structures dans un environnement Microsoft Excel. Les structures sont entièrement prises en charge dans les feuilles de calcul et peuvent être visualisées, modifiées, recherchées, redimensionnées, ordonnées, gérées. Fourni par ChemAxon. . Utilitaire basé sur Indigo pour trouver des doublons et comparer visuellement deux fichiers contenant plusieurs structures. Les formats d'entrée SDF, SMILES, CML, MOLFILE sont pris en charge. Les fichiers peuvent contenir une grande quantité de molécules et ChemDiff a été testé sur des fichiers contenant jusqu'à 1 million de molécules. Gratuit et open source. Distribué par le logiciel GGA.

Résumé

La découverte de médicaments en termes simples consiste à trouver de petits composés moléculaires qui possèdent le potentiel d'interagir avec des bio-macromolécules spécifiques, principalement des protéines, apportant ainsi un effet souhaité sur le fonctionnement des molécules cibles. Le criblage virtuel de grandes bibliothèques de composés à l'aide d'approches informatiques est devenu une excellente alternative au criblage à haut débit coûteux et laborieux effectué dans les laboratoires. Le criblage virtuel à haut débit réduit considérablement le nombre de composés à analyser systématiquement à l'aide de tests biochimiques avant d'entrer dans les essais cliniques. Ici, nous donnons d'abord un bref aperçu de la justification du criblage virtuel, des types de criblage virtuel - criblage virtuel basé sur la structure, à base de ligand et inverse, et des défis qui doivent être relevés pour améliorer les stratégies existantes. Par la suite, nous décrivons la méthodologie adoptée pour le criblage virtuel de petites molécules, peptides et protéines. Enfin, nous utilisons quelques études de cas pour mieux comprendre l'application du criblage à haut débit assisté par ordinateur.


Voir la vidéo: AutoDock Tutorial - The best free software for molecular docking Free Tutorial (Décembre 2022).