Prédictions fiables de la structure cristalline à partir des premiers principes

Nouvelles

MaisonMaison / Nouvelles / Prédictions fiables de la structure cristalline à partir des premiers principes

Apr 26, 2023

Prédictions fiables de la structure cristalline à partir des premiers principes

Volume Communication Nature

Nature Communications volume 13, Numéro d'article : 3095 (2022) Citer cet article

3507 accès

8 Citations

8 Altmétrique

Détails des métriques

Une méthode peu coûteuse et fiable pour les prédictions de la structure cristalline moléculaire (CSP) a été développée. Le nouveau protocole CSP part d'un graphique bidimensionnel du ou des monomères de cristal et n'utilise aucune information expérimentale. En utilisant les résultats des calculs de mécanique quantique pour les dimères moléculaires, un champ de force ab initio (aiFF) précis à deux corps et à monomère rigide pour le cristal est développé. Étant donné que les CSP avec aiFF sont essentiellement aussi coûteux qu'avec les FF empiriques, des dizaines de milliers de polymorphes plausibles générés par les procédures d'emballage cristallin peuvent être optimisés. Ici, nous montrons la robustesse de ce protocole qui a trouvé le cristal expérimental dans les 20 polymorphes prédits les plus stables pour chacune des 15 molécules étudiées. Le classement a été encore affiné en effectuant des calculs périodiques de la théorie fonctionnelle de la densité (DFT) plus la correction de la dispersion (pDFT + D) pour ces 20 polymorphes les mieux classés, ce qui a permis au cristal expérimental de se classer numéro un pour tous les systèmes étudiés (et le deuxième polymorphe, s'il est connu, classé parmi les premiers). Alternativement, les polymorphes générés peuvent être utilisés pour améliorer les aiFF, ce qui conduit également à des prédictions de rang un. Le protocole CSP proposé devrait aboutir à ce que les aiFF remplacent les FF empiriques dans la recherche CSP.

Les propriétés des solides cristallins dépendent essentiellement de la forme polymorphe d'une substance donnée et de nombreux cristaux peuvent exister sous plusieurs de ces formes1,2. La connaissance des formes polymorphes stables possibles d'un cristal est d'une importance particulière pour l'industrie pharmaceutique3. Si un polymorphe différent de celui obtenu en laboratoire cristallise lors de la fabrication d'un médicament, il aura des propriétés physico-chimiques différentes et pourra entraîner des effets thérapeutiques indésirables, deux exemples sont le ritonavir4,5 et la rotigotine6,7,8. Ainsi, dans le processus de développement de médicaments, on aimerait savoir si le polymorphe utilisé est thermodynamiquement la forme la plus stable dans les conditions ambiantes. Dans l'industrie de la défense, les développements de matériaux énergétiques sont coûteux et très dangereux9,10 et la connaissance a priori de la structure cristalline des matériaux notionnels permettrait d'accélérer le criblage de ces matériaux. L'industrie des semi-conducteurs peut également bénéficier de ces connaissances11. Les méthodes CSP répondent à ces besoins en trouvant un ensemble de polymorphes cristallins les plus stables d'une molécule donnée à partir de son diagramme bidimensionnel et en n'utilisant aucune information expérimentale spécifique à cette molécule.

Des CSP fiables pour les cristaux moléculaires à partir de la connaissance des seuls diagrammes bidimensionnels de monomère(s) ont été presque impossibles pendant longtemps. En 1988, Maddox12 a décrit l'échec des CSP comme un scandale continu dans les sciences physiques et a déclaré qu'en général, même les solides cristallins les plus simples posaient un grand défi. Au milieu des années 1990, Gavezzotti13 a posé la question fondamentale : « Les structures cristallines sont-elles prévisibles ? », et sa réponse a été « Non ». En réponse à cette critique, le Cambridge Crystallographic Data Center (CCDC) a mené une série de tests "en aveugle"14,15,16,17,18,19 en ne fournissant que des diagrammes bidimensionnels de monomères de cristaux qui ont été mesurés mais non publiés et demander à des groupes de recherche de soumettre leurs prédictions, avec les résultats du premier test publiés en 2000. Si le domaine a bien avancé depuis le premier test, les résultats du dernier, 6ème test19 ne sont toujours pas tout à fait satisfaisants. Les groupes participants ont atteint un taux de réussite compris entre 13% et 57% (sans compter les polymorphes C et E du système XXIII), où le succès signifie que le polymorphe expérimental a été trouvé parmi les polymorphes sur deux listes contenant 100 polymorphes chacune.

Il faut remarquer ici que les prédictions des structures des cristaux sont en fait un problème difficile pour la science physique, contrairement à ce que Maddox12 sous-entendait. La raison en est la haute dimensionnalité de l'espace conformationnel et cristallographique résultant en des milliers de polymorphes plausibles produits par échantillonnage de cet espace dans une fenêtre relativement étroite d'énergies et de densités de réseau. Les distances énergétiques entre les polymorphes consécutifs ordonnés par l'énergie du réseau sont de l'ordre de 1 kJ/mol à l'extrémité basse énergie, ce qui nécessite des précisions presque impossibles à atteindre par des FF empiriques. De plus, pour les polymorphes observés expérimentalement, les différences entre leurs énergies de réseau calculées sont du même ordre20.

Bien qu'il existe plusieurs variantes de CSP, y compris une utilisation récente des réseaux de neurones profonds21, la majorité des groupes participant au 6e test en aveugle ont utilisé une forme de FF, principalement de caractère empirique. Le protocole CSP le plus réussi consistant en un échantillonnage dans l'espace polymorphe plus une minimisation de l'énergie du réseau a été développé par Neumann et al.22,23. Ce protocole utilise un FF sur mesure qui est obtenu en affinant les paramètres d'un FF empirique pour reproduire au plus près les énergies de réseau pDFT + D (et leurs dérivés). Les polymorphes initiaux pour les calculs pDFT + D sont obtenus à l'aide du FF empirique. La méthode est incluse dans le progiciel commercial GRACE (Generation Ranking and Characterization Engine)24, mais certains de ses détails ne sont pas disponibles. Des revues récentes du domaine des CSP peuvent être trouvées dans les réf. 25,26,27,28,29,30,31.

Dans le présent travail, un protocole CSP est proposé entièrement basé sur les premiers principes, c'est-à-dire n'utilisant aucune information expérimentale. Puisque la principale caractéristique de cette méthode est l'utilisation d'aiFFs, nous l'appellerons le protocole CSP(aiFF). Ce protocole se compose de plusieurs étapes illustrées à la Fig. 1. Bien que les aiFF soient utilisés dans les CSP depuis un certain temps19,32,33,34, de telles prédictions prenaient beaucoup de temps (plusieurs mois au minimum), nécessitaient d'énormes efforts humains , et étaient possibles pour les monomères contenant jusqu'à environ 20 atomes. Dans le présent travail, quatre développements récents sont combinés pour réduire considérablement les coûts et augmenter la prévisibilité de ces CSP : (a) Le développement d'une variante très efficace35 de la théorie des perturbations adaptées à la symétrie (SAPT)36 pour les calculs ab initio des énergies d'interaction ; (b) La création d'autoPES37,38 : une méthode automatique, efficace et fiable pour la génération de surfaces d'énergie potentielle (PES) avec une implication humaine minimale ; (c) Permettre l'utilisation de ces aiFF dans l'étape de minimisation de l'énergie du réseau des CSP, une partie du présent travail ; ( d ) L'application de pDFT + D pour un raffinement final des classements polymorphes. L'étape 3 de la figure 1 peut produire même des millions de polymorphes à faible coût et l'expérience passée indique que les polymorphes expérimentalement pertinents sont presque toujours parmi eux. Ainsi, l'essence des protocoles CSP est de filtrer tous les polymorphes pertinents à faible énergie de réseau hors de cet ensemble. Au cours des dernières années, plusieurs groupes ont démontré que l'optimisation de la géométrie pDFT + D des polymorphes place le polymorphe expérimental parmi les premiers, souvent numéro un19,39,40,41. Cependant, de tels calculs sont si coûteux qu'ils ne peuvent être supportés que pour une centaine de polymorphes. En revanche, si un FF est utilisé à l'étape 4, des dizaines de milliers de polymorphes peuvent être optimisés. Ce FF doit être suffisamment précis pour ne manquer aucun polymorphe important. Ainsi, la méthode ab initio et l'ajustement aux énergies d'interaction calculées à l'aide de cette méthode doivent avoir des incertitudes suffisamment petites. Dans les calculs des énergies d'interaction des dimères, la variante de SAPT que nous utilisons (voir "Méthodes") est presque aussi précise35,42,43 que la méthode des clusters couplés avec des excitations simples, doubles et triples non itératives, CCSD(T), la " méthode de référence de la théorie de la structure électronique, mais elle est nettement moins coûteuse. Pour éviter une perte de précision due à l'ajustement, la forme de la fonction d'ajustement doit être beaucoup plus impliquée que celles des FF empiriques qui sont généralement construites à partir de potentiels de Lennard-Jones plus Coulomb, voir "Méthodes". La forme étendue peut ajuster des données ab initio avec des incertitudes d'environ 1 kJ/mol, ce que nous montrerons comme étant suffisant pour des CSP fiables. Une telle forme n'a jamais été utilisée dans les minimisations d'énergie de réseau et nous avons dû modifier le logiciel CSP pour le rendre possible. Enfin, pour rendre l'étape 2 abordable, le nombre de points de grille ab initio nécessaires pour ajuster un aiFF doit être raisonnablement petit. La méthode autoPES37,38 réduit ce nombre de deux ordres de grandeur par rapport aux approches typiques d'ajustement de surface, réduisant ainsi les coûts de développement du même ratio. Cela réduit également la quantité d'implication humaine presque à zéro car l'ensemble du processus est entièrement automatisé. Nous montrons ci-dessous que le protocole proposé a trouvé le cristal expérimental classé numéro un pour les 15 molécules étudiées (et le deuxième polymorphe, s'il est connu, classé parmi les premiers).

Étape 1 : minimisation de l'énergie du monomère pour trouver la géométrie d'équilibre. Étape 2 : calculs ab initio des énergies d'interaction intermoléculaires des dimères suivis de l'ajustement d'une forme analytique d'aiFF à ces données. Étape 3: génération de millions d'arrangements plausibles de polymorphes en échantillonnant différents groupes spatiaux, orientations de monomères et paramètres de cellule unitaire, suivi d'une réduction de cet ensemble à des dizaines de milliers de polymorphes en utilisant des critères de densité ou des minimisations d'énergie de réseau brutes avec de simples FF. Étape 4 : minimisation fine avec aiFFs pour tous les polymorphes de l'ensemble réduit. Étape 5 : affinement du classement via des calculs pDFT+D sur quelques dizaines de polymorphes les mieux classés de l'étape 4.

Pour évaluer les performances de notre méthode, nous avons réalisé des CSP pour 15 molécules dont plusieurs systèmes issus des blind tests du CCDC14,15,16,17,18,19 (désignés par des chiffres romains), ainsi que pour le méthanol, le benzène, le nitrométhane, 5,5′-dinitro-2H, 2′H-3,3′-bi-1,2,4-triazole (DNBT), 1-3-5-trinitrobenzène (TNB), défériprone et fluorouracile. Les graphiques moléculaires sont présentés dans la Fig. 1 supplémentaire. Les résultats sont résumés dans le tableau 1. Une version étendue de ce tableau est disponible dans le tableau supplémentaire 1.

Le protocole CSP(aiFF) a classé le polymorphe expérimental comme numéro 1 dans 5 cas, comme numéro 2-6 dans 7 cas, et comme numéros 9, 9 et 16. Nous avons également inclus un deuxième polymorphe identifié expérimentalement dans les cas de système I, benzène et défériprone, désignés par "Poly2" dans le tableau 1, et ceux-ci sont classés respectivement par les numéros 8, 4 et 8. Après des calculs pDFT + D sur les 20 polymorphes les mieux classés de chaque cristal, sans autre optimisation de la géométrie, un cristal expérimental est devenu numéro 1 dans chaque cas. Pour la défériprone, c'est Poly2 qui est devenu le polymorphe de rang 1, tandis que Poly1 est resté au rang 2. Pour le système I et le benzène, Poly2 a changé de rang de 8 à 2 et de 4 à 3, respectivement. Les RMSD20 entre les cristaux calculés et expérimentaux varient entre 0,09 et 0,67 Å, ​​en dessous du seuil CCDC de 0,8 Å. De plus, les densités et les paramètres cellulaires, indiqués dans le tableau supplémentaire 1, concordent très étroitement. La Fig. 2 supplémentaire affiche les écarts en pourcentage entre les paramètres de réseau calculés et expérimentaux. Les erreurs moyennes pour les paramètres de cellule a, b, c et β s'élèvent à 4,3 %, 2,6 %, 4,3 % et 2,4 %, respectivement. Un tel niveau de prédictivité est sans précédent pour un protocole CSP entièrement basé sur les premiers principes. Les chevauchements des polymorphes expérimentaux avec les plus proches calculés sont illustrés à la Fig. 2. Cette figure permet une appréciation intuitive de la proximité de ces structures. Cette performance exceptionnelle de CSP(aiFF) a été obtenue malgré les systèmes étudiés présentant des difficultés typiques dues à la proximité des énergies de réseau des polymorphes et malgré l'utilisation d'une approximation de monomère rigide. Les paysages d'énergie de réseau par rapport à la densité des minimisations aiFF pour les systèmes IV et XXII sont présentés dans la Fig. 3 supplémentaire. Des graphiques analogues pour les autres systèmes se ressemblent. Les 100 polymorphes à plus faible énergie répartissaient dans la plage d'environ 5 kJ/mol pour les systèmes I, XII, XIII, le benzène et le nitrométhane, d'environ 10 kJ/mol pour les systèmes II, IV, VIII, XVI, XXII, le méthanol, le TNB, la défériprone , et le fluorouracile, et environ 20 kJ/mol pour le DNBT. À l'extrémité basse énergie, les différences d'énergie entre les polymorphes consécutifs sont inférieures à 1 kJ / mol, c'est-à-dire comparables aux RMSE des ajustements sur toutes les configurations de dimères avec des énergies d'interaction négatives, présentées dans le tableau 1.

Chevauchement de la structure cristalline expérimentale (couleurs spécifiques à l'élément) avec la structure cristalline calculée la plus proche (vert) à l'aide des aiFF basés sur SAPT (DFT) pour les systèmes : a et b I, c II, d IV, e VIII, f XII, g XIII, h XVI, i XXII, j méthanol, k et l benzène, m nitrométhane, n DNBT, o TNB, p et q défériprone, r fluorouracile.

L'utilisation de la forme fonctionnelle étendue des aiFF dans les minimisations d'énergie du réseau au lieu de la forme exp-6-1 plus simple (n'incluant pas un polynôme devant les exponentielles, les fonctions d'amortissement, etc., voir "Méthodes") utilisée dans certains FF empiriques conduit à d'énormes améliorations dans les classements. Pour quantifier ces améliorations, nous avons effectué des minimisations d'énergie de réseau avec la forme exp-6-1 des aiFF, ajustées en utilisant le même niveau de théorie que dans le cas de la forme étendue, pour les systèmes I, II, IV et XXII, obtenant les classements de 138, 2231, 49 et 60, respectivement, alors que les classements de la forme aiFF étendue pour ces systèmes sont 1 ou 2, voir le tableau 1. La principale raison de cette amélioration est que les RMSE pour les énergies d'interaction négatives sont de 2,3 à 5,3 fois plus petit dans ce dernier cas (ces rapports sont corrélés avec le nombre de paramètres d'ajustement : par exemple, 30 et 270 pour l'exp-6-1 et la forme étendue, respectivement, dans le cas du système IV).

Afin de mieux quantifier le pouvoir prédictif de notre approche, des calculs analogues à ceux décrits ci-dessus ont été effectués avec un FF empirique. Nous avons choisi le W99 FF44 avec des charges ponctuelles calculées par nos soins selon la méthode CHELPG45. Pour les 18 polymorphes expérimentaux considérés, le FF W99+charges en a trouvé 33 % au rang 10 ou mieux, tandis que le résultat analogue pour aiFF (sans l'étape pDFT+D) est de 94 %. Cela équivaut à une différence qualitative pour les applications technologiques. Pour plus de détails sur les CSP avec le W99+charges FF, voir les tableaux supplémentaires 1 et 2.

On peut se demander pourquoi les calculs pDFT+D sont nécessaires pour améliorer les classements, alors que plusieurs comparaisons sur les énergies d'interaction de référence, voir, par exemple, refs. 42,43, montrent que SAPT(DFT) est presque aussi précis que CCSD(T) et plus précis que les méthodes DFT+D. La raison principale est que ce qui est utilisé dans les CSP sont des aiFF, et ils incluent des incertitudes supplémentaires dues à l'ajustement. Bien que l'erreur d'ajustement moyenne pour les énergies d'interaction négatives ne soit que d'environ 1 kJ/mol, les erreurs peuvent être plus importantes dans certaines configurations. Si une configuration avec une énergie d'interaction trop négative est importante pour un polymorphe, ce polymorphe peut devenir trop stable et donc trop haut classé. Deux autres raisons possibles, la taille de l'ensemble de base et la négligence des effets à plusieurs corps dans CSP (aiFF), sont discutées dans les informations supplémentaires et il est peu probable qu'elles soient une raison. Pour améliorer les prédictions de l'étape 4, nous avons développé une version alternative de notre méthode, alt-CSP(aiFF). Après avoir exécuté le protocole CSP(aiFF) moins l'étape pDFT+D, les géométries de 20 polymorphes avec les énergies de réseau les plus basses sont examinées et les dimères voisins les plus proches consécutifs sont identifiés. Ensuite, les calculs SAPT sont effectués pour ces dimères, l'aiFF est réajusté et les minimisations de réseau pour les 20 polymorphes sont effectuées avec le nouvel aiFF. Cette procédure est itérée jusqu'à ce que les énergies des clusters 5x5x5 extraits de chaque polymorphe calculé de deux manières : uniquement à partir de l'aiFF et de manière hybride, en remplaçant les énergies d'interaction de l'aiFF par celles de SAPT disponibles, soient les mêmes à un certain seuil près. Nous avons appliqué alt-CSP(aiFF) à deux des cristaux les moins bien classés du tableau 1 : le système XVI (rang 16) et le fluorouracile (rang 9). Dans chaque cas, alt-CSP(aiFF) a entraîné le polymorphe expérimental au rang 1, tandis que RMSD20 a été réduit de 0,29 à 0,15 Å et de 0,61 à 0,42 Å, respectivement. Ainsi, alt-CSP(aiFF) peut être utilisé sans le stade pDFT+D. Cependant, les calculs ab initio supplémentaires sont à peu près aussi coûteux que ceux de pDFT+D, il n'y a donc pas de gain en termes d'efficacité.

La méthode proposée est non seulement très fiable, comme indiqué ci-dessus, mais également très efficace par rapport aux autres moyens de combiner des CSP basés sur FF avec des calculs pDFT + D. Pour le démontrer, nous montrons sur la Fig. 3 les coûts de trois stratégies CSP possibles en termes de temps de paroi monocœur sur l'exemple du système I. Notez que ce type de calculs est généralement effectué sur des centaines de cœurs, de sorte que la paroi réelle le temps n'est que de quelques heures pour la stratégie 1, l'approche proposée ici. La majorité du temps pour la stratégie 1, 7 jours-cœur, est consacrée au développement d'un aiFF et la majeure partie de ce temps est utilisée pour calculer les énergies d'interaction SAPT (DFT) pour 706 configurations de dimères, avec très peu de temps consacré à l'ajustement de ces énergies . L'étape suivante, le compactage et la minimisation (PACK+MIN) de centaines de milliers de cristaux, ne nécessite que moins d'un tiers de journée. La dernière étape, les calculs pDFT + D pour les 20 premiers polymorphes aux géométries aiFF, nécessite environ une journée. La stratégie hypothétique 2 diffère de la stratégie 1 par l'utilisation d'un FF empirique dans l'étape PACK+MIN et par la réalisation de calculs pDFT+D pour 100 polymorphes avec réoptimisation des géométries (ce nombre de polymorphes a été choisi comme un compromis entre taux de réussite et coûts de calcul). Le temps requis pour la dernière étape serait de 70 jours-cœur, donc la stratégie 2 est environ un ordre de grandeur plus cher que la stratégie 1. De plus, si le FF W99+charges était utilisé, le taux de réussite de la stratégie 2 sur l'ensemble des 18 polymorphes examinés ici seraient de 72 % (voir le tableau supplémentaire 2), tandis que le taux de réussite de la stratégie 1 est déjà de 100 % avec 16 polymorphes les mieux classés. Toutes les barres PACK+MIN semblent avoir à peu près la même hauteur pour aiFF et pour le FF empirique. En effet, le calcul de l'énergie du réseau n'est qu'environ deux fois plus coûteux dans le premier cas. La stratégie hypothétique 3 effectue des calculs pDFT + D avec optimisation de la géométrie pour les 25 500 polymorphes produits par PACK + MIN. Cette stratégie aurait une fiabilité très élevée (puisque la pratique indique que les polymorphes expérimentaux sont presque toujours inclus dans un si grand pool de structures candidates), mais elle serait extrêmement coûteuse, 49 ans monocœur, et donc pas pratique (bien que possible si quelques milliers de cœurs étaient utilisés). Avec l'utilisation d'un FF empirique, on peut définir le nombre de polymorphes inclus dans l'étape pDFT + D entre 100 et 25 000, augmentant systématiquement les coûts et la fiabilité par rapport à la stratégie 2. Cependant, avec W99 + charges et notre ensemble de polymorphes, le taux de réussite resterait à 72 % jusqu'à ce que le nombre de polymorphes soit au moins égal à 589. Pour les stratégies 2 et 3, l'étape PACK+MIN peut être remplacée par tout autre protocole produisant le nombre requis de polymorphes candidats, avec des effets non significatifs sur le total horaires.

Temps d'arrêt total requis pour les CSP du système I sur un seul cœur du processeur Intel E5-2670 utilisant différentes stratégies. Les rangées "aiFF", "PACK+MIN" et "pDFT+D" indiquent les temps de développement, d'emballage et de minimisation d'un aiFF, et de calculs DFT+D périodiques.

Étant donné que les aiFF sont des sommes d'interactions à deux corps, ils négligent les effets à plusieurs corps mentionnés précédemment et discutés dans les informations supplémentaires. Bien que nous montrons que ces effets ne sont pas critiques dans les CSP pour les cristaux considérés ici, ils peuvent être significatifs pour certains autres cristaux46,47,48. L'effet à plusieurs corps le plus important, la polarisation à plusieurs corps, peut être pris en compte à l'aide d'aiFF polarisables qui peuvent être développés à l'aide d'autoPES, mais qui ne sont pas encore implémentés dans nos codes CSP. Dans les informations supplémentaires, nous expliquons également pourquoi l'ensemble de base relativement petit que nous avons utilisé est adéquat pour les CSP. Un effet négligé beaucoup plus important est la flexibilité des monomères. Bien que les monomères considérés par nous aient été supposés rigides, le protocole CSP(aiFF) proposé peut être appliqué aux monomères avec des degrés de liberté doux. De tels monomères peuvent être considérablement déformés dans les cristaux par rapport à leurs structures d'équilibre en phase gazeuse. La version récente d'autoPES38 a la capacité de calculer les énergies d'interaction en tenant compte de tous les degrés de liberté intramonomère ou de certains degrés de liberté sélectionnés et la plupart des codes CSP peuvent effectuer un compactage et une minimisation incluant tous les degrés de liberté. Par conséquent, de telles prédictions peuvent être faites encore complètement à partir des premiers principes. Cependant, les coûts de tels calculs augmentent fortement avec le nombre total de degrés de liberté. Une façon de contourner ce problème consiste à supposer la séparation des degrés de liberté inter- et intramonomère à l'étape 2, comme cela a été fait dans tous les FF biomoléculaires et dans tous les FF utilisés dans les CSP à monomères flexibles. Étant donné que nos aiFF ne dépendent que des séparations entre atomes de différents monomères, les énergies d'interaction peuvent être calculées pour des configurations de monomères arbitraires. Un tel intermonomère FF "flexibilisé" peut remplacer le composant intermonomère des FF empiriques actuels, tandis que le composant intramonomère peut être conservé inchangé. On peut s'attendre à ce qu'un tel remplacement conduise à de meilleures prédictions dans les CSP à monomère flexible.

D'autres effets négligés par la version actuelle de CSP(aiFF) sont thermiques et entropiques, car les résultats que nous présentons correspondent à une température de 0 K. Pour certains cristaux, ces effets peuvent modifier le classement des polymorphes, comme l'ont souligné Brandenburg et Grimme39 et récemment étudié de manière approfondie par Hoja et al.41. Les effets thermiques et entropiques peuvent être calculés de manière routinière en utilisant pDFT+D, bien que de tels calculs soient plusieurs fois plus chers que les calculs pDFT+D avec des géométries statiques. À titre de test, nous avons calculé les deux effets pour les 5 polymorphes d'énergie de réseau les plus bas du système XXII, ne conduisant à aucun changement de classement.

La méthode CSP(aiFF) des premiers principes développée ici a été appliquée à des cristaux de 15 molécules rigides avec 18 polymorphes expérimentaux connus. Lorsque les aiFF sont appliqués dans les CSP pour les cristaux de ces molécules, 17 ou 94 % des polymorphes sont classés dans la plage de 1 à 10, tandis que le dernier a le rang 16. À titre de comparaison, les CSP analogues avec les charges empiriques W99 + FF se classent seulement 33 % de polymorphes dans la plage de 1 à 10, 3 polymorphes expérimentaux ne sont pas trouvés dans 568 ou plus générés, et pour deux molécules, les prédictions n'étaient pas possibles en raison de types d'atomes manquants. La capacité de CSP(aiFF) à minimiser des dizaines de milliers de polymorphes est son principal avantage par rapport aux approches alternatives qui doivent utiliser des méthodes de faible précision à ce stade, conduisant souvent à tort à l'abandon des structures correctes. Lors d'un reclassement ultérieur des 20 premiers polymorphes avec des calculs pDFT + D à des géométries aiFF fixes, pour les 15 molécules, un polymorphe expérimental a été classé numéro 1, tandis que les seconds polymorphes ont été classés numéros 2, 2 et 3. Le pDFT + L'étape D peut être omise si les aiFF sont améliorés de manière itérative en effectuant des calculs ab initio sur des dimères extraits de cristaux prédits avec l'itération précédente d'un aiFF [le protocole alt-CSP(aiFF)]. Le protocole CSP proposé montre non seulement une puissance prédictive ultime pour les systèmes testés, mais est également peu coûteux par rapport à d'autres approches hautement prédictives. Sur une centaine de cœurs, les prédictions complètes pour l'un des systèmes étudiés ici prennent moins d'une journée, y compris la génération aiFF. Le protocole CSP(aiFF) nécessite une implication humaine minimale, consistant uniquement en la préparation des entrées pour les calculs autoPES, UPACK et pDFT+D, et ne comprend que des logiciels libres avec des codes open source. Les limites de la mise en œuvre actuelle de la méthodologie CSP(aiFF) ont été discutées, en particulier la négligence des interactions à plusieurs corps et l'approximation des monomères rigides. Bien que l'ensemble de test ne comprenne que des cristaux homogènes, il n'y a aucune raison de douter que la méthode fonctionnera aussi bien pour les cocristaux comprenant des sels puisque la qualité des aiFF ne dépend pas du fait que les dimères soient homogènes ou hétérogènes (bien sûr, pour les cocristaux à deux composants, trois PSE doivent être développés). De plus, alors que la plus grande des molécules testées comprenait 22 atomes, la méthode devrait s'appliquer également aux molécules plus grosses puisque la précision relative de SAPT(DFT) ne change pas avec la taille du système35. Bien sûr, les calculs seront plus coûteux à mesure que la taille augmente, mais des molécules d'environ 100 atomes sont à portée de main. L'efficacité du protocole CSP proposé est due à l'utilisation de la méthode SAPT (DFT) qui est efficace en termes de calcul par rapport à d'autres méthodes de structure électronique précises et à l'utilisation de la méthode autoPES pour l'ajustement des aiFF puisque cette méthode réduit non seulement les coûts de tels ajustements par ordre de grandeur, mais réduit également presque à zéro l'effort humain de cette étape la plus difficile à automatiser. Un élément important du protocole CSP(aiFF) est qu'il remplace les formes potentielles simples utilisées dans tous les protocoles CSP antérieurs par une forme étendue capable d'ajuster les énergies d'interaction ab initio avec des incertitudes considérablement réduites. Un avantage du protocole proposé est qu'il constitue une procédure complète de premiers principes pour étudier les structures et les propriétés cristallines. Un tel protocole devrait fonctionner aussi bien pour tout type de monomère, contrairement aux protocoles utilisant des FF empiriques, qui ne devraient bien fonctionner que pour des systèmes similaires à ceux utilisés pour l'ajustement de ces FF. Nous pensons que l'effet global du protocole CSP proposé sera que le domaine des CSP passera de l'utilisation de FF empiriques à des aiFF. Cela devrait accroître la fiabilité des prédictions et, par conséquent, bien que les CSP aient joué jusqu'à présent le meilleur rôle de conseil dans les développements technologiques, ils pourraient devenir un élément de premier plan dans le développement de nouveaux matériaux cristallins. Plus généralement, les aiFF peuvent être utilisés dans plusieurs types de conception de matériaux informatiques.

À l'étape 1, les géométries des monomères ont été optimisées à l'aide d'ORCA49,50 avec la fonction PBE51 et la correction D352 dans l'ensemble de base aug-cc-pVTZ53.

Pour rendre le protocole CSP (aiFF) pratique, les aiFF doivent être construits à l'étape 2 à des coûts raisonnablement bas, mais en même temps avec de petites incertitudes, pour des monomères avec des dizaines d'atomes. Cela nécessite d'abord que la méthode ab initio utilisée pour calculer les énergies d'interaction intermoléculaire soit peu coûteuse et précise. Il apparaît que le meilleur choix actuel pour de tels calculs est SAPT36,54, une méthode ab initio qui calcule directement les énergies d'interaction, en partant de monomères isolés et en imposant la bonne symétrie permutationnelle électronique. Nous avons appliqué la variante SAPT basée sur DFT, SAPT(DFT)55,56, voir réf. 35 pour une revue récente de cette méthode. Les calculs SAPT(DFT) et CCSD(T) s'échelonnent comme \({{{{{{\mathcal{O}}}}}}}}({n}^{5})\) et \({{{ {{{{\mathcal{O}}}}}}}}({n}^{7})\) avec la taille du système, respectivement, où n est le nombre d'électrons, et pour les dimères avec quelques dizaines d'atomes , les calculs SAPT(DFT) sont environ deux ordres de grandeur moins chers que les calculs CCSD(T). Les nouveaux algorithmes SAPT (DFT) récemment développés et les codes informatiques efficaces35,42 peuvent être utilisés pour calculer des milliers de points de grille pour les dimères avec des monomères d'environ 100 atomes en utilisant des ressources informatiques raisonnables et en étant capable d'y parvenir en quelques jours si un nombre suffisant de cœurs informatiques sont disponibles.

Les détails des calculs des énergies d'interaction SAPT(DFT)55,56,57,58 de premier et de second ordre sont les suivants. Nous avons utilisé la version Density-fitting35,59,60 dans les codes SAPT202061 interfacés avec le package ORCA49,50 pour les calculs sur les monomères. La fonctionnelle PBE51 a été utilisée dans les calculs DFT en appliquant la correction asymptotique régulée par le gradient (GRAC)62,63. L'ensemble de base aug-cc-pVDZ53 plus un ensemble de fonctions midbond 3s3p2d2f (autoPES par défaut) a été utilisé dans le format d'ensemble de base centré sur le monomère (MC+BS)64. Les termes représentant les effets d'induction d'ordre supérieur et d'induction d'échange, notés \(\delta {E}_{{{{{{{{\rm{int}}}}}}}},{{{{{ {{\rm{resp}}}}}}}}^{{{{{{{\rm{HF}}}}}}}}}\) et obtenu comme différence entre Hartree–Fock (HF ) les énergies d'interaction et la somme des corrections SAPT(HF) de premier et de second ordre appropriées dans leurs versions de réponse (resp) ont été incluses pour tous les systèmes à l'exception du système XIII, du benzène, du DNBT et du TNB. Nous utilisons une notation abrégée pour les composants d'énergie d'interaction SAPT : "indx" est la somme des composants d'induction et d'échange-induction du second ordre, ainsi que du \(\delta {E}_{{{{{{ {{\rm{int}}}}}}}},{{{{{{{\rm{resp}}}}}}}}}^{{{{{{{\rm{HF}} }}}}}}}\) contribution, "dispx" est la somme des composantes de dispersion et d'échange-dispersion, "elst" est la composante électrostatique et "exch" est la composante d'échange de premier ordre. L'importance relative des composants attractifs est illustrée dans la Fig. 4 supplémentaire.

Dans tous les CSP passés, seuls des FF simples ont été utilisés à l'étape de minimisation de l'énergie du réseau. Les deux formes les plus utilisées sont le potentiel de Lennard-Jones 12-6-1 : A12/r12 − C6/r6 + qaqb/r, et le potentiel de Buckingham exp-6-1 : Ae−βr − C6/r6 + qaqb/ r, où r est une distance atome-atome et A12, A, β, C6, qa et qb sont des paramètres ajustables. Les aiFF basés sur SAPT (DFT) ont été utilisés dans les CSP, mais toujours avec la forme potentielle exp-6-1 dans l'étape de minimisation. Cette forme n'est pas assez souple pour bien s'adapter aux données ab initio, ce qui conduit à des incertitudes de quelques kJ/mol, trop grandes pour des CSP fiables. En revanche, la forme étendue que nous utilisons dans le protocole CSP(aiFF) peut ajuster les données ab initio avec des incertitudes d'environ 1 kJ/mol, ce que nous montrons être suffisant pour des CSP fiables. Cette forme fonctionnelle est37,38

où a (b) passe par-dessus les ensembles d'atomes du monomère A (B), respectivement, αab, βab, \({a}_{i}^{ab}\), \({A}_{12}^ {ab}\) sont des paramètres d'énergie de répulsion, \({C}_{n}^{ab}\) sont des paramètres d'énergie de dispersion et d'induction à longue distance, qx, x = a, b, sont des charges partielles atomiques, \ ({\delta }_{n}^{ab}\) sont des paramètres d'amortissement, et fn sont les fonctions d'amortissement de Tang-Toennies65 : \({f}_{n}(\delta ,r)=1-{e} ^{-\delta r}\mathop{\sum }\nolimits_{m = 0}^{n}{(\delta r)}^{m}/m!\) Les énergies d'interaction à longue portée ont été calculées à l'aide d'un ab approche initio-distribuée. Les paramètres d'amortissement dans le terme de dispersion plus induction ont été ajustés séparément à la somme de toutes les composantes proches du second ordre plus \(\delta {E}_{{{{{{{\rm{int}}}}} }}},{{{{{{{\rm{resp}}}}}}}}}^{{{{{{{\rm{HF}}}}}}}}}\), alors que \({\delta }_{1}^{ab}\) ont été adaptés aux énergies électrostatiques. Tous les PES développés ici sont des PES à deux corps et à 6 dimensions, c'est-à-dire supposent des monomères rigides. Les aiFF ont été construits comme des sommes de ces PES à deux corps. Il faut ajouter que la forme étendue des FF donnée par l'Eq. (1) a été utilisé dans certains CSP publiés, mais uniquement dans les simulations de dynamique moléculaire (MD) qui peuvent remplacer les calculs pDFT+D de l'étape 5. Notez que les calculs MD sont à peu près aussi chers que ceux pDFT+D et nettement plus chers que les minimisations de l'étape 4. Les graphiques montrant les composants d'énergie d'interaction SAPT (DFT) et leurs ajustements en fonction de la distance R entre les centres de masse des monomères sont inclus dans la Fig. 5 supplémentaire. On peut voir en particulier que les énergies électrostatiques ab initio sont très bien reproduits pour des R supérieurs à la distance minimale de van der Waals RvdW malgré l'utilisation uniquement d'interactions charge-charge amorties, c'est-à-dire en omettant des termes multipolaires plus élevés. Alors que l'utilisation de ces derniers termes dans les FF empiriques améliore les prédictions par rapport à l'utilisation de charges uniquement66,67, nos résultats montrent que les multipôles de rang supérieur ne sont pas nécessaires si la fonction électrostatique inclut l'amortissement et est ajustée aux énergies électrostatiques ab initio. L'aggravation de l'accord avec les valeurs ab initio observée pour R < RvdW est inévitable et est due aux effets de chevauchement de charge qui ne sont pas proportionnels aux puissances inverses de R36. Ces effets sont pris en compte dans l'ajustement global par le premier terme de l'équation. (1). C'est pourquoi les énergies d'interaction totale ajustée et ab initio sont en excellent accord pour tout R.

Étant donné qu'aucun des packages CSP disponibles n'est capable d'utiliser la forme d'aiFF donnée par Eq. (1), nous avons modifié deux de ces packages : MOLPAK68 et UPACK69 à appliquer dans les étapes 3 et 4. MOLPAK utilise le concept de géométrie de coordination et recherche par défaut dans 26 groupes d'espace : P1, \(P\bar{1}\ ), P2, Pm, Pc, P21, P2/c, P21/m, P2/m, P21/c, Cc, C2, C2/c, Pnn2, Pba2, Pnc2, P221, Pmn21, Pma2, P21212, P212121, Pca21, Pna21, Pnma, Fdd2, Pbcn et Pbca. Il génère des polymorphes sur une grille dans un espace de recherche tridimensionnel en faisant varier systématiquement l'orientation de la molécule centrale par pas de 10∘. Cette génération est effectuée dans les 51 géométries de coordination. Le tassement dans la cellule unitaire est contrôlé par une simple interaction répulsive 1/r12 entre atomes : les molécules sont rapprochées jusqu'à ce qu'un seuil d'énergie soit atteint. Cette étape fournit un ensemble initial de 6859 combinaisons d'angles × 51 géométries de coordination = 349 809 polymorphes hypothétiques. A partir de cet ensemble, 25 500 polymorphes les plus denses, 500 de chaque géométrie de coordination, sont minimisés à l'aide du programme WMIN70. La forme fonctionnelle par défaut du FF dans WMIN est exp-6-1. Nous avons modifié ce code pour inclure des FF de la forme de l'Eq. (1).

UPACK génère des structures cristallines aléatoires dans 13 groupes d'espace par défaut : C2, C2/c, Cc, P1, \(P\bar{1}\), P21, P21/c, P212121, Pbca, Pc, Pbcn, Pca21 et Pna21 . Il peut utiliser n'importe quel potentiel 12-6-1 et nous avons sélectionné l'OPLS-AA FF71. L'étape d'emballage est divisée dans UPACK en deux étapes. Dans la première étape, seules 500 structures raisonnables par groupe de symétrie sont générées aléatoirement de manière illimitée et sont ensuite utilisées pour estimer les dimensions des cellules. Dans la deuxième étape, la génération aléatoire est effectuée dans un espace de coordonnées restreint en utilisant cette estimation de cellule. La plupart des structures générées sont immédiatement rejetées en utilisant le critère selon lequel les interactions atome-atome 12-6-1 ne doivent pas être supérieures à 2000 kJ/mol pour n'importe quelle paire. De telles générations plus des tests de critères d'énergie se poursuivent jusqu'à ce que 5 000 polymorphes par groupe de symétrie, c'est-à-dire qu'un total de 65 000 polymorphes soient trouvés. Cette deuxième étape implique également une optimisation grossière des énergies de réseau. La liste résultante est soumise à un clustering72 pour supprimer les doublons. Le clustering réduit considérablement le pool. Par exemple, pour le système XXII, il est réduit à 13 014 polymorphes.

Dans l'étape 4 de CSP(aiFF) réalisée avec UPACK, tous les polymorphes de l'ensemble réduit sont minimisés avec des seuils serrés. Nous avons modifié UPACK pour pouvoir utiliser des FF de la forme de l'Eq. (1). Nous avons constaté qu'il est avantageux d'effectuer d'abord l'étape 4 avec l'OPLS-AA FF, c'est-à-dire en utilisant le chemin UPACK d'origine, y compris le regroupement, puis de minimiser l'ensemble réduit à l'aide de aiFF. La procédure a été choisie non pas pour gagner du temps, bien qu'elle entraîne des économies mineures, mais pour éviter que les minimisations ne se retrouvent dans des "trous" d'un FF, c'est-à-dire des minima non physiques à des séparations intermonomères très courtes. Par construction, les FF 12-6-1 n'ont pas de trous, tandis que exp-6-1 et nos FF de forme étendue ont presque toujours des trous (bien que derrière des barrières d'environ 100 kJ/mol, l'une des contraintes de l'ajustement autoPES). Nous avons constaté que les minimisations aiFF à partir des structures minimisées par OPLS ne se retrouvent presque jamais dans des trous. Nous aurions pu facilement éviter l'utilisation d'OPLS en ajustant un FF 12-6-1 aux données ab initio.

Les deux packages CSP que nous avons modifiés ont produit des prédictions presque identiques pour les cas où nous avons utilisé les deux. MOLPAK a été utilisé pour les systèmes I, II, XII, XXII, le nitrométhane et le benzène. UPACK a été utilisé pour les systèmes restants, ainsi que pour les systèmes I, II et XXII traités également par MOLPAK. Pour ces trois systèmes, les classements du cristal expérimental par les deux colis étaient identiques.

PLATON73 a été utilisé pour vérifier les symétries manquées74 et pour les transformations de groupe d'espace d'un réglage non standard à un réglage standard en attribuant au cristal cible le groupe d'espace et les paramètres de cellule appropriés, conduisant aux données du tableau 1. Par exemple, pour le système II, MOLPAK et UPACK a prédit le cristal expérimental en symétrie P21/c, et PLATON l'a transformé en symétrie P21/n.

À l'étape 5, des calculs périodiques d'énergie de réseau DFT + D à un seul point, c'est-à-dire sans optimisations de géométrie, ont été effectués pour les 20 polymorphes les mieux classés à partir des minimisations aiFF en utilisant la fonctionnelle PBE51 avec des pseudopotentiels75 plus la correction de dispersion D352 avec le Becke-Johnson ( BJ) amortissement76,77. Nous avons utilisé les codes Quantum ESPRESSO (QE)78,79, avec des coupures d'énergie cinétique d'onde plane de 340 et 3061 eV pour les fonctions d'onde et les densités de charge, respectivement.

L'énergie vibratoire du point zéro (ZPVE) et les effets thermiques ont été calculés dans l'approximation harmonique en utilisant Phonopy 2.8.180 et VASP 5.4.481,82,83,84,85 avec la même approche DFT+D que celle appliquée dans QE. Les pseudopotentiels à onde augmentée du projecteur86,87 ont été utilisés. Pour la relaxation du cristal, une coupure de 1000 eV pour l'ensemble de base des ondes planes a été utilisée. La relaxation a été arrêtée si le changement d'énergie total entre deux étapes pour les mouvements électroniques et ioniques était inférieur à 10−5 et 0,5 10−2 eV, respectivement. Les calculs de phonon ont été effectués au point Γ en utilisant une supercellule d'au moins 10 Å de longueur dans chaque direction. Comme pour l'étape de relaxation, une coupure de 1000 eV pour l'ensemble de base d'ondes planes et un seuil de convergence de 10−8 eV ont été utilisés dans le calcul de l'énergie totale. Ensuite, ZPVE et les effets thermiques ont été calculés sur un maillage de 8 × 8 × 8 en utilisant la matrice dynamique construite à partir des constantes de force des atomes déplacés dans la supercellule.

Les données qui appuient les conclusions de cette étude sont incluses dans l'article et les informations supplémentaires. En particulier, le fichier .zip contient les coordonnées et les énergies de tous les points de données calculés, les paramètres des ajustements et les fichiers d'informations cristallographiques pour un ensemble de polymorphes les mieux classés.

Les codes utilisés pour les calculs de structure électronique, l'ajustement, les CSP et les calculs pDFT+D : SAPT, ORCA, autoPES (partie du package SAPT), MOLPAK, UPACK, Quantum Espresso et VASP sont disponibles sur le Web et les liens sont fournis dans les références du document principal et des informations supplémentaires. Un correctif pour UPACK est disponible sur le site Web SAPT. Un programme FORTRAN calculant les potentiels ajustés est inclus dans le fichier Supplementary_Data_1.zip.

Cruz-Cabeza, AJ, Reutzel-Edens, SM & Bernstein, J. Faits et fictions sur le polymorphisme. Chim. Soc. Rév. 44, 8619–8635 (2015).

Article CAS PubMed Google Scholar

Bučar, D., Lancaster, RW et Bernstein, J. Disappearing Polymorphs Revisited. Angew. Chim. Int. Éd. 54, 6972–6993 (2015).

Article CAS Google Scholar

Hilfiker, R. & von Raumer, M. (eds.) Polymorphisme dans l'industrie pharmaceutique : développement de formes solides et de médicaments (Wiley-VCH, Weinheim, Allemagne, 2019).

Bauer, J. et al. Ritonavir : un exemple extraordinaire de polymorphisme conformationnel. Pharm. Rés. 18, 859–866 (2001).

Article CAS PubMed Google Scholar

Chemburkar, SR et al. Faire face à l'impact des polymorphes du ritonavir sur les dernières étapes du développement du processus de traitement des médicaments en vrac. Org. Processus Rés. Dév. 4, 413–417 (2000).

Article CAS Google Scholar

Rappel du patch Waknine, Y. Rotigotine en raison de la cristallisation du médicament. Medscape (2008).

Rietveld, IB & Ceolin, R. Rotigotine : Polymorphisme inattendu avec comportement monotropique global prévisible. J.Pharm. Sci. 104, 4117–4122 (2015).

Article CAS PubMed Google Scholar

Mortazavi, M. et al. Le dépistage polymorphe computationnel révèle une forme de rotigotine d'apparition tardive et peu soluble. Comm. Chim. 2, 70 (2019).

Article CAS Google Scholar

Badgujar, DM, Talawar, MB, Asthana, SN & Mahulikar, PP Progrès scientifiques et technologiques des matériaux énergétiques modernes : un aperçu. J. Hazard. Mater. 151, 289–305 (2008).

Article CAS PubMed Google Scholar

Zhang, C. Origines de l'énergie et de la sécurité des matériaux énergétiques et de la contradiction énergie et sécurité. Propulseurs Explos. Pyrotech. 43, 855–856 (2018).

Article CAS Google Scholar

Jurchescu, OD et al. Effets du polymorphisme sur le transport de charge dans les semi-conducteurs organiques. Phys. Rév. B 80, 085201 (2009).

Article ADS CAS Google Scholar

Maddox, J. Crystals à partir des premiers principes. Nature 335, 201 (1988).

Annonces d'article Google Scholar

Gavezzotti, A. Les structures cristallines sont-elles prévisibles ? Acc. Chim. Rés. 27, 309–314 (1994).

Article CAS Google Scholar

Lommerse, JPM et al. Un test de prédiction de la structure cristalline de petites molécules organiques. Cristal d'Acta. B 56, 697-714 (2000).

Article CAS Google Scholar

Motherwell, WDS et al. Prédiction de la structure cristalline de petites molécules organiques : un deuxième test à l'aveugle. Cristal d'Acta. B 58, 647–661 (2002).

Article CAS Google Scholar

Jour, GM et al. Un troisième test à l'aveugle de prédiction de la structure cristalline. Cristal d'Acta. B 61, 511–527 (2005).

Article CAS Google Scholar

Jour, GM et al. Des progrès significatifs dans la prédiction des structures cristallines de petites molécules organiques - un rapport sur le quatrième test à l'aveugle. Cristal d'Acta. B 65, 107–125 (2009).

Article CAS Google Scholar

Bardwell, DA et al. Vers la prédiction de la structure cristalline des composés organiques complexes - un rapport sur le cinquième test à l'aveugle. Cristal d'Acta. B 67, 535–551 (2011).

Article CAS Google Scholar

Reilly, AM et al. Rapport sur le sixième test à l'aveugle des méthodes de prédiction de la structure cristalline organique. Cristal d'Acta. B 72, 439–459 (2016).

Article CAS Google Scholar

Nyman, J. & Day, GM Différences d'énergie statique et vibrationnelle du réseau entre les polymorphes. CrystEngComm 17, 5154–5165 (2015).

Article CAS Google Scholar

Ryan, K., Lengyel, J. & Shatruk, M. Prédiction de la structure cristalline via l'apprentissage en profondeur. Confiture. Chim. Soc. 140, 10158–10168 (2018).

Article PubMed CAS Google Scholar

Neumann, MA, Leusen, FJJ et Kendrick, J. Une avancée majeure dans la prédiction de la structure cristalline. Angew. Chim. Int. Éd. 47, 1–5 (2008).

Article Google Scholar

Neumann, MA Champs de force sur mesure pour la prédiction de la structure cristalline. J.Phys. Chim. B 112, 9810–9829 (2008).

Article CAS PubMed Google Scholar

Neumann, M. A. GRACE; Avant-garde Materials Simulation: St-Germain-en-Laye, France. https://www.avmatsim.eu/ (2008).

Day, GM Approches actuelles pour prédire les structures cristallines organiques moléculaires. Cristallologue. Rév. 17, 3–52 (2011).

Article Google Scholar

Price, SL Prédiction des structures cristallines des composés organiques. Chim. Soc. Rév. 43, 2098-2111 (2014).

Article CAS PubMed Google Scholar

Szalewicz, K. Détermination de la structure et des propriétés des cristaux moléculaires à partir des premiers principes. Acc. Chim. Rés. 47, 3266–3274 (2014).

Article CAS PubMed Google Scholar

Hoja, J., Reilly, AM & Tkatchenko, A. Modélisation des premiers principes des cristaux moléculaires : structures et stabilités, température et pression. Wiley Interdiscip. Rév. : Comput. Mol. Sci. 7, e1294 (2017).

Google Scholar

Oganov, AR Prédiction de la structure cristalline : réflexions sur l'état actuel et les défis. Discutez de Faraday. R. Soc. Chim. 211, 643–660 (2018).

Article ADS CAS Google Scholar

Price, SL & Brandenburg, JG Prédiction de la structure cristalline moléculaire. Dans Non-Covalent Interactions in Quantum Chemistry and Physics, (eds de-la Roza, AO & DiLabio, GA) 333–363 (Elsevier, 2017).

Prix, SL La prédiction de la structure cristalline d'ordre zéro (CSP_0) arrive-t-elle à maturité ? Que devrions-nous viser dans un code de prédiction de structure cristalline idéale ? Discutez de Faraday. R. Soc. Chim. 211, 9-30 (2018).

Article ADS CAS Google Scholar

Podeszwa, R., Bukowski, R., Rice, BM et Szalewicz, K. Surface d'énergie potentielle pour le dimère de cyclotriméthylène trinitramine à partir de la théorie des perturbations adaptées à la symétrie. Phys. Chim. Chim. Phys. 9, 5561–5569 (2007).

Article CAS PubMed Google Scholar

Podeszwa, R., Rice, BM et Szalewicz, K. Prédiction de la structure des cristaux moléculaires à partir des premiers principes. Phys. Rév. Lett. 101, 115503 (2008).

Article ADS PubMed CAS Google Scholar

Misquitta, AJ, Welch, GWA, Stone, AJ & Price, SL Une prédiction des premiers principes de la structure cristalline de C6Br2ClFH2. Chim. Phys. Lett. 456, 105-109 (2008).

Article ADS CAS Google Scholar

Garcia, J., Podeszwa, R. & Szalewicz, K. Codes SAPT pour les calculs des énergies d'interaction intermoléculaires. J. Chem. Phys. 152, 184109 (2020).

Article ADS CAS PubMed Google Scholar

Jeziorski, B., Moszyński, R. & Szalewicz, K. Théorie des perturbations Approche des surfaces d'énergie potentielle intermoléculaire des complexes de van der Waals. Chim. Rév.94, 1887–1930 (1994).

Article CAS Google Scholar

Metz, MP, Piszczatowski, K. & Szalewicz, K. Génération automatique de surfaces d'énergie potentielle intermoléculaire. J. Chem. Calcul théorique. 12, 5895–5919 (2016).

Article CAS PubMed Google Scholar

Metz, MP & Szalewicz, K. Génération automatique de surfaces d'énergie potentielle intermoléculaire à monomère flexible. J. Chem. Calcul théorique. 16, 2317-2339 (2020).

Article CAS PubMed Google Scholar

Brandenburg, JG & Grimme, S. Polymorphisme cristallin organique : une référence pour les méthodes de structure électronique à champ moyen corrigées en dispersion. Crist. Acta B 52, 502–513 (2016).

Article CAS Google Scholar

Whittleton, SR, de-la Roza, AO & Johnson, ER Modèle de dispersion dipolaire Exchange-Hole pour un classement précis de l'énergie dans la prédiction de la structure cristalline moléculaire. J. Chem. Calcul théorique. 13, 441–450 (2017).

Article CAS PubMed Google Scholar

Hoja, J. et al. Description informatique fiable et pratique des polymorphes de cristaux moléculaires. Sci. Adv. 5, eaau3338 (2019).

Article ADS PubMed PubMed Central Google Scholar

Garcia, J. & Szalewicz, K. Ab Initio Extended Hartree – Fock plus Méthode de dispersion appliquée aux dimères avec des centaines d'atomes. J.Phys. Chim. A 124, 1196-1203 (2020).

Article CAS PubMed Google Scholar

Taylor, DC et al. Test à l'aveugle de méthodes basées sur la densité fonctionnelle sur les énergies d'interaction intermoléculaires. J. Chem. Phys. 145, 124105 (2016).

Article ADS PubMed CAS Google Scholar

Williams, DE Champ de force intermoléculaire amélioré pour les molécules contenant des atomes de H, C, N et O, avec application aux cristaux de nucléosides et de peptides. J. Comput. Chim. 22, 1154-1166 (2001).

Article CAS Google Scholar

Breneman, CM & Wiberg, KB Détermination des monopôles centrés sur l'atome à partir de potentiels électrostatiques moléculaires. La nécessité d'une densité d'échantillonnage élevée dans l'analyse conformationnelle du formamide. J. Comp. Chim. 11, 361 (1990).

Article CAS Google Scholar

Welch, GWA, Karamertzanis, PG, Misquitta, AJ, Stone, AJ & Price, SL L'énergie d'induction est-elle importante pour la modélisation des cristaux organiques ? J. Chem. Calcul théorique. 4, 522–532 (2008).

Article CAS PubMed Google Scholar

Karamertzanis, PG et al. Modélisation de l'interaction des liaisons hydrogène inter et intramoléculaires dans les polymorphes conformationnels. J. Chem. Phys. 128, 244708 (2008).

Article ADS PubMed CAS Google Scholar

Greenwell, C. et al. Surmonter les difficultés de prédiction de l'énergétique polymorphe conformationnelle dans les cristaux moléculaires via des méthodes de fonction d'onde corrélées. Chim. Sci. 11, 2200-2214 (2020).

Article CAS PubMed PubMed Central Google Scholar

Neese, F. Le système de programme ORCA. Wiley Interdiscip. Rév. : Comput. Mol. Sci. 2, 73–78 (2012).

CAS Google Scholar

Neese, F. ORCA, un package de structure électronique ab initio, DFT et semi-empirique. avec les contributions de U. Becker, et al. https://orcaforum.kofo.mpg.de.

Perdew, JP, Burke, K. & Ernzerhof, M. L'approximation de gradient généralisée simplifiée. Phys. Rév. Lett. 77, 3865–3868 (1996).

Article ADS CAS PubMed Google Scholar

Grimme, S., Antony, J., Elrich, S. & Krieg, H. Une paramétrisation ab initio cohérente et précise de la correction de dispersion fonctionnelle de densité (DFT-D) pour les 94 éléments H-Pu. J. Chem. Phys. 132, 154104 (2010).

Article ADS PubMed CAS Google Scholar

Kendall, RA, Dunning, TH Jr & Harrison, RJ Les affinités électroniques des atomes de la première rangée revisitées. Bases systématiques et fonctions d'onde. J. Chem. Phys 96, 6796–6806 (1992).

Article ADS CAS Google Scholar

Szalewicz, K. Théorie des perturbations adaptée à la symétrie des forces intermoléculaires. Wiley Interdisc. Rév. Comp. Mol. Sci. 2, 254–272 (2012).

Article CAS Google Scholar

Misquitta, AJ, Podeszwa, R., Jeziorski, B. & Szalewicz, K. Potentiels intermoléculaires basés sur la théorie des perturbations adaptées à la symétrie, y compris les énergies de dispersion à partir de calculs fonctionnels de densité dépendant du temps. J. Chem. Phys. 123, 214103 (2005).

Article ADS PubMed CAS Google Scholar

Hesselmann, A., Jansen, G. & Schütz, M. Théorie des perturbations intermoléculaires adaptées à la théorie de la fonctionnelle de la densité et à la symétrie avec ajustement de la densité : une nouvelle méthode efficace pour étudier les énergies d'interaction intermoléculaires. J. Chem. Phys. 122, 014103 (2005).

Article ADS CAS Google Scholar

Misquitta, AJ, Jeziorski, B. & Szalewicz, K. Dispersion Energy from Density-Functional Theory Description of Monomers. Phys. Rév. Lett. 91, 033201 (2003).

Article ADS PubMed CAS Google Scholar

Hesselmann, A. & Jansen, G. Énergies de dispersion intermoléculaire à partir de la théorie fonctionnelle de la densité dépendant du temps. Chim. Phys. Lett. 367, 778–784 (2003).

Article ADS CAS Google Scholar

Bukowski, R., Podeszwa, R. & Szalewicz, K. Calculs efficaces des fonctions de susceptibilité dynamique Kohn-Sham couplées et des énergies de dispersion avec ajustement de densité. Chim. Phys. Lett. 414, 111-116 (2005).

Article ADS CAS Google Scholar

Podeszwa, R., Bukowski, R. & Szalewicz, K. Méthode d'ajustement de la densité dans la théorie des perturbations adaptée à la symétrie basée sur la description de Kohn-Sham des monomères. J. Chem. Calcul théorique. 2, 400–412 (2006).

Article CAS PubMed Google Scholar

Bukowski, R. et al. SAPT2020 : Un programme ab initio pour les calculs de la théorie des perturbations adaptées à la symétrie à plusieurs corps des énergies d'interaction intermoléculaires. http://www.physics.udel.edu/~szalewic/SAPT/SAPT.html (2020).

Grüning, M., Gritsenko, OV, van Gisbergen, SJA & Baerends, EJ Corrections de forme des potentiels d'échange-corrélation par une connexion transparente régulée par gradient des potentiels modèles pour les régions intérieure et extérieure. J. Chem. Phys. 114, 652–660 (2001).

Annonces d'article Google Scholar

Cencek, W. & Szalewicz, K. Sur le comportement asymptotique de la théorie fonctionnelle de la densité. J. Chem. Phys. 139, 024104–(1:27) (2013). Erratum : 140, 149902 (2014).

Article ADS CAS Google Scholar

Williams, HL, Mas, EM, Szalewicz, K. & Jeziorski, B. Sur l'efficacité des fonctions de base centrées sur les monomères, les dimères et les liaisons dans les calculs des énergies d'interaction intermoléculaires. J. Chem. Phys. 103, 7374–7391 (1995).

Article ADS CAS Google Scholar

Tang, KT & Toennies, JP Un modèle simple amélioré pour le potentiel de van der Waals basé sur des fonctions d'amortissement universelles pour les coefficients de dispersion. J. Chem. Phys. 80, 3726–3741 (1984).

Article ADS CAS Google Scholar

Day, GM, Motherwell, WDS & Jones, W. Au-delà du modèle d'atome isotrope dans la prédiction de la structure cristalline des molécules rigides : multipôles atomiques par rapport aux charges ponctuelles. Crist. Croissance Dés. 5, 1023-1033 (2005).

Article CAS Google Scholar

Price, SL Prédiction computationnelle des structures cristallines organiques et du polymorphisme. Int. Rév. Phys. Chim. 27, 541–568 (2008).

Article CAS Google Scholar

Holden, JR, Du, Z. & Ammon, HL Prédiction des structures cristallines possibles pour les composés organiques contenant C-, H-, N-, O- et F-. J. Comput. Chim. 14, 422–437 (1993).

Article CAS Google Scholar

van Eijck, BP & Kroon, J. UPACK package de programme pour la prédiction de la structure cristalline : champs de force et génération de structure cristalline pour les petites molécules de glucides. J. Comput. Chim. 20, 799–812 (1999).

3.0.CO;2-Z" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291096-987X%28199906%2920%3A8%3C799%3A%3AAID-JCC6%3E3.0.CO%3B2-Z" aria-label="Article reference 69" data-doi="10.1002/(SICI)1096-987X(199906)20:83.0.CO;2-Z">Article PubMed Google Scholar

Busing, rapport WR ORNL-5747. Laboratoire national d'Oak Ridge, Oak Ridge, TN (1981).

Jorgensen, WL & Tirado-Rives, J. Les fonctions potentielles OPLS [Optimized Potentials for Liquid Simulations] pour les protéines, les minimisations énergétiques pour les cristaux de peptides cycliques et la crambine. Confiture. Chim. Soc. 110, 1657–1666 (1988).

Article CAS PubMed Google Scholar

Van Eijck, BP & Kroon, J. Regroupement rapide de structures équivalentes dans la prédiction de la structure cristalline. J. Comput. Chim. 18, 1036-1042 (1997).

3.0.CO;2-U" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291096-987X%28199706%2918%3A8%3C1036%3A%3AAID-JCC7%3E3.0.CO%3B2-U" aria-label="Article reference 72" data-doi="10.1002/(SICI)1096-987X(199706)18:83.0.CO;2-U">Article Google Scholar

Spek, AL Validation de structure monocristalline avec le programme PLATON. J. Appl. Cristallologue. 36, 7-13 (2003).

Article CAS Google Scholar

Spek, AL Validation de la structure en cristallographie chimique. Acta Crystallogr., Sect. D : Biol. Cristallologue. 65, 148-155 (2009).

Article CAS Google Scholar

Rappe, AM, Rabe, KM, Kaxiras, E. & Joannopoulos, JD Pseudopotentiels optimisés. Phys. Rév. B : Condens. Affaire 41, 1227 (1990).

Article ADS CAS Google Scholar

Becke, AD & Johnson, ER Moment dipolaire de trou d'échange et interaction de dispersion. J. Chem. Phys. 122, 154104–(1:5) (2005).

Annonces d'article Google Scholar

Grimme, S., Ehrlich, S. & Goerigk, L. Effet de la fonction d'amortissement dans la théorie fonctionnelle de la densité corrigée de la dispersion. J. Comp. Chim. 32, 1456-1465 (2011).

Article CAS Google Scholar

Giannozzi, P. et al. Quantum ESPRESSO : un projet logiciel modulaire et open-source pour les simulations quantiques de matériaux. J.Phys. Condens. Matière 21, 395502 http://www.quantum-espresso.org (2009).

Article PubMed Google Scholar

Giannozzi, P. et al. Fonctionnalités avancées pour la modélisation des matériaux avec Quantum ESPRESSO. J.Phys. Condens. Affaire 29, 465901 (2017).

Article CAS PubMed Google Scholar

Togo, A. & Tanaka, I. Premiers principes de calculs de phonons en science des matériaux. Scr. Mater. 108, 1–5 (2015).

Article ADS CAS Google Scholar

Kresse, G. & Hafner, J. Dynamique moléculaire ab initio pour les métaux liquides. Phys. Rev. B 47, 558–561 (1993).

Article ADS CAS Google Scholar

Kresse, G. & Hafner, J. Simulation de dynamique moléculaire ab initio de la transition métal liquide-amorphe-semi-conducteur dans le germanium. Phys. Rév. B : Condens. Matière 49, 14251–14269 (1994).

Article ADS CAS Google Scholar

Kresse, G. & Furthmüller, J. Efficacité des calculs d'énergie totale ab-initio pour les métaux et les semi-conducteurs à l'aide d'un ensemble de base d'ondes planes. Calcul. Mater. Sci. 6, 15-50 (1996).

Article CAS Google Scholar

Kresse, G. & Furthmüller, J. Schémas itératifs efficaces pour les calculs d'énergie totale ab initio utilisant un ensemble de base d'ondes planes. Phys. Rév. B : Condens. Matière 54, 11169–11186 (1996).

Article ADS CAS Google Scholar

Kresse, G. et al. VASP : package de simulation de Vienne à partir de zéro. http://www.vasp.at (2021).

Blöchl, PE Méthode d'onde augmentée du projecteur. Phys. Rév. B : Condens. Matière 50, 17953–17979 (1994).

Annonces d'article Google Scholar

Kresse, G. & Joubert, D. Des pseudopotentiels ultradoux à la méthode des ondes augmentées par projecteur. Phys. Rév. B : Condens. Matière 59, 1758–1775 (1999).

Article ADS CAS Google Scholar

Télécharger les références

Ce travail a été soutenu par le US Army Research Laboratory et le Army Research Office (Grant No. W911NF-19-1-0117) et la NSF (Grant No. CHE-1900551). Nous remercions Rafał Podeszwa pour ses commentaires sur le manuscrit.

Département de physique et d'astronomie, Université du Delaware, Newark, DE, 19716, États-Unis

Rahul Nikhar & Krzysztof Szalewicz

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

RN et KS ont conçu la méthode. RN l'a codé et a effectué des calculs numériques. Les deux auteurs ont analysé les résultats, rédigé le manuscrit et l'ont révisé.

La correspondance est Krzysztof Szalewicz.

Les auteurs ne déclarent aucun intérêt concurrent.

Nature Communications remercie Gregory Beran, Graeme Day et l'autre relecteur anonyme pour leur contribution à l'examen par les pairs de ce travail. Les rapports des pairs examinateurs sont disponibles.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International License, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, tant que vous donnez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Nikhar, R., Szalewicz, K. Prédictions fiables de la structure cristalline à partir des premiers principes. Nat Commun 13, 3095 (2022). https://doi.org/10.1038/s41467-022-30692-y

Télécharger la citation

Reçu : 17 novembre 2021

Accepté : 10 mai 2022

Publié: 02 juin 2022

DOI : https://doi.org/10.1038/s41467-022-30692-y

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.