6.1 Descriptores moleculares
Los descriptores moleculares son valores numéricos y representan datos experimentales o calculados (en programas libres o comerciales) que capturan características y propiedades de las moléculas (fisicoquímicas, electrónicas, conectividad molecular, etc.). Estos descriptores se utilizan comúnmente en quimioinformática y en química computacional, para estudiar moléculas. La codificación de moléculas usando descriptores permite realizar diferentes tipos de análisis como la visualización de espacio químico, estudios de relaciones estructura-propiedad y cribado virtual, por mencionar algunos ejemplos (Xue y Bajorath 2009). De acuerdo al o a los descriptores seleccionados, serán las predicciones e interpretaciones que podrán realizarse. La Tabla 1 resume ejemplos de diferentes tipos de descriptores:
Tabla 1. Breve resumen sobre tipos de descriptores.
Índices topológicos
Calcula una variable escalar basado en una gráfica de la molécula sin átomos de hidrógeno.
Solo se tiene la información estructural, aunque esto reduce la interpretación del resultado, pueden aplicarse eficientemente.
Índices de Wiener y de Randic.
Propiedades fisicoquímicas
Generalmente, estima propiedades físicas de las moléculas con modelos predictivos.
Con valores de estas propiedades se puede hacer un análisis más espontáneo y tomar decisiones informadas.
Constante disociación del ácido, área polar superficial, solubilidad en agua.
Huellas digitales moleculares
Basados en conocimiento: usan diccionarios. Basados en información: capturan información de la estructura.
Conocimiento: son más fáciles de interpretar, pero tienen poder predictivo bajo. Información: son difíciles de interpretar pero tienen alto poder predictivo.
Huellas digitales de llaves estructurales (structure keys), huellas digitales de llaves convertidoras (hash-key).
Modelos del farmacóforo
Generan resultados a partir de posibles puntos de interacción ligando-receptor.
Los resultados son fáciles de interpretar, la eficiencia dependerá de la confiabilidad de los puntos de interacción.
Modelos de 3- y 4- puntos farmacofóricos.
Patrones de plantillas moleculares
Con base en el scaffold (subestructura que soporta a los grupos funcionales).
Su interpretación es intuitiva. En general son buenos predictores.
Scaffolds, Scaffold Hopping.
Específicamente, los descriptores moleculares se pueden dividir en dos categorías principales: descriptores basados en la estructura y descriptores basados en propiedades fisicoquímicas.
Descriptores basados en la estructura
Los descriptores basados en la estructura son descriptores que se derivan directamente de la estructura química de una molécula. Estos descriptores se pueden calcular utilizando algoritmos que analizan la estructura de la molécula, como la distancia entre átomos, los ángulos de enlace y la carga eléctrica de los átomos. Ejemplos de descriptores basados en la estructura son:
Número de átomos
Número de enlaces
Número de átomos de carbono
Número de átomos de oxígeno
Número de grupos funcionales
Descriptores basados en propiedades fisicoquímicas
Los descriptores basados en propiedades fisicoquímicas son descriptores que se derivan de las propiedades físicas y químicas de una molécula. Ejemplos de descriptores basados en propiedades fisicoquímicas son:
Peso molecular
Solubilidad
Polaridad
LogP (coeficiente de partición octanol-agua)
Descriptores de importancia farmacéutica
En el diseño de fármacos, una regla empírica y basada en descriptores, es la regla de Lipinski o "regla de los cinco" (Lipinski et al. 1997), que está asociada a la biodisponibilidad oral de una molécula basada en cuatro propiedades moleculares específicas:
No más de 5 donadores de puente de hidrógeno (HBD).
No más de 10 aceptores de puente de hidrógeno (HBA).
Peso molecular (MW) inferior a 500 Da.
Coeficientes de partición (logP) no superiores a 5.
Una molécula que no cumple con dos o más de estas condiciones tiene menor probabilidad de ser biodisponible por vía oral.
Las reglas de Lipinski son una guía utilizada para filtrar compuestos con mayores probabilidades de llegar a la clínica. Sin embargo, es importante tomar cuenta los objetivos del proyecto de diseño de fármacos y recordar que las propiedades que debe tener un fármaco van más allá de estas reglas, por ejemplo la potencia. Además, hay que considerar que existen fármacos aprobados que no cumplen con estas reglas. (Doak et. al. 2014, Matsson et. al. 2016, Degoey et. al. 2018, Tyagi et. al. 2020)
Veber propuso añadir reglas adicionales a la regla de Lipinski, las cuales contemplan la permeabilidad de un compuesto junto con la flexibilidad de la molécula en términos de número de enlaces rotables y del área superficial polar topológica (TPSA) (Veber et al. 2002). Las reglas de flexibilidad de Veber que complementan la regla de los cinco son:
Área superficial polar topológica (TPSA) menor de 140 Å^2.
Número de enlaces rotables (nRB) menor o igual a 10.
Otra característica estructural que puede describirse mediante descriptores moleculares es la complejidad molecular (Saldívar-González y Medina-Franco 2020). La complejidad de una estructura química es subjetiva y puede describirse de manera diferente en función de los campos en los que se trabaja. Por ejemplo, la complejidad sintética y la complejidad estructural podrían manejarse como conceptos diferentes. Sin embargo, ambas tienen aplicaciones prácticas, en la síntesis y en el diseño de compuestos bioactivos, donde se ha asociado con la selectividad (Lovering et al. 2009; Clemons et al. 2010), la seguridad y el éxito de los compuestos en el progreso hacia el desarrollo clínico (Lovering et al. 2009).
A continuación, se resumen los descriptores moleculares de importancia farmacéutica (Tabla 2) y descriptores relacionados con el concepto de complejidad molecular (Tabla 3). En las siguientes secciones abordaremos el uso de la librería RDKit
de Python para el cálculo de descriptores moleculares, así como otras paqueterías útiles para analizar bases de datos moleculares.
Tabla 2. Descriptores asociados con biodisponibilidad oral
Peso molecular (MW)
2D
mol_exactmw
Asociado con la complejidad y la permeabilidad de una molécula.
Coeficiente de Partición (logP)
2D
MolLogP
Determina el grado de afinidad que tiene una molécula por fases lipídicas y a su vez, es una medida del grado de repulsión que muestra esta molécula por soluciones acuosas.
Área de superficie polar topológica (TPSA)
2D
TPSA
Correlacionada con la permeabilidad por difusión pasiva.
Número de enlaces rotables (nRB)
2D
NumRotatableBonds
Asociado con la flexibilidad de una molécula: a mayor nRB, se tendrá una mayor flexibilidad.
Número de aceptores de puente de Hidrógeno (HBA)
2D
NumHAcceptors
Asociado con la permeabilidad de una molécula: moléculas con números grandes de HBA interactúan de forma favorable con solventes similares al agua.
Número de donadores de puente de hidrógeno
(HBD)
2D
NumHDonors
Asociado con la permeabilidad de una molécula.
Tabla 3. Descriptores asociados con complejidad molecular
Fracción de átomos de carbono con hibridación sp3 (Fcsp3)
2D
FractionCSP3
Un mayor valor de Fsp3 indica que la molécula tiene una mayor probabilidad de tener una estructura tridimensional, y por ende no tendrá una estructura plana
Fracción de carbonos quirales (FCC)
2D
NA*
Un elevado valor de FCC significa una mayor complejidad estereoquímica.
Número de Anillos (nR)
2D
RingCount
Asociado con la posibilidad de un mayor tamaño y complejidad estructural.
Número de Heteroátomos (numHeteroatoms)
2D
NumHeteroatoms
El incremento de complejidad molecular tiende a estar asociado con un mayor número de heteroátomos.
*NA: No aplica
Los códigos de RDKit pueden consultarse en la siguiente liga:
Más información sobre los descriptores que pueden calcularse con RDKit
:
Para saber más:
Clemons PA, Bodycombe NE, Carrinski HA, Wilson JA, Shamji AF, Wagner BK, Koehler AN, Schreiber SL (2010). Small molecules of different origins have distinct distributions of structural complexity that correlate with protein-binding profiles. Proc. Natl. Acad. Sci. U.S.A. 107:18787-18792. doi: 10.1073/pnas.1012741107.
DeGoey DA, Chen HJ, Cox PB, Wendt MD (2018). Beyond the Rule of 5: Lessons Learned from AbbVie’s Drugs and Compound Collection. J. Med. Chem. 61:2636–2651. doi: 10.1021/acs.jmedchem.7b00717.
Doak BC, Over B, Giordanetto F, Kihlberg J (2014). Oral druggable space beyond the rule of 5: insights from drugs and clinical candidates. Chem. Biol. 21:1115-1142. doi: 10.1016/j.chembiol.2014.08.013.
Lipinski CA, Lombardo F, Dominy BW, Feeney PJ (1997). Experimental and computational approaches to estimate solubility and permeability in drug discovery and development settings. Adv. Drug Delivery Rev. 23:3-25. doi: 10.1016/S0169-409X(96)00423-1.
Lovering F, Bikker J, Humblet C (2009). Escape from Flatland: Increasing saturation as an approach to improving clinical success. J. Med. Chem. 52:6752–6756. doi: 10.1021/jm901241e.
Matsson P, Doak BC, Over B, Kihlberg J (2016). Cell permeability beyond the rule of 5. Adv. Drug Delivery Rev. 101:42-61. doi: 10.1016/j.addr.2016.03.013.
Saldívar-González FI, Medina-Franco JL (2020). Chemoinformatics approaches to assess chemical diversity and complexity of small molecules. In Trabocchi A, Lenci E (eds) Small Molecule Drug Discovery. Elsevier, pp 83-102.
Tyagi M, Begnini F, Poongavanam V, Doak BC, Kihlberg J (2020). Drug Syntheses Beyond the Rule of 5. Chemistry. 26:49-88. doi: 10.1002/chem.201902716.
Veber DF, Johnson SR, Cheng HY, Smith BR, Ward KW, Kopple KD (2002). Molecular properties that influence the oral bioavailability of drug candidates. J. Med. Chem. 45:2615–2623. doi: 10.1021/jm020017n.
Xue L, Bajorath J (2000). Molecular descriptors in chemoinformatics, computational combinatorial chemistry, and virtual screening. Comb. Chem. High Throughput Screen. 3:363-372. doi: 10.2174/1386207003331454.
Last updated