7.4 Panorama y acantilados de actividad
Last updated
Last updated
La exploración de relaciones estructura-actividad (SAR, por sus siglas en inglés, structure-activity relationships) y estructura-propiedad (SPR, por sus siglas en inglés, structure-property relationships) de bases de datos de compuestos, es una de los primeros pasos básicos en el descubrimiento de fármacos. Para este fin, una de los enfoques es cuantificar los panoramas de actividad/propiedad o activity landscapes (ALs), e identificar, si los hay, los acantilados de actividad o activity cliffs (ACs) y los acantilados de similitud (Dunn et al. 2023).
Los ALs son definidos como representaciones gráficas que integran la similitud de compuestos y las relaciones de actividad. Representan gráficamente la actividad de compuestos biológicamente relevantes en el espacio químico, haciendo posible visualizar las SAR e identificar compuestos claves y determinantes (ver Figura 1). Compuestos que son similares (estructuralmente hablando) entre sí y similares a sus vecinos en el espacio químico, pero que tienen una alta e inesperada diferencia de actividad (o propiedad), forman los ACs (Javed et al., 2020 and Maggiora G et. al, 2020).
Los ALs ayudan a visualizar las relaciones entre las estructuras moleculares y las actividades biológicas de los compuestos, y ayuda a identificar compuestos que tienen una actividad similar pero una estructura molecular diferente, lo que es muy útil en la selección de compuestos para el cribado biológico. Los ALs revelan regiones de discontinuidad en las SAR, donde pequeños cambios en la química estructural dirigen a grandes cambios en la potencia del compuesto, un escenario frecuentemente encontrado en la optimización de compuestos líderes. Como forma extrema de discontinuidad SAR, los ACs representan las características más destacadas de los ALs y, a menudo, son el principal punto focal de su análisis (Dagmar and Bajorath 2012).
Recordemos que la hipótesis común en muchos métodos de modelado QSAR es que la asociación entre estructuras químicas y la propiedad de interés (p. ej. actividad biológica) es continua, es decir, existe una relación directa entre la similitud de la actividad y la similitud estructural de los compuestos. Sin embargo, esta suposición no siempre se cumple si en el conjunto de datos se tienen, los antes mencionados, ACs (Muratov et al. 2020).
Los ACs recibieron una fuerte atención en química computacional y en el diseño de fármacos debido a que representan casos de discontinuidad en SAR que fueron perjudiciales para el modelado QSAR, ya que en esta metodología los compuestos ACs fueron considerados falsamente como valores atípicos. Sin embargo, la discontinuidad SAR también se traduce en un gran contenido de información sobre SAR, así como los ACs permiten la identificación de pequeñas modificaciones químicas que determinan la potencia de compuestos activos, puntos que generan interés para la Química Farmacéutica por su potencial aplicación en la optimización de compuestos (Dagmar et al. 2019). La Figura 2 ilustra ejemplos de ACs.
Modelar y racionalizar ALs requiere aplicar métodos computacionales. Como tal, el concepto de ALs es de relevancia para la quimioinformática (que tiene un fuerte enfoque en la extracción y representación de datos) y la Química Farmacéutica (dada su relevancia inmediata para el análisis SAR) (Dagmar and Bajorath 2012). Para este propósito Python es una herramienta útil ya que tiene varias bibliotecas que permiten realizar el análisis de datos, la visualización y la creación de modelos de aprendizaje automático que abordan de forma adecuada estos conceptos.
A continuación se ejemplifican los conceptos de ACs y ALs empleando python.
Con fines prácticos se empleó una base de datos de una serie de compuestos que actúan sobre el blanco terapéutico GPR40. Este blanco es de interés para estudios relacionados a la diabetes tipo II. La base de datos química fue obtenida de CHEMBL. Los parámetros que serán usados para realizar el análisis de similitud son: IC50 y el coeficiente de Tanimoto.
Tras un proceso de curado, se generaron los cálculos de pIC50, diferencia de actividad (Figura 3), similitud molecular empleando el coeficiente de Tanimoto (Figura 4) y el valor SALI (por sus siglas en inglés, Structure-Activity Landscape Index).
El valor SALI, propuesto por Guha y Van Drie (Guha and Van Drie 2008), es uno de los enfoques más tempranos y sencillos para capturar el ALs de bases de datos de compuestos y rápidamente detectar ACs (Dunn et al. 2023):
donde Pi y Pj son los valores de las propiedades de las moléculas i y j, respectivamente, y s(i,j) es la similitud de i y j. En la mayoría de las aplicaciones publicadas de SALI, s(i,j) ha sido calculado como el coeficiente de Tanimoto usando como representación fingerprints moleculares, pero puede ser cuantificado empleando cualquier otra combinación de representación molecular e índice de similitud (Guha and Van Drie 2008),
El valor SALI fue empleado para mapear los ACs en un mapa Similitud Estructura-Actividad (SAS, structure-activity similarity map). Un mapa SAS son representaciones bidimensionales de ALs que contrasta la similitud estructural y la similitud de actividad. En el gráfico se incluyen comparaciones sistemáticas de compuestos por pares. Cada punto en el mapa SAS representa un par de compuestos, los cuales son coloreados según cual es el compuesto más activo de los pares (Naveja et al. 2019)
En el ejercicio se empleó una escala de color continua desde x (valores bajos SALI) hasta y (valores altos SALI asociados con ACs). Para este segmento se consideró que dos compuestos están conectados si tienen un valor SALI superior al límite de corte establecido (mayor al 70 u 80% de todos los valores).
Considerando lo anterior, se emplearon diferentes métricas, tales como considerar valores superiores al primer, segundo y tercer cuartil (25%, 50% y 75%, respectivamente) de los datos, así como el promedio más dos veces la desviación estándar de los mismos. A continuación se grafican aquellos pares de moléculas que se consideran ACs considerando las métricas anteriores:
Lo descrito anteriormente está ejemplificado y desarrollado en Python en el repositorio disponible en la sección Recursos y ejercicios.
Cruz-Monteagudo M, Medina-Franco JL, Pérez-Castillo Y, Nicolotti O, Cordeiro NMDS, Borges F (2014) Activity Cliffs in Drug Discovery: Dr Jekyll or Mr Hyde?. Drug Discovery Today 19 (8): 1069–80.
Dagmar S, Bajorath J (2012) Exploring Activity Cliffs in Medicinal Chemistry. J. Med. Chem. 55 (7): 2932–42.
Dagmar S, Hu H, Bajorath J (2019) Evolving Concept of Activity Cliffs. ACS Omega 4 (11): 14360–68.
Dunn, Timothy B, López-López E, Kim, TD Medina-Franco JL, Miranda-Quintana RA (2023). Exploring Activity Landscapes with Extended Similarity: Is Tanimoto Enough?. Molecular Informatics 42 (7): e2300056.
Guha R, Van Drie JH (2008). Structure--Activity Landscape Index: Identifying and Quantifying Activity Cliffs. J. Chem. Inf. Model. 48 (3), 646–658.
Javed I, Vogt M, Bajorath J (2020) Activity Landscape Image Analysis Using Convolutional Neural Networks. Journal of Cheminformatics 12 (1): 34.
Maggiora G, Medina-Franco JL, Iqbal J, Vogt M, Bajorath J (2020) From Qualitative to Quantitative Analysis of Activity and Property Landscapes. J. Chem. Inf. Model. 60:5873–5880
Muratov EN, Bajorath J, Sheridan RP, Tetko IV, Filimonov D, Poroikov V, Oprea TI, et al. (2020) QSAR without Borders. Chem. Soc. Rev. 49 (11): 3525–64.
Naveja JJ, Saldívar-González FI, Sánchez-Cruz N, Medina-Franco JL (2019) Cheminformatics Approaches to Study Drug Polypharmacology. In Multi-Target Drug Design Using Chem-Bioinformatic Approaches, edited by Kunal Roy, 3–25. New York, NY: Springer New York.