💻
Quimioinformática
GitHub
  • 📖Quimioinformática aplicada al diseño de fármacos
  • 🔎1. Búsqueda de información química
    • 📑1.1 SciFinder-n
    • 📑1.2 Web of Science
    • 📑1.3 Scopus
    • 📑1.4 CAS Source Index (CASSI)
    • 📑1.5 Herramientas de visualización bibliométrica
  • 🐍2. Introducción a Python, Google Colab y Linux
    • 💻2.1 Fundamentos de programación
    • 🧹2.2 Manejo y limpieza de datos
    • 🐧2.3 Linux
      • 🪟2.3.1 Subsistema de Windows para Linux (WSL)
        • 👩‍💻2.3.1.1 Creación de usuarios
        • 🧑‍💻2.3.1.2 Selección de usuario de inicio por defecto
        • 🐍2.3.1.3 Instalación de Python, pip3 y VSCode desde WSL
        • 🔰2.3.1.4 Instalación de Anaconda desde WSL
        • ⚗️2.3.1.5 RDKit e instalación de ambientes
      • 👩‍✈️2.3.2 Comandos Linux
        • 📂2.3.2.1 Comandos de navegación
        • 💽2.3.2.2 Exploración y manipulación de archivos
    • 📚Recursos y ejercicios
  • 🧑‍🔬3. Representación molecular
    • 💻3.1 SMILES
    • 💻3.2 SMARTS
    • 💻3.3 InChI Keys
    • 📚Recursos y ejercicios
  • 🔎4. Bases de datos moleculares
    • 💊4.1 PubChem
      • 4.1.1 API
    • 💊4.2 ChEMBL
      • 4.2.1 API
    • 💊4.3 DrugBank
    • 💊4.4 ZINC
    • 💊4.5 ChemSpider
    • 📚Recursos y ejercicios
  • 🗃️5. Construcción y curado de bases de datos moleculares
    • 🧱5.1 Construcción de bases de datos
    • 🧹5.2 Curado de bases de datos
    • 📚Recursos y ejercicios
  • 📊6. Análisis y visualización de información química
    • ✍️6.1 Descriptores moleculares
      • 📈6.1.2 Principios para el Análisis de Bases de Datos Moleculares
      • 🔎6.1.3 Caso de estudio
    • ⚛️6.2 Espacio químico
      • 🎨6.2.1 Multiverso químico y "Chemical art gallery"
    • 📊Recursos y ejercicios
  • 🪞7. Similitud química
    • 🔢7.1 Representación molecular
    • 💱7.2 Función de similitud
    • 📉7.3 Estudios cuantitativos de relación estructura-actividad (QSAR)
    • 🏞️7.4 Panorama y acantilados de actividad
    • 📚Recursos y ejercicios
  • ⚗️8. Enumeración de bibliotecas químicas
    • 👩‍🔬8.1 Reacciones químicas
    • 👨‍🔬8.2 Reglas de transformación
    • 📚Recursos y ejercicios
  • 🔐9. Acoplamiento molecular
    • 9.1 LeDock
    • 9.2 AutoDock Vina
      • 📖9.2.1 Tutorial de acoplamiento
Powered by GitBook
On this page
  • 1. Ejercicio
  • 2. Para saber más:
  1. 7. Similitud química

7.4 Panorama y acantilados de actividad

Previous7.3 Estudios cuantitativos de relación estructura-actividad (QSAR)NextRecursos y ejercicios

Last updated 1 year ago

La exploración de relaciones estructura-actividad (SAR, por sus siglas en inglés, structure-activity relationships) y estructura-propiedad (SPR, por sus siglas en inglés, structure-property relationships) de bases de datos de compuestos, es una de los primeros pasos básicos en el descubrimiento de fármacos. Para este fin, una de los enfoques es cuantificar los panoramas de actividad/propiedad o activity landscapes (ALs), e identificar, si los hay, los acantilados de actividad o activity cliffs (ACs) y los acantilados de similitud ().

Los ALs son definidos como representaciones gráficas que integran la similitud de compuestos y las relaciones de actividad. Representan gráficamente la actividad de compuestos biológicamente relevantes en el espacio químico, haciendo posible visualizar las SAR e identificar compuestos claves y determinantes (ver Figura 1). Compuestos que son similares (estructuralmente hablando) entre sí y similares a sus vecinos en el espacio químico, pero que tienen una alta e inesperada diferencia de actividad (o propiedad), forman los ACs ( and ).

Los ALs ayudan a visualizar las relaciones entre las estructuras moleculares y las actividades biológicas de los compuestos, y ayuda a identificar compuestos que tienen una actividad similar pero una estructura molecular diferente, lo que es muy útil en la selección de compuestos para el cribado biológico. Los ALs revelan regiones de discontinuidad en las SAR, donde pequeños cambios en la química estructural dirigen a grandes cambios en la potencia del compuesto, un escenario frecuentemente encontrado en la optimización de compuestos líderes. Como forma extrema de discontinuidad SAR, los ACs representan las características más destacadas de los ALs y, a menudo, son el principal punto focal de su análisis ().

A continuación se ejemplifican los conceptos de ACs y ALs empleando python.

1. Ejercicio

Con fines prácticos se empleó una base de datos de una serie de compuestos que actúan sobre el blanco terapéutico GPR40. Este blanco es de interés para estudios relacionados a la diabetes tipo II. La base de datos química fue obtenida de CHEMBL. Los parámetros que serán usados para realizar el análisis de similitud son: IC50 y el coeficiente de Tanimoto.

Tras un proceso de curado, se generaron los cálculos de pIC50, diferencia de actividad (Figura 3), similitud molecular empleando el coeficiente de Tanimoto (Figura 4) y el valor SALI (por sus siglas en inglés, Structure-Activity Landscape Index).

En el ejercicio se empleó una escala de color continua desde x (valores bajos SALI) hasta y (valores altos SALI asociados con ACs). Para este segmento se consideró que dos compuestos están conectados si tienen un valor SALI superior al límite de corte establecido (mayor al 70 u 80% de todos los valores).

Considerando lo anterior, se emplearon diferentes métricas, tales como considerar valores superiores al primer, segundo y tercer cuartil (25%, 50% y 75%, respectivamente) de los datos, así como el promedio más dos veces la desviación estándar de los mismos. A continuación se grafican aquellos pares de moléculas que se consideran ACs considerando las métricas anteriores:

2. Para saber más:

Recordemos que la hipótesis común en muchos métodos de modelado QSAR es que la asociación entre estructuras químicas y la propiedad de interés (p. ej. actividad biológica) es continua, es decir, existe una relación directa entre la similitud de la actividad y la similitud estructural de los compuestos. Sin embargo, esta suposición no siempre se cumple si en el conjunto de datos se tienen, los antes mencionados, ACs ().

Los ACs recibieron una fuerte atención en química computacional y en el diseño de fármacos debido a que representan casos de discontinuidad en SAR que fueron perjudiciales para el modelado QSAR, ya que en esta metodología los compuestos ACs fueron considerados falsamente como valores atípicos. Sin embargo, la discontinuidad SAR también se traduce en un gran contenido de información sobre SAR, así como los ACs permiten la identificación de pequeñas modificaciones químicas que determinan la potencia de compuestos activos, puntos que generan interés para la Química Farmacéutica por su potencial aplicación en la optimización de compuestos (). La Figura 2 ilustra ejemplos de ACs.

Modelar y racionalizar ALs requiere aplicar métodos computacionales. Como tal, el concepto de ALs es de relevancia para la quimioinformática (que tiene un fuerte enfoque en la extracción y representación de datos) y la Química Farmacéutica (dada su relevancia inmediata para el análisis SAR) (). Para este propósito Python es una herramienta útil ya que tiene varias bibliotecas que permiten realizar el análisis de datos, la visualización y la creación de modelos de aprendizaje automático que abordan de forma adecuada estos conceptos.

El valor SALI, propuesto por Guha y Van Drie (), es uno de los enfoques más tempranos y sencillos para capturar el ALs de bases de datos de compuestos y rápidamente detectar ACs ():

donde Pi y Pj son los valores de las propiedades de las moléculas i y j, respectivamente, y s(i,j) es la similitud de i y j. En la mayoría de las aplicaciones publicadas de SALI, s(i,j) ha sido calculado como el coeficiente de Tanimoto usando como representación fingerprints moleculares, pero puede ser cuantificado empleando cualquier otra combinación de representación molecular e índice de similitud (),

El valor SALI fue empleado para mapear los ACs en un mapa Similitud Estructura-Actividad (SAS, structure-activity similarity map). Un mapa SAS son representaciones bidimensionales de ALs que contrasta la similitud estructural y la similitud de actividad. En el gráfico se incluyen comparaciones sistemáticas de compuestos por pares. Cada punto en el mapa SAS representa un par de compuestos, los cuales son coloreados según cual es el compuesto más activo de los pares ()

Lo descrito anteriormente está ejemplificado y desarrollado en Python en el repositorio disponible en la sección

Cruz-Monteagudo M, Medina-Franco JL, Pérez-Castillo Y, Nicolotti O, Cordeiro NMDS, Borges F (2014) . Drug Discovery Today 19 (8): 1069–80.

Dagmar S, Bajorath J (2012) . J. Med. Chem. 55 (7): 2932–42.

Dagmar S, Hu H, Bajorath J (2019) ACS Omega 4 (11): 14360–68.

Dunn, Timothy B, López-López E, Kim, TD Medina-Franco JL, Miranda-Quintana RA (2023). . Molecular Informatics 42 (7): e2300056.

Guha R, Van Drie JH (2008). J. Chem. Inf. Model. 48 (3), 646–658.

Javed I, Vogt M, Bajorath J (2020) Journal of Cheminformatics 12 (1): 34.

Maggiora G, Medina-Franco JL, Iqbal J, Vogt M, Bajorath J (2020) . J. Chem. Inf. Model. 60:5873–5880

Muratov EN, Bajorath J, Sheridan RP, Tetko IV, Filimonov D, Poroikov V, Oprea TI, et al. (2020) . Chem. Soc. Rev. 49 (11): 3525–64.

Naveja JJ, Saldívar-González FI, Sánchez-Cruz N, Medina-Franco JL (2019) In Multi-Target Drug Design Using Chem-Bioinformatic Approaches, edited by Kunal Roy, 3–25. New York, NY: Springer New York.

🪞
🏞️
Muratov et al. 2020
Dagmar et al. 2019
Dagmar and Bajorath 2012
Guha and Van Drie 2008
Dunn et al. 2023
Guha and Van Drie 2008
Naveja et al. 2019
Recursos y ejercicios.
Activity Cliffs in Drug Discovery: Dr Jekyll or Mr Hyde?
Exploring Activity Cliffs in Medicinal Chemistry
Evolving Concept of Activity Cliffs.
Exploring Activity Landscapes with Extended Similarity: Is Tanimoto Enough?
Structure--Activity Landscape Index: Identifying and Quantifying Activity Cliffs.
Activity Landscape Image Analysis Using Convolutional Neural Networks.
From Qualitative to Quantitative Analysis of Activity and Property Landscapes
QSAR without Borders
Cheminformatics Approaches to Study Drug Polypharmacology.
Dunn et al. 2023
Javed et al., 2020
Maggiora G et. al, 2020
Dagmar and Bajorath 2012
Figura 3. Mapa de calor de la diferencia de actividad entre los compuestos de la base de datos.
Figura 4. Mapa de calor de la similitud molecular, empleando el coeficiente de Tanimoto, entre los compuestos de la base de datos.
Figura 1. Representación de acantilados de actividad para un par de compuestos A (débilmente potente), B (altamente potente). Los nodos representan compuestos y las flechas indican relaciones de similitud. Recuperado de .
Figura 2. Acantilados de actividad basados en huellas dígitales moleculares y subestructura. En rojo se marcan las diferencias en los grupos R y en otras estructuras. TC: coeficiente de Tanimoto. Recuperado de ().
Dagmar and Bajorath 2012
Dagmar et al. 2019