Recursos y ejercicios
Last updated
Last updated
En este cuaderno de código analizaremos una base de datos con información sobre fármacos en fase 4 (aprobados y comercializados) con 1677 moléculas, descargadas de ChEMBL. Calcularemos descriptores basados en propiedades fisicoquímicas y con los valores se obtendrán distintas gráficas de una variable. Se calcularán también coeficientes de correlación de Pearson para graficar heatmaps. Obtendremos scaffolds de Murcko y su frecuencia, además de otros descriptores como QED y SAscore.
Ingrese a Magic Rings (https://bit.ly/magicrings), verá gráfico de PCA con 39 449 anillos de importancia en el diseño de fármacos. Los puntos que representan los anillos bioactivos están marcados por color. El eje x representa aproximadamente el tamaño de los anillos (pequeño a la izquierda, grande a la derecha) y el eje y representa la complejidad de los anillos. La parte inferior del gráfico contiene moléculas menos complejas y la superior, más complejas. A partir de este gráfico, identifique 3 anillos bioactivos con actividad epigenética, 3 con actividad en proteínas cinasas y 3 con actividad en receptores acoplados a proteína G (GPCR). Describa si esos anillos pertenecen a zonas pobladas o poco exploradas del espacio químico.
Elija una base de datos curada para la visualización del espacio químico.
a) Describa brevemente el origen y contenido de la base de datos.
b) Concatenar la base de datos elegida con dos de las utilizadas en el cuaderno de código: FDA y BIOFACQUIM.
Con las tres bases concatenadas:
c) Obtenga la visualización del espacio químico, con las seis propiedades ejemplificadas en el cuaderno de código y utilice PCA como método de reducción de dimensiones.
d) Incluya la gráfica de barras con la explicación de la varianza.
e) Escriba una interpretación de la visualización del espacio químico. ¿La base de datos elegida comparte espacio químico con alguna otra? ¿Es esperado o no esperado, ventaja o desventaja? ¿A qué podría deberse?
Con las mismas tres bases concatenadas del punto anterior:
f) Obtenga la visualización del espacio químico, con las seis propiedades ejemplificadas durante la sesión y t-SNE como método de reducción de dimensiones. Adjunte captura de pantalla del código utilizado.
g) Escriba una interpretación de la visualización del espacio químico. ¿La base de datos elegida comparte espacio químico con alguna otra? ¿Es esperado o no esperado, ventaja o desventaja? ¿A qué podría deberse?