💻
Quimioinformática
GitHub
  • 📖Quimioinformática aplicada al diseño de fármacos
  • 🔎1. Búsqueda de información química
    • 📑1.1 SciFinder-n
    • 📑1.2 Web of Science
    • 📑1.3 Scopus
    • 📑1.4 CAS Source Index (CASSI)
    • 📑1.5 Herramientas de visualización bibliométrica
  • 🐍2. Introducción a Python, Google Colab y Linux
    • 💻2.1 Fundamentos de programación
    • 🧹2.2 Manejo y limpieza de datos
    • 🐧2.3 Linux
      • 🪟2.3.1 Subsistema de Windows para Linux (WSL)
        • 👩‍💻2.3.1.1 Creación de usuarios
        • 🧑‍💻2.3.1.2 Selección de usuario de inicio por defecto
        • 🐍2.3.1.3 Instalación de Python, pip3 y VSCode desde WSL
        • 🔰2.3.1.4 Instalación de Anaconda desde WSL
        • ⚗️2.3.1.5 RDKit e instalación de ambientes
      • 👩‍✈️2.3.2 Comandos Linux
        • 📂2.3.2.1 Comandos de navegación
        • 💽2.3.2.2 Exploración y manipulación de archivos
    • 📚Recursos y ejercicios
  • 🧑‍🔬3. Representación molecular
    • 💻3.1 SMILES
    • 💻3.2 SMARTS
    • 💻3.3 InChI Keys
    • 📚Recursos y ejercicios
  • 🔎4. Bases de datos moleculares
    • 💊4.1 PubChem
      • 4.1.1 API
    • 💊4.2 ChEMBL
      • 4.2.1 API
    • 💊4.3 DrugBank
    • 💊4.4 ZINC
    • 💊4.5 ChemSpider
    • 📚Recursos y ejercicios
  • 🗃️5. Construcción y curado de bases de datos moleculares
    • 🧱5.1 Construcción de bases de datos
    • 🧹5.2 Curado de bases de datos
    • 📚Recursos y ejercicios
  • 📊6. Análisis y visualización de información química
    • ✍️6.1 Descriptores moleculares
      • 📈6.1.2 Principios para el Análisis de Bases de Datos Moleculares
      • 🔎6.1.3 Caso de estudio
    • ⚛️6.2 Espacio químico
      • 🎨6.2.1 Multiverso químico y "Chemical art gallery"
    • 📊Recursos y ejercicios
  • 🪞7. Similitud química
    • 🔢7.1 Representación molecular
    • 💱7.2 Función de similitud
    • 📉7.3 Estudios cuantitativos de relación estructura-actividad (QSAR)
    • 🏞️7.4 Panorama y acantilados de actividad
    • 📚Recursos y ejercicios
  • ⚗️8. Enumeración de bibliotecas químicas
    • 👩‍🔬8.1 Reacciones químicas
    • 👨‍🔬8.2 Reglas de transformación
    • 📚Recursos y ejercicios
  • 🔐9. Acoplamiento molecular
    • 9.1 LeDock
    • 9.2 AutoDock Vina
      • 📖9.2.1 Tutorial de acoplamiento
Powered by GitBook
On this page
  • Google Colaboratory PubChem
  • Google Colaboratory ChEMBL
  1. 4. Bases de datos moleculares

Recursos y ejercicios

Previous4.5 ChemSpiderNext5. Construcción y curado de bases de datos moleculares

Last updated 12 months ago

Google Colaboratory PubChem

En el siguiente cuaderno de código se ilustran diversos ejercicios para la obtención información química de la base de datos PubChem.

Ejercicios
  1. Identifique compuestos que contienen la palabra “benzylpiperidine” como parte de su nombre. Para realizar esta búsqueda se pueden establecer los siguientes criterios:

input =  "compund/name/{name}"
operation =  "cids"
output =  "txt"
options= ?name_type=word 

a) Indique la URL para realizar esta búsqueda:

b) Utilice la función len para saber cuántos compuestos se obtienen con esta búsqueda e indique el número obtenido:

a) Desglose su búsqueda e indique el input, operation y output:

b) Indique la URL para realizar esta búsqueda:

  1. Busque compuestos con similitud mayor a 85% del siguiente SMILES: CC1CC2=C(C3(N1)C4=C(C=CC(=C4)Cl)NC3=O)NC5=CC(=C(C=C25)F)Cl

a) Desglose su búsqueda e indique el input, operation y output:

b) Indique la URL para realizar esta búsqueda.

  1. Realice una búsqueda de compuestos que contengan como subestructura una de las estructuras privilegiadas definida en los ejercicios de representación molecular. En caso de filtrarse compuestos erróneos, corregir el SMARTS de consulta.

a) Desglose su búsqueda. Indique el input, operation y output.

b) Indique la URL para realizar esta búsqueda.

c) Muestre ejemplos de los compuestos identificados-

Google Colaboratory ChEMBL

En el siguiente cuaderno de código se ilustran diversos ejercicios para la obtención información química de la base de datos ChEMBL.

Ejercicios

Realiza las siguientes búsquedas, considerando que cada punto no es secuencial:

  1. A partir del nombre “ibuprofeno”, obtén la información asociada al nombre preferido, el ID de ChEMBL, los sinónimos de la molécula, la fase clínica máxima, la clasificación ATC, la información asociada a la estructura molecular y la información asociada a las propiedades moleculares.

  2. ¿Cuántas moléculas en ChEMBL contienen la subestructura correspondiente a la quinazolina (SMILES: C1=CC=C2C(=C1)C=NC=N2)?

  3. Identifica la cantidad de las moléculas que tienen más del 75% de similitud con el naproxeno, así cómo la/las moléculas con mayor similitud.

  4. ¿Cuántas moléculas se encuentran en fase clínica 3 considerando todo ChEMBL?

  5. ¿Cuántas moléculas están catalogadas como NO bioterapeuticas considerando todo ChEMBL?

Ejercicio global:

  1. Selecciona un blanco molecular de tu interés, preferiblemente una proteína.

  2. Obtén el ID de ese blanco a través de UniProt.

  3. Obtén los blancos moleculares asociados a ese ID de Uniprot empleando la API.

  4. Descarga los datos de actividad asociados a los target_chembl_id obtenidos en el paso anterior, considerando únicamente las siguientes columnas: "molecule_chembl_id", "canonical_smiles", "standard_value", "standard_units", "target_chembl_id" y "target_organism".

  5. Utilizando los "molecule_chembl_id" obtenidos, recopila la información molecular de todas las entradas previamente obtenidas y genera un DataFrame.

  6. Aplica los siguientes filtros al DataFrame resultante:

- Elimina los duplicados basados en los SMILES canónicos.

- Conserva las moléculas que no violen ninguna de las cinco reglas de Lipinski.

c) Corrobore esta información entrando a Entrez () en búsqueda avanzada y usando el índice [synonym]. Muestre una captura de pantalla de su búsqueda.

Obtenga un archivo csv con los SMILES canónicos de al menos 5 compuestos identificados en el punto anterior. Adicionalmente, puede agregar otras propiedades (revisar el siguiente link para seleccionar propiedades moleculares )

🔎
📚
https://www.ncbi.nlm.nih.gov/pccompound/
https://pubchem.ncbi.nlm.nih.gov/docs/pug-rest#section=Compound-Property-Tables
Google Colaboratory
Logo
Google Colaboratory
Logo