💻
Quimioinformática
GitHub
  • 📖Quimioinformática aplicada al diseño de fármacos
  • 🔎1. Búsqueda de información química
    • 📑1.1 SciFinder-n
    • 📑1.2 Web of Science
    • 📑1.3 Scopus
    • 📑1.4 CAS Source Index (CASSI)
    • 📑1.5 Herramientas de visualización bibliométrica
  • 🐍2. Introducción a Python, Google Colab y Linux
    • 💻2.1 Fundamentos de programación
    • 🧹2.2 Manejo y limpieza de datos
    • 🐧2.3 Linux
      • 🪟2.3.1 Subsistema de Windows para Linux (WSL)
        • 👩‍💻2.3.1.1 Creación de usuarios
        • 🧑‍💻2.3.1.2 Selección de usuario de inicio por defecto
        • 🐍2.3.1.3 Instalación de Python, pip3 y VSCode desde WSL
        • 🔰2.3.1.4 Instalación de Anaconda desde WSL
        • ⚗️2.3.1.5 RDKit e instalación de ambientes
      • 👩‍✈️2.3.2 Comandos Linux
        • 📂2.3.2.1 Comandos de navegación
        • 💽2.3.2.2 Exploración y manipulación de archivos
    • 📚Recursos y ejercicios
  • 🧑‍🔬3. Representación molecular
    • 💻3.1 SMILES
    • 💻3.2 SMARTS
    • 💻3.3 InChI Keys
    • 📚Recursos y ejercicios
  • 🔎4. Bases de datos moleculares
    • 💊4.1 PubChem
      • 4.1.1 API
    • 💊4.2 ChEMBL
      • 4.2.1 API
    • 💊4.3 DrugBank
    • 💊4.4 ZINC
    • 💊4.5 ChemSpider
    • 📚Recursos y ejercicios
  • 🗃️5. Construcción y curado de bases de datos moleculares
    • 🧱5.1 Construcción de bases de datos
    • 🧹5.2 Curado de bases de datos
    • 📚Recursos y ejercicios
  • 📊6. Análisis y visualización de información química
    • ✍️6.1 Descriptores moleculares
      • 📈6.1.2 Principios para el Análisis de Bases de Datos Moleculares
      • 🔎6.1.3 Caso de estudio
    • ⚛️6.2 Espacio químico
      • 🎨6.2.1 Multiverso químico y "Chemical art gallery"
    • 📊Recursos y ejercicios
  • 🪞7. Similitud química
    • 🔢7.1 Representación molecular
    • 💱7.2 Función de similitud
    • 📉7.3 Estudios cuantitativos de relación estructura-actividad (QSAR)
    • 🏞️7.4 Panorama y acantilados de actividad
    • 📚Recursos y ejercicios
  • ⚗️8. Enumeración de bibliotecas químicas
    • 👩‍🔬8.1 Reacciones químicas
    • 👨‍🔬8.2 Reglas de transformación
    • 📚Recursos y ejercicios
  • 🔐9. Acoplamiento molecular
    • 9.1 LeDock
    • 9.2 AutoDock Vina
      • 📖9.2.1 Tutorial de acoplamiento
Powered by GitBook
On this page
  • 1. Caso de estudio
  • 1.1 Revisión de literatura
  • 1.2 Construcción desde cero
  • 1.3 Uso de SciFinder para la recopilación de compuestos
  • 1.4 Servidores para dibujar moléculas a partir de imágenes
  • Para saber más:
  1. 5. Construcción y curado de bases de datos moleculares

5.1 Construcción de bases de datos

Previous5. Construcción y curado de bases de datos molecularesNext5.2 Curado de bases de datos

Last updated 28 days ago

El punto clave de la construcción de bases de datos es definir los objetivos y criterios para la información que va a ser recolectada. Es decir, el usuario debe identificar cuáles son las características principales que desea implementar en la base de datos.

Preguntas que deben ser respondidas antes de empezar la construcción de una base de datos son las siguientes:

  • ¿Qué tipo de compuestos debe contener?

  • ¿Qué tipo de parámetros serán analizados?

  • ¿Se puede conseguir la información a partir de bases de datos públicas? De lo contrario, ¿debe construirse desde cero?

1. Caso de estudio

Por ejemplo, digamos que el usuario tiene el objetivo de comenzar a construir una base de datos relacionada a medicamentos que son usados en el ámbito de la salud mental. Existen diferentes formas de abordar esta tarea. A continuación, se revisarán una serie de recomendaciones generales.

1.1 Revisión de literatura

La primera recomendación es revisar la literatura científica sobre el tipo de compuestos esperamos encontrar o cuales se están usando actualmente. Puede consultar la sección de para obtener mayor detalles.

Consultado referencias bibliográficas y literatura sobre el tema en este caso, medicinas usadas en el ámbito de la salud mental podemos adentrarnos al tema y responder preguntas básicas:

  • ¿Qué medicamentos se usan actualmente?

  • ¿Cuál es el mecanismo de estos medicamentos? Es decir, ¿sobre qué objetivos biológicos tienen su efecto terapéutico?

A partir de aquí, el usuario cuenta con un parámetro de selección que puede establecer para definir qué tipos de compuestos incluirá o no en la base de datos. Posteriormente, deberá elegir el método con el cual se agregarán esos compuestos. Es decir, ¿existe alguna base de datos pública que cumpla con el parámetro de elección? De no ser así, ¿el usuario puede construir la base de datos a partir de distintas fuentes?

1.2 Construcción desde cero

A continuación, se mostrará un ejemplo de cómo pueden obtenerse componentes de forma individual para construirla desde cero.

El objetivo del usuario es crear una base de datos con estos compuestos. El tipo de información esencial para cualquier base de datos es el nombre o ID del compuesto y su representación en notación SMILES.

Esto puede hacerse de diferentes formas:

  • Construir las moléculas con un editor de estructuras químicas.

  • Buscar directamente el nombre y/o representación de las moléculas.

  • Utilizar un software para convertir compuestos de formato de imagen a una representación lineal, por ejemplo, SMILES.

La base de los compuestos es la siguiente:

Comencemos con la recopilación de compuestos.

  1. Primer compuesto.

Representación SMILES: [H]\C(=N/OCC(O)CNN1CCCC1)C1=CC(OC2CCCC2)=C(OC)C=C1.

  1. Compuestos derivados

Se repite el proceso para los compuestos derivados.

Representación SMILES: [H]\C(=N/OCC(O)CNN1CCCCC1)C1=CC(OC2CCCC2)=C(OC)C=C1.

Con esta información, el usuario procede a almacenar la información en una hoja de cálculo.

Este ejemplo se realizó con solo cinco compuestos, pero el usuario define la cantidad de compuestos que estarán en la base de datos.

Una vez que el usuario terminó de recopilar la información en la hoja de cálculo, debemos guardar el archivo en formato csv (delimitado por comas) para su posterior manejo.

Si cargamos nuestro archivo en formato csv y lo guardamos en nuestra carpeta de trabajo, podemos visualizar la información que hemos recopilado.

import numpy as np
import pandas as pd

# For database in .csv
df = pd.read_csv("EjemploBasedeDatos.csv")
df

Es importante mencionar que el usuario puede elegir distintas formas de construir la base de datos. Es decir, el usuario con base en los criterios de selección previamente establecidos debe elegir entre distintas maneras de obtener compuestos. A continuación, se presentarán algunas alternativas que pueden ser útiles.

1.3 Uso de SciFinder para la recopilación de compuestos

En el buscador de SciFinder, ingresamos el nombre del artículo que elegimos en la Sección 1.2.

A continuación, seleccionamos el artículo e ingresamos a la sección de "Substances".

Para este artículo en específico, se encontraron 75 resultados de diferentes compuestos. Es importante mencionar que no todos los compuestos deben ser agregados a la base de datos. El usuario debe seleccionar con cuidado qué compuestos deben ser agregados o no.

Una facilidad que otorga SciFinder es que podemos acceder directamente a la representación de los compuestos que se encuentran dentro del artículo. Es decir, a diferencia del método utilizado en la seción 1.2 en donde el usuario dibujaba sus propias estructuras, con SciFinder podemos obtener directamente tanto el nombre como la representación en formato SMILES. Para obtener el nombre del compuesto así como su representación tipo SMILES, ingresar a la sección denominada 'Other Names and Identifiers'.

El usuario puede descargar todos los resultados en formato 'xlsx' (es decir, hoja de cálculo) y desde el archivo de excel modificar las entradas que desee para solo quedarse con los compuestos que cumpla con los criterios de selección.

1.4 Servidores para dibujar moléculas a partir de imágenes

Para saber más:

Siguiendo con la revisión de literatura referente al desarrollo de inhibidores de fosfodiesterasas, se encuentra el artículo . En este se reporta la síntesis de una serie de compuestos análogos al , compuesto con efectos antidepresivos (Figura 1).

En este caso en particular, no se cuenta con las representaciones y/o nombres en particular de cada compuesto así que usaremos un editor de estructuras químicas (); pero el usuario es libre de elegir otro software.

es una aplicación web para extraer estructuras químicas de archivos en pdf. Sólo tiene que cargar un documento pdf, una o varias imágenes que contengan representaciones de estructuras químicas. Si se carga un documento pdf, se utiliza DECIMER Segmentation para detectar y segmentar todas las representaciones de estructuras químicas. Las representaciones de estructuras químicas detectadas o cargadas se procesan utilizando el motor OCSR de DECIMER V2. Las representaciones de estructuras químicas y la correspondiente representación SMILES se presentan más arriba. Además, las estructuras químicas se pueden editar según sus necesidades del usuario utilizando el editor de estructuras químicas de Ketcher y, antes de descargar las imágenes segmentadas y los archivos mol correspondientes. Además, los nombres IUPAC de las estructuras químicas pueden resolverse utilizando .

DECIMER. Recuperado el 16 de octubre de 2023 de .

Rajan K, Brinkhaus HO, Agea MI, Zielesny A, Steinbeck C (2023) ChemRxiv. doi: 10.26434/chemrxiv-2023-xhcx9.

Rajan K, Zielesny A and Steinbeck C (2021) . J Cheminform 13:34.

Saldívar González FI, Chávez Ponce de León DE, López López E, Francisco Hernández L, Lira Rocha A, Medina Franco JL (2028) . UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO pp 18-26.

🗃️
🧱
Búsqueda de información química
New Selective Phosphodiesterase 4D Inhibitors Differently Acting on Long, Short, and Supershort Isoforms
artículo
rolipram
Marvin Sketch
DECIMER
STOUT V2
https://decimer.ai/
DECIMER.ai - An open platform for automated optical chemical structure identification, segmentation and recognition in scientific publications.
STOUT: SMILES to IUPAC names using neural machine translation
Manual de Quimioinformática
Figura 2. Compuesto base.
Figura 3. Primer compuesto derivado.
Figura 4. Quinto compuesto derivado.*Tacm: Trimetil acetamido metilo.
Figura 5. Adición de compuestos a una hoja de cálculo.
Figura 6. Resultado final de la recopilación de información.
Figura 7: En el buscador de SciFinder, ingresamos el nombre del artículo que elegimos en la Sección 1.4.1.. Recopilación de compuestos a través de SciFinder.
FIgura 8. Recopilación de compuestos a través de SciFinder
Figura 9. Compuestos encontrados dentro del artículo seleccionado.
Figura 1. Compuestos similares al Rolipram. Fuente:
Bruno O et al., J Med Chem. 2009, 52:6546-57