🔎4. Bases de datos moleculares

Objetivos

Familiarizarse con el uso de bases de datos relacionadas con la investigación de fármacos como: ChEMBL, PubChem, Drugbank y ZINC.
Identificar el tipo de información disponible en cada uno de estos recursos, de tal manera que la búsqueda de información se realice en forma sencilla y eficiente.
Familiarizarse con el uso de APIs para acceder a información disponible en bases de datos públicas mediante programación.

Introducción

Una base de datos moleculares es una estructura organizada de almacenamiento de información relacionada con sustancias químicas y sus propiedades. Estas bases almacenan datos sobre compuestos químicos, como su estructura molecular, propiedades físicas y químicas, actividades biológicas, entre otros detalles relevantes y pueden ser utilizadas en diversos campos de la química. En la investigación en fármacos, las bases de datos usadas con frecuencia son PubChem, ChEMBL, ZINC, ChemSpider y DrugBank (Bender 2010, Nicola et al. 2012). La Tabla 1 resume diferentes bases de datos químicos y el tipo de información disponible en cada una de ellas.

Acceder a estas bases de datos moleculares permite comprender el contenido de un repositorio de datos e identificar relaciones numéricas, patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto (Engel 2003).

Tabla 1. Páginas disponibles en línea para búsqueda y recuperación de información química.

Base de datos

Tipo de información

Estructuras químicas y propiedades fisicoquímicas

CAS Registry

CAS Registry contiene más de 167 millones de sustancias químicas orgánicas e inorgánicas únicas, como aleaciones, compuestos de coordinación, minerales, mezclas, polímeros y sales, y más de 68 millones de biosecuencias.

ChemSpider

Estructuras químicas de compuestos de interés y la predicción de muchos parámetros fisicoquímicos.

Disponibilidad en el mercado

ZINC

Compuestos químicos disponibles en el mercado.

eMolecules

Contiene más de 6 millones de moléculas de proveedores comerciales, como Acros, Asinex, ChemBridge, ChemDiv, ComGenex, Enamine, Fluka, Key Organics, Maybridge, Otava, Sigma-Aldrich, y muchos más.

Patentes

SureChEMBL

Productos químicos de patentes de texto completo.

Diseño de fármacos/Información Biológica

PubChem

Sustancias, estructuras y datos de bioactividad.

ChEMBL

Dianas moleculares, moléculas bioactivas con propiedades farmacéuticas.

DRUGBANK

Fármacos aprobados por la FDA* (moléculas pequeñas y biotecnológicos), nutracéuticos y fármacos en fase experimental con datos farmacológicos, ADME-Tox.**

Otras

ChEBI

Base de datos y ontología de entidades químicas de interés biológico.

Protein Data Bank (PDB)

Datos sobre estructuras macromoleculares biológicas.

En las bases de datos químicas, existen varios tipos de búsquedas que permiten a los usuarios recuperar información específica. La Figura 1 muestra los tipos de búsquedas más frecuentes en bases de datos moleculares que son:

Búsqueda por nombre químico o formula molecular.
Búsqueda por estructura (aquí pueden emplearse las representaciones moleculares vistas en la sección 3).
Búsqueda por propiedades físicas o químicas.
Búsqueda por similitud (p. ej. similitud estructural por huellas moleculares, o bien, por similitud de propiedades moleculares).
Búsqueda por subestructura y/o superestructura.
Búsqueda farmacofórica.
Búsqueda por proveedor o por fuente.
Búsqueda por actividad biológica, útil en el ámbito de la química farmacéutica para buscar compuestos en función de su actividad biológica, por ejemplo, compuestos con actividad antibacteriana o anticancerígena.

La combinación de diferentes tipos de búsquedas puede ser útil para obtener resultados más precisos y relevantes. En las siguientes secciones se detalla el procedimiento para realizar búsquedas en las bases de datos más comúnmente utilizadas en la investigación para diseño de fármacos.

En el campo de la quimioinformática, el acceso a bases de datos a través de servidores web se ha vuelto esencial para la investigación y el desarrollo de nuevos fármacos. Las API (Interfaces de Programación de Aplicaciones, por sus siglas en inglés) juegan un papel crucial en este proceso al permitir la comunicación entre diferentes sistemas informáticos y facilitar la extracción de datos con una serie de códigos de programación.

API

Las API en quimioinformática proporcionan una interfaz estructurada y estandarizada que permite a los investigadores acceder a una variedad de bases de datos biomoleculares y químicas de manera eficiente. Estas API suelen ofrecer funciones para realizar consultas específicas, recuperar información detallada sobre compuestos químicos, proteínas, actividades biológicas, y más. Además, suelen estar respaldadas por documentación detallada que describe cómo utilizarlas y qué tipos de consultas se pueden realizar.

Una API es un conjunto de reglas y protocolos que permite que dos aplicaciones se comuniquen entre sí. En términos simples, una API define cómo los componentes de software deben interactuar.

Su uso facilita la integración y la interoperabilidad entre sistemas diferentes. Además, proporcionan una capa de abstracción, lo que significa que un desarrollador puede interactuar con la funcionalidad de un sistema sin necesidad de conocer los detalles internos de su implementación. Para ejemplificar lo anterior, puede pensar en una API como un mesero en un restaurante, quien le atiende y toma su orden, esta última se la hace llegar al chef del restaurante con la solicitud, quien prepara y entrega lo solicitado al mesero. Este lleva la comida ordenada y directamente a su mesa (ver Figura 1).

Para saber más:

Bender A (2010) Compound bioactivities go public. Nat Chem Biol. 6:309. doi: 10.1038/nchembio.354
Engel T (2003) Databases and data sources in Chemistry. In: Gasteiger J, Engel T (eds) Chemoinformatics, 1st edn. Wiley-VCH, Weinheim.
Miller MA (2002) Chemical database techniques in drug discovery. Nat Rev Drug Discov. 1:220–227. doi: 10.1038/nrd745
Nicola G, Liu T, Gilson MK (2012) Public domain databases for Medicinal Chemistry. J. Med. Chem. 55:6987-7002. doi: 10.1021/jm300501t
Public Chemical Databases. https://chem.libretexts.org/Courses/Intercollegiate_Courses/Cheminformatics/03%3A_Database_Resources_in_Cheminformatics/3.03%3A_Public_Chemical_Databases Fecha de acceso: Diciembre de 2023.

PreviousRecursos y ejercicios Next4.1 PubChem

Last updated 9 months ago

hashtagObjetivos

hashtagIntroducción

hashtagAPI

hashtagPara saber más:

Objetivos

Introducción

API

Para saber más: