4. Bases de datos moleculares
Objetivos
Familiarizarse con el uso de bases de datos relacionadas con la investigación de fármacos como: ChEMBL, PubChem, Drugbank y ZINC.
Identificar el tipo de información disponible en cada uno de estos recursos, de tal manera que la búsqueda de información se realice en forma sencilla y eficiente.
Familiarizarse con el uso de APIs para acceder a información disponible en bases de datos públicas mediante programación.
Introducción
Una base de datos moleculares es una estructura organizada de almacenamiento de información relacionada con sustancias químicas y sus propiedades. Estas bases almacenan datos sobre compuestos químicos, como su estructura molecular, propiedades físicas y químicas, actividades biológicas, entre otros detalles relevantes y pueden ser utilizadas en diversos campos de la química. En la investigación en fármacos, las bases de datos usadas con frecuencia son PubChem, ChEMBL, ZINC, ChemSpider y DrugBank (Bender 2010, Nicola et al. 2012). La Tabla 1 resume diferentes bases de datos químicos y el tipo de información disponible en cada una de ellas.
Acceder a estas bases de datos moleculares permite comprender el contenido de un repositorio de datos e identificar relaciones numéricas, patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto (Engel 2003).
Tabla 1. Páginas disponibles en línea para búsqueda y recuperación de información química.
Estructuras químicas y propiedades fisicoquímicas
CAS Registry contiene más de 167 millones de sustancias químicas orgánicas e inorgánicas únicas, como aleaciones, compuestos de coordinación, minerales, mezclas, polímeros y sales, y más de 68 millones de biosecuencias.
Estructuras químicas de compuestos de interés y la predicción de muchos parámetros fisicoquímicos.
Disponibilidad en el mercado
Compuestos químicos disponibles en el mercado.
Contiene más de 6 millones de moléculas de proveedores comerciales, como Acros, Asinex, ChemBridge, ChemDiv, ComGenex, Enamine, Fluka, Key Organics, Maybridge, Otava, Sigma-Aldrich, y muchos más.
Patentes
Productos químicos de patentes de texto completo.
Diseño de fármacos/Información Biológica
Sustancias, estructuras y datos de bioactividad.
Dianas moleculares, moléculas bioactivas con propiedades farmacéuticas.
Fármacos aprobados por la FDA* (moléculas pequeñas y biotecnológicos), nutracéuticos y fármacos en fase experimental con datos farmacológicos, ADME-Tox.**
Otras
Base de datos y ontología de entidades químicas de interés biológico.
Datos sobre estructuras macromoleculares biológicas.
En las bases de datos químicas, existen varios tipos de búsquedas que permiten a los usuarios recuperar información específica. La Figura 1 muestra los tipos de búsquedas más frecuentes en bases de datos moleculares que son:
Búsqueda por nombre químico o formula molecular.
Búsqueda por estructura (aquí pueden emplearse las representaciones moleculares vistas en la sección 3).
Búsqueda por propiedades físicas o químicas.
Búsqueda por similitud (p. ej. similitud estructural por huellas moleculares, o bien, por similitud de propiedades moleculares).
Búsqueda por subestructura y/o superestructura.
Búsqueda farmacofórica.
Búsqueda por proveedor o por fuente.
Búsqueda por actividad biológica, útil en el ámbito de la química farmacéutica para buscar compuestos en función de su actividad biológica, por ejemplo, compuestos con actividad antibacteriana o anticancerígena.
La combinación de diferentes tipos de búsquedas puede ser útil para obtener resultados más precisos y relevantes. En las siguientes secciones se detalla el procedimiento para realizar búsquedas en las bases de datos más comúnmente utilizadas en la investigación para diseño de fármacos.
En el campo de la quimioinformática, el acceso a bases de datos a través de servidores web se ha vuelto esencial para la investigación y el desarrollo de nuevos fármacos. Las API (Interfaces de Programación de Aplicaciones, por sus siglas en inglés) juegan un papel crucial en este proceso al permitir la comunicación entre diferentes sistemas informáticos y facilitar la extracción de datos con una serie de códigos de programación.
API
Las API en quimioinformática proporcionan una interfaz estructurada y estandarizada que permite a los investigadores acceder a una variedad de bases de datos biomoleculares y químicas de manera eficiente. Estas API suelen ofrecer funciones para realizar consultas específicas, recuperar información detallada sobre compuestos químicos, proteínas, actividades biológicas, y más. Además, suelen estar respaldadas por documentación detallada que describe cómo utilizarlas y qué tipos de consultas se pueden realizar.
Una API es un conjunto de reglas y protocolos que permite que dos aplicaciones se comuniquen entre sí. En términos simples, una API define cómo los componentes de software deben interactuar.
Su uso facilita la integración y la interoperabilidad entre sistemas diferentes. Además, proporcionan una capa de abstracción, lo que significa que un desarrollador puede interactuar con la funcionalidad de un sistema sin necesidad de conocer los detalles internos de su implementación. Para ejemplificar lo anterior, puede pensar en una API como un mesero en un restaurante, quien le atiende y toma su orden, esta última se la hace llegar al chef del restaurante con la solicitud, quien prepara y entrega lo solicitado al mesero. Este lleva la comida ordenada y directamente a su mesa (ver Figura 1).
Para saber más:
Bender A (2010) Compound bioactivities go public. Nat Chem Biol. 6:309. doi: 10.1038/nchembio.354
Engel T (2003) Databases and data sources in Chemistry. In: Gasteiger J, Engel T (eds) Chemoinformatics, 1st edn. Wiley-VCH, Weinheim.
Miller MA (2002) Chemical database techniques in drug discovery. Nat Rev Drug Discov. 1:220–227. doi: 10.1038/nrd745
Nicola G, Liu T, Gilson MK (2012) Public domain databases for Medicinal Chemistry. J. Med. Chem. 55:6987-7002. doi: 10.1021/jm300501t
Public Chemical Databases. https://chem.libretexts.org/Courses/Intercollegiate_Courses/Cheminformatics/03%3A_Database_Resources_in_Cheminformatics/3.03%3A_Public_Chemical_Databases Fecha de acceso: Diciembre de 2023.
Last updated