8. Enumeración de bibliotecas químicas
Last updated
Last updated
Explorar metodologías propuestas en síntesis química para explorar un espacio químico asequible utilizando herramientas quimioinformáticas de acceso abierto.
Familiarizarse con los formatos SMART y SMIRKS para representar reacciones y transformaciones químicas.
Un enfoque para aumentar la probabilidad de encontrar nuevos compuestos líderes en el diseño de fármacos se presenta mediante la generación computacional de bibliotecas químicas (Walters, 2019). Las bibliotecas virtuales pueden construirse siguiendo diferentes enfoques (Figura 1). En este tutorial se generarán bibliotecas químicas usando reacciones y transformaciones químicas descritas en la literatura.
Dependiendo de la información utilizada para guiar el diseño de compuestos, los enfoques respectivos pueden estar basados en ligandos, basados en estructuras o una mezcla de ambos. A su vez, las metodologías basadas en ligandos pueden dividirse en dos categorías principales: (i) enfoques basados en reglas, que emplean un conjunto de reglas de construcción para el ensamblaje de moléculas a partir de un conjunto de 'bloques de construcción' (es decir, reactivos o fragmentos moleculares), y (ii) enfoques libres de reglas, generalmente se basan en modelos generativos de aprendizaje profundo.
Representar reacciones químicas es mucho más complicado que representar estructuras individuales. Para representar reacciones químicas es de particular importancia identificar los reactivos, productos, y si se quiere representar reacciones de manera más genérica, se requiere determinar el centro de reacción, es decir, el conjunto de átomos y enlaces que se modifican durante la reacción. En este sentido, también es importante considerar que el mapeo de átomos depende del mecanismo de reacción.
Como se muestra en Figura 2, si buscamos reacciones en las que hay un grupo carbonilo en el material de partida y alcohol en el producto usando el Query 1, esta búsqueda puede producir resultados no deseados por no mapear de forma correcta. El mapeo de átomos asegura que tanto el grupo carbonilo como el alcohol estén en el sitio de reacción. Sin embargo, es esencial tener en cuenta que el mapeo de átomos depende del mecanismo de reacción, como se muestra en las reacciones 2 y 3 de la Figura 2.
Daylight ha desarrollado SMILES para que puedan usarse para describir reacciones, SMARTS para consultas de reacciones y SMIRKS para describir transformaciones (https://www.daylight.com). La Tabla 1 resume las diferencias entre SMILES, SMARTS y SMIRKS para representar reacciones químicas.
Tabla 1. Comparación entre SMILES, SMARTS y SMIRKS para representar reacciones químicas.
Representación
Reactivo > Agente > Producto
En algunos casos se puede omitir la presencia de agentes.
Reactivo > > Producto
Reactivo > Agente > Producto
Reactivo > >
> Agente >
> > Producto
Consulta
Reactivo > > Producto
Ejemplo
CC(= O)O.OCC > [H+].[Cl-].OCC > CC(= O)OCC
> > [#6][CX3](=O)[#6]
Esta consulta devuelve reacciones en las que el producto contiene cetonas.
Características
El mapeo es siempre la última parte de la expresión del átomo delimitada por dos puntos y es opcional.
Los hidrógenos normalmente se omiten en SMILES.
El mapeo atómico es opcional.
Cualquier reacción SMILES válida es una consulta SMARTS válida.
Cualquier molécula SMARTS válida puede ser un componente de una reacción.
Los SMARTS recursivos solo admiten expresiones moleculares.
Todos los SMIRKS válidos son consultas de reacción válidas.
Los átomos se pueden agregar o eliminar durante una transformación.
Las expresiones SMARTS se pueden usar para describir los átomos directamente involucrados en la reacción (centro de reacción)
La estequiometría se define como 1:1 para todos los átomos del reactivo y del producto de una transformación.
Los hidrógenos explícitos que se utilizan en un lado de una transformación deben aparecer explícitamente en el otro lado de la transformación y deben estar mapeados.
Las expresiones atómicas pueden ser cualquier expresión SMARTS válida para nodos donde el enlace (conectividad y orden de enlace) no cambia.
Uso
Representar reacciones específicas entre reactivos específicos que producen productos específicos.
Los SMARTS se utilizan para buscar reacciones.
SMIRKS se utilizan para representar transformaciones químicas genéricas.
Aplicaciones
Almacenamiento (puede ser un registro de reacciones que se han llevado a cabo en una empresa, un conjunto de planes de reacción en un grupo de investigación académico o incluso un conjunto de reacciones hipotéticas que tal vez nunca tengan éxito en el laboratorio).
Recuperar búsquedas específicas.
Clasificación y categorización de reacciones.
Usando SMIRKS para representar transformaciones químicas, las especificaciones de reacción se pueden almacenar en la base de datos.
Las estructuras se pueden transformar y combinar (reaccionar) para producir nuevas estructuras.
Buscar reacciones y recuperar información relevante de una reacción química es una tarea compleja e implica buscar estructuras químicas de reactivos o productos (completa o parcial), información de transformación (centros de reacción), descripción de reacciones (el tipo de reacción, comentarios generales) y datos numéricos sobre la reacción experimental (rendimiento, selectividad, condiciones de reacción, etc.).
Las principales bases de datos de reacciones que ayudan a organizar, almacenar y recuperar datos han sido descritas por Papadakis et al. (Papadakis et al. 2017). La base de datos de reacciones CASREACT se destaca por contener el número más significativo de reacciones reportadas, más de 150 millones de reacciones de un solo paso y de múltiples pasos, que datan desde 1840 hasta la fecha. Esta base de datos se puede utilizar para proporcionar información sobre diferentes formas de producir el mismo producto, buscar aplicaciones de un catalizador particular y varias formas de llevar a cabo transformaciones de grupos funcionales específicos. Otra base de datos de reacciones es REAXYS, basada en las bases de datos de química líderes en la industria de Elsevier que incluyen datos de más de 49 millones de reacciones, que datan desde 1771 hasta la fecha. Incluye muchos compuestos (orgánicos, inorgánicos y organometálicos) y detalles de reacciones experimentales (rendimiento, disolventes, etc.). Permite buscar reacciones, sustancias, fórmulas y datos como datos de propiedades fisicoquímicas y espectros. Además, la base de datos REAXYS se puede utilizar para la planificación de rutas de síntesis (Goodman J, 2009).
WebReactions de Open Molecules es un ejemplo de una base de datos de reacciones de acceso abierto. Introduce un nuevo concepto para recuperar reacciones de una gran base de datos en la que las reacciones están indexadas por los cambios de enlace que ocurren y el efecto de los grupos circundantes sobre dichos enlaces. A diferencia de las bases de datos de reacciones convencionales que trabajan en la búsqueda de subestructuras de reacciones, WebReactions realiza una búsqueda de similitudes de reacciones personalizables centrándose en el centro de reacción.
Por ejemplo, la síntesis de fentanilo, un potente analgésico opioide, y sus derivados sintéticos implican una aminación reductiva que se puede buscar en WebReactions. Como se muestra en la Figura 3 a, una vez dibujada la reacción de interés, los centros de reacción se definen (rojo) y se puede establecer un rendimiento mínimo y las características de los átomos circundantes. En este caso, hay siete reacciones coincidentes; en las figuras 3 b-d se muestran tres ejemplos, que muestran cómo se podrían llevar a cabo reacciones similares bajo diferentes agentes reductores y condiciones. Cada resultado proporciona el reactivo, el producto y el catalizador, y la referencia del artículo original. Un laboratorio de síntesis puede seleccionar reacciones candidatas en función del mayor rendimiento posible o de los recursos (como reactivos) que están fácilmente disponibles.
Papadakis E, Anantpinijwatna A, Woodley J, Gani R (2017) A reaction database for small molecule pharmaceutical processes integrated with process information. Processes. 5, 58.
Pitt WR, Kroeplien B (2013) Exploring virtual scaffold spaces. In: Brown N (ed) Methods and Principles in Medicinal Chemistry. Wiley, London, pp 83–104.
Saldívar-González FI, Huerta-García CS. & Medina-Franco JL. (2020) Chemoinformatics-based enumeration of chemical libraries: a tutorial. J Cheminform 12, 64.
Walters WP (2019) Virtual chemical libraries. J Med Chem. 62, 1116–1124.
[C:1]([O,Cl:5]) = [O:2].[N:3][H:4] > > [N:3][C:1] = [O:2]. [*:5][H:4][C]([O,Cl]) = [O].[N][H] > > [N][C] = [O].[*][H]