🪞7. Similitud química

Objetivos:

  • Introducir el concepto de similitud química y a sus aplicaciones en el diseño de fármacos.

  • Conocer los componentes básicos para evaluar la similitud entre compuestos químicos.

  • Establecer relaciones entre la similitud estructural y la actividad biológica de compuestos químicos mediante estudios cuantitativos de relación estructura-actividad (QSAR) y panoramas de actividad. Asimismo, identificar sistemáticamente acantilados de actividad (en inglés, activity cliffs).

Introducción

En forma amplia, cuando se habla de similitud se infiere que existe algún parecido entre dos o más objetos, generalmente de naturaleza física. Por ejemplo, el cilantro y el perejil, hierbas aromáticas empleadas ampliamente en la cocina mexicana, son notablemente semejantes respecto a su tamaño, color, forma, etc. En cambio, el cilantro y la ceboolla larga no resultan similares a primera vista. No obstante, es posible encontrar similitudes entre estos dos objetos (hierbas) si se consideran otros aspectos, por ejemplo, su uso o el contenido de vitamina C (Prieto-Martínez, 2018) (ver Figura 1). Cabe destacar que el término de "similitud" es subjetivo, para el cual no hay una definición considerada como correcta, ya que muchos factores pueden intervenir en la apreciación de la semejanza o diferencia entre dos o más objetos (Bajorath, 2016).

El concepto de similitud es un concepto ampliamente explorado y explotado en quimioinformática y también es un tema central en química farmacéutica. En el mundo molecular este concepto gana relevancia simplemente por la comparación realizada entre compuestos y sus propiedades, específicamente su actividad, siendo su determinación uno de los ejercicios más frecuentes realizados en investigaciones químicas y farmacéuticas, frecuentemente por diferentes razones (Maggiora et al., 2014). Como se mencionó anteriormente, este concepto es subjetivo ya que, aplicado a la química farmacéutica, depende del método para codificar la información química relevante, así como del espacio químico (Bajorath, 2016).

Ante esta situación, en quimioinformática se han propuesto diferentes criterios para evaluar la similitud o diversidad de compuestos y/o de bibliotecas de compuestos químicos, entre los cuales destaca el análisis de propiedades fisicoquímicas, el análisis de núcleos base o scaffolds y el análisis de huellas digitales moleculares o fingerprints (Maggiora et al., 2014).

Más que nada, la identificación de patrones moleculares, con base en la exploración computacional o humana, proporciona una base para tomar una decisión sobre si dos compuestos son similares entre sí o no. Con base en esto, a inicios de los 90s surgió el principio de propiedad de similitud (SPP, por sus siglas en inglés) que mencionaba que compuestos similares deberían de tener propiedades similares, con un enfoque particular en la actividad biológica (Naveja et al, 2019). No obstante, la evidencia experimental sugiere que la relación entre la similitud estructural y las propiedades, especialmente la actividad, no siempre sigue esta pauta. Se han observado compuestos que, a pesar de no ser considerados similares en términos estructurales, comparten propiedades similares, al igual que casos donde compuestos estructuralmente similares no exhiben similitudes en sus propiedades. Este fenómeno ha sido documentado en la literatura (Maggiora et al., 2014).

Existen un par de metodologías que siguen el SPP, tal es el caso de las relaciones estructura actividad (SAR, por sus siglas en inglés) y el SAR cuantitativo (QSAR, por sus siglas en inglés), los cuales son métodos de modelaje usados ampliamente para evaluar propiedades biológicas de sustancias químicas. En cuanto al QSAR, este se encuentra basado en la hipótesis de que la estructura química es responsable de la actividad (Giuseppina G, 2020).

El concepto de similitud es explorado y empleado en los panoramas de actividad o activity landscapes (ALs), los cuales son definidos como representaciones gráficas que integran la similitud de compuestos y las relaciones de actividad. Representan gráficamente la actividad de compuestos biológicamente relevantes en el espacio químico, haciendo posible visualizar las SAR e identificar compuestos claves y determinantes. Compuestos que son similares entre sí y vecinos en el espacio químico pero que tienen grandes diferencias en la potencia forman los acantilados de actividad o activity cliffs (ACs) (Javed et al., 2020). El SPP indica que en los ALs la superficie de la representación gráfica debería ser lisa, sin embargo la evidencia muestra que, en cambio, hay discontinuidades correspondientes a los ACs (Giuseppina G, 2020).

En general, se consideran diferentes criterios y conceptos de similitud:

  • Similitud molecular vs química. La similitud química se basa principalmente en las características fisicoquímicas de los compuestos (solubilidad, log P, peso molecular, etc), mientras que la similitud molecular se enfoca principalmente en las características estructurales (subestructuras compartidas, topología, etc) de los compuestos y sus representaciones.

  • Similitud evaluada con base en representaciones moleculares 2D vs 3D. Los métodos de similitud 2D se basan en información deducida de gráficos moleculares, mientras que los métodos de similitud 3D se basan en la comparación de conformaciones moleculares y propiedades asociadas.

  • Similitud molecular vs biológica. En lugar de los descriptores habituales de propiedades fisicoquímicas o estructurales, la similitud biológica emplea las actividades de compuestos frente a un panel de blancos de referencia, generalmente proteínas, que proporcionan una "firma biológica".

  • Similitud global vs local. La similitud local considera únicamente átomos, grupos o funcionalidades particulares de interés, mientras que la similitud global considera a las moléculas completas.

Cabe destacar que para cada tipo de similitud se consideran los descriptores moleculares particulares que logren capturar la información para cada caso de interés (fisicoquímica, estructural, gráfica, etc) (Maggiora et al., 2014).

Bases del concepto de similitud

Recordemos que la similitud es una relación de pares. Para construir una medida computacional adecuada de similitud se requieren al menos tres componentes básicos, los cuales son:

  1. Una representación cuyos componentes codifican las características moleculares y/o químicas relevantes para la evaluación de similitud.

  2. Una ponderación o peso individual de las características de representación.

  3. Una función de similitud o de distancia (concepto opuesto a similitud) que transforma (o mapea) la información de las estructuras en una escala de valores reales en el intervalo [0, 1] (Maggiora et al., 2014).

Estos tres componentes básicos se abordaran con más detalle en las siguientes secciones.

Cabe destacar que la evaluación de similitud en química informática es un problema complicado. Dos compuestos que comparten una subestructura común pueden ser detectados sin ambigüedades, así como todos los compuestos que comparten estas subestructuras pueden ser recuperados de un base de datos de compuestos. Además, es posible identificar compuestos que se consideran similares a una referencia con una actividad conocida y resultar en que dichos compuestos no comparten similitud en actividad o propiedad. En contraste, compuestos que probablemente serían considerados muy similares podrían no serlo (Figura 2) (Maggiora et al., 2014).

La Figura 3 ilustra como no puede mencionarse con certeza si dos compuestos son similares entre sí, cuál podría ser su grado de similitud y cómo se debe evaluar la similitud. En este caso, el problema es que es difícil racionalizar relaciones que son principalmente de naturaleza subjetiva. La dificultad del problema aumenta aún más cuando se intenta describir relaciones de similitud de una manera formalmente consistente y cuantificarlas con ayuda de métodos computacionales.

Para saber más:

Last updated