💻3.3 InChI Keys

Es un sistema de nomenclatura para identificar las sustancias químicas que codifica la estructura molecular y facilita la búsqueda de información en bases de datos y en la web sobre dicha sustancia. La IUPAC y el Instituto Nacional de Estándares y Tecnología (NIST) trabajan en conjunto para desarrollar este sistema.

Los nombres InChI se obtienen mediante un algoritmo que convierte la entrada de información estructural en un identificador único en tres pasos: normalización (para eliminar información redundante), canonización (para generar una etiqueta única para cada átomo) y, por último, serialización (para creación de la cadena de caracteres).

El formato InChI se construye por capas, en las cuales se describen características importantes de la estructura como: conectividad de los átomos, posición de átomos de hidrógeno, cargas, entre otras.

Figura 1. Construcción del formato InChI.

El formato InChIKey es un identificador de longitud fija de 27 caracteres. Se creó para facilitar aún más las búsquedas en bases de datos o páginas web y para resolver problemas relacionados con compuestos duplicados.

A continuación, se muestra un ejemplo de cómo este formato puede ser empleado con la librería RDKit.

Ejercicios:

1. Uso del formato InChI

En este caso, se utilizó ChEMBL (véase la sección de Introducción a las bases de datos moleculares para más información) para buscar el siguiente fármaco: sertraline.

Figura 2. Búsqueda de fármacos mediante ChEMBL.

En la sección de representaciones podemos consultar diferentes formatos incluyendo el InChI.

InChI=1S/C17H17Cl2N/c1-20-17-9-7-12(13-4-2-3-5-14(13)17)11-6-8-15(18)16(19)10-11/h2-6,8,10,12,17,20H,7,9H2,1H3/t12-,17-/m0/s1

Uso de InChI
sertraline = Chem.MolFromInchi('InChI=1S/C17H17Cl2N/c1-20-17-9-7-12(13-4-2-3-5-14(13)17)11-6-8-15(18)16(19)10-11/h2-6,8,10,12,17,20H,7,9H2,1H3/t12-,17-/m0/s1')
sertraline 

El código anterior convierte el formato InChI en la estructura 2D.

Figura 3. Estructura generada a partir de formato InChI.

Si se desea, también se puede convertir de un formato InChI a SMILES:

sertraline = Chem.MolFromInchi('InChI=1S/C17H17Cl2N/c1-20-17-9-7-12(13-4-2-3-5-14(13)17)11-6-8-15(18)16(19)10-11/h2-6,8,10,12,17,20H,7,9H2,1H3/t12-,17-/m0/s1')
sertraline.smiles = Chem.MolToSmiles(sertraline)
sertraline.smiles
>>> 'CN[C@H]1CC[C@@H](c2ccc(Cl)c(Cl)c2)c2ccccc21'

Para saber más:

Last updated