3.1 SMILES
Representación molecular usando SMILES.
Last updated
Representación molecular usando SMILES.
Last updated
La nomenclatura SMILES (del inglés; Simplified Molecular Input Line Entry Specification) representa a las estructuras químicas usando cadenas de caracteres alfanuméricos de tipo ASCII. Esta nomenclatura utiliza las siguientes reglas básicas para la codificación de moléculas:
Los átomos son representados a través de su símbolo atómico. Los hidrógenos de átomos saturados no se representan explícitamente.
Los átomos vecinos son colocados uno junto a otro. Los enlaces simple son representados a través de un guión simple (-), los enlaces dobles mediante el signo de igualdad (=); mientras que los enlaces triples con un símbolo de numeral (#).
Los paréntesis especifican ramificaciones dentro de la estructura. Las ramificaciones abarcan no sólo cadenas carbonadas sino también grupos funcionales. Por ejemplo, los grupos carbonilo se escriben como C(=O) ya que el átomo de oxígeno se encuentra por fuera de la cadena y se considera una ramificación.
Para la representación lineal de estructuras cíclicas, un enlace se "rompe" en cada anillo y los átomos de conexión entre anillos continúan con el mismo dígito en la representación. Los átomos dentro de un anillo aromático se indican con letras minúsculas.
Aunque la notación de SMILES son una forma clara de describir estructuras químicas, pueden existir múltiples representaciones SMILES válidas para el mismo gráfico molecular. Por ese motivo se generaron los SMILES canónicos para garantizar la existencia de una sola representación de un compuesto en una base de datos o identificar compuestos duplicados, pero es dependiente del programa utilizado. Por lo tanto, se recomienda generar los SMILES utilizando un solo programa.
A continuación, se muestran ejemplos para obtener representaciones SMILES usando la librería RDKit
.
En este ejercicio se codifica en formato molécula la estructura química del fármaco ponatinib, el cual es utilizado para tratar determinados tipos de leucemia mieloide crónica.
a) Como primer paso, se dibuja la estructura del ponatinib en MarvinSketch y se selecciona la opción de copiar la estructura molecular en formato Daylight SMILES.
b) A través de RDKit
y de la función MolFromSmiles se convierte el SMILES generado a formato molécula utilizando el siguiente código:
El resultado que se imprime es el siguiente:
Se obtendrá el SMILES de mismo compuesto a partir del formato 'molblock' reportado en la base de datos DrugBank (ver la sección de Bases de datos moleculares para mayor información).
a) Ingrese a DrugBank (https://go.drugbank.com) y busque información relacionada con el fármaco ponatinib.
b) En la sección de "Structure" seleccione la opción 'MOL'.
c) Esta opción lo llevará a una nueva página que contiene una serie de números y letras que describen la estructura molecular. Copie el link de esta página.
e) En un cuaderno de código escriba las siguientes líneas y pegue el link después de la función request.get.
Estas líneas de código arrojan la estructura y el SMILES del fármaco ponatinib.
Si se desea analizar un conjunto de compuestos al mismo tiempo es posible hacer uso de una lista como se muestra a continuación:
El código anterior permite visualizar estructuras moleculares presente en una lista:
Si el usuario desea conocer si en un conjunto determinado de moléculas existen subestructuras específicas (por ejemplo, un grupo carbonilo) entonces puede hacer uso de la función 'Substructure Match
' y 'HasSubstructure Match
'.
Este código arroja como resultado:
Para este ejercicio se hará uso de la libreria py3Dmol
, desarrollada para crear visualizaciones de sistemas moleculares. Es de importancia recalcar que, si el usuario desea visualizar una estructura en 3D, la conversión debe suceder desde el formato 'mol', es decir, no es posible trabajar con las notaciones lineales SMILES, SMARTS e InChI.
El resultado del código anterior se muestra a continuación:
SMILES - A Simplified Chemical Language https://daylight.com/dayhtml/doc/theory/theory.smiles.html. Fecha de acceso: Noviembre 2023.
Weininger D (1988) SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules. J. Chem. Inf. Comput. Sci. 28, 1, 31–36.