📖9.2.1 Tutorial de acoplamiento

A continuación se presentan las instrucciones para utilizar el programa AutoDock Vina (Vina) después de su instalación. Como primer ejemplo se realizarán los cálculos para una sola molécula, muy útil para cuando determinamos los parámetros a utilizar en nuestro sistema. Posteriormente, escalaremos este cálculo a varias moléculas realizando un cribado virtual (virtual screening).

Una molécula

Como primer paso necesitamos una carpeta o directorio en nuestro HOME de Ubuntu, ya sea en un equipo con sistema operativo Linux o WSL de Windows. Por ejemplo, para crear el directorio llamado "redock", tecleamos en la terminal:

mkdir redock

Una vez creada la carpeta, necesitamos los siguientes archivos dentro de la misma:

  • La proteína blanco en formato .pdb

  • La molécula a acoplar (ligando) en un formato que reconozca Open Babel (.pdb, .smi, .mol...)

  • El archivo de configuración para Vina, config.vd o config.txt

En caso de que la proteína elegida tenga una molécula co-cristalizada, se puede descargar sólo la molécula desde la sección Small Molecules del PDB.

También podemos aislarla con el programa Chimera, cargando la estructura del PDB:

File → Fetch by ID
Verificar que esté seleccionada la opción PDB y escribir el ID de la proteína elegida

Select → Residue → "Molécula co-cristalizada"
Actions → Write PDB...

El archivo de configuración puede crearse en un editor de texto como el Bloc de notas y guardarse con la terminación .vd o .txt. La información que suele contener incluye el nombre del archivo del receptor, las coordenadas y el tamaño de la rejilla o grid:

Figura 1. Ejemplo de archivo de configuración para Vina.

Se pueden especificar también otros parámetros como el número de resultados para cada molécula (num_modes) en el archivo de configuración (sección Configuration File de la documentación del programa) (AutoDock Vina).

Una vez con los archivos en la carpeta y los permisos asignados, entramos al directorio usando la terminal, por ejemplo a la carpeta titulada "redock":

cd redock

Ahora utilizaremos Open Babel para adicionar hidrógenos a la proteína, la sintaxis general se presenta a continuación, tomar en cuenta que el archivo de entrada está en formato .pdb y necesitamos que el archivo de salida también esté en .pdb:

obabel -i <formato_del_archivo> <nombre_del_archivo> -o pdb -O <archivo_salida> -p 7

Entonces si el archivo .pdb con nuestra proteína blanco se llama "dnmt1.pdb" y el de salida se llamará "dnmt1_H.pdb" para distinguirlo del inicial, escribimos en la terminal:

obabel -i pdb dnmt1.pdb -o pdb -O dnmt1_H.pdb -p 7

La opción -p adiciona los hidrógenos apropiados para el pH especificado.

Podemos verificar que tenemos un nuevo archivo de salida con el comando "ls" (Figura 2).

Figura 2. Verificando la creación del nuevo archivo.

Ahora para adicionar los hidrógenos al ligando, en el archivo llamado "ligand.pdb", escribimos en la terminal:

obabel -i pdb ligand.pdb -o pdb -O ligand_H.pdb -p 7

Si el ligando no viene de un formato con coordenadas tridimensionales, como sería el caso del .smi (un archivo de texto con SMILES), añadir la opción --gen3D a la conversión con obabel.

La adición de hidrógenos puede realizarse con otros programas o servidores como YASARA, mencionado anteriormente en la Selección y preparación de la proteína.

Una vez que están listos los archivos .pdb de la proteína y el ligando con hidrógenos, utilizaremos MGLTools para convertirlos a .pdbqt, el formato para ejecutar Vina. Puedes realizar la minimización energética de la proteína y/o los ligandos con otras herramientas antes del cambio de formato.

Como primer paso, activamos el ambiente donde instalamos MGLTools escribiendo en la terminal:

conda activate mgltools

Verificar que al inicio de la terminal cambie de (base) a (mgltools):

Figura 3. Activar ambiente mgltools.

Preparar la proteína con nombre de archivo "dnmt1_H.pdb":

prepare_receptor4.py -r dnmt1_H.pdb

Preparar el ligando en el archivo "ligand_H.pdb":

prepare_ligand4.py -l ligand_H.pdb

Podemos verificar que tenemos dos archivos .pdbqt en nuestra carpeta utilizando nuevamente el comando "ls". Desactivamos el ambiente mgltools:

conda deactivate

Podemos rectificar las coordenadas y nombre del archivo del receptor en la configuración, escribiendo en la terminal "cat config.vd":

Figura 4. Archivo de configuración.

Si el archivo de configuración tiene los datos correctos, ejecutamos el acoplamiento, especificando el archivo de configuración y el del ligando en .pdbqt:

vina --config config.vd --ligand ligand.pdbqt

El cálculo comenzará y la terminal informará sobre el avance:

Figura 5. Cálculo de acoplamiento con Vina.

Cuando termine el cálculo la terminal mostrará los resultados de la función de puntuación implementada en Vina (docking score) y tendremos un nuevo archivo en la carpeta donde hemos estado trabajando.

El archivo con los resultados tendrá terminación out.pdbqt, por ejemplo en este caso: "ligand_out.pdbqt". Al abrir este archivo con un editor de texto podremos recuperar los resultados del docking score:

Figura 6. Resultados del acoplamiento con Vina.

Este archivo de salida también contiene información sobre la pose predicha para el ligando, es decir, la conformación y orientación de la molécula (Saldivar-González et al. 2016). El formato pdbqt no es leído directamente por varios de los visualizadores moleculares, por lo cual se utiliza comúnmente la interfaz gráfica de AutoDockTools.

También podemos utilizar el comando "vina_split" para separar los resultados del archivo out.pdbqt en distintos archivos .pdb, uno por cada modelo de unión (num_modes):

vina_split --input <archivo_out.pdbqt>

La instrucción anterior se debe ejecutar en la misma carpeta de trabajo donde esta el archivo de salida. Los archivos .pdbqt resultantes pueden visualizarse con programas como Discovery Studio o Chimera, además de AutoDockTools y guardarse en otro formato como .pdb. Con estos archivos separados también podemos hacer cálculos de RMSD (Root Mean Square Deviation), con herramientas como LigRMSD o DockRMSD. Una aplicación de este valor es la comparación de nuestros cálculos con la información de la molécula co-cristalizada (Ramírez y Caballero 2018, Shivanika et al. 2020).

Cribado virtual

Podemos escalar el mismo procedimiento de acoplamiento molecular a más de un compuesto. Para esto creamos una nueva carpeta en el HOME de Linux:

mkdir cribado

En esta carpeta ocuparemos nuevamente el archivo de configuración (config.vd o config.txt), y el archivo de la proteína en formato .pdbqt, el cual podemos copiar y pegar del ejemplo anterior.

En cuanto al archivo con nuestros ligandos, podemos tener un archivo .sdf o .mol2 con varias moléculas o podemos escribir un archivo .smi. Este último puede crearse en un editor de texto, donde cada renglón tiene el SMILES de un compuesto y lo guardamos con terminación .smi en lugar de .txt:

Figura 7. Ejemplo de un archivo .smi.

Preparamos los ligandos a partir del archivo .smi, en este ejemplo llamado "SAH_scaffolds.smi":

obabel -i smi SAH_scaffolds.smi -o pdb -O ligand_.pdb -m -p 7 --gen3D

Se van a generar tantos archivos .pdb como moléculas haya en el archivo. Podemos verificar que existen los nuevos archivos con el comando "ls":

Figura 8. Archivos .pdb a partir de un archivo .smi.

Cambiamos el formato a .pdbqt con un ciclo iterativo o bucle (loop):

conda activate mgltools
for i in *pdb; do prepare_ligand4.py -l $i; done
conda deactivate

Con los ligandos y la proteína en formato .pdbqt ejecutamos el acoplamiento con otro bucle:

for i in *pdbqt; do vina --config config.vd --ligand $i; done

Para analizar los resultados, además de lo mencionado en la sección de acoplamiento con una molécula, podemos extraer la primer pose (con docking score más favorable) de cada uno de los archivos de salida:

conda activate mgltools
for i in *out.pdbqt; do pdbqt_to_pdb.py -f $i; done

Así tendremos la primera pose calculada para cada molécula en formato .pdb, para seguir analizando los resultados.

QuickVina

Las instrucciones anteriores para utilizar AutoDock Vina también funcionan para utilizar las herramientas disponibles de QuickVina, desarrolladas para acelerar los cálculos de acoplamiento molecular. Por un lado está QuickVina 2 (QVina), una herramienta rápida y precisa para acelerar los cálculos de AutoDock Vina hasta 20.49 veces. Los scores de QVina 2 son prácticamente idénticos a los de Vina (r=0.967) (Alhossary et al. 2015). Y por otro lado tenemos QuickVina-W, para hacer cálculos de acoplamiento molecular ciego (blind docking) en caso de no tener información sobre la cavidad en el blanco de interés (Hassan et al. 2017).

Para utilizar las herramientas, es necesario descargarlas del sitio web (se recomiendan los binarios):

Figura 9. Descarga de QVina.

El archivo descargado debe copiarse y pegarse en la carpeta de trabajo, junto con el resto de archivos a utilizar (ligando, proteína, config.vd). Es importante darle permisos de ejecución a este nuevo archivo, por ejemplo para QVina con nombre de archivo de descarga "qvina2.1":

chmod 777 qvina2.1

Después de realizar lo anterior, seguimos todos los pasos antes descritos para Vina hasta ejecutar el acoplamiento, donde ahora en lugar de utilizar el comando "vina" cambiaremos a "./qvina2.1" (verificar el nombre del archivo de descarga). Por ejemplo, para una molécula quedaría la orden para la terminal:

./qvina2.1 --config config.vd --ligand <archivo.pdbqt>

Al finalizar el cálculo tendremos igualmente un archivo de salida out.pdbqt.

Para saber más:

Last updated