2. Introducción a Python, Google Colab y Linux
Objetivos
Introducir definiciones y funciones básicas de Python.
Presentar el concepto de librerías/paqueterías.
Importar bases de datos existentes.
Introducción
Python es un lenguaje de programación interpretado y orientado a objetos. Fue desarrollado a finales de los 80´s por Guido van Rossum y fue publicado por primera vez en 1991. La amplia aplicabilidad y el soporte de paqueterías con los que cuenta, permiten que se construyan productos y software altamente versátiles y escalables en el mundo real. En la ciencia, cada vez es más recurrente el uso de Python en áreas como la Quimioinformática y la Bioinformática para el manejo y análisis de datos complejos, por ejemplo, datos genómicos, imágenes médicas, registros médicos electrónicos y bases de datos de miles (incluso millones) de compuestos químicos.
Las características generales de Python son:
Lenguaje interpretado (rápido para programar): esto significa que no es necesario compilar el código fuente en un programa antes de ejecutarlo. En su lugar, el intérprete de Python lee y ejecuta el código directamente, lo que facilita el desarrollo y la depuración, ya que se puede probar el código por línea o en fragmentos.
Tipado dinámico (lenguaje sencillo y fácil de aprender): en Python no es necesario declarar el tipo de una variable explícitamente (ver variables en la sección Fundamentos de Programación).
Multiplataforma: esto significa que se puede escribir el código en Python en una plataforma (como Windows) y ejecutarlo en otra (como Linux) sin necesidad de realizar cambios significativos en el código fuente.
Gratuito y de acceso libre.
Orientado a objetos: el código en Python se organiza en objetos que pueden tener atributos (datos) y métodos (funcionalidades), lo que facilita la creación de programas modulares y estructurados.
En las siguientes secciones se abordarán con mayor detalle los conceptos detrás de la programación con Python.
Instalación de Python
Actualmente la mayoría de las computadoras Linux, macOS y algunas computadoras Windows tienen ya instalada una versión reciente de Python.
No es necesaria la instalación de Python u otro programa para el seguimiento de este manual, a menos que se indique lo contrario.
Para comprobar que Python está instalado, es necesario ejecutarlo desde la línea de comandos.
Aquí el ejemplo desde la terminal Linux:
Si Python no está instalado es necesario descargarlo desde la siguiente página:
Las instrucciones son distintas dependiendo del sistema operativo. A continuación algunos recursos para instalarlo en su computadora si así lo desea:
Una vez instalado Python, puede ejecutarse desde la terminal:
También puede ejecutarse desde el entorno de desarrollo y aprendizaje integrado de Python (IDLE, por sus siglas en inglés):
También es posible utilizar editores como Visual Studio Code para escribir y ejecutar programas en Python:
Otra alternativa para ejecutar códigos de Python, cuando es necesario hacer varias pruebas rápidas y visualizar el resultado conforme se van ejecutando las celdas de código, son los cuadernos interactivos o notebooks. Un ejemplo es Jupyter Notebook, una herramienta web en la que se puede ejecutar código, incluir texto e imágenes. Para utilizar Jupyter es necesario instalarlo, sin embargo, actualmente también es posible ejecutarlo en la nube con Google Colab.
Google Colaboratory
En este libro electrónico utilizamos “Google Colaboratory” como herramienta para escribir y ejecutar código Python en la nube de Google. Con esto, el usuario no requerirá instalar ambientes virtuales para ejecutar los códigos, únicamente se requiere una cuenta de correo electrónico en Gmail.
Otra ventaja de utilizar Google Colab es que permite incluir texto, enlaces a páginas web e imágenes para enriquecer el código y su entendimiento. En caso de necesitar altas prestaciones de cómputo, el entorno permite configurar algunas propiedades del equipo sobre el que se ejecuta el código.
Para crear un cuaderno de código Colab, se puede usar el menú Archivo que aparece en la parte superior izquierda al abrir Drive y en more seleccionar Google Colaboratory.
En caso de abrir un Colab mediante un vínculo (link), asegurarse de crear una copia en su propio Drive. De esta forma se asegurará que los cambios o ediciones al código se guarden de forma correcta.
Cargar archivos en Colab
Para trabajar con datos proveniente de archivos, estos se deberán subir desde la PC a Google Colab. A continuación se indica el procedimiento.
Ir al último ícono de la barra lateral a la izquierda de la pantalla ("Archivos" o "Files").
Presionar el primer ícono (una hoja de papel con una flecha hacia arriba) y seleccionar el archivo de interés.
Una vez que se termine de subir, hacer click derecho sobre el archivo, y seleccionar "copiar ruta".
Pegamos la ruta en el argumento de
pd.read_csv()
, y agregamos otro parámetro:delimiter=""
, donde será necesario poner entre las comillas el caracter que limita las distintas columnas del archivo.
Ejercicio
Abrir la cuenta de Google Drive y crear un primer Colab. En este primer cuaderno, escribir la primera línea de código:
Ahora cargaremos un archivo al cuaderno de código. Primero, es necesario descargar el archivo y guardarlo en la computadora local:
Subir el archivo descargado al ambiente Colab como se describió en la sección anterior. Usar la instrucción pd.read_csv()
para leer el archivo. Se debe ejecutar la siguiente orden antes de leer el archivo .csv:
Para saber más:
Beginner's Guide to Python. https://wiki.python.org/moin/BeginnersGuide Fecha de acceso: Noviembre de 2023.
Joshi J (2021) Chapter 9 - Python, a reliable programming language for chemoinformatics and bioinformatics. In Sharma N, Ojha H, Raghav PK, Goyal RK (Eds.), Chemoinformatics and Bioinformatics in the Pharmaceutical Sciences. Academic Press. doi: https://doi.org/10.1016/B978-0-12-821748-1.00013-0.
Python Cheat Sheet. InterviewBit. https://www.interviewbit.com/python-cheat-sheet/ Fecha de acceso: Agosto de 2023.
Te damos la bienvenida a Colaboratory. https://colab.research.google.com/?hl=es#scrollTo=-Rh3-Vt9Nev9 Fecha de acceso: Diciembre de 2023.
Last updated