Page cover

🐍2. Introducción a Python, Google Colab y Linux

Objetivos

  • Introducir definiciones y funciones básicas de Python.

  • Presentar el concepto de librerías/paqueterías.

  • Importar bases de datos existentes.

Introducción

Python es un lenguaje de programación interpretado y orientado a objetos. Fue desarrollado a finales de los 80´s por Guido van Rossum y fue publicado por primera vez en 1991. La amplia aplicabilidad y el soporte de paqueterías con los que cuenta, permiten que se construyan productos y software altamente versátiles y escalables en el mundo real. En la ciencia, cada vez es más recurrente el uso de Python en áreas como la Quimioinformática y la Bioinformática para el manejo y análisis de datos complejos, por ejemplo, datos genómicos, imágenes médicas, registros médicos electrónicos y bases de datos de miles (incluso millones) de compuestos químicos.

Las características generales de Python son:

  • Lenguaje interpretado (rápido para programar): esto significa que no es necesario compilar el código fuente en un programa antes de ejecutarlo. En su lugar, el intérprete de Python lee y ejecuta el código directamente, lo que facilita el desarrollo y la depuración, ya que se puede probar el código por línea o en fragmentos.

  • Tipado dinámico (lenguaje sencillo y fácil de aprender): en Python no es necesario declarar el tipo de una variable explícitamente (ver variables en la sección Fundamentos de Programación).

  • Multiplataforma: esto significa que se puede escribir el código en Python en una plataforma (como Windows) y ejecutarlo en otra (como Linux) sin necesidad de realizar cambios significativos en el código fuente.

  • Gratuito y de acceso libre.

  • Orientado a objetos: el código en Python se organiza en objetos que pueden tener atributos (datos) y métodos (funcionalidades), lo que facilita la creación de programas modulares y estructurados.

En las siguientes secciones se abordarán con mayor detalle los conceptos detrás de la programación con Python.

Instalación de Python

Actualmente la mayoría de las computadoras Linux, macOS y algunas computadoras Windows tienen ya instalada una versión reciente de Python.

Para comprobar que Python está instalado, es necesario ejecutarlo desde la línea de comandos.

Aquí el ejemplo desde la terminal Linux:

python --version

Si Python no está instalado es necesario descargarlo desde la siguiente página:

Las instrucciones son distintas dependiendo del sistema operativo. A continuación algunos recursos para instalarlo en su computadora si así lo desea:

Una vez instalado Python, puede ejecutarse desde la terminal:

Python ejecutado en CMD Windows

También puede ejecutarse desde el entorno de desarrollo y aprendizaje integrado de Python (IDLE, por sus siglas en inglés):

IDLE escribiendo el código
Ejecutando print ("Hello world") en IDLE

También es posible utilizar editores como Visual Studio Code para escribir y ejecutar programas en Python:

Visual Studio Code
Instalación para Windows
Instalación para Ubunut-Linux

Otra alternativa para ejecutar códigos de Python, cuando es necesario hacer varias pruebas rápidas y visualizar el resultado conforme se van ejecutando las celdas de código, son los cuadernos interactivos o notebooks. Un ejemplo es Jupyter Notebook, una herramienta web en la que se puede ejecutar código, incluir texto e imágenes. Para utilizar Jupyter es necesario instalarlo, sin embargo, actualmente también es posible ejecutarlo en la nube con Google Colab.

Google Colaboratory

En este libro electrónico utilizamos “Google Colaboratory” como herramienta para escribir y ejecutar código Python en la nube de Google. Con esto, el usuario no requerirá instalar ambientes virtuales para ejecutar los códigos, únicamente se requiere una cuenta de correo electrónico en Gmail.

Otra ventaja de utilizar Google Colab es que permite incluir texto, enlaces a páginas web e imágenes para enriquecer el código y su entendimiento. En caso de necesitar altas prestaciones de cómputo, el entorno permite configurar algunas propiedades del equipo sobre el que se ejecuta el código.

Para crear un cuaderno de código Colab, se puede usar el menú Archivo que aparece en la parte superior izquierda al abrir Drive y en more seleccionar Google Colaboratory.

En caso de abrir un Colab mediante un vínculo (link), asegurarse de crear una copia en su propio Drive. De esta forma se asegurará que los cambios o ediciones al código se guarden de forma correcta.

Cargar archivos en Colab

Para trabajar con datos proveniente de archivos, estos se deberán subir desde la PC a Google Colab. A continuación se indica el procedimiento.

  1. Ir al último ícono de la barra lateral a la izquierda de la pantalla ("Archivos" o "Files").

  2. Presionar el primer ícono (una hoja de papel con una flecha hacia arriba) y seleccionar el archivo de interés.

  1. Una vez que se termine de subir, hacer click derecho sobre el archivo, y seleccionar "copiar ruta".

  2. Pegamos la ruta en el argumento de pd.read_csv(), y agregamos otro parámetro: delimiter="" , donde será necesario poner entre las comillas el caracter que limita las distintas columnas del archivo.

Ejercicio

Abrir la cuenta de Google Drive y crear un primer Colab. En este primer cuaderno, escribir la primera línea de código:

print('Hola mundo')

Ahora cargaremos un archivo al cuaderno de código. Primero, es necesario descargar el archivo y guardarlo en la computadora local:

Subir el archivo descargado al ambiente Colab como se describió en la sección anterior. Usar la instrucción pd.read_csv() para leer el archivo. Se debe ejecutar la siguiente orden antes de leer el archivo .csv:

import pandas as pd

Para saber más:

Last updated