Passa al contingut principal

Guía Python: Manejando archivos, diccionarios y funciones

Guía Python: Manejando archivos, diccionarios y funciones:

Diccionarios

Conocidos en otros lenguajes como Hashes (Perl), arreglos asociativos (PHP) o hashmaps (Java), los diccionarios en Python son contenedores de pares clave-valor. A simple vista, son simplemente arreglos o listas cuyos índices son cadenas en vez de ser números enteros. Internamente la diferencia es mucho mayor, ya que se implementan como tablas hash en vez de listas. Pero no vale la pena entrar aquí en esos detalles, cuando podemos encontrar descripciones precisas en Wikipedia: Lista, Tabla Hash.
Los diccionarios no preservan el orden de los elementos: éste depende de las claves que se usen, del orden en el que se ingresan los datos y de otros factores. Además, no se puede iterar directamente sobre los elementos, aunque Python provee funciones para hacerlo (y también para iterar sobre las claves).
Para crear un diccionario, escribimos los pares clave-valor entre llaves, separando cada par por una coma:
>>> mi_diccionario = { 'nombre': 'Juan', 'apellido': 'Perez', 'pais':
 'Uruguay' }
>>> print mi_diccionario['nombre']
Juan
Un diccionario puede ser expandido simplemente asignando un valor a un nuevo índice. También podemos eliminar un valor del diccionario usando del:
>>> mi_diccionario['edad'] = 32
>>> del mi_diccionario['pais']
>>> print mi_diccionario
{'edad': 32, 'nombre': 'Juan', 'apellido': 'Perez'} # notar que se 
agregó la clave 'edad', se eliminó la clave 'país', y no se preservó el 
orden
Si intentamos acceder a una clave no definida, Python lanza la excepción KeyError. Para evitarla, podemos comprobar fácilmente si la clave está en el diccionario usando el operador in:
>>> print mi_diccionario['una_clave_que_no_existe']
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 'una_clave_que_no_existe'
>>> if 'edad' in mi_diccionario:
...     print mi_diccionario['edad']
...
32
Otra forma de evitar el error es utilizar el método get(). Este método recibe dos parámetros: la clave cuyo valor se quiere obtener y el valor a retornar si la clave no está definida. Si no se especifica el segundo parámetro, get devuelve None:

>>> print mi_diccionario.get('edad')
32
>>> print mi_diccionario.get('una_clave_que_no_existe')
None>>> print mi_diccionario.get('una_clave_que_no_existe', 
'valor predeterminado')
valor predeterminado
Al igual que las secuencias, los diccionarios también pueden ser recorridos con un bucle for. La diferencia es que en vez de iterar en orden sobre los elementos, el bucle for itera sobre las claves sin un orden preestablecido:
>>> for clave in mi_diccionario:
...  print clave, ": ", mi_diccionario[clave]
...
edad :  32
nombre :  Juan
apellido :  Perez
Usando el método items(), obtenemos una lista de tuplas (clave, valor), que podemos usar en el for:
>>> for (clave, valor) in mi_diccionario.items():
...  print clave, ": ", valor
...
edad :  32
nombre :  Juanapellido :  Perez
Los diccionarios soportan otras operaciones: el método copy() devuelve una copia, y el método update() permite agregar a un diccionario las claves y valores de otro:
>>> dic = mi_diccionario.copy()
>>> print dic
{'edad': 32, 'nombre': 'Juan', 'apellido': 'Perez'}
>>> dic.update({'pais': 'Uruguay', 'idioma': 'Español' })
>>> print dic
{'edad': 32, 'nombre': 'Juan', 'idioma': 'Español', 'apellido': 'Perez', 
'pais': 'Uruguay'}

Funciones

Las funciones en Python se declaran con la palabra clave def, seguida del nombre de la función y de sus argumentos. Como todo bloque en Python, la declaración termina con dos puntos (“:”) y el código siguiente debe estar sangrado a un nivel mayor:
def mifuncion(parametro1, parametro2):
    código de la función
Una vez definida, la función puede ser llamada desde cualquier parte de nuestro archivo Python, simplemente con su nombre. Además de recibir valores por vía de sus parámetros, la función puede acceder a variables definidas fuera de ella y en el mismo archivo (módulo), usando la sentencia global.
Para devolver un valor, se utiliza la sentencia return. Este valor se puede obtener por asignación. Veamos un ejemplo:
variable_externa = 'HOLA'

def mi_funcion(param1, param2, ...):
    # código de la función
    global variable_externa
    return variable_externa

mifuncion(....) # ejecuta el código de la función
mi_variable1 = mi_funcion(var1, var2, ...)  # mi_variable = 'HOLA'
Vale notar que la función puede devolver solamente un valor (objeto), sin embargo, se puede simular la devolución de valores múltiples gracias al empaquetado: valores separados por coma luego de la sentencia return se convierten a una tupla y lo que devuelve la función es esa tupla. Luego podemos recibir los valores devueltos como una tupla o desempaquetarlos:
>>> def mi_f():
...     return 'a', 'b'
...
>>> var1, var2 = mi_f()   # var1 = 'a', var2 = 'b'
>>> t_var = mi_f()        # t_var: tupla formada por 'a' y 'b'
>>> t_var
('a', 'b')
Las funciones en Python pueden además asignarse y pasarse como parámetro a otras funciones.

Manejando archivos

En Python, así como en cualquier otro lenguaje, los archivos se manipulan en tres pasos: primero se abren, luego se opera sobre ellos y por último se cierran.

Apertura

Para abrir un archivo debemos usar la función open(), que recibe como parámetros el nombre del archivo y el modo en el que se debe abrir. De forma predeterminada (es decir, si se omite el segundo parámetro), el archivo se abre como sólo lectura.
Es importante tener en cuenta que todas las operaciones están limitadas a la forma en la que se abra el archivo: no se puede leer de un archivo abierto solamente para escritura, ni escribir en un archivo abierto como solo lectura.
Modos
  • r: Sólo lectura. No se podrá escribir en el archivo.
  • w: Sólo escritura. Trunca el archivo al momento de abrirlo.
  • a: Sólo escritura. Escribe al final del archivo.
En cualquiera de los modos, si el archivo no existe, es creado. Opcionalmente se puede añadir + al modo para que se abra en modo lectura y escritura a la vez; aunque esto no suele ser necesario y requiere cuidado para que funcione correctamente.
Otro modificador posible es b, que sirve para trabajar con archivos binarios. Esto es necesario en Windows para manejar correctamente archivos de imágenes, o música (toda clase de archivos que no sean texto simple), porque el mismo SO hace diferencia entre archivos binarios y de texto. Esto no sucede en sistemas tipo UNIX (como Mac OS, o Linux), y por tanto en estos sistemas el modificador b no hace ninguna diferencia.

Lectura

Una vez abierto el archivo, podemos leer el contenido hacia una cadena con read(), leer una línea con readline(), u obtener una lista conteniendo las líneas del archivo con readlines(). Los tres métodos aceptan un parámetro entero opcional que define el número máximo de bytes a leer del archivo. Si este parámetro es negativo o simplemente se omite, read y readlines leerán todo el archivo y readline una línea completa sin importar su largo.
Otra forma de leer el archivo es leer línea por línea en un bucle for, ya que el objeto archivo es iterable.
Para ejemplificar lo mencionado hasta ahora, supongamos que tenemos un archivo prueba.txt con el siguiente contenido:
Esto es
una prueba
de lectura!
tenemos varias formas de leerlo:
>>> archivo = open('prueba.txt', 'r') # sólo lectura. Con modificadores, podría usar 'r+', 'rb', o 'rb+'
>>> print archivo.read()              # leer todo
Esto es
una prueba
de lectura!
>>> print archivo.readline()          # leer 1 línea.
Esto es
>>> print archivo.readlines()   # leer todas las líneas como una lista.

['Esto es\n', 'una prueba\n', 'de lectura!']   # nótese que siempre se 
                                                 incluyen los saltos de 
                                                 línea.
>>> print archivo.read(2)             # leer como máximo 2 bytes
Es
>>> print archivo.readline(4)         # leer 1 línea completa o 4 bytes,
                                        lo que ocurra primero.
Esto
>>> for linea in archivo:              # con un bucle for. Esta 
                                         es la forma recomendada
                                         de lectura por líneas.

...     print linea
...


Esto es                               # Notar la línea vacía. Esto es 
                                        porque la cadena leída incluye 
                                        un salto de línea al final, y 
                                        print agrega otro.

 
una prueba
de lectura!
Es importante notar que los ejemplos anteriores no funcionan en secuencia tal cual fueron escritos. Esto es debido a que una vez que se lee contenido del archivo, la siguiente lectura comenzará desde donde acabó la anterior. Es decir, si leemos 4 bytes de la primera línea (“Esto”), una siguiente lectura de 3 bytes devolverá ” es”. Todo archivo contiene un puntero interno que actúa como un cursor o como un punto de partida para las funciones de lectura o escritura y a su vez cada vez que se usa una de estas funciones, el puntero interno se mueve
Para manipular el puntero interno existen los métodos seek, que recibe como parámetro la posición a la que debe mover el puntero (0 para moverlo hacia el principio del archivo) y tell, que devuelve la posición actual del puntero.

Escritura

Si lo que queremos es escribir en el archivo, tenemos los métodos write y writelines. Contrapartes de read y readlines respectivamente, write escribe una cadena al archivo y writelines recibe una lista de líneas para escribir. Por ejemplo, si quisiéramos recrear el archivo prueba.txt del ejemplo anterior, podemos hacerlo de dos formas:
>>> archivo = open('prueba.txt', 'w')  # escritura y truncado
>>> archivo.write("Esto es\nuna prueba\nde lectura!")
>>> archivo.writelines(['Esto es\n', 'una prueba\n', 'de lectura!'])  

# notar la inclusión explícita de saltos de línea
>>> archivo.close()

Cierre

Cuando terminamos de trabajar con el archivo, lo cerramos con close(). Esto libera el archivo para ser usado por otros programas, y además asegura que los cambios sobre él se guarden. De más está decir que Python se encarga de cerrar todos los archivos que queden abiertos al final del programa, pero es una buena práctica no dejar nada al azar y cerrar el archivo tan pronto como se lo termina de usar.

with

A partir de Python 2.5, podemos simplificar un poco el código necesario para abrir y cerrar el archivo usando with:
with open('prueba.txt') as archivo:
    for linea in archivo:
        ....
Esto nos libera de tener que cerrar el archivo explícitamente, ya que Python se encargará de cerrarlo automáticamente al salir del bloque.

Alvaro Martinez Alvaro Martinez para Maestros del Web.
Agrega tu comentario | Enlace permanente al artículo

Síguenos en: @maestros | Fan page

Comentaris

Entrades populars d'aquest blog

10 alternativas a Cuevana para ver películas online

10 alternativas a Cuevana para ver películas online : Durante este último tiempo, en Cuevana se sucedieron varios “problemas” por los cuales hubo que ajustar algunas cosas antes de tiempo (como el rediseño del sitio), que dejaron a algunos usuarios ciertos problemas para acceder a las películas o series del portal. Pero realmente esto es algo que no incumbe a los usuarios y, como sabemos, existen muchas otras alternativas a Cuevana dando vueltas por Internet, que intentaremos presentar aquí mismo. Los sitios que repasaremos funcionan del mismo modo que Cuevana, mediante la instalación de un plugin que permite visualizar los videos de Megaupload o WUShare, entre otros servicios, en una calidad de imágen realmente excelente. Tal como sucede con el más popular servicio, todos ellos tienen publicidad que en algunos casos resulta insoportable, pero como dice Federico en DotPod “a caballo regalado no se le miran los dientes”. Alternativas a Cuevana 1. Moviezet Posiblemente el mejor clon d...

Learn Composition from the Photography of Henri Cartier-Bresson

“Do you see it?” This question is a photographic mantra. Myron Barnstone , my mentor, repeats this question every day with the hopes that we do “see it.” This obvious question reminds me that even though I have seen Cartier-Bresson’s prints and read his books, there are major parts of his work which remain hidden from public view. Beneath the surface of perfectly timed snap shots is a design sensibility that is rarely challenged by contemporary photographers. Henri Cartier-Bresson. © Martine Franck Words To Know 1:1.5 Ratio: The 35mm negative measures 36mm x 24mm. Mathematically it can be reduced to a 3:2 ratio. Reduced even further it will be referred to as the 1:1.5 Ratio or the 1.5 Rectangle. Eyes: The frame of an image is created by two vertical lines and two horizontal lines. The intersection of these lines is called an eye. The four corners of a negative can be called the “eyes.” This is extremely important because the diagonals connecting these lines will form the breakdown ...

Más de 50 de las mejores herramientas online para profesores

No es una exageración afirmar que hay ciento de aplicaciones educativas por ahí por la red, para todos los gustos y de todos los colores, por lo que es difícil tratar de recogerlas todas en un listado. Sin embargo, algunas destacan más que otras por su innovación y por su capacidad para conseguir adeptos, y esas son las que protagonizan la presente recopilación. Son 50 interesantes herramientas online basadas en las recopilaciones de EduArea , las muchas ya tratadas en Wwwhat’s new y las destacadas por la experiencia. 1. Dropbox : Un disco duro virtual con varios GB gratuitos y al que se accede desde casi cualquier dispositivo. Sin embargo, es muchísimo más que eso, de hecho ya comentamos 20 razones . 2. Google Drive : La evolución de Google Docs que suma a sus múltiples herramientas de creación de documentos, un considerable espacio virtual gratuito. 3. CloudMagic : Una extensión y una app multidispositivo para buscar información simultáneamente en Gmail, Twitter, Facebook, Evernote ...