martes, 21 de agosto de 2007

Como obtener una copia de la wikipedia y consultarla offline

Actualmente la wikipedia es una de las enciclopedias mas consultadas a nivel mundial. Pero que pasaría si no estuviera accesible, o tuviéramos un corte de nuestra conexión a Internet. Podemos solucionar esto obteniendo una copia completa y almacenándola en nuestro disco duro.
La primera opción seria descargar un backup de la base de datos de la wikipedia en formato XML, transformar los datos e insertarlos en nuestra base de datos MySQL. Tenemos una completa guia en ingles en la página de Thanassis Tsiodras. El último volcado de la wikipedia es de Agosto de 2007, y lo podéis descargar en español aquí, o en ingles aquí.
La otra opción es descargar un volcado estático en HTML. Solo tendriamos que descomprimir el archivo con 7zip en nuestro disco duro, y ya tendríamos nuestra copia de la wikipedia. El último volcado de Agosto de 2007 se está todavía realizando, por lo que tendremos que recurrir al del mes de Abril de 2007.
Y la última opción seria descargar una copia en DVD, aunque actualmente solo esta disponible en alemán.
A la hora de escoger una alternativa, la más fácil seria la de obtener una copia en HTML (descargar y descomprimir), pero si queremos una copia potente y rápida, y tenemos conocimientos de Python, Perl, o PHP, la mejor opción es seguir la guia de Thanassis Tsiodras.

Via: Compiler

No hay comentarios:

Publicar un comentario