8 de febrero de 2010

Descarga páginas web completas usando la terminal (Ubuntu)

Hay infinidad de plugins y otra infinidad de páginas web que te permiten hacer lo siguente: Descargar páginas web completas para poder llevártela contigo y visualizarla sin necesidad de internet. Sin embargo, hoy os enseñaré como hacerlo via la terminal y descargar varias páginas a la vez.

Empezemos (Escuchando "Hold de floor" de Mayor lazor en el fondo):
Instalamos Httrack (visitamos synaptic ó:):
  • sudo apt-get install httrack
Ahora escribimos, en la terminal: "Httrack". Ahora nos pedirá que le demos valores, yo os diré, según el órden en el que nos diga, qué nos dice y que hay que poner.
  • El nombre del proyecto (El nombre de la carpeta en el que guardará la(s) página(s).
  • La ruta en la guardará el archivo (Por defecto: /home/pc/Webistes)
  • La(s) URL(s): Aquí ponemos la url. Si queremos descargar varias páginas a la vez, escribiremos las URL con espacios entre medio: www.monzisez.blogspot.com www.google.es
  • Ahora nos pedirá si queremos descargar la página web con imágenes, si queremos guardar enlaces, etc... En nuestro caso, escribiremos: "3".
  • Ahora nos da la opción de guardar la(s) página(s) como un archivo .jpg, comprimido, etc.... aquí, yo voy a dar un "ENTER" para no seleccionar nada y guardar como .html
  • La siguente opción permite a httrack actualizar de forma automática a nuestra página web guardada. Este tutorial no tiene ese propósito así que: "ENTER".
  • Ponemos en marcha httrack y descargará: "Y".

Gracias a Muycomputer me entero de que todo esto se puede resumir usando wget. Bastaría con lanzar el comando: wget -r -p http://www.ejemplo.com

    Tutorial by Monzi_sez -- 8 de febrero de 2010
    Actualizado 22 de marzo de 2010

    1 comentario:

    1. gracias, que bueno, creo qe me va a servir.

      obs. httrack va todo en minúsculas.


      felipe.-

      ResponderEliminar