Como usar o comando wget

Muitas pessoas não conhecem profundamente todas as vantagens que o wget nos oferece, e eu também não sabia. Por isso resolvi fazer esse post.
Wget é um software livre para baixar arquivos da web, suporta os protocolos HTTP, HTTPS, e FTP, assim como baixa através de proxys. É parte do projeto GNU e seu nome deriva de World Wide Web e Get. Escrito em C, Wget pode, facilmente, ser instalado em qualquer sistema Unix-like e já foi portado também para Windows.

Essa é uma poderosa ferramenta e para tentar explorar as opções do wget, vamos ver uma série de exemplos de uso prático:

Baixando um arquivo:

 wget http://pagina.com/iso/ubuntulinux.iso  

Mas e se, enquanto está baixando este arquivo, acontece um apagão em seu computador e perde o arquivo que estava baixando, ou momentaneamente o servidor de onde estava baixando cai? Nestes casos é melhor utilizar o wget assim:

 wget -c http://pagina.com/iso/ubuntulinux.iso  

A opção -c qualquer interrupção no download será “continuada de onde parou”. Se existe parte de um arquivo que tentou baixar sem a opção -c, o wget continuará baixando o arquivo mas salvando com outro nome ubuntulinux.iso.1.

As vezes o download pode falhar por haver algum problema de conexão, por exemplo. O padrão do wget é tentar 20 vezes fazer o download com sucesso.
Mas também podemos especificar o número de tentativas usando a opção -tries. Por exemplo se quisermos que o número de tentativas de baixar seja 75, podemos fazer o seguinte:

 wget -c --tries=75 http://pagina.com/iso/ubuntulinux.iso  

Podemos especificar o nome do arquivo resultante, se quisermos que o arquivo a ser baixado tenha outro nome. Ao invés de distrolinux.iso seja distro.iso podemos fazer o seguinte:

 wget -O distro.iso http://pagina.com/iso/ubuntulinux.iso  

O wget não baixa somente arquivos de páginas webs, pode usar também outros protocolos de comunicação, como por exemplo FTP:

 wget -c ftp://usuario:senha@localhost/arquivo.zip  

Pode também mudar o estilo em que se mostra de forma gráfica o progresso do download assim:

 wget -c --progress=dot http://pagina.com/iso/ubuntulinux.iso  

É possível configurar o limite da taxa de transferência com wget usando a opção –limit-rate, por exemplo se quisermos limitá-lo a 100K por segundo:

 wget -c --limit-rate=100K http://pagina.com/iso/ubuntulinux.iso  

Também é possivel usar “recursão”. Se deseja baixar todos os arquivos de uma página web recursivamente usando wget, pode fazer assim:

 wget -r “http://localhost/pasta/”  

Podemos indicar que não crie diretórios, quando está realizando download de maneira simultânea, o qual somente baixará os arquivos, assim:

 wget -r -nd “http://localhost/pasta/”  

Baixar os dois primeiros níveis ou mais de maneira simultânea assim:

 wget -r -l2 “http://localhost/pasta/”  

Usando algo mais similar a Expressões Regulares no wget: Isto é feito usando os caracteres especiais * ?, por exemplo:

 wget http://localhost/*.txt  

 

 wget ftp://dominio.com/pub/file??.vbs  

 

 wget http://dominio.com/pub/files??.*  

 

 wget -r “*.jpg” http://dominio.com/pub/  

O wget também nos permite baixar um website completo e torná-lo disponível localmente. Para isso basta fazermos da seguinte forma:

 wget --mirror -p --convert-links -P ./diretorio_local http://ubuntulinux.com.br/  

–mirror: ativa as opções de espelhamento;
-p: baixa to
dos os arquivos que são necessários para exibir plenamente uma determinada página HTML;
–convert-links: após o download, converte os links no documento para visualização local; e
-P ./diretorio_local: salva todos os arquivos e diretórios no diretório especificado.

Se quisermos baixar um website sem as imagens, por exemplo. Podemos utilizar o –reject, que rejeita um tipo de arquivo:

 wget --reject=gif http://ubuntulinux.com.br/  

E claro, podemos fazer o inverso: Baixar somente as imagens do website. Para isso utilizaremos o :

 wget -r -A.png http://ubuntulinux.com.br/  

Podemos deixar o wget rodando em background com -b, assim:

 wget -b http://localhost/arquivo.txt  

Se utilizarmos o GNU/Linux pode fazer diretamente no console assim:

 wget http://localhost/arquivo.txt &  

Aí utilizaríamos o tail para sempre checar o estado do download:

 tail -f wget-log  

Uma das opções mais maneiras do wget é a capacidade ler URL’s de um arquivo externo de texto.
Primeiro devemos gravar as URLs no arquivo de texto e depois:

 wget -i Lista-URL.txt  

Também podemos desabilitar a cache e os cookies usando as opções -no-cache e no-cookies.

E em relação a downloads através de proxys, pode indicar o usuário e password de autenticação usando as opções -proxy-user e -proxy-password, assim:

 wget -proxy-user=usuario -proxy-password=senha http://pagina.com/iso/ubuntulinux.iso  

Bom, é isso galera…

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Como apagar arquivos e pastas pelo terminal do UbuntuAcessar