Converter páginas Web em PDF

Por: Ricardo Durand
Tempo de leitura: 5 min
wkhtmltopdf

Às vezes, há artigos na Web que queremos guardar num ficheiro de texto, com ou sem imagens, para memória futura ou para fazer parte de um arquivo que estejamos a fazer sobre um determinado tema. Em vez de guardar a página Web nos favoritos do browser – pode haver um problema no site e ficar offline ou deixar de existir – a alternativa é guardá-la em PDF, no computador. Por defeito, os browsers já permitem fazer isto, mas com algumas limitações. Para contornar isso, usamos a ferramenta wkhtmltopdf (que, basicamente, é um comando para usar na Linha de Comandos do Windows) e convertemos de forma fácil uma página Web (ou várias) num PDF.

1 – Faça o download deste programa que nos vai ajudar a converter páginas de um site para PDF em wkhtmltopdf.org. Clique em ‘Downloads’ e depois na versão de 32 ou 64-bit que aparece primeiro, para Windows. Instale o wkhtmltopdf e entre na pasta onde ficou instalado (no disco C:/programas/wkhtmltopdf/bin). Aqui, pressione a combinação de teclas ‘Alt + D’ para seleccionar a barra de endereço desta janela do ´Explorador de Ficheiros’, escreva cmd e faça ‘Enter’ – isto faz com que se abra a Linha de Comandos do Windows.

2 – Abra o seu browser (funciona com qualquer um, desde o Edge ao Chrome) e entre na página da Web que quer converter em PDF – escolhemos uma página da Wikipedia sobre Plutão. Copie o endereço, volte à janela da Linha de Comandos que abriu e faça ‘Ctrl + V’ para o colar aqui. Dê um espaço e escreva a localização onde quer gravar o PDF (por exemplo, nós criámos uma pasta chamada ‘WebPDF’, por isso será ‘c:/WebPDF’). Assim, o comando completo para converter esta página é:
wkhtmltopdf https://pt.wikipedia.org/wiki/Plutao c:\WebPDF\Plutao.pdf (também tem de dar um nome ao ficheiro e colocar a extensão ‘PDF’ – escolhemos ‘Plutao.pdf’. Carregue em ‘Enter’ para que a conversão seja feita.

3 – Quando terminar, abra o ‘Explorador de Ficheiros’ e entre na pasta que criou para guardar os PDF. Como pode ver no nosso exemplo, é mostrada uma cópia exacta da página da Wikipedia com o artigo que escolhemos sobre Plutão.Todos os links que existam nos artigos originais também são clicáveis nestes PDF – se não quiser que seja assim, tem de escrever –disable-external-links no comando, logo a seguir a ‘wkhtmltopdf’, antes do URL do site.

4 – Para incluir várias páginas Web num PDF, basta adicionar os endereços ao comando com um espaço entre cada um: a ordem em que os escreve define como aparecem no PDF. No nosso exemplo, adicionámos mais páginas da Wikipedia sobre planetas; apenas é preciso não esquecer, também, de dar nome do ficheiro final. Se quiser retirar as imagens, para reduzir o tamanho do PDF, escreva –no-images a seguir a ‘wkhtmltopdf’, tal como explicámos para retirar os links no passo anterior.

5 – Se as páginas Web que está a converter forem demasiado extensas, podemos facilitar a navegação entre elas ao adicionar um índice no início do PDF: basta começar o comando com a indicação wkhtmltopdf toc. Depois, quando abrir o ficheiro, o que aparece primeiro é um índice: clique num link para abrir a página respectiva.

6 – Existem outras opções que permitem ajustar as características do PDF – para ver todas as possibilidades, escreva wkhtmltopdf -H na linha de comandos. Por exemplo, se quer aumentar o tamanho da fonte para 30, adicione o comando –minimum-font-size 30 como nos passos 3 e 4. Tenha em atenção que se estiver a converter várias páginas, esta mudança aplica o tamanho da fonte a todas as páginas Web. Se quiser mudar apenas o tamanho da letra em algumas páginas, tem de escrever este comando depois dos endereços.

7 – Também podemos converter páginas Web em imagens – contudo, aqui não vai conseguir pesquisar e seleccionar texto ou adicionar várias páginas ao mesmo ficheiro, como acontece num PDF. Para experimentar, escreva wkhtmltoimage seguido do endereço que quiser converter e dê-lhe um nome, com a extensão JPG: wkhtmltoimage https://pt.wikipedia.org/wiki/Jupiter_(planeta) c:\WebPDF\Jupiter.jpg.

Por: Ricardo Durand Editor
Seguir:
Começou no jornalismo de tecnologias em 2005 e tem interesse especial por gadgets com ecrã táctil e praias selvagens do Alentejo. É editor do site Trendy e faz regularmente viagens pelo País em busca dos melhores spots para fazer surf. Pode falar com ele pelo email rdurand@pcguia.fidemo.pt.
Exit mobile version