Come estrarre il testo da un documento PDF

Può essere molto frustrante cercare di estrarre il testo da un file PDF per usarlo in un'altra applicazione.

Estrai il testo usando Acrobat Reader

Passaggio 1

Apri il file in Acrobat Reader. In Windows, seleziona "File -> Esporta documento di testo", assegna un nome al documento e salvalo.

Passaggio 2

Su un sistema operativo Mac o Linux, copia il testo accedendo al menu "Visualizza" e selezionando "Continua" o "Orientamento continuo". (La prima opzione ti darà il testo in una colonna, mentre la seconda opzione formatterà il testo come pagine affiancate). Vai a "Modifica -> Seleziona tutto" e poi "Modifica -> Copia".

Passaggio 3

Usa lo strumento Seleziona se vuoi solo estrarre parte del testo. Fare clic sullo strumento "Seleziona testo" e quindi selezionare le informazioni desiderate. In un documento con più colonne, dovrai utilizzare il primo strumento "Selezione colonne". Vai a "Modifica -> Copia"

Converti PDF in HTML

Passaggio 1

Utilizza Gmail come scorciatoia. Allega il file PDF a un'email e invialo al tuo account Gmail. Quando apri l'email vedrai una serie di opzioni accanto all'allegato. Seleziona l'opzione "Visualizza come HTML" e salva il file che si apre in una finestra separata. Sebbene non sia possibile visualizzare la grafica, il file HTML conserva il formato del documento di testo.

Passaggio 2

Estrai e converti i file sulla riga di comando. Gli utenti Linux possono utilizzare un comando di conversione di base che modificherà un file .pdf in un file .txt: "Pdftotext nomefile.pdf". Assicurati di cambiare il nome del file con il nome del file PDF.

Passaggio 3

Scarica un programma di conversione di testo PDF. Ci sono un certo numero di programmi open source e programmi gratuiti disponibili, come PDFBox e Easy PDF to Text Converter. Molti di questi programmi possono anche convertire i file PDF in HTML.