Come estrarre il testo da un documento PDF
Estrai il testo usando Acrobat Reader
Passaggio 1
Apri il file in Acrobat Reader. In Windows, seleziona "File -> Esporta documento di testo", assegna un nome al documento e salvalo.
Passaggio 2
Su un sistema operativo Mac o Linux, copia il testo accedendo al menu "Visualizza" e selezionando "Continua" o "Orientamento continuo". (La prima opzione ti darà il testo in una colonna, mentre la seconda opzione formatterà il testo come pagine affiancate). Vai a "Modifica -> Seleziona tutto" e poi "Modifica -> Copia".
Passaggio 3
Usa lo strumento Seleziona se vuoi solo estrarre parte del testo. Fare clic sullo strumento "Seleziona testo" e quindi selezionare le informazioni desiderate. In un documento con più colonne, dovrai utilizzare il primo strumento "Selezione colonne". Vai a "Modifica -> Copia"
Converti PDF in HTML
Passaggio 1
Utilizza Gmail come scorciatoia. Allega il file PDF a un'email e invialo al tuo account Gmail. Quando apri l'email vedrai una serie di opzioni accanto all'allegato. Seleziona l'opzione "Visualizza come HTML" e salva il file che si apre in una finestra separata. Sebbene non sia possibile visualizzare la grafica, il file HTML conserva il formato del documento di testo.
Passaggio 2
Estrai e converti i file sulla riga di comando. Gli utenti Linux possono utilizzare un comando di conversione di base che modificherà un file .pdf in un file .txt: "Pdftotext nomefile.pdf". Assicurati di cambiare il nome del file con il nome del file PDF.
Passaggio 3
Scarica un programma di conversione di testo PDF. Ci sono un certo numero di programmi open source e programmi gratuiti disponibili, come PDFBox e Easy PDF to Text Converter. Molti di questi programmi possono anche convertire i file PDF in HTML.