• Filed to: OCR PDF facili • Proven solutions
L'OCR può trasformare un file PDF scansionato in un documento di testo modificabile e ricercabile. Ciò potrebbe essere estremamente utile in molte situazioni e uno dei modi in cui le persone possono svolgere tale compito è con i programmi OCR open source. Oltre ad avere il vantaggio di essere gratis e facilmente disponibile su più piattaforme, ma è la soluzione ideale se devi trasformare le pagine di un libro digitalizzato in qualcosa che puoi cercare e modificare. Se tu stessi cercando una soluzione OCR stabile a lungo termine, PDFelement Pro è probabilmente la scelta migliore.
Tesseract è un meraviglioso e miglior software open source open source attualmente gestito da Google. Può essere usato su una varietà di piattaforme tra cui Linux, Windows e OS X. Include il supporto per diverse lingue e con la possibilità di scaricare ancora di più tramite estensioni, offre una vasta gamma di opzioni che copriranno quasi tutti i progetti. Tuttavia, è un po’ complicato in termini di utilizzo e per ottenere il meglio richiede una certa comprensione del codice. Se usato, tuttavia, produce risultati accurati e ha un supporto multipiattaforma che potrebbe rivelarsi utile in un'ampia varietà di situazioni. È alquanto difficile il capire come usare il software, ma una volta capito, il programma è molto efficace.
Questo è un altro software open source pdf OCR progettato per funzionare su piattaforme Linux, Windows e OS/2, offrendo una vasta scelta per quasi ogni situazione. Come con altri software open source OCR, il processo è accurato e il pacchetto espandibile. Tuttavia soffre di problemi simili con l'usabilità. Questo varia leggermente a seconda della piattaforma usata, con alcuni con un front-end più user-friendly rispetto ad altri, ma è ancora uno strumento capace una volta che si usa.
Originariamente una soluzione OCR commerciale, Cuneiform è stata convertita in open source dal suo sviluppatore quando è cessato l'ulteriore sviluppo del progetto. Per tale motivo non rappresenta la soluzione più aggiornata disponibile, ma è comunque efficace. Questo è un software multilingue che funziona ancor bene e riesce ad evitare alcune insidie proprie di altre soluzioni open source, come interfacce utente non intuitive e così via. È la più semplice dei tre da usare. Con formati di uscita multipli e molta personalizzazione possibile, è un buon software, se in ritardo rispetto agli standard più avanzati di oggi.
Funzioni |
Tesseract |
GOCR |
Cuneiform |
---|---|---|---|
Sistema Operativo Compatibile |
OS X, Windows, Linux | Windows, Linux, OS/2 | Windows |
Lingue | 12 (plus expansions) | 2 | 20 |
Conversione File | Forum/Mailing List | Mailing List | No |
Assistenza | No | No | No |
Verdetto:
Non c'è dubbio che tutti questi strumenti OCR open source offrono un modo per eseguire l'OCR sul documento. Tutti presentano alcuni svantaggi, sia che si tratti della facilità d'uso o che siano in qualche modo obsoleti e non sfruttino appieno i moderni processori multicore per la velocità. Tenendo presente ciò, molte persone si rivolgono a pacchetti commerciali più completi per soddisfare le loro esigenze di OCR e con un supporto completo, facilità d'uso e affidabilità non è una sorpresa. I prodotti open source hanno il loro posto, ma per i molti che si affidano quotidianamente agli strumenti e necessitano di qualcosa di un po’ più semplice da far funzionare, i costi valgono molto spesso a lungo termine per trovare una soluzione a lungo termine.
Tranne il software OCR open source di cui sopra, possiamo trovare molte soluzioni PDF con funzioni OCR sul mercato. PDFelement Pro sono due di questi. Ecco come OCR scannerizzare PDF e modificarlo con PDFelement Pro
La funzione OCR avanzata in PDFelement Pro ti aiuterà a eseguire facilmente l'OCR sui tuoi file PDF. Segui i passi seguenti.
Dopo aver avviato l'applicazione, clicca Apri File per aprire il PDF digitalizzato nel programma. Riceverai una notifica che ti consiglia di eseguire l'OCR.
Clicca "Esegui OCR" nella barra di notifica blu o clicca il tasto "OCR" nella scheda "Converti". Se si usasse la funzione OCR per la prima volta, si può scaricare la libreria OCR. Puoi cambiare lingua e personalizzare le pagine in base alle tue esigenze dopo il download. Clicca "OK" per lanciare il processo. Al termine, puoi modificare il testo sul file PDF scansionato con PDFelement Pro.
Fredo Russo