5 servizi OCR online gratuiti testati e testati


Hai un documento PDF o un'immagine che vorresti convertire in testo? Recentemente, qualcuno mi ha inviato un documento per posta che avevo bisogno di modificare e inviare indietro con correzioni. La persona non è riuscita a trovare una copia digitale, quindi mi è stato assegnato il compito di ottenere tutto il testo in formato digitale.

Non avevo intenzione di passare ore a digitare tutto di nuovo, quindi ho finito col prendere una bella immagine di alta qualità del documento e poi mi ha bruciato attraverso una serie di servizi OCR online per vedere quale mi avrebbe dato i migliori risultati.

In questo articolo, passerò attraverso un paio dei miei siti preferiti per OCR che sono gratuiti. Vale la pena notare che la maggior parte di questi siti fornisce un servizio gratuito di base e quindi ha opzioni a pagamento se si desidera funzionalità extra come immagini più grandi, documenti PDF multipagina, lingue di input diverse, ecc.

È anche utile sapere in anticipo che la maggior parte di questi servizi non sarà in grado di eguagliare la formattazione del documento originale. Questi sono principalmente per l'estrazione di testo e basta. Se hai bisogno che tutto sia in un formato o in un formato specifico, dovrai farlo manualmente dopo aver ottenuto tutto il testo dall'OCR.

Inoltre, i risultati migliori per ottenere il testo arriveranno da documenti con una risoluzione da 200 a 400 DPI. Se hai una bassa immagine DPI, i risultati non saranno così buoni.

Infine, ci sono stati molti siti che ho provato che non funzionavano. Se l'OCR online di Google è gratuito, vedrai un sacco di siti ma molti dei siti nei primi 10 risultati non hanno nemmeno completato la conversione. Alcuni avrebbero timeout, altri avrebbero commesso errori e alcuni si sono bloccati sulla pagina di "conversione", quindi non mi sono nemmeno preoccupato di menzionare quei siti.

Per ogni sito, ho testato due documenti per vedere quanto bene l'output sarebbe. Per i miei test, ho semplicemente utilizzato il mio iPhone 5S per scattare una foto di entrambi i documenti e poi li ho caricati direttamente sui siti web per la conversione.

Nel caso in cui desideri vedere come sono le immagini che ho usato per il mio test, li ho allegati qui: test1 e test2. Si noti che queste non sono le versioni a piena risoluzione delle immagini prese dal telefono. Ho usato l'immagine a piena risoluzione durante il caricamento sui siti.

OnlineOCR

OnlineOCR.net è un sito pulito e semplice che ha fornito ottimi risultati nel mio test. La cosa principale che mi piace è che non ha un sacco di pubblicità in tutto il luogo, che di solito è il caso con questi tipi di siti di servizio di nicchia.

free online ocr

Per iniziare, seleziona il file e attendi fino al termine del caricamento. La dimensione massima di caricamento per questo sito è di 100 MB. Se ti registri per un account gratuito, ottieni alcune funzionalità extra come la dimensione di caricamento più grande, i PDF multipagina, le lingue di input diverse, più conversioni all'ora, ecc.

Quindi, scegli la lingua di input e quindi scegli il formato di output. È possibile scegliere tra Word, Excel o Testo semplice. Fai clic sul pulsante Convertie vedrai il testo visualizzato in fondo in una casella insieme a un link per il download.

ocr output

Se tutto ciò che vuoi è il testo, basta copiarlo e incollarlo dalla scatola. Tuttavia, ti suggerisco di scaricare il documento Word perché fa un lavoro sorprendentemente grandioso nel mantenere il layout del documento originale.

Ad esempio, quando ho aperto il documento Word per il mio secondo test, sono rimasto sorpreso di trova che il documento includesse una tabella con tre colonne, proprio come nell'immagine.

online ocr output

Tra tutti i siti, questo era il migliore di gran lunga. Vale assolutamente la pena di registrarti se hai bisogno di fare molte conversioni.

Per completezza, ho intenzione di collegare anche i file di output creati da ciascun servizio in modo da poter vedere i risultati da solo. Ecco i risultati di OnlineOCR: Test1 Doc e Test2 Doc.

Nota che quando apri questi documenti Word sul tuo computer, riceverai un messaggio Word afferma che proviene da Internet e la modifica è stata disabilitata. Questo è perfettamente OK perché Word non si fida dei documenti da Internet e in realtà non è necessario abilitare la modifica se si desidera solo visualizzare il documento.

i2OCR

Un altro sito che ha dato risultati abbastanza buoni era i2OCR. Il processo è molto simile: scegli la lingua, il file, quindi premi Estrai testo.

i2ocr

devo aspettare un minuto o due qui perché questo sito richiede un po 'di più. Inoltre, nel passaggio 2, assicurati che l'immagine sia visualizzata nell'anteprima con il lato destro, altrimenti otterrai un sacco di parole incomprensibili come output. Per qualche ragione, le immagini del mio iPhone venivano visualizzate in modalità verticale sul mio computer, ma sono panoramiche quando ho caricato su questo sito.

i2ocr output

I dovuto aprire manualmente l'immagine in un'app di editing fotografico, ruotarla di 90 gradi, quindi ruotarla di nuovo in verticale e quindi salvarla di nuovo. Una volta completato, scorri verso il basso e ti mostrerà un'anteprima del testo insieme a un pulsante di download.

Questo sito è andato molto bene con l'output per il primo test, ma non ha funzionato molto bene con il secondo test che ha avuto il layout della colonna. Ecco i risultati di i2OCR: Test1 Doc e Test2 Doc.

FreeOCR

Free-OCR.com prenderà le tue immagini e convertirle in testo semplice. Non ha un'opzione per esportare in formato Word. Scegli il tuo file, seleziona una lingua e poi fai clic su Start.

Il sito è veloce e otterrai l'output abbastanza rapidamente. Basta fare clic sul link per scaricare il file di testo sul tuo computer.

freeocr

Come con NewOCR menzionato di seguito, questo sito capitalizza tutte le T in il documento. Non ho idea del perché lo farebbe, ma per qualche strano motivo questo sito e NewOCR lo hanno fatto entrambi. Non è un grosso problema cambiarlo, ma è un processo noioso che non dovresti assolutamente fare.

Ecco i risultati di FreeOCR: Test1 Doc e Test2 Doc.

ABBYY FineReader Online

Per utilizzare FineReader online, devi registrarti per un account, che ti consente di ottenere un 15 giorni prova gratuita per OCR fino a 10 pagine gratis. Se devi solo eseguire un OCR occasionale per un paio di pagine, puoi utilizzare questo servizio. Assicurati di fare clic sul link verifica nell'e-mail di conferma dopo la registrazione.

finereader online

Fai clic su Riconosciin alto e poi su Caricaper selezionare il file. Scegli la lingua, il formato di output, quindi fai clic su Riconoscinella parte inferiore. Questo sito ha un'interfaccia pulita e senza pubblicità.

Nei miei test, questo sito è stato in grado di catturare il testo dal primo documento di test, ma è stato assolutamente enorme quando ho aperto il documento Word, quindi ho finito per rifarlo e scegliere Plain Text come formato di output.

Per il secondo test con le colonne, il documento Word era vuoto e non riuscivo nemmeno a trovare il testo. Non sono sicuro di cosa sia successo lì, ma non sembra in grado di gestire qualcosa di diverso dai semplici paragrafi. Ecco i risultati di FineReader: test1 Doc e Test2 Doc.

NewOCR

Il prossimo sito, NewOCR.com, era OK, ma non così buono come il primo sito. In primo luogo, ha pubblicità, ma per fortuna non una tonnellata. Per prima cosa seleziona il tuo file e poi fai clic sul pulsante Anteprima.

upload image

Puoi quindi ruotare l'immagine e regolare il area in cui si desidera cercare il testo. È un po 'come il modo in cui il processo di scansione funziona su un computer con uno scanner collegato.

ocr image

Se il documento ha più colonne, puoi controlla il pulsante Analisi del layout di paginae cercherà di dividere il testo in colonne. Fai clic sul pulsante OCR, attendi qualche secondo per completarlo e quindi scorri verso il basso quando la pagina si aggiorna.

Nel primo test, ha ottenuto tutto il testo correttamente, ma per qualche motivo in maiuscolo ogni T nel documento! Non ho idea del perché lo avrebbe fatto, ma è successo. Nel secondo test con l'analisi della pagina attivata, ha ottenuto la maggior parte del testo, ma il layout era completamente disattivato.

Ecco i risultati di NewOCR: Test1 Doc e Test2 Doc.

Conclusione

Come puoi vedere, la libertà non ti dà davvero risultati molto buoni, il più delle volte, sfortunatamente. Il primo sito menzionato è il migliore di gran lunga perché non solo ha fatto un ottimo lavoro nel riconoscere tutto il testo, ma è anche riuscito a mantenere il formato del documento originale.

Se hai solo bisogno di testo, , la maggior parte dei siti web sopra dovrebbe essere in grado di farlo per te. Se avete domande, sentitevi liberi di commentare. Buon divertimento!

Ecco il modo migliore per scaricare video o intere playlist, o convertirli in Audio mp3!

Post correlati:


2.12.2015