5 gratis OCR-tjänster online testade och granskade

Har du ett PDF -dokument eller en bild som du vill konvertera till text? Nyligen skickade någon mig ett dokument med posten som jag behövde redigera och skicka tillbaka med rättelser. Personen kunde inte hitta en digital kopia, så jag fick i uppdrag att få all text i digitalt format.

Det fanns inget sätt att jag skulle spendera timmar på att skriva in allt igen, så det slutade med att jag tog en fin högkvalitativ bild av dokumentet och sedan brände mig igenom ett gäng OCR - tjänster online för att se vilken som skulle ge mig bäst resultat.

I den här artikeln ska jag gå igenom ett par av mina favoritsajter för OCR som är gratis. Det är värt att notera att de flesta av dessa webbplatser tillhandahåller en grundläggande gratistjänst och sedan har betalalternativ om du vill ha extra funktioner som större bilder, flersidiga PDF - dokument, olika inmatningsspråk, etc.

Det är också bra att veta i förväg att de flesta av dessa tjänster inte kommer att kunna matcha formateringen av ditt originaldokument. Dessa är främst för att extrahera text och det är allt. Om du vill att allt ska vara i en specifik layout eller format måste du göra det manuellt när du har fått all text från OCR .

Dessutom kommer de bästa resultaten för att få texten från dokument med en upplösning på 200 till 400 DPI . Om du har en bild med låg DPI blir resultatet inte lika bra.

Slutligen fanns det många sajter jag testade som bara inte fungerade. Om du Googlar gratis online OCR kommer du att se ett gäng webbplatser men flera av webbplatserna i de 10 bästa resultaten slutförde inte ens konverteringen. Vissa fick timeout, andra gav fel och vissa fastnade bara på "konverteringssidan", så jag brydde mig inte ens om att nämna dessa sajter.

För varje sida testade jag två dokument för att se hur bra resultatet skulle bli. För mina tester använde jag helt enkelt min iPhone 5S för att ta en bild av båda dokumenten och laddade sedan upp dem direkt till webbplatserna för konvertering.

Om du vill se hur bilderna såg ut som jag använde för mitt test så har jag bifogat dem här: Test1 och Test2 . Observera att dessa inte är fullupplösta versioner av bilderna tagna från telefonen. Jag använde bilden i full upplösning när jag laddade upp till webbplatserna.

OnlineOCR

OnlineOCR.net är en ren och enkel sida som levererade mycket bra resultat i mitt test. Det viktigaste jag gillar med den är att den inte har massor av annonser överallt, vilket vanligtvis är fallet med den här typen av nischade tjänstwebbplatser.

gratis online ocr

För att börja, välj din fil och vänta tills den har laddats upp. Den maximala uppladdningsstorleken för denna webbplats är 100 MB. Om du registrerar dig för ett gratiskonto får du några extra funktioner som den större uppladdningsstorleken, flersidiga PDF(PDFs) -filer , olika inmatningsspråk, fler konverteringar per timme, etc.

Välj sedan ditt inmatningsspråk och välj sedan utdataformatet. Du kan välja mellan Word , Excel eller vanlig text(Plain Text) . Klicka(Click) på knappen Konvertera(Convert) så ser du texten längst ner i en ruta tillsammans med en nedladdningslänk.

ocr utgång

Om allt du vill ha är texten, kopiera och klistra bara in den från rutan. Men jag föreslår att du laddar ner Word- dokumentet eftersom det gör ett förvånansvärt bra jobb med att behålla originaldokumentets layout.

Till exempel, när jag öppnade Word -dokumentet för mitt andra test, blev jag förvånad över att se att dokumentet innehöll en tabell med tre kolumner, precis som i bilden.

online ocr-utgång

Av alla webbplatser var den här den överlägset bästa. Det är helt värt att registrera sig för om du behöver göra många konverteringar.

För fullständighetens skull kommer jag också att länka till utdatafilerna som skapas av varje tjänst så att du kan se resultatet själv. Här är resultaten från OnlineOCR : Test1 Doc och Test2 Doc .

Observera att när du öppnar dessa Word -dokument på din dator får du ett meddelande i Word om att det är från Internet och att redigering har inaktiverats. Det är helt OK eftersom Word inte litar på dokument från Internet och du behöver verkligen inte aktivera redigering om du bara vill se dokumentet.

i2OCR

En annan sida som gav ganska bra resultat var i2OCR . Processen är väldigt lik: välj språk, fil och tryck sedan på Extrahera text(Extract Text) .

i2ocr

Du måste vänta en minut eller två här eftersom den här sidan tar lite längre tid. Se också till i steg 2(Step 2) att din bild visas med höger sida upp i förhandsgranskningen, annars får du en massa floskler som utdata. Av någon anledning visades bilderna från min iPhone i stående läge på min dator, men liggande när jag laddade upp till den här webbplatsen.

i2ocr-utgång

Jag var tvungen att manuellt öppna bilden i en fotoredigeringsapp, rotera den 90 grader, sedan rotera tillbaka den till porträtt och sedan spara den igen. När(Once) du är klar, scrolla ner och det kommer att visa dig en förhandsgranskning av texten tillsammans med en nedladdningsknapp.

Den här webbplatsen klarade sig ganska bra med resultatet för det första testet, men gjorde det inte så bra med det andra testet som hade kolumnlayouten. Här är resultaten från i2OCR: Test1 Doc och Test2 Doc .

FreeOCR

Free-OCR.com tar dina bilder och konverterar dem till vanlig text. Den har inte ett alternativ att exportera till Word -format. Välj din fil, välj ett språk och klicka sedan på Start .

Webbplatsen är snabb och du kommer att få utdata ganska snabbt. Klicka bara(Just) på länken för att ladda ner textfilen till din dator.

freeocr

Som med NewOCR som nämns nedan, använder den här webbplatsen alla T:n i dokumentet. Jag har ingen aning om varför det skulle göra det, men av någon konstig anledning gjorde den här sidan och NewOCR båda detta. Det är ingen stor sak att ändra det, men det är en tråkig process som du egentligen inte borde behöva göra.

Här är resultaten från FreeOCR: Test1 Doc och Test2 Doc .

ABBYY FineReader Online

För att använda FineReader Online måste du registrera dig för ett konto, vilket ger dig en 15-dagars gratis provperiod för att OCR upp till 10 sidor gratis. Om du bara behöver göra en engångs- OCR för ett par sidor kan du använda den här tjänsten. Se(Make) till att du klickar på verifieringslänken i bekräftelsemailet efter att du har registrerat dig.

finereader online

Klicka på Recognize längst upp och klicka sedan på Ladda(Upload) upp för att välja din fil. Välj ditt språk, utdataformat och klicka sedan på Recognize längst ned. Den här webbplatsen har ett rent gränssnitt och inga annonser också.

I mina tester kunde den här sidan ta tag i texten från det första testdokumentet, men det var helt enormt när jag öppnade Word - dokumentet, så det slutade med att jag gjorde det igen och valde vanlig text(Plain Text) som utdataformat.

För det andra testet med kolumnerna var Word - dokumentet tomt och jag kunde inte ens hitta texten. Osäker på vad som hände där, men det verkar inte kunna hantera annat än enkla stycken. Här är resultaten från FineReader: Test1 Doc och Test2 Doc .

Ny OCR

Nästa sida, NewOCR.com , var OK, men inte alls lika bra som den första. För det första har den annonser, men tack och lov inte en ton. Du väljer först din fil och klickar sedan på knappen Förhandsgranska .(Preview)

ladda upp bild

Du kan sedan rotera bilden och justera området där du vill skanna efter text. Det är ungefär som hur skanningsprocessen fungerar på en dator med en ansluten skanner.

ocr bild

Om dokumentet har flera kolumner kan du kontrollera knappen Sidlayoutanalys( Page layout analysis) och den kommer att försöka dela upp texten i kolumner. Klicka(Click)OCR- knappen, vänta några sekunder tills den är klar och scrolla sedan ner till botten när sidan uppdateras.

I det första testet fick den all text korrekt, men av någon anledning skrevs varje T i dokumentet med versaler! Ingen aning om varför det skulle göra det, men det gjorde det. I det andra testet med sidanalys aktiverad fick den det mesta av texten, men layouten var helt avstängd.

Här är resultaten från NewOCR: Test1 Doc  och Test2 Doc .

Slutsats

Som du kan se ger gratis dig inte riktigt bra resultat för det mesta tyvärr. Den första sajten som nämns är den överlägset bästa eftersom den inte bara gjorde ett bra jobb med att känna igen all text, den lyckades också behålla formatet på originaldokumentet.

Om du bara behöver text, men de flesta av webbplatserna ovan borde kunna göra det åt dig. Om du har några frågor, kommentera gärna. Njut av!



About the author

Hej potentiella arbetsgivare! Jag är en mycket erfaren mjukvaruingenjör med över 7 års erfarenhet inom området. Jag vet hur man designar och utvecklar Windows 7-applikationer och har ett brett utbud av Coola webbplatser-rekommendationer på min profil. Mina kunskaper och erfarenheter erbjuder mig en utmärkt matchning för alla företag som letar efter en talangfull person med goda projektledningsförmåga, programmeringskunskaper och erfarenhet av webbutveckling.



Related posts