Google lägger till OCR-support på 34 språk

Vad är OCR?
Om du bara går med oss, Optical CharacterErkännande är ett automatiserat system som översätter en bild av text till kodad valbar text. Google använder OCR för att skanna dina bilder och PDF-filer, sedan förvandlas skanningen till ett redigerbart Google Doc-format. Under de senaste två åren har Google använt mänskliga input från reCAPTCHA-pussel för att öka deras framgång med att identifiera komplexa ord.
Vilka språk lades till?
Tillsammans med de ytterligare språken, Google ocksåförbättrad OCR-kvalitet för de 5 tidigare implementerade språken: engelska, italienska, tyska, spanska och franska. De 29 nya språk som har lagts till är följande:
1. Bulgariska 2. katalanska 3. Kinesiska (förenklad Han) 4. Kroatiska 5. Tjeckiska 6. danska 7. holländska 8. Filippinsk 9. finska 10. Grekiska 11. ungerska 12. indonesiska 13. Japanska 14. koreanska 15. lettiska</ P> | 16. litauiska 17. norska 18. Polska 19. portugisiska 20. rumänska 21. ryska 22. serbiska 23. Slovakiska 24. Slovenska 25. svenska 26. Thai 27. turkiska 28. Ukrainska 29. Vietnamesiska |
Var noga med att ladda upp bilder eller PDF-filer till Google Docs Välj det språk som texten i din fil är skriven på! För att göra det, lägg din fil i kön som ska laddas upp Kolla upp lådan för Konvertera text från PDF- eller bildfiler till Google Docs-dokument. En rullgardinsmeny för dokumentspråk visas där du kan Välj ditt språk.

Har du provat Googles OCR-teknik förskanna gamla familjetidskrifter, böcker eller vad du än har lagt runt i huset? Du kan också prova det på din iPhone eller Android-telefon om du har appen Google Goggles!
Lämna en kommentar