Google legger til OCR-støtte for 34 språk

Hva er OCR?
Hvis du bare blir med, Optical CharacterAnerkjennelse er et automatisert system som oversetter et bilde av tekst til kodet valgbar tekst. Google bruker OCR for å skanne bildene og PDF-filene dine, og deretter gjør skanningen til et redigerbart Google Doc-format. I løpet av de siste to årene har Google brukt menneskelige innspill fra reCAPTCHA-gåter for å øke suksessen med å identifisere komplekse ord.
Hvilke språk ble lagt til?
Sammen med tilleggsspråk, Google ogsåforbedret OCR-kvalitet for de fem tidligere implementerte språkene: engelsk, italiensk, tysk, spansk og fransk. De 29 nye språkene som er lagt til er følgende:
1. bulgarsk 2. katalansk 3. Kinesisk (forenklet Han) 4. Kroatisk 5. Tsjekkisk 6. dansk 7. nederlandsk 8. Filippinsk 9. Finsk 10. gresk 11. ungarsk 12. indonesisk 13. japansk 14. koreansk 15. latvisk</ P> | 16. litauisk 17. norsk 18. polsk 19. portugisisk 20. rumensk 21. russisk 22. serbisk 23. Slovakisk 24. slovensk 25. svensk 26. Thai 27. tyrkisk 28. Ukrainsk 29. vietnamesisk |
Når du laster opp bilder eller PDF-filer til Google Docs, må du huske å gjøre det Å velge språket som teksten i filen din er skrevet på! For å gjøre det, legg filen i køen som skal lastes opp Kryss av boksen for Konverter tekst fra PDF- eller bildefiler til Google Docs-dokumenter. En rullegardinmeny for Dokumentspråk vises der du kan Å velge ditt språk.

Har du prøvd ut Googles OCR-teknologi forskanne gamle familiejournaler, bøker, eller hva annet du har lagt rundt i huset? Du kan også prøve det på iPhone- eller Android-telefonen hvis du har Google Goggles-appen!
Legg igjen en kommentar