Google tilføjer OCR-support til 34 sprog
Hvad er OCR?
Hvis du lige er med, Optisk karakterAnerkendelse er et automatiseret system, der oversætter et billede af tekst til kodet valgbar tekst. Google bruger OCR til at scanne dine billeder og PDF-filer, derefter omdannes scanningen til et redigerbart Google Doc-format. I de sidste 2 år har Google brugt menneskelige input fra reCAPTCHA-puslespil for at øge deres succes med at identificere komplekse ord.
Hvilke sprog blev tilføjet?
Sammen med de ekstra sprog, Google ogsåforbedret OCR-kvalitet for de 5 tidligere implementerede sprog: engelsk, italiensk, tysk, spansk og fransk. De 29 nye sprog, der er tilføjet, er følgende:
1. Bulgarsk 2. katalansk 3. Kinesisk (forenklet Han) 4. Kroatisk 5. Tjekkisk 6. dansk 7. hollandsk 8. Filippinsk 9. Finsk 10. græsk 11. Ungarsk 12. indonesisk 13. japansk 14. koreansk 15. lettisk</ P> | 16. litauisk 17. norsk 18. Polsk 19. portugisisk 20. rumænsk 21. russisk 22. serbisk 23. Slovakisk 24. slovenske 25. svensk 26. Thai 27. tyrkisk 28. Ukrainsk 29. Vietnamesisk |
Når du uploader billeder eller PDF-filer til Google Docs, skal du huske at gøre det Vælg det sprog, som teksten i din fil er skrevet på! For at gøre det skal du sætte din fil i køen, der skal uploades Kontrollere kassen til Konverter tekst fra PDF- eller billedfiler til Google Docs-dokumenter. En rullemenu til dokumentsprog vises, hvor du kan Vælg dit sprog.
Har du prøvet Googles OCR-teknologi tilscanning af gamle familieblade, bøger eller andet hvad du har lagt rundt i huset? Du kan også prøve det på din iPhone eller Android-telefon, hvis du har appen Google Goggles!
Efterlad en kommentar