Google pridáva podporu OCR pre 34 jazykov
Čo je OCR?
Ak sa k nám len pripájate, optický charakterRozpoznávanie je automatizovaný systém, ktorý prevádza obraz textu na kódovaný voliteľný text. Google používa OCR na skenovanie vašich obrázkov a súborov PDF a potom zmení skenovanie na upraviteľný formát Google Doc. Za posledné 2 roky spoločnosť Google využíva ľudské vstupy z hádaniek reCAPTCHA na zvýšenie ich úspechu pri identifikácii zložitých slov.
Aké jazyky boli pridané?
Spolu s ďalšími jazykmi Googlevylepšená kvalita OCR pre 5 predtým implementovaných jazykov: angličtinu, taliančinu, nemčinu, španielčinu a francúzštinu. Pridalo sa 29 nových jazykov:
1. bulharčina 2. Katalánčina 3. čínština (zjednodušená Han) 4. chorvátsky 5. česky 6. dánsky 7. Holandčina 8. Filipínsky 9. Fínsky 10. Gréčtina 11. Maďarčina 12. indonézština 13. Japonec 14. Kórejčina 15. lotyština</ P> | 16. litovčina 17. Nórsky 18. poľština 19. portugalčina 20. rumunčina 21. ruština 22. Srbsky 23. slovenský jazyk 24. slovinčina 25. Švédčina 26. thajčina 27. turečtina 28. ukrajinčina 29. vietnamčina |
Pri odovzdávaní obrázkov alebo súborov PDF do Dokumentov Google nezabudnite vybrať jazyk, v ktorom je napísaný text vo vašom súbore! Ak to chcete urobiť, vložte súbor do frontu, ktorý chcete odovzdať check box pre Konvertujte text zo súborov PDF alebo obrázkov na dokumenty Dokumentov Google, Tam sa zobrazí rozbaľovacia ponuka Jazyk dokumentu vybrať tvoj jazyk.
Už ste vyskúšali technológiu OCR od spoločnosti Googleskenujete staré rodinné časopisy, knihy alebo čokoľvek iné, čo ležíte okolo domu? Môžete si to tiež vyskúšať na svojom telefóne iPhone alebo Android, ak máte aplikáciu Google Goggles!
Zanechať komentár