Google добавя OCR поддръжка за 34 езика

Какво е OCR?
Ако просто се присъединявате към нас, Оптичен геройРазпознаването е автоматизирана система, която превежда изображение на текст в кодиран избираем текст. Google използва OCR за сканиране на вашите снимки и PDF файлове, след което превръща сканирането в редактируем формат на Google Doc. През последните 2 години Google използва човешки принос от пъзели reCAPTCHA, за да увеличи успеха си в идентифицирането на сложни думи.
Какви езици бяха добавени?
Наред с допълнителните езици, Google същоподобрено качество на OCR за 5-те реализирани преди това езици: английски, италиански, немски, испански и френски. Добавените 29 нови езика са следните:
1. български 2. Каталунски 3. китайски (опростен хан) 4. Хърватски 5. Чешки 6. датски 7. Холандски 8. Филипински 9. Финландски 10. Гръцки 11. унгарски 12. Индонезийски 13. Японци 14. корейски 15. Латвийски</ P> | 16. Литовски 17. Норвежки 18. Полски 19. Португалски 20. Румънски 21. руски 22. Сръбски 23. Словашки 24. словенски 25. шведски 26. Тайландски 27. турски 28. украински 29. Виетнамски |
Когато качвате изображения или PDF файлове в Google Документи, не забравяйте Изберете езикът, на който е написан текстът във вашия файл! За целта поставете файла си в опашката, която ще бъде качена Проверка кутията за Преобразувайте текст от PDF или файлове с изображения в документи на Google Docs, Ще се покаже падащото меню Език на документа, там можете Изберете твоят език.

Изпробвали ли сте OCR технологията на Google засканиране на стари семейни дневници, книги или каквото и да е друго, което сте положили около къщата? Можете също да го изпробвате на вашия iPhone или Android телефон, ако имате приложението Google Goggles!
Оставете коментар