Google adaugă suport OCR pentru 34 de limbi

Ce este OCR?
Dacă vă alăturați doar noi, Optical CharacterRecunoașterea este un sistem automat care traduce o imagine de text în text selectabil codat. Google folosește OCR pentru a scana imaginile și fișierele PDF, apoi transformă scanarea într-un format Google Doc modificabil. În ultimii 2 ani, Google a folosit aportul uman din puzzle-urile reCAPTCHA pentru a-și spori succesul în identificarea cuvintelor complexe.
Ce limbi au fost adăugate?
Alături de limbile suplimentare, Google de asemeneaîmbunătățirea calității OCR pentru cele 5 limbi implementate anterior: engleză, italiană, germană, spaniolă și franceză. Cele 29 de limbi noi adăugate sunt următoarele:
1. bulgară 2. catalană 3. Chineză (Han simplificat) 4. croată 5. cehă 6. daneză 7. olandez 8. filipineză 9. finlandeză 10. greacă 11. maghiară 12. indoneziană 13. japoneză 14. coreeană 15. leton</ P> | 16. lituaniană 17. norvegiană 18. poloneză 19. portugheză 20. română 21. rusă 22. Sârb 23. slovacă 24. slovenă 25. Suedeză 26. Thai 27. turc 28. ucraineană 29. vietnameză |
Când încărcați imagini sau fișiere PDF în Google Docs, asigurați-vă că Selectați limba în care este scris textul din fișierul dvs.! Pentru a face acest lucru, puneți fișierul în coadă pentru a fi încărcat, apoi Verifica cutia pentru Convertiți text din fișiere PDF sau imagini în documente Google Docs. Apare un meniu derulant Limbă document, acolo puteți Selectați limba ta.

Ați încercat tehnologia OCR Google pentruscanează jurnale vechi de familie, cărți sau orice altceva ai așezat în jurul casei? Puteți încerca, de asemenea, pe iPhone sau telefonul dvs. Android dacă aveți aplicația Google Goggles!
Lasa un comentariu