Google ajoute la prise en charge de l'OCR pour 34 langues
Qu'est-ce que l'OCR?
Si vous venez de nous rejoindre, Optical CharacterLa reconnaissance est un système automatisé qui traduit une image de texte en texte sélectionnable codé. Google utilise OCR pour numériser vos images et vos fichiers PDF. Il transforme ensuite la numérisation en un format modifiable de Google Doc. Au cours des deux dernières années, Google a eu recours à la contribution humaine de puzzles reCAPTCHA pour mieux identifier les mots complexes.
Quelles langues ont été ajoutées?
Outre les langues supplémentaires, Google a égalementqualité OCR améliorée pour les 5 langues précédemment implémentées: anglais, italien, allemand, espagnol et français. Les 29 nouvelles langues ajoutées sont les suivantes:
1. bulgare 2. catalan 3. Chinois (Han simplifié) 4. croate 5. tchèque 6. danois 7. néerlandais 8. philippin 9. finnois 10. grec 11. hongrois 12. indonésien 13. japonais 14. coréen 15. letton</ p> | 16. lituanien 17. norvégien 18. polonais 19. portugais 20. roumain 21. russe 22. serbe 23. slovaque 24. slovène 25. suédois 26. thaï 27. turc 28. ukrainien 29. vietnamien |
Lorsque vous téléchargez des images ou des fichiers PDF dans Google Docs, veillez à: Sélectionner la langue dans laquelle le texte de votre fichier est écrit! Pour ce faire, placez votre fichier en file d'attente pour le téléchargement, puis Vérifier la boîte pour Conversion de texte à partir de fichiers PDF ou d'images en documents Google Docs. Un menu déroulant Langue du document apparaît. Vous pouvez y accéder. Sélectionner Votre langue.
Avez-vous essayé la technologie OCR de Google pourscanner de vieux journaux de famille, des livres ou tout ce que vous avez à la maison? Vous pouvez également l'essayer sur votre iPhone ou votre téléphone Android si vous possédez l'application Google Goggles!
laissez un commentaire