Что: 8fcb5b8860eae6e0ba253f4c78997ae31fa33670 Когда: 2024-02-11 23:17:49+03:00 ------------------------------------------------------------------------ ------------------------------------------------------------------------ Впервые использовал Tesseract OCR https://en.wikipedia.org/wiki/Tesseract_(software) В девятом классе (20+ лет назад) я на подработке использовал FineReader для распознавания текста. С тех пор ни разу не трогал подобный софт. А тут надо один документ заново "набрать". Установил из портов Tesseract, сделал на цифровую мыльницу фотографию документа, просто указал путь к JPEG файлу и .txt файлу, подождал несколько секунд -- получил текст. Не абсолютно всё распозналось, но почти всё. Существенно сэкономило время, нежели пришлось бы набирать всё с нуля. Полностью свободное ПО, не много зависимостей. Приятная штука оказалась, ожидал куда большего геморроя. ------------------------------------------------------------------------ оставить комментарий: mailto:comment@blog.stargrave.org?subject=Re:%20%D0%92%D0%BF%D0%B5%D1%80%D0%B2%D1%8B%D0%B5%20%D0%B8%D1%81%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D0%BB%20Tesseract%20OCR%20%288fcb5b8860eae6e0ba253f4c78997ae31fa33670%29 ------------------------------------------------------------------------ Сгенерирован: SGBlog 0.34.0