Ремонт аймак

19.03.2017

Что-то у нас уж совсем идиллическая картина получается: пришел, увидел, распознал. No problem. На самом деле проблемы возникают. На страницах с нестандартным шрифтом, на страницах с мелким текстом, на страницах со сложным фоновым изображением, на страницах со сложной версткой (особенно если вставленные картинки или текстовые блоки нарушают ровные колонки текста). Иногда какой-то рисуночек или текстовый фрагмент необъяснимым образом выпадает из конечного документа. Иногда программа принимает рисунок за текст и пытается его распознать. Иногда, наоборот, принимает фрагмент текста за рисунок и не распознает. А иногда две колонки принимает за одну и пытается их соединить. Всяко бывает.

Можно выделить две основные причины неполадок: когда программа плохо понимает шрифт, которым набран сканируемый текст, и когда программа неверно размечает страницу блоками. Давайте обсудим, как со всем этим быть. Возможно вам понадобится ремонт аймак.

Обучать программу нестандартным шрифтам (декоративным, заголовочным) имеет смысл только для длинного текста. Короткий проще поправить руками (при помощи спеллера, конечно). Как же это делается? Ставите точку в строке Распознавание с обучением (Сервис ► Опции ► Распознать). Нажимаете кнопку Распознать. Вам покажут окно Ручное обучение эталона. Вписываете в окошке тот символ, на котором остановилась программа1, и жмете кнопку Обучить. Форма этого символа будет запомнена. Тут же покажут следующий. И так до тех пор, пока вы не увидите, что программа пишет в окошке ввода все время правильные буквы - ну, значит, усвоила. Обычно приходится проходить таким образом не более странички-двух. После этого нажмете кнопку Закрыть и можете приступать к распознаванию. В опциях на странице Распознавание этот режим работы называется Распознавание с пользовательским эталоном.








Нас выбрали

partners3