Bookdesigner 5

Попередня ↔ Наступна

Одне з основних практичних застосувань програми OCR Pad - чистка і склейка (доробка) тексту після програм розпізнавання тексту. OCR Pad - незамінний помічник при оцифрування книг.

Основні можливості:

1. Повна підтримка Unicode.
Плюс 5 віртуальних клавіатур: грецька, математична, західно-європейська, східно-європейська і різні екзотичні символи.

2. Пошук поганих слів за списком користувача. Двох типів: як рекурсивний (з показом кожного знайденого слова), так і мовчазна відмітка всіх знайдених слів.

3. Find / Replace c повної Юнікодние підтримкою і пошуком за регулярними виразами (RegExp). Підтримується збереження чотирьох окремих історій пошуку / заміни (запам'ятовує до 50-ти останніх Find / Replace для кожної з чотирьох):

пошук: звичайна історія і історія RegExp
заміна: звичайна історія і історія RegExp

Вікна історії відкриваються натисканням на кнопки зі стрілкою вниз. Коли відкрито вікно історії, правий клік всередині вікна забезпечує доступ до меню менеджера історії.

RegExp - це потужна іграшка, а ті, хто в них розібрався - зможуть робити ну дуже багато. Вообщем, настійно рекомендую, розберетеся - відразу відчуєте різницю. Тим більше, що інструмент для експериментування тепер під рукою: відкриваєте Find / Replace, відзначаєте RegExp, вводите своє вираження, потім find - і відразу видно результат.

В принципі, в RegExp розібратися нескладно, але розробка RegExp-скриптів вимагає уважності і тчательной налагодження. Тому при написанні своїх файлів для Book Cleaner рекомендується їх налагоджувати по рядках. Для цього є колонка use: застосовуватися будуть тільки ті
вираження, де use відзначено.

Ну а тим, хто хоче дізнатися більше про RegExp - докладна довідка по його теорії і практиці доступна через "help -> regular expressions". Там об'єднані дві довідки: російськомовна - від Грибова і англомовна - від Білла.

4. Ну і для купи зробив вставку картинок: "Insert -> picture"

P.S. Ще в основному вікні є дві кнопки, зі стрілками вгору і вниз. Це для точного перегортання сторінок.

P.P.S. Так, забув сказати. Чи не товуйте Find / Replace і Book Cleaner в режимі показу невидимих символів (кінця рядка і nbsp): можуть бути збої.

P.P.P.S. У прикладах Book Cleaner файлів про hex-номера написав, а ось про специфіку RegExp-пошуку російських букв та іншої екзотики по hex-номерами - забув сказати. Це нечасто потрібно, але про всяк випадок ...

Робиться так. Курсор ставиться перед символом, після чого на другий панелі статусу з'являється його hex-номер. Якщо номер містить менше 4 цифр - то попереду додаються нулі. Потім до отриманої цифри додається \ u і цей вислів використовується в RegExp.

Наприклад, російська Ц. На статус висвічується hex: 426. Отже, для завдання Ц в RegExp треба використовувати \ u0426.

Інший приклад: грецька маленька альфа. На статус - hex: 3b1. Для RegExp - \ u03b1

Третій приклад: подвійний інтеграл з математичної клавіатури. На статус - hex: 222c. Для RegExp - \ u222c.

З приводу Юнікодние RegExp-специфіки досить докладно розписано в довідці від Білла.

Bookdesigner 5

Основні можливості:

Схожі статті