Документация Scan Tailor

Материал из Bryansk Linux Users Group.

Перейти к: навигация, поиск

Версия 0.9.1 beta (build 20090121)

Содержание

Введение

Scan Tailor (tailor по-английски - портной) – это интерактивный инструмент для пост-обработки сканированных страниц (сканы). Он делает такие операции как разрезание страниц, компенсация наклона, добавление/удаление полей, и другие. Вы даете ему необработанные сканы, а в результате получаете страницы, готовые для печати или сборки в PDF или DJVU файл.

Сканирование, оптическое распознавание символов, а также сборка многостраничных документов не входят в задачи проекта.

Scan Tailor написан на C++ с использованием Qt и выпускается под лицензией GPL версия 3.

Сайт программы: http://scantailor.sourceforge.net.

Внимание! Проект находится в разработке и пока не готов к реальному использованию. Тем не менее, вы можете оценить прогресс, которого мы добились, посмотрев скриншоты или скачав последнюю сборку. Обновление: последняя сборка уже может выполнять реальную работу!

В процессе развития программы будет обновляться и документация по ней.

Системные требования

Операционная система: MS Windows, GNU/Linux.
Для Linux и FreeBSD должны быть установлена библиотека Qt версии не ниже 4.2.1(проверить!).

Первый запуск

Для ОС MS Windows:
Программа работает без установки. Надо распаковать архив и запустить файл scantailor.exe.

Для ОС GNU/Linux:
Если Вы установили Scan Tailor, то в главном меню (KDE/Gnome) должен был появиться ярлык Scan Tailor. Щелкните на нём для запуска Scan Tailor. Scan Tailor можно также запустить из консоли дав команду:

$ scantailor

При первом запуске появится окно, в котором Вы можете выбрать "Новый проект" или "Открыть проект":

Изображение:Begin.png

"Новый проект" - создает новый проект.
"Открыть проект" - открывает проект. Проекты программы Scan Tailor имеют резрешение "ScanTailor".

При создании нового проекта появится окно "Файлы проекта":

Изображение:Begin files.png

"Директория ввода" – папка, где находятся исходные сканы.

"Директория вывода" – папка, куда будут сохранены обработанные сканы.

"Файлы не в проекте" – список файлов, находящихся в папке, указанной в "Директории ввода". Можно выбрать файлы для обработки вручную. Нажатием на кнопку "Выбрать все" будут выбраны все сканы.

"Файлы в проекте" – список файлов, включенный в проект для обработки. Для удаления всех файлов можно также воспользоваться кнопкой "Выбрать все".

Кнопки "вправо" и "влево" между "Файлы не в проекте" и "Файлы в проекте" соответственно добавляют в проект и удаляют из проекта выбранные сканы.

Главное окно Scan Tailor

Изображение:Tailor win.jpeg

  1. список этапов обработки сканов.
  2. параметры обработки для каждого этапа.
  3. центральная зона. Это основное рабочее поле, здесь выполняется работа на сканами.
  4. лента предпросмотра. Предпросмотр сканов в уменьшенном виде удобен для первоначальной оценки результатов, а также быстрого перехода к нужному скану.

Меню программы

Меню "Файл":
Файл->Сохранить проект – сохраняет проект (Ctrl+S);
Файл->Сохранить проект как ... – сохраняет текущее состояние проекта под новым именем.

Меню "Обработка":
Обработка->Запустить пакетную обработку – запуск обработки всех сканов в проекте на том этапе (вид обработки), который активен в текущий момент;
Обработка->Остановить пакетную обработку – принудительная остановка пакетной обработки.

Меню "Инструменты":
Инструменты->Режим отладки – предназначен только для разработчиков. В центральной зоне появляются несколько вкладок для детального контроля процесса обработки.

Этапы обработки

Добавив сканы в проект, их можно обработать в несколько этапов:

Изображение:Etap tab.png

Исправление ориентации

Настраиваются следующие параметры:

Изображение:Orient param tab.png

Поворот – повернуть скан. Зелёная стрелка показывает текущую настройку команды "поворот".

Область применения:

Применить к ... – область применения изменённых вручную параметров. Если изменения не вносились, то текущие параметры применяются для всех сканов.

Изображение:Orient param win.png

Только к этой странице (уже применено) – изменение применяется только к текущей странице (используется по-умолчанию).

Ко всем страницам в диапазоне – изменение применяется к указанному диапазону. По-умолчанию предлагается применить ко всем сканам.

К каждой второй странице диапазона – изменение применяется к текущему скану и через один после него. Этот режим полезен для настройки ко всем четные/нечетным страницам.

Разрезка страниц

На этом этапе сказывается тип скана: 1 страница или разворот. А также можно выбрать для обработки только одну из страниц разворота.

Настраиваются следующие параметры:

Изображение:Split param tab.png

Тип разреза – выбор способа разрезки скана в зависимости от его содержания. Кнопками выбирается один из трех вариантов: 1 страница (целиком); половина разворота; разворот.

Кнопка Изменить – в окне Разрезание страниц настраиваются:

  • Тип разреза: автоматически/вручную;
  • Область применения: Только эта страница/Все страницы.

Разделительная линия – выбор режима автоматически/вручную.

В случае, если выбран 2-й тип разреза (половина разворота), эта настройка будет иметь вид:

Изображение:Split param tab2.png

Вручную здесь можно указать какую из половинок разворота следует обрабатывать. Зеленая стрелка показывает текущую настройку.

В зависимости от типа разреза в центральной зоне скан будет выглядеть следующим образом:

Вертикальная синяя линия указывает линию разреза. Залитая цветным фоном зона является зоной обработки, "полезной зоной", а белая (см. центральный рисунок) - необрабатываемой зоной.

Компенсация наклона

Компенсируется наклон страниц, появляющийся при неправильном расположении книги в сканере, в том числе присканировании разворотов толстых книг. (проверить!)

Изображение:Deskew main tab.jpeg

Компенсация выполняется для всей страницы целиком. И не может выправить "кривые хвосты", часто возникающие ближе к середине разворота книги при сканировании.

Изображение:Deskew param tab.png

Если автоматическая компенсация наклона неудовлетворительна, можно вручную указать значение угла поворота, "играя им". Направление поворота определяется знаком у величины наклона: "+" – против часовой стрелке; "-" – по часовой стрелки.

Полезная область

Определяется область с "полезным" содержанием (залито цветом). Эта область в дальнейшем будет определять будущие размеры обработанных сканов. Всё, что не попало в эту область будет удалено. (проверить!)

Для корректировки области нужно перетаскивать её границы мышью.

Изображение:Content main tab.jpeg

При корректировке границ полезной области, будет активна кнопка "Вручную".

Изображение:Content param tab.png

Макет страницы

К полезной области "наращиваются" поля с заданными значениями.

Изображение:Maket main tab.jpeg

Для корректировки области нужно перетаскивать мышью и внутренние, и внешние сплошные границы. При этом меняться будет только величина полей. Полезная область остается неизменной. Настраиваются следующие параметры:

Изображение:Maket param tab.png

Поля – настраиваются поля для будущих страниц по ряду параметров. В частности:

  • Единица измерения:
    Изображение:Maket param edizm tab.png
  • Величина полей: сверху, снизу, слева, справа.
  • Замок – его состояние определяет будут ли противоположные поля одинаковыми Изображение:Maket param zamok-close tab.png или разными Изображение:Maket param zamok-open tab.png. В первом случае при изменении одного из полей второе будет изменяться синхронно. Во втором - назначать величину всехполей можно индивидуально.
  • Применить к ... – описание см. выше.

Выравнивание – настраивается способ выравнивания полезной области:

  • Выровнять с другими страницами – определяет будут ли все страницы в проекте иметь одинаковые размеры. Выключение этого параметра приведет к независимому определению размеров всех страниц.
  • 9 кнопок позволяют визуально задать способ выравнивания полезной области к полям будущей страницы.
  • Применить к ... – описание см. выше.

Самая широкая страница – ссылка на страницу, имеющую самую большую "индивидуальную" ширину.

Самая высокая страница – ссылка на страницу, имеющую самую большую "индивидуальную" высоту.

Последние два параметра определяют размеры всех страниц при условии включенной галки на Выровнять с другими страницами.

Вывод

Создается результирующая страница. Результат отображается в Центральной зоне программы. Также создается готовый файл для текущей страницы.

Изображение:Output main tab.jpeg

Для страниц, которые ещё не обработаны на последнем этапе или тех, для которых были внесены изменения в найстройках, в окне ленты предпросмотра появляется знак вопроса:

Изображение:Output preview tab.png

После обработки скана знак вопроса исчезнет. Настраиваются следующие параметры:

Изображение:Output param dpi tab.png

Разрешение вывода (DPI) – кнопокой "Изменить" можно вручную указать разрешение для выходных файлов:

Изображение:Output dpi win.png

Режим – выбирается режим вывода готовых страниц:

Изображение:Output param rezhim tab.png

В зависимости от выбранного режима меняются дополнительные параметры настройки вывода.

Черно-белый режим:

Изображение:Output param rezhim BW tab.png

Разрешение вывода (DPI) – кнопокой "Изменить" можно вручную указать разрешение для выходных файлов.

Двухтоновый режим будет удален по причине непопулярности.

Цветной / Серый режим:

Изображение:Output param rezhim color tab.png

Смешанный режим:

Изображение:Output param rezhim mix tab.png

Смешанный режим применяется для проектов, в которых присутствуют сканы с полутоновыми картинками (в градациях серого или цветные). При этом вся страница бинаризуется как в режиме Черно-белый, а автоматичсеки найденные полутоновые картинки без изменений накладываются на черно-белый результирующий рисунок. В этом режиме также используется выравнивание освещения, причем оно делается даже для цветных картинок.

Для получения результирующий файлов для всего проекта запускаем Пакетную обработку: Обработка->Запустить пакетную обработку. В папку для вывода, настроенную при создании проекта, будут сохранены результаты обработки.

Выходные форматы:

Вывод осуществляется в формат TIFF. В режиме Черно-белый - со сжатием G4Fax; для цветных/серых и смешанных - со сжатием LZW.

Описание работы в программе Scan Tailor

Последовательность действий (кратко):

  1. При необходимости, вручную поправить ориентацию страниц на стадии "Исправление ориентации".
  2. Переходим на этап "Полезная область" и там Запусаем пакетную обработку: Обработка->Запустить пакетную обработку. Эта стадия на данный момент самая проблемная - на ней большинство ошибок и возникает.
  3. Правим ошибки этапа "Полезная область" просмотром всех страниц вручную. Горячие клавиши для перехода по страницам: Page Up и Page Down.
  4. На Макете страницы ссылками Самая широкая страница / Самая широкая страница переходим на соответствующие им страницы и проверяем поля. Бывает что что-то пропускаешь. Исправляем и снова проверяем ту же функцию пока всё не исправим.
  5. На этапе Вывод выставляем свои параметры → Применить к → Ко всем страницам. Запускаем Пакетную обработку.

Советы по п.3:

Попутно с проверкой правильности определения полезной области можно переходить по другим этапам, корректируя настройки. Затем возвращаемся для этап "Полезная область" и переходим на следующий скан. В частности, индивидуально можно настраивать:

  • если программа ошиблась с определением скана правый-левый, на вкладке "Разрезка страниц" делаем исправление;
  • на "Макет страницы" меняем выравнивание с "общий по центру" на "вверх" или "вниз". Встречается оформление книг, где лучше сохранить именно такое "оригинальное" выравнивание.

Полезные ссылки

C пожеланиями и замечаниями по документации обращаться к автору программы - axehand@gmail.com.

Личные инструменты