Сканирование, оцифровка документов, книг, пленки, негативов, слайдов

Сканирование документов

 Прайс-лист | Вакансии | Про нас | Нам доверяют | Контакты


Сканирование:

- Сканирование документов

- Сканирование книг

- Сканирование пленки

- Широкоформатное сканирование

- Сканирование фотографий

- Сканирование рентгеновских снимков

- Оцифровка видео

- Набор рукописного текста 

Постобработка:

- Распознавание текста

Для предприятий:

- Системы сканирования документов на предприятии

 

 

Сканеры поставляются в трех основных форматах: скользящие, ручные и планшетные. Сканеры могут обеспечивать или только монохромный режим или цветной режим сканирования. Стоимость сканеров может отличаться существенно в зависимости от типа и характеристик, поэтому пользователи выбирают нужный вариант сканера исходя из решаемых ими задач.

Одной из важных характеристик сканера является разрешение, характеризующееся количеством точек на один дюйм изображения (dpi - dot per inch). Более простые сканеры дают разрешение от 300 до 600 dpi, более качественные - до 1200 dpi. Для выполнения полиграфических работ используются профессиональные сканеры, дающие большее разрешение, но и стоимость таких сканеров достаточно высока. Если пользователь ориентируется на получение изображений для экрана монитора, например, для подготовки материалов для Web-страниц, то ему достаточно иметь недорогой сканер с невысоким разрешением.

Следует заметить, что с помощью сканеров помимо сканирования графических образов можно сканировать и распознавать тексты. Большие возможности предоставляют, например, современные средства Microsoft Office. В этот пакет включена программа Microsoft Office Document Imaging, которая позволяет:

- Сканировать документы, состоящие из одной страницы или из нескольких страниц.

- Выполнять распознавание текста.

- Копировать и экспортировать распознанный текст в Word.

- Обнаруживать текст в отсканированных документах.

- Распознавать страницы отсканированного документа так же просто.

- Отправлять отсканированные документы по электронной почте.

В действительности Microsoft Office Document Imaging состоит из двух компонентов: Microsoft Office Document Scanning и Microsoft Office Document Imaging.

Первый компонент обеспечивает управление сканированием документов с применением любого установленного сканера. Для этого предназначены конфигурации сканирования, позволяющие управлять подключенным сканером с помощью ряда настроек, оптимизированных для определенных целей. Например, конфигурация сканирования Черно-белый идеально подходит для сканирования и распознавания страниц текста , тогда как конфигурация Цвет больше всего подходит для сканирования полноцветных рисунков или произведений искусства. Также по умолчанию автоматически производится оптическое распознавание текста в текстовых документах сразу по завершении сканирования, что помогает без затруднений сканировать большое количество страниц с созданием одного конечного файла.

Второй компонент позволяет производить просмотр отсканированных документов на экране, перекомпоновку многостраничных документов, выделение и обработку распознанного текста и отправку документов по электронной почте.

Когда документ сканируется в первый раз, в Microsoft Office Document Imaging может быть произведена проверка сканера с последующим проведением сканирования пробного документа. Данная процедура может занять какое-то время, но она нужна для того, чтобы после завершения операции в Microsoft Office Document Imaging было правильно идентифицировано установленное оборудование. При установке нового сканера можно повторно запустить процедуру проверки.

Microsoft Office Document Imaging обеспечивает ряд конфигураций параметров, позволяющих выполнять наиболее распространенные задачи сканирования. Каждая конфигурация оптимизирована для определенного вида сканирования. Можно настроить конфигурации определенным образом или создать свои собственные для достижения определенных целей. Среди встроенных конфигураций сканирования имеются следующие:

Черно-белый. Сканирование производится в монохромном режиме с разрешением 300 точек на дюйм. Данная конфигурация разработана для распознавания текста при сканировании черного текста на белой бумаге или при сканировании контрастных изображений. Само сканирование производится быстрее, чем при других конфигурациях, а получающиеся в итоге файлы изображений меньше по размерам.

Черно-белый с цветной страницы. Сканирование производится в оттенках серого с разрешением 300 точек на дюйм, но сохраняется документ в файле монохромного формата. Данная конфигурация разработана для сканировании с распознаванием текста на цветном фоне или цветного текста.

Оттенки серого. Сканирование производится в оттенках серого с разрешением 200 точек на дюйм. Данная конфигурация подходит для сканирования страниц, содержащих непрерывные черно-белые изображения (такие как фотографии) и текст, или же только цветной текст.

Цвет. Сканирование производится с разрешением 150 точек на дюйм. Данная конфигурация предназначена для сканирования полноцветных документов. Само сканирование производится довольно медленно, мелкий текст может оказаться недостаточно читаемым для распознавания, а получающиеся в результате файлы будут большого размера.

Кроме разрешения и типа сканирования, каждая конфигурация задает следующие параметры:

- Размер страницы.

- Папку по умолчанию для сохранения файлов.

- Язык для распознавания текста.

- Сохранение многостраничных документов целиком или в виде отдельных страниц.

- Автоматическое проведение распознавания текста после сканирования.

- Автоматическое создание имен файлов.

- Автоматическое выравнивание страниц, отсканированных вверх ногами, или криво.

Программа сканирования изображений DeskScan II

Сканеры обычно поставляются вместе с программным обеспечением. Программы позволяют не только настроить параметры и выполнить сканирование изображения, но и произвести дополнительную модификацию обработку. Приведем в качестве примера возможности программы сканирования изображений DeskScan II, разработанной фирмой Hewlett Packard для планшетного сканера ScanJet 4С. Эта фирма является ведущим поставщиком оборудования этого типа и программного обеспечения к нему.

После вызова программы сканирования на экране появляется панель, управляющая процессом сканирования. Щелчок по кнопке "Просмотр" инициирует процесс сканирования. Через несколько секунд в правой части панели появляется сканированное изображение. С помощью имеющейся в правой половине панели подвижной рамки можно настроиться на ту часть рисунка, которую нужно записать в файл.

Исходные изображения

Существуют два основных типа исходных сканируемых изображений: рисунки и фотографии. Для рисунков и фотографий имеются как черно-белые, так и цветные варианты. Эти варианты употребляются, в частности, для того, чтобы сканировать материалы для черно-белого принтера или же для цветного принтера (или для вывода на экран).

Для получения компьютерного изображения требуемого качества нужно уточнить параметры сканирования. При сканировании изображения задается следующая информация:

цветосодержание (черно-белое или цветное) глубина цвета (16 и 256 оттенков серого цвета для черно-белого и 16, 256 или миллионы цветов для цветного изображения) метод сканирования (Рисунок, Полутон или Фото) дополнительный стиль (Цветное пятно или Детализированный для Фотографий, Нормальный, Диффузионный, Качественный, Высококачественный для Полутонов)

Методы сканирования

Рассмотрим основные методы сканирования.

Рисунок

Используется для изображений с большими участками сплошного цвета. Примерами изображений, сканируемых методом "Рисунок", являются изображения из кривых и линий, фирменные знаки, изображения со сплошным цветом без градиента. Файлы, созданные методом "Рисунок", могут в дальнейшем легко редактироваться.

Фото

Используется для сканирования изображений со многими оттенками серого цвета или цветных изображений. При использовании метода "Фото" вариация цветных значений в изображении сохраняется от пиксела к пикселу.

Примерами изображений, которые следует сканировать данным методом, могут служить оригинальные фотографии, иллюстрации в книгах и журналах.

Полутон

Используется для оптимизации качества сканируемых фотографий при печати на принтерах.
Изображения, сканируемые с типом изображения "Полутон", обрабатываются таким способом, который имитирует многие оттенки цветов в изображении.

Типы получаемых изображений

Меню на передней панели дает возможность выбрать тип получаемого изображения, при этом все необходимые характеристики задаются автоматически. Программа DeskScan II автоматически выберет тип получаемого изображения после выполнения пробного сканирования.

В меню представлены следующие типы:

- Черно-белый рисунок

- Четкий черно-белый рисунок

- Цветной рисунок

- Черно-белый полутон

- Цветной полутон

- Черно-белое фото

- Четкое черно-белое фото

- Цветное фото

- Четкое цветное фото

- Миллионы цветов

- Четкие миллионы цветов

Параметры "Миллионы цветов" и "Четкие миллионы цветов" используются для сканирования изображений, которые будут выводиться на мониторах высокого качества или будут напечатаны на принтерах с фотографическим качеством. Файлы изображений, просканированных с таким качеством, могут занимать на диске несколько мегабайтов.

Помимо стандартных типов изображения, в диалоговом окне Адаптированный тип можно задавать адаптированные типы изображения, когда явно устанавливаются требуемые параметры качества.

Стратегия сканирования

Готовясь к публикации материалов в Интернете, мы нередко сталкиваемся с проблемой подготовки качественных иллюстраций. Часто в нашем распоряжении имеется фотография, полученная с помощью обычного фотоаппарата. Качество фотографии не всегда нас устраивает, однако нечеткие или плохо кадрированные снимки тоже могут пригодиться: компьютер позволяет получить вполне приемлемое изображение, даже если качество исходного снимка далеко от совершенства.

Опишем несколько приемов сканирования фотографий.

Общий принцип состоит в том, что при сканировании нужно установить большее разрешение, чем требуется для вывода готового снимка на экран.

Чтобы разобраться с правилами установки нужного разрешения проделаем несколько экспериментов в программе DeskScan II. Установим для начала в поле "Путь" значение "Экран". Это означает, что мы планируем выводить сканируемое изображение на экран. Для того чтобы узнать, какое при этом установилось разрешение, щелкнем в верхнем меню позицию "Адаптировать", а далее выберем из выпадающего меню позицию "Маршрут печати". В появившейся таблице можно увидеть, что параметр "разрешение" имеет и по горизонтали, и по вертикали значение 75 точ./д (точек на дюйм).

Нам теперь достаточно установить вдвое большее разрешение. Для этого можно внести в соответствующие поля выведенной таблицы значения 150 вместо 75. Или можно закрыть окно с таблицей, и установить в поле "Путь" другое устройство вывода. Так, например, при выводе на лазерный цветной принтер (в поле "Путь" устанавливается значение "Color laser Jet Series") разрешение устанавливается 150 точ./д. Это можно проверить описанным ранее способом: выбрать в меню позицию "Адаптировать", далее позицию "Маршрут печати" и посмотреть установленные параметры разрешения.

Не следует забывать, что при сканировании больших цветных фотографий при большом разрешении вы будете получать файлы очень больших размеров. Поэтому в вашем распоряжении должен быть достаточно мощный компьютер и несколько десятков мегабайт свободного места на диске. Есть несколько вариантов решения проблемы больших файлов:

можно "вырезать" из фотографии только нужный вам фрагмент (нужную часть снимка выделить с помощью подвижной рамки), можно сканировать изображение в меньшем масштабе (переместив ползунок в поле "масштаб" влево до достижения нужного значения масштаба), можно, в конце концов, пожертвовать качеством, установив меньшее разрешение или меньшее количество цветов (например, в параметре "Тип" установить значение "Четкое цветное фото" вместо "Четкие миллионы цветов" ).

В нижней левой части экрана указывается размер (в килобайтах) файла, который будет получаться при установленных параметрах сканирования. Вы можете варьировать параметры, получая на экране размер конечного изображения, и выбрать тот, который вам подходит из соображений экономии места на диске. Но если вы готовите материалы для размещения в Интернете, то на размер файла можно не обращать внимания - файл нужно будет потом преобразовать в другой формат (jpeg или gif), и его размеры сильно уменьшатся.

После начального сканирования (с помощью кнопки "Просмотр"), желательно поставить автоматическую экспозицию и потом сохранить изображение (с помощью кнопки "Окончательный") в формате .bmp. После этого можно продолжить обработку изображения в редакторе Adobe Photoshop. Именно средствами этого графического редактора можно "дотянуть" качество изображения до нужного вам уровня.

Технология изображения

Рассмотрим более подробно технологию получения изображений на мониторе компьютера.

Наиболее распространенными мониторами сейчас являются мониторы, основанные на технологии электронно-лучевых трубок (CRT - cathode ray tube). Это в основном та же технология, которая используется в наших телевизионных приемниках. Пользователи компьютеров покупают сейчас 15 или 17-дюймовые цветные мониторы с коэффициентом обновления (частотой развертки) 75 Гц и выше, с отображением цветовой палитры True Color (несколько миллионов цветов). Для реализации высоких качеств монитора нужна также соответствующая графическая плата (графический адаптер), устанавливаемая в системный блок компьютера.

Технология CRT требует достаточно больших размеров монитора, в отличие от технологии жидкокристаллических дисплеев (LCD - liquid crystall display). LCD-мониторы применяются для портативных компьютеров notebook (laptop). Пока стоимость жидкокристаллических мониторов существенно выше, чем у обычных мониторов. Если же LCD-мониторы станут дешевле, они имеют все шансы вытеснить мониторы с электронно-лучевыми трубками. Пользователи не без основания считают LCD-мониторы экологически чистыми устройствами, не создающими заметных электромагнитных излучений.

Жидкокристаллические экраны могут быть пассивными, обладая при этом не слишком высокой четкостью изображений, или активными. У активных LCD-экранов каждая точка (пиксел) отображается самостоятельным транзистором. Большой размер экрана требует большого числа транзисторов, что приводит к значительному удорожанию монитора.

CRT-мониторы создают изображение на экране, получая от графической карты RGB (red-green-blue) данные и направляя электронный пучок на экран. Экран покрыт фосфорицирующими группами (тремя фосфорицирующими точкам трех цветов). Электроны вызывают свечение фосфора надлежащих цветов. Фосфор светится короткое время, поэтому он должен постоянно получать электронные сигналы, чтобы удерживать изображение на экране. Частота регенерации - это время, которое требуется для перерисовки экранного изображения. Более высокая частота регенерации (частота развертки) дает меньше мерцания и создает меньшее напряжение для глаз.

Для обеспечения работы монитора в компьютере имеется графический адаптер. Обычно адаптеры поддерживают несколько графических режимов, которые отличаются качеством изображения в двух направлениях: разрешающей способности и глубине цветовой гаммы. Разрешение монитора определяется количеством пикселов по горизонтали и вертикали. Цветовая глубина - это количество цветов, в которое может быть окрашен каждый пиксел.

Графические адаптеры имеют память для хранения и обработки информации, поступающей на экран. Для хранения информации для каждого пиксела можно использовать разное число бит, что и определяет в конечном итоге глубину цвета на экране. С помощью 8 бит можно отобразить 256 цветов, 15 бит достаточно для хранения 32000 цветов, 24 бита могут отображать 16,7 млн. цветов.

Векторные и растровые изображения

Имеются два основных класса компьютерных изображений: векторные и растровые.

Векторные изображения, известные также как объектно-ориентированные изображения, определяются множеством точек, связанных математическими соотношениями. Растровые изображения задаются матрицей, описывающей точки экрана и их цвет. Чем выше качество растрового изображения (больше пикселов и больше глубина цвета), тем больше потребуется памяти для хранения информации для каждого пиксела.

Растровые изображения ближе к фотографии, поскольку позволяют более точно воспроизводить основные характеристики фотографии: освещенность, прозрачность, плавность переходов, тональность и пр. В отличие от векторных изображений растровые изображения плохо масштабируются, нужные масштабы и разрешение задаются при создании изображения. Один из способов получения растровых изображений - сканирование фотографий или слайдов. Существуют также разнообразные пакеты компьютерной графики, создающие растровые изображения. Более профессиональные пакеты предлагают пользователям разнообразные графические эффекты, которые позволяют в некоторых случаях достигать изображений, сравнимых с "ручным" рисование или фотографией.

Если посмотреть на фрагмент растрового изображения в увеличенном виде, то можно заметить, что плавная линия представляется в виде ступени, но при высокой разрешающей способности и большом числе цветов эти ступеньки не заметны для глаза.

Векторное изображение может отличаться очень высокой точностью передачи линий и сложных геометрических форм. Векторная графика не дает особых преимуществ в передаче оттенков или текстуры по сравнению с растровыми изображениями, но все же имеет ряд преимуществ:

- несложные векторные изображения обладают меньшими размерами по сравнению с растровыми изображениями,

- векторные изображения являются масштабируемыми, что означает возможность их увеличения или уменьшения без каких-либо искажений,

- в векторных изображениях часто раздельно представлены координаты векторов (точек) и характеристики их визуализации, что позволяет легко получать разнообразные визуальные образы для одной математической (геометрической) формы.

Векторные изображения не могут быть получены путем сканирования или перехвата экранных изображений. Они создаются с помощью специальных пакетов векторной графики или путем специальных математических преобразований растровых изображений.

Традиционно векторная графика широко использовалась в геоинформационных системах (ГИС) и картографии. Векторные форматы были более компактны и с ними легче было работать. Современные ГИСы чаще используют теперь векторно-растровые технологии. Некоторые задачи, например, интерполяцию точечных изображений на поверхность, проще решать на растровых изображениях. Кроме того, здесь часто приходится иметь дело с фотографиями поверхности Земли, полученными со спутников. Такие снимки преобразуются в проекции карты, где начинают применяться методы математического моделирования.

Большинство программ по созданию или обработке растровых изображений предлагают следующие типы изображений, которые отличающиеся количеством выделяемых бит на один пиксел.

Монохромная графика

Этот режим иногда называют черно-белой графикой, или графикой с однобитовым разрешением. Это означает, что каждый пиксел может быть окрашен только в белый или черный цвет. Такие изображения можно получить с помощью графических пакетов или с помощью сканирования картинок в режиме "Монохромная графика". В этом режиме можно создавать изображения, которые по стилю относятся к художественной черно-белой графике.

Оттенки серого

Изображения этого типа содержат 8 бит на пиксел и позволяют в каждой точке получить 256 оттенков серого цвета. Этот тип изображения можно получить, например, при сканировании черно-белых фотографий в режиме "Оттенки серого". Разумеется, любая цветная фотография также может быть отсканирована в этом режиме, но качество изображения может быть не вполне удовлетворительным, поскольку некоторые цвета из-за недостаточной контрастности могут сливаться.

Индексированный 16-цветный

Каждый пиксел здесь представлен 4 битами, в которых записывается номер цвета в палитре из 16-ти цветов. Палитра строится таким образом, что каждый цвет для всех трех составляющих цветов (красного, зеленого и синего) имеет конкретное значение в диапазоне от 0 до 256. Индексированные изображения небольшие по объему и содержат палитру внутри себя или в виде отдельного файла.

Индексированный 256-цветный

Аналогично предыдущему типу здесь каждый пиксел представлен номером цвета в палитре, состоящей из 256 цветов. Для хранения информации о пикселе требуется 8 бит.

Истинный цвет RGB

Этот тип изображений содержит 24 бита на пиксел, и эти 24 бита представляют информацию о трех цветах (красном, зеленом и синем) по 8 бит на каждый цветной компонент. Этот тип изображения передает 16,7 млн цветов.

Форматы графических файлов

Программные пакеты для работы с графикой ориентированы на создание или редактирование графических файлов нескольких типов. Из всего множества разнообразных форматов можно выделить несколько наиболее популярных, поддерживаемых большим число пакетов. К таким форматам относятся:

BMP - растровый формат, разработанный фирмой Microsoft в качестве способа хранения и обмена данными. Этот формат может отображать изображения с глубиной до 24 бит. Созданные в этом формате файлы могут передавать очень качественные и реалистичные изображения.

EPS - формат Encapsulated PostScript, основанный на языке описания страниц PostScript, разработан фирмой Adobe в 1985 г. Эти файлы используются в программах настольных издательств. Файлы EPS могут использоваться в качестве средства обмена между векторной информацией и растровыми изображениями. Этот формат основан на модели изображения, которая становится стандартным способом передачи графической информации между аппаратными средствами (принтерами) и программными пакетами.

GIF - Graphic Interchange Format, может сохранять несколько растровых изображений в одном файле. Поддерживает до 256 цветов и может создавать высококачественные изображения. Формат использует сжатие данных, которое может уменьшить 8-битовое изображение примерно на 40%. Широко используется для создания изображений, помещаемых в Интернете. Может иметь "прозрачный" фон, что также привлекательно для разработчиков Web-страниц.

PCX - использовался в программе Paitbrush, которая стала входить в пакеты фирмы Microsoft. Этот формат может поддерживать изображения вплоть до 24-битового цвета. Файлы могут сжиматься в случае 16-цветого изображения на 40-70%, а 256-цветовое изображение может быть уменьшено на 10-30%.

TIF - широко используется в издательских системах. Формат может поддерживать несколько различных алгоритмов сжатия данных. Нередко возникает ситуация, когда некоторый конкретный пакет не поддерживает используемый в файле TIF метод сжатия, и могут возникать ошибки типа "Неподдерживаемый тип сжатия". Иногда проблемы возникают из-за того, что пакет может читать только черно-белые TIF-файлы, а изображение является цветным.

WMF - метафайл Windows, созданный фирмой Microsoft для хранения векторной и растровой графики. Формат может создавать и хранить изображения вплоть до 24 бит на пиксел, передавая высококачественные изображения. Изображения в этом формате хорошо масштабируются.

JPG - формат, разработанный Объединенной группой экспертов по фотографии. Использует основанный на аппаратуре стандартный алгоритм сжатия. Коэффициент сжатия может достигать 100:1. В силу этих особенностей широко используется для представления графических (фотографических) материалов в Интернете.

Преобразование графических форматов

С проблемой преобразования форматов графических файлов приходится сталкиваться, например, при подготовке мультимедиа проекта, размещаемого в Интернете. На Web-страницах должны быть графические объекты, подготовленные в формате .GIF или .JPG, другие графические объекты существующие программы просмотра Web-страниц пока не воспринимают.

Преобразование форматов графических файлом можно выполнить с помощью графических пакетов, воспринимающих файлы разных форматов. Одним из таких графических пакетов является пакет Photo Editor, входящий в Microsoft Office. Этот пакет умеет работать практически со всеми наиболее распространенными форматами изображений: рисунками Windows, TIF, PCX, GIF, JPG, Kodak Photo CD. При этом он дает возможность конвертировать файлы из одного формата в другой с помощью обычной операции Save as ...

При преобразовании файлов можно уточнить желаемые параметры. Например, можно выполнить преобразование из цветного в черно-белый формат. Для выбранного типа файла можно также выбрать количество цветов, степень сжатия файла, либо фактор качества - большой файл и лучшее качество изображения, или же маленький файл более низкого качества.

Графический пакет дает возможность выделить и сохранить некоторую область рисунка, выполнить редактирование изображения - растянуть или повернуть на произвольный угол изображение, поменять его яркость или контрастность, поменять цветовую гамму. Имеется также несколько художественных эффектов: украшение рельефом, эффект мелка или угля, эффект погружения в воду, эффект цветного витража.

Еще один простой способ подготовки материалов для Интернета - воспользоваться текстовым процессором Word, который умеет преобразовывать документ в формат HTML. Если при этом в документе были картинки, то они переводятся в формат GIF и записываются на диск в виде отдельных файлов.

+380 (44) 232-72-46

+380 (99) 212-63-99

+380 (98) 081-14-77

+380 (63) 740-73-01

 

Сканеры:

Epson, Canon, Fujitsu, Plustek, Vupoint, Motorola, Интелком, Элар, Xerox, Штрих-м, Datalogic, Yashica, Kodak, Argox, Metrologic, HP

Литература:

"Сканеры и сканирование. Краткое руководство", Степаненко Олег Степанович

"Секреты цифрового сканирования со слайдов, пленок и диапозитивов", Дэвид Буш

Сканирование: Одесса, Донецк, Харьков, Львов , Днепропетровск

Обработка изображений


При использовании материалов этой страницы, прямая гиперссылка на нее обязательна

© 2008-2021 ScanKiev.com.ua