Решил реанимировать тему. В дальнейшем видимо надо объединить с очень похожей темой
https://astronomy.ru/forum/index.php/topic,23351.0/topicseen.html (Вот взял книжки посканировать).
Вот нашел хорошие советы, копирую из
http://www.cqham.ru/m2_scan.htm :
Советы по подготовке материалов в электронном и бумажном виде.Если вы хотите сосканировать изображение с бумажного оригинала, а также подготовить файл для пересылки или публикации в Интернете, то решение задачи, стоящей перед вами, далеко не так однозначно, как может показаться на первый взгляд. Что же требуется получить в результате такой операции? Совсем немного - файл максимального качества при минимальном объеме. Речь пойдет о черно-белых изображениях, не имеет значения что это будет - текст, рисунки, схемы и т.д.
Всегда сканируйте и сохраняйте файлы с разрешением от 300 до 600 dpi, меньшее разрешение способно безвозвратно ухудшить файл, особенно надписи на схемах и мелкие детали, а большее приведет к неоправданно большому размеру файла, да и не имеет смысла, поскольку для просмотра 300-600 dpi будет вполне достаточно. Большинство принтеров все равно ограничено теми же 600 dpi, так что здесь тоже выигрыша не получить.
Для сохранения черно-белого изображения выбирайте формат выходного файла tif CCITT Group 4(или Fax 4, это то же самое), файлы этого формата позволяют получить очень качественное черно-белое изображение при минимальном объеме, менее популярный формат - png, объем будет также небольшой. Внимательно отнеситесь к порогу черно-белого изображения в программе сканирования и не устанавливайте его выше, чем это необходимо, разумеется, если софт позволяет это сделать. Высокий порог приведет к "мусору" на изображении, ухудшит четкость за счет излишней черноты и увеличит объем файла без всякой пользы.
Если конечной целью выбирается формат djvu, то лучше выбрать разрешение 600 dpi, особенность формата в высокой степени сжатия, поэтому не стоит бояться большого размера выходного файла, он увеличится незначительно по сравнению с 300 dpi, но качество будет выше, особенно на мелких деталях. В дальнейшем такой файл djvu можно будет сконвертировать в тот же tif, например для программ OCR или работы в графическом редакторе, качество при этом практически не потеряется.
Только в том случае, если нет возможности сохранить файл в указанных форматах по тем или иным причинам, тогда используйте bmp, который затем следует сжать при помощи zip или rar для уменьшения объема при хранении или пересылке, это позволит в дальнейшем качественно сконвертировать полученный файл в другие форматы, например в djvu.
НИКОГДА не выбирайте для выходного черно-белого файла формат jpg и другие, предназначенные для цветных изображений! То, что произойдет с изображением не поддается никаким улучшениям, разве что полная ручная правка может помочь, что как правило, бессмысленно из-за потерь времени. Появляются так называемые "артефакты" - тени вокруг всех элементов, в дальнейшем это нельзя ничем скомпенсировать, а конечный файл НИКОГДА не будет меньше по размеру и лучше по качеству, чем при tif CCITT G4 или djvu.
Допустимо, хотя и нежелательно, использовать формат gif, но ОБЯЗАТЕЛЬНО проверьте, что установлен черно-белый режим, то есть однобитный цвет. Далеко не все программы позволяют это сделать, лучше оставить gif для других целей, например анимированных и цветных изображений, скриншотов и т.д. Сохранять черно-белые изображения в формате gif при включенном цвете НЕДОПУСТИМО, все линии расплывутся, скомпенсировать это невозможно! К тому же черно-белый gif всегда проиграет по объему tif CCITT G4, проигрыш будет в несколько раз.
НИКОГДА не пытайтесь использовать для сканирования изображений и текста популярный векторный pdf, это приведет только к колоссальному и напрасному увеличению объема файла. Эффективность pdf никто не будет оспаривать, но он проявляет свои достоинства только при импорте файлов из векторных редакторов или других приложений, например из Word, Exel и других программ. Для получения черно-белого изображения со сканера он не имеет никаких преимуществ перед другими форматами, разве что необходимо сохранить исходные размеры, например для печатных плат или расположения деталей, хотя и это вряд ли имеет смысл. Если есть сомнения на этот счет, то скачайте программу MayuraDraw (
www.mayura.com), на сайте есть бесплатная и русская версия этой программы, размер очень небольшой - от 0,4 до 1,4 мб, в зависимости от версии. Нарисуйте любой черно-белый чертеж, сохраните его в pdf и посмотрите на объем файла. Такого малого объема достигнуть при сканировании невозможно. Вот простой пример - pdf файл с чертежом, созданный в MayuraDraw занял объем 7,1 кб, преобразованный Акробатом 5 в tif CCITT G4 при 600 dpi имеет объем 79,808 кб, созданный из него тем же Акробатом pdf файл получился 56,435 кб. Поэтому не пытайтесь конкурировать с векторными программами, это бесполезно.
Даже если у вас есть готовый текст, схемы и другие изображения в формате pdf, то и в этом случае можно резко сократить объем файла за счет его конвертации в tif CCITT G4, а затем в djvu, выигрыш достигает двух раз и более.
Формат pcx тоже не дает особых преимуществ перед tif CCITT G4, во всех случаях размер файла будет больше при том же качестве. Не все программы корректно поддерживают tif CCITT G4, например ACDSee 2.хх отображает его в негативе. Но в стандартную поставку Windows 98 входит программа от Kodak, ориентированная на работу с этим форматом, так что проблем с просмотром и печатью быть не должно. Современные софты показывают этот формат без затруднений.
Если нужно отсканировать схему по частям, а затем в графическом редакторе "склеить" получившиеся отдельные страницы, то лучше делать это в bmp или tif, не обращая внимания на размер получившихся файлов. Фотошоп или аналогичные графические редакторы без труда работают с большими изображениями, полученный файл bmp можно сохранять в tif CCITT G4 или в djvu, это займет время на конвертацию, но выходной файл будет качественным и небольшим.
Многие, но не все сканеры имеют достаточную глубину резкости, что позволят делать "фотоснимки", например печатных плат и других небольших и плоских объектов, это поможет получить достаточно качественные изображения, если под рукой нет цифрового фотоаппарата. В этом случае можно использовать gif или jpg, в зависимости от стоящей задачи, хотя можно использовать цветной или полутоновый djvu.
Если необходимо распознать текст одной из программ OCR, например FineReader, CuneiForm, OmniPage и другими, может оказаться, что софт не поддерживает файлы tif CCITT G4. FineReader работает с этим форматом без проблем. Ничего страшного, просто конвертируйте файлы tif CCITT G4 или djvu в несжатый tif или bmp при помощи IrfanView, XNView(не для djvu) или аналогичных программ, качество изображения при этом останется вполне достаточным для распознавания. Последняя версия заслуженно популярного IrfanView 3.80 с плагином открывает многостраничные djvu, но к сожалению, только первую страницу. Автор обещал подумать о поддержке multipage djvu и добавке кодера djvu в будущих версиях плагинов.
Виртуальный принтер FinePrint может помочь в случае, если нужно получить файл bmp из того же pdf или другого, сложного в обращении графического формата, а полный Acrobat не установлен, есть только Acrobat Reader. Проверьте все установки в FinePrint и отправьте файл на печать, щелкните правой мышкой на изображении в FP, выберите необходимые параметры и скопируйте изображение в буфер. Получившийся bmp может быть вставлен в созданное пустое изображение, например в IrfanView, а затем сохранен в tif CCITT G4. Результат будет очень хороший, но на слабых компьютерах разрешение 600 dpi может привести к очень большому времени на преобразование или к зависанию программы. Если после передачи на печать в FP файла pdf, на изображении исчезает текст, то выберите в Acrobat Reader опцию Print as image, то есть печать как изображения, тогда выходной файл будет точно соответствовать входному. Также не забывайте про опции Shrink... и Expand... в окне печати Акробата, это позволит сжать или растянуть изображение по размеру страницы, соответственно. Разумеется, что можно применять аналогичные виртуальные принтеры - pdfFactory, SuperPrint, ePrint и другие. Не забывайте, что это именно ВИРТУАЛЬНЫЕ принтеры, а по своей сути - конвертеры файлов, поэтому наличие реального принтера совсем не обязательно, если не стоит задача получить распечатку на бумаге.
Чтобы не выбирать каждый раз для виртуальных или реальных принтеров размер бумаги, а по дефолту он установлен Letter, зайдите в папку "Принтеры", щелкая правой мышкой на каждом принтере зайдите в "Свойства" и в установках выберите более привычный формат A4, разумеется, если нужно использовать именно его.
Распечатать увеличенное изображение на нескольких листах бумаги можно при помощи таких программ, как CrackerJack 4.х(плагин к полному Акробату, скачать можно на
www.lantanarips.com), HandyPrint98, Poster, Poster Printery, QImagePRO, Teulat и других. Обратная задача - поместить несколько страниц на одном листе решается при помощи FinePrint, BBPrint или аналогичных. Для печати книжек и брошюр лучше всего подойдет ClickBook, эта же функция, но победнее, есть у FinePrint. Для документов Word есть макрос "Верстка". На сайте СКР вы можете скачать софт для пакетной конвертации графических файлов в djvu, а также для создания многостраничных djvu. Используются консольные версии djvu программ фирмы AT&T с добавлением GUI для удобства работы с большим количеством файлов. Качество получаемых файлов хорошее, скорость работы намного выше, чем у DjVu Solo. Файл bmp с цветным изображением размером более 200 мб, разрешение 600 dpi, был преобразован в djvu размером около 700 кб. Время на конвертацию около 6 минут.
Если у вас есть какие либо дополнения, советы, возражения по всему выше написанному, то можно высказать свое мнение в письме вебмастеру СКР. Мы будем рады, если эти советы помогут нашим посетителям в подготовке качественных и небольших по объему материалов.
===================================================================
Уже во втором источнике вижу, что: чтобы перегнать материалы в djvu, лучше все же готовить для него tiff в разрешении 600 dpi (иначе мелкие буквы для последующего распознавания текста - могут малость запороться). Де, последующий объем увеличится незначительно. Так-то оно так, но сами tiff - диска жрут немеряно, книга в 300 dpi заняла у меня (300 страниц) - до 2-3 гиг. А тут, значит, будет 10-20 Гиг. Ой-ой...