Телескопы покупают здесь


A A A A Автор Тема: Сканирование книг  (Прочитано 24562 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Vladneb

  • Гость
Сканирование книг
« : 18 Дек 2002 [01:07:51] »
Хочу отсканировать часть книг и статей из журналов, издававшихся в советские времена для любителей астрономии и которых нет в сети, чтобы потом выставить для свободного скачивания (собрал в свое время неплохую библиотеку). В программировании я не силен и представляю собой типичного (но продвинутого) юзера. :D Поэтому прошу совета: в какой формат лучше сканировать книгу и как потом ее лучше скомпоновать, чтобы удобно было использовать? PDF мне не нравится - по сути огромный рисунок в рулоне, да и акробат ридер неудобен для просмотра (хотя может я ошибаюсь?). Очень понравился вариант книги Сикорука для просмотра в браузере. Хотелось бы, чтобы книги имели наименьший размер с одной стороны и были удобными в использовании с другой. Как это сделать?

Оффлайн Stepa

  • *****
  • Сообщений: 1 989
  • Благодарностей: 44
  • Мне нравится этот форум!
    • Сообщения от Stepa
Re:Сканирование книг
« Ответ #1 : 18 Дек 2002 [05:54:26] »
PDF или PS хороши потому, что они видны из любой ОС. Это многоплатформенный формат. И изображение интегрировано с текстом.
Поэтому я думаю, что все же PDF лучше. Самый хороший, но и самый трудоемкий - распознать FineReader'ом книгу, и вставить в текст рисунки и в Acrobat'e сделать книгу по-новому. Но это занимает очень много времени. Но места будет занимать совсем немного.

Acrobat неудобен (совсем немного) , когда изображения страниц просто отсканированы, потому что на картинки большого размера неудобно смотреть в Reader'e. Но все равно, не комплект же JPEG'ов или PSD'шек вместо книги выкладывать. Тут картинки в одном файле, и смотрятся, где хочешь (в Linux/Unix-оидах, в Windows).
PDF - решение всех проблем ! :)
P.S. У меня есть несколько отсканированных книг в PDF, которые я скачал со Starlab'a по-моему. Не сказал, чтобы размер был велик.
P.P.S. Сканируйте в малом разрешении (100 dpi) и места занимать будет мало.
We must hang together or we all shall hang separately

Оффлайн bibliograf

  • *****
  • Сообщений: 879
  • Благодарностей: 50
    • Сообщения от bibliograf
Re:Сканирование книг
« Ответ #2 : 18 Дек 2002 [06:34:44] »
 100 dpi для картинок маловато. "Библиотечка телескопо-
строителя" отсканирована 575dpi -это около 200кБ/стра-
ницу в PDF.

Оффлайн Stepa

  • *****
  • Сообщений: 1 989
  • Благодарностей: 44
  • Мне нравится этот форум!
    • Сообщения от Stepa
Re:Сканирование книг
« Ответ #3 : 18 Дек 2002 [07:41:47] »
Именно!
Вот поэтому самый лучший (самый трудоемкий) - распознать книгу в FineReader
А картинки с любым разрешением вставить.
Но все равно, самый органичный формат - PDF
We must hang together or we all shall hang separately

Оффлайн Nazar

  • *****
  • Сообщений: 2 277
  • Благодарностей: 145
  • Дорогу осилит идущий! +7978-847-29-47
  • Награды Открытие комет, астероидов, сверхновых звезд, научно значимые исследования.
    • Сообщения от Nazar
    • Астротурист - походы и наблюдения в горном Крыму!
Re:Сканирование книг
« Ответ #4 : 21 Дек 2002 [00:44:42] »
Обычно делается в jpg. PDF занимает больше места. Для Сети это актуально. С нашими то скоростями. ;)
https://vk.com/astrotourist   Astrotourist_info

Оффлайн LSDream

  • Новичок
  • *
  • Сообщений: 40
  • Благодарностей: 4
  • Ку...
    • Сообщения от LSDream
Re:Сканирование книг
« Ответ #5 : 22 Дек 2002 [17:44:13] »
Подскажите где в сети можно найти электронные версии астрономических книг. :-\
Планета, на которой нет цветовой дифференциации штанов, где не понятно перед кем и сколько раз нужно сесть и сделать КУ - не имеет будущего.

Vladneb

  • Гость
Re:Сканирование книг
« Ответ #6 : 23 Дек 2002 [01:36:00] »
to  sasha_gomel: http://abyse.starlab.ru/ в разделе "книги", также там есть замечательный раздел "статьи".

По-поводу сканирования: pdf так pdf, только все равно неудобно, когда книга оформлена в html-е, то совсем другое дело. :(

tlgleonid

  • Гость
Re:Сканирование книг
« Ответ #7 : 23 Дек 2002 [10:44:14] »
И все таки pdf удобнее. Ведь так книгу загрузил и целиком ее можно использовать. А html-код состоит из множества файлов. Да и  pdf распечатывать удобнее.

Оффлайн Алексей Юдин

  • *****
  • Сообщений: 28 777
  • Благодарностей: 1124
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re:Сканирование книг
« Ответ #8 : 23 Дек 2002 [16:45:15] »
Всё, что связано с созданием растровых копий книг - геморрой, т. к. приходится идти на компромисс между размером и качеством, причём быстрота создания такой копии книги выливается в неудобство чтения и распространения. НАДО распознавать. Да, это большая работа, но книга действительно получает новую жизнь. А те растровые копии, которые летают повсюду, даже не распознаются. Кстати, идеально было бы поиметь блат в "Науке", "Машиностроении" и еще паре издательств, чтобы взять тексты и картинки в наиболее удобном и качественном виде.

Оффлайн Nazar

  • *****
  • Сообщений: 2 277
  • Благодарностей: 145
  • Дорогу осилит идущий! +7978-847-29-47
  • Награды Открытие комет, астероидов, сверхновых звезд, научно значимые исследования.
    • Сообщения от Nazar
    • Астротурист - походы и наблюдения в горном Крыму!
Re:Сканирование книг
« Ответ #9 : 24 Дек 2002 [01:14:06] »
Согласен с Вами. Если делать с умом - только распознавать!
Тогда действительно приятно будет посмотреть. И архивировать легче будет. И объем умеьшится.
Только придется поработать. Но кому сейчас легко?  ;)
https://vk.com/astrotourist   Astrotourist_info

Evgeniy Puhalskiy

  • Гость
Re:Сканирование книг
« Ответ #10 : 05 Янв 2003 [20:44:32] »
Я думаю, не обязательно распознавать. Я в свое время находил удовольствие в скачивании 100мб Навашина, 21мб Сикорука и прочее. Огромная помощь любителю уже сами книги. Лишь бы можно было нормально читать. А скачивать 100мб через инет дешевле, чем искать оригинал по почте...

Оффлайн Aurorыч

  • Модератор
  • *****
  • Сообщений: 8 413
  • Благодарностей: 561
    • Instagram: aurorbor
  • Награды Победитель ежегодного конкурса астрофото
    • Сообщения от Aurorыч
    • The world of Boris Dmitriev Photography
Re:Сканирование книг
« Ответ #11 : 05 Янв 2003 [23:41:53] »
Ге-ге ;D мне например что то не очень захотелось бы качать 100 мб через инет, с моей то связью, а она у многих низкая.

Есть вариант сделать книгу в виде html. Например как у меня на сайте лежит книга Надубовича Ю.Ю., потом можно запаковать чтобы легче можно было качать. ;)
The world of Boris Dmitriev Photography
АПОЛАР-150, AZ-EQ6GT PRO

Veter

  • Гость
Подготовка книг в электронном варианте
« Ответ #12 : 06 Янв 2003 [00:08:20] »
Я готовлю книги в формате *.doc -- для текстового редактора WORD. Такую книгу можно быстро распечатать, или представить в наиболее удобном для конкретного человека виде. Две книги лежат у меня на домашней страничке.

Для форматирования используется макрос для MS WORD, написанный на Perl ребятами из БИБЛИОТЕКИ АРТЕФАКТ. Они также приводят полную технологию подготовки книги.
« Последнее редактирование: 19 Янв 2004 [17:03:57] от Гришель Максим »

Evgeniy Puhalskiy

  • Гость
Re:Сканирование книг
« Ответ #13 : 06 Янв 2003 [00:18:23] »
Ну, понятное дело что если есть текст - незачем качать фотокопию. Но если ничего кроме фотокопии нет, то она должна быть принята с благодарностью, все 100 мб.

У меня есть "Черные дыры и Вселенная" И.Д Новикова в ворде. Если надо - пришлю.

А текст в любом случае лучше в PDF - распечатка однозначная и безпроблемная.
« Последнее редактирование: 06 Янв 2003 [00:34:40] от Evgeniy Puhalskiy »

Vladneb

  • Гость
Re:Сканирование книг
« Ответ #14 : 06 Янв 2003 [02:57:46] »
Если делать с умом - только распознавать!
Тогда действительно приятно будет посмотреть. И архивировать легче будет. И объем умеьшится.
Только придется поработать. Но кому сейчас легко?  ;)

Угу, только ум измеряется временем в данном случае. Где его взять? Будет скорее всего PDF, но исходники со сканера оставлю, у кого есть в запасе ум (то бишь время  ;D ) - перешлю и пусть распознает на здоровье.

P.S. Можно по другому - что лучше: распознать и сделать одну книгу или же за это время отсканить и сделать в PDF 10-15?
« Последнее редактирование: 06 Янв 2003 [03:03:26] от Vladneb »

Оффлайн Алексей Юдин

  • *****
  • Сообщений: 28 777
  • Благодарностей: 1124
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re:Сканирование книг
« Ответ #15 : 08 Янв 2003 [15:00:21] »
Пожалуйста - готов. Давайте только сканированный материал с разрешением получше - так 300 дпи где - то. Рисунки если можно и получше. Ради такого дела и посижу сколько надо, и в хтмл загоню. Я хотел сделать это на существующих книгах, но уж очень мало разрешение в большинстве случаев. Быстроты не обещаю. Звоните - (095) 301-81-72. Пишите - sexylover@yandex.ru . Инет есть, но тормозной так что при случае хотелось бы на дисках.

Evgeniy Puhalskiy

  • Гость
Re:Сканирование книг
« Ответ #16 : 09 Янв 2003 [06:44:07] »
Алексей!
Если у Вас есть время, загляните сюда:

https://astronomy.ru/forum/index.php?board=7;action=display;threadid=1395
http://abyse.starlab.ru

на Ваш выбор - нераспознанного текста тонны!
Только боже упаси от html! Это лишнее. Хотя бы word, или что еще лучше текст в PDF.

Оффлайн Алексей Юдин

  • *****
  • Сообщений: 28 777
  • Благодарностей: 1124
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re:Сканирование книг
« Ответ #17 : 13 Янв 2003 [13:14:36] »
Я уже давно скачал почти все "тонны" и должен сказать, что он малопригоден для распознавания - разрешение везде низкое, кое-где отсутствуют части страниц или страницы целиком. Окулист отдыхает... Некоторые вещи даже я с трудом читаю. Пролетавшая тут PDF-компашка уже наполовину мной прочитана и те же нарекания + геморройность растрового пдф. Надо менять подход - и я предлагаю такой вариант - обладатели литературы сканируют её с нормальным (300 дпи) разрешением, а я распознаю, вбиваю формулы, обрабатываю иллюстрации, ловлю очепятки и пр. А потом публикуем во всех модных форматах - HTML, TEX, PS, PDF и пр. Так что предлагаю начать. Кидайте к примеру Слюсарева !  ;D

Дадим вторую жизнь советским астрономооптическим книгам!!!


Оффлайн Алексей Юдин

  • *****
  • Сообщений: 28 777
  • Благодарностей: 1124
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re:Сканирование книг
« Ответ #18 : 13 Янв 2003 [13:22:16] »
Да, чуть не забыл, нужно такие вещи кидать без сжатия (не jpg и не gif). А то они высокие частоты хорошо кушают, особенно jpg.

Evgeniy Puhalskiy

  • Гость
Re:Сканирование книг
« Ответ #19 : 13 Янв 2003 [13:39:32] »
Я сканирую обычно в compressed TIFF. "Планета Марс" имеется в JPEG(что поделать :( ). Когда вылезу на выделенку не знаю, если у Вас есть FTP скиньте адресок( с моей FTP проблемы...).