ВНИМАНИЕ! На форуме начался конкурс - астрофотография месяца - АВГУСТ!
0 Пользователей и 1 Гость просматривают эту тему.
Sumo, может посоветуете тогда, какой сейчас самый лучший OCR пакет для кириллицы - FineReader от ABBYY - или покруче есть?
что делать с формулами - оставить картинки или попробовать обучить OCR
А зачем вообще OCR? Лучше просто сканы выложить. Ничего не теряется, после печати получаем копию книги. Большинство книг в сети выложены именно таким образом, чаще всего в формате PDF.
Цитата: bk7f2 от 13 Мая 2003 [13:55:14]А зачем вообще OCR? Лучше просто сканы выложить. Ничего не теряется, после печати получаем копию книги. Большинство книг в сети выложены именно таким образом, чаще всего в формате PDF.Хотя бы для того, чтобы тексты "впитались" поисковыми системами интернета, и по текстам шел поиск! Продолжать?...
Цитата: Самодуров Владимир от 14 Мая 2003 [18:21:25]Цитата: bk7f2 от 13 Мая 2003 [13:55:14]А зачем вообще OCR? Лучше просто сканы выложить. Ничего не теряется, после печати получаем копию книги. Большинство книг в сети выложены именно таким образом, чаще всего в формате PDF.Хотя бы для того, чтобы тексты "впитались" поисковыми системами интернета, и по текстам шел поиск! Продолжать?...Современные поисковые машины (например google) отлично умеют индексировать PDF
Имеется в наличие "Сокровища звездного неба"Ф.Ю Зигеля в TIFF-ах. Всего 40мб. Лежит давно, осканировано год назад. Все надеялся, что один хороший человек (которому и были нужны изначально эти TIFF-ы для своего сайта) оформит в PDF... Одним словом, могу выложить в сеть, если найдется FTP для загрузки.Наконец, есть планы на сканирование книги "Очерки о Вселенной" Б.А Воронцова-Вельяминова, работы много и я не знаю, в коня ли корм...