Внимание! Это временный неофициальный архив старой версии форума Полигон Призраков, созданный сочувствующим форуму участником. Этот сайт просуществует лишь до тех пор, пока администрация Полигона не сдержит своё обещание и не откроет официальный архив по адресу old.sannata.org.

Полигон-2

Форум о старых компьютерах

Объявление форума

Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС.

Полигон-2 »   Технический флейм »   Finereader
RSS

Finereader

Советы по выбору версии

<<Назад  Вперед>> Страницы: 1 *
Печать
 
Fe-Restorator
Гость

Ссылка

Заметил за файнридером таковую особенность: сколько-бы новых версий после 7-ой ни появлялось - работают они не лучше 7-ки, а порой, даже значительно хуже! Базовый алгоритм распознавания у него не изменялся вообще, а примочки-конверторы "из ворда на стенку" и так всегда были глюкавы, а теперь определяют номер версии: новее примочка = выше номер.
Так-что рекомендация будет такова: распознавай в 7-ке и не парь мозг. Под 7-ой форточкой 7-ка нормально работает.

PS. Раз уж выше поминался варез, то и 7-ку в варезном варьянте разыскать в сети можно. ;)
Сейчас на форуме
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Fe-Restorator написал:
[q]
Заметил за файнридером таковую особенность […] а теперь определяют номер версии: новее примочка = выше номер.
[/q]
Вот вообще нифига не согласен. Тоже долго пользовался 7-ой, а потом как-то попробовал 10, и был приятно удивлён. Да оно стало тяжеловесней и тормознутей, но зато софтина стала (естественно из того что мне лично было необходимо, список далеко неполный, это то что вот прям щас в голову пришло):
  • эффективней и точней понимать мягкие переносы, и, наконец-то, научилась их автоматически удалять при экспорте как простой форматированный текст;
  • находить и ставить неразрывные пробелы там где надо, а не где попало (по расстоянию между символами в текстовом блоке)
  • понимать кавычки и апострфы и отличать левые от правых: « » ‘ ’ “ ” „ “ ;
  • ставить дикритические символы над буквами, а не использовать готовый символ;
  • дюймы правильно понимает и ставит именно знак дюймов ′ ″ , а не похожие кавычки с апострофами;
  • правильно вкуривать математические символы, и не пытаться например интеграл растащить на 3—4 строчки;
  • адекватнее работать со стилями;
  • воспринимать w как один символ (sic!) а не два: надстрочная r и нормальная w, такой косяк был во многих шрифтах с засечками и очень это бесило, каждый раз приходилось обучать;
    а ещё
  • реально начал работать механизм обработки изображенией, и появилась фишка с рапрямлением строк.

Хотя конечно последний пункт довольно сомнительный, потому как например при скане книжки ни за что бы не стал делать это в FR, xsane справляется гораздо лучше, а предобработку сканированных изображений делаю в Sacn Tailor’е.

Сейчас иногда пользуюсь 11-ой, и от 10-ки она тоже довольно таки отличается в лучшую сторону по обработке, но в худшую по теяжеловесности =))) А ваще в основном перешёл на tesseract.

И, так сказать, хозяйке на заметку: есть хороший сайт Рутор.
Fe-Restorator
Гость

Ссылка

Насчёт мягких переносов - эт возможно и прогресс для ридера, но всё-ж - это надстройка над движком, а не сам двигун. Тем паче - я всегда превращаю кучу букв в одну длинную строку и уже после обрабатываю её на предмет синтаксиса и пунктуации, сторонним софтом. Получается намного лучше, и проще заверстать всё потом в собственный формат страницы.
От ридера мне нужно чёткое распознавание самих букв, чего я успешно добивался в 7-ке, даже при обработке "слепой, выеденной мухами" советской машинописной документации (например, слепая "К" от которой остались только акцентные штрихи слева вверху и справа вверху и снизу). Попросту, расставил на символах реперные точки и отпечатанные в таком виде отдельные точки подсунул ридеру на обучение. Процент ошибок на слепом тексте был менее 0.5 с первого-ж прохода!
Практиковался и с распознаванием рукописи, тут дела значительно хуже, но всё-ж метод точек давал 80% годного текста.

PS. Вот тебе тест-задание: выполнить динамическую вёрстку 5-ти страниц книги с иллюстрациями. Для отображения оной на форматах от В6 до А4, соблюдая все правила вёрстки и оформления. Дополнительно: с возможностью вывода результата как в тухлый ворд, так и в FB2, XpressTags, HTML, txt и pdf форматы.
PPS. Чую, одним ридером не обойдёшься, несмотря на все его "плюшки". А раз так - нет смысла в погоне за версиями ридера.
Сейчас на форуме
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Fe-Restorator написал:
[q]
Насчёт мягких переносов - эт возможно и прогресс для ридера … Тем паче - я всегда превращаю кучу букв в одну длинную строку
[/q]
Это всё понятно. Кодгда нужно красиво, качественно и для себя, как я уже писал, предпочитаю Тессеракт, потому как ФР часто вылетает из под вайна, да и обучается тессеракт гораздо проще и контролю над ним больше. И вообще я за юникс-вэй, когда каждая программа выполняет одно действие, но хорошо.


Fe-Restorator написал:
[q]
…нет смысла в погоне за версиями ридера.
[/q]
Я о погоне как таковой не говорю. Просто новые версии чуточку лучше, не только в из-за новых свистоперделок. Пусть то что я использую всего лишь насдтройка (хотя вот с этим утверждением я бы поспорил), но ФР давно превратился в комбайн, который отлично справляется с задачей электронного документоборота (ко всему прочему с минимальными затратами на обучение человеков) и с несложным манипуляциям с документами и книгами в домашних условиях и домашних же целях. А описаные мной моменты улучшений в новых версиях (и ещё довольно много неописанных) вообще сводят редактуру к минимуму. С семёркой проблем было больше, сильно больше.
В кончном же счете суть моего послания такова, что брать версию поновее имеет смысл.


Fe-Restorator написал:
[q]
выполнить динамическую вёрстку
[/q]
А использовать ФР для предпечатной верстки — это да, это глупо. И дело даже не в его ущербности, он просто для этого не предназначен, хотя и имеет этого некоторые инструменты =)
ua1osm
Гость

Ссылка

Распознают ли новейшие версии Finereader рукописный текст?
Сейчас на форуме
Fe-Restorator
Гость

Ссылка

ua1osm написал:
[q]
Распознают ли новейшие версии Finereader рукописный текст?
[/q]
Нет. Хотя тужатся и делают попытки. Процент уверенного распознавания - не выше 25.
Псевдо-рукописный текст, т.е. напечатанный "рукописным шрифтом" фр распознаёт. Если шрифт заковырист - то через процесс обучения.

Кстати, НИ ОДИН файнридер не умеет читать ни кириллицу, ни глаголицу! Книжки от 1800 до 1920 года - в пролёте, ни ижиц, ни ятей... ;) Об письме вязью и говорить нечего...


asp_id написал:
[q]
предпочитаю Тессеракт
[/q]
Как там у тессеракта дела с глаголицей обстоят?


asp_id написал:
[q]
А использовать ФР для предпечатной верстки — это да, это глупо
[/q]
Для процесса вёрстки - об сём и речи нет! А как источник текста для той самой вёрстки - вполне пригоден. Только вот, "мягкие переносы", им расставленные, не соответствуют требованиям русского языка. Ошибочны на 25% минимум. Приходится удалять их все и ставить свои, другой прогой. Сим хотел показать несущественность "примочек" новых версий фр перед 7-кой. Смысла в погоне за номером версии - нет, по меньшей мере, для меня таковой - не очевиден.
Сейчас на форуме
zOrg
Гость
[V] Я не робот.

Откуда: Ленинградская область, пгт. Сиверский
Всего сообщений: 5124
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
9 янв. 2009
ua1osm Тема почищена от флуда.

ЗЫ: Нарываетесь, коллега! Вас 3 раза предупредили не обсуждать способы получения нелегального ПО. А Вы в штыки! Хотите в жБан, можем устроить!
<<Назад  Вперед>> Страницы: 1 *
Печать
Полигон-2 »   Технический флейм »   Finereader
RSS

1 посетитель просмотрел эту тему за последние 15 минут
В том числе: 1 гость, 0 скрытых пользователей

Последние RSS
[Москва] LIQUID-Акция. Сливаются разъемы CF
МС7004 и 7004А на AT и XT
Пайка термотрубок
Проммать s478 PEAK 715VL2-HT ( Full-Size SBC)
Подскажите по 386 материке по джамперам.

Самые активные 5 тем RSS