Объявление форума |
Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС. |
Полигон-2 » Технический флейм » Finereader |
<<Назад Вперед>> | Страницы: 1 * | Печать |
Fe-Restorator |
Сообщение отправлено: 18 июня 2013 23:27
Заметил за файнридером таковую особенность: сколько-бы новых версий после 7-ой ни появлялось - работают они не лучше 7-ки, а порой, даже значительно хуже! Базовый алгоритм распознавания у него не изменялся вообще, а примочки-конверторы "из ворда на стенку" и так всегда были глюкавы, а теперь определяют номер версии: новее примочка = выше номер. Так-что рекомендация будет такова: распознавай в 7-ке и не парь мозг. Под 7-ой форточкой 7-ка нормально работает. PS. Раз уж выше поминался варез, то и 7-ку в варезном варьянте разыскать в сети можно. |
Сейчас на форуме |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Fe-Restorator написал: Вот вообще нифига не согласен. Тоже долго пользовался 7-ой, а потом как-то попробовал 10, и был приятно удивлён. Да оно стало тяжеловесней и тормознутей, но зато софтина стала (естественно из того что мне лично было необходимо, список далеко неполный, это то что вот прям щас в голову пришло): Заметил за файнридером таковую особенность […] а теперь определяют номер версии: новее примочка = выше номер.
Хотя конечно последний пункт довольно сомнительный, потому как например при скане книжки ни за что бы не стал делать это в FR, xsane справляется гораздо лучше, а предобработку сканированных изображений делаю в Sacn Tailor’е. Сейчас иногда пользуюсь 11-ой, и от 10-ки она тоже довольно таки отличается в лучшую сторону по обработке, но в худшую по теяжеловесности =))) А ваще в основном перешёл на tesseract. И, так сказать, хозяйке на заметку: есть хороший сайт Рутор. |
Fe-Restorator |
NEW! Сообщение отправлено: 19 июня 2013 16:59 Сообщение отредактировано: 19 июня 2013 17:09
Насчёт мягких переносов - эт возможно и прогресс для ридера, но всё-ж - это надстройка над движком, а не сам двигун. Тем паче - я всегда превращаю кучу букв в одну длинную строку и уже после обрабатываю её на предмет синтаксиса и пунктуации, сторонним софтом. Получается намного лучше, и проще заверстать всё потом в собственный формат страницы. От ридера мне нужно чёткое распознавание самих букв, чего я успешно добивался в 7-ке, даже при обработке "слепой, выеденной мухами" советской машинописной документации (например, слепая "К" от которой остались только акцентные штрихи слева вверху и справа вверху и снизу). Попросту, расставил на символах реперные точки и отпечатанные в таком виде отдельные точки подсунул ридеру на обучение. Процент ошибок на слепом тексте был менее 0.5 с первого-ж прохода! Практиковался и с распознаванием рукописи, тут дела значительно хуже, но всё-ж метод точек давал 80% годного текста. PS. Вот тебе тест-задание: выполнить динамическую вёрстку 5-ти страниц книги с иллюстрациями. Для отображения оной на форматах от В6 до А4, соблюдая все правила вёрстки и оформления. Дополнительно: с возможностью вывода результата как в тухлый ворд, так и в FB2, XpressTags, HTML, txt и pdf форматы. PPS. Чую, одним ридером не обойдёшься, несмотря на все его "плюшки". А раз так - нет смысла в погоне за версиями ридера. |
Сейчас на форуме |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Fe-Restorator написал: Это всё понятно. Кодгда нужно красиво, качественно и для себя, как я уже писал, предпочитаю Тессеракт, потому как ФР часто вылетает из под вайна, да и обучается тессеракт гораздо проще и контролю над ним больше. И вообще я за юникс-вэй, когда каждая программа выполняет одно действие, но хорошо. Насчёт мягких переносов - эт возможно и прогресс для ридера … Тем паче - я всегда превращаю кучу букв в одну длинную строку Fe-Restorator написал: Я о погоне как таковой не говорю. Просто новые версии чуточку лучше, не только в из-за новых свистоперделок. Пусть то что я использую всего лишь насдтройка (хотя вот с этим утверждением я бы поспорил), но ФР давно превратился в комбайн, который отлично справляется с задачей электронного документоборота (ко всему прочему с минимальными затратами на обучение человеков) и с несложным манипуляциям с документами и книгами в домашних условиях и домашних же целях. А описаные мной моменты улучшений в новых версиях (и ещё довольно много неописанных) вообще сводят редактуру к минимуму. С семёркой проблем было больше, сильно больше. …нет смысла в погоне за версиями ридера. В кончном же счете суть моего послания такова, что брать версию поновее имеет смысл. Fe-Restorator написал: А использовать ФР для предпечатной верстки — это да, это глупо. И дело даже не в его ущербности, он просто для этого не предназначен, хотя и имеет этого некоторые инструменты =) выполнить динамическую вёрстку |
ua1osm |
NEW! Сообщение отправлено: 19 июня 2013 20:19
Распознают ли новейшие версии Finereader рукописный текст? |
Сейчас на форуме |
Fe-Restorator |
NEW! Сообщение отправлено: 19 июня 2013 20:25 Сообщение отредактировано: 19 июня 2013 20:47
ua1osm написал: Нет. Хотя тужатся и делают попытки. Процент уверенного распознавания - не выше 25. Распознают ли новейшие версии Finereader рукописный текст? Псевдо-рукописный текст, т.е. напечатанный "рукописным шрифтом" фр распознаёт. Если шрифт заковырист - то через процесс обучения. Кстати, НИ ОДИН файнридер не умеет читать ни кириллицу, ни глаголицу! Книжки от 1800 до 1920 года - в пролёте, ни ижиц, ни ятей... Об письме вязью и говорить нечего... asp_id написал: Как там у тессеракта дела с глаголицей обстоят? предпочитаю Тессеракт asp_id написал: Для процесса вёрстки - об сём и речи нет! А как источник текста для той самой вёрстки - вполне пригоден. Только вот, "мягкие переносы", им расставленные, не соответствуют требованиям русского языка. Ошибочны на 25% минимум. Приходится удалять их все и ставить свои, другой прогой. Сим хотел показать несущественность "примочек" новых версий фр перед 7-кой. Смысла в погоне за номером версии - нет, по меньшей мере, для меня таковой - не очевиден. А использовать ФР для предпечатной верстки — это да, это глупо |
Сейчас на форуме |
zOrg
Гость
[V] Я не робот. Откуда: Ленинградская область, пгт. Сиверский Всего сообщений: 5124 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 9 янв. 2009 |
ua1osm Тема почищена от флуда. ЗЫ: Нарываетесь, коллега! Вас 3 раза предупредили не обсуждать способы получения нелегального ПО. А Вы в штыки! Хотите в жБан, можем устроить! |
<<Назад Вперед>> | Страницы: 1 * | Печать |
Полигон-2 » Технический флейм » Finereader |
1 посетитель просмотрел эту тему за последние 15 минут |
В том числе: 1 гость, 0 скрытых пользователей |
Последние | |
[Москва] LIQUID-Акция. Сливаются разъемы CF МС7004 и 7004А на AT и XT Пайка термотрубок Проммать s478 PEAK 715VL2-HT ( Full-Size SBC) Подскажите по 386 материке по джамперам. |
Самые активные 5 тем | |