Внимание! Это временный неофициальный архив старой версии форума Полигон Призраков, созданный сочувствующим форуму участником. Этот сайт просуществует лишь до тех пор, пока администрация Полигона не сдержит своё обещание и не откроет официальный архив по адресу old.sannata.org.

Полигон-2

Форум о старых компьютерах

Объявление форума

Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС.

Полигон-2 »   Технический флейм »   Ищется распознавалка немецкого
RSS

Ищется распознавалка немецкого

Файнридер и Ридирис не годятся

<<Назад  Вперед>> Страницы: 1 * 2
Печать
 
мастер бук
Advanced Member
ниспровергатель раритетов

Откуда: москва
Всего сообщений: 3806
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
6 янв. 2009
qlex написал:
[q]
Выставьте язык распознования "немецкий
[/q]
DDP написал:
[q]
в файнридере оставьте только немецкий
[/q]
:thumbdown:
qlex
Advanced Member
~-~

Откуда: Красноярский край, г. Ачинск
Всего сообщений: 662
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
13 сен. 2011
мастер бук
Если файнридер не справляется, то другой, скорей всего, выдаст не лучше результат...
Значит, источник недостаточно качественный или с малым разрешением картинка...

Если какие-то вычурнутые шрифты, пробуйте ABBYY FineReader XIX:
[q]
ABBYY FineReader XIX обеспечивает распознавание старых европейских текстов, набранных старинными шрифтами, с учётом особенностей старинных алфавитов, вышедшей из употребления орфографии и морфологии.

Дополнительно к 177 языкам, используемым в системе FineReader, программа поддерживает 5 старых европейских языков: английский, немецкий, французский, испанский и итальянский. В арсенале системы — способность обрабатывать популярные в прошлом шрифты Fraktur и Schwabacher и большое количество готических («ломаных») шрифтов.
[/q]
uav1606
Advanced Member


Откуда: Енакиево
Всего сообщений: 4373
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
16 янв. 2008
мастер бук, сбавьте тон Ваших сообщений, пожалуйста, всё-таки люди пытаются Вам помочь. Кстати, не уверен, что эта тема имеет отношение именно к старому софту.

По сути темы: можете ещё вот эти распозновалки посмотреть:
http://cognitiveforms.ru/products/cuneiform/
http://freeocr.net/

Немецкий там есть, но я сомневаюсь, что они распознают лучше. Да и возможностей у них меньше.

Ещё есть онлайн-распозновалки, типа этой:
http://www.onlineocr.net/

Скорее всего, дело и правда не в FineReader, а в плохом качестве исходного документа, плохом сканировании или нестандартном шрифте. Хотелось бы увидеть хотя бы одну страницу отсканированного образца - тогда бы многое стало понятнее.
мастер бук
Advanced Member
ниспровергатель раритетов

Откуда: москва
Всего сообщений: 3806
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
6 янв. 2009
uav1606 написал:
[q]
Хотелось бы увидеть хотя бы одну страницу отсканированного образца
[/q]
книга весит 60 мб
могу выслать для опытов
интересуют страницы с 51 начиная
картинки можно пропустить-иллюстрации к статье будут собственные
uav1606
Advanced Member


Откуда: Енакиево
Всего сообщений: 4373
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
16 янв. 2008
Выложите куда-нибудь и сюда ссылку киньте. Но было бы достаточно одной страницы в виде картинки.
Fe-Restorator
Гость

Ссылка

Картинка должна быть отсканирована в градациях серого с разрешением 200 dpi или в цвете с 300 dpi. Иначе ни один финн-ридер твой текст не распознает. Как минимум, безошибочно.
Сейчас на форуме
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Если уходить от Файнридера — то к Тессеракту, его можно обучить конкретному шрифту книги (обычно одной страницы достаточно), а можно поперебирать уже готовые базы.
А если не уходить, то можно попробовать подготовить страницы-картинки прогой Scan Tailor, она приведёт их к нужному виду, что бы файнридер ошибался гораздо меньше.

мастер бук, а правда 60 метров не так много, выложите куд-нибудь, а то мне тоже стало интересно с чем это файн-ридер не справляется!
Кстати, можно попробовать распознавать с обучением :rolleyes:
Fe-Restorator
Гость

Ссылка

asp_id написал:
[q]
Кстати, можно попробовать распознавать с обучением :rolleyes:
[/q]
Для финна-ридера этот метод == палка о двух концах: обучаясь новому шрифту он быстро забывает шрифт базовый. :41: И после обучения обязательно нужно корректировать базу сигнатур, иначе каждый следующий вариант буквы "А" будет мешать всем предыдущим.
Сейчас на форуме
мастер бук
Advanced Member
ниспровергатель раритетов

Откуда: москва
Всего сообщений: 3806
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
6 янв. 2009
uav1606 написал:
[q]
Выложите куда-нибудь и сюда ссылку киньте
[/q]
http://yadi.sk/d/M3-tScE2B8vzr
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Собственно, как и ожидалось, очень маленькое разрешение у документа (72 dpi) — Файнридер видит это как кашу, а не как текст, для более-менее нормального распознавания ему нужно хотя бы 240 dpi.

Для решения проблемы необходимо выдернуть из этой PDF-ки нужные страницы как картинки, и увеличить их габаритный размер раза в 2, а то и в 4, затем прогнать в упомянутой мной выше программе Scan Tailor. Полученный выхлоп уже скармливать файнридеру, ошибок почти не делает, ну разве что изредка на слипшихся буквах. Кстати нужен полный Acrobat, он поможет комфортно и без изврата выдернуть все нужные страницы как картинки за один раз, так же подойдёт PDFArchuitect, но то же должен быть полным.
Если дадите точные номера нужных страниц, могу провести эту вот предОКРовую подготовку.
<<Назад  Вперед>> Страницы: 1 * 2
Печать
Полигон-2 »   Технический флейм »   Ищется распознавалка немецкого
RSS

1 посетитель просмотрел эту тему за последние 15 минут
В том числе: 1 гость, 0 скрытых пользователей

Последние RSS
[Москва] LIQUID-Акция. Сливаются разъемы CF
МС7004 и 7004А на AT и XT
Пайка термотрубок
Проммать s478 PEAK 715VL2-HT ( Full-Size SBC)
Подскажите по 386 материке по джамперам.

Самые активные 5 тем RSS