Внимание! Это временный неофициальный архив старой версии форума Полигон Призраков, созданный сочувствующим форуму участником. Этот сайт просуществует лишь до тех пор, пока администрация Полигона не сдержит своё обещание и не откроет официальный архив по адресу old.sannata.org.

Полигон-2

Форум о старых компьютерах

Объявление форума

Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС.

Полигон-2 »   Технический флейм »   Ищется распознавалка немецкого
RSS

Ищется распознавалка немецкого

Файнридер и Ридирис не годятся

<<Назад  Вперед>> Страницы: 1 2
Печать
 
Fe-Restorator
Гость

Ссылка

asp_id написал:
[q]
Кстати, можно попробовать распознавать с обучением :rolleyes:
[/q]
Для финна-ридера этот метод == палка о двух концах: обучаясь новому шрифту он быстро забывает шрифт базовый. :41: И после обучения обязательно нужно корректировать базу сигнатур, иначе каждый следующий вариант буквы "А" будет мешать всем предыдущим.
Сейчас на форуме
мастер бук
Advanced Member
ниспровергатель раритетов

Откуда: москва
Всего сообщений: 3806
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
6 янв. 2009
uav1606 написал:
[q]
Выложите куда-нибудь и сюда ссылку киньте
[/q]
http://yadi.sk/d/M3-tScE2B8vzr
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Собственно, как и ожидалось, очень маленькое разрешение у документа (72 dpi) — Файнридер видит это как кашу, а не как текст, для более-менее нормального распознавания ему нужно хотя бы 240 dpi.

Для решения проблемы необходимо выдернуть из этой PDF-ки нужные страницы как картинки, и увеличить их габаритный размер раза в 2, а то и в 4, затем прогнать в упомянутой мной выше программе Scan Tailor. Полученный выхлоп уже скармливать файнридеру, ошибок почти не делает, ну разве что изредка на слипшихся буквах. Кстати нужен полный Acrobat, он поможет комфортно и без изврата выдернуть все нужные страницы как картинки за один раз, так же подойдёт PDFArchuitect, но то же должен быть полным.
Если дадите точные номера нужных страниц, могу провести эту вот предОКРовую подготовку.
мастер бук
Advanced Member
ниспровергатель раритетов

Откуда: москва
Всего сообщений: 3806
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
6 янв. 2009
ну давайте с 49 по 59 для начала
только текст
картинки, чертежи не нужны
у ирисридера получилось так
IFьr die' g,eplalllten F,e:rnbahl1lelektrHilZierung:en beglann die KPEV bemits 19Q2 mi~ Stud ien ьber dle A!lJisfьhn.mg der erforderlichen Lokomo1iven.
Vorherrschend waren In AnlehmJltng an die Damp'~lokomotrven Entwьrfe mit Paralfe~kurbellaJntrieb, Die SSW boten nach dem V,orbild erner 11 "Cl' -Konslru'kflion fь r die Badischen Staatsbahnen, eine :2 "B2"-$chlilelllzuglokomo;tive 'fЬr 110 km Je h Hцchslg/Ђ,sOhwi nd,ig1>eil: mit 1 000 kW Le1S1ongl und 60 kNI Antahrzugkraft in d'rlei Var~anl:en und eine' Bo 80 '-Lok:Q,motwe tьr 100 km/li mi~: 735 kW und SO kiN an, ID~e' AJEG schlug
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Вот, пожалуста попрубейте скормить файнридеру вот эти картинки: http://yadi.sk/d/M7WEcQIjBAzP5
На всякий случай в архиве так же лежит файнридерский файл-проект. (файн-ридер 11 версии)

У меня получилось:
[q]
Für die geplanten Fernbahnelektrifizierungen begann die KPEV bereits 1902 mit Studien über die Ausführung der erforderlichen Lokomotiven. Vorherrschend waren in Anlehnung an die Dampflokomotiven Entwürfe mit Paral-lelkurbelantrieb. Die SSW boten nach dem Vorbild einer 1'C1 -Konstruktion für die Badischen Staatsbahnen eine 2'B2-Schnellzuglokomotivefür 110 km je h Höchstgeschwindigkeit mit 1 000 kW Leistung und 60 kN Anfahr-zugkraft in drei Varianten und eine Bo'Bo-Lokomotive für 100 km/h mit 735 kW und 80 kN an. Die AEG schlug
[/q]
Естественно ошибки есть есть, но это уже текст, читаемый и правимый в течении 15 минут.
мастер бук
Advanced Member
ниспровергатель раритетов

Откуда: москва
Всего сообщений: 3806
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
6 янв. 2009
нет, один хрен, о распознает немецкую u c 2 точками как мягкий знак :frown:
попробую другой софт
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Да не может такого быть! Если корректно выставлен язык, в данном случае немецкий, то всё должно отрабатывать нормально, и умляуты и ß, всё распознается. Может просто в вашем файнридере нет немецкого языкового пакета?
Я вот сейчас проверил у меня и Cuneiform нормально прочитывает, главное чтоб языковой набор был немецкий.

UPD: Вот я даже в качестве доказательства присовокуплю к посту документ, экспортировано из Файнридера, в режиме «Точная копия» в документ Word: http://yadi.sk/d/aj9UNNN0BBdtf, все умляуты на месте, всё как положено, конечно форматирование хромое, но так уж его экспортирует файнридер в этом режиме. Не пытайтесь смотреть этот документ прямо на Яндекс-Диске — Я-Д его совсем ломает, там по 3 колонки. Надо смотреть непосредственно Вордом.
мастер бук
Advanced Member
ниспровергатель раритетов

Откуда: москва
Всего сообщений: 3806
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
6 янв. 2009
asp_id написал:
[q]
у меня и Cuneiform нормально прочитывает,
[/q]
а меня даже куник вместо FUR распознал FIN
asp_id
Member


Откуда: Ленинград
Всего сообщений: 165
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
8 янв. 2010
Ну в общем как хотите, всё чем мог я помог.
За фантастику и мистику на чужих компах не отвечаю.
<<Назад  Вперед>> Страницы: 1 2
Печать
Полигон-2 »   Технический флейм »   Ищется распознавалка немецкого
RSS

1 посетитель просмотрел эту тему за последние 15 минут
В том числе: 1 гость, 0 скрытых пользователей

Последние RSS
[Москва] LIQUID-Акция. Сливаются разъемы CF
МС7004 и 7004А на AT и XT
Пайка термотрубок
Проммать s478 PEAK 715VL2-HT ( Full-Size SBC)
Подскажите по 386 материке по джамперам.

Самые активные 5 тем RSS