Объявление форума |
Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС. |
Полигон-2 » Технический флейм » Ищется распознавалка немецкого |
<<Назад Вперед>> | Страницы: 1 * 2 | Печать |
uav1606
Advanced Member
Откуда: Енакиево Всего сообщений: 4373 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 16 янв. 2008 |
мастер бук, сбавьте тон Ваших сообщений, пожалуйста, всё-таки люди пытаются Вам помочь. Кстати, не уверен, что эта тема имеет отношение именно к старому софту. По сути темы: можете ещё вот эти распозновалки посмотреть: http://cognitiveforms.ru/products/cuneiform/ http://freeocr.net/ Немецкий там есть, но я сомневаюсь, что они распознают лучше. Да и возможностей у них меньше. Ещё есть онлайн-распозновалки, типа этой: http://www.onlineocr.net/ Скорее всего, дело и правда не в FineReader, а в плохом качестве исходного документа, плохом сканировании или нестандартном шрифте. Хотелось бы увидеть хотя бы одну страницу отсканированного образца - тогда бы многое стало понятнее. |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
uav1606 написал: книга весит 60 мб Хотелось бы увидеть хотя бы одну страницу отсканированного образца могу выслать для опытов интересуют страницы с 51 начиная картинки можно пропустить-иллюстрации к статье будут собственные |
uav1606
Advanced Member
Откуда: Енакиево Всего сообщений: 4373 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 16 янв. 2008 |
Выложите куда-нибудь и сюда ссылку киньте. Но было бы достаточно одной страницы в виде картинки. |
Fe-Restorator |
NEW! Сообщение отправлено: 16 октября 2013 21:50
Картинка должна быть отсканирована в градациях серого с разрешением 200 dpi или в цвете с 300 dpi. Иначе ни один финн-ридер твой текст не распознает. Как минимум, безошибочно. |
Сейчас на форуме |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 17 октября 2013 2:02 Сообщение отредактировано: 17 октября 2013 2:04
Если уходить от Файнридера — то к Тессеракту, его можно обучить конкретному шрифту книги (обычно одной страницы достаточно), а можно поперебирать уже готовые базы. А если не уходить, то можно попробовать подготовить страницы-картинки прогой Scan Tailor, она приведёт их к нужному виду, что бы файнридер ошибался гораздо меньше. мастер бук, а правда 60 метров не так много, выложите куд-нибудь, а то мне тоже стало интересно с чем это файн-ридер не справляется! Кстати, можно попробовать распознавать с обучением |
Fe-Restorator |
NEW! Сообщение отправлено: 17 октября 2013 2:40
asp_id написал: Для финна-ридера этот метод == палка о двух концах: обучаясь новому шрифту он быстро забывает шрифт базовый. И после обучения обязательно нужно корректировать базу сигнатур, иначе каждый следующий вариант буквы "А" будет мешать всем предыдущим. Кстати, можно попробовать распознавать с обучением |
Сейчас на форуме |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
uav1606 написал: Выложите куда-нибудь и сюда ссылку киньтеhttp://yadi.sk/d/M3-tScE2B8vzr |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Собственно, как и ожидалось, очень маленькое разрешение у документа (72 dpi) — Файнридер видит это как кашу, а не как текст, для более-менее нормального распознавания ему нужно хотя бы 240 dpi. Для решения проблемы необходимо выдернуть из этой PDF-ки нужные страницы как картинки, и увеличить их габаритный размер раза в 2, а то и в 4, затем прогнать в упомянутой мной выше программе Scan Tailor. Полученный выхлоп уже скармливать файнридеру, ошибок почти не делает, ну разве что изредка на слипшихся буквах. Кстати нужен полный Acrobat, он поможет комфортно и без изврата выдернуть все нужные страницы как картинки за один раз, так же подойдёт PDFArchuitect, но то же должен быть полным. Если дадите точные номера нужных страниц, могу провести эту вот предОКРовую подготовку. |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 18 октября 2013 10:19 Сообщение отредактировано: 18 октября 2013 10:20
ну давайте с 49 по 59 для начала только текст картинки, чертежи не нужны у ирисридера получилось так IFьr die' g,eplalllten F,e:rnbahl1lelektrHilZierung:en beglann die KPEV bemits 19Q2 mi~ Stud ien ьber dle A!lJisfьhn.mg der erforderlichen Lokomo1iven. Vorherrschend waren In AnlehmJltng an die Damp'~lokomotrven Entwьrfe mit Paralfe~kurbellaJntrieb, Die SSW boten nach dem V,orbild erner 11 "Cl' -Konslru'kflion fь r die Badischen Staatsbahnen, eine :2 "B2"-$chlilelllzuglokomo;tive 'fЬr 110 km Je h Hцchslg/Ђ,sOhwi nd,ig1>eil: mit 1 000 kW Le1S1ongl und 60 kNI Antahrzugkraft in d'rlei Var~anl:en und eine' Bo 80 '-Lok:Q,motwe tьr 100 km/li mi~: 735 kW und SO kiN an, ID~e' AJEG schlug |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 18 октября 2013 17:28 Сообщение отредактировано: 18 октября 2013 17:32
Вот, пожалуста попрубейте скормить файнридеру вот эти картинки: http://yadi.sk/d/M7WEcQIjBAzP5 На всякий случай в архиве так же лежит файнридерский файл-проект. (файн-ридер 11 версии) У меня получилось: Естественно ошибки есть есть, но это уже текст, читаемый и правимый в течении 15 минут. Für die geplanten Fernbahnelektrifizierungen begann die KPEV bereits 1902 mit Studien über die Ausführung der erforderlichen Lokomotiven. Vorherrschend waren in Anlehnung an die Dampflokomotiven Entwürfe mit Paral-lelkurbelantrieb. Die SSW boten nach dem Vorbild einer 1'C1 -Konstruktion für die Badischen Staatsbahnen eine 2'B2-Schnellzuglokomotivefür 110 km je h Höchstgeschwindigkeit mit 1 000 kW Leistung und 60 kN Anfahr-zugkraft in drei Varianten und eine Bo'Bo-Lokomotive für 100 km/h mit 735 kW und 80 kN an. Die AEG schlug |
<<Назад Вперед>> | Страницы: 1 * 2 | Печать |
Полигон-2 » Технический флейм » Ищется распознавалка немецкого |
1 посетитель просмотрел эту тему за последние 15 минут |
В том числе: 1 гость, 0 скрытых пользователей |
Последние | |
[Москва] LIQUID-Акция. Сливаются разъемы CF МС7004 и 7004А на AT и XT Пайка термотрубок Проммать s478 PEAK 715VL2-HT ( Full-Size SBC) Подскажите по 386 материке по джамперам. |
Самые активные 5 тем | |