Объявление форума |
Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС. |
Полигон-2 » Технический флейм » Ищется распознавалка немецкого |
<<Назад Вперед>> | Страницы: 1 2 | Печать |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 14 октября 2013 8:50 Сообщение отредактировано: 14 октября 2013 8:50
Mod. uav1606. Перенесено из раздела "Старый софт", т.к. речь в теме идёт совсем не про старый софт. есть у меня одна заветная книжка на немецком языке надо мне на ее основе сделать несколько статей по истории однако файн распознает ее с таким количеством очепяток что я болше времени трачу на их исправление чем на перевод есть какие нибудь распознавалки заточенные чисто на немецкую лексику? |
qlex
Advanced Member
~-~ Откуда: Красноярский край, г. Ачинск Всего сообщений: 662 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 13 сен. 2011 |
Выставьте язык распознования "немецкий" в файнридере и будет разпозновалка, заточенная чисто под немцев |
DDP
Advanced Member
Всего сообщений: 386 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 25 мая 2012 |
мастер бук написал: ну, майн кампф можно найти сразу, не прибегая к распознаванию... есть у меня одна заветная книжка на немецком языке в файнридере оставьте только немецкий и русский языки. |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 14 октября 2013 20:47 Сообщение отредактировано: 18 октября 2013 19:51
qlex написал: DDP написал: Выставьте язык распознования "немецкий в файнридере оставьте только немецкий |
qlex
Advanced Member
~-~ Откуда: Красноярский край, г. Ачинск Всего сообщений: 662 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 13 сен. 2011 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 16 октября 2013 5:10 Сообщение отредактировано: 16 октября 2013 11:00
мастер бук Если файнридер не справляется, то другой, скорей всего, выдаст не лучше результат... Значит, источник недостаточно качественный или с малым разрешением картинка... Если какие-то вычурнутые шрифты, пробуйте ABBYY FineReader XIX: ABBYY FineReader XIX обеспечивает распознавание старых европейских текстов, набранных старинными шрифтами, с учётом особенностей старинных алфавитов, вышедшей из употребления орфографии и морфологии. |
uav1606
Advanced Member
Откуда: Енакиево Всего сообщений: 4373 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 16 янв. 2008 |
мастер бук, сбавьте тон Ваших сообщений, пожалуйста, всё-таки люди пытаются Вам помочь. Кстати, не уверен, что эта тема имеет отношение именно к старому софту. По сути темы: можете ещё вот эти распозновалки посмотреть: http://cognitiveforms.ru/products/cuneiform/ http://freeocr.net/ Немецкий там есть, но я сомневаюсь, что они распознают лучше. Да и возможностей у них меньше. Ещё есть онлайн-распозновалки, типа этой: http://www.onlineocr.net/ Скорее всего, дело и правда не в FineReader, а в плохом качестве исходного документа, плохом сканировании или нестандартном шрифте. Хотелось бы увидеть хотя бы одну страницу отсканированного образца - тогда бы многое стало понятнее. |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
uav1606 написал: книга весит 60 мб Хотелось бы увидеть хотя бы одну страницу отсканированного образца могу выслать для опытов интересуют страницы с 51 начиная картинки можно пропустить-иллюстрации к статье будут собственные |
uav1606
Advanced Member
Откуда: Енакиево Всего сообщений: 4373 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 16 янв. 2008 |
Выложите куда-нибудь и сюда ссылку киньте. Но было бы достаточно одной страницы в виде картинки. |
Fe-Restorator |
NEW! Сообщение отправлено: 16 октября 2013 21:50
Картинка должна быть отсканирована в градациях серого с разрешением 200 dpi или в цвете с 300 dpi. Иначе ни один финн-ридер твой текст не распознает. Как минимум, безошибочно. |
Сейчас на форуме |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 17 октября 2013 2:02 Сообщение отредактировано: 17 октября 2013 2:04
Если уходить от Файнридера — то к Тессеракту, его можно обучить конкретному шрифту книги (обычно одной страницы достаточно), а можно поперебирать уже готовые базы. А если не уходить, то можно попробовать подготовить страницы-картинки прогой Scan Tailor, она приведёт их к нужному виду, что бы файнридер ошибался гораздо меньше. мастер бук, а правда 60 метров не так много, выложите куд-нибудь, а то мне тоже стало интересно с чем это файн-ридер не справляется! Кстати, можно попробовать распознавать с обучением |
Fe-Restorator |
NEW! Сообщение отправлено: 17 октября 2013 2:40
asp_id написал: Для финна-ридера этот метод == палка о двух концах: обучаясь новому шрифту он быстро забывает шрифт базовый. И после обучения обязательно нужно корректировать базу сигнатур, иначе каждый следующий вариант буквы "А" будет мешать всем предыдущим. Кстати, можно попробовать распознавать с обучением |
Сейчас на форуме |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
uav1606 написал: Выложите куда-нибудь и сюда ссылку киньтеhttp://yadi.sk/d/M3-tScE2B8vzr |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Собственно, как и ожидалось, очень маленькое разрешение у документа (72 dpi) — Файнридер видит это как кашу, а не как текст, для более-менее нормального распознавания ему нужно хотя бы 240 dpi. Для решения проблемы необходимо выдернуть из этой PDF-ки нужные страницы как картинки, и увеличить их габаритный размер раза в 2, а то и в 4, затем прогнать в упомянутой мной выше программе Scan Tailor. Полученный выхлоп уже скармливать файнридеру, ошибок почти не делает, ну разве что изредка на слипшихся буквах. Кстати нужен полный Acrobat, он поможет комфортно и без изврата выдернуть все нужные страницы как картинки за один раз, так же подойдёт PDFArchuitect, но то же должен быть полным. Если дадите точные номера нужных страниц, могу провести эту вот предОКРовую подготовку. |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 18 октября 2013 10:19 Сообщение отредактировано: 18 октября 2013 10:20
ну давайте с 49 по 59 для начала только текст картинки, чертежи не нужны у ирисридера получилось так IFьr die' g,eplalllten F,e:rnbahl1lelektrHilZierung:en beglann die KPEV bemits 19Q2 mi~ Stud ien ьber dle A!lJisfьhn.mg der erforderlichen Lokomo1iven. Vorherrschend waren In AnlehmJltng an die Damp'~lokomotrven Entwьrfe mit Paralfe~kurbellaJntrieb, Die SSW boten nach dem V,orbild erner 11 "Cl' -Konslru'kflion fь r die Badischen Staatsbahnen, eine :2 "B2"-$chlilelllzuglokomo;tive 'fЬr 110 km Je h Hцchslg/Ђ,sOhwi nd,ig1>eil: mit 1 000 kW Le1S1ongl und 60 kNI Antahrzugkraft in d'rlei Var~anl:en und eine' Bo 80 '-Lok:Q,motwe tьr 100 km/li mi~: 735 kW und SO kiN an, ID~e' AJEG schlug |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 18 октября 2013 17:28 Сообщение отредактировано: 18 октября 2013 17:32
Вот, пожалуста попрубейте скормить файнридеру вот эти картинки: http://yadi.sk/d/M7WEcQIjBAzP5 На всякий случай в архиве так же лежит файнридерский файл-проект. (файн-ридер 11 версии) У меня получилось: Естественно ошибки есть есть, но это уже текст, читаемый и правимый в течении 15 минут. Für die geplanten Fernbahnelektrifizierungen begann die KPEV bereits 1902 mit Studien über die Ausführung der erforderlichen Lokomotiven. Vorherrschend waren in Anlehnung an die Dampflokomotiven Entwürfe mit Paral-lelkurbelantrieb. Die SSW boten nach dem Vorbild einer 1'C1 -Konstruktion für die Badischen Staatsbahnen eine 2'B2-Schnellzuglokomotivefür 110 km je h Höchstgeschwindigkeit mit 1 000 kW Leistung und 60 kN Anfahr-zugkraft in drei Varianten und eine Bo'Bo-Lokomotive für 100 km/h mit 735 kW und 80 kN an. Die AEG schlug |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
нет, один хрен, о распознает немецкую u c 2 точками как мягкий знак попробую другой софт |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 18 октября 2013 20:46 Сообщение отредактировано: 18 октября 2013 20:59
Да не может такого быть! Если корректно выставлен язык, в данном случае немецкий, то всё должно отрабатывать нормально, и умляуты и ß, всё распознается. Может просто в вашем файнридере нет немецкого языкового пакета? Я вот сейчас проверил у меня и Cuneiform нормально прочитывает, главное чтоб языковой набор был немецкий. UPD: Вот я даже в качестве доказательства присовокуплю к посту документ, экспортировано из Файнридера, в режиме «Точная копия» в документ Word: http://yadi.sk/d/aj9UNNN0BBdtf, все умляуты на месте, всё как положено, конечно форматирование хромое, но так уж его экспортирует файнридер в этом режиме. Не пытайтесь смотреть этот документ прямо на Яндекс-Диске — Я-Д его совсем ломает, там по 3 колонки. Надо смотреть непосредственно Вордом. |
мастер бук
Advanced Member
ниспровергатель раритетов Откуда: москва Всего сообщений: 3806 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 6 янв. 2009 |
asp_id написал: а меня даже куник вместо FUR распознал FIN у меня и Cuneiform нормально прочитывает, |
asp_id
Member
Откуда: Ленинград Всего сообщений: 165 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 8 янв. 2010 |
Ну в общем как хотите, всё чем мог я помог. За фантастику и мистику на чужих компах не отвечаю. |
<<Назад Вперед>> | Страницы: 1 2 | Печать |
Полигон-2 » Технический флейм » Ищется распознавалка немецкого |
1 посетитель просмотрел эту тему за последние 15 минут |
В том числе: 1 гость, 0 скрытых пользователей |
Последние | |
[Москва] LIQUID-Акция. Сливаются разъемы CF МС7004 и 7004А на AT и XT Пайка термотрубок Проммать s478 PEAK 715VL2-HT ( Full-Size SBC) Подскажите по 386 материке по джамперам. |
Самые активные 5 тем | |