Объявление форума |
Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС. |
Полигон-2 » Технический флейм » Восстановление страниц из Content.IE5 |
<<Назад Вперед>> | Печать |
ATauenis
Advanced Member
Откуда: Москва Всего сообщений: 2904 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 30 апр. 2015 |
Не в первый раз нахожу на старых жёстких дисках огромные кэши IE со страницами, которых нет в Web Archive. В основном это результаты поисковиков середины нулевых и подобный полу хлам. Если включить автономный режим, можно "полазить" в поиске Яндекса образца 2008 года, или посмотреть прогноз погоды, который выбирается через JavaScript. Очень хорошо IE переадресует все запросы к интернету в свой кэш. Порылся в кэше, там все файлы в неизменном виде, и есть БД в формате, который как бы описан, но по факту набор полей там произвольный, и упомянутому описанию соответствует только часть файла. Поэтому начал писать утилиту, которая сканирует весь кэш на предмет ht* файлов, а далее ищет картинки и прочие ресурсы по именам файлов. Но это весьма весёлая задача, особенно когда есть ссылка на какой-нибудь index.htm, и поди угадай, какой из 100 index.htm[ * ] там упомянут. Разобрать формат index.dat пока не вышло, но, может быть, ещё разберусь. Вопрос: есть ли какие-нибудь готовые утилиты, преобразующие кэш IE в читабельный формат (типа как у Teleport Pro)? Или я первопроходец за без года 20 лет существования этого формата? |
pahan
Advanced Member
Откуда: Химки, М.О. Всего сообщений: 1070 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 13 мар. 2015 |
Не очень понял задачу, но вот здесь вроде есть параметр, позволяюший распихать файлы по папкам, как на исходном сайте. |
ATauenis
Advanced Member
Откуда: Москва Всего сообщений: 2904 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 30 апр. 2015 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 28 февраля 2018 21:38 Сообщение отредактировано: 28 февраля 2018 23:38
pahan, задачу поняли верно, надо реанимировать кэш, чтобы страницы из него открывались не только в автономном режиме на компе, содержащем кэш, но и на других. IECacheView на справляется на 4-, ссылки (и картинки, стили, js) на другие домены остаются как есть. Но простые (однодоменные) сайты восстановил отлично. В целом, можно заменить http/https в файлах на адрес корневой папки с достанными страницами, и будет то, что надо. Скорее всего. Ещё обнаружил недостаток. Ест только папку Temporary Internet Files, отдельно Content.IE5 не признаёт. Также не завелась на WinME. |
Igor Michailov
Advanced Member
Откуда: Екатеринбург Всего сообщений: 1132 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 26 авг. 2012 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 1 марта 2018 11:13 Сообщение отредактировано: 1 марта 2018 11:16
Если задача посмотреть температуру в прошлые года, то можно на гисметео в разделе Дневник это сделать. Например, 1 марта 2000 года в Москве была температура +5С В целом же задача автоматического восстановления веб-страниц из кешей браузеров решается плохо. Как правило, после автоматического восстановления, страницы нуждаются в ручной обработке рашпилем (как в известном бородатом анекдоте). |
ATauenis
Advanced Member
Откуда: Москва Всего сообщений: 2904 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 30 апр. 2015 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 1 марта 2018 11:49 Сообщение отредактировано: 4 марта 2018 17:43
Не, дело не только в температуре. Интересно поностальгировать по старому виду выдачи Яндекса, страницам ВКонтакте вида задолго до моей регистрации там, блоку поиска в боковой панели IE, личным кабинетам модемных провайдеров и т.д.. Также в кэше вижу остатки update.microsoft.com для WinME, может, что-нибудь там будет полезное. Потом, когда отсортирую что можно выкладывать, а что нет, выложу у себя на сайте (в Web.Archive.Org всего этого нет и быть не может, многое требовало логины-пароли или скрыто в robots.txt). Igor Michailov написал: Однако, IE с этим отлично справляется, если включить автономный режим. В целом же задача автоматического восстановления веб-страниц из кешей браузеров решается плохо. Руками его работа проделывается так: 1.) Поменять "http://", ""http://" и ""//" на путь к папке восстановленных страниц. 2.) Распаковать что сжато Gzip'ом (самый сложный для автоматизации процесс, пока думаю, как его проделать грамотно). 3.) Подправить пути. 4.) Можно запускать машину времени |
<<Назад Вперед>> | Печать |
Полигон-2 » Технический флейм » Восстановление страниц из Content.IE5 |
1 посетитель просмотрел эту тему за последние 15 минут |
В том числе: 1 гость, 0 скрытых пользователей |
Последние | |
[Москва] LIQUID-Акция. Сливаются разъемы CF МС7004 и 7004А на AT и XT Пайка термотрубок Проммать s478 PEAK 715VL2-HT ( Full-Size SBC) Подскажите по 386 материке по джамперам. |
Самые активные 5 тем | |