Объявление форума |
Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС. |
Полигон-2 » Старый софт » Aрхив софта для ретрокомпьютеров |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 | Печать |
SuperMax
Advanced Member
Откуда: Красноярск Всего сообщений: 326 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 27 авг. 2012 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 25 августа 2016 4:19 Сообщение отредактировано: 25 августа 2016 6:22
В архив софта для ретрокомпьютеров прикрутил систему поиска сейчас в поиске 5'484'223 файлов - можно искать примеры Тетрис для VAX OpenVMS для Alpha Драйвера для ET6000 Ищем все про ДВК в архиве Пересторонина по умолчанию поиск идет по всем словам если надо что-то исключить перед словом вставьте ~ (пробел не надо) Ищем voodoo исключив из поиска nt4 если слово не полностью то пишите так Ищем все в начале которого voodoo чего [пока] нет -морфологии -транслитерации -контекстного поиска по содержимому файлов -контекстного поиска по содержимому архивов будет ли это делаться зависит от востребованности функционала советы, замечания приветствуются сразу скажу, что это сделано по-быстрому, за минувшие выходные и это просто пробный шар в поисковой системе |
DOS Logic
Advanced Member
d(-_-)b Откуда: Украина. Ивано-Франковск Всего сообщений: 4778 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 1 июля 2006 |
круто |
Guest |
NEW! Сообщение отправлено: 25 августа 2016 11:00
SuperMax, странно: пишет "Search: "amstrad" found 2419 results" а на экране не более сотни ссылок. Что называется результатом и как оно подсчитано? Да, и в выдаче полно "неопределимых" файлов, таких как "index.htm" коий к теме поиска отношения не имеет. Это просто левая страница, в облаке тегов которой (даже не в самом теле!) упомянуто поисковое слово. Было-бы здорово организовать именно БД, по одной на каждый тип оборудования (атари, амига, вакс, и т.п.), где были-бы перечислены ссылки на реальные файлы софта. С подробным описанием. Затем, на основе БД составить каталог (FTP) и сложить в него всё выкачанное по ссылкам, получится бекап. Разумеется, в-одиночку "архивировать инет" ты не сможешь, значит для каждой БД назначить нескольких модераторов-архивариусов из числа заинтересованных соответствующей техникой. PS. Почему речь об БД и жёстком "раскладывании по полочкам"? Так ведь софт уже написан и нового не предвидится. (А ежли-вдруг, так добавить один-два пункта зело проще!) PPS. За попытку |
Сейчас на форуме |
SuperMax
Advanced Member
Откуда: Красноярск Всего сообщений: 326 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 27 авг. 2012 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 25 августа 2016 12:24 Сообщение отредактировано: 25 августа 2016 13:34
отвечу по пунктам 1. на экран выводится первые 99 результатов по убыванию релевантности скоро прикручу листалку как на гугле, просто руки не дошли. [если тут есть крутой дизайнер, который готов выдрать куски оформления с гугла или дадака - велкам в личку, помощь будет в тему] 2. касаемо index.htm и прочих - поясняю, индексация идет по имени файла и пути к нему тк на сервере куча зеркал различных живых и уже мертвых сайтов и ftp-шников начиная от хюлетовского ftp - кончая подборками технической литературы технически поиск можно усложнить добавить типы файлов (те при сканировании файлов в базу положены mime types всех файлов) 3. это поисковик по моему архиву http://mirrors.pdp-11.ru/ и только, т.е. задачи индексировать весь инет нет и не будет, тк сегодня сайт есть, а завтра уже нет. соответственно методика наполнения простая - нашел интересное, закачал, по возможности классифицировал в нужную директорию и сейчас к этому добавилась фишка индексирования. Однако, если есть желание помогать, то это очень хорошо, тк множество сайтов надо разобрать и разложить http://mirrors.pdp-11.ru/_misc/ftp.sunet.se/pub/os/ явно надо раскидать по операционкам На счет БД и описания - можно сделать интерфейс к БД и дать доступ по типу вики для прикрепления описаний к директориям или файлам. Можно начать с малого - редактирование тегов. 4. это не попытка, это уже самый большой архив из существующих upd: немного дополнил архив - сейчас в нем 6'006'399 файлов 4'498 ГБ |
SokilOff |
SuperMax написал: Самый большой из существующих - это archive.org это не попытка, это уже самый большой архив из существующих Но всё равно круто =) |
SuperMax
Advanced Member
Откуда: Красноярск Всего сообщений: 326 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 27 авг. 2012 |
SokilOff написал: web.archive.org безусловно очень серьезный проект, но у них совсем другое направление и другая задача - это не сколько сохранение информации (попробуйте провалится в глубину сайта в архиве - как правило пусто) сколько сохранение внешнего вида сайтов. Самый большой из существующих - это archive.org я же ставлю задачу сохранения информации целиком, без ориентировки на сохранение оформления. те по сути близкие по духу проекты это http://bitsavers.informatik.uni-stuttgart.de/ , DECUS итд итп причем последний, вообще не индексируется поисковиками тк их дурные антивирусные системы находят там опасные вирусы (!) |
SokilOff |
SuperMax написал: archive.org - это намного больше, чем просто web.archive.org web.archive.org безусловно очень серьезный проект, но у них совсем другое направление и другая задача - это не сколько сохранение информации (попробуйте провалится в глубину сайта в архиве - как правило пусто) сколько сохранение внешнего вида сайтов В тамошних разделах shareware CD-ROMs и Community Software вагон и маленькая тележка ретро- и современного вареза. И как раз ретро - наша тема. |
SuperMax
Advanced Member
Откуда: Красноярск Всего сообщений: 326 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 27 авг. 2012 |
SokilOff написал: согласен, там много чего есть. но вот по моим основным направлениям - DEC: VAX PDP-11 итд очень мало archive.org - это намного больше, чем просто web.archive.org вообще я хочу перевести разговор в другое русло - есть ли что интересное, что стоит добавить в мой архив ? |
Takedasun
Advanced Member
Откуда: Керчь Всего сообщений: 798 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 16 окт. 2013 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 4 сентября 2016 0:35 Сообщение отредактировано: 4 сентября 2016 0:36
Интересный сайт. Спасибо!!! |
SuperMax
Advanced Member
Откуда: Красноярск Всего сообщений: 326 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 27 авг. 2012 |
Профиль | Сообщить модератору
NEW! Сообщение отправлено: 8 сентября 2016 11:23 Сообщение отредактировано: 8 сентября 2016 11:24
небольшой апдейт 1. прикрутил разбивку на страницы - теперь можно просмотреть все результаты поиска 2. поработал над оформлением - теперь в результатах поиска иконки типов файлов отображаются также как и в простом просмотре 3. в результатах поиска можно сразу перейти на директорию с найденным файлом - для удобства просмотра "а что еще есть?" |
<<Назад Вперед>> | Страницы: 1 2 3 4 5 6 | Печать |
Полигон-2 » Старый софт » Aрхив софта для ретрокомпьютеров |
1 посетитель просмотрел эту тему за последние 15 минут |
В том числе: 1 гость, 0 скрытых пользователей |
Последние | |
[Москва] LIQUID-Акция. Сливаются разъемы CF МС7004 и 7004А на AT и XT Пайка термотрубок Проммать s478 PEAK 715VL2-HT ( Full-Size SBC) Подскажите по 386 материке по джамперам. |
Самые активные 5 тем | |