Внимание! Это временный неофициальный архив старой версии форума Полигон Призраков, созданный сочувствующим форуму участником. Этот сайт просуществует лишь до тех пор, пока администрация Полигона не сдержит своё обещание и не откроет официальный архив по адресу old.sannata.org.

Полигон-2

Форум о старых компьютерах

Объявление форума

Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС.

Полигон-2 »   Старый софт »   Aрхив софта для ретрокомпьютеров
RSS

Aрхив софта для ретрокомпьютеров

новости

<<Назад  Вперед>> Страницы: 1 2 3 4 5 6
Печать
 
SuperMax
Advanced Member


Откуда: Красноярск
Всего сообщений: 326
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
27 авг. 2012
В архив софта для ретрокомпьютеров прикрутил систему поиска


сейчас в поиске 5'484'223 файлов - можно искать
примеры Тетрис для VAX
OpenVMS для Alpha
Драйвера для ET6000
Ищем все про ДВК в архиве Пересторонина


по умолчанию поиск идет по всем словам

если надо что-то исключить перед словом вставьте ~ (пробел не надо)
Ищем voodoo исключив из поиска nt4

если слово не полностью то пишите так
Ищем все в начале которого voodoo


чего [пока] нет
-морфологии
-транслитерации
-контекстного поиска по содержимому файлов
-контекстного поиска по содержимому архивов
будет ли это делаться зависит от востребованности функционала

советы, замечания приветствуются

сразу скажу, что это сделано по-быстрому, за минувшие выходные и это просто пробный шар в поисковой системе
DOS Logic
Advanced Member
d(-_-)b

Откуда: Украина. Ивано-Франковск
Всего сообщений: 4778
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
1 июля 2006
круто :thumbup:
Guest
Гость

Ссылка

SuperMax, странно: пишет "Search: "amstrad" found 2419 results" а на экране не более сотни ссылок.
Что называется результатом и как оно подсчитано?

Да, и в выдаче полно "неопределимых" файлов, таких как "index.htm" коий к теме поиска отношения не имеет. Это просто левая страница, в облаке тегов которой (даже не в самом теле!) упомянуто поисковое слово.

Было-бы здорово организовать именно БД, по одной на каждый тип оборудования (атари, амига, вакс, и т.п.), где были-бы перечислены ссылки на реальные файлы софта. С подробным описанием. Затем, на основе БД составить каталог (FTP) и сложить в него всё выкачанное по ссылкам, получится бекап.

Разумеется, в-одиночку "архивировать инет" ты не сможешь, значит для каждой БД назначить нескольких модераторов-архивариусов из числа заинтересованных соответствующей техникой.

PS. Почему речь об БД и жёстком "раскладывании по полочкам"? Так ведь софт уже написан и нового не предвидится. (А ежли-вдруг, так добавить один-два пункта зело проще!)

PPS. За попытку "консолидации" собора разрозненной инфы - большой плюс!
Сейчас на форуме
SuperMax
Advanced Member


Откуда: Красноярск
Всего сообщений: 326
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
27 авг. 2012
отвечу по пунктам
1. на экран выводится первые 99 результатов по убыванию релевантности
скоро прикручу листалку как на гугле, просто руки не дошли.
[если тут есть крутой дизайнер, который готов выдрать куски оформления с гугла или дадака - велкам в личку, помощь будет в тему]

2. касаемо index.htm и прочих - поясняю, индексация идет по имени файла и пути к нему
тк на сервере куча зеркал различных живых и уже мертвых сайтов и ftp-шников
начиная от хюлетовского ftp - кончая подборками технической литературы

технически поиск можно усложнить добавить типы файлов (те при сканировании файлов в базу положены mime types всех файлов)

3. это поисковик по моему архиву http://mirrors.pdp-11.ru/ и только, т.е. задачи индексировать весь инет нет и не будет, тк сегодня сайт есть, а завтра уже нет.
соответственно методика наполнения простая - нашел интересное, закачал, по возможности классифицировал в нужную директорию
и сейчас к этому добавилась фишка индексирования.

Однако, если есть желание помогать, то это очень хорошо, тк множество сайтов надо разобрать и разложить
http://mirrors.pdp-11.ru/_misc/ftp.sunet.se/pub/os/
явно надо раскидать по операционкам

На счет БД и описания - можно сделать интерфейс к БД и дать доступ по типу вики
для прикрепления описаний к директориям или файлам. Можно начать с малого - редактирование тегов.

4. это не попытка, это уже самый большой архив из существующих :cool:

upd: немного дополнил архив - сейчас в нем
6'006'399 файлов 4'498 ГБ
SokilOff
Member


Всего сообщений: 152
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
31 дек. 2012
SuperMax написал:
[q]
это не попытка, это уже самый большой архив из существующих
[/q]
Самый большой из существующих - это archive.org
Но всё равно круто =)
SuperMax
Advanced Member


Откуда: Красноярск
Всего сообщений: 326
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
27 авг. 2012
SokilOff написал:
[q]
Самый большой из существующих - это archive.org
[/q]
web.archive.org безусловно очень серьезный проект, но у них совсем другое направление и другая задача - это не сколько сохранение информации (попробуйте провалится в глубину сайта в архиве - как правило пусто) сколько сохранение внешнего вида сайтов.

я же ставлю задачу сохранения информации целиком, без ориентировки на сохранение оформления.
те по сути близкие по духу проекты это http://bitsavers.informatik.uni-stuttgart.de/ , DECUS итд итп
причем последний, вообще не индексируется поисковиками тк их дурные антивирусные системы находят там опасные вирусы (!)
SokilOff
Member


Всего сообщений: 152
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
31 дек. 2012
SuperMax написал:
[q]
web.archive.org безусловно очень серьезный проект, но у них совсем другое направление и другая задача - это не сколько сохранение информации (попробуйте провалится в глубину сайта в архиве - как правило пусто) сколько сохранение внешнего вида сайтов
[/q]
archive.org - это намного больше, чем просто web.archive.org

В тамошних разделах shareware CD-ROMs и Community Software вагон и маленькая тележка ретро- и современного вареза. И как раз ретро - наша тема.
SuperMax
Advanced Member


Откуда: Красноярск
Всего сообщений: 326
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
27 авг. 2012
SokilOff написал:
[q]
archive.org - это намного больше, чем просто web.archive.org
В тамошних разделах shareware CD-ROMs и Community Software вагон и маленькая тележка ретро- и современного вареза. И как раз ретро - наша тема.
[/q]
согласен, там много чего есть. но вот по моим основным направлениям - DEC: VAX PDP-11 итд очень мало

вообще я хочу перевести разговор в другое русло - есть ли что интересное, что стоит добавить в мой архив ?
Takedasun
Advanced Member


Откуда: Керчь
Всего сообщений: 798
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
16 окт. 2013
Интересный сайт. Спасибо!!! :thumbup:
SuperMax
Advanced Member


Откуда: Красноярск
Всего сообщений: 326
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
27 авг. 2012
небольшой апдейт

1. прикрутил разбивку на страницы - теперь можно просмотреть все результаты поиска
2. поработал над оформлением - теперь в результатах поиска иконки типов файлов отображаются также как и в простом просмотре
3. в результатах поиска можно сразу перейти на директорию с найденным файлом - для удобства просмотра "а что еще есть?"
<<Назад  Вперед>> Страницы: 1 2 3 4 5 6
Печать
Полигон-2 »   Старый софт »   Aрхив софта для ретрокомпьютеров
RSS

1 посетитель просмотрел эту тему за последние 15 минут
В том числе: 1 гость, 0 скрытых пользователей

Последние RSS
[Москва] LIQUID-Акция. Сливаются разъемы CF
МС7004 и 7004А на AT и XT
Пайка термотрубок
Проммать s478 PEAK 715VL2-HT ( Full-Size SBC)
Подскажите по 386 материке по джамперам.

Самые активные 5 тем RSS