Объявление форума |
Если пользуетесь личными сообщениями и получили по электронной почте оповещение о новом письме, не отвечайте, пожалуйста, почтой. Зайдите на форум и ответьте отправителю через ЛС. |
Полигон-2 » IBM PC-совместимое. До 2000 года включительно » Pentium P54C тестовые регистры TR12 |
<<Назад Вперед>> | Страницы: 1 2 * 3 4 | Печать |
pahan
Advanced Member
Откуда: Химки, М.О. Всего сообщений: 1070 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 13 мар. 2015 |
Скорее всего, вы правы. Изначально (при старте процессора) кэш отключен. Но дальше он включается, кэширует какие-то данные, и к тому моменту, когда мы отключаем кэш из тестовой проги, в нём уже что-то есть. А вот дальше самое интересное - даже при отключенном кэше, в случае если нужные данные находятся в нём, они будут взяты из кэша, но в случае промаха кэш обновлён не будет. В случае записи - они могут быть обновлены только в кэше, но не в памяти. Мне кажется, даже при отключенном кэше, любой доступ к памяти начинается с cache lookup который естесвенно ничего не дает. см. Pentium® Processor Family Developer’s Manual 24142805.pdf таблица 2.1 Не так уж и сильно - в 2-2,5 раза. во первых, и память у пенька пошустрее А это вообще мало влияет. Ну протаскивает он за такт в 2 раза больше данных. Только программе (особенно досовской) из 32/64 бит при этом скорее всего надо было только 8 или 16. Остальные будут проигнорированы. Широкая шина как раз актуальна в основном чтобы загонять данные в кэш. во вторых, шина поширее |
BreakPoint |
NEW! Сообщение отправлено: 14 сентября 2016 16:32
pahan написал: Вот именно, то есть при прочих равных у нас получатеся какой то условный 386ДХ-66. А получился 25. Не так уж и сильно - в 2-2,5 раза. pahan написал: Это по сути потдверждает мою теорию. Т.е. не смотя на "отключенный кэш" проц все равно не имеет обходных путей для общения в внешним миром в обход кэша. в случае если нужные данные находятся в нём, они будут взяты из кэша, но в случае промаха кэш обновлён не будет Т.е. при любой ИО операции к памяти проц сначала проверяет есть ли эти данные/код в кэше, и (кто бы мог подумать) их там не находит. Естественно на лукап уходит как минимум 4 цикла (а то и больше). Т.е. кэш становится тормозом системы, а не ускорителем. Поэтому я и говорю, что проц без кэша и проц с отключенным кэшом это не одно и тоже. pahan написал: Тут тоже не все так просто, во первых от широкой шины выиграет префетчер (по крайней мере в теории). Во вторых FPU. А это вообще мало влияет. Ну протаскивает он за такт в 2 раза больше данных. |
Сейчас на форуме |
pahan
Advanced Member
Откуда: Химки, М.О. Всего сообщений: 1070 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 13 мар. 2015 |
Откуда цифра 4? Минимум 4 цикла - это как раз обращение к памяти уже после кэша. Естественно на лукап уходит как минимум 4 цикла (а то и больше). Да, в теории в 2 раза. В лучшем случае. Префетчер у классического пня - 2 буфера по 256 бит (т.е. в р-р строки опять же кэша). Одновременно работает только один, но он хотя бы будет качать вдвое быстрее. У MMX - 4 по 128 бит, что этот теоретический выигрыш убирает (качать 256 бит по 64 битной шине - тоже самое, что и 128 бит по 32битной). во первых от широкой шины выиграет префетчер (по крайней мере в теории) Тоже теория. FPU 1) не так уж часто и используется, а только там где он действительно нужен и 2) работает с 32, 64 или 80битными данными. Выигрыш дадут только два последних варианта. Во вторых FPU. |
BreakPoint |
NEW! Сообщение отправлено: 24 января 2017 15:14 Сообщение отредактировано: 24 января 2017 19:52
дошли руки немного поиграться с отключением кэша. получилась полная ерунда. под руками оказался Пень2 266 на 440LX. для начала написал на паскале простенький код, который заполняет память определенными значениями, а затем их читает. доступ к памяти осуществлялся двумя способами - последовательно. т.е. идеальный для кэша режим - и с чередованием в 128 байт. т.е. каждый последующий доступ должен с высокой долей вероятности вызвать промах кэша. естественно в первом случае программа работала в 4 раза быстрее, чем во втором. Затем отлючил оба кэша. И тут началось самое интересное. Во первых программа стала тупить не по детски. работать стало медленне раз в 50. Такое впечаление, что прерывание таймера не всегда отрабатывается. Хотя может у паскаля какие то свои тараканы по поводу таймера, но с другой стороны с кэшем же все нормально работает. UPD. С таймером это я тупанул |
Сейчас на форуме |
BreakPoint |
NEW! Сообщение отправлено: 24 января 2017 20:00 Сообщение отредактировано: 24 января 2017 20:38
Поставил конвингтон, чтоб Л2 кэш под ногами не путался. Получилось Включенный кэш: Последовательная запись: 0.17с Последовательное чтение: 0.16с Запись с форисрованным промахом кэша: 0.77с Чтение с форисрованным промахом кэша: 0.39с Выключенный кэш: Последовательная запись: 14.6с Последовательное чтение: 18.0с Запись с форисрованным промахом кэша: 15.2с Чтение с форисрованным промахом кэша: 17.9с Короче говоря, процу проще сделать кэш лукап+лайн филл чем с отключенным кэшем к памяти обращатся. Вот собственно и вопрос, откуда такой оверхед на отключенный кэш. |
Сейчас на форуме |
pahan
Advanced Member
Откуда: Химки, М.О. Всего сообщений: 1070 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 13 мар. 2015 |
Думаю, с этим всё просто - к моменту разработки этих процессоров никто и не предполагал возможность их эксплуатации без кэша. Собственно, ковингтон - короткоживущий маркетинговый ублюдок, выросший из стремления максимально удешевить процессор и быстро провалившийся. Да и вообще, почти все нововведения в P6 (как и в P54) просто бессмысленны без кэша. Вот собственно и вопрос, откуда такой оверхед на отключенный кэш. Но изначальный-то спор у нас был вообще-то про P54(С). Вот на нём бы посмотреть замеры. Интересней как раз было провести этот тест на 286-586х - посмотреть, насколько отстутствие кэша будет влиять на производительность в разных поколениях. |
BreakPoint |
NEW! Сообщение отправлено: 24 января 2017 21:07
"ублюдочность" конвингтона тут ни при чем. П2 тоже самое показывает. а вот для чистоты эксперимента самый лучший экземпляр благодаря отсутсвию л2 кэша. тут ключевой вопрос деградация производительности при отключении л1 кэша. возможно тут проблема с тем, как отключаение кэша реализовано. есть у меня идея что проц после каждой ИО инвилидейтит и флашит кэш. попробую вручную такое сделать. думаю, для любого проца отключение кэша является нештатным режимом. кстати, у меня где то мамка сокет3 есть, так в ней в биосе отключение л1 кэша отнесено к режиму "детурбо". |
Сейчас на форуме |
pahan
Advanced Member
Откуда: Химки, М.О. Всего сообщений: 1070 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 13 мар. 2015 |
Ага, он так обычно и реализовывался. кстати, у меня где то мамка сокет3 есть, так в ней в биосе отключение л1 кэша отнесено к режиму "детурбо". Э нет. думаю, для любого проца отключение кэша является нештатным режимом. Тут как раз интересно смотреть на самые древние и самые дешёвые. 286 и 386SX, когда на платах его просто могло не быть. 486 - особенно интересны поделия от Cyrix, когда для включения встроенного в процессор в кэша должна быть поддержка в биосе. 486-P5 - наши "любимые" платы с фейковым кэшем. Как вариант - платы без набортного L2 кэша и только с (пустым) разъёмом под COAST. |
Fasterpast
Advanced Member
Всего сообщений: 582 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 20 окт. 2013 |
Ну так это давно пошло, когда снижать частоту для эмуляции ХТ уже стало нереально, стали кнопкой турбо на 486 отключать кэш, которые без него работали как раз соответствующие (крайне тормознуто). |
Rio444
Гость
Откуда: Ростов-на-Дону Всего сообщений: 8632 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 14 сен. 2014 |
Fasterpast написал: Есть вполне себе брендовые 486-е с опциональным L2 кэшем "хрен найдешь". 486-P5 - наши "любимые" платы с фейковым кэшем. И не скажу, что производительность без кэша падает катастрофически. |
<<Назад Вперед>> | Страницы: 1 2 * 3 4 | Печать |
Полигон-2 » IBM PC-совместимое. До 2000 года включительно » Pentium P54C тестовые регистры TR12 |
1 посетитель просмотрел эту тему за последние 15 минут |
В том числе: 1 гость, 0 скрытых пользователей |
Последние | |
[Москва] LIQUID-Акция. Сливаются разъемы CF МС7004 и 7004А на AT и XT Пайка термотрубок Проммать s478 PEAK 715VL2-HT ( Full-Size SBC) Подскажите по 386 материке по джамперам. |
Самые активные 5 тем | |