DaoMail - путь письма
социальная почтовая служба (beta-версия)
весь DaoMail
вход / регистрация
Гость
ваша подписка (0
реклама
Зависимость производительности четырехъядерных Ivy Bridge от тактовой частоты и влияние на нее емкости кэш-памяти и количества потоков вычислений
| text | html

web-архив: по темам » Hi-Tech » ноутбуки » это письмо

2012-09-25 07:46:53

Как и было обещано в прошлый раз, сегодня у нас на повестке дня еще одно теоретическое исследование. Скорее всего, последнее для четырехъядерных Core, поскольку после него "белых пятен" в деталях функционирования этих процессоров в окружении реального программного обеспечения остаться не должно. Дело в том, что мы решили затронуть такой вопрос, как частота. Казалось бы, очень простой — очевидно, что производительность ей пропорциональна. Но достижимая на практике производительность не прямо пропорциональна, в чем мы уже убедились на примере бюджетных процессоров, поскольку на нее влияют и другие факторы — от аппаратного окружения до особенностей самих программ. А вот каким именно образом — мы сегодня и будем выяснять. Попутно убьем двух зайцев. Во-первых, разберемся с вопросом — зависит ли "кэшелюбивость" от частоты. Ну или, скорее, "частотолюбивость" от емкости кэш-памяти. Во-вторых, прикинем в цифрах — в какой степени более высокая частота может скомпенсировать отсутствие поддержки Hyper-Threading. Вопрос не праздный не только для оверклокеров — достаточно вспомнить про мобильные Core i7. Тоже восьмипоточные, да и максимальные тактовые частоты в их случае сравнимы с настольными моделями, но не всегда они достижимы из-за более жесткого теплопакета и относительно слабой системы охлаждения. А вот "канонических" Core i5 среди мобильных процессоров нет. Есть носящие такое название, но все они являются двухъядерными моделями, равно как и многие Core i7. В общем, единственный способ приобрести портативный компьютер с четырехъядерным процессором — выбирать что-нибудь на базе Core i7 линейки QM. А вот как их производительность может соотноситься с настольными i5 более высокой частоты — вопрос интересный. Поскольку, может быть, и не стоит пытаться купить быстрый ноутбук, а ограничиться компактным и "долгоиграющим" ультрабуком, собрав на сэкономленные деньги для ресурсоемких задач отдельный десктопчик :)

В общем, была бы информация, а как ее применить — найдется. Дело осталось за малым –получить. Желательно, максимально полную. Ну и точную — в обязательном порядке. Чем мы сегодня и займемся.

Конфигурация тестовых стендов

Процессор Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
"Базовая" модель Core i7-3770K Core i7-3770K Core i5-3470
Технология пр-ва 22 нм 22 нм 22 нм
Частота ядра, ГГц 2,4/3,2 2,4/3,2 2,4/3,2
Кол-во ядер/потоков вычисления 4/4 4/4 4/8
Кэш L1, I/D, КБ 32/32 32/32 32/32
Кэш L2, КБ 4x256 4x256 4x256
Кэш L3, МиБ 8 8 6
Частота UnCore, ГГц 2,4/3,2 2,4/3,2 2,4/3,2

Процессоры — те же Ivy Bridge, что и в прошлый раз: один Core i5 и один Core i7, тестировавшийся в двух режимах — с включенной и отключенной поддержкой технологии Hyper-Threading. Единственное изменение в условиях — мы протестировали их и на частоте 3,2 ГГц (точно также — жестко зафиксировав множитель и отключив технологии энергосбережения), которая является базовой для Core i5-3470. Но выбрана она была в первую очередь не поэтому, а потому, что ровно на треть выше, чем 2,4 ГГц, результаты для которой у нас уже есть. Т.е. в идеале прирост производительности должен составлять порядка 33%, а вот каким он будет на практике в зависимости от конфигурации процессора и конкретного программного обеспечения — мы и посмотрим.

  Системная плата Оперативная память
LGA1155 Biostar TH67XE (H67) Corsair Vengeance CMZ8GX3M2A1600C9B (2x1333; 9-9-9-24)

Тестирование

Традиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта (NVIDIA GeForce GTX 570 1280 МБ в исполнении Palit) являются стандартными для всех тестирований "основной линейки" и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в "натуральном" виде.

Интерактивная работа в трёхмерных пакетах

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
20,2% 19,2% 19,5%

Один балл разницы между 6 и 8 МиБ кэш-памяти можно считать действительно разницей, поскольку при увеличении частоты он превратился в два, а вот "приварок" от Hyper-Threading — простая флуктуация результатов и ошибки округления, поскольку наблюдается только в одном из режимов. Да так, в общем-то, и должно быть — уже не раз было сказано, что эти тесты хорошей поддержкой многопоточности не отличаются, так что и четырех "обычных" ядер им много. Рост же производительности с частотой фактически от режима не зависит и близок к линейному. Но быстродействие не прямо пропорционально частоте, что для нас не ново после тестирования бюджетных процессоров: есть еще и влияние видеокарты, а не только CPU.

Финальный рендеринг трёхмерных сцен

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
33,8% 33,3% 33,1%

Расчетный многопоточный тест: первое приводит к прямой пропорциональности скорости от частоты, а второе — дает огромную фору процессорам с поддержкой Hyper-Threading. Тем не менее, несложно заметить, что "нейтрализовать" ее отсутствие можно большей частотой. И, в общем-то, не так уж и сложно — разгон какого-нибудь Core i5-3570K (или, тем более, 2500К/2550К) на треть не является чем-то невозможным. С другой стороны, и их "старшие братья" работают на аналогичных частотах, а что происходит в этом случае с производительностью — хорошо видно.

Упаковка и распаковка

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
28,3% 27,5% 27,9%

Аккуратные линеечки и крайне близкая эффективность повышения тактовой частоты: да, упаковка силами 7-Zip многопоточная, да, емкость кэш-памяти важна всем тестам, но с точки зрения производительности это сдвиг, а не дополнительный коффициент :) Грубо говоря, независимо от частоты Core i5 это Core i5, а Core i7 — это Core i7. Меняем частоту — пропорционально меняются результаты.

Кодирование аудио

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
33% 33,3% 33,3%

Специфика данного теста такова, что увеличение частоты на треть, приводящее к такому же росту производительности, все равно способно лишь скомпенсировать отсутствие Hyper-Threading, поскольку эта технология еще более эффективна, чем лобовое повышение тактовой частоты. Но, конечно, большее число "настоящих" ядер еще более полезно. Зато и заметно дороже. Нам же в рамках сегодняшнего тестирования важнее всего то, что все три испытуемых реагируют на повышение частоты одинаковым образом.

Компиляция

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
28,2% 28,8% 27,9%

А здесь эффективность Hyper-Threading настолько высока, что ее частотой "перебить" вообще не удалось. Но, опять же, это сдвиг, а не масштабирование — разброс "привеса" укладывается в 1%.

Математические и инженерные расчёты

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
29,5% 28,9% 27,7%

Вот здесь минимум и максимум прироста различаются уже на 2% — с натяжкой этот случай можно считать примером того, что при увеличении частоты емкость кэш-памяти может оказаться сдерживающим фактором, поскольку "канонический" Core i5 стабильно проигрывает Core i7.

Растровая графика

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
31,8% 31,5% 31,8%

C Hyper-Threading чуть быстрее, чем без оной, но в целом производительность практически пропорциональна тактовой частоте, а прочие факторы — вообще рояля не играют. Вот в бюджетных моделях увеличение L3 с 2 до 3 МиБ хоть полтора процента, но прибавляет, а 6 МиБ — уже как минимум достаточно.

Векторная графика

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
32,3% 32,3% 31,5%

Производительность пропорциональная тактовой частоте. Можно, конечно, сказать, что при 6 МиБ коэффициент пропорциональности чуть хуже, но лучше не позориться — 1 балл разницы легко может получаться и из-за банального округления.

Кодирование видео

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
28,9% 29,1% 29,1%

Двухъядерным моделям Hyper-Threading в этой группе дает очень много, четырехъядерных — и без этой технологии всем программам хватает (а некоторые так и вовсе при ее активации замедляются) — в общем, опять имеем почти прямую пропорциональность тактовой частоте, причем без какого-либо влияения емкости кэш-памяти.

Офисное ПО

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
32,8% 32,6% 32,8%

Эти тесты в основной своей массе вообще однопоточные, но общее положение дел аналогично предыдущей группе. Да и не только ей.

Java

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
29,9% 31,2% 29,9%

Как мы уже не раз говорили, Java-машина оценивает Hyper-Threading примерно как половинку физического ядра, т.е. при прочих равных 4С/8T примерно эквивалентны "классическому" шестиядерному процессору. А вот тактовой частоте производительность почти прямо пропорциональна, т.е. более высокая частота способна с легкостью отсутствие НТ скомпенсировать. К кэш-памяти же этот тест слабовосприимчив, так что и на прирост производительности ее емкость практически не влияет. Точнее, разница между 1 и 1,5 МиБ на поток есть (что мы видели в младших моделях да и Core i7-3820 чуть быстрее, чем модели для LGA1155 в том числе и за счет 10, а не 8 МиБ L3), но небольшая, а вот между 1,5 и 2 МиБ ее нет вообще.

Игры

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
8,5% 8,5% 7,8%

Как видим, уже Core i5 с частотой 2,4 ГГц в паре с GTX 570 более чем достаточно для всех игр из методики, так что увеличение тактовой частоты процессора почти ничего не дает. Нет, конечно, прирост частоты кадров есть, но минимальный среди всех тестов и очень слабый — если вспомнить, что частота различается на треть. Поэтому, поскольку у нас все-таки теоретическое исследование, мы решили большее внимание уделить "низкокачественному" режиму — для таких систем он не интересен с практической точки зрения, зато различия между процессорами могут и появиться.

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
21,5% 21,2% 18,5%

Что мы видим? Проигрыш конфигурации с уменьшенной емкостью кэш-памяти таки повторился и даже увеличился, так что его можно считать подтвержденным на практике (в "стандартном" режиме все равно упирались именно в видеокарту, так что на основании разницы в 0,5% делать далеко идущие выводы было опасно). Ну а HT четырехъядерным процессорам все еще способна мешать во многих игровых движках, по чисто техническим причинам такое улучшение многопоточности неспособным утилизировать. Но вот то, что начиная со второго поколения Core i5 и Core i7 начали различаться в том числе и по емкости кэша, эти потенциальные неудобства полностью компенсирует — более дорогой процессор даже в таком окружении все равно быстрее более дешевого.

Многозадачное окружение

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
32,8% 31,5% 31,8%

И здесь какое-никакое положительное влияние увеличения емкости кэш-памяти в расчете на поток вычисления наблюдается, однако мы более склонны списать его, скорее, на погрешности измерения и прочие факторы, на деле чуть-чуть занизившие результаты Core i7 с отключенной НТ на низкой частоте — потому и прирост получился большим. Данная гипотеза лучше всего подтверждается тем, что она хорошо укладывается в общую картину. Ну и вторым важным моментом можно считать то, что и при разнородной многопоточной нагрузке увеличение производительности методом "грубой силы" остается вполне действенным механизмом. Т.е. восемь потоков — это хорошо. Но четыре быстрых — лучше, чем восемь медленных. Но при одинаковой архитектуре и близкой тактовой частоте "улучшайзеры" типа Hyper-Threading, бесспорно, очень актуальны, так что разница в позиционировании и ценах настольных Core i5 и i7 продолжает оставаться оправданной.

Итого

Ivy Bridge Ivy Bridge HT Ivy Bridge 6M
19,2% 20,2% 19,5%

Традиционная итоговая диаграмма говорит сама за себя — в среднем более высокая частота позволяет добиться более высокой производительности процессоров, нежели технологии увеличения многопоточности. Что неудивительно — НТ достаточна эффективна там, где действительно нужно много потоков вычисления, но вот таких мест в массовом ПО очень мало. Зато таких, где вообще пары потоков достаточно, масса, так что в конечном итоге мы "приплыли" и к близким оценкам эффективности этой технологии для двух- и четырехъядерных моделей: в районе 9,5% в среднем. Максимальные приросты, впрочем, и там, и там превышают 35%, что оправдывает разницу в цене настольных процессоров (неважно — какие именно семейства сравниваются: Core i5 против Core i7 или Pentium против Core i3), но только в тех случаях, когда есть уверенность, что двух или четырех (соответственно) потоков не хватит. В противном случае есть хороший стимул сэкономить. Пусть, заодно, потеряв и в емкости кэш-памяти третьего уровня — сегодня мы убедились в том, что независимо от тактовой частоты она лишь "сдвигает" производительность, но не изменяет ее пропорциональным образом.

Нагляднее всего это видно на таком вот графике, где мы собрали воедино проценты увеличения производительности во всех группах с ростом тактовой частотой. Линии не совпали, причем их расположение вроде бы свидетельствует о том, что 8 МиБ L3 завсегда лучше, независимо от того, используется Hyper-Threading или нет, но... Как нам кажется, разница вовсе не стоит тех 100 долларов, которые "просит" Intel. Вот разница между четырьмя и восемью потоками вычисления вполне может их стоить, но только тогда, когда второе будет реально использоваться программным обеспечением, а прибавка в кэше — просто дается "в нагрузку".

Что касается ноутбучных процессоров, то тут все еще печальнее. Или наоборот — смешнее: это уж как посмотреть. Просто потому, что таких, безусловно привлекательных для массового пользователя, процессоров, как четырехъядерные Core i5 в этом сегменте рынка просто нет. Есть двухъядерные Core i5 и Core i7 — различаются частотой и емкостью кэш-памяти. Есть четырехъядерные восьмипоточные Core i7 — различаются частотой и емкостью кэш-памяти. И, разумеется, ценой. Так что, как нам кажется, при таком раскладе доплата еще менее оправдана, хотя тут сложно выбирать напрямую — ноутбуки обычно продаются именно как ноутбуки, а не россыпь комплектующих. В результате может оказаться и так, что интересующей модели с процессором, имеющим меньшую емкость кэш-памяти, просто не окажется в магазине.

Впрочем, возможно, что как раз для мобильных Core i7-QM разница между 6 и 8 МиБ окажется заметной. Дело в том, что сравнивая Core i5 и i7 с отключенной НТ мы сравниваем на деле 1,5 и 2 МиБ на поток. Тут разница исчезающее мала, конечно, но вот в QM при включенной НТ будет либо 0,75, либо 1 МиБ на поток (для двухъядерных Core i5 и i7 это тоже верно). А наши тестирования Celeron G460 или Core i3 показали, что первого иногда может оказаться и маловато. Более того — из сравнения настольных Celeron и Pentium можно сделать вывод, что 1 МиБ на поток (или, по крайней мере, на ядро) тоже не всегда достаточно. Но ведь именно столько мы имеем в "дефолтной" конфигурации Core i7 для LGA1155! А можно ли получить больше? Вообще говоря, да. Но для этого нужно взять процессоры для LGA2011, где две модели (самый дешевый 3820 и топовый 3960Х) могут похвастаться максимальной "кэшевооруженностью" в 1,25 МиБ на поток. Таким образом, мы пока не исключаем возможность дальнейшего расширения и углубления данной линейки "теоретических тестирований" при наличии свободных временных ресурсов :)

Благодарим компании Corsair, Palit, "Ф-Центр" и "Юлмарт"

за помощь в комплектации тестовых стендов.

Источник



web-архив: по темам » Hi-Tech » ноутбуки » это письмо








© 2004-2024 DaoMail.ru