Практически всегда под любой публикацией, в которой так или иначе затрагивается тема производительности современных интеловских процессоров, рано или поздно появляется несколько сердитых читательских комментариев о том, что прогресс в развитии чипов у Intel давно забуксовал и нет смысла переходить со «старого доброго Core i7-2600K» на что-то новое. В таких репликах, скорее всего, будет раздражённо упоминаться про прирост производительности на неосязаемом уровне «не более пяти процентов в год»; про низкокачественный внутренний термоинтерфейс, который непоправимо испортил современные процессоры Intel; либо про то, что покупать в современных условиях процессоры с таким же, как и несколько лет назад, количеством вычислительных ядер вообще – удел недальновидных дилетантов, так как в них нет необходимого задела на будущее.

В том, что все такие реплики не лишены оснований, сомнений нет. Однако очень похоже, что они многократно преувеличивают имеющиеся проблемы. Лаборатория 3DNews подробно тестирует интеловские процессоры с 2000 года, и мы не можем согласиться с тезисом, что какому бы то ни было их развитию пришёл конец, а происходящее с микропроцессорным гигантом в течение последних лет иначе как стагнацией уже и не назовёшь. Да, какие-то кардинальные перемены с процессорами Intel происходят редко, но тем не менее они продолжают планомерно совершенствоваться. Поэтому те чипы серии Core i7, которые можно купить сегодня, заведомо лучше моделей, предлагавшихся несколько лет тому назад.

Поколение Core Кодовое имя Техпроцесс Этап разработки Время выхода 2 Sandy Bridge 32 нм Так (Архитектура) I кв. 2011 3 Ivy Bridge 22 нм Тик (Процесс) II кв. 2012 4 Haswell 22 нм Так (Архитектура) II кв. 2013 5 Broadwell 14 нм Тик (Процесс) II кв. 2015 6 Skylake 14 нм Так

(Архитектура) III кв. 2015 7 Kaby Lake 14+ нм Оптимизация I кв. 2017 8 Coffee Lake 14++ нм Оптимизация IV кв. 2017

Собственно, этот материал как раз и является контраргументом для рассуждений о никчёмности выбранной Intel стратегии постепенного развития потребительских CPU. Мы решили собрать в одном тесте старшие интеловские процессоры для массовых платформ за последние семь лет и посмотреть на практике, насколько представители серий Kaby Lake и Coffee Lake ушли вперёд относительно «эталонных» Sandy Bridge, которые за годы гипотетических сравнений и мысленных противопоставлений в представлении обывателей стали настоящей иконой процессоростроения.

⇡#Что поменялось в процессорах Intel c 2011 года по настоящее время

Отправной точкой в новейшей истории развития процессоров Intel принято считать микроархитектуру Sandy Bridge. И это неспроста. Несмотря на то, что первое поколение процессоров под маркой Core было выпущено в 2008 году на базе микроархитектуры Nehalem, почти все основные черты, которые присущи современным массовым CPU микропроцессорного гиганта, вошли в обиход не тогда, а парой лет позднее, когда распространение получило следующее поколение процессорного дизайна, Sandy Bridge.

Сейчас компания Intel приучила нас к откровенно неторопливому прогрессу в разработке микроархитектуры, когда нововведений стало очень мало и они почти не приводят к росту удельной производительности процессорных ядер. Но всего лишь семь лет назад ситуация была кардинально иной. В частности, переход от Nehalem к Sandy Bridge был ознаменован 15-20-процентным ростом показателя IPC (числа исполняемых за такт инструкций), что обуславливалось глубокой переделкой логической конструкции ядер с прицелом на повышение их эффективности.

В Sandy Bridge были заложены многие принципы, которые с тех пор не менялись и стали стандартными для большинства процессоров сегодняшнего дня. Например, именно там появился отдельный кеш нулевого уровня для декодированных микроопераций, а также стал применяться физический регистровый файл, снижающий энергозатраты при работе алгоритмов внеочередного выполнения инструкций.

Но, пожалуй, самым главным нововведением стало то, что Sandy Bridge был спроектирован как унифицированная система-на-чипе, рассчитанная одновременно на все классы применений: на серверные, десктопные и мобильные. Скорее всего, в прадедушки современных Coffee Lake общественное мнение поставило именно его, а не какой-нибудь Nehalem и уж тем более не Penryn, именно из-за этой особенности. Впрочем, и итоговая сумма всех переделок в глубинах микроархитектуры Sandy Bridge тоже оказалась весьма значительной. В конечном итоге этот дизайн утратил все старые родственные связи с P6 (Pentium Pro), которые то здесь, то там проявлялись во всех предшествующих процессорах Intel.

Говоря об общей структуре, нельзя также не вспомнить и о том, что в процессорный кристалл Sandy Bridge впервые в истории интеловских CPU было встроено полноценное графическое ядро. Этот блок отправился внутрь процессора вслед за контроллером DDR3-памяти, разделяемым L3-кешем и контроллером шины PCI Express. Для соединения вычислительных ядер и всех остальных «внеядерных» частей инженеры Intel внедрили в Sandy Bridge новую на тот момент масштабируемую кольцевую шину, применяемую для организации взаимодействия между структурными единицами в последующих массовых CPU и по сей день.

Если же опуститься на уровень микроархитектуры Sandy Bridge, то одной из ключевых её особенностей стала поддержка семейства SIMD-инструкций, AVX, предназначенных для работы с 256-битными векторами. К настоящему моменту такие инструкции прочно вошли в обиход и не кажутся чем-то необычным, но их реализация в Sandy Bridge потребовала расширения части вычислительных исполнительных устройств. Инженеры Intel стремились сделать работу с 256-битными данными такой же быстрой, как и с векторами меньшей разрядности. Поэтому вместе с реализацией полноценных 256-битных исполнительных устройств потребовалось и увеличение скорости работы процессора с памятью. Логические исполнительные устройства, предназначенные для загрузки и сохранения данных, в Sandy Bridge получили удвоенную производительность, кроме того, симметрично была увеличена пропускная способность кеш-памяти первого уровня при чтении.

Нельзя не упомянуть и о сделанных в Sandy Bridge кардинальных изменениях в работе блока предсказания ветвлений. Благодаря оптимизациям в применяемых алгоритмах и увеличению размеров буферов, архитектура Sandy Bridge позволила сократить процент неверных предсказаний переходов почти вдвое, что не только заметно сказалось на производительности, но и позволило дополнительно снизить энергопотребление этого дизайна.

В конечном итоге с сегодняшних позиций процессоры Sandy Bridge можно было бы назвать образцово-показательным воплощением фазы «так» в интеловском принципе «тик-так». Как и предшественники, данные процессоры продолжили базироваться на техпроцессе с 32-нм нормами, но предложенный ими рост производительности оказался более чем убедителен. И подпитывала его не только обновлённая микроархитектура, но и увеличенные на 10-15 процентов тактовые частоты, а также внедрение более агрессивной версии технологии Turbo Boost 2.0. Если учесть всё это, хорошо понятно, почему многие энтузиасты до сих пор вспоминают Sandy Bridge самыми тёплыми словами.

Старшим предложением в семействе Core i7 на момент выхода микроархитектуры Sandy Bridge стал Core i7-2600K. Этот процессор получил тактовую частоту на уровне 3,3 ГГц с возможностью авторазгона при неполной нагрузке до 3,8 ГГц. Впрочем, отличали 32-нм представителей Sandy Bridge не только сравнительно высокие для того времени тактовые частоты, но и хороший разгонный потенциал. Среди Core i7-2600K нередко можно было встретить экземпляры, способные работать на частотах 4,8-5,0 ГГц, что во многом обуславливалось применением в них качественного внутреннего термоинтерфейса – бесфлюсового припоя.

Через девять месяцев после выпуска Core i7-2600K, в октябре 2011 года, компания Intel обновила старшее предложение в модельном ряду и предложила немного ускоренную модель Core i7-2700K, номинальная частота которой была доведена до 3,5 ГГц, а максимальная частота в турборежиме – до 3,9 ГГц.

Впрочем, жизненный цикл Core i7-2700K оказался коротким – уже в апреле 2012 года на смену Sandy Bridge пришёл обновлённый дизайн Ivy Bridge. Ничего особенного: Ivy Bridge относился к фазе «тик», то есть представлял собой перевод старой микроархитектуры на новые полупроводниковые рельсы. И в этом отношении прогресс действительно был серьёзным – кристаллы Ivy Bridge производились по 22-нм технологическому процессу, основанному на трёхмерных FinFET-транзисторах, которые в то время только входили в употребление.

При этом старая микроархитектура Sandy Bridge на низком уровне осталась практически нетронута. Были выполнены лишь отдельные косметические переделки, которые ускорили выполнение в Ivy Bridge операций деления и немного повысили эффективность технологии Hyper-Threading. Правда, попутно были несколько улучшены «внеядерные» компоненты. Контроллер PCI Express получил совместимость с третьей версией протокола, а контроллер памяти увеличил свои возможности и стал поддерживать скоростную оверклокерскую DDR3-память. Но в итоге рост удельной производительности при переходе от Sandy Bridge к Ivy Bridge составил не более 3-5 процентов.

Не дал серьёзных причин для радости и новый технологический процесс. К сожалению, внедрение 22-нм норм не позволило как-то принципиально нарастить тактовые частоты Ivy Bridge. Старшая версия Core i7-3770K получила номинальную частоту 3,5 ГГц с возможностью разгона в турборежиме до 3,9 ГГц, то есть с точки зрения частотной формулы она оказалась ничуть не быстрее Core i7-2700K. Улучшилась лишь энергоэффективность, однако пользователей настольных компьютеров этот аспект традиционно волнует слабо.

Всё это, конечно, вполне можно списать на то, что на этапе «тик» никаких прорывов происходить и не должно, но кое в чём Ivy Bridge оказались даже хуже предшественников. Речь – о разгоне. При выводе на рынок носителей этого дизайна Intel приняла решение отказаться от использования при финальной сборке процессоров бесфлюсовой пайки галлиевым припоем теплораспределительной крышки к полупроводниковому кристаллу. Начиная с Ivy Bridge для организации внутреннего термоинтерфейса стала использоваться банальная термопаста, и это сразу же ударило по максимально достижимым частотам. По разгонному потенциалу Ivy Bridge определённо стали хуже, и в результате переход от Sandy Bridge к Ivy Bridge стал одним из самых спорных моментов в новейшей истории потребительских процессоров Intel.

Поэтому на следующий этап эволюции, Haswell, возлагались особенные надежды. В этом поколении, относящемся к фазе «так», должны были появиться серьёзные микроархитектурные улучшения, от которых ожидалась способность как минимум продвинуть вперёд забуксовавший было прогресс. И в какой-то степени это произошло. Появившиеся летом 2013 года процессоры Core четвёртого поколения действительно приобрели заметные улучшения во внутренней структуре.

Основное: теоретическая мощность исполнительных устройств Haswell, выражающаяся в количестве исполняемых за такт микроопераций, по сравнению с прошлыми CPU выросла на треть. В новой микроархитектуре не только был проведён ребаланс имеющихся исполнительных устройств, но и появилось два дополнительных исполнительных порта для целочисленных операций, обслуживания ветвлений и генерации адресов. Кроме того, микроархитектура получила совместимость с расширенным набором векторных 256-битных инструкций AVX2, которые благодаря трёхоперандным FMA-командам увеличили пиковую пропускную способность архитектуры вдвое.

В дополнение к этому инженеры Intel пересмотрели ёмкость внутренних буферов и, где это было необходимо, увеличили их. Выросло в размере окно планировщика. Кроме того, были увеличены целочисленный и вещественночисленный физические регистровые файлы, что улучшило возможности процессора по переупорядочиванию порядка исполнения инструкций. В дополнение ко всему этому, существенно изменилась и подсистема кеш-памяти. L1- и L2-кеши в Haswell получили вдвое более широкую шину.

Казалось бы, перечисленных улучшений должно быть достаточно для того, чтобы заметно поднять удельную производительность новой микроархитектуры. Но как бы не так. Проблема дизайна Haswell состояла в том, что он оставил без изменений входную часть исполнительного конвейера и декодер x86-команд сохранил ту же производительность, что и раньше. То есть максимальный темп декодирования x86-кода в микроинструкции остался на уровне 4-5 команд за такт. И в результате при сопоставлении Haswell и Ivy Bridge на одинаковой частоте и при нагрузке, не использующей новые AVX2-инструкции, выигрыш в производительности оказался всего лишь на уровне 5-10 процентов.

Имидж микроархитектуры Haswell подпортила и первая волна процессоров, выпущенная на её основе. Опираясь на всё тот же 22-нм техпроцесс, что и Ivy Bridge, новинки не смогли предложить высокие частоты. Например, старший Core i7-4770K вновь получил базовую частоту 3,5 ГГц и максимальную частоту в турборежиме на уровне 3,9 ГГц, то есть по сравнению с прошлыми поколениями Core никакого продвижения не наметилось.

В то же время с внедрением следующего технологического процесса с 14-нм нормами у Intel стали возникать разного рода трудности, поэтому через год, летом 2014 года, на рынок было выведено не следующее поколение процессоров Core, а вторая очередь Haswell, которая получила кодовые имена Haswell Refresh, или, если говорить о флагманских модификациях, то Devil’s Canyon. В рамках этого обновления Intel смогла заметно увеличить тактовые частоты 22-нм CPU, что действительно вдохнуло в них новую жизнь. В качестве примера можно привести новый старший процессор Core i7-4790K, который по номинальной частоте взял отметку в 4,0 ГГц и получил максимальную частоту с учётом турборежима на уровне 4,4 ГГц. Удивительно, что подобное полугигагерцевое ускорение было достигнуто без каких-либо реформ техпроцесса, а лишь за счёт простых косметических изменений в схеме питания процессоров и благодаря улучшению теплопроводящих свойств термопасты, используемой под крышкой CPU.

Впрочем, даже представители семейства Devil’s Canyon особенно жалуемыми в среде энтузиастов предложениями стать не смогли. На фоне результатов Sandy Bridge их разгон нельзя было назвать выдающимся, к тому же достижение высоких частот требовало сложного «скальпирования» – демонтажа процессорной крышки с последующей заменой штатного термоинтерфейса каким-либо материалом с лучшей теплопроводностью.

Из-за сложностей, которые преследовали Intel при переводе массового производства на 14-нм нормы, выступление следующего, пятого по счёту поколения процессоров Core, Broadwell, получилось сильно скомканным. Компания долго не могла решить, стоит ли вообще выпускать на рынок десктопные процессоры с этим дизайном, поскольку при попытках изготовления крупных полупроводниковых кристаллов уровень брака превышал приемлемые значения. В конечном итоге предназначенные для настольных компьютеров четырёхъядерники Broadwell всё-таки появились, но, во-первых, произошло это лишь летом 2015 года – с девятимесячным опозданием относительно изначально запланированного срока, а во-вторых, уже через два месяца после их анонса Intel представила дизайн следующего поколения, Skylake.

Тем не менее с точки зрения развития микроархитектуры Broadwell трудно назвать вторичной разработкой. И даже более того, в настольных процессорах этого поколения применялись такие решения, к которым ни до того, ни после того Intel никогда не прибегала. Уникальность десктопных Broadwell определялась тем, что в них проникло производительное интегрированное графическое ядро Iris Pro уровня GT3e. И это значит не только то, что процессоры этого семейства обладали самым мощным на тот момент встроенным видеоядром, но и также то, что они комплектовались дополнительным 22-нм кристаллом Crystall Well, представляющим собой основанную на eDRAM кеш-память четвёртого уровня.

Смысл добавления в процессор отдельного чипа быстрой встроенной памяти вполне очевиден и обусловлен потребностями производительного встроенного графического ядра в фрейм-буфере с низкой латентностью и высокой пропускной способностью. Однако установленная в Broadwell память eDRAM архитектурно была выполнена именно как виктимный кеш, и ей могли пользоваться и вычислительные ядра CPU. В результате десктопные Broadwell стали единственными в своём роде массовыми процессорами с 128 Мбайт L4-кеша. Правда, при этом несколько пострадал объём расположенного в процессорном кристалле L3-кеша, который был сокращён с 8 до 6 Мбайт.

Некоторые улучшения были заложены и в базовой микроархитектуре. Несмотря на то, что Broadwell относился к фазе «тик», переделки коснулись входной части исполнительного конвейера. Было увеличено окно планировщика внеочередного исполнения команд, в полтора раза вырос объём таблицы ассоциативной трансляции адресов второго уровня, а, кроме того, вся схема трансляции приобрела второй обработчик промахов, что позволило обрабатывать по две операции преобразования адресов параллельно. В сумме все нововведения повысили эффективность внеочередного исполнения команд и предсказания сложных ветвлений кода. Попутно были усовершенствованы механизмы выполнения операций умножения, которые в Broadwell стали обрабатываться в существенно более быстром темпе. По итогам всего этого Intel даже смогла утверждать, что улучшения микроархитектуры повысили удельную производительность Broadwell по сравнению с Haswell на величину порядка пяти процентов.

Но несмотря на всё это, ни о каком существенном преимуществе первых десктопных 14-нм процессоров вести речь было невозможно. И кеш четвёртого уровня, и микроархитектурные изменения лишь пытались скомпенсировать главный изъян Broadwell – низкие тактовые частоты. Из-за проблем с технологическим процессом базовая частота старшего представителя семейства, Core i7-5775C, была установлена лишь на уровне 3,3 ГГц, а частота в турборежиме не превышала 3,7 ГГц, что оказалось хуже характеристик Devil’s Canyon на целых 700 МГц.

Подобная же история произошла и с разгоном. Предельные частоты, до которых удавалось раскочегаривать десктопные Broadwell без использования продвинутых методов охлаждения, находились в районе 4,1-4,2 ГГц. Поэтому нет ничего удивительного, что потребители восприняли выпуск Broadwell скептически, и процессоры этого семейства так и остались странным нишевым решением для тех, кто был заинтересован в производительном встроенном графическом ядре. Первым же полноценным 14-нм чипом для настольных компьютеров, который смог привлечь к себе внимание широких слоёв пользователей, стал только следующий проект микропроцессорного гиганта – Skylake.

Производство Skylake, как и процессоров предыдущего поколения, выполнялось по 14-нм техпроцессу. Однако здесь Intel уже смогла добиться нормальных тактовых частот и разгона: старшая десктопная версия Skylake, Core i7-6700K, получила номинальную частоту 4,0 ГГц и авторазгон в рамках турборежима до 4,2 ГГц. Это чуть более низкие значения, если сравнивать с Devil’s Canyon, однако более новые процессоры оказались определённо быстрее предшественников. Дело в том, что Skylake – это «так» в интеловской номенклатуре, что означает существенные изменения в микроархитектуре.

И они действительно есть. Улучшений в дизайне Skylake на первый взгляд было сделано не так много, но все они носили прицельный характер и позволили устранить имевшиеся слабые места в микроархитектуре. Если коротко, то Skylake получили увеличенные внутренние буфера для более глубокого внеочередного исполнения инструкций и более высокую пропускную способность кеш-памяти. Усовершенствования затронули блок предсказания переходов и входную часть исполнительного конвейера. Также был увеличен темп исполнения инструкций деления, и перебалансированы механизмы исполнения операций сложения, умножения и FMA-инструкций. В довершение разработчики потрудились над повышением эффективности технологии Hyper-Threading. В сумме это позволило добиться примерно 10-процентного улучшения производительности на такт в сравнении с процессорами прошлых поколений.

В целом Skylake можно охарактеризовать как достаточно глубокую оптимизацию исходной архитектуры Core, с таким расчётом, чтобы в дизайне процессора не оставалось никаких узких мест. С одной стороны, за счёт увеличения мощности декодера (с 4 до 5 микроопераций за такт) и скорости работы кеша микроопераций (с 4 до 6 микроопераций за такт) существенно увеличился темп декодирования инструкций. А с другой – выросла эффективность обработки получающихся микроопераций, чему поспособствовало углубление алгоритмов внеочередного исполнения и перераспределение возможностей исполнительных портов вместе с серьёзной ревизией темпа исполнения целого ряда обычных, SSE и AVX-команд.

Например, Haswell и Broadwell имели по два порта для исполнения умножений и FMA-операций над вещественными числами, но только один порт предназначался для сложений, что плохо соответствовало реальному программному коду. В Skylake этот дисбаланс был устранён и сложения стали выполняться уже на двух портах. Кроме того, количество портов, способных работать с целочисленными векторными инструкциями, выросло с двух до трёх. В конечном итоге всё это привело к тому, что практически для любого типа операций в Skylake всегда есть несколько альтернативных портов. А это значит, что в микроархитектуре наконец были успешно устранены практически все возможные причины простоя конвейера.

Заметные изменения затронули и подсистему кеширования: пропускная способность кеш-памяти второго и третьего уровня была увеличена. Кроме того, сократилась ассоциативность кеша второго уровня, что в конечном счёте позволило улучшить его КПД и уменьшить штраф при обработке промахов.

Существенные перемены произошли и на более высоком уровне. Так, в Skylake вдвое выросла пропускная способность кольцевой шины, которая соединяет все процессорные блоки. Кроме того, в CPU этого поколения обосновался новый контроллер памяти, который получил совместимость с DDR4 SDRAM. А в дополнение к этому для соединения процессора с чипсетом стала применяться новая шина DMI 3.0 с увеличенной вдвое пропускной способностью, что дало возможность реализовать скоростные линии PCI Express 3.0 в том числе и через чипсет.

Впрочем, как и все предшествующие версии архитектуры Core, Skylake представлял собой ещё одну вариацию на тему изначального дизайна. А это значит, что и в шестом поколении микроархитектуры Core разработчики Intel продолжили придерживаться тактики поэтапного внедрения улучшений на каждом цикле разработки. В целом это – не слишком впечатляющий подход, который не позволяет увидеть какие-то значимые изменения в производительности сразу – при сравнении CPU из соседних поколений. Но зато при модернизации старых систем ощутимый прирост производительности заметить совсем несложно. Например, сама Intel охотно сравнивала Skylake с Ivy Bridge, демонстрируя при этом, что за три года быстродействие процессоров выросло более чем на 30 процентов.

И в действительности это был достаточно серьёзный прогресс, потому что потом всё стало значительно хуже. После Skylake какое бы то ни было улучшение удельной производительности процессорных ядер прекратилось совсем. Те процессоры, которые представлены на рынке в настоящее время, всё ещё продолжают использовать микроархитектурный дизайн Skylake, несмотря на то, что с момента его появления в десктопных процессорах прошло уже почти три года. Неожиданный простой случился из-за того, что Intel не смогла справиться со внедрением следующей версии полупроводникового процесса с 10-нм нормами. В результате весь принцип «тик-так» рассыпался, вынудив микропроцессорного гиганта как-то выкручиваться и заниматься многократным перевыпуском старых продуктов под новыми именами.

Процессоры поколения Kaby Lake, которые появились на рынке в самом начале 2017 года, стали первым и очень ярким примером попыток Intel продать клиентам тот же Skylake во второй раз. Близкие родственные связи между двумя поколениями процессоров особо и не скрывались. Intel честно говорила, что Kaby Lake – это уже не «тик» и не «так», а простая оптимизация предыдущего дизайна. При этом под словом «оптимизация» понимались некие улучшения в структуре 14-нм транзисторов, которые открывали возможность увеличения тактовых частот без изменения рамок теплового пакета. Для видоизменённого техпроцесса был даже придуман специальный термин «14+ нм». Благодаря этой производственной технологии старший массовый десктопный процессор Kaby Lake, получивший наименование Core i7-7700K, смог предложить пользователям номинальную частоту 4,2 ГГц и частоту турборежима 4,5 ГГц.

Таким образом, рост частот Kaby Lake по сравнению с оригинальным Skylake составил примерно 5 процентов, и этим всё и ограничивалось, что, честно говоря, ставило под сомнение правомерность отнесения Kaby Lake к следующему поколению Core. До этого момента каждое последующее поколение процессоров, не важно, относилось оно к фазе «тик» или «так», обеспечивало хоть какой-то прирост показателя IPC. Между тем в Kaby Lake никаких микроархитектурных улучшений не было вообще, поэтому эти процессоры логичнее было бы считать просто вторым степпингом Skylake.

Однако новая версия 14-нм техпроцесса всё же смогла кое в чём положительно проявить себя: разгонный потенциал Kaby Lake по сравнению с Skylake подрос примерно на 200-300 МГц, благодаря чему процессоры данной серии оказались достаточно тепло встречены энтузиастами. Правда, Intel продолжила использовать под процессорной крышкой вместо припоя термопасту, поэтому для полноценного разгона Kaby Lake необходимо было проводить скальпирование.

Не справилась Intel и с вводом в строй 10-нм технологии и к началу текущего года. Поэтому в конце прошлого года на рынок была выведена ещё одна разновидность процессоров, построенных на всё той же микроархитектуре Skylake, – Coffee Lake. Но говорить о Coffee Lake как о третьем обличье Skylake не совсем правильно. Прошлый год стал периодом кардинальной смены парадигмы на процессорном рынке. В «большую игру» вернулась AMD, которая смогла переломить устоявшиеся традиции и создать спрос на массовые процессоры с числом ядер более четырёх. Внезапно Intel оказалась в роли догоняющей, и выход Coffee Lake стал не столько попыткой заполнить паузу до долгожданного появления 10-нм процессоров Core, сколько реакцией на выход шести- и восьмиядерных процессоров AMD Ryzen.

В результате процессоры Coffee Lake получили важное структурное отличие от своих предшественников: число ядер в них было увеличено до шести штук, что с массовой платформой Intel произошло впервые. Однако при этом никаких изменений на уровне микроархитектуры вновь введено не было: Coffee Lake по сути – шестиядерный Skylake, собранный на основе точно таких же по внутреннему устройству вычислительных ядер, которые снабжены увеличенным до 12 Мбайт L3-кешем (по стандартному принципу 2 Мбайт на ядро) и объединены привычной кольцевой шиной.

Впрочем, несмотря на то, что мы так запросто позволяем себе говорить о Coffee Lake «ничего нового», утверждать о полном отсутствии каких-то перемен не совсем справедливо. Хотя в микроархитектуре вновь ничего не поменялось, специалистам Intel пришлось потратить немало усилий для того, чтобы шестиядерные процессоры смогли вписаться в стандартную десктопную платформу. И результат вышел достаточно убедительным: шестиядерные процессоры остались верны привычному тепловому пакету и, более того, совсем не замедлились по тактовым частотам.

В частности, старший представитель поколения Coffee Lake, Core i7-8700K, получил базовую частоту 3,7 ГГц, а в турборежиме он может разгоняться до 4,7 ГГц. При этом оверклокерский потенциал Coffee Lake, несмотря на его более массивный полупроводниковый кристалл, оказался даже лучше, чем у всех предшественников. Core i7-8700K нередко выводятся их рядовыми владельцами на пятигигагерцевый рубеж, причём такой разгон бывает реален даже без скальпирования и замены внутреннего термоинтерфейса. И это значит, что Coffee Lake хоть и экстенсивный, но существенный шаг вперёд.

Всё это стало возможным исключительно благодаря очередному усовершенствованию 14-нм технологического процесса. На четвёртый год его использования для массового производства десктопных чипов Intel удалось добиться действительно впечатляющих результатов. Внедрённая третья версия 14-нм норм («14++ нм» в обозначениях производителя) и перекомпоновка полупроводникового кристалла позволили существенно улучшить производительность в пересчёте на каждый затраченный ватт и поднять суммарную вычислительную мощность. Внедрением шестиядерности Intel, пожалуй, смогла совершить даже более значительный шаг вперёд, чем любым из предшествующих тому улучшений микроархитектуры. И сегодня Coffee Lake смотрится весьма соблазнительным вариантом для модернизации старых систем, основанных на предыдущих носителях микроархитектуры Core.

Кодовое имя Техпроцесс Число ядер GPU L3-кеш, Мбайт Число транзисторов, млрд Площадь кристалла, мм2 Sandy Bridge 32 нм 4 GT2 8 1,16 216 Ivy Bridge 22 нм 4 GT2 8 1,2 160 Haswell 22 нм 4 GT2 8 1,4 177 Broadwell 14 нм 4 GT3e 6 Н/д ~145 + 77 (eDRAM) Skylake 14 нм 4 GT2 8 Н/д 122 Kaby Lake 14+ нм 4 GT2 8 Н/д 126 Coffee Lake 14++ нм 6 GT2 12 Н/д 150

⇡#Процессоры и платформы: спецификации

Для проведения сравнения семи последних поколений Core i7 мы взяли старших представителей в соответствующих сериях – по одному от каждого дизайна. Основные характеристики этих процессоров приведены в следующей таблице.

Core i7-2700K Core i7-3770K Core i7-4790K Core i7-5775C Core i7-6700K Core i7-7700K Core i7-8700K Кодовое имя Sandy Bridge Ivy Bridge Haswell (Devil’s Canyon) Broadwell Skylake Kaby Lake Coffee Lake Технология производства, нм 32 22 22 14 14 14+ 14++ Дата выхода 23.10.2011 29.04.2012 2.06.2014 2.06.2015 5.08.2015 3.01.2017 5.10.2017 Ядра/потоки 4/8 4/8 4/8 4/8 4/8 4/8 6/12 Базовая частота, ГГц 3,5 3,5 4,0 3,3 4,0 4,2 3,7 Частота Turbo Boost, ГГц 3,9 3,9 4,4 3,7 4,2 4,5 4,7 L3-кеш, Мбайт 8 8 8 6 (+128 Мбайт eDRAM) 8 8 12 Поддержка памяти DDR3-1333 DDR3-1600 DDR3-1600 DDR3L-1600 DDR4-2133 DDR4-2400 DDR4-2666 Расширения набора инструкций AVX AVX AVX2 AVX2 AVX2 AVX2 AVX2 Интегрированная графика HD 3000 (12 EU) HD 4000 (16 EU) HD 4600 (20 EU) Iris Pro 6200 (48 EU) HD 530 (24 EU) HD 630 (24 EU) UHD 630 (24 EU) Макс. частота графического ядра, ГГц 1,35 1,15 1,25 1,15 1,15 1,15 1,2 Версия PCI Express 2.0 3.0 3.0 3.0 3.0 3.0 3.0 Линии PCI Express 16 16 16 16 16 16 16 TDP, Вт 95 77 88 65 91 91 95 Сокет LGA1155 LGA1155 LGA1150 LGA1150 LGA1151 LGA1151 LGA1151v2 Официальная цена $332 $332 $339 $366 $339 $339 $359

Любопытно, что за прошедшие с момента выпуска Sandy Bridge семь лет Intel так и не смогла заметно нарастить тактовые частоты. Несмотря на то, что дважды менялся технологический производственный процесс и дважды серьезно оптимизировалась микроархитектура, сегодняшние Core i7 почти не продвинулись вперёд по своей рабочей частоте. Новейший Core i7-8700K имеет номинальную частоту 3,7 ГГц, что всего лишь на 6 процентов выше частоты вышедшего в 2011 году Core i7-2700K.

Впрочем, такое сравнение не совсем корректно, ведь Coffee Lake имеет в полтора раза больше вычислительных ядер. Если же ориентироваться на четырёхъядерный Core i7-7700K, то рост частоты выглядит всё-таки убедительнее: этот процессор ускорился относительно 32-нм Core i7-2700K на достаточно весомые 20 процентов в мегагерцевом выражении. Хотя всё равно вряд ли это можно назвать впечатляющим приростом: в абсолютных величинах это конвертируется в прибавку по 100 МГц в год.

Нет никаких прорывов и в других формальных характеристиках. Intel продолжает снабжать все свои процессоры индивидуальной кеш-памятью второго уровня объёмом 256 Кбайт на ядро, а также общим на все ядра L3-кешем, размер которого определяется из расчёта 2 Мбайт на ядро. Иными словами, главный фактор, по которому произошёл самый большой прогресс, – это число вычислительных ядер. Развитие Core начиналось с четырёхъядерных CPU, а пришло к шестиядерным. Причём очевидно, что это ещё не конец и в ближайшей перспективе мы увидим и восьмиядерные варианты Coffee Lake (либо Whiskey Lake).

Впрочем, как нетрудно заметить, за семь лет у Intel почти не менялась и ценовая политика. Даже шестиядерный Coffee Lake по сравнению с предшествующими четырёхъядерными флагманами подорожал всего лишь на шесть процентов. Все же остальные старшие процессоры класса Core i7 для массовой платформы всегда обходились потребителям в сумму порядка $330-340.

Любопытно, что самые крупные перемены произошли даже не с самими процессорами, а с поддержкой ими оперативной памяти. Пропускная способность двухканальной SDRAM с момента выхода Sandy Bridge и до сегодняшнего дня выросла вдвое: с 21,3 до 41,6 Гбайт/с. И это – ещё одно немаловажное обстоятельство, определяющее преимущество современных систем, совместимых со скоростной DDR4-памятью.

Да и вообще, все эти годы вместе с процессорами эволюционировала и вся остальная платформа. Если вести речь о главных вехах в развитии платформы, то, помимо роста скорости совместимой памяти, отметить хочется и появление поддержки графического интерфейса PCI Express 3.0. Кажется, что скоростная память и быстрая графическая шина наряду с прогрессом в частотах и архитектурах процессоров выступают весомыми причинами того, что современные системы стали лучше и быстрее прошлых. Поддержка DDR4 SDRAM появилась в Skylake, а перевод процессорной шины PCI Express на третью версию протокола произошёл ещё в Ivy Bridge.

Кроме того, заметное развитие получили и сопутствующие процессорам наборы системной логики. Действительно, сегодняшние интеловские чипсеты трёхсотой серии могут предложить гораздо более интересные возможности в сравнении с Intel Z68 и Z77, которые использовались в LGA1155-материнских платах под процессоры поколения Sandy Bridge. В этом нетрудно убедиться по следующей таблице, в которой мы свели воедино характеристики флагманских интеловских чиспсетов для массовой платформы.

P67/Z68 Z77 Z87 Z97 Z170 Z270 Z370 Совместимость с CPU Sandy Bridge

Ivy Bridge Haswell Haswell

Broadwell Skylake

Kaby Lake Coffee Lake Интерфейс DMI 2.0 (2 Гбайт/с) DMI 3.0 (3,93 Гбайт/с) Стандарт PCI Express 2.0 3.0 Линии PCI Express 8 20 24 Поддержка PCIe M.2 Нет

Есть Есть, до 3 устройств Поддержка PCI Есть Нет SATA 6 Гбит/с 2 6 SATA 3 Гбит/с 4 0 USB 3.1 Gen2 0 USB 3.0 0 4 6 10 USB 2.0 14 10 8 4

В современных наборах логики существенно развились возможности для подключения высокоскоростных носителей информации. Самое главное: благодаря переходу чипсетов на шину PCI Express 3.0 сегодня в производительных сборках можно использовать быстродействующие NVMe-накопители, которые даже по сравнению с SATA SSD могут предложить заметно лучшую отзывчивость и более высокую скорость чтения и записи. И одно только это может стать веским аргументом в пользу модернизации.

Кроме того, современные наборы системной логики предоставляют гораздо более богатые возможности для подключения дополнительных устройств. И речь не только о существенном увеличении числа линий PCI Express, что обеспечивает наличие на платах нескольких дополнительных слотов PCIe, заменяющих обычные PCI. Попутно в сегодняшних чипсетах имеется также и врождённая поддержка портов USB 3.0, а многие современные материнские платы снабжаются и портами USB 3.1 Gen2.

⇡#Описание тестовых систем и методики тестирования

Для того чтобы протестировать семь принципиально разных процессоров Intel Core i7, выпущенных за последние семь лет, нам потребовалось собрать четыре платформы с процессорными разъёмами LGA1155, LGA1150, LGA1151 и LGA1151v2. Набор комплектующих, который оказался необходим для этого, описывается следующим перечнем:

Процессоры: Intel Core i7-8700K (Coffee Lake, 6 ядер + HT, 3,7-4,7 ГГц, 12 Мбайт L3); Intel Core i7-7700K (Kaby Lake, 4 ядра + HT, 4,2-4,5 ГГц, 8 Мбайт L3); Intel Core i7-6700K (Skylake, 4 ядра, 4,0-4,2 ГГц, 8 Мбайт L3); Intel Core i7-5775C (Broadwell, 4 ядра, 3,3-3,7 ГГц, 6 Мбайт L3, 128 Мбайт L4); Intel Core i7-4790K (Haswell Refresh, 4 ядра + HT, 4,0-4,4 ГГц, 8 Мбайт L3); Intel Core i7-3770K (Ivy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 8 Мбайт L3); Intel Core i7-2700K (Sandy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 8 Мбайт L3). Процессорный кулер: Noctua NH-U14S.

Материнские платы: ASUS ROG Maximus X Hero (LGA1151v2, Intel Z370); ASUS ROG Maximus IX Hero (LGA1151, Intel Z270); ASUS Z97-Pro (LGA1150, Intel Z97); ASUS P8Z77-V Deluxe (LGA1155, Intel Z77).

Память: 2 × 8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill TridentX F3-2133C9D-16GTX); 2 × 8 Гбайт DDR4-3200 SDRAM, 16-16-16-36 (G.Skill Trident Z RGB F4-3200C16D-16GTZR). Видеокарта: NVIDIA Titan X (GP102, 12 Гбайт/384-бит GDDR5X, 1417-1531/10000 МГц). Дисковая подсистема: Samsung 860 PRO 1TB (MZ-76P1T0BW). Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).



Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise (v1709) Build 16299 с использованием следующего комплекта драйверов:

Intel Chipset Driver 10.1.1.45;

Intel Management Engine Interface Driver 11.7.0.1017;

NVIDIA GeForce 391.35 Driver.

Описание использовавшихся для измерения вычислительной производительности инструментов:

Комплексные бенчмарки:

Futuremark PCMark 10 Professional Edition 1.0.1275 – тестирование в сценариях Essentials (обычная работа среднестатистического пользователя: запуск приложений, сёрфинг в интернете, видеоконференции), Productivity (офисная работа с текстовым редактором и электронными таблицами), Digital Content Creation (создание цифрового контента: редактирование фотографий, нелинейный видеомонтаж, рендеринг и визуализация 3D-моделей). Аппаратное ускорение OpenCL в тестировании было отключено.

Futuremark 3DMark Professional Edition 2.4.4264 — тестирование в сцене Time Spy Extreme 1.0.

Приложения:

Adobe Photoshop CC 2018 — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.

Adobe Photoshop Lightroom Classic СС 7.1 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 16-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T1.

Adobe Premiere Pro CC 2018 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.

Blender 2.79b – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели из Blender Cycles Benchmark rev4.

Corona 1.3 – тестирование скорости рендеринга при помощи одноимённого рендерера. Измеряется скорость построения стандартной сцены BTR, используемой для измерения производительности.

Google Chrome 65.0.3325.181 (64-bit) – тестирование производительности при работе интернет-приложений, построенных с использованием современных технологий. Применяется специализированный тест WebXPRT 3, реализующий на HTML5 и JavaScript реально использующиеся в интернет-приложениях алгоритмы.

Microsoft Visual Studio 2017 (15.1) – измерение времени компиляции крупного MSVC-проекта – профессионального пакета для создания трёхмерной графики Blender версии 2.79b.

Stockfish 9 – тестирование скорости работы популярного шахматного движка. Измеряется скорость перебора вариантов в позиции «1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w»;

V-Ray 3.57.01 – тестирование производительности работы популярной системы рендеринга при помощи стандартного приложения V-Ray Benchmark;

VeraCrypt 1.22.9 – тестирование криптографической производительности. Используется встроенный в программу бенчмарк, задействующий тройное шифрование Kuznyechik-Serpent-Camellia.

WinRAR 5.50 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. Используется максимальная степень компрессии.

x264 r2851 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 1080p@50FPS AVC-видеофайл, имеющий битрейт около 30 Мбит/с.

x265 2.4+14 8bpp — тестирование скорости транскодирования видео в перспективный формат H.265/HEVC. Для оценки производительности используется тот же видеофайл, что и в тесте скорости транскодирования кодером x264.

Игры:

Ashes of Singularity. Разрешение 1920 × 1080: DirectX 11, Quality Profile = High, MSAA=2x. Разрешение 3840 × 2160: DirectX 11, Quality Profile = Extreme, MSAA=Off.

Assassin’s Creed: Origins. Разрешение 1920 × 1080: Graphics Quality = Very High. Разрешение 3840 × 2160: Graphics Quality = Very High.

Battlefield 1. Разрешение 1920 × 1080: DirectX 11, Graphics Quality = Ultra. Разрешение 3840 × 2160: DirectX 11, Graphics Quality = Ultra.

Civilization VI. Разрешение 1920 × 1080: DirectX 11, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra. Разрешение 3840 × 2160: DirectX 11, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra.

Far Cry 5. Разрешение 1920 × 1080: Graphics Quality = Ultra, Anti-Aliasing = TAA, Motion Blur = On. Разрешение 3840 × 2160: Graphics Quality = Ultra, Anti-Aliasing = TAA, Motion Blur = On.

Grand Theft Auto V. Разрешение 1920 × 1080: DirectX Version = DirectX 11, FXAA = Off, MSAA = x4, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = x4, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum. Разрешение 3840 × 2160: DirectX Version = DirectX 11, FXAA = Off, MSAA = Off, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = x4, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum.

The Witcher 3: Wild Hunt. Разрешение 1920 × 1080, Graphics Preset = Ultra, Postprocessing Preset = High. Разрешение 3840 × 2160, Graphics Preset = Ultra, Postprocessing Preset = High.

Total War: Warhammer II. Разрешение 1920 × 1080: DirectX 12, Quality = Ultra. Разрешение 3840 × 2160: DirectX 12, Quality = Ultra.

Watch Dogs 2. Разрешение 1920 × 1080: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%. Разрешение 3840 × 2160: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%.

Во всех игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений fps. Использование 0,01-квантиля вместо показателей минимального fps обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.

⇡#Производительность в комплексных бенчмарках

Комплексный тест PCMark 8 показывает средневзвешенную производительность систем при работе в типичных общеупотребительных приложениях разного рода. И он хорошо иллюстрирует тот прогресс, который претерпевали интеловские процессоры на каждом этапе смены дизайна. Если говорить о базовом сценарии Essentials, то тут действительно средний прирост скорости на каждом поколении не превышает пресловутых 5 процентов. Однако выделяется на общем фоне Core i7-4790K, который благодаря усовершенствованиям в микроархитектуре и росту тактовых частот смог обеспечить неплохой рывок в производительности, выходящий за среднестатистический уровень. Этот рывок виден и в сценарии Productivity, по результатам которого быстродействие Core i7-4790K сравнимо с производительностью старших процессоров в семействах Skylake, Kaby Lake и Coffee Lake.

Третий же сценарий, Digital Content Creation, объединяющий ресурсоёмкие творческие задачи, выдаёт совсем иную картину. Тут свежий Core i7-8700K может похвастать 80-процентным преимуществом перед Core i7-2700K, что можно расценить как более чем достойный результат семилетней эволюции микроархитектуры. Конечно, существенная часть этого преимущества объясняется увеличением числа вычислительных ядер, но даже если сравнивать между собой показатели четырёхъядерных Core i7-2700K и Core i7-7700K, то и в этом случае прирост скорости достигает солидной величины в 53 процента.

Ещё сильнее выпячивает преимущества новых процессоров синтетический игровой тест 3DMark. Мы пользуемся сценарием Time Spy Extreme, который имеет усиленные оптимизации под многоядерные архитектуры, и в нём итоговый рейтинг Core i7-8700K оказывается почти втрое выше, чем у Core i7-2700K. Но двукратное преимущество перед Sandy Bridge показывает и представитель поколения Kaby Lake, который, как и все предшественники, располагает четырьмя вычислительными ядрами.

Любопытно, что самым успешным усовершенствованием изначальной микроархитектуры, если судить по результатам, следует считать переход от Ivy Bridge к Haswell – на этом этапе, по данным 3D Mark, производительность выросла на 34 процента. Впрочем, Coffee Lake, безусловно, тоже есть чем похвастать, однако интеловские процессоры образца 2017-2018 года имеют точно такую же микроархитектуру, как и Skylake, а выделяются исключительно за счёт экстенсивного усиления – роста числа ядер.

⇡#Производительность в ресурсоёмких приложениях

В целом производительность в приложениях за последние семь лет эволюции процессоров Intel выросла заметно. И речь тут идёт совсем не о пяти процентах в год, о которых принято шутить в рядах интелоненавистников. Сегодняшние Core i7 превосходят своих предшественников из 2011 года более чем в два раза. Конечно, большую роль тут сыграл переход на шестиядерность, однако немалый вклад внесли и микроархитектурные улучшения, и рост тактовой частоты. Самым результативным дизайном в этом плане оказался Haswell. В нём существенно поднялась частота, а также появилась поддержка AVX2-инструкций, которая постепенно укрепились в приложениях для работы с мультимедийным контентом и в задачах рендеринга.

Стоит отметить, что в ряде случаев модернизация процессоров в системах, на которых решаются профессиональные задачи, может дать поистине прорывное улучшение скорости работы. В частности, троекратное увеличение быстродействия при переходе от Sandy Bridge к Coffee Lake можно получить при перекодировании видео современными кодерами, а также при финальном рендеринге посредством V-Ray. Неплохой прирост отмечается и при нелинейном видеомонтаже в Adobe Premiere Pro. Впрочем, даже если ваша сфера деятельности не связана напрямую с решением таких задач, в любом из проверенных нами приложений прирост составил как минимум 50 процентов.

Рендеринг:

Обработка фото:

Обработка видео:

Перекодирование видео:

Компиляция:

Архивация:

Шифрование:

Шахматы:

Интернет-сёрфинг:

Для того чтобы нагляднее представить, как менялась мощность интеловских процессоров при смене последних семи поколений микроархитектуры, мы составили специальную таблицу. В ней приведены процентные величины усреднённого прироста производительности в ресурсоёмких приложениях, получаемые при смене одного флагманского процессора серии Core i7 на другой.

Нетрудно заметить, что Coffee Lake оказался наиболее значительным обновлением дизайна массовых процессоров Intel. Полуторакратное увеличение числа ядер придаёт быстродействию существенный импульс, благодаря которому при переходе на Core i7-8700K даже с процессоров недавних поколений можно получить очень заметное ускорение. Сравнимый рост производительности в период с 2011 года у Intel случался ещё лишь однажды – при вводе процессорного дизайна Haswell (в усовершенствованном виде Devil’s Canyon). Тогда он был обусловлен серьёзными изменениями в микроархитектуре, которые были проведены одновременно с заметным увеличением тактовой частоты.

⇡#Производительность в играх

То, что производительность интеловских процессоров планомерно увеличивается, хорошо видят пользователи ресурсоёмких приложений. Однако среди игроков бытует иное мнение. Ещё бы, игры, даже самые современные, не пользуются наборами векторных инструкций, плохо оптимизируются под многопоточность, да и вообще масштабируют свою производительность гораздо более сдержанными темпами из-за того, что кроме вычислительных ресурсов нуждаются ещё и в графических. Так есть ли смысл обновлять процессоры тем, кто использует компьютеры преимущественно для игр?

Попробуем ответить и на этот вопрос. Для начала приведем результаты тестов в разрешении FullHD, где процессорозависимость проявляется сильнее, поскольку графическая карта не является серьёзным ограничением для показателя fps и даёт процессорам продемонстрировать, на что они способны, более явно.

Ситуация в разных играх похожая, поэтому давайте посмотрим на усреднённые относительные показатели игровой производительности в FullHD. Они приведены в следующей таблице, где показан прирост, получаемый при смене одного флагманского процессора серии Core i7 на другой.

Действительно, игровая производительность при выходе новых поколений процессоров масштабируется гораздо слабее, чем в приложениях. Если там можно было говорить о том, что за последние семь лет интеловские процессоры ускорились примерно вдвое, то с точки зрения игровых приложений Core i7-8700K всего лишь на 36 процентов быстрее, чем Sandy Bridge. А если сравнивать новейший Core i7 с каким-нибудь Haswell, то преимущество Core i7-8700K окажется всего лишь на уровне 11 процентов, несмотря на полуторакратное увеличение числа вычислительных ядер. Думается, игроки, не желающие обновлять свои LGA1155-системы, в чём-то правы. Такого прироста, как творческие работники – создатели контента, они не получат даже и близко.

Если же завести речь о разрешении 4K, где фокус нагрузки переносится на графический ускоритель, то осмысленность модернизации процессора кажется ещё более сомнительной. Фактически даже Core i7-2700K хватает для того, чтобы полностью раскрыть потенциал существующих в настоящее время флагманских графических ускорителей.

Различие в результатах совсем слабое, суммарно ситуация выглядит следующим образом.

Получается, что 4K-игрокам – владельцам процессоров Core i7-4790K и более поздних – волноваться сейчас вообще не о чем. Пока на рынок не придёт новое поколение графических ускорителей, при игровой нагрузке в сверхвысоких разрешениях узким местом такие CPU не окажутся, а производительность полностью упирается в видеокарту. Апгрейд процессора может иметь смысл разве только для систем, оборудованных ретропроцессорами Sandy Bridge или Ivy Bridge, но даже и в этом случае прирост частоты кадров не превысит 6-9 процентов.

Тесты производительности было бы любопытно дополнить и результатами измерения энергопотребления. За прошедшие семь лет Intel дважды меняла технологические нормы и шесть раз – заявленные рамки теплового пакета. Кроме того, процессоры Haswell и Broadwell в отличие от остальных использовали принципиально иную схему питания и снабжались интегрированным преобразователем напряжения. Всё это, естественно, так или иначе влияло на реальное потребление.

Используемый нами в тестовой системе цифровой блок питания Corsair RM850i позволяет контролировать потребляемую и выдаваемую электрическую мощность, чем мы и пользуемся для измерений. На графике ниже приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.

В состоянии простоя ситуация принципиально поменялась с вводом в строй дизайна Broadwell, когда Intel перешла на использование 14-нм техпроцесса и внедрила в обращение более глубокие энергосберегающие режимы.

При рендеринге выясняется, что увеличение числа вычислительных ядер в Coffee Lake заметно повлияло на его энергопотребление. Этот процессор стал существенно прожорливее своих предшественников. Самыми же экономичными представителями серии Core i7 стали носители микроархитектур Broadwell и Ivy Bridge, что вполне согласуется с теми характеристиками TDP, которые для них декларирует Intel.

Интересно, что при максимально высоких нагрузках потребление Core i7-8700K похоже на потребление процессора Devil’s Canyon и уже не кажется таким запредельным. Но в целом энергетические аппетиты процессоров Core i7 разных поколений различаются очень заметно, причём более современные модели CPU не всегда становятся экономичней предшественников. Большой шаг в улучшении характеристик потребления и тепловыделения был сделан в поколении Ivy Bridge, кроме того, неплох в этом отношении и Kaby Lake. Однако сейчас, похоже, улучшение энергоэффективности флагманских десктопных процессоров перестало быть для Intel важной задачей.

⇡#Дополнение: производительность на одинаковой тактовой частоте

Сравнительное тестирование массовых процессоров Core i7 разных поколений может быть интересно и в том случае, если все участники приведены к единой тактовой частоте. Нередко производительность более новых представителей оказывается выше за счёт того, что Intel увеличивает в них тактовые частоты. Тесты же на одинаковой частоте позволяют вычленить из общего результата экстенсивную частотную составляющую, зависящую от микроархитектуры лишь косвенно, и сосредоточиться на вопросах «интенсификации».

Производительность, измеренная безотносительно к тактовым частотам, может интересовать и энтузиастов, которые эксплуатируют CPU за пределами номинальных режимов, на частотах, сильно отличающихся от штатных значений. Руководствуясь этими соображениями, мы решили добавить в практическое сравнение дополнительную дисциплину – тесты всех процессоров на одинаковой частоте 4,5 ГГц. Данное значение частоты была выбрано исходя из того, что разогнать до неё нетрудно почти любой из интеловских процессоров последних лет выпуска. Исключить из такого сравнения пришлось лишь представителя поколения Broadwell, поскольку оверклокерский потенциал Core i7-5775C крайне ограничен и о взятии им частоты 4,5 ГГц можно и не мечтать. Остальные шесть процессоров прошли ещё один цикл тестирования.

Результаты, полученные в комплексных тестах:

Результаты тестов в ресурсоёмких приложениях:

Даже если не принимать в рассмотрение тактовую частоту как фактор, за счёт которого интеловские процессоры прибавляют в скорости, улучшение производительности более новых чипов всё равно отлично прослеживается. Усреднённое преимущество Coffee Lake перед Sandy Bridge составляет 88 процентов, а превосходство четырёхъядерных Skylake и Kaby Lake над четырёхъядерным же Sandy Bridge достигает 38 процентов. В целом весь прогресс усреднённого быстродействия в ресурсоёмких приложениях за последние семь лет у процессоров Core i7 (работающих на одинаковой тактовой частоте) представлен на графике.

Даже если отмести тот факт, что частоты интеловских процессоров хоть медленно, но всё же растут, Core i7 с каждым новым поколением становятся лучше только за счёт структурных изменений и оптимизаций в микроархитектуре. Если судить по быстродействию в приложениях для создания и обработки цифрового контента, то можно заключить, что средний прирост удельной производительности на каждом этапе составляет порядка 15 процентов.

Впрочем, в играх, в которых оптимизация программного кода под современные микроархитектуры происходит с большим отставанием, ситуация с ростом быстродействия несколько иная:

По играм отлично видно, как развитие интеловских микроархитектур остановилось на поколении Skylake, и даже увеличение числа вычислительных ядер в Coffee Lake мало помогает в наращивании игровой производительности.

Конечно, отсутствие роста удельной игровой производительности ещё не означает, что более новые Core i7 неинтересны для геймеров. В конце концов, не стоит забывать, что приведённые выше результаты касаются частоты кадров для CPU, работающих на одинаковой тактовой частоте, а более новые процессоры не только имеют более высокие номинальные частоты, но и разгоняются куда лучше старых. А это значит, что игроки из числа оверклокеров могут быть заинтересованы в переходе на Coffee Lake не из-за его микроархитектуры, которая осталась неизменной со времён Skylake, и не из-за шести ядер, дающих минимальный прирост скорости в играх, а по другой причине – благодаря оверклокерским возможностям. В частности, взятие 5-гигагерцевого рубежа для Coffee Lake – вполне посильная задача, чего про его предшественников не скажешь.

Так сложилось, что компанию Intel принято ругать за выбранную в последние годы стратегию размеренного и неторопливого внедрения улучшений базовой архитектуры Core, которая даёт не слишком заметный прирост быстродействия при переходе на каждое следующее поколение CPU. Однако подробное тестирование показывает, что в целом реальная производительность прирастает не такими уж и вялыми темпами. Просто нужно учитывать два момента. Во-первых, многие усовершенствования, добавляемые в новые процессоры, раскрывают себя далеко не сразу, а лишь спустя некоторое время, когда программное обеспечение обретает соответствующие оптимизации. Во-вторых, пусть и небольшое, но планомерное улучшение производительности, происходящее каждый год, в сумме даёт весьма значительный эффект, если рассматривать ситуацию в контексте более продолжительных временных промежутков.

В подтверждение достаточно привести один весьма показательный факт: новейший Core i7-8700K превосходит по быстродействию своего предшественника родом из 2011 года более чем вдвое. И даже если сопоставлять новинку с процессором Core i7-4790K, который вышел в 2014 году, то окажется, что за четыре года производительность успела вырасти как минимум в полтора раза.

Впрочем, нужно понимать, что указанные выше показатели прироста касаются ресурсоёмких приложений для создания и обработки цифрового контента. И именно здесь проходит водораздел: профессиональные пользователи, которые используют свои системы для работы, получают от совершенствования процессоров куда большие дивиденды, чем те, у кого компьютер служит чисто для развлечений. И в то время как для создателей контента частая модернизация платформ и процессоров – более чем осмысленный шаг, позволяющий поднять продуктивность, про геймеров разговор получается совершенно иным.

Игровые приложения — очень консервативная отрасль, которая реагирует на какие-либо изменения в архитектуре процессоров крайне медленно. Кроме того, игровая производительность в большей мере зависит от производительности графических карт, а не процессоров. Поэтому получается так, что пользователи игровых систем развитие интеловских CPU, произошедшее за последние годы, видят совсем по-другому. Там, где «профессионалы» констатируют двукратный рост производительности, игроки получают в лучшем случае лишь 35-процентное увеличение числа fps. И это значит, что в погоне за новыми поколениями интеловских CPU для них практически нет никакого смысла. Даже старшие процессоры серий Sandy Bridge и Ivy Bridge имеют достаточную мощность для того, чтобы раскрыть потенциал графической карты уровня GeForce GTX 1080 Ti.

Таким образом, пока игроков в новых процессорах может привлечь не столько рост производительности, сколько новые возможности. Ими могут быть какие-то дополнительные функции, появляющиеся в свежих платформах, например поддержка скоростных накопителей. Или же лучший оверклокерский потенциал, пределы которого, несмотря на проблемы Intel с освоением новых технологических процессов, всё-таки постепенно отодвигаются к более отдалённым рубежам. Однако для того, чтобы игроки получили чёткий и понятный сигнал к модернизации, в первую очередь должен произойти заметный рост быстродействия игровых GPU. А до тех пор даже владельцы интеловских CPU семилетней давности будут продолжать ощущать себя совершенно не обделёнными процессорной производительностью.

Тем не менее эту ситуацию вполне способны изменить процессоры поколения Coffee Lake. Произошедшее в них увеличение числа вычислительных ядер (до шести, а в перспективе и до восьми штук) несёт в себе мощный эмоциональный заряд. За счёт этого Core i7-8700K кажется очень удачным апгрейдом практически любому пользователю ПК, ведь многие думают, что шестиядерники за счёт заложенного в них потенциала смогут оставаться актуальным вариантом в течение более продолжительного срока. Так ли это в действительности, сейчас сказать тяжело. Но, подытоживая всё сказанное выше, мы можем подтвердить, что модернизация системы с переходом на Coffee Lake в любом случае имеет куда больше смысла, чем варианты апгрейда, которые микропроцессорный гигант предлагал до сих пор.