Эпл A9X под микроскопом: 2 ядра ARMv8, большой GPU и 128-битный контроллер памяти

Вы получите комплексный ремонт не выходя из дома если обратитесь к мастерам на сайте https://remont-admin.ru/. Выезд мастера осуществляется на любой адрес в Екатеринбурге.

Высокоинтегрированная система на кристалле (system-on-chip, SoC) Эпл A9X для планшетника iPod Pro, по сведениям создателя, может посоветовать мощность, сопоставимую с тем, что могут предложить микропроцессоры Intel. Эпл не открывает огромного числа деталей о собственной самой производительной SoC, но фотографии ядра A9X, сделанные организацией Chipworks с помощью растрового электронного микроскопа (РЭМ, англ. scanning electron microscope, SEM), открывают определенные детали об устройстве.

Эпл A9X: огромная SoC для огромного планшетника

По измерениям Chipworks, схема Эпл A9X громадна по меркам микропроцессоров для мобильных телефонов. Площадь A9X cоставляет 147 миллиметров², она на 40 % больше, чем площадь Эпл A9, производимой по техническому процессу CLN16FF организацией Taiwan Semiconductor Manufacturing Co. Для аналогии: четырёхъядерный Intel Skylake с графическим микропроцессором класса ДжиТи2 имеет площадь ядра в 122 миллиметров², а 2-ядерный Intel Haswell с графическим ядром ДжиТи3 имеет объем в 177 миллиметров². Характерно системы на кристалле для мобильных телефонов имеют площадь ощутимо меньше 100 миллиметров².

 

Эпл A9X

 

Как хорошо видно, Эпл не стала беречь на микросхеме для собственного самого производительного планшетника. Но, в отличии от определенных передовых мобильных SoC, в Эпл A9X нет десятка ядер совместного предназначения либо больших кешей, призванных повысить мощность в однопоточных дополнениях. Вместо этого, по всей видимости, Эпл рассчитывает понадеяться на неоднородные вычисления.

Всего 2 ядра совместного предназначения

Эпл A9X экипирован 2-мя ARMv8-A-совместимыми ядрами совместного предназначения Twister, в подготовке которых участвовал знаменитый Джим Келлер (Jim Keller). Микропроцессорные ядра (замечены зелёным на схеме) имеют суммарный кеш 2-го значения объёбог 3 Мбайт и могут работать на тактовой частоте до 2,26 ГГц.

Зная, что все 64-разрядные микроархитектуры Эпл характерно могли дешифрировать и синхронно выполнять больше ARMv8-инструкций, чем ядра, спроектированные ARM, содержание всего 2-ух ядер совместного предназначения не должно представляться дефектом. Пока, проверенных данных об архитектуре Twister нет, и трудно сообщить, как мощность пары свежих ядер Эпл корреспондируется с соперничающими продуктами. Все-таки, большая тактовая частота и, скорее всего, крайне действенная архитектура позволят микросхеме показывать прекрасный уровень мощности в большинстве дополнений.

Производительный GPU и неоднородные вычисления

Вместо того, чтобы встроить множество ядер совместного предназначения, Эпл интегрировала в A9X крайне производительный графический микропроцессор. GPU основывается на архитектуре Imagination Технолоджис PowerVR Серии7XT и имеет 12 кластеров (замечены голубым на схеме), созданные как 6 блоков с определенной совместной логикой. Эта архитектура не только лишь крайне эффективна для обработки графики, но также и сохраняет возможности подобных интерфейсов программирования дополнений, как OpenGL 4.3, OpenCL 1.2 и DirectX 11.2 (несовременно для Эпл и вероятнее всего не выполнено на аппаратном уровне).

 

Графический микропроцессор PowerVR Серии7XT

Интересно, что официально Imagination предлагает решения PowerVR Серии7XT с 8-ю либо шестнадцатью кластерами, но Эпл решила применять конфигурацию из 12-и кластеров (Imagination именует кластерами блоки unified shading cluster, USC, c 64–128 потоковыми микропроцессорами в любом). Другими словами, создатели Эпл без помощи других основали графический микропроцессор на основе архитектуры PowerVR Серии7XT, что бывало и прежде, давая возможность продуктам Эпл иметь хорошую мощность сравнивая с соперниками в дополнениях, требующих вычисляемой производительность GPU.

 

Вычисляемый кластер PowerVR Серии7XT

По всей видимости, техники Эпл максимизировали число потоковых графических микропроцессоров у GPU чипсета Эпл A9X для того, чтобы повысить вычисляемые возможности системы на кристалле. По-видимому, Эпл рассчитывает применять технологии GPU-ускорения для дополнений, которые требуют серьёзной точной производительности. Зная крайне хорошую результативность синхронных расчётов на графических микропроцессорах, такой подход имеет резон. При подобающей оптимизации ПО особые GPU-кластеры внутри SoC гарантируют бóльшую мощность, чем дополнительное ядро совместного предназначения.

Новая система памяти и неимение L3

Микропроцессор Эпл A9X — первая схема компании с восьмиканальным контроллером памяти LPDDR4 (8 отличительных 16-битных интерфейсов видны вверху и по краям SoC). Благодаря 128-разрядному доступу к памяти и её тактовой частоте в 3200 МГц, пропускная дееспособность подсистемы памяти A9X составляет 51,2 Гигабайт/с, что в два раза больше, чем у прочих микросхем Эпл. Принимая во внимание производительный GPU и повышенное разрешение у дисплея Эпл iPod Pro (2732 × 2048 пунктов), большая пропускная дееспособность памяти очень принципиальна для представляемой системы на кристалле.

 

Эпл iPod Pro

Интересно, что в отличии от A9 и предшественников (A7, A8, A8X), A9X не имеет кеша 3-го значения для ядер совместного предназначения и GPU. Решение отказаться от кеша можно пояснить увеличившейся пропускной возможностью подсистемы памяти, и тем прецедентом, что Эпл хотела применять прежде всего GPU-ускорение для строгих дополнений. Принимая во внимание непрезентабельные объемы кеша 3-го значения, вряд ли Эпл сумела сберечь значительные денежные средства на изготовлении микросхемы, отказавшись от него в A9X. Также, огромные кеши часто позволяют беречь электрическую энергию, минимизировав применение материнской платы. Так что, отказ от L3 — очень неоднозначное решение проектировщиков SoC.

Кроме производительных CPU, GPU и целиком перепроектированной подсистемы памяти, микропроцессоры Эпл A9X содержит большое количество специальных блоков, мощность которых серьёзно оказывает влияние на совместную работу устройства. Прежде всего, Эпл A9X имеет целиком свежий контроллер NAND флеш-памяти, что повысит мощность интегрированного накопителя данных. Во-вторых, SoC имеет целиком переделанный контроллер экрана, давая возможность заключительному работать с неустойчивой частотой обновления. В-третьих, свежий чипсет имеет свежие контроллеры детекторов и целый комплект своеобразных ускорителей. Пока, установить всё перечисленное выше на фотографии такого качества не представляется вероятным. Все-таки, такие «мелочи» занимают значительную — более четверти — площадь ядра A9X.

Взгляд в будущее

Судя по строительным заключениям в A9X, возможно, Эпл рассчитывает рассчитывать на неоднородные вычисления не только лишь для квалифицированного ПО, которое будет запускаться на iPod Pro, но также и для обычных дополнений. По-видимому, в дальнейшем мы увидим будущее повышение числа GPU-кластеров во всех SoC компании при прежнем количестве ядер совместного предназначения в обозримые годы. Как бы там ни было, до прохода на 10-нм технический процесс в середине 2017 года микросхемы Эпл продолжат содержать 2 ядра, однако производительные передовые GPU.

 

Эпл iPod и Айфон

Что же касается 128-битного доступа к памяти, то он, возможно, останется уникальной перспективой A9X либо A10X. Внешние виды памяти требуют места на микросхемах и в истории с чипами для телефонов «обширный» доступ к LPDDR4 нельзя снабдить на физическом уровне. Следовательно, можно ждать, что грядущие SoC компании продолжат применять кеш 3-го значения для максимизации пропускной возможности памяти, если Эпл не сможет решить использовать технологии вроде Wide I/O.

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий