Ячейка (микропроцессор) - Cell (microprocessor)

Клетка это многоядерный микропроцессор микроархитектура, сочетающая в себе универсальный PowerPC основной скромной производительности с обтекаемой сопроцессинг элементы[1] которые значительно ускоряют мультимедиа и векторная обработка приложения, а также многие другие формы специализированных вычислений.[1]

Он был разработан Sony, Toshiba, и IBM, альянс, известный как "STI". Архитектурный проект и первая реализация были выполнены в Центре дизайна STI в г. Остин, Техас в течение четырехлетнего периода, начиная с марта 2001 г., бюджет, по сообщению Sony, приближается АМЕРИКАНСКИЙ ДОЛЛАР$ 400 миллионов.[2] Cell - это сокращение от Архитектура Cell Broadband Engine, обычно сокращенно CBEA полностью или Ячейка BE частично.

Первое крупное коммерческое применение Cell было в Sony PlayStation 3 игровая консоль, выпущенный в 2006 году. В мае 2008 года на базе Cell-based IBM Roadrunner суперкомпьютер стал первым TOP500 LINPACK устойчивая система 1,0 петафлопс.[3][4] Компьютерные системы Mercury также разработаны конструкции на базе Cell.

Архитектура Cell включает в себя когерентность памяти архитектура, которая подчеркивает энергоэффективность, расставляет приоритеты пропускная способность слишком низкий задержка, и способствует пиковой вычислительной пропускная способность над простотой программный код. По этим причинам Cell считается сложной средой для разработка программного обеспечения.[5] IBM предоставляет Linux платформа для разработки, чтобы помочь разработчикам создавать программы для чипов Cell.[6]

История

Cell BE в том виде, в котором он отображается в PS3 на материнской плате
Питер Хофсти, один из главных разработчиков микропроцессора Cell

В середине 2000 г. Sony Computer Entertainment, Корпорация Toshiba, и IBM сформировали альянс, известный как «STI», для разработки и производства процессора.[7]

Центр дизайна STI открылся в марте 2001 года.[8] Ячейка была разработана в течение четырех лет с использованием улучшенных версий инструментов проектирования для МОЩНОСТЬ4 процессор. Более 400 инженеров из трех компаний работали вместе в Остине при критической поддержке одиннадцати проектных центров IBM.[8] В этот период IBM подала много патенты относящиеся к архитектуре Cell, производственному процессу и программной среде. Ранняя патентная версия Broadband Engine представляла собой пакет микросхемы, включающий четыре «элемента обработки», которые были описанием патента для того, что теперь известно как Элемент обработки энергии (СИЗ). Каждый элемент обработки будет содержать 8 «Элементы синергетической обработки» (SPE ) на микросхеме. Этот пакет микросхем должен был работать с тактовой частотой 4 ГГц и с 32 SPE, обеспечивающими 32гигафлопс каждая (четверть точности FP8), Broadband Engine теоретически должен был иметь необработанную вычислительную мощность 1 терафлопс.

Конструкция с 4 СИЗ и 32 СИЗ так и не была реализована. Вместо этого Sony и IBM изготовили конструкцию только с одним PPE и 8 SPE. Эта меньшая конструкция, Cell Broadband Engine или Cell / BE, была изготовлена ​​с использованием 90 нм ТАК ЧТО Я процесс.[9]

В марте 2007 года IBM объявила, что 65 нм версия Cell / BE находится в производстве на ее заводе (в то время, теперь GlobalFoundries) в Ист-Фишкилл, Нью-Йорк.[9][10]

Bandai Namco Entertainment использовали процессор Cell / BE для своих 357 аркадная доска, а также последующие 369.

В феврале 2008 года IBM объявила, что начнет производство процессоров Cell с 45 нм процесс.[11]

В мае 2008 года IBM представила высокопроизводительную версию процессора Cell с плавающей запятой двойной точности - PowerXCell 8i,[12] при размере элемента 65 нм.

В мае 2008 г. Opteron - и суперкомпьютер на базе PowerXCell 8i, IBM Roadrunner Система стала первой в мире системой, достигающей одного петафлопса, и была самым быстрым компьютером в мире до третьего квартала 2009 года. Три самых энергоэффективных суперкомпьютера в мире, представленные Зеленый500 list аналогичным образом основаны на PowerXCell 8i.

Процессор Cell 45 нм был представлен совместно с Sony PlayStation 3 Slim в августе 2009 г.[13]

К ноябрю 2009 года IBM прекратила разработку процессора Cell с 32 APU.[14][15] но все еще разрабатывала другие продукты Cell.[16]

Коммерциализация

17 мая 2005 г. компания Sony Computer Entertainment подтвердила некоторые характеристики процессора Cell, который будет поставляться в следующем выпуске. PlayStation 3 консоль.[17][18][19] Эта конфигурация ячейки имеет один PPE в ядре с восемью физическими SPE в кремнии.[19] В PlayStation 3 один SPE блокируется во время процесса тестирования, что помогает повысить производительность, а другой зарезервирован для ОС, оставляя 6 бесплатных SPE для использования в коде игр.[20] Целевая тактовая частота при введении составляет 3,2ГГц.[18] Вводный дизайн изготовлен с использованием процесса SOI 90 нм, при этом начальное серийное производство планируется для предприятия IBM в г. Ист-Фишкилл, Нью-Йорк.[9]

Отношения между ядра и потоки является распространенным источником путаницы. Ядро СИЗ двухзаходный и проявляется в программном обеспечении как два независимых потока выполнения, в то время как каждый активный SPE проявляется как один поток. В конфигурации PlayStation 3, описанной Sony, процессор Cell обеспечивает девять независимых потоков выполнения.

28 июня 2005 г. IBM и Компьютерные системы Mercury объявила о партнерском соглашении по созданию компьютерных систем на базе Cell для встроенный такие приложения, как медицинская визуализация, производственная инспекция, аэрокосмический и защита, обработка сейсмических данных, и телекоммуникации.[21] С тех пор Меркьюри выпустил лезвия, общепринятый стоечные серверы и PCI Express платы ускорителей с процессорами Cell.[21]

Осенью 2006 года IBM выпустила QS20. модуль лезвия использование процессоров с двойной ячейкой BE для потрясающей производительности в определенных приложениях, достигая пика в 410 гигафлопс при четвертичной точности FP8 на модуль. В QS22 на базе процессора PowerXCell 8i. IBM Roadrunner суперкомпьютер. Mercury и IBM используют полностью загруженный процессор Cell с восемью активными SPE. 8 апреля 2008 г. корпорация Fixstars выпустила PCI Express плата ускорителя на базе процессора PowerXCell 8i.[22]

Высокопроизводительный сервер мультимедийных вычислений Sony ZEGO использует процессор Cell / B.E с тактовой частотой 3,2 ГГц.

Обзор

В Ячейка широкополосного доступа, или же Клетка как это более широко известно, это микропроцессор, задуманный как гибрид обычных настольных процессоров (таких как Athlon 64, и Ядро 2 семейства) и более специализированных высокопроизводительных процессоров, таких как NVIDIA и ATI графические процессоры (GPU ). Более длинное название указывает на его предполагаемое использование, а именно в качестве компонента в настоящем и будущем. онлайн-распространение системы; как таковой он может использоваться в дисплеях высокой четкости и записывающем оборудовании, а также в HDTV системы. Кроме того, процессор может подходить для цифровое изображение системы (медицинские, научные, и Т. Д.) и физическое моделирование (например, научные и Строительная инженерия моделирование).

В простом анализе процессор Cell можно разделить на четыре компонента: внешние структуры ввода и вывода, главный процессор называется Элемент обработки энергии (СИЗ) (двусторонний одновременный многопоточный PowerPC 2.02 основной),[23] восемь полнофункциональных сопроцессоров, называемых Элементы синергетической обработки, или SPE, и специализированный высокоскоростной кольцевая шина данных соединение PPE, элементов ввода / вывода и SPE, называемое Элемент Interconnect Bus или ЕИБ.

Для достижения высокой производительности, необходимой для математически сложных задач, таких как декодирование / кодирование MPEG потоки, создание или преобразование трехмерных данных или выполнение Анализ Фурье данных, процессор Cell объединяет SPE и PPE через EIB, чтобы предоставить доступ через полностью кэш согласованный DMA (прямой доступ к памяти), как в основную память, так и в другое внешнее хранилище данных. Чтобы максимально использовать возможности EIB и перекрыть вычисления и передачу данных, каждый из девяти элементов обработки (PPE и SPE) оснащен Двигатель DMA. Поскольку инструкции загрузки / сохранения SPE могут обращаться только к его собственному локальному блокнотная память каждый SPE полностью зависит от DMA для передачи данных в основную память и локальную память других SPE и из них. Операция DMA может передавать либо единичную область блока размером до 16 КБ, либо список от 2 до 2048 таких блоков. Одним из основных проектных решений в архитектуре Cell является использование DMA в качестве центрального средства передачи данных внутри кристалла с целью обеспечения максимальной асинхронности и параллелизма при обработке данных внутри кристалла.[24]

PPE, на котором работает обычная операционная система, контролирует SPE и может запускать, останавливать, прерывать и планировать процессы, выполняемые на SPE. С этой целью PPE имеет дополнительные инструкции, относящиеся к управлению SPE. В отличие от SPE, PPE может читать и записывать основную память и локальную память SPE с помощью стандартных инструкций загрузки / сохранения. Несмотря на то, что Тьюринг завершен архитектуры, SPE не являются полностью автономными и требуют, чтобы PPE запускал их, прежде чем они смогут выполнять какую-либо полезную работу. Поскольку большая часть «лошадиных сил» системы поступает от элементов синергетической обработки, использование DMA как метод передачи данных, и ограниченный объем локальной памяти каждого SPE представляет собой серьезную проблему для разработчиков программного обеспечения, которые хотят максимально использовать эту мощность, требуя тщательной ручной настройки программ для получения максимальной производительности от этого процессора.

Архитектура СИЗ и шины включает различные режимы работы, дающие разные уровни защита памяти, позволяя защитить области памяти от доступа определенных процессов, запущенных на SPE или PPE.

И PPE, и SPE являются RISC архитектуры с 32-битным форматом инструкций фиксированной ширины. PPE содержит 64-битный регистр общего назначения набор (GPR), 64-битный набор регистров с плавающей запятой (FPR) и 128-битный Altivec набор регистров. SPE содержит только 128-битные регистры. Их можно использовать для скалярных типов данных размером от 8 до 64 бит или для SIMD вычисления в различных целочисленных форматах и ​​форматах с плавающей запятой. Адреса системной памяти для PPE и SPE выражаются в виде 64-битных значений для теоретического диапазона адресов 264 байт (16 эксабайт или 16 777 216 терабайт). На практике не все эти биты реализованы аппаратно. Адреса локального хранилища, внутренние для процессора SPU (Synergistic Processor Unit), выражаются 32-битным словом. В документации, относящейся к ячейке, слово всегда означает 32 бита, двойное слово означает 64 бита, а четверное слово означает 128 бит.

PowerXCell 8i

В 2008 году IBM анонсировала обновленный вариант Cell под названием PowerXCell 8i,[25] который доступен в QS22 Блейд-серверы от IBM. PowerXCell производится на 65 нм процесс и добавляет поддержку до 32 ГБ памяти DDR2 со слотами, а также значительно улучшает производительность с плавающей запятой двойной точности на SPE с пикового значения примерно 12,8.GFLOPS до 102,4 GFLOPS для восьми SPE, что, по совпадению, является той же пиковой производительностью, что и NEC SX-9 векторный процессор выпущен примерно в то же время. В IBM Roadrunner суперкомпьютер, самый быстрый в мире в 2008–2009 годах, состоял из 12 240 процессоров PowerXCell 8i и 6 562 AMD Opteron процессоры.[26] Суперкомпьютеры с питанием от PowerXCell 8i также доминировали во всех шести самых «зеленых» системах в списке Green500 с самым высоким в мире соотношением MFLOPS / Watt.[27] Помимо QS22 и суперкомпьютеров, процессор PowerXCell также доступен в качестве ускорителя на карте PCI Express и используется в качестве основного процессора в QPACE проект.

Поскольку в PowerXCell 8i был удален интерфейс памяти RAMBUS и добавлены интерфейсы DDR2 значительно большего размера, а также улучшенные SPE, пришлось переработать компоновку микросхемы, что привело как к увеличению кристалла, так и к упаковке.[28]

Архитектура

Хотя чип Cell может иметь несколько различных конфигураций, базовая конфигурация представляет собой многоядерный микросхема, состоящая из одного «элемента процессора питания» («PPE») (иногда называемого «элементом обработки» или «PE») и нескольких «элементов синергетической обработки» («SPE»).[29] PPE и SPE связаны между собой внутренней высокоскоростной шиной, получившей название «Element Interconnect Bus» («EIB»).

Элемент процессора питания (PPE)

В СИЗ[30][31][32] это PowerPC на основе, двойная выдача по порядку двусторонняя одновременный многопоточный ядро с 23-ступенчатым конвейером, выступающим в качестве контроллера для восьми SPE, которые обрабатывают большую часть вычислительной нагрузки. СИЗ имеет ограниченные возможности исполнения вне очереди; он может выполнять нагрузки вне очереди и конвейеры отложенного исполнения. PPE будет работать с обычными операционными системами из-за его сходства с другими 64-битными процессорами PowerPC, в то время как SPE предназначены для выполнения векторизованного кода с плавающей запятой. СИЗ содержит 64 KiB 1-й уровень тайник (Инструкция 32 КБ и данные 32 КБ) и кэш-память уровня 2 512 КБ. Размер строки кэша составляет 128 байт. Кроме того, IBM добавила AltiVec (VMX) блок[33] который полностью конвейерно для одинарная точность с плавающей точкой (Altivec 1 не поддерживает двойная точность векторы с плавающей запятой.), 32-битный Блок фиксированной точки (FXU) с 64-битным регистровым файлом на поток, Блок загрузки и хранения (LSU), 64-бит Модуль с плавающей запятой (FPU), Филиал (BRU) и Branch Execution Unit (BXU).[30]PPE состоит из трех основных блоков: блока инструкций (IU), блока выполнения (XU) и блока векторного / скалярного исполнения (VSU). IU содержит кэш инструкций L1, оборудование для предсказания ветвлений, буферы инструкций и логин для проверки зависимостей. XU содержит целочисленные исполнительные блоки (FXU) и блок загрузки-сохранения (LSU). VSU содержит все ресурсы выполнения для FPU и VMX. Каждый PPE может выполнять две операции с двойной точностью за такт, используя скалярную инструкцию слияния-умножения-сложения, что соответствует 6.4.GFLOPS на частоте 3,2 ГГц; или восемь операций с одинарной точностью за такт с помощью векторной инструкции слияния-умножения-сложения, что соответствует 25,6 гигафлопс на частоте 3,2 ГГц.[34]

Ксенон в Xbox 360

PPE был разработан специально для процессора Cell, но во время разработки Microsoft обратилась к IBM с просьбой о высокопроизводительном процессоре для своего Xbox 360. IBM выполнила требования и сделала трехъядерный Ксеноновый процессор, основанный на слегка измененной версии PPE с добавленными расширениями VMX128.[35][36]

Элементы синергетической обработки (SPE)

Каждый SPE представляет собой двойной процесс обработки заказов, состоящий из «Синергетического Процессора»,[37] SPU и «Контроллер потока памяти», MFC (DMA, MMU, и интерфейс шины). SPE не имеют предсказание ветвления оборудование (отсюда большая нагрузка на компилятор).[38] Каждый SPE имеет 6 исполнительных блоков, разделенных между четными и нечетными конвейерами на каждом SPE: SPU запускает специально разработанный Набор инструкций (ISA) с 128 бит SIMD организация[33][39][40] для инструкций с одинарной и двойной точностью. В текущем поколении Cell каждый SPE содержит 256KiB встроенная SRAM для инструкции и данных, называется «Локальное хранилище» (не путать с «Локальной памятью» в документах Sony, которые относятся к VRAM), которая видна PPE и может быть адресована непосредственно программным обеспечением. Каждый SPE может поддерживать до 4 ГиБ локальной памяти хранилища. Местный магазин не работает как обычный Кэш процессора поскольку он не прозрачен для программного обеспечения и не содержит аппаратных структур, которые предсказывают, какие данные загружать. SPE содержат 128-битные 128-битные записи. зарегистрировать файл и измеряет 14,5 мм2 по процессу 90 нм. SPE может работать с шестнадцатью 8-битными целыми числами, восемью 16-битовыми целыми числами, четырьмя 32-битными целыми числами или четырьмя числами с плавающей запятой одинарной точности за один такт, а также с операцией памяти. Обратите внимание, что SPU не может напрямую обращаться к системной памяти; 64-битные адреса виртуальной памяти, сформированные SPU, должны быть переданы из SPU в контроллер потока памяти SPE (MFC), чтобы настроить операцию DMA в системном адресном пространстве.

В одном типичном сценарии использования система загружает SPE небольшими программами (аналогично потоки ), объединяя SPE в цепочку для обработки каждого шага сложной операции. Например, телеприставки может загружать программы для чтения DVD, декодирования видео и звука и отображения, и данные будут передаваться от SPE к SPE, пока, наконец, не попадут на телевизор. Другая возможность - разделить входной набор данных и иметь несколько SPE, выполняющих одинаковые операции параллельно. На частоте 3,2 ГГц каждый SPE дает теоретическое 25,6 GFLOPS одинарной точности исполнения.

По сравнению с его персональный компьютер современников, относительно высокая общая производительность процессора Cell с плавающей запятой, казалось бы, затмевает возможности модуля SIMD в таких процессорах, как Pentium 4 и Athlon 64. Однако сравнение возможностей системы только с плавающей запятой является одномерной метрикой, зависящей от конкретного приложения. В отличие от процессора Cell, такие настольные процессоры больше подходят для универсального программного обеспечения, которое обычно запускается на персональных компьютерах. Помимо выполнения нескольких инструкций за такт, процессоры Intel и AMD предикторы ветвления. Ячейка предназначена для компенсации этого с помощью компилятора, в котором создаются инструкции по подготовке к переходу. Для операций с плавающей запятой двойной точности, которые иногда используются в персональных компьютерах и часто используются в научных вычислениях, производительность Cell падает на порядок, но все же достигает 20,8 GFLOPS (1,8 GFLOPS на SPE, 6,4 GFLOPS на PPE). Вариант PowerXCell 8i, специально разработанный для двойной точности, достигает 102,4 Гфлопс при вычислениях с двойной точностью.[41]

Тесты, проведенные IBM, показывают, что SPE могут достичь 98% своей теоретической пиковой производительности при оптимизированном параллельном умножении матриц.[34]

Toshiba разработал сопроцессор питается от четырех SPE, но без PPE, так называемый SpursEngine разработан для ускорения эффектов 3D и кино в бытовой электронике.

Каждый SPE имеет локальную память объемом 256 КБ.[42] Всего у SPE 2 МБ локальной памяти.

Шина межсоединения элементов (EIB)

EIB - это внутренняя коммуникационная шина процессора Cell, которая соединяет различные элементы системы на кристалле: процессор PPE, контроллер памяти (MIC), восемь сопроцессоров SPE и два интерфейса ввода-вывода вне кристалла, в сумме 12 участников PS3 (количество SPU может варьироваться в промышленных приложениях). EIB также включает арбитражный блок, который функционирует как светофор. В некоторых документах IBM называет участников ЕИБ «единицами».

В настоящее время EIB реализован как круговое кольцо, состоящее из четырех однонаправленных каналов шириной 16 байт, которые попарно вращаются в противоположных направлениях. Когда шаблоны трафика позволяют, каждый канал может передавать до трех транзакций одновременно. Поскольку EIB работает на половине системной тактовой частоты, эффективная канальная скорость составляет 16 байтов каждые два системных такта. Максимум параллелизм, с тремя активными транзакциями на каждом из четырех колец, пик мгновенный Пропускная способность EIB составляет 96 байтов за такт (12 одновременных транзакций × 16 байтов шириной / 2 системных такта за передачу). Хотя эта цифра часто цитируется в литературе IBM, просто масштабировать ее по тактовой частоте процессора нереально. Арбитражный отдел накладывает дополнительные ограничения.

Старший инженер IBM Давид Кролак, Ведущий разработчик EIB, объясняет модель параллелизма:

Кольцо может начинать новую операцию каждые три цикла. Каждая передача всегда занимает восемь ударов. Это было одно из сделанных нами упрощений, оно оптимизировано для потоковой передачи большого количества данных. Если вы выполняете небольшие операции, это не так хорошо работает. Если вы думаете о поездах с восемью вагонами, которые курсируют по этому пути, то до тех пор, пока поезда не сталкиваются друг с другом, они могут сосуществовать на пути.[43]

У каждого участника EIB есть один 16-байтовый порт чтения и один 16-байтовый порт записи. Ограничение для одного участника - это чтение и запись со скоростью 16 байтов за такт EIB (для простоты часто считается, что 8 байтов за системный такт). Каждый процессор SPU содержит выделенный DMA очередь управления, способная планировать длинные последовательности транзакций к различным конечным точкам, не мешая текущим вычислениям SPU; этими очередями DMA можно управлять локально или удаленно, что обеспечивает дополнительную гибкость модели управления.

Данные передаются по каналу EIB ступенчато по кольцу. Поскольку участников двенадцать, общее количество шагов по каналу до исходной точки равно двенадцати. Шесть шагов - это самое большое расстояние между любой парой участников. Каналу EIB не разрешается передавать данные, требующие более шести шагов; такие данные должны идти по более короткому маршруту по кругу в другом направлении. Количество шагов, участвующих в отправке пакета, очень мало влияет на задержку передачи: тактовая частота, управляющая шагами, очень высока по сравнению с другими соображениями. Однако большие расстояния связи находятся пагубно сказываются на общей производительности EIB, поскольку они снижают доступный параллелизм.

Несмотря на первоначальное желание IBM реализовать EIB как более мощную перекладину, круговая конфигурация, которую они приняли для экономии ресурсов, редко является ограничивающим фактором для производительности чипа Cell в целом. В худшем случае программист должен проявить особую осторожность, чтобы спланировать шаблоны связи, при которых EIB может функционировать на высоких уровнях параллелизма.

Давид Кролак объяснил:

Ну, в начале, в начале процесса разработки, несколько человек настаивали на перекрестном переключателе, и, как спроектирована шина, вы могли бы фактически вытащить EIB и вставить перекрестный переключатель, если бы вы были готовы выделить больше кремния. место на микросхеме до проводки. Нам нужно было найти баланс между возможностью подключения и площадью, и просто не хватило места для установки полноценного перекрестного переключателя. Итак, мы придумали эту кольцевую структуру, которая, на наш взгляд, очень интересна. Он вписывается в ограничения по площади и при этом имеет очень впечатляющую пропускную способность.[43]

Оценка пропускной способности

На частоте 3,2 ГГц каждый канал имеет скорость 25,6 ГБ / с. Если рассматривать EIB отдельно от элементов системы, которые он соединяет, выполнение двенадцати одновременных транзакций с такой скоростью потока дает абстрактную полосу пропускания EIB 307,2 ГБ / с. Основываясь на этой точке зрения, многие публикации IBM описывают доступную пропускную способность EIB как «более 300 ГБ / с». Это число отражает пик мгновенный Пропускная способность EIB масштабируется в зависимости от частоты процессора.[44]

Однако другие технические ограничения связаны с механизмом арбитража для пакетов, принимаемых на шину. Группа IBM Systems Performance объяснила:

Каждый блок на EIB может одновременно отправлять и получать 16 байтов данных за каждый цикл шины. Максимальная полоса пропускания данных для всего EIB ограничена максимальной скоростью, с которой адреса отслеживаются всеми устройствами в системе, которая составляет один за цикл шины. Поскольку каждый запрос отслеживаемого адреса потенциально может передавать до 128 байтов, теоретическая пиковая пропускная способность данных на EIB на частоте 3,2 ГГц составляет 128Bx1,6 ГГц = 204,8 ГБ / с.[34]

Эта цитата, по-видимому, полностью отражает публичное раскрытие IBM этого механизма и его влияния. Блок арбитража EIB, механизм отслеживания и генерация прерывания при ошибках трансляции сегментов или страниц недостаточно хорошо описаны в документации, которую IBM еще не опубликовала.[нужна цитата ]

На практике эффективная полоса пропускания EIB также может быть ограничена вовлеченными участниками кольца. В то время как каждое из девяти процессорных ядер может одновременно поддерживать чтение и запись со скоростью 25,6 ГБ / с, контроллер интерфейса памяти (MIC) привязан к паре каналов памяти XDR, обеспечивающих максимальный поток 25,6 ГБ / с для операций чтения и записи. комбинированный и два контроллера ввода-вывода задокументированы как поддерживающие пиковую комбинированную скорость ввода 25,6 ГБ / с и пиковую комбинированную скорость вывода 35 ГБ / с.

Чтобы усугубить путаницу, некоторые старые публикации ссылаются на полосу пропускания EIB, исходя из системной частоты 4 ГГц. Этот опорный кадр приводит к мгновенному показателю пропускной способности EIB 384 ГБ / с и ограниченному арбитражем показателю пропускной способности 256 ГБ / с.

Считается, что наиболее часто упоминаемое теоретическое число 204,8 ГБ / с - лучшее, что нужно иметь в виду. В Производительность систем IBM group продемонстрировала, что потоки данных, ориентированные на SPU, достигают 197 ГБ / с на процессоре Cell, работающем на частоте 3,2 ГГц, так что это число также является справедливым отражением практики.[45]

Контроллеры памяти и ввода / вывода

Ячейка содержит двойной канал Рамбус Макрос XIO, который взаимодействует с Rambus Память XDR. Контроллер интерфейса памяти (MIC) отделен от макроса XIO и разработан IBM. Канал XIO-XDR работает со скоростью 3,2 Гбит / с на вывод. Два 32-битных канала могут обеспечить теоретический максимум 25,6 ГБ / с.

Интерфейс ввода / вывода, также разработанный Rambus, известен как FlexIO. Интерфейс FlexIO разбит на 12 полос, каждая из которых представляет собой однонаправленный двухточечный путь шириной 8 бит. Пять двухточечных маршрутов шириной 8 бит являются входящими полосами для Cell, а остальные семь - исходящими. Это обеспечивает теоретическую пиковую пропускную способность 62,4 ГБ / с (36,4 ГБ / с для исходящего трафика, 26 ГБ / с для входящего трафика) на частоте 2,6 ГГц. Интерфейс FlexIO можно синхронизировать независимо, тип. на частоте 3,2 ГГц. 4 входящие + 4 исходящие полосы поддерживают согласованность памяти.

Возможные применения

Карта обработки видео

Некоторые компании, такие как Leadtek, выпустили PCI-E карты на основе Cell, чтобы обеспечить перекодирование "быстрее, чем в реальном времени" H.264, MPEG-2 и MPEG-4 видео.[46]

Блейд-сервер

29 августа 2007 г. IBM объявила BladeCenter QS21. Производя измеренные 1,05 гигафлопс операций с плавающей запятой в секунду (гигафлопс) на ватт, с пиковой производительностью примерно 460 гигафлопс, это одна из самых энергоэффективных вычислительных платформ на сегодняшний день.Одно шасси BladeCenter может выполнять 6,4 терафлопс операций с плавающей запятой в секунду (терафлопс) и более 25,8 терафлопс в стандартной стойке 42U.[47]

13 мая 2008 г. IBM объявила BladeCenter QS22. QS22 представляет процессор PowerXCell 8i, производительность которого с плавающей запятой двойной точности в пять раз выше, чем у QS21, а также емкость блейд-памяти DDR2 объемом до 32 ГБ.[48]

IBM прекратила выпуск линейки блейд-серверов на базе процессоров Cell с 12 января 2012 года.[49]

Плата PCI Express

Несколько компаний предоставляют платы PCI-e, использующие IBM PowerXCell 8i. Производительность составляет 179,2 гигафлопс (SP), 89,6 гигафлопс (DP) на 2,8 ГГц.[50][51]

Консольные видеоигры

Sony с PlayStation 3 игровая приставка было первым производственным приложением процессора Cell с тактовой частотой 3,2ГГц и содержащий семь из восьми действующих SPE, чтобы позволить Sony увеличить урожай по производству процессора. Только шесть из семи SPE доступны разработчикам, так как один зарезервирован ОС.[20]

Домашний кинотеатр

Toshiba произвела HDTV используя Cell. Они представили систему для декодирования 48 Стандартное определение MPEG-2 потоков одновременно на 1920×1080 экран.[52][53] Это может позволить зрителю выбрать канал на основе десятков миниатюр видео, отображаемых одновременно на экране.

Суперкомпьютерные вычисления

Суперкомпьютер IBM, IBM Roadrunner, был гибридом общего назначения x86-64 Opteron а также процессоры Cell. Эта система заняла первое место в списке 500 лучших компьютеров за июнь 2008 года как первый суперкомпьютер, работающий на петафлопс скорости, достигнув постоянной скорости 1,026 петафлопс при использовании стандартной Linpack ориентир. IBM Roadrunner использовала версию процессора Cell PowerXCell 8i, изготовленную по 65-нм технологии, и усовершенствованные блоки SPU, которые могут обрабатывать вычисления с двойной точностью в 128-битных регистрах, достигая 102 гигафлопс двойной точности на чип.[54][55]

Кластерные вычисления

Кластеры PlayStation 3 Консоли являются привлекательной альтернативой высокопроизводительным системам на основе блейд-серверов Cell. Лаборатория инновационных вычислений, группа во главе с Джек Донгарра на факультете компьютерных наук Университета Теннесси тщательно исследовали такое приложение.[56] Terrasoft Solutions продает кластеры PS3 с 8 и 32 узлами с Желтая собака Linux предустановленная, реализация исследования Донгарры.

Как впервые сообщил Проводной 17 октября 2007 г.,[57] интересное приложение использования PlayStation 3 в кластерной конфигурации было реализовано астрофизиком Гауравом Кханной из физического отдела Массачусетский университет в Дартмуте, который заменил время, используемое на суперкомпьютерах, кластером из восьми PlayStation 3. Впоследствии следующее поколение этой машины, теперь называемое PlayStation 3 Гравитационная сетка, использует сеть из 16 машин и использует процессор Cell для предполагаемого приложения, которое является двоичным черная дыра коалесценция с использованием теория возмущений. В частности, кластер выполняет астрофизическое моделирование больших сверхмассивные черные дыры захватывать более мелкие компактные объекты и генерировать числовые данные, которые многократно публиковались в соответствующей научно-исследовательской литературе.[58] Версия процессора Cell, используемая PlayStation 3, имеет основной ЦП и 6 SPE, доступных пользователю, что дает машине Gravity Grid сеть из 16 процессоров общего назначения и 96 векторных процессоров. Единовременная стоимость сборки машины составляет 9000 долларов, и она подходит для моделирования черных дыр, которое в противном случае стоило бы 6000 долларов за запуск на обычном суперкомпьютере. Вычисления черных дыр не требуют интенсивного использования памяти и легко локализуются, поэтому хорошо подходят для этой архитектуры. Кханна утверждает, что производительность кластера превосходит производительность традиционного Linux-кластера на базе ядра Intel Xeon 100+ по результатам его моделирования. PS3 Gravity Grid привлекала значительное внимание средств массовой информации в 2007 году.[59] 2008,[60][61] 2009,[62][63][64] и 2010.[65][66]

Лаборатория вычислительной биохимии и биофизики Universitat Pompeu Fabra, в Барселона, развернутый в 2007 г. BOINC система называется PS3GRID[67] для совместных вычислений на основе программного обеспечения CellMD, первого, разработанного специально для процессора Cell.

Соединенные Штаты Исследовательская лаборатория ВВС развернула кластер PlayStation 3 из более чем 1700 единиц, получивший название «Кластер Кондор», для анализа высокое разрешение спутниковые снимки. Военно-воздушные силы заявляют, что Condor Cluster станет 33-м по величине суперкомпьютером в мире по мощности.[68] Лаборатория открыла суперкомпьютер для использования университетами для исследований.[69]

Распределенных вычислений

С помощью вычислительной мощности более полумиллиона консолей PlayStation 3 проект распределенных вычислений Складной @ дома был признан Книга Рекордов Гиннесса как самая мощная распределенная сеть в мире. Первый рекорд был достигнут 16 сентября 2007 года, так как проект превзошел один. петафлопс, чего раньше никогда не было в распределенной вычислительной сети. Кроме того, коллективные усилия позволили одной только PS3 23 сентября 2007 года достичь отметки в петафлопс. Для сравнения, второй по мощности суперкомпьютер в мире в то время - IBM. BlueGene / L производительность составляет около 478,2 терафлопс, что означает, что вычислительная мощность Folding @ home примерно в два раза больше, чем у BlueGene / L (хотя межсоединение ЦП в BlueGene / L более чем в миллион раз быстрее, чем средняя скорость сети в Folding @ home). По состоянию на 7 мая 2011 года Folding @ home работает со скоростью около 9,3 x86 петафлопс, из которых 1,6 петафлопса генерируются только 26000 активными PS3. В конце 2008 года группа из 200 консолей PlayStation 3 использовалась для создания мошеннической SSL сертификат, эффективно взламывая его шифрование.[70]

Мэйнфреймы

25 апреля 2007 г. IBM объявила о начале интеграции микропроцессоров с архитектурой Cell Broadband Engine в линейка мэйнфреймов компании.[71] Это привело к Gameframe.

Взлом пароля

Архитектура процессора делает его более подходящим для аппаратной криптографии. атака грубой силой приложений, чем обычные процессоры.[72]

Программная инженерия

Из-за гибкого характера ячейки существует несколько возможностей использования ее ресурсов, не ограничиваясь только разными вычислительными парадигмами:[73]

Очередь заданий

PPE поддерживает очередь заданий, планирует задания в SPE и отслеживает ход выполнения. Каждый SPE запускает «мини-ядро», роль которого заключается в получении задания, его выполнении и синхронизации с PPE.

Самостоятельная многозадачность SPE

Мини-ядро и планирование распределяются по SPE. Задачи синхронизируются с помощью мьютексы или же семафоры как в обычном Операционная система. Готовые к запуску задачи ждут в очереди, пока SPE их выполнит. SPE используют общую память для всех задач в этой конфигурации.

Потоковая обработка

Каждый SPE запускает отдельную программу. Данные поступают из входного потока и отправляются в SPE. Когда SPE завершает обработку, выходные данные отправляются в выходной поток.

Это обеспечивает гибкую и мощную архитектуру для потоковая обработка, и позволяет явное планирование для каждого SPE отдельно. Другие процессоры также могут выполнять задачи потоковой передачи, но ограничены загруженным ядром.

Разработка программного обеспечения с открытым исходным кодом

В 2005 году разработчиками IBM были представлены исправления, обеспечивающие поддержку Cell в ядре Linux.[74] Арнд Бергманн (один из разработчиков вышеупомянутых патчей) также описал архитектуру Cell на базе Linux на LinuxTag 2005.[75] Начиная с версии 2.6.16 (20 марта 2006 г.) ядро ​​Linux официально поддерживает процессор Cell.[76]

И PPE, и SPE программируются на C / C ++ с использованием общего API, предоставляемого библиотеками.

Решения Fixstars обеспечивает Желтая собака Linux для систем на базе IBM и Mercury Cell, а также для PlayStation 3.[77] Компания Terra Soft стала стратегическим партнером Mercury для предоставления пакета поддержки системной платы Linux для Cell, а также поддержки и разработки программных приложений на различных других платформах Cell, включая IBM BladeCenter JS21 и Cell QS20, а также решения на основе Mercury Cell.[78] Terra Soft также поддерживает набор для построения и управления кластеров Y-HPC (высокопроизводительные вычисления) и инструменты для секвенирования генов Y-Bio. Y-Bio основан на стандарте RPM Linux для управления пакетами и предлагает инструменты, которые помогают исследователям в области биоинформатики выполнять свою работу с большей эффективностью.[79] IBM разработала псевдофайловую систему для Linux, названную Spufs, которая упрощает доступ к ресурсам SPE и их использование. IBM в настоящее время поддерживает Linux ядро и GDB портов, в то время как Sony поддерживает Набор инструментов GNU (GCC, binutils ).[80]

В ноябре 2005 года IBM выпустила на свой веб-сайт «Комплект разработчика программного обеспечения Cell Broadband Engine (CBE) версии 1.0», состоящий из симулятора и различных инструментов. Версии для разработки последнего ядра и инструментов для Fedora Core 4 хранятся в Барселонский суперкомпьютерный центр интернет сайт.[81]

В августе 2007 года компания Mercury Computer Systems выпустила комплект разработки программного обеспечения для PLAYSTATION (R) 3 для высокопроизводительных вычислений.[82]

В ноябре 2007 года корпорация Fixstars выпустила новый модуль «CVCell», призванный ускорить работу нескольких важных OpenCV API для Cell. В серии программных расчетных тестов они зафиксировали время выполнения на процессоре Cell с тактовой частотой 3,2 ГГц, которое было в 6–27 раз быстрее по сравнению с тем же программным обеспечением на Intel Core 2 Duo с тактовой частотой 2,4 ГГц.[83]

Галерея

Иллюстрации разных поколений Cell / B.E. процессоры и PowerXCell 8i. Изображения не в масштабе; All Cell / Б.Э. Размеры корпуса 42,5 × 42,5 мм, а PowerXCell 8i - 47,5 × 47,5 мм.

Смотрите также

Рекомендации

  1. ^ а б Гшвинд, Майкл; Хофсти, Х. Питер; Флакс, Брайан; Хопкинс, Мартин; Ватанабэ, Юкио; Ямазаки, Такеши (2006). «Синергетическая обработка в многоядерной архитектуре Cell». IEEE Micro. IEEE. 26 (2): 10–24. Дои:10.1109 / MM.2006.41. S2CID  17834015.
  2. ^ «Cell Designer рассказывает о PS3 и процессорах IBM Cell». Архивировано из оригинал 21 августа 2006 г.. Получено 22 марта, 2007.
  3. ^ Годен, Шарон (9 июня 2008 г.). «IBM Roadrunner преодолевает 4-х минутную милю суперкомпьютеров». Computerworld. Архивировано из оригинал 24 декабря 2008 г.. Получено 10 июня, 2008.
  4. ^ Филдс, Джонатан (9 июня 2008 г.). «Суперкомпьютер задает темп в петафлоп». Новости BBC. Получено 9 июня, 2008.
  5. ^ Шенкленд, Стивен (22 февраля 2006 г.). «Octopiler стремится вооружить программистов Cell». CNET. Получено 22 марта, 2007.
  6. ^ "Комплект для разработки программного обеспечения Cell Broadband Engine версии 1.0". LWN. 10 ноября 2005 г.. Получено 22 марта, 2007.
  7. ^ Крюэлл, Кевин (14 февраля 2005 г.). «Клетка движется в центр света». Отчет микропроцессора.
  8. ^ а б «Введение в мультипроцессор Cell». Журнал исследований и разработок IBM. 7 августа 2005 г. Архивировано с оригинал 28 февраля 2007 г.. Получено 22 марта, 2007.
  9. ^ а б c «IBM производит сотовый процессор с использованием новой производственной технологии». X-bit labs. Архивировано из оригинал 15 марта 2007 г.. Получено 12 марта, 2007.
  10. ^ «Начато производство 65-нм процессоров CELL». Вселенная PlayStation. 30 января 2007 г. Архивировано с оригинал 2 февраля 2007 г.. Получено 18 мая, 2007.
  11. ^ Стоукс, Джон (7 февраля 2008 г.). «IBM сокращает Cell до 45 нм. За более дешевыми PS3 последуют». Arstechnica.com. Получено 19 сентября, 2012.
  12. ^ «IBM предлагает высокопроизводительные вычисления вне лаборатории». IBM. Получено 15 мая, 2008.
  13. ^ «Sony отвечает на наши вопросы о новой PlayStation 3». Ars Technica. 18 августа 2009 г.. Получено 19 августа, 2009.
  14. ^ "Будет ли Roadrunner последним ура для клетки?". 27 октября 2009 г. Архивировано с оригинал 31 октября 2009 г.
  15. ^ "SC09: IBM lässt Cell-Prozessor auslaufen". HeiseOnline. 20 ноября 2009 г.. Получено Двадцать первое ноября, 2009.
  16. ^ «IBM не остановила разработку процессоров Cell». DriverHeaven.net. 23 ноября 2009 г. Архивировано с оригинал 25 ноября 2009 г.. Получено 24 ноября, 2009.
  17. ^ Беккер, Дэвид (7 февраля 2005 г.). «У чипа PlayStation 3 раздвоение личности». CNET. Получено 18 мая, 2007.
  18. ^ а б Терротт, Пол (17 мая 2005 г.). «Sony поднимает ставки с PlayStation 3». WindowsITPro. Архивировано из оригинал 30 сентября 2007 г.. Получено 22 марта, 2007.
  19. ^ а б Ропер, Крис (17 мая 2005 г.). «E3 2005: Демонстрации технологии сотовых процессоров». IGN. Получено 22 марта, 2007.
  20. ^ а б Мартин Линклейтер. «Оптимизация ядра клетки». Журнал Game Developer Magazine, апрель 2007 г.. С. 15–18. Чтобы увеличить производительность, Sony поставляет процессоры PlayStation 3 Cell только с семью рабочими SPE. И из этих семи один SPE будет использоваться операционной системой для различных задач. Остается шесть SPE и 1 PPE для использования программистами игр.
  21. ^ а б «Меркьюри получает награду IBM PartnerWorld Beacon Award». Суперкомпьютерные сети. 12 апреля 2007 г.. Получено 18 мая, 2007.[мертвая ссылка ]
  22. ^ "Fixstars выпускает плату ускорителя с PowerXCell 8i". Корпорация Fixstars. 8 апреля 2008 г. Архивировано с оригинал 5 января 2009 г.. Получено 18 августа, 2008.
  23. ^ Коран, Сандип (2009). Практическое программирование на ядре широкополосной сотовой связи. Springer Science & Business Media. п. 17. ISBN  9781441903082.
  24. ^ Гшвинд, Майкл (2006). «Многопроцессорная обработка микросхем и ядро ​​широкополосной сотовой связи». ACM. Получено 29 июня, 2008.
  25. ^ Руководство по программированию Cell Broadband Engine, включая процессор PowerXCell 8i (PDF) (1.11 изд.). 12 мая 2008 г.
  26. ^ "IBM анонсирует блейд-сервер PowerXCell 8i, QS22". Beyond3D. Май 2008. Архивировано с оригинал 16 июня 2008 г.. Получено 10 июня, 2008.
  27. ^ «Список Green500 - ноябрь 2009 г.». Архивировано из оригинал 23 февраля 2011 г.
  28. ^ «Упаковка микропроцессора Cell Broadband Engine для суперкомпьютерных приложений» (PDF). Архивировано из оригинал (PDF) 4 января 2014 г.. Получено 4 января, 2014.
  29. ^ «Брифинг по клеточному микропроцессору». IBM, Sony Computer Entertainment Inc., Toshiba Corp.7 февраля 2005 г.
  30. ^ а б http://www.cc.gatech.edu/~hyesoon/spr11/lec_cell.pdf
  31. ^ Практические вычисления на ядре широкополосной связи Сандип Коранн, Springer Science + Business Media, 2009, стр.19.
  32. ^ http://www.research.ibm.com/people/a/ashwini/E3%202005%20Cell%20Blade%20reports/All_About_Cell_Cool_Chips_Final.pdf
  33. ^ а б «Энергоэффективный процессор и сотовый процессор» (PDF). IBM. 16 февраля 2005 г.
  34. ^ а б c «Архитектура Cell Broadband Engine и ее первая реализация». IBM developerWorks. 29 ноября 2005 г.. Получено 6 апреля, 2006.
  35. ^ "Обработка правды: интервью с Дэвидом Шиппи ", Ли Александр, Гамасутра, 16 января 2009 г.
  36. ^ "Игра в дурака ", Джонатан В. Ласт, Wall Street Journal, 30 декабря 2008 г.
  37. ^ «Архивная копия» (PDF). Архивировано из оригинал (PDF) 18 ноября 2014 г.. Получено 24 января, 2015.CS1 maint: заархивированная копия как заголовок (связь)
  38. ^ «IBM Research - Cell». IBM. Получено 11 июня, 2005.
  39. ^ «Синергетическая обработка в многоядерной архитектуре Cell» (PDF). IEEE Micro. Март 2006 г.. Получено 1 ноября, 2006.
  40. ^ «Новая архитектура SIMD для гетерогенного многопроцессорного чипа Cell» (PDF). Hot Chips 17. 15 августа 2005 г. Архивировано с оригинал (PDF) 9 июля 2008 г.. Получено 1 января, 2006.
  41. ^ «Преемник ячейки с турбо-режимом - PowerXCell 8i». PPCNux. Ноябрь 2007 г.. Получено 10 июня, 2008.
  42. ^ Поддержка OpenMP в ячейке, IBM T. J Watson Research
  43. ^ а б «Знакомьтесь: Дэвид Кролак о шине EIB Cell Broadband Engine». IBM. 6 декабря 2005 г.. Получено 18 марта, 2007.
  44. ^ «Сотовая многопроцессорная коммуникационная сеть: высокая скорость» (PDF). IEEE. Архивировано из оригинал (PDF) 7 января 2007 г.. Получено 22 марта, 2007.
  45. ^ «Архитектура Cell Broadband Engine и ее первая реализация». Ibm.com. 29 ноября 2005 г.. Получено 19 сентября, 2012.
  46. ^ «Карта транскодирования Leadtek PxVC1100 MPEG-2 / H.264».
  47. ^ "IBM удваивается на Cell Blade" (Пресс-релиз). Армонк, Нью-Йорк: IBM. 29 августа 2007 г.. Получено 19 июля, 2017.
  48. ^ «IBM предлагает высокопроизводительные вычисления вне лаборатории» (Пресс-релиз). Армонк, Нью-Йорк: IBM. 13 мая 2008 г.. Получено 19 июля, 2017.
  49. ^ Морган, Тимоти Прикетт (28 июня 2011 г.). "IBM уничтожит последний блейд-сервер Cell". Реестр. Получено 19 июля, 2017.
  50. ^ "Пресс-релиз Fixstars". Архивировано из оригинал 5 января 2009 г.. Получено 18 августа, 2008.
  51. ^ «Плата сопроцессора на базе соты работает под управлением Linux». Архивировано из оригинал 2 мая 2009 г.
  52. ^ «Toshiba демонстрирует сотовый микропроцессор, одновременно декодирующий 48 потоков MPEG-2». Tech-On !. 25 апреля 2005 г.
  53. ^ «Победитель: Мультимедийный монстр». IEEE Spectrum. 1 января 2006 г. Архивировано с оригинал 18 января 2006 г.. Получено 22 января, 2006.
  54. ^ "За пределами одной клетки" (PDF). Лос-Аламосская национальная лаборатория. Архивировано из оригинал (PDF) 8 июля 2009 г.. Получено 6 апреля, 2017.
  55. ^ «Возможности клеточного процессора для научных вычислений». ACM Computing Frontiers. Получено 6 апреля, 2017.
  56. ^ «SCOP3: приблизительное руководство по научным вычислениям на PlayStation 3» (PDF). Департамент компьютерных наук, Университет Теннесси. Архивировано из оригинал (PDF) 15 октября 2008 г.. Получено 8 мая, 2007.
  57. ^ Гардинер, Брайан (17 октября 2007 г.). «Астрофизик заменяет суперкомпьютер на восемь PlayStation 3». Проводной. Получено 17 октября, 2007.
  58. ^ "PS3 Gravity Grid". Гаурав Ханна, доцент инженерного колледжа Массачусетского университета в Дартмуте.
  59. ^ «Кластер PS3 создает самодельный более дешевый суперкомпьютер».
  60. ^ Хайфилд, Роджер (17 февраля 2008 г.). «Почему ученые любят игровые консоли». Дейли Телеграф. Лондон.
  61. ^ Пекхэм, Мэтт (23 декабря 2008 г.). «Ничто не ускользнет от притяжения PlayStation 3, даже черная дыра». Вашингтон Пост.
  62. ^ Малик, Тарик (28 января 2009 г.). «Консоли Playstation 3 преодолевают вибрации черной дыры». Space.com.
  63. ^ Лайден, Джеки (21 февраля 2009 г.). "Playstation 3: суперкомпьютер со скидкой?". энергетический ядерный реактор.
  64. ^ Уоллич, Пол (1 апреля 2009 г.). «Суперкомпьютер становится персональным». IEEE Spectrum.
  65. ^ "Суперкомпьютер на базе PlayStation". Новости BBC. 4 сентября 2010 г.
  66. ^ Фаррелл, Джон (12 ноября 2010 г.). «Черные дыры и квантовые петли: больше, чем просто игра». Forbes.
  67. ^ "PS3GRID.net".
  68. ^ «Министерство обороны обсуждает новый суперкомпьютер Sony PlayStation».
  69. ^ «Кластеры PlayStation 3, обеспечивающие университеты недорогими суперкомпьютерами». Архивировано из оригинал 14 мая 2013 года.
  70. ^ «PlayStation 3 использовалась для взлома SSL, Xbox использовалась для игры в Boogie Bunnies». Engadget. Получено 19 сентября, 2012.
  71. ^ «Мэйнфреймы IBM Go 3-D». eWeek. 26 апреля 2007 г.. Получено 18 мая, 2007.
  72. ^ «PlayStation ускоряет проверку пароля». Новости BBC. 30 ноября 2007 г.. Получено 17 января, 2011.
  73. ^ "CELL: новая платформа для цифровых развлечений". Sony Computer Entertainment Inc. 9 марта 2005 г. Архивировано с оригинал 28 октября 2005 г.
  74. ^ Бергманн, Арнд (21 июня 2005 г.). "ppc64: представьте платформу Cell / BPA, v3". Получено 22 марта, 2007.
  75. ^ «Модель программирования сотового процессора». LinuxTag 2005. Архивировано из оригинал 18 ноября 2005 г.. Получено 11 июня, 2005.
  76. ^ Шенкленд, Стивен (21 марта 2006 г.). «Linux получает встроенную поддержку процессоров Cell». CNET. Получено 22 марта, 2007.
  77. ^ «Terra Soft предоставит Linux для PLAYSTATION3». Архивировано из оригинал 30 марта 2009 г.
  78. ^ Terra Soft - Linux для Cell, PlayStation PS3, QS20, QS21, QS22, IBM System p, Mercury Cell и Apple PowerPC В архиве 23 февраля 2007 г. Wayback Machine
  79. ^ "Y-Bio". 31 августа 2007 г. Архивировано с оригинал 2 сентября 2007 г.
  80. ^ "Арнд Бергманн о сотовом". IBM developerWorks. 25 июня 2005 г.
  81. ^ «Linux в системах на базе Cell BE». Барселонский суперкомпьютерный центр. Архивировано из оригинал 8 марта 2007 г.. Получено 22 марта, 2007.
  82. ^ "Mercury Computer Systems выпускает комплект разработки программного обеспечения для PLAYSTATION (R) 3 для высокопроизводительных вычислений". PRNewswire-FirstCall. 3 августа 2007 г.
  83. ^ ""CVCell "- модуль, разработанный Fixstars, ускоряющий библиотеку OpenCV для процессора Cell / B.E.". Корпорация Fixstars. 28 ноября 2007 г. Архивировано с оригинал 17 июля 2010 г.. Получено 12 декабря, 2008.

внешняя ссылка