Один из компонентов компьютера, от которого требуется наибольшая производительнось, это графический контроллер, являющийся сердцем всех мультимедиа систем. Фраза требуется производительность означает, что некие вещи происходят настолько быстро, насколько это обеспечивается пропускной способностью. Пропускная способность обычно измеряется в Мегабайтах в секунду, и показывает скорость, с которой происходит обмен данными между видеопамятью и графическим контроллером.
На производительность графической подсистемы влияют несколько факторов:
Для увеличения производительности графической подсистемы на столько, насколько это возможно, приходится снижать до минимума все препятствия на этом пути. Графический контроллер производит обработку графических функций, требующих интенсивных вычислений, в результате, разгружается центральный процессор системы. Отсюда следует, что графический контроллер должен оперировать своей собственной, можно даже сказать частной, местной памятью. Тип памяти, в которой хранятся графические данные называется буфер кадра (frame buffer). В системах, ориентированнных на обработку 3D приложениий, требуется еще и наличие специальной памяти, называемо z-буфер (z-buffer), в котором хранится информация о глубине изображаемой сцены. Также, в некоторых системах может иметься собственная память текстур (texture memory), т.е. память для хранения элементов, из которых формируются поверхности объекта. Наличие текстурных карт ключевым образом влияет на реалистичность изображения трехмерных сцен.
Появление насыщенных мультимедиа и видеорядом приложений, так же, как и увеличение тактовой частоты современных центральныъх процессоров, сделало невозможным и дальше использовать стандартную динамическую память со случайным доступом (DRAM). Современные мультимедиа контроллеры требуют от основной системной памяти большей пропускной способности и меньшего времени доступа, чем когда-либо ранее до этого. Идя навстречу новым требованиям, производители предлагют новые типы памяти, разработанные с помощью обычных и революционных методов. Впечатляющие усовершенствования делают проблему правильного выбора типа памяти для приложения особенно актуальной и сложной.
Производители улучшили технологии и создали новые архитектуры, в ответ на требования более высоких скоростей работы памяти. Широкий выбор новых типов памяти ставит перед производителем видеоадаптеров проблему, для какого сегмента рынка или каких приложений выбрать тот или иной тип.
Под воздействием требований перемен, полупроводниковая индустрия предлагает множество новых интерфейсов. Некоторые объединили в себе свойства существующих интерфейсов с ограниченным набором изменений, другие имеют совершенно новый дизайн и оригинальную архитектуру.
Существующие типы памяти, доступные производителям
видеоадаптеров, перечислены в нижеследующей таблице.
Тип | Свойства | Резюме |
---|---|---|
3D RAM | Ввстроенные вычислительные средства и кэш-память, реализованнные на уровне чипа. Высокая оптимизация для использования при выполнении трехмерных операций. | Технология рабочих станций для обработки 3D графики, которая обеспечивает таким платам, как Diamond Fire GL 4000 дополнительное увеличение производительности. Контроллер RealIMAGE обеспечивает продвижение этой технологии на рынок настольных компьютеров. |
Burst EDO | Дополнительный пакет регистров обеспечивает быстрый вывод строки из последовательных адресов. | Долгое время ожидания, если следующий адрес не является соседним в последовательности. |
CDRAM | Предшественник 3D RAM со встроенным в микросхему кэшем. Работаект с внешним контроллером кэш-памяти. | Идеально приспособлен быть основой для текстурной памяти и может быть органичным дополнением памяти типа 3D RAM с ее высокой пропускной способностью, например в адапторе Diamond Fire GL 4000. Контроллер RealIMAGE обеспечивает продвижение этой технологии на рынок настольных компьютеров. |
DRAM | Относится к группе промышленных стандартов. Дальнейшие совершенствования технологии DRAM основываются на низкой стоимости производства, но также произошло существенное увеличение пропускной способности. За два цикла данные считываются в и из памяти. | На основе этой технологии производятся некоторые из самых распространенных типов памяти. |
EDO DRAM | Использует стандартный интерфейс DRAM, но передача данных в и из памяти происходит с более высокой скоростью (или на более высокой частоте). Улушение производительности достигается за счет дополнительного внешнего чередования данных графическим контроллером (интерливинг). | В зависимости от графического контроллера, может иметь производительность на уровне более дорогой двухпортовой технологии памяти, такой, как VRAM, использующейся в графических контроллерах для систем на базе ОС Windows. |
MDRAM | Высокая пропускная способность, низкие задержки по времени, мелкоячеистость. | Компания Tseng Labs разработала контроллер, который смог использовать все преимущества архитектуры этой памяти. В среде DOS были достигнуты отличные результаты, в среде Windows всего лишь удовлетворительные. |
RDRAM | Возможный претендент на широкое распространение и принятие в качестве стандарта на память с высокой производительностью. | Поддерживается ограниченным числом графических контроллеров, но со временем ситуация может измениться. |
SDRAM | Производится по стандартам JEDEC, имеет большую производительность, чем DRAM. | Чаще используется в качестве основной системной памяти, нежили в графических адаптерах. |
SGRAM | Производится по стандартам JEDEC, разновидность SDRAM, однопортовая. Производительность оптимизирована для графических операций, но при этом имеет характеристики, свойственные высокоскоростной памяти, позволяющие использовать этот тип памяти для хранения текстур и z-буферизации. | Снабжена уникальными свойствами, большими и лучшими, чем у SDRAM, обеспечивающих высокую скорость обработки графики. Идеално подходит для графических адаптеров с одним недорогим банком памяти, использующимся для 2D/3D графики и цифрового видео. |
VRAM | Технология двухпортовой памяти, которая все еще остается лучшим решением для создания буферов кадра с высокой производительностью. | Не является дешевым решением, но для приложений, которым требуется разрешение 1280х1024 при истинном представлении цвета (True color), особенно с двойной буферизацией, это лучший из доступных выборов. |
WRAM | Высокоскоростная, двухпортовая технология памяти, используемая только двумя производителями видеоадаптеров - компаниями Matrox и Number Nine. Этот тип памяти изготавливает один производитель -- Samsung. По своему дизайну этот тип памяти аналогичен VRAM и RDRAM. | Нестандартный тип памяти, требующий использования специальной технологии в контроллерах. Технология изготовления таких контроллеров запатентована, следовательно, не является общедоступной. |
Скорость, с которой информация поступает на экран, и количество информации, которое выходит из видеоадаптера и передается на экран - все зависит от трех факторов:
Обычно, частота обновления экрана имеет значение не менее 75Hz или циклов в секунду. Следствием мерцание экрана является зрительное напряжение и усталость глаз при длительном наблюдении за изображением. Для уменьшения усталости глаз и улучшения эргономичности изображения, значение частоты обновления экрана должно быть достаточно высоким, не менее 75 Hz.
Число допускающих воспроизведение цветов или глубина цвета это десятичный эквивалент двоичного значения количества битов на пиксел. Так, 8 бит на пиксел эквивалентно 28 или 256 цветам, 16 битный цвет, часто называемый просто high-color, отображает более 65,000 цветов, а 24 битный цвет, также известный, как истинный или true color, может представить 16.7 миллионов цветов. 32 битный цвет, с целью избежать путаницы, обычно означает отображение истинного цвета с дополнительными 8 битами, которые используются для обеспечения 256 степеней прозрачности. Так, в 32 битном представлении каждый из 16.7 миллионов истинных цветов имеет дополнительные 256 степеней доступной прозрачности. Такие возможности представления цвета имеются только в системах высшего класса и графических рабочих станциях.
Ранее, настольные компьютеры были оснащены в основном мониторами с диагональю экрана 14 дюймов. VGA разрешение 640х480 пикселов вполне и хорошо покрывало этот размер экрана. Как только размер среднего монитора увеличился до 15 дюймов, разрешение увеличилось до значения 800х600 пикселов. Так как компьютер все больше становится средсвом визуализации, с более лучшей графикой, а графический интерфейс пользователя (GUI) становится стандартом, пользователи хотят видеть больше информации на своих мониторах. Мониторы с диагональю 17 дюймов становятся стандартным оборудованием для систем на базе ОС Windows и разрешение 1024х768 пикселов адекватно заполняет экран с таким размером. Некоторые пользователи используют разрешение 1280х1024 пикселов на 17 дюймовых мониторах.
Современной графической подсистеме для обеспечения разрешения 1024x768 требуется 1 Мегабайт памяти. Несмотря на то, что только три четверти этого объема памяти необходимо в действительности, графическая подсистема обычно хранит информацию о курсоре и ярлыках в буферной памяти дисплея (off-screen memory) для быстрого доступа. Пропускная способность памяти определяется соотношением того, как много мегабайт данных передаются в память и из нее за секунду времени. Типичное разрешение 1024х768, при 8 битной глубине представления цвета и частоте обновления экрана 75 Hz, требует пропускной способности памяти 1118 мегабайт в секунду. Добавление функций обработки 3D графики требует увеличения размера доступной памяти на борту видеоадаптера. В современных видеоакселераторах для систем на базе Windows типичен размер установленной памяти в 4 Мб. Дополнительная память, сверх необходимой для создания изображения на экране, используется для z-буфера и хранения текстур.
Первые чипы памяти, пригодные для использования в компьютерной графике были микросхемы DRAM. DRAM является энергозависимой памятью. Электрический заряд в каждой из ячеек памяти оставляет нулевой или единичный бит данных. Заряд каждой ячейки должен непрерывно обновляться с целью избежать потери электрического сигнала со временем, в следствии чего теряются хранящиеся в памяти данные. Требуется два цикла вычислений для считывания данных в память и из нее.
VRAM была разработана в качестве альтернативы DRAM и была призвана преодолеть ограничения по производительности, за счет считывания и записи данных из банков памяти за один цикл. В то же время, использование VRAM требует наличия специального контроллера, разработанного для использования именно с этим типом памяти. Рынок обоих типов памяти четко сегментирован. VRAM все еще используется в подсистемах, расчитанных на очень высокое разрешение и в которых очень важна возможность работы с 24-битным представлением цвета (например в системах CAD, верстки и цветоделения). Память типа DRAM используется в стандартных графических подсистемах, расчитанных, в основном, на офисное применение (электронные таблицы, текстовые процессоры). Однако, экзотические типы памяти все больше и больше используются вместо VRAM и DRAM в их традиционных областях применения. Все более отчетливо можно видеть, что для разных приложений предлагается использовать разные типы памяти.
Улучшения в архитектуре DRAM заключались в увеличении производительности, за счет ускорения разными путями скорости выполнения циклов чтения и записи. Типы памяти Fast Page Mode DRAM (FPM DRAM), Extended Data Out (EDO DRAM), Fast EDO DRAM и Burst EDO, могут служить примерами эволюции архитектуры DRAM. Эта традиционная, хотя и работающая быстрее, архитектура DRAM требует небольших или вообще не требует, изменений в интерфейсе графического процессора для использования в видеоподсистеме.
Ускорение работы этих типов памяти достигается за счет увеличения частоты, с которой происходят циклы чтения и записи DRAM. Время, требуемое на снаряжение зарядом конденсатора ячейки памяти DRAM, является физическим ограничением. Для преодоления этого ограничения DRAM, производители размещают высокопроизводительный буфер памяти между блоком памяти и графическим процессором. Это обеспечивает возможность увеличения пропускной способности, за счет организации сквозной очередности данных для всех блоков памяти, даже несмотря на то, что память DRAM может быть недостаточно быстрой для обработки данных приходящих от процессора. Этот эффект можно сравнить с быстрым входом массы людей в метро, когда несколько турникетов обслуживают сразу группу пассажиров. Вы можете наблюдать пакетное перемещение, когда за промежуток времени, требуемый для прохода через турникет одному человеку, происходит перемещение сразу нескольких пассажиров. В результате пропускная способность становится гораздо выше. В улучшенных архитектурах DRAM оптимизированы потоки информации в и из буфера, что обеспечивает оптимизацию потока данных из памяти и обеспечивает обновление содержимого ячеек памяти с большей, нежели нормальная, скоростью. В итоге, видно, что главной целью улучшений архитектуры было снижение времени ожидания, требуемого данным для запись в память и считывание из нее.
Новые экзотические технологии памяти предлагают лучшую производительность по сравнению с DRAM и более выгодную цену, чем у VRAM. Скорейшее внедрение этих новых типов памяти напрямую зависит от появления графических подсистем, которые их поддерживают. Скорость не является главным критерием. Большое число производителей и низкая стоимость, обусловленная массовым производством чипов памяти в больших количиствах, обеспечивают конкурентноспособные цены.
Создателем памяти типа 3D RAM является компания Mitsubishi, которая впоследствии оптимизировала ее для процессов визуализации изображений в 3D графике с помощью дополнительно встроенных в чип блоков арифметической логики (arithmetic logic unit - ALU), сравнения, видеобуферов последовательного доступа к памяти (serial access memory - SAM) и других функций.
3D RAM имеет двухпортовую архитектуру, аналогичную VRAM. Этот тип памяти имеет некоторое количество встроенной развитой логики и вычислительную мощность, которые обеспечивают параллелизм операций. Параллелизм операций это то, как чип справляется со своей работой при пиковой загруженности ширины полосы пропускания. Кроме этого, огромную помощь в обеспечении высокой производительности 3D RAM оказывают встроенные буферы. Память 3D RAM являет собой великолепную комбинацию лучших свойств архитектур VRAM, DRAM и embedded memory (встраиваемой памяти).
Память типа CDRAM (Cached DRAM - кэшированная память) cостоит из 4Mbit и 16Mbit DRAM и 16Kbit SRAM (кэш), отсюда и название. CDRAM используется в качестве текстурной памяти. При размещении элементов текстур (texels) в кэше минимизируется время случайного чтения текселов и обеспечивается прирост производительности. Скорость передачи необходимых для наложения текстурных элементов, текселов, из которых и состоят текстуры из памяти CDRAM достигает 800 Мб в секунду. CDRAM специально оптимизирована для минимизации случайных перемещений текстурных данных между графическим контроллером и памятью.
Память типа CDRAM имеет организацию:
CDRAM используется в качестве текстурной памяти и для кэширования высокоскоростных жестких дисков с интерфейсом Fibre Channel.
Оба типа памяти, CDRAM и 3D RAM, используются в комбинации с чипсетом 3Dpro от компании Mitsubishi, сделанного по технологии REALimage компании Evans & Sutherland.
Многобанковая (Multibank) DRAM или MDRAM, организована в виде большого массива независимых банков памяти с высокой пропускной способностью. Банки памяти MDRAM организованы вокруг внутренней, высокоскоростной общей шины внутри чипа памяти. Чрезвычайно большой объем данных может передаваться по этой шине. Каждый банк памяти вдоль шины также способен обрабатывать большой объем данных. Представьте себе узкое место на шоссе со множеством ответвлений. Каждое из ответвлений имеет много полос. Попадая на шоссе, большое количиство данных может выбраться с него через множество широких ответвлений. Чем больше данных может передаваться из основной шины, тем больше данных может перемещаться по ней, поступая в другие банки памяти. Это способ, с помощью которого достигается увеличение пропускной способности памяти в архитектуре MDRAM. Главная выгода от использования памяти типа MDRAM, это возможность получить пиковую пропускную способность в 800 Мб/с. Разработчиком памяти типа MDRAM является компания MoSys. Единственной компанией, которая сделала контроллер для этой памяти, была компания Tseng Labs. Эта же компания выпустила графические чипсеты ET6000 и ET6100, имеющие встроенный контроллер, обеспечивающий интерфейс для работы с MDRAM. В декабре 1997 года компания Tseng Labs была куплена корпорацией ATi Tech.. Вероятно, перспективные разработки Tseng Labs, в частности 128 разрядный чипсет ET6300 с поддержкой функций 3D графики, лягут в основу нового 128 разрядного графического процессора ATi Tech.
Компания Rambus для своего типа памяти RDRAM использует собственную внутреннию шину, для оперирования потоками с большим количеством данных. Новая технология позволяет чипам DRAM и контроллерам передавать данные со скоростью 500 мегабайт в секунду по каналу Rambus (Rambus Channel). Канал представляет собой узкую, шириной в байт, шину данных внутри чипа. Контроллер, управляющий каналом Rambus включает в себя Rambus ASIC cell (ячейка со специализированной интегральной схемой Rambus - RAC), которая обеспечивает электрический и логический интерфейс для памяти RDRAM. Теоритически, графический контроллер с RAC может поддерживать до четырех каналов Rambus, если они будут доступны. В этом случае станет возможным обеспечить пропускную способность до 2 гигабайт в секунду. Архитектура графического контроллера с RAC состоит из нескольких частей, самого контроллера и одного или двух DRAM компонентов. Возможность изменения количества составных частей является одним из преимуществ технологии Rambus. Другим достоинством является высокая пропускная способность каждого канала Rambus. Чем больше доступно каналов, тем быстрее работает память RDRAM.
В августе 1998 г. Samsung объявил об окончании разработки 64-Мбит модулей Rambus DRAM и о готовности к их массовому производству. Чип производится по технологии 0.23мкм и работает со скоростью 0.9-1Ггц. Это примерно в 10 раз быстрее нынешней PC-100 памяти. Samsung полон энтузиазма и планирует к 2000 году захватить около половины рынка памяти для PC.
Не так давно появившиеся на рынке синхронная DRAM (Synchronous DRAM - SDRAM) и синхронная графическая память (Synchronous Graphics RAM - SGRAM), являются высокопроизводительными наследниками памяти типа DRAM. Принцип, по которому работает SDRAM, можно сравнить с тем, как движется автомобиль по длинной дороге с множеством светофоров. Если на каждом перекрестке загорается красный свет, машина должна остановиться, а затем вновь начать движение. Если бы был способ, с помощью которого на пути следования встречалось бы как можно больше зеленых сигналов светофора, поездка была бы плавной и быстрой. SDRAM имеет средства, гарантирующие, что входящим и исходящим данным потребуются небольшие временные задержки, по сравнению с задержками при передаче данных через стандартную DRAM, необходимые для синхронизации всех элементов и строк данных внутри чипа памяти. В реализация SGRAM пошли еще дальше, определения количество перекрестков на нашей воображаемой улице, еще больше оптимизируя движение, по сравнению с SDRAM. В обоих случаях, скорость перемещения данных увеличивается, за счет полного контроля за временными издержками, требующимися различным элементам чипов памяти для функционирования. SDRAM и SGRAM имеют потенциальную возможность полностью заменить стандартную память DRAM. Эти типы памяти имеют простую архитектуру и не требуют слишком много специализированных управляющих схем. Со временем, стоимость SDRAM и SGRAM будет на уровне или ниже чипов DRAM. И это заметно невооруженным взглядом, стоит лишь вспомнить о динамике изменения цен на память за последний год. Этому способствовало наличие множества поставщиков, массовое производство и появление промышленных стандартов и спецификаций. Несомненными преимуществами SDRAM и SGRAM, по сравнению с DRAM, является большая пропускная способность и емкость чипов памяти.
Встраиваемая память. Мы уже определили, что главная цель при создании новых типов памяти, это передать данные в память и извлечь их оттуда так быстро, насколько это возможно. Соединение между чипами контроллера и чипами памяти является большим источником задержек по времени или замедлений, из-за того, что данным требуется время на перемещение между памятью и контроллером. Один из путей для минимизации физических ограничений устройств памяти, это разместить память в том же чипе, что и контроллер, т.е. внутри полупроводника. Когда так сделано, то этот тип памяти называется Embedded RAM. В микропроцессорах существует сравнимая ситуация, например Pentium II имеет арифметический процессор (его, по аналогии, можно сравнить с графическим контроллером), внутреннюю шину и внутреннюю память (кэш). До появления процессора Intel 8086, эти элементы процессора располагались в качестве отдельных компонентов на печатных платах. Каждому такому компоненту требуется свой собственный доступ к шине данных, свой собственный таймер и схема синхронизации, а так же собственная печатная плата, где все это смонтировано. Архитектура Embedded RAM тесно связывает процессор и память, снижая необходимость в дополнительных тактах и сигналах синхронизации, а так же уменьшает расстояние, которое должны преодолевать данные перемещаясь между компонентами. Среди преимуществ, которые могут появиться при использовании Embedded RAM можно назвать увеличение производительности и, потенциально, более низкую себестоимость. Однако, недостатком Embedded RAM является негибкость при использовании и возможные сложности при модернизации.
Windows RAM или WRAM, подобна VRAM и тоже является двухпортовой памятью. Ее два порта обеспечивают осуществление одновременного ввода и вывода графических данных. Выгода от использования двухпортовой памяти в том, что пока графические данные передаются и размещаются в буфере экрана, изображение на экране продолжает обновляться за счет графической информации, поступающей из того же буфера экрана и в то же время. Другое преимущество WRAM в том, что эта память имеет такую характерную особенность, как ускорение операций, за счет двойной буферизации. Двойная буферизация (Double buffering) означает, что запись одного графического изображения или кадра в память осуществляется в то же время, когда другое изображение считывается и выводится на экран. Это очень полезная функция для приложений, связанных с обработкой видео и 3D графики, в которых частота смены кадров является ключевым показателем производительности.
К сожалению, WRAM имеет лишь небольшое преимущество в цене по сравнению с VRAM, из-за того, что этот тип памяти производит всего одна компания -- Samsung. Существование всего одного поставщика какого-либо устройства не может гарантировать достаточных поставок для обеспечения повсеместного применения этих компонентов.
Существует два основных способа того, как и где разместить видеопамять:
Снаружи -- более традиционный подход, при котором память и графический контроллер используются в качестве двух независимых компонентов. Графический чипсет имеет интерфейс, обеспечивающий возможность использования различных типов памяти таких, как VRAM, DRAM, 3D RAM, CDRAM, SDRAM или WRAM. Архитектуры, поддерживающие память типа DRAM, свободно доступны от разных производителей. Что обеспечивает постоянную и последовательную поддержку этого типа памяти и гарантирует конкурентноспособные цены. Это же верно и для VRAM, несмотря на то, что этот тип памяти относится к high-end продуктам. Чем более быстрая видеопамять используется, тем более быстрой получается графическая подсистема. Комбинация 3D RAM и CDRAM с графическим контроллером RealIMAGE подтверждает эту точку зрения наиболее красноречиво.
Внутри -- встраиваемая память (embedded memory), являющаяся частью графического контроллера, кстати, этого было непросто достичь. Размещение видеопамяти внутри того же чипа, что и графический процессор обеспечивает невероятное снижение производственных затрат, уменьшает размеры компонентов и увеличивает быстродействие. Многие компании, такие как NeoMagic, Silicon Magic и NEC уже анонсировали производство таких компонентов. Производители графических чипсетов тоже анонсировали устройства со встроенными компонентами. Идея производства устройств со встроенными компонентами витала просто таки в воздухи в течении более чем пяти лет, и, возможно, сейчас мы становимся свидетелями становления нового стандарта.
Одно несомненно, обработка графики является одним из важнейших приложений среди прочих, которому требуется высокопроизводительная память, но в меньших объемах, чем нужно для системной (оперативной) памяти компьютера. Сам по себе тип памяти DRAM не отвечает потребностям основных графических приложений, в особенности после того, как 3D графика стала неотъемлемой частью мультимедиа в персональных компьютерах. Поэтому, богатый выбор новых типов видеопамяти, доступных для использования производителям графических адаптеров и подробно описанных в этом обзоре, необходим для достижения такого уровня производительности, который необходим современным Windows-акселераторам.
В этом параграфе будут описаны несколько новейших концепций архитектур памяти, которые возможно будут доступны для применения в ближайшие пару лет. В настоящее время нет графических контроллеров, которые позволяли бы использовать эти типы памяти в видеоадаптерах.
Ферроэлектрическая память -- Ferroelectric RAM (FeRAM), это энергонезависимый тип памяти, аналогичный Flash памяти, что означает возможность хранения данных без использования источников энергии. Чипы FeRAM имеют маленькую емкость, на уровне килобит, но производство 1 Мбит чипов FeRAM уже не за горами, этим занимается компания NEC. Ожидается, что этот тип памяти будет пригоден для использования в качестве системной (оперативной) памяти в персональных компьютерах и возможно в графических адаптерах. В настоящее время 1 Мбит чипы FeRAM имеют время доступа 60 ns, которое сопоставимо с временем доступа 40-50 ns у чипов DRAM. Корпорации NEC более интересно добиться большей емкости чипов FeRAM, например большей, чем 16 Мбит, и по мнению представителей компании этого следует ожидать в ближайшие 3-5 лет. Варианты чипов FeRAM с маленькой емкостью уже доступны в промышленных образцах для производителей компьютерного оборудования.
Другой игрок на этом рвнке - компания Fujitsu, которая ведет разработки чипов FeRAM с емкостью от 64Мбит до 1Гбит.
Около года назад, корпорация Intel объявила о своем намерении сделать технологию памяти Rambus основной архитектурой для изготовления системной памяти персональных компьютеров, в результате чего с 1999 года начнется вытеснение с этого рынка памяти типа SDRAM. Зная возможности Intel, можно с большой долей уверенности сказать, что так оно и будет. Специалисты корпорация Intel опробовали различные технологии памяти типа DRAM, прежде чем остановить свой выбор на технологии Rambus. Intel лицензировала архитектуру RDRAM у компании Rambus, после чего обе фирмы начали совместные разработки по созданию нового типа памяти, получившего наименование DRDRAM (Direct RDRAM). Кстати, компания Rambus выдала лицензии на свою технологию изготовления памяти семи крупнейшим производителям чипов DRAM и около 15 производителям контроллеров. Результатом выбора корпорацией Intel технологии Rambus может стать появление более быстрой и более совершенной памяти, которая будет применятся повсеместно.
Недавно, Intel закончила тестирование чипов DRDRAM от Toshiba в 64 Мбит и 72 Мбит исполнении. Все прошло нормально, чипы показали запланированную скорость передачи данных 1.6 Гб/с. Сейчас проводится тестирование чипов от LG, а компания Fujitsu заявила о своей готовности представить собственные варинты чипов DRDRAM. В общем, похоже 1999 год станет годом тотального наступления Rambus. Хотя сбрасывать со счетов DDR SDRAM и SLDRAM явно не стоит. Но в любом случае, кто бы ни стал победителем, а память менять придеться.
Уже давно, еще со времен 486 процессоров, отставание скорости системной шины PC от скорости убыстряющихся CPU все более увеличивалось. Именно тогда Intel впервые отказался от частоты процессоров, синхронной с частотой системной шины, и применил технологию умножения частоты FSB. Этот факт отразился даже в названии - 486DX2. Хотя частота системной шины осталась той же, несмотря на название, производительность процессора выросла почти вдвое.
В дальнейшем разброд в тактовой частоте различных системных компонентов только увеличивался: в то время, как частота системной шины выросла сначала до 66 МГц, а затем и до 100, шина PCI осталась все не тех же давних 33 МГц, для AGP стандартной является 66 МГц, и т.д. Шина памяти же до самого последнего времени оставалась синхронной с системной шиной (название обязывает - Synchronous DRAM, SDRAM). - Так появились спецификации PC66, затем PC100, потом, с несколько большими организационными усилиями, PC133 SDRAM.
Однако за то время, за которое частота шины памяти увеличилась на треть и, соответственно, на столько же возросла ее пропускная способность (с 800 Мбайт/с до 1,064 Мбайт/с), частота процессоров увеличилась в два с половиной раза - с 400 МГц до 1 ГГц. Наблюдается некоторый дисбаланс, не так ли? Пропускная способность PC133 SDRAM составляет лишь 1,064 Мбайт/с, тогда как сегодняшним PC требуется по крайней мере: 1 Гбайт/с для процессора с частотой системной шины 133 МГц, столько же - для графической шины AGP 4X, 132 Мбайт/с для 33 МГц шины PCI. То есть, около 2.1 Гбайт/с - как и говорилось только что, дисбаланс более чем в два раза.
Однако дальнейшее увеличение частоты SDRAM при современном техническом уровне оснащения ее производителей невозможно: Уже 166 МГц SDRAM получается слишком дорогой, особенно с учетом сегодняшних объемов оперативной памяти в PC. Этот момент, сыграл не слишком приятную шутку с Direct Rambus DRAM. В то же время отказываться от синхронизации шины памяти с системной шиной по ряду причин не хотелось бы.
Технологии, пытающиеся залатать SDRAM путем добавления кэша SRAM, вроде ESDRAM, или же путем оптимизации ее работы, вроде VCM SDRAM, не помогли. На выручку пришла популярная в последнее время в компонентах PC технология передачи данных одновременно по двум фронтам сигнала, когда за один такт передаются сразу два пакета данных. В случае с используемой сегодня 64-бит шиной - это два 8-байтных пакета, 16 байт за такт. Или, в случае с той же 133 МГц шиной, уже не 1,064, а 2,128 Мбайт/с. Те самые 2.1 Гбайт/с, что и требуются для сегодняшних PC.
Причем по цене, мало отличающейся от обычной 133 МГц памяти: технология та же (включая методику упаковки чипов - TSOP, не microBGA, как у RDRAM), оборудование - то же, энергопотребление, практически не отличающееся от SDRAM, площадь чипа отличается лишь на несколько процентов. Именно это сочетание доступности с требующейся на сегодняшний день производительностью и заинтересовало в первую очередь прагматичную индустрию DRAM - точно так же в свое время они выбирали PC66, PC100, PC133:
Однако в отличие от этих спецификаций, в название которых входила тактовая частота шины памяти, так же, как и в отличие от спецификации Direct Rambus DRAM, где за основу берется результирующая частота (тактовая частота, помноженная на те же два пакета на такт, что и у DDR SDRAM) - PC600, PC700, PC800, компании, разрабатывавшие DDR SDRAM, а точнее, маркетинговые отделы этих компаний, избрали ту систему (помните мультфильм про относительность единиц измерения - 48 попугаев?), которая позволила получить максимальную цифру в названии - они выбрали пиковую пропускную способность и получили PC1600 для 100 МГц и PC2100 для 133 МГц чипов DDR SDRAM.
Впрочем, эта система названий придумана совсем недавно, хотя чипы DDR SDRAM производятся уже достаточно давно: образцы 64 Мбит чипов появились почти два года назад - в середине 1998 г. Именно к тому времени, в декабре 1998 г., когда Intel уже продолжительное время поддерживал RDRAM, одобрена открытая спецификация DDR SDRAM, не требующая от производителей, использующих ее, никаких лицензионных отчислений. Как и в случае с PC133 SDRAM, основными сторонниками новой спецификации выступили IBM и VIA, к тому времени четко ориентировавшаяся на альтернативные RDRAM архитектуры. Несколькими месяцами спустя, в мае, одобрена спецификация 184-контактных модулей DIMM, а также закончена работа над спецификацией DDR SGRAM.
Примерно через полтора года DDR SDRAM доведен до стадии, когда производители DRAM в состоянии начать его коммерческое производство -появились уже образцы 133 МГц 64 Мбит чипов DDR SDRAM, соответствующие спецификации PC2100 и готовые к началу производства.
Однако первыми чипы DDR использовали отнюдь не производители модулей памяти. Производителям видеокарт проще - на карте они в праве применять что угодно, лишь бы на выходе был стандартный сигнал. Да и ширина шины памяти все же всегда была узким местом скорее для графических чипов, чем для центральных процессоров. Так что, производители видеокарт гораздо раньше воспользовались появившейся в графических чипах поддержкой DDR SDRAM/SGRAM.- Уже через несколько месяцев после выхода первого такого чипа, GeForce 256, появились карты с DDR SDRAM и SGRAM чипами на борту.
Стандартной скоростью чипов для первой волны DDR плат стали 150 и 166 МГц (результирующая частота - 300 и 333 МГц соответственно, пропускная способность шины, учитывая с учетом 128-бит разрядности - 4.8 и 5.2 Гбайт/с). Можно с большой уверенностью предположить, что осеннее поколение графических чипов будет ориентироваться на 183 МГц чипы (366 МГц, 6 Гбайт/с), а в 2001 г. мы увидим массовый выход видеокарт с 200 МГц (400 МГц, 6.4 Гбайт/с).
Результат замены SDRAM/SGRAM на их вдвое более быстрый аналог не замедлил сказаться. Производительность карт на системах с мощным центральным процессором при использовании приложений, оказывающих заметную нагрузку именно на шину памяти (например 32-бит цвет), возрастает до полутора раз.
Оценивая известную на сегодня информацию о планах разработчиков графических чипов на ближайший год, можно констатировать бесспорную победу DDR над RDRAM. После того, как Intel со своим i740 успешно продвинул AGP и отказался от дальнейших попыток прямого влияния в этой области, ситуацией к счастью, управляет рынок. Дорогой RDRAM оказался никому не нужен, тем более что 128-бит шина памяти выводит DDR SDRAM по производительности даже вперед двухканального RDRAM.
А вот с модулями памяти DIMM DDR SDRAM положение несколько иное: их востребовать некому: весь вопрос встал за чипсетами, обладающими поддержкой этого типа памяти и, соответственно, за материнскими платами на базе этих чипсетов. Первый пользовательский чипсет, обладающий поддержкой этого типа памяти, ожидался от VIA сначала осенью 99 г., затем зимой 2000, весной: Но вроде бы, наконец, ожидание подходит к концу. Уже во втором квартале должен выйти первый чипсет VIA, обладающий поддержкой DDR SDRAM - Apollo Pro266.
Ко все той же 133 МГц системной шине и AGP 4X добавится поддержка DDR SDRAM, а также V-Link - новой, ускоренной шины обмена информацией между северным и южным мостами чипсета, обеспечивающей пропускную способность 266 Мбайт/с (в два раза быстрее стандартной PCI). Кроме того, ожидается, что поддержка двухпроцессорных конфигураций, встроенная еще в Apollo Pro133A, станет официальной.
Чуть позже, в третьем квартале, ожидается выход варианта Apollo Pro266 с интегрированным видеоядром PM266. Причем, в отличие от PM133 с хиленьким по меркам третьего квартала Savage4, в этот чипсет будет встроен вариант Savage2000 (GX4C). Его производительности для дешевых систем, являющихся нишевым рынком для интегрированных чипсетов, должно быть более чем достаточно.
И в последнем квартале 2000 г. должен выйти первый серверный чипсет VIA, PX266V. Пока о нем известно мало, за исключением того, что там ожидается поддержка до 4 процессоров и двойная шина V-Link: к южному мосту и к подсистеме 64-бит 66 МГц PCI.
На вторую половину этого года запланирован выход и DDR чипсета для Athlon - KX266, по своим возможностям аналогичного своему собрату для Pentium III - Apollo Pro266. Но на всякий случай, AMD предпочла вновь подстраховаться, выпустив в третьем квартале свой чипсет с поддержкой DDR SDRAM - AMD 760. Ожидается поддержка новой частоты системной шины EV6 - 133 МГц (266 МГц), естественно, 133 МГц PC2100 DDR SDRAM, ATA100. Вскоре после AMD 760 должен последовать мультипроцессорный AMD 770 с аналогичными параметрами.
Если уж зашла речь о мультипроцессорных чипсетах, рассчитанных на серверные платформы, то нельзя не упомянуть еще двух игроков на этом рынке: Samsung со своим Caspian, разрабатываемым совместно с AMD, и ServerWorks со своей линейкой ServerSet, которая должна обзавестись DDR SDRAM чипсетом для процессоров Intel уже в первой половине этого года.
Учитывая такие факторы, как стоимость RDRAM, разницу в производительности RDRAM и DDR SDRAM, и падение производительности подсистемы памяти RDRAM при увеличении объема памяти, подавляющее большинство производителей серверов намеревается предпочесть DDR SDRAM перед RDRAM. С этим желанием вынужден считаться даже Intel, который в своем следующем серверных чипсете под x86 (i870) планирует поддерживать именно DDR SDRAM. Да и помимо Intel на рынке серверных чипсетов будет достаточно желающих поддержать DDR - кроме независимых разработчиков, на этом рынке выступят и сами производители серверов, разрабатывающие чипсеты под свои системы - IBM, NEC:
Кварталом позже выхода соответствующих чипсетов, ожидаются материнские платы на них. Так что первые платы, позволяющие использовать модули DDR SDRAM, должны выйти уже в третьем квартале 2000 г. И именно эти временные рамки указаны в планах различных производителей материнских плат. Первым и единственным неудобством для их пользователей должен стать новый форм-фактор модулей DIMM.
К сожалению, ничто на свете не дается даром и увеличение пропускной способности памяти вдвое сопровождается изменением форм-фактора модулей. При сохранении тех же размеров модуля число контактов увеличилось со 168 до 184. Изменившееся положение ключа не позволит вставить модули DIMM DDR SDRAM в сегодняшние разъемы DIMM.
Но перейдем к наиболее интересному моменту, связанному с большинством компонентов PC, - конкретным значениям производительности. К сожалению, результаты чипсетов VIA, с которыми предстоит столкнуться обычным пользователям, неизвестны. Но, по крайней мере, уже известны результаты чипсета Samurai от Micron. VIA, кстати, лицензировала у Micron наработки по части DDR, а сам Micron, вообще, не горит желанием выходить на рынок чипсетов, рассматривая Samurai в первую очередь как страховочный вариант для стимуляции продажи чипов DDR SDRAM в сочетании с регистрированными 133 МГц модулями DDR SDRAM (серверный вариант - более надежные, но более медленные, пользовательский вариант - более быстрые небуферизованные модули DIMM):
StreamD - признанный индустрией тест, оценивающий эффективную пропускную способность шины памяти. Результаты вряд ли нуждаются в комментариях, и как бы анонсируют все последующие результаты, полученные на приложениях, используемых в реальной жизни. Эти приложения, естественно, не столь зависят от пропускной способности шины памяти. Поэтому различия между платформами RDRAM и DDR очень сильно сглаживаются, но суть дела это не меняет: DDR в реальных приложениях в среднем незначительно превосходит RDRAM.
Теперь о перспективах. Стандарт модулей DIMM DDR SDRAM предполагает использование до 200 МГц чипов, с результирующей частотой 400 МГц и пропускной способностью 3.2 Гбайт/с - как у двухканального Direct Rambus DRAM. С того момента, когда DDR SDRAM исчерпает свои возможности, в 2003 г. должен стартовать DDR-II.
Скорость DDR-II чипов, как предполагается, начнется со 100 МГц, но за счет того, что будет передаваться 4 пакета данных за такт, их пропускная способность также должна составить 3.2 Гбайт/с. Учитывая такую технологию работы (передачу 32 байтов за такт) рост производительности DDR-II чипов при росте тактовой частоты будет максимальным - в 4 раза: 150 МГц дадут уже 4.8 Гбайт/с, а 200 МГц - 6.4 Гбайт/с.
Модули на этих чипах, как и модули на чипах DDR, также будут иметь свой собственный форм-фактор (230 контактов), и требовать новых чипсетов. То же самое можно сказать и о чипах Advanced DRAM Technology, которые должны появиться примерно в то же время.
До тех пор, еще три года, нам предстоит выбирать лишь между DDR SDRAM и Direct Rambus DRAM. Если Intel не будет силой влиять на рынок (а он будет!), то результат, учитывая соотношение цена/производительность, выглядит вполне понятным - выигрывает DDR SDRAM. В противном случае ситуация становится непредсказуемой: трудно просчитать, что пересилит - финансовая мощь Intel, или здравый смысл индустрии, и в какой пропорции проявят себя эти два компонента в конечном результате.
В любом случае, если отстраниться от экстремистских точек зрения, то можно констатировать, что как бы ни сложилась ситуация, судьба DDR SDRAM сегодня видится в более радужных оттенках, нежели, скажем, год назад. За этот год успел выйти Athlon, AMD набрала вес, а VIA - сделала ставку на DDR SDRAM. Поэтому, что бы ни произошло на рынке решений от Intel, те, кто будет приобретать в конце этого года процессоры AMD, просто обречены на DDR SDRAM. А это, если ситуация с ценой на RDRAM не изменится кардинально до конца года, уже само по себе выглядит неплохим аргументом в пользу выбора решения от AMD/VIA для тех, кто предпочитает делать покупки, руководствуясь разумом, а не рекламой.
Платформы от ServerWorks, которая сегодня выступает для Intel в роли страховочного варианта, закрывая те области на серверном рынке x86, которые не в состоянии закрыть Intel, смогут выступить столь же достойным ответом на i840 с двумя каналами Rambus на рынке решений для рабочих станций и серверов, как чипсеты VIA - на рынке обычных пользовательских PC.
По предварительным тестам прототипа Samurai, производительность системы на его основе равна производительности системы на базе i840, а порой и обгоняет ее. Это с учетом цены модулей RIMM, которая вряд ли уменьшится в несколько раз в течение года, и объем памяти в серверах и рабочих станциях дает разницу в стоимости между решениями на базе DDR SDRAM и RDRAM в тысячи долларов при равной производительности.
Итог: производители DRAM не могут позволить себе не выпускать DDR SDRAM. Рынок для этого типа памяти существует, он весьма велик. Затрат для перехода на DDR SDRAM почти не требуется. Себестоимость изготовления чипов не слишком отличается от себестоимости изготовления чипов SDRAM той же тактовой частоты. Стоимость RDRAM столь высока, что пользователи, даже при неудовлетворенном спросе на память, зачастую просто не могут позволить себе увеличить объем памяти в своих PC. Получился парадокс: если отбросить PC133 SDRAM, как технологию, принадлежащую к предыдущему поколению, то на рынке общедоступной памяти просто нет предложения. Ну не считать же таковым безбожно дорогой RDRAM? При данных обстоятельствах воздержаться от выпуска DDR SDRAM было бы непростительной глупостью.
Складывается, наконец, и вторая половина мозаики: чипсеты и материнские платы. Во второй половине 2000 г. на рынке будет вполне достаточно решений, полностью закрывающих поддержкой DDR SDRAM весь спектр рынка: чипсеты VIA и AMD - High-End PC на базе Pentium III и Athlon, чипсеты AMD и Samsung - серверы и рабочие станции на базе Athlon, чипсеты ServerWorks - серверы и рабочие станции на базе Pentium III.
Доступен, дешев, производительность RDRAM по цене SDRAM... Жить будет. И неплохо.
Enhanced SDRAM (ESDRAM - улучшенная SDRAM) более быстрая версия SDRAM, сделанная в соответствии со стандартом JEDEC компанией Enhanced Memory Systems (EMS). С точки зрения времени доступа, производительность ESDRAM в два раза выше, по сравнению со стандартной SDRAM. В большинстве приложений ESDRAM, благодря более быстрому времени доступа к массиву SDRAM и наличию кэша, обеспечивает даже большую производительность, чем DDR SDRAM.
Более высокая скорость работы ESDRAM достигается за счет дополнительных функций, которые используются в архитектуре этой памяти. ESDRAM имеет строку кэш-регистров (SRAM), в которых хранятся данные, к которым уже было обращение. Доступ к данным в строке кэша осуществляется быстрее, чем к ячейкам SDRAM, со скоростью 12 ns, т.к. не требуется обращаться к данным в строке через адрес в колонке. При этом скорость работы ячеек ESDRAM составляет 22 ns, в отличие от стандартной скорости работы ячеек SDRAM, имеющей значения 50 - 60 ns.
При этом стоит заметить, что память ESDRAM полностью совместима со стандартной памятью JEDEC SDRAM на уровне компонентов и модулей, по количеству контактов и функциональности. Однако, что бы использовать все преимущества этого типа памяти необходимо использовать специальный контроллер (чипсет).
Увеличение производительности при использовании ESDRAM достигается за счет применения двух банковой архитектуры, которая состоит из массива SDRAM и SRAM строчных регистров (кэш). Строчные регистры вместе с быстрым массивом SDRAM обеспечивают более быстрый доступ для чтения и записи данных, по сравнению со стандартной SDRAM. ESDRAM может работать в режиме "упреждающего обращения" к массиву SDRAM, в результате, следующий цикл записи или чтения может начаться в момент, когда выполнение текущего цикла не завершено. Возможность использовать такой режим напрямую зависит от центрального процессора, управляющего работой конвейера адресации.
С точки зрения применения в качестве системной (оперативной) памяти компьютера, чипсет VCS-164 (Polaris) компании VLSI Technology поддерживает ESDRAM, правда этот чипсет рассчитан для применения в системах на базе процессора Alpha. ESDRAM полностью соответствует спецификации Intel PC-100 SDRAM, и соответственно, совместима с чипсетами Intel 440BX и Via Technologies MVP-3.
Fast Cycle Random Access Memory (FCRAM). Разработчик этого типа памяти - компания Fujitsu. В основу этого типа памяти легла принципиально иная концепция по сравнению с DRAM. Время выполнения цикла соответствует всего 20нс, т.е. в 3-4 раза меньше, чем у нынешних модулей DRAM. Это достигнуто благодаря двум принципиальным моментам. Во-первых, в отличие от современных чипов памяти, где сначала выясняется адрес строки (RAS), а потом, после некоторой задержки адрес столбца (CAS), где находится нужная ячейка, в FCRAM мгновенно выясняются обе координаты. Во-вторых, существующая память типа DRAM имеет время выполнения цикла 70нс, из-за того, что после выполнения каждой операции над ячейкой должна пройти команда сброса. В FCRAM же встроена цепь автоматического сброса, благодаря чему возможна конвейерная обработка команд, где следующая команда начинает выполняться еще до окончания выполнения предыдущей. Итог - время выполнения цикла - 20нс. В результате, мы получаем очень интересный гибрид. По скорости работы FCRAM более напоминает SRAM, а по объему - обычную память DRAM.
MRAM - Magnetic random access memory. Разработчик - компания Toshiba. Уже есть пробный образец основной структуры чипа MRAM, воплощающего в себе новую технологию памяти, потенциально способную превзойти существующие типы DRAM и по скорости, и по объему, и по энергопотреблению. Уже этот тестовый образец демонстрирует выдающиеся скоростные качества - цикл чтения занимает всего 6 нс.
Согласно заявлению компании, технология хранения информации в чипе MRAM заключается в создании элемента с мелкими частицами платины и кобальта, находящихся между двумя магнитными слоями. Запись и чтение происходят путем изменения магнитной активности в контуре.
Toshiba планирует создать прототип чипа MRAM к 2000 году. Примерно тогда же планируют создание первых чипов MRAM и ее конкуренты: Motorola, IBM, Siemens и Philips.