Рефераты

Процессоры

чипа AMD5k86-P90 - $99.

Характеристики микропроцессора AMD5k86:

- 4-потоковое суперскалярное ядро с 6-ю параллельно работающими

исполнительными устройствами, составляющими 5-ступенчатый конвейер;

- 4-потоковый ассоциативный кэш команд с линейной адресацией объемом 16

Кб;

- 4-потоковый ассоциативный кэш данных с обратной записью и линейной

адресацией объемом 8 Кб;

- полное переупорядочивание выполнения инструкций, предварительное

(speculative) исполнение;

- динамический кэш предсказания переходов объемом 1 Кб; в случае

неправильного предсказания задержка составляет менее 3 внутренних тактов;

- 80-разрядное интегрированное, высокопроизводительное устройство

выполнения операций с плавающей запятой, обладающее небольшим временем

задержки при выполнении операций +/*;

- питающее напряжение - 3В, система SSM (System Management Mode) для

уменьшения потребляемой мощности;

- 64-разрядная шина и системный интерфейс помещены в 296-контакный

корпус SPGA, совместимый по выводам с процессором Pentium (P54C) и

процессорным гнездом Socket-7;

- полная совместимость с Microsoft Windows и инсталлированной базой ПО

для процессоров архитектуры х86.

4.2.2.2. Пример маркировки микропроцессора AMD5k86-P75.

---------------------------------------------

| #### ### ### ###### ----------- |\

| ## ## ## ### ## ## ## `\------ | |\

| ###### ## # ## ## ## /| | | |\

| ## ## ## ## ###### | ----,| | |\

| ----/ \| |\

1 -------------------- |\

2 -------- AMD5k86тм-Р75 |\

3 ------------------------ |\

4 -------- AMD-SSA/5-75ABQ |\

| E | Designed for |\

5 ----------------------- /\/------- |\

| (m) (c)1996AMD /\/------- |\

| /\/------- |\

| Microsoft |\

6 -------- HEAT SINK ---------- |\

\ AND FAN REQ'D Windows 95 тм |\

\ |\

`----------------------------------------

--\

\ \ \ \ \ \ \ \ \ \ \ \ \ \

\ \ \ \ \ \ \ \

Обозначения:

1. P-рейтинг 5. Питающее напряжение

2. Название B=3.45 - 3.60B

3. Температура корпуса C=3.30 - 3.465B

W=55C R=70C F=3.135 - 3.465B

Q=60C Y=75C H=2.76 - 3.0B

X=65C Z=85C J=2.57 - 2.84B

4. Серийный номер K=2.38 - 2.63B

6. Температурный режим

4.2.2.3. Тесты.

Система Р – рейтингов измерения производительности процессоров была

предложена в начале 1996 года компаниями AMD, Cyrix, IBM и SGS – Thomson

Microelectronics. P-рейтинг составляется, по результатам проведения

эталонного теста Winstone 96, разработанного издательством Ziff – Davis

Этот тест представляет собой набор из 13 наиболее часто применяемых

приложений, таких как Microsoft Word и Exel.

Следует заметить, что в отличие от системы тестов iComp, которой

пользуется корпорация intel для оценки производительности своих

микропроцессоров, тестовый набор Winstone 96 является общедоступным.

В своем новом чипе AMD5k86 компания AMD воплотила поистине

новаторское сочетание набора инструкций х86 и суперскалярной RISC-

архитектуры (reduced instruction set computing architecture). Как

утверждают некоторые специалисты AMD, благодаря такому решению

микропроцессор AMD5k86 обеспечивает на 30% большую производительность, чем

процессор Pentium с такой же тактовой частотой. Впрочем, результаты

тестирования с использованием пакета тестов Winstone 96 компании Ziff –

Davis показывают, что преимущество несколько скромнее.

Тестовая конфигурация:

|Материнская плата |FIC PA2002 |

|Чипсет |VIA Apollo Master |

|ОЗУ |EDO DRAM объемом 16 Мб |

|Кэш-память L2 |256 Кб |

|Видеоплата |PCI Diamond Stealth64 3200 |

|(640х480х256) |Diamond GT 4.02.00.218 for Windows 95 |

|Видеодрайвер |EIDE Quantum Fireball емкостью 1.2 Гб |

|Жесткий диск | |

AMD5k85-P75 CPU (index 48.8)

Pentium 75 (index 47.4)

AMD5k85-P90 CPU (index 56.7)

Pentium 90 (index 54.9)

4.2.2.4. Материнские платы для AMD5k86.

Список широко распространенных системных плат, протестированных в

лабораториях компании AMD и

рекомендованных для установки процессора AMD5k86.

|Производитель |Модель |Чипсет |BIOS |

|Abit |PH5 1.3 |SiS 551 |Award Pentium PCI|

| | | |Sys BIOS (N35) |

|Abit |PH5 2.1 |Intel Triton |Award Pentium PCI|

| | | |Sys BIOS (C4) |

|Atrend |ATC1000 |Intel Triton |Award |

| | | |i430-2A59CA29C-00|

|Atrend |ATC1545 A1 |OPTi Viper |Award OPTi Viper |

| | | |ATS-1545 ver. |

| | | |0.6. |

|Biostar |8500TAC A1 |Intel Triton |AMI 1993 |

|ECS |TR5510 |Intel Triton |Award |

| | | |i430FX-2A59CE1NC-|

| | | |00 |

|ECS |AIO |Intel Triton |Award |

| | | |i430FX-2A59CE1NC-|

| | | |00 |

|FIC |PA2002 1.21 |VIA 570 |Award 4.052G800 |

|Gigabyte |GA586ATS 1B |Intel Triton |Award Intel 430FX|

| | | |PCI-ISA v.1.26 |

|Hsingtech |M507 1.1 |Intel Triton |Award 2/1/1996x |

|Mycomp (TMC) |PCI54ITS 2.00 |Intel Triton |Award |

| | | |i430FX-2A59CM29C-|

| | | |00 |

|Замечание: ранние версии указанных системных плат нуждаются в|

|замене BIOS на более новую версию, правильно распознающую чип|

|AMD5k86 |

4.2.2.5. AMD планирует выпустить K5.

Репутация AMD сильно зависит от успешности затянувшегося проекта К5-

первой самостоятельной пробы архитектурных сил в области х86. Рождение К5

опасно откладывается уже не первый раз. В первом квартале следующего года

AMD планирует перевод K5 на технологический процесс с проектными нормами

0.35 мкм и с трехуровневой металлизацией, разработанный при содействии с HР

и запускаемый на новом заводе AMD Fab 25 в Остине, штат Техас. Это позволит

уменьшить К5 с

4.2 миллионами транзисторов до 167 кв. мм и поднять процент выхода годных,

а также тактовую частоту.

По мнению руководства AMD в 1996 году объем выпуска К5 будет

наращиваться достаточно быстро, что позволит отгрузить до конца года более

пяти миллионов процессоров. Ответом на вызов Intel с ее процессором Pentium

Pro может стать только процессор К6, но уже никто не верит, что его удастся

увидеть раньше 1997 года. Hесмотря на всемирный переход на процессор

Pentium, в следующем году еще могут сохраниться некоторые рынки для 486-х.

Эксперты считают, что потребность таких региональных рынков, как Китай,

Индия, Россия, Восточная Европа и Африка, в 486-х чипах составит до 20

миллионов процессоров в 1996 году. AMD рассчитывает, что именно ей удастся

поставить большую часть от этого количества. Поэтому компания повышает

тактовую частоту 486-х до 133 Мгц, чтобы конкурировать с низшими версиями

процессора Pentium в настольных ПК начального уровня. Однако, AMD будет

усиленно наращивать выпуск К5, поскольку 486-е быстро выходят из моды.

4.3. Процессоры NexGen.

В то время: как компания Intel готовила отрасль к шокирующему выходу

в жизнь серийных моделей серверов и настольных машин на Pentium Pro, фирма

NexGen представляла форуму свои планы по разработке процессора Nx686. Этот

суперскалярный х86-совместимый процессор, к разработке которого

подключается еще и команда архитекторов из AMD, снятых с собственного

неудачного проекта К6, будет содержать около 6 млн. транзисторов, включая

вычислитель с плавающей точкой на одном кристалле с процессором (отказ от

предыдущего двухкристалльного подхода, ослабившего Nx586). Технология КМОП

с проектными нормами 0,35 мкм и пятислойной металлизацией позволила

"упаковать" на одном кристалле семь исполнительных узлов: два для

целочисленных, один для операций с плавающей точкой, по одному для

обработки мультимедиа, команд переходов, команд загрузки и команд записи.

Показатели производительности представители NexGen назвать не смогли, но

выразили предположение, что он превзойдет Pentium Pro на 16-разрядных

программах вдвое, а на 32-битовых - на 33 %.

До сих пор мало что известно про Nx686, так как чип еще не

анонсировался и NexGen не хочет раскрывать козыри перед конкурентами в лице

AMD, Cyrix и Intel. Однако, NexGen не хочет раскрывать козыри перед

конкурентами в лице AMD, Cyrix и Intel. Однако, NexGen настаивает о том,

что Nx686 по производительности сопоставим с интеловским Pentium Pro и AMD

K5, и наследует микроархитектуру Nx586, появившуюся в 1994 году. NexGen

называет ее RISC86. Базовая ее идея, как и в случае с Pentium Pro и K5,

состоит в преобразовании сложных CISC-команд программного обеспечения x86 в

RISC-подобные операции, исполняемые параллельно в процессорном ядре RISC-

типа. Этот подход, известный под названием несвязанной микроархитектуры,

позволяет обогатить CISC-процессор новейшими достижениями RISC-архитектур и

сохранить совместимость с имеющимся ПО для х86.

В Nx686 эта философия продвинута на новый логический уровень. Сегодня

в Nx586 имеется три исполнительных блока, трехконвейерное суперскалярное

ядро. Он способен выполнять в каждом такте по одной команде х86.

Возможности для совершенствования очевидны: Nx586 будет содержать пять

исполнительных блоков, четыре конвейера и несколько декодеров, способных

справиться с выполнением двух или даже более команд х86 за один машинный

такт. Для этого потребуется встроить дополнительные регистры переименования

и очереди команд.

Подход к использованию интегрированного кэш-контроллера и интерфейса

для скоростной кэш-памяти остается неизменным. Представители NexGen

говорят, что они изучают возможность использования кристалла вторичной кэш-

памяти по образцу и подобию Intel, тем более что их производственный

партнер IBM Microelectronics способен делать статическую память и

многокристальные сборки (MCM - multichip modules).

Пример практической реализации технологии МСМ фирмы IBM представляет

новая версия процессора Nx586, запланированная к выпуску на конец этого

года и включающая кристалл CPU и FPU в одном корпусе. Одновременное

перепроектирование топологии с масштабированием до размера линии 0.35

микрон позволит компании NexGen основательно уменьшить размеры кристалла

ЦПУ - до 118 кв. мм - меньше в этом классе ничего нет.

NexGen, новичок в группе производителей процессоров х86. Nx596 может

параллельно обрабатывать на нескольких исполнительных блоках до четырех

простейших операций, которые названы командами RISC86. Процессор К5 имеет

похожий четырехпоточный дешифратор, но результаты его работы компания

называет R – ops.

4.4. Процессоры Cyrix.

Первая вещь из грандиозного проекта М1 компании Cyrix, наконец

обнародована. Это процессор Сх 6х86-100, монстроподобный кристалл которого

сложен и очень дорог для того, чтобы претендовать на массовый выпуск в

течении длительного срока. Его проблемы сможет решить процессор, который

пока имеет кодовое название M1rx и опирающийся на техно процесс с

пятислойной металлизацией, идущий на смену трехслойной версии той же 0.6-

мкм технологии. Если проект увенчается успехом, то размер кристалла с 394

кв. мм уменьшится до 225 кв. мм, тогда у Cyrix появится шанс поднять

тактовую частоту до 120 МГц. В этом случае эксперты предсказывают ему

производительность в пределах 176-203 по тесту SPECint92, т.е. на уровне

процессора Pentium 133 (SPECint92=190.9) или 150 МГц. Если все обещания

сбудутся, то Cyrix сможет продать столько процессоров, сколько произведет.

Также компания cyrix предложила компромиссный вариант процессора - 5х86,

основанного на ядре 486-го, усиленного элементами архитектуры 6х86.

Стартовая версия этого гибрида будет совместима по цоколевке с гнездом 486-

го.

4.5. Процессоры Sun Microsystems.

Sun Microsystems процессор UltraSparc-II. Впервые вводя RISC-

технологию, SUN в 1988 году объявила SPARC в качестве масштабируемой

архитектуры, с запасом на будущее. Однако, с 1993 года реализация

SuperSparc стала на шаг отставать от своих конкурентов.

С появлением UltraSparc, четвертого поколения архитектуры SPARC,

компания связывает надежды на восстановление утраченных позиций. Он

содержит ни много, ни мало, но девять исполнительных блоков: два

целочисленных АЛУ, пять блоков вычислений с плавающей точкой (два для

сложения, два для умножения и одно для деления и извлечения квадратного

корня), блок предсказания адреса перехода и блок загрузки/записи.

UltraSparc содержит блок обработки переходов, встроенный в первичную кэш

команд, и условно выполняет предсказанные переходы, но не может выдавать

команды с нарушением их очередности. Эта функция перекладывается на

оптимизирующие компиляторы.

Архитектура SPARC всегда имела регистровые окна, т.е. восемь

перекрывающихся банков по 24 двойных регистра, которые могут предотвратить

остановки процессора в моменты комплексного переключения, связанные с

интенсивными записями в память. Разработчики компиляторов склонны считать

эти окна недостаточным решением, поэтому в UltraSparc используется

иерархическая система несвязанных шин. Шина данных разрядностью 128 бит

работает на одной скорости с ядром процессора. Она соединяется через

буферные микросхемы с 128-разрядной системной шиной, работающей на частоте,

составляющей половину, треть или четверть скорости процессорного ядра. Для

согласования с более "медленной" периферией служит шина ввода-вывода Sbus.

Фирма Sun реализует эту схему на аппаратном уровне с помощью

коммутационной микросхемы, являющейся составной частью схемного комплекта

окружения. Эта микросхема может изолировать шину памяти от шины ввода-

вывода, так что ЦПУ продолжает, например, запись в графическую подсистему

или в иное устройство ввода-вывода, а не останавливается во время чтения

ОЗУ. Такая схема гарантирует полное использование ресурсов шины и

установившуюся пропускную способность

1.3 Гигабайт/с.

В процессоре UltraSparc – II используется система команд Visual

Instruction Set (VIS), включающая 30 новых команд для обработки данных

мультимедиа, графики, обработки изображений и других целочисленных

алгоритмов. Команды VIS включают операции сложения, вычитания и умножения,

которые позволяют выполнять до восьми операций над целыми длинной байт

параллельно с операцией загрузки или записи в память и с операцией перехода

за один такт. Такой подход может повысить видеопроизводительность систем.

4.6. Процессоры Digital Equipment.

Digital Equipment процессор Alpha наиболее тесно следует в русле RISC-

философии по сравнению со своими конкурентами, "посрезав излишки сала" с

аппаратуры и системы команд с целью максимального спрямления маршрута

прохождения данных. Разработчики Alpha уверены, что очень высокая частота

чипа даст вам большие преимущества, чем причудливые аппаратные излишества.

Их принцип сработал: кристалл 21164 был самым быстрым в мире процессором со

дня своего появления в 1995 году. Процессор 21164 в три раза быстрее на

целочисленных вычислениях, чем Pentium-100, и превосходит на обработке

числе с плавающей точкой, чем суперкомпьютерный набор микросхем R8000 фирмы

Mips. Топология процессора следующего поколения 21164А не изменилась, но

она смаштабирована, кроме того, модернизирован компилятор, что повысило

производительность на тестах SPECmarks. Предполагается, что готовые образцы

нового процессора, изготовленные по КМОП - технологии с нормами 0.35

микрон, при тактовой частоте свыше 300 МГц будут иметь производительность

500 по SPECint92 и 700 по SPECfp92.

Процессоры семейства 21164 на прибегают к преимуществам исполнения не

в порядке очередности (out – of – order), больше полагаясь на

интеллектуальные компиляторы, которые могут генерировать коды, сводящие к

минимуму простои конвейера. Это самый гигантский процессор в мире - на

одном кристалле размещено 9.3 миллиона транзисторов, большая часть которых

пошла на ячейки кэш-памяти. Alpha 21164 имеет на кристалле относительно

небольшую первичную кэш прямого отображения на 8 Кбайт и 96 Кбайт

вторичной. За счет вздувания площади кристалла достигнута беспрецедентная

производительность кэширования.

В 21164 работает четыре исполнительных блока (два для целых и два для

чисел с плавающей точкой) и может обрабатывать по две команды каждого типа

за такт. Он имеет четырехступенчатый конвейер команд, который "питает"

отдельные конвейеры для целых чисел, чисел с плавающей точкой и конвейер

памяти. По сравнению с прочими RISC-процессорами нового поколения чип 21164

имеет относительно глубокие и простые конвейеры, что позволяет запускать их

с более высокой тактовой частотой.

Конвейер команд вообще не заботится о их зависимости по данным (в

отличие от pentium Pro, который является ярким примером машины данных), он

выдает команды в порядке их поступления на свой вход (в порядке следования

по программе). Если текущие четыре команды невозможно послать сразу все на

различные исполнительные блоки, то конвейер команд останавливается до тех

пор, пока это не станет возможным. В отличие от конкурентов 21164 также не

использует технику переименования регистров, вместо нее он непосредственно

обновляет содержимое своих архитектурных регистров, когда результат

достигает финальной ступени конвейера – write – back. Для борьбы с

задержками и зависимостью команд по данным в процессоре активно

используются маршруты для обхода регистров, поэтому совместно используемые

операнды становятся доступными до стадии write - back.

Компания Digital продвигает Альфу как платформу для серверов Windows

NT, а не как традиционный UNIX-сервер.

4.7. Процессоры Mips.

Mips процессор R1000 унаследовал свой суперскалярный дизайн от R8000,

который предназначался для рынка суперкомпьютеров научного назначения. Но

R1000 ориентирован на массовые задачи. Использование в R1000 динамического

планирования команд, которое ослабляет зависимость от перекомпиляции ПО,

написанного для более старых процессоров, стало возможным благодаря тесным

связям Mips со своим партнером Silicon Graphics, имеющим богатейший тыл в

виде сложных графических приложений.

R1000 первый однокристальный процессор от Mips. Для предотвращения

остановок конвейера в нем использовано динамическое предсказание переходов,

с четырьмя уровнями условного исполнения, с использованием переименования

регистров, гарантирующего, что результаты не будут передаваться в реальные

регистры до тех пор, пока неясность по команде перехода не будет снята.

Процессор поддерживает "теневую карту" отображения своих регистров

переименования. В случае неверного предсказания адреса перехода он просто

восстанавливает эту карту отображения, но не выполняет фактической очистки

регистров и "промывки" буферов, экономя таким образом один такт.

R1000 отличается также радикальной схемой внеочередной обработки.

Порядок следования команд в точном соответствии с программой сохраняется на

трех первых ступенях конвейера, но затем поток разветвляется на три очереди

(где команды дожидаются обработки на целочисленном АЛУ, блоке вычислений с

плавающей точкой и блоке загрузки/записи). Эти очереди уже обслуживаются по

мере освобождения того или иного ресурса.

Предполагаемая производительность R1000, выполненного по КМОП-

технологии с нормами 0.35 микрон должна достичь 300 по SPECint92 и по

SPECfp92.

Программный порядок в конце концов восстанавливается так, что самая

"старая" команда покидает обработку первой. Аппаратная поддержка исполнения

в стиле out – of – order дает большие преимущества конечному пользователю,

так как коды, написанные под старые скалярные процессоры Mips (например,

R4000), начинают работать на полной скорости и не требуют перекомпиляции.

Хотя потенциально процессор R1000 способен выдавать по пять команд на

исполнение в каждом такте, он выбирает и возвращает только четыре, не

успевая закончить пятую в том же такте.

Одно из двух устройств для вычисления двойной точности с плавающей

точкой занято сложениями, а другое умножениями/делениями и извлечением

квадратного корня. Hа кристалле R1000 реализован также интерфейс внешней

шины, позволяющий связывать в кластер до четырех процессоров без

дополнительной логики обрамления.

4.8. Процессоры Hewlett – Packard

Hewlett – Packard процессор PA-8000. Компания Hewlett – Packard

одной из первых освоила RISC-технологию, выйдя еще в 1986 году со своим

первым 32-разрядным процессором PA-RISC. Практически все выпускаемые

процессоры PA-RISC используются в рабочих станциях HP серии 9000. В период

с 1991 по 1993 (перед появлением систем на базе PowerPC) HP отгрузила

достаточно много таких машин, став крупнейшим продавцом RISC-чипов в

долларовом выражении.

С целью пропаганды своих микропроцессоров среди других производителей

систем компания HP стала организатором организации Precision RISC

Organization (PRO). А в 1994 году компания взорвала бомбу, объединившись с

Intel для создания новой архитектуры. Это поставило под сомнение будущее

PRO.

PA-8000 это 64-разрядный, четырехканальный суперскалярный процессор с

радикальной схемой неупорядоченного исполнения программ. В составе

кристалла десять функциональных блоков, включая два целочисленных АЛУ, два

блока для сдвига целых чисел, два блока multiply/accumulate (MAC) для чисел

с плавающей запятой, два блока деления/извлечения квадратного корня для

чисел с плавающей запятой и два блока загрузки/записи. Блоки МАС имеют

трехтактовую задержку и при полной загрузке конвейера на обработке

одинарной точности обеспечивают производительность 4 FLOPS за такт. Блоки

деления дают 17-тактовую задержку и не конвейеризированы, но они могут

работать одновременно с блоками МАС.

В PA-8000 использован буфер переупорядочивания команд (IRB) глубиной

56 команд, позволяющий "просматривать" программу на следующие 56 команд

вперед в поисках таких четырех команд, которые можно выполнить параллельно.

IRB фактически состоит из двух 28-слотовых буферов. Буфер АЛУ содержит

команды для целочисленного блока и блока плавающей точки, а буфер памяти -

команды загрузки/записи.

Как только команда попадает в слот IRB, аппаратура просматривает все

команды, отправленные на функциональные блоки, чтобы найти среди них такую,

которая является источником операндов для команды, находящейся в слоте.

Команда в слоте запускается только после того, как будет распределена на

исполнение последняя команда, которая сдерживала ее. Каждый из буферов IRB

может выдавать по две команды в каждом такте, и в любом случае выдается

самая "старая" команда в буфере. Поскольку PA-8000 использует

переименование регистров и возвращает результаты выполнения команд из IRB в

порядке их следования по программе, тем самым поддерживается точная модель

обработки исключительных ситуаций.

HP проектировала РА-8000 специально для задач коммерческой обработки

данных и сложных вычислений, типа генной инженерии, в которых объем данных

настолько велик, что они не умещаются ни в один из мыслимых

внутрикристалльных КЭШей. Вот почему, РА-8000 полагается на внешние

первичные КЭШи команд и данных. Слоты в третьем 28-слотовом буфере, который

называется буфером переупорядочивания адресов (Adress – Recorder Buffer -

ARB), один к одному ассоциированы со слотами в буфере памяти IRB. В АРВ

содержатся виртуальные и физические адреса всех выданных команд

загрузки/записи. Кроме того, АРВ допускает выполнение загрузок и записей в

произвольном порядке, но с сохранением согласованности и сглаживанием

влияния задержки, связанной с адресацией внешних КЭШей.

4.9. Процессоры Motorola.

Motorola/IBM процессор PowerPC620 это первая 64-битовая реализация

архитектуры PowerPC. Имея 64-битовые регистры и внутренние магистрали

данных и семь миллионов транзисторов, новому процессору требуется почти

вдвое больший и сложный кристалл, чем у PowerPC 604. Модель 620 имеет

четырехканальную суперконвейерную схему с шестью исполнительными

устройствами: три целочисленных АЛУ, блок плавающей точки, блок

загрузки/записи и блок переходов. Последний способен на четырехуровневое

предсказание ветвлений в программе и условное исполнение с использованием

схемы переименования регистров.

ПО микроархитектуре RISC-ядра 620-й похож на 604-й. Отличия сводятся

в основном к ширине регистров и магистралей данных, а также к увеличенному

числу станций резервирования для условного исполнения команд. Прибавка

производительности достигнута за счет улучшенного шинного интерфейса.

Теперь он имеет 128-битовый интерфейс к памяти, по которому за один цикл

обращения можно выбрать два 64-битовых длинных слова, и 40-битовая шина

адреса, по которой можно адресовать до одного терабайта физической памяти.

В состав шинного интерфейса входить также поддержка кэш-памяти

второго уровня объемом до 128 Мбайт, которая может работать на четверти,

половине или на полной скорости ЦПУ.

5. Лабораторные испытания и тестирование микропроцессоров.

5.1. Лабораторные испытания процессоров i386DX.

В 1992 году на рынке появилось три новых МП, способных заместить

существующие 386DX и обеспечить повышение характеристик систем на основе

i386. Это: Intel RapidCAD, Chips& Technologies 38600DX, и Cyrix 486DLC. В

настоящий момент предлагаются только версии 33 МГц, хотя C&T и Cyrix

обещают выпустить в начале 1993 года вариант 40 МГц. Конечно, на такой

частоте можно заставить работать и 33 МГц вариант, но мой опыт показывает,

что это ненадежно, в любой момент машина может зависнуть. Intel RapidCAD

распространяется, как продукт для конечных пользователей, т.е. в машину его

устанавливают именно они. Напротив, C&T и Cyrix поставляют свои процессоры

и производителям. Cyrix также производит процессор 486SLC, заменяющий

Intel/AMD 386SX. C&T объявил о создании процессора 38600SX, но в продаже он

появится только в 1993 году, если вообще появится.

RapidCAD, грубо говоря, представляет собой процессор 486DX без

внутренней кэш-памяти и с цоколевкой процессора 386. Для программ он

соответствует 386 с сопроцессором, так как все специфичные команды i486

удалены из набора команд. Рекламируется этот процессор, как "абсолютный

сопроцессор" и, к чему и обязывает такое имя, он предназначен для замены

процессора 386DX в существующих системах и резкого повышения

производительности операций с плавающей точкой, таких, как CAD, электронные

таблицы, математические программные пакеты (SPSS, Mathematica и т.д.).

RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA (132 вывода),

устанавливающийся в гнездо для i386, включает в себя ЦПУ и модуль операций

с плавающей точкой, и RapidCAD-2, в корпусе PGA (68 выводов),

устанавливающийся в гнездо для сопроцессора i387, включает в себя ПЛМ,

подающий сигнал на схемы системной платы для правильной обработки особых

ситуаций при операциях с плавающей точкой. Большинство операций исполняется

в течение одного цикла, как и в i486. Однако узким местом является

интерфейс шины 386, так как каждый цикл шины равен двум циклам процессора.

Это значит, что команды выполняются быстрее, чем считываются из памяти.

Поскольку операции с плавающей точкой выполняются медленнее обычных команд,

то замедление на них не сказывается, и они выполняются с такой же

скоростью, как и на i486DX. Именно поэтому RapidCAD позволяет получить

более высокие характеристики с плавающей точкой, чем любая комбинация

386/387. Результаты теста SPEC, стандартного теста для машин под UNIX,

показывают, что RapidCAD ускоряет операции с плавающей точкой на 85%, а с

целыми числами - на 15% по сравнению с любой комбинацией 386/387 при

одинаковой тактовой частоте. Потребляемая мощность при 33 МГц составляет

3500 мВт. Текущая цена RapidCAD 33 МГц составляет 300$.

Предполагается, что процессор фирмы C&T 38600DX полностью совместим с

i386DX. В отличие от процессора Am386 фирмы AMD, который использует

микрокод, идентичный микрокоду Intel 386, в процессоре 38600DX использован

патентно чистый микрокод, для обеспечения полной совместимости в набор

команд даже включена недокументированная команда LOADALL386. Некоторые

команды выполняются быстрее, чем в i386. C&T также выпустила процессор

38605DX, включающий кэш-память команд на 512 байт, что еще более повысит

его производительность. К сожалению, 38605DX выпускается в корпусе PGA (144

вывода) и не может быть установлен непосредственно в разъем i386DX. При

проведении испытаний я заметил, что у 38600DX есть серьезные проблемы

коммуникации ЦПУ- сопроцессор, и из-за этого скорость выполнения в

большинстве программ операций с плавающей точкой у него падает ниже уровня

i386/i387. Эта проблема существует для всех производимых на настоящий

момент 387- совместимых сопроцессоров (ULSI 83C87, IIT 3C87, Cyrix EMX87,

Cyrix 83D87, Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети тоже

проводил такие тесты с 38700DX и пришел к аналогичным выводам. Он связался

с C&T, и ему ответили, что знают об этом. Средняя потребляемая мощность

38600DX 40 МГц - 1650 Мвт, что меньше, чем потребление i386 33 МГц. Текущая

цена 38600DX 33 МГц - 80$.

Процессор Cyrix 486DLC - последняя новинка на рынке заменителей

i386DX. Набор его команд совместим с i486SX, установлена 1 КВ кэш-память и

аппаратно реализованный 16х16 бит умножитель. Исполнительное устройство

486DLC, созданное с использованием некоторых принципов RISC, выполняет

большинство команд за один цикл. Аппаратный умножитель перемножает 16-

разрядные значения за 3 цикла, вместо 12 - 25 циклов у i386DX. Это особенно

удобно при вычислении адресов (код, генерируемый некоторыми

неоптимизирующими компиляторами, может содержать много команд MUL для

доступа к массивам) и для программных вычислений с плавающей точкой (напр.,

при эмуляции сопроцессора). Внутренняя кэш-память представляет собой

объединенную память команд и данных сквозной записи, и может быть

конфигурирована, как память с прямым отображением, или как 2-канальная

ассоциативная. Из-за необходимости обеспечения полной совместимости после

перезагрузки процессора кэш-память отключается, и должна быть включена с

помощью небольшой программы, предоставляемой фирмой Cyrix. Если кэш-память

включена при загрузке, (напр., при "горячей" перезагрузке, Ctrl – Alt –

Del) , BIOS моего РС (пр- ва AMI) зависает при загрузке, и мне приходится

либо выполнять рестарт процессора, либо отключать кэш перед перезагрузкой.

Это одна из причин того, что после запуска процессора кэш-память

отключается. Я уверен, что в следующих версиях BIOS фирмы AMI это будет

учтено и встроенная кэш-память будет поддерживаться. Кэш-память помогает

процессору 486DLC преодолеть ограничения интерфейса шины 386, хотя процент

попаданий составляет не более 50%. Фирма Cyrix предусмотрела некоторые

возможности управления кэш-памятью процессора, что, конечно, улучшит связь

внешней и внутренней кэш-памяти. Современные системы 386 не воспринимают

эти управляющие сигналы, не имеющие значения для i386DX, но в дальнейшем

системы, разработанные с учетом этих возможностей 486DLC, могут

использовать их. Встроенный кэш 486DLC допускает до 4-х некэшируемых

областей памяти, что может быть очень полезно в том случае, если ваша

система использует периферийные устройства, отображаемые в память (напр.,

сопроцессор Weitek). В существующих системах 386 пересылки DMA (напр., SCSI

контроллера, платы звука) могут отключить внутренний кэш, так как не

существует других способов обеспечить соответствие кэш-памяти и основной

памяти, что, конечно, снижает характеристики 486DLC. Потребляемая мощность

486DLC 40 МГц - 2800 Мвт. Немецкий дистрибьютор продает 486DLC 33 МГц по

текущей цене 115$. 486DLC работает далеко не со всеми сопроцессорами и не

во всех обстоятельствах, особенно критичен в этом отношении многозадачный

защищенный режим (улучшенный режим MS- Windows). При использовании 486DLC

совместно с Cyrix EMC87, Cyrix 83D87 (выпуск до августа 1992) и IIT 3C87

машина зависает из-за проблем синхронизации между ЦПУ и сопроцессором при

исполнении команд FSAVE и FRSTOR, сохраняющих и восстанавливающих состояние

сопроцессора при переключении задач. Лучше всего использовать 486DLC с

Cyrix 387+ (распространяется только в Европе) или Cyrix 83D87 выпуска после

июля 1992, являющийся наиболее мощным сопроцессором среди совместимых

сопроцессоров 486DLC. Если у вас уже есть сопроцессор Cyrix 83D87, и вы

хотите знать, совместим ли он с 486LCD, я рекомендую вам мою программу

COMPTEST, распространяемую как CTEST257.ZIP через анонимные ftp из

garbo@uwasa.fi или другие ftp-серверы. Если программа сообщит о

сопроцессоре 387+, то у вас установлен либо 387+, либо аналогичная новая

версия 83D87 и проблем с совместимостью не будет.

При испытаниях использовалась система:

Аппаратная конфигурация: 33,3/40 МГц системная плата, комплект микросхем

Forex, кэш 128 КВ с нулевым состоянием ожидания, прямое отображение,

сквозная запись, один буфер записи, 4 байта на строку, 4 цикла задержки при

кэш-промахе. 8 МВ основной памяти, среднее состояние ожидания 1,6 цикла.

BIOS фирмы AMI. Процессор Cyrix EMC87 в режиме совместимости 387, как

матсопроцессор. Этот процессор вместе с Cyrix 83D87/387+ являются самыми

Страницы: 1, 2, 3, 4


© 2010 Современные рефераты