Процессор

Центра́льный проце́ссор (ЦП; CPU — англ. céntral prócessing únit, дословно — центральное вычислительное устройство) — процессор машинных инструкций, часть аппаратного обеспечения компьютера или программируемого логического контроллера, отвечающая за выполнение арифметических операций, заданных программами операционной системы, и координирующий работу всех устройств компьютера. Современные ЦП, выполняемые в виде отдельных микросхем (чипов), реализующих все особенности, присущие данного рода устройствам, называют микропроцессорами. С середины 1980-х последние практически вытеснили прочие виды ЦП, вследствие чего термин стал всё чаще и чаще восприниматься как обыкновенный синоним слова «микропроцессор». Тем не менее, это не так: центральные процессорные устройства некоторых суперкомпьютеров даже сегодня представляют собой сложные комплексы больших (БИС) и сверхбольших (СБИС) интегральных схем. Изначально термин Центральное процессорное устройство описывал специализированный класс логических машин, предназначенных для выполнения сложных компьютерных программ. Вследствие довольно точного соответствия этого назначения функциям существовавших в то время компьютерных процессоров, он естественным образом был перенесён на сами компьютеры. Начало применения термина и его аббревиатуры по отношению к компьютерным системам было положено в 60-х годах XX века. Устройство, архитектура и реализация процессоров с тех пор неоднократно менялись, однако их основные исполняемые функции остались теми же, что и прежде. Ранние ЦП создавались в виде уникальных составных частей для уникальных, и даже единственных в своём роде, компьютерных систем. Позднее от дорогостоящего способа разработки процессоров, предназначенных для выполнения одной единственной или нескольких узкоспециализированных программ, производители компьютеров перешли к серийному изготовлению типовых классов многоцелевых процессорных устройств. Тенденция к стандартизации компьютерных комплектующих зародилась в эпоху бурного развития полупроводниковых элементов, мейнфреймов и миникомпьютеров, а с появлением интегральных схем она стала ещё более популярной. Создание микросхем позволило ещё больше увеличить сложность ЦП с одновременным уменьшением их физических размеров. Стандартизация и миниатюризация процессоров привели к глубокому проникновению основанных на них цифровых устройств в повседневную жизнь человека. Современные процессоры можно найти не только в таких высокотехнологичных устройствах, как компьютеры, но и в автомобилях, калькуляторах, мобильных телефонах и даже в детских игрушках. Чаще всего они представлены микроконтроллерами, где помимо вычислительного устройства на кристалле расположены дополнительные компоненты (интерфейсы, порты ввода/вывода, таймеры, и др.). Современные вычислительные возможности микроконтроллера сравнимы с процессорами персональных ЭВМ десятилетней давности, а чаще даже значительно превосходят их показатели.

1. 1. 1. Организация памяти 8086/88 Память для процессоров 8086/8088 представляется в виде линейной последовательности байт. Для обращения к памяти процессор (совместно с внешней схемой) формирует шинные сигналы MEMWR# (Memory Write) и MEMRD# (Memory Read) для операции записи и считывания соответственно. Охват пространства размером 1 Мб обеспечивается 20-разрядной шиной адреса. Логическая память разбивается на сегменты размером 65 Кб. Физический адрес памяти (поступающий на шину адреса разрядностью 20 бит) состоит из двух 16- битных частей – адрес сегмента Seg и исполнительного адреса ЕА (executive address), суммируемых со смещением на 4 бита (рис 2.1).

Рис. 2.1. Формирование физического адреса памяти процессором 8086/8088

     Процессор может обращаться к одному байту памяти,  так  и  слову,  или

двойному слову. При размещении слова в памяти с адресом, соответствующим адресу слова, содержит его младшую часть (Low), следующий байт содержит старшую часть (High). Слово может размещаться в памяти как по четному (Even), так и по не нечетному (Odd) адресу. Двойное слово обычно используется для хранения полного адреса, и в нем располагается сначала слово смещения (в порядке L, H), а затем сегмента (в том же порядке). Сегментация памяти в порядке L, H являются характерной чертой процессоров Intel.

     Все пространство памяти разбивается  на  параграфы  –  области  из  16

смежных байт, начиная с нулевого адреса. Вполне очевидно, что любой сегмент может начинаться только на границе параграфа (четыре младших бита адреса – нулевые).

1.1.2. Адресация ввода-вывода

Для обращения к устройствам ввода-вывода процессор имеет отдельные команды IN и OUT, результатом выполнения которых является формирование шинных сигналов IORD# (Input/ Output Write) для чтения или записи одного или двух байт. Данные при чтении могут помещаться только в регистр AL или AX и выводятся из этих же регистров. В циклах ввода-вывода используется только 16 младших бит шины адреса (старшие биты при этом нулевые), что позволяет адресовать до 64 Кб регистров ввода-вывода. Адрес устройства задается либо в команде (только младший байт, старший – нулевой), либо берется из регистра DX (полный 16-битный адрес).

1.1.3. Система команд

Набор команд 8086/88 включает следующие основные группы:

    . инструкции пересылки данных
    . арифметические и логические инструкции;
    . инструкции со строками;
    . инструкции передачи управления;
    . инструкции управления процессором;
     Каждая команда имеет один или два байта инструкции, за которыми  может

следовать 1, 2 или 4 байты операнда. Перед кодом инструкции возможно применение префиксов CS;, DS;, ES;, SS;, указывающих на использование заданных сегментных регистров вместо обычного, префикса REP, указывающего на необходимость повтора инструкции указанное в регистре СХ число раз, и префикса LOCK, блокирующего системную шину на время выполнения инструкции. С позиции сегодняшнего дня можно считать, что система команд 16-разрядного процессора 8086/88 является подмножеством команд 32-разрядных процессоров 80х86.

2. . Процессоры 80186/80188

Процессоры i80186/80188 и их модификации 80С186/80С188 не представляют нового представления архитектуры: как и 8085/8088, они являются процессорами с 16-разрядной внутренней архитектурой и программно совместимыми с 8086ю Разрядность шины адреса - 20 бит, шины данных у 80186 – 16 бит, у 80188 – 8 бит. Эти процессоры имеют встроенные периферийные контроллеры прерывания, прямого доступа к памяти, трехканальный таймер и генератор синхронизации. За счет архитектурных улучшений сокращенно число тактов, требуемых для выполнения некоторых команд. Процессоры 80С186/80С188 имеют средства управления энергопотреблением, есть их модификации со встроенными последовательными портами и контроллерами регенерации динамической памяти. Встроенная периферия этих процессоров имеет программный интерфейс, не совместимы с IBM РС - спецификациями. Эти процессоры используются во встраиваемых контроллерах и компьютерах, не требующих 100% IBM – совместимости (возможно обеспечение совместимости на уровне MS DOS).

1.2.1. Математический сопроцессор 8087

Сопроцессор 8087, официально (фирмой Intel) называемый NPX (Numeric Processor eXtension), предназначен для расширения вычислительных возможностей центрального процессора (CPU) 8086/8088, 80186/80188. Его применение к системе команд 8086 добавляется 68 мнемоник, включающих арифметические, тригонометрические, экспоненциальные и логарифмические.

3. Процессор 80286

Процессор 80286, выпущенный в 1982 году, представляет второе поколение 16- разрядных процессоров. Он имеет специальные средства для работы в многопользовательских и многозадачных системах. Самым существенным отличием от 8086/88 является механизм управления адресации памяти, который обеспечивает четырехуровневую систему защиты и поддержки виртуальной памяти. Специальные средства предназначены для поддержки механизма переключения задач (Task switching). Процессор имеет расширенную систему команд, которая кроме команд управления защитой включает все команды 8086 н и несколько новых команд общего назначения. Процессор может работать в двух режимах:

   8086 Real Address Mode – режим реальной адресации (или просто  реальный

режим - Real Mode), полностью совместимый с 8086. В этом режиме возможна адресация до 1 Мбайт физической памяти (на самом деле, за счет “удачной” ошибки, почти на 64 Кб больше).

   Protect Virtual Address Mode – защищенный режим  виртуальной  адресации

(или просто защищенный режим - Protect Mode). В этом режиме процессор позволяет адресовать до 16 Мбайт физической памяти, через которые при использовании страничной адресации могут отображаться до 1 Гб виртуальной памяти каждой задачи. Система команд в этом режиме также включает набор команд 8086, расширенный для обеспечения аппаратной реализации функций супервизора многозадачной ОС и виртуальной памяти. Переключение в защищенный режим осуществляется одной командой (с предварительно подготовленными таблицами дескрипторов) достаточно быстро. Обратное переключение в реальный режим возможно только через аппаратный сброс процессора.

   По составу и назначению в реальном режиме  регистры  80286  в  основном

совпадают с регистрами 8086/88. Изменения касаются назначения бит регистра 8086, процессор 80286 имеет 16-битную шину данных и очередь команд 6 байт. За счет архитектуры сокращенно время выполнения операций: процессор 20286 с тактовой частотой 12,5 МГц работает более чем в 6 раз быстрее чем 8086 с тактовой частотой 5 МГц. Предусмотрена возможность использования высокопроизводительного процессора 80287, программно совместимого с 8087.

   Под управлением MSDOS процессор  80286  обычно  используют  в  реальном

режиме работы. Защищенный режим используют ОС типа XENIX, UNIX, OS/2, NetWare286 и оболочка MS Windows. Хотя его преимущества в РС реализованы лишь частично (он в основном использовался как быстрый процессор 8086), именно с этим процессором связан настоящий “бум” на рынке РС.

1.3.1. Организация памяти 80286

Как и у процессоров 8086/8088, для обращения к памяти процессор (совместно с внешней схемой) формирует шинные сигналы MEMWR# (Memory Write) и MEMRD# (Memory Read) для операции записи и считывания соответственно. Шина адреса разрядностью 24 бита позволяет адресовать 16 Мб физической памяти, но в реальном режиме доступен только 1 Мб, начинающийся с младших адресов. С программной точки зрения память также организуется в виде сегментов, но управление сегментацией имеет существенные различия для реального и защищенного режимов.

     В  реальном  режиме  по   адресации   памяти   декларируется   полная

совместимость с процессором 8086, который своей 16-битной адресной шиной охватывает пространство в 1 Мб. На самом деле на радость разработчиков программного обеспечения РС, 80286 имеет ошибку, “узаконенною” и в следующих поколения процессоров. При вычислении физического адреса возможно возникновение переполнения, которое с 20-битной шиной адреса просто игнорируется. Например, Seg=FFFFh и EA=FFFF, физический адрес, вычисленный по формуле PA=16*Seg+EA=10FFEF, процессором 8086 трактуется как 0FFEF – адрес, принадлежащий первому мегабайту. Однако на выходе А20 процессора 80286 в этом случае устанавливается единичное значение, что соответствует адресу ячейки из второго мегабайта физической памяти. Для обеспечения полной программной совместимости с 8086 в схему РС был введен специальный вентиль Gate A20, принудительно обнуляющий бит А20 системной шины адреса. Не оценив потенциальной выгоды от этой ошибки, управление вентилем узаконили через программно-управляемы бит контроллера клавиатуры 8042. Когда оперативная память подешевела, а “аппетит” программного обеспечения вырос, в эту небольшую область (64К-16 бит) стали помещать некоторые резидентные программы или даже часть операционный системы, а для ускорения управлением вентилем появились более быстрые способы (Gate A20 Fast Control).

   В отличии от 8086 процессор 80286 имеет средства контроля за  переходом

через границу сегмента, работающие в реальном режиме. При попытке адресации к слову, имеющему смещение FFFh (его старший байт выходит за границу сегмента), или выполнения инструкции, все байты которой не умещаются в одном сегменте, процессор вырабатывает прерывание – исключение 13 (0Dh) – Segment Overrun Exception. При попытке выполнения инструкции ES-CAPE с операндом памяти, не умещаемся в сегменте, вырабатывается исключение 9 – Processor Extension Segment Interrupt.

   В защищенном режиме работают не все режимы  адресации,  допустимые  для

8086 и реального режима 80286. Отличия касаются определения сегментов:

    . сегментные регистры CS, DS, SS и ES хранят не  сами  базовые  адреса
      сегментов, а селекторы, по которым из  таблицы,  хранящейся  в  ОЗУ,
      извлекаются дескрипторы сегментов;
    . дескриптор описывает базовый адрес, размер сегмента (1-64 Кб) и  его
      атрибуты;
    . базовый адрес сегмента имеет разрядность 24 бита, что и обеспечивает
      адресацию 16 Мб физической памяти.
   Селекторы, загружаемые в 16-битные сегментные регистры, имеют три поля:

RPL (биты 0, 1), TI (бит 2) и INDEX (биты 3-15): RPL (Requested Privilege Level) – запрошенный уровень привилегий; TI (Table Indicator) – индикатор использования GDT – глобальный (TI=0) или LDT – локальной (TI=1) таблицы дескрипторов; INDEX – номер дескриптора в таблице.

   Дескрипторы хранятся в слове и занимают  по  четыре  смежных  слова  (8

байт). При загрузке нового значения селектора дескрипторы считываются из ОЗУ и кэшируются во внутренних программно не доступных (и невидимых) регистрах процессора. До смены значения селектора при обращения к памяти используются значения дескрипторов только из кэш-регистров. Обращение к дескрипторам выполняются как заблокированные шинные циклы, что обеспечивает целостность дескрипторов и при наличии других контроллеров шины.

   Для  функций  передачи  управления  и  переключения  задач  определенны

специальные типы дескрипторов

1.3.2. Ввод-вывод

Как и 8086, процессор 80286 позволяет адресовать до 64К однобайтных или 32К двухбайтных регистров в пространстве, отдельном от памяти (команды ввода- вывода вызывают шинные циклы с активными сигналами IORD#, IOWR#). В адресном пространстве ввода-вывода область 00F8-00FF зарезервирована для использования сопроцессором. При операциях ввода-вывода старшие биты адреса (линии А[16:20]) не используются. Адрес устройства либо задается в команде (только младший байт, старший – нулевой), либо берется из регистра DX (полный 16-битный адрес). Строковые команды REP INSB/INSW, REP OUTSB/OUTSW обеспечивают блочный ввод-вывод со скоростью, превышающей аналогичные операции со стандартным контроллером DMA.

   В    защищенном     режиме     инструкции     ввода-вывода     являются

привилегированными. Это означает, что они могут исполнятся задачами только с определенным уровнем привилегий, определяемым полем IOPL регистра флагов. Несанкционированная попытка выполнения этих инструкций вызывает исключение 13 – нарушения защиты (знаменитое сообщение “General Protection Error”).

1.3.3. Начальный сброс и переход в защищенный режим

По высокому уровню сигнала на входе RESET процессор прекращает выполнение инструкций и перестает управлять локальной шиной. После аппаратного сброса процессор переходит к выполнению команды, считанной по физическому адресу FFFF0h. Сброс (и только сброс!) переводит процессор в реальный режим и устанавливает значения некоторых регистров.

   Только после сброса и до первой  команды  межсегментного  перехода  или

вызова на шине адреса в реальном режиме бита А[20:23] в циклах выборки команд имеют единичное значения. Из этого следует, что по крайней мере на начальный период времени после сигнала RESET компьютер должен иметь образ BIOS в адресах FFFFF0-FFFFFFh, в то время как РС на 8086/88 ROM BIOS располагалась под границей 0FFFFFh. Перемещение BIOS из первого мегабайта памяти в старшие адреса “навсегда” невозможно, поскольку векторы прерывания, ссылающиеся на сервисы BIOS, в реальном режиме могут адресоваться только к памяти в диапазоне адресов 0-0FFFFh (0-10FFEF при открытом вентиле Gate A20). Таким образом, у РС/AT на процессоре 80286 (и старше) ROM BIOS отображается по крайней мере на две области памяти, расположенные под верхними границами первого и последнего мегабайтов физической памяти.

   Перевод процессора в защищенный режим осуществляется  загрузкой  в  MSW

слова с единичным значением бита РЕ (Protect Enable). Перед этим в памяти должны быть проинициализированы необходимые таблицы дескрипторов IDT и GDT, а в базовые регистры IDT и GDT должны быть занесены их физические адреса (24-битные) и размер. После выполнения инструкции LMSW, устанавливающий бит РЕ, сразу должна выполнятся команда внутрисегментного перехода JMP для очистки очереди инструкций, декодированных в реальном режиме.

   Для установки регистров процессора в  начальное  состояние  защищенного

режима, предполагаемое системное ПО, выполняют инструкцию JMP с ссылкой на селектора начального TSS системы. При этом загрузится регистр задачи, регистры LDT, регистры сегментов и общие регистры. Регистр задачи TR должен указывать на действительный TSS, поскольку операция переключения задач повлечет сохранение текущего состояния задач.

1.3.4. Защита

Процессор 80286 имеет механизмы защиты от несанкционированного выполнения критических инструкций – команды HLT, которая останавливает процессор, и команд, влияющих на сегменты кода и данных. Механизмы сгруппированы в три группы:

    . ограничения использования сегментов (например, запрет  на  записи  в
      только читаемые сегменты данных); доступность  использования  только
      сегментов, дескрипторы которых описаны в GDT и LDT;
    . ограничения доступа к сегментам через правила привилегий;
    . выделение привилегированных инструкций или операций,  которые  можно
      выполнять только при определенных уровнях CPL и IOPL (биты 13  и  14
      регистра флагов).

Архитектура 32-разрядных процессоров

История 32-разрядных процессоров началась с процессора Intel386. Эти процессора вобрали в себя все свойства своих 16-разрядных предшественников 8086/88 и 80286 для обеспечения программной совместимости с громадным объемом ранее написанного ПО. Однако в них по современным меркам преодолено очень жесткое ограничение на длину непрерывного сегмента памяти – 64 Кб. В защищенном режиме 32-битных процессоров оно отодвинулось до 4 Гб – предела физически адресуемой памяти, что како-то время можно считать “почти бесконечностью“. Все эти процессоры имеют поддержку виртуальной памяти объемом до 64 Тб, встроенный блок управления памятью поддерживает механизмы сегментации и страничной трансляции адресов (Paging). Процессоры обеспечивают четырехуровневую системы защиты памяти и ввода-вывода, переключения задач. Они имеют расширенную систему команд, включающую все команды 8086, 80286. Процессор может работать в двух режимах, между которыми обеспечивается достаточно быстрое переключение в обе стороны:

     Real Address Mode – режим реальной адресации, полностью совместимый  с

8086. В этом режиме возможна адресация до 1 Мб физической памяти (на самом деле почти на 64 Кб больше).

     Protected  Virtual  Address  Mode  –  защищенный   режим   виртуальной

адресации. В этом режиме процессор позволяет адресовать до 4 Гб физической памяти, через которые при использовании механизма страничной адресации могут отображаться до 16 Тб виртуальной памяти каждой задачи. Существенным дополнением является Virtual 8086 Mode – режим виртуального процессора 8086. Это режим является особым состоянием задачи защищенного режима, в котором процессор функционирует как 8086. На одном процессоре в таком режиме могут одновременно исполняться несколько задач с изолированными друг от друга реальными ресурсами. При этом использование физического адресного пространства памяти управляется механизмами сегментации и трансляции страниц. Попытки выполнения команд, выхода за рамки отведенного пространства памяти и разрешенной области ввода-вывода контролируется системой защиты.

     Процессоры могут оперировать с 8, 16  и  32-битными  операндами  байт,

слов и двойных слов, а также с битам, битовыми полями и строками бит.

     Рассмотрим базовую архитектуру, общую для всех существующих на  данный

момент 32-разрядных процессоров: 386, 486, Pentium, Pentium Pro и Pentium

2.1.1. Организация памяти

Память для процессоров 80х86 разделяются на байты (8 бит), слова (16 бит), двойные слова (32 бит). Слова записываются в двух смежных байтах, начиная с младшего. Адресом слова является адрес его младшего байта. Двойные слова записываются в четырех смежных байтах.

     Более крупными единицами являются страницы и  сегменты.  Память  может

логически организовываться в виде одного или множества сегментов переменной длины ( в реальном режиме – фиксированной). Сегменты могут выгружаться на диске и по мере необходимости с него подкачиваться в физическую память. Кроме сегментации, в защищенном режиме возможно разбиение логической памяти на страницы размером 4 Кб (Paging), каждая из которых может отображаться на любую область физической памяти. Сегментация и разбиение на страницы могут применяться в любых сочетаниях. Сегментация является средством организации логической памяти, используемым на прикладном уровне. Разбиение на страницы применяются на системном уровне для управлении физической памятью.

     Применительно  к  памяти  различают  на  три  адресных   пространства:

логическое, линейное и физическое. Основным режимом работы 32-разрядных процессоров считается защищенный режим, в котором работают все механизмы преобразования адресных пространств.

     Логический адрес, также называется виртуальным, состоит  из  селектора

(в реальном режиме – просто сегмента) и смещение. Смещение формируется суммированием компонентов (base, index, disp) в эффективный адрес. Поскольку каждая задача может иметь до 16К селекторов, а смещение, ограниченное размером сегмента, может достигать 4 Гб, логическое адресное пространство для каждой задачи может достигать 64 Тб. Все это пространство виртуальной памяти в принципе доступно программисту (этот ‘принцип” должна реализовывать операционная система).

     Блок сегментации транслирует логическое адресное  пространство  в  32-

битное пространство линейных адресов. Линейный адрес образуется сложением базового адресного сегмента с эффективным адресом. Базовый адрес сегмента в реальном режиме образуется умножением содержимого используемого сегментного регистра на 16 (как и в 8086). В защищенным режиме базовый адрес загружается из дескриптора, хранящегося в таблице, по селектору, загруженному в используемый сегментный регистр.

     Физический 32-битный  адрес  памяти  образуется  после  преобразования

линейного адреса блоком страничной переадресации. В простейшем случае (при отключенном блоке страничной переадресации) линейный адрес совпадает с физическим – присутствующим на внешней шине адреса процессора. Включенный блок страничной переадресации осуществляет трансляцию линейного адреса в физический блоками (страницами) размером 4 Гб. Этот блок может включаться только в защищенном режиме.

     Как и у  процессоров  8086/8088,  для  обращения  к  памяти  процессор

(совместно с внешней схемой) формирует шинные сигналы MEMWR# (Memory Write) и MEMRD (Memory Read) для операции записи и считывания соответственно. Шина адреса разрядностью 32 бита позволяет адресовать 4 Гб физической памяти, но в реальном режиме доступен только 1 Мб, начинающийся с младших адресов.

     В реальном режиме по адресации памяти обеспечивается  совместимость  с

процессором 8086, который своей 16-битной адресной шиной охватывает пространство физической памяти в 1Мб. Для обеспечения совместимости с 80286 32-разрядные процессоры реализуют его ошибку, связанную с переполнением, возникающим при сложении адресов сегмента с эффективным адресом. При вычисление физического адреса возможно возникновение переполнение, которое вызовет появление единицы на линии А20 шины адреса. Максимальное значение адреса в реальном режиме 10FFEF достигается при Seg=FFFFh и EA=FFFFh. Для обеспечения полной программной совместимости с 8086 в РС используется вентиль Gate A20, принудительно обнуляющий бит А20 системной шины адреса. Вентиль в РС управляется через программно-управляемый бит контроля клавиатуры 8042 или более быстрым способом (Gate A 20 Fast Control), определяемым чипсетом системной платы.

     В реальном  режиме  размер  сегмента  фиксирован  –  как  и  8086,  он

составляет 64 Кб (FFFFh). Попытка использования эффективного адреса, выходящего за границы сегмента, при 32-битной адресации вызывает исключение типа 13. При 16-битной адресации при вычисление эффективного адреса возможный перенос в разряд А16 игнорируется, и сегмент “сворачивается кольцом” (как и в 8086). Средства контроля следят и за переходом через границу сегмента во время обращения по “приграничному” адресу. При попытки адресации к слову, имеющему смещение FFFFh, или двойному слову со смещением FFFDh-FFFh (их старшие байты выходят за границу сегмента), или выполнения инструкции, все байты которой не умещаются в данном сегменте, процессор вырабатывает прерывание – исключение типа 13 (0Dh) – Segment Overrun Exception. При попытки выполнения инструкции ESCAPE с операндом памяти, не умещающимся в сегменте, вырабатывается исключение типа 9 – Processor Extension Segment Overrun Interrupt (только для 386).

     8Система команд 32-разрядных процессоров  предусматривает  11  режимов

адресации операндов. Из них только два не имеют отношение к памяти:

     . операнд-регистр, который может находится в  любом  8,  16  или  32-
       битном регистре процессора.;
     .  непосредственный  операнд  (8,  16  или  32-бит),  который   может
       содержаться в самой команде.
   Остальные девять режимов (табл. 3.1.) используются при формировании

эффективного адреса операнда из памяти.

     Эффективный адрес вычисляется с  использованием  комбинации  следующих
     компонентов:
     Смещение (Displacement или  Disp)  –  8-,  16-  или  32-битное  число,
     включенное в команду.
     База (Base) – содержимое базового регистра.  Обычно  используется  для
     указания на начало некоторого массива.
     Индекс (Index) – содержимое индексного регистра.  Обычно  используется
     для выбора элемента массива.
     Масштаб (Scale) –  множитель  (1,  2,  4  или  8),  указанный  в  коде
     инструкции. Этот элемент используется для  указания  размера  элемента
     массива. Доступен только в 32-битном режиме адресации.
     Эффективный адрес вычисляется по формуле EA=Base+Index*Scale+Disp.
     Отдельные слагаемые в этой формуле могут  и  отсутствовать.  Возможные

режимы адресации приведены в табл. 3.1.

                 Таблица 3.1. Режимы адресации памяти 32-битных процессоров

Прямая адресация EA=Disp | Косвенная регистровая адресная Register Index Mode EA=Base | Базовая адресации Based Mode EA=Base+Disp | Индексная адресация Index Mode EA=Index+Disp | Масштабированная индексная адресации Scaled Index Mode EA=Scalex*Index+Disp| Базово-индексная адресация Based Index Mode EA=Base+Index* | Масштабированная базово-индексная адресация Based Scaled EA=Base+Scale* Index| Масштабированная базово-индексная адресация Based Index EA=Base+Index+Disp | Масштабированная базово-индексная адресации со смещение EA=Base+Scale*Index+|

     Процессор может использовать режимы 32-битной или 16-битной адресации.

Режим 16-битной адресации соответствует режимам процессоров 8086 и 80286, при этом в качестве компонентов адреса используются младшие 16 бит соответствующих регистров. Режим 32-битной адресации использует расширенные 32-разрядные регистры и имеет дополнительные режимы, использующие масштабирование индекса. Различия 16- и 32-битных режимов адресации приведены в табл. 3.2.

   В реальном режиме по умолчанию используется 16-битная  адресация, но  с

помощью префикса изменение разрядн6ости адреса (Address Length Prefix) для текущей инструкции можно переключится в 32-битный режим. При этом появляются дополнительные возможности адресации (масштабирования), но вычисленное значение эффективного адреса все равно не может преодолеть 64- килобайтный барьер – при такой попытке генерируется исключение 13 – General Protection Fault.

   В  защищенном  режиме  адресация  по  умолчанию  определяется  битом  D

дескриптора используемого кодового сегмента: при D=0 – 15 бит, при D=1 – 32 бита. Префикс разрядности адреса переключает разрядность для текущей инструкции на противоположную. Таблица 3.2. Различия режимов адресации

Компоненты 16-битная адресации 32-битная адресации Базовый регистр BX или BP Любой 32-битный общего назначения Индексный регистр SI или DI Любой 32-битный общего назначение,кроме ESP Масштаб Нет (всегда 1) 1, 2, 4 или 8 Смещение 0, 8 или 16 бит 0, 8 или 32 бит

   При обращениях к памяти использование сегментных регистров по умолчанию

определяется типом обращения (табл. 3.3.). На время текущей инструкции при необходимости для большинства типов обращения возможно использование альтернативного сегментного регистра, на что указывает префикс замены сегмента (CS:; DS:; ES:; SS:; FS: или GS) перед кодом инструкции.

       Таблица 3.3. Использование сегментных регистров при адресации памяти

Тип обращения к памяти Сегментный регистр по умолчанию альтернативный Выборка команд CS нет Стековые операции SS нет Строка-приемник ES нет Любые ссылки к памяти, кроме использующих в качестве базового регистры BP, EBP или ESP DS CS,ES,SS,FS,GS |Ссылки к памяти, использующие вкачестве базового регистры BP, EBP или ESP SS CS,DS,ES,FS,GS

2.1.2. Прерывания и исключения

Прерывания и исключения нарушают нормальный ход выполнения программы для обработки внешних событий или сообщения о возникновении особых условий или ошибок.

   Прерывания подразделяются на аппаратные (маскируемые и  немаскируемые),

вызываемые электрическими сигналами на выходах процессора, и программные, вызываемые по команде INT xx. Программные прерывания процессором обрабатываются как разновидность исключений.

   Аппаратные прерывания подразделяются на  маскируемые  и  немаскируемые.

Процессор может воспринимать прерывания после выполнения каждой команды, длинные строковые команды имеют для восприятия прерываний специальные окна.

   Маскируемые прерывания вызывают переход и высокий  уровень  сигнала  на

входе INTR (Interrupt Request) при установленном флаге разрешения (IF=1). В этом случае процессор сохраняет с стеке регистр флагов, сбрасывает флаг IF и вырабатывает два следующих друг за другом (back to back) цикла подтверждения прерывания, в которых генерируются управляющие сигналы INTA# (Interrupt Acknowledge). Высокий уровень сигнала INTR должен сохраняться по крайней мере до подтверждения прерывания. Первый цикл подтверждения холостой, по второму импульсу внешний контроллер прерываний передает по шине номер вектора, обслуживающего данный тип аппаратного прерывания. Прерывание с полеченным номером вектора выполняется процессором также, как и программное. Обработка текущего прерывания может быть в свою очередь прервана немаскируемым прерыванием, а если обработчик установит флаг IF, то и другим маскируемым аппаратным прерыванием.

   Немаскируемые прерывания выполняются не зависимо от состояния флага  IF

по сигналу NMI (Non Mascable Interrupt). Высокий уровень на этом входе вызовет прерывание с типом (вектором) 2, которое выполняется также, как и маскируемое. Его обработка не может прерваться под действием сигнала на входе NMI до выполнения команды IRET.

   Исключения (Exceptions) подразделяются на отказы, ловушки  и  аварийные

завершения.

   Отказ (fault) – это исключение, которое обнаруживается и  обслуживается

до выполнения инструкции, вызывающей ошибку. После обнаружения этого исключения выполнение возвращается снова на туже инструкцию (включая все префиксы), которая вызвала отказ. Отказы, использующиеся в системе виртуальной памяти, позволяют, например, подкачать с диска в оперативную память затребованную страницу или сегмент.

   Ловушка (trap) – это исключение, которое обнаруживается и обслуживается

после выполнения инструкции, его вызывающей. После обслуживания этого исключения управление возвращается на инструкцию, следующей за вызывающей ловушку. К классу ловушек относятся и программные прерывания.

   Аварийное завершение (abort) – это  исключение,  которое  не  позволяет

точно установить инструкцию, его вызвавшую. Оно используется для сообщения о серьезной ошибке, такой как аппаратное ошибка или повреждение системных таблиц.

   Набор и обработка исключений реального и защищенного режимов  различны.

Под исключения Intel резервирует векторы 0-31 в таблице прерываний, однако в РС часть из них перекрывается системными прерываниями BIOS и DOS.

2.1.3. Начальный сброс и самотестирование

По высокому уровню сигнала на входе RESET процессор прекращает выполнение инструкции и перестает управлять локальной шиной. После аппаратного сброса процессор переходит к выполнению команды, считанной по физическому адресу FFFFFFF0h. Сброс переводит процессор в реальный режим и устанавливает значения некоторых регистров:

     FLAGS = 0002h и биты VM и RF его расширения обнуляются;
     в регистре CR0 обнуляются биты PG, TS, EM, MP и РЕ;
     CS = F000h (база устанавливается FFFF0000h, лимит – 0FFFFh);
     DS = ES = SS = FS = GS = 0000h
     Регистр DH после сброса содержит идентификатора  процессора  Component

Id (03-386, 04-486, 05-Pentium, 06-Pentium Pro или Pentium II), DL – номер модели (Revision Id).

     Только после сброса и до первой команды  межсегментного  перехода  или

вызова на шине адреса в реальном режиме биты A[20:31] в циклах выборки команд имеют единичное значение. Из этого следует, что по крайней мере на начальный период времени после сигнала RESET компьютер должен иметь образ BIOS в адресах FFFFFFF0-FFFFFFFFh, в то время, как в РС 8086/88 имели образ под границей 16-го мегабайта (FFFFFFh). Перемещение BIOS из первого мегабайта памяти в режиме нормальной работы невозможно, поскольку векторы прерывания, ссылающиеся на сервисы BIOS, в реальном режиме могут адресоваться только к памяти в диапазоне адресов 0-0FFFFFh (0-10FFEF) при открытом вентиле Gate A20).

     Если во время спада сигнала RESET  на  определенном  входе  процессора

удерживать низкий уровень сигнала, процессор начнет выполнять внутренний тест BIST (Built-In Self-Test). Тест для 386-го и 486-го процессоров выполняется примерно за 2 в 20-ой степени тактов, что занимает десятки миллисекунд. По окончанию самотестирования процессор начинает работу, как после обычного сброса, а регистр EAX содержит сигнатуру результата тестирования. Об успешном выполнении теста свидетельствует нулевое значение сигнатуры.

2.1.4. Ввод-вывод

Как и 8086, 32-разрядные процессоры позволяют адресовать до 64К однобайтных или 32К двухбайтных регистров в пространстве, отдельном от памяти. Дополнительно имеется возможность обращения к 32-битным портам. При операциях ввода-вывода линии A[16:31] не используются. Адрес устройства задерживается либо в команде (только младший байт, старший – нулевой), либо берется из регистра DX (полный 16-битытный адрес). Команды ввода-вывода вызывают шинные циклы с активными сигналами IORD#, IOWR#. Строковые команды обеспечивают блочный ввод-вывод со скоростью, превышающей аналогичные операции со стандартным контроллером DMA. В адресном пространстве ввода- вывода область 0F8-0FF зарезервирована для использования сопроцессором (при обращении к сопроцессору 386 выставляет единицу на линии А31 шины адреса, что используется для упрощения дешифрации адресов).

   В    защищенном     режиме     инструкции     ввода-вывода     являются

привилегированными. Это означает, что они могут исполнятся задачами только с определенным уровнем привилегий, определяемым полем IOPL регистра флагов или битовой картой разрешения ввода-вывода (I/O Remission Bitmap), хранящийся в сегменте состояния задачи. Несанкционированная попытка выполнения этих инструкций вызовет исключение 13 – нарушение защиты (знаменитое сообщение “General Protection Error ”).

2.1.5. Режим системного управления SMM

Современные модели 32-разрядных процессоров (начиная с некоторых модификаций 386-го и 486-го), кроме обычных режимов – реального, защищенного и режима V86, - имеют дополнительный режим системного управления SMM (System Management Mode). Этот режим предназначен для выполнения некоторых действий с возможностью их полной изоляции от прикладного программного обеспечения и даже операционный системы. Главным образом, этот режим предназначен для реализации системы управления энергопотреблением.

   В режим SMM процессор может войти  только  по  сигналу  на  входе  SMI#

(System Management Interrupt), более совершенные процессоры могут войти в SMM и по приему соответствующего сообщения по шине APIC. Сигнал для процессора является запросом прерывания с наивысшим приоритетом. Обнаружив активный сигнал (низкий уровень) SMI#, процессор по завершении текущей инструкции и выгрузки буферов записи переключается в режим SMM, о чем свидетельствует его выходной сигнал SMIACT#. Сразу при входе в SMM процессор сохраняет свой контекст – почти все регистры – в специальной памяти SMRAM. Эта память является выделенной областью физической памяти, доступ к которой обеспечивается внешними (по отношению к процессору) схемами в шинных циклах обращения к памяти только при наличии сигнала SMIAKT#. После сохранения контекста процессор переходит к выполнению обработчика SMI, который расположен в той же памяти SMRAM. Обработчика представляет собой последовательность обычных инструкций, исполняемых процессором в режиме, напоминающем реальный. При входе в режим SMM автоматически запрещаются аппаратные прерывания (включая и немаскируемые) и не генерируются исключения, так что действия процессора однозначно определяются программой обработчика SMI. Процедура обработки завершается инструкцией RSM, по которой процессор восстанавливает свой контекст из образа, хранящегося в SMRAM, и возвращается в обычный режим работы.

   При  возврате  из   SMM   возможны   некоторые   варианты,   заказанные

обработчиком (в пределах возможности SMM данного процессора). Во-первых, обработчик может программно внести изменения в образ контекста процессора, и при его восстановлении процессор может вернуться не в то состояние, в котором произошло SMI. Во-вторых возможен выбор варианта для случая, когда прерывание SMI возникло во время останова процессора по инструкции HALT: можно вернуться снова на инструкцию останова, а можно перейти к выполнению следующей за ней инструкции. В-третьих, процессоры, начиная с Pentium второго поколения (и Enhanced 486 фирмы AMD), поддерживают возможность рестарта (повторного выполнения) инструкции ввода-вывода, предшествующей появлению сигнала SMI#.

   Возможность  рестарта  инструкции  ввода-вывода  является   расширением

режима SMM. Ее используют, например, когда прикладная программа (или системный драйвер) пытается обратиться операцией ввода-вывода к периферийному устройству, находящемуся в “спящем” режиме. Системная логика должна в этом случае выработать сигнал SMI# раньше сигнала RDY#, завершающего шинный цикл рестартуемой инструкции ввода-вывода. Обработчик SMI “разбудит” устройство, после чего операции ввода-вывода рестартует, и прикладное ПО (или драйвер) “не заметит”, что устройство пребывало в спячке. Таким образом, управление потреблением может быть организованно на уровне BIOS способом, совершенно “прозрачным” для программного обеспечения (в том числе и ОС). Прозрачность SMM обеспечивается следующими свойствами режима:

. возможность только аппаратно входа в SMM,
. исполнением кода SMM в отдельном адресном пространстве,
. полным сохранением состояния прерванной программы в области SMRAM,
. запретом обычных прерываний,
. восстановлением состояния прерванной задачи по выходу из режима SMM.
Память SMRAM должна быть физически или логически выделенной областью
размером от 32 Кб (минимальные потребности SMM) до 4 Гб. SMRAM
располагается, начиная с адреса SMIBASE (по умолчанию 30000h), и
распределяется относительно адреса SMIBASE следующим образом:
. FE00h-FFFFh (3FE00h-3FFFFh) – область сохранения контекста
(распределяется, начиная со старших адресов по направлению к
младшим). По прерыванию SMI сохраняются практически все регистры
процессора, включая программно невидимые регистры CR1, CR2 и CR4, а
также скрытые регистры дескрипторов для CS, DS, ES, FS, GS и SS.
Автоматическое сохранение не производится для регистров DR5-DR0, TR7-
TR3 и регистров FPU;
. 8000h (38000h) – точка входа в обработчик (SMI Handler);
. 0-7FFFh (30000h-37fffh) – свободная область.

2.1.6. Расширение ММХ

Расширение ММХ ориентированно на мультимедийное, 2D и 3D-графическое и коммуникационное применение. Основная идея расширения MMX заключается в одновременной обработки нескольких элементов данных за одну инструкцию – так называемая технология SIMD (single Instruction – Multiple Data). Расширение ММХ использует новые типы упакованных 64-битных данных:

    . упакованные байты (Packed byte) – восемь байт;
    . упакованные слова (Packed word) – четыре слова;
    . упакованные двойные слова (Packed doubleword) – два двойных слова;
    . учетверенное слово (Quadword) – одно слово.
   Эти типы данных могут специальным образом  обрабатываться  в  регистрах

ММХ0-ММХ7, представляющих собой младшие биты стека 80-битных регистров FPU. Как и регистры FPU, эти регистры не могут использоваться для адресации памяти, совпадение регистров FPU и ММХ накладывает ограничения на чередование кодов FPU и ММХ – забота об их независимости лежит на программисте приложений ММХ.

   Еще одна особенность технологии ММХ – поддержка арифметики с насыщением

(saturating arithmetic). Ее отличие от обычной арифметики с циклическим переполнением (wraparound mode) заключается в том, что при возникновении переполнения в результате фиксируется максимальное возможное значение для используемого типа данных, а перенос игнорируется. В случае антипереполнения в результате фиксируется минимальное возможно значение. Граничные значения определяются типом (знаковые или беззнаковые) и разрядностью переменных. Такой режим вычислений актуален, например, для вычисления цветов в графике.

   В систему команд введено 57 дополнительных инструкций для одновременной

обработки нескольких единиц данных. Одновременно обрабатываемое 64-битное слово может содержать как одну единицу обработки, так и 8 однобайтных, 4 двухбайтных или 2 четырехбайтных операнда. Новые инструкции включают следующие группы:

    . арифметические  (Arithmetic  Instructions),  включающие  сложение  и
      вычитание в разных  режимах,  умножение  и  комбинацию  умножения  и
      сложения;
    . сравнение (Comparison Instructions) элементов  данных  на  равенство
      или по величине;
    . преобразование форматов (Conversion Instructions);
    . логические (Logical Instructions) – И, И-НЕ, ИЛИ и Исключающее  ИЛИ,
      выполняемые над 64-битными операндами;
    . сдвиги (Shift Instructions) – логические и арифметические;
    . пересылки данных (Data Transfer Instructions) между регистрами ММХ и
      целочисленными регистрами или памятью;
    . очистка ММХ (Empty MMX State) – установка признаков пустых регистров
      в слове тегов.
   Инструкции ММХ не влияют на флаги условий.
   Регистры ММХ, в отличии от регистров FPU,  адресуются  физически  а  не

относительно значения TOS. Более того, любая инструкция ММХ обнуляет поле TOS регистра состояния FPU. В слове тегов свободному регистру соответствует комбинация “11”, остальные комбинации указывают только на занятость регистра. После каждой операции ММХ биты тегов используемого регистра назначения обнуляются. Неиспользуемые в ММХ биты [79:64] регистров FPU заполняются единицами, так что ошибочное использование данных ММХ инструкций FPU приведет к исключению.

   Инструкции  ММХ  не  порождают  новых  исключений.  Исключения  при  их

выполнении могут возникать только при нарушении границ при обращениях к памяти (данные и инструкции). Однако если предшествующая инструкция FPU породила условие исключения, то оно произойдет при выполнении инструкции ММХ. После его обработки инструкция ММХ может быть благополучна исполнена.

   Инструкции ММХ доступны из любого режима процессора.  При  переключении

задач необходимо следить за корректностью сохранения контекста, как и при работе с FPU.

   Часто чередование годов FPU и ММХ может снизить  производительность  за

счет необходимости сохранения и восстановления весьма объемного контекста FPU.

2.1.7. Внутренний кэш

Внутренне кэширование обращений к памяти применяется в процессорах, начиная с 486-го. С кэшированием связаны новые функции процессоров, биты регистров и внешние сигналы.

   Процессоры 486 и Pentium имеют внутренний кэш первого уровня, в Pentium

Pro и Pentium II имеется и вторичный кэш. Процессоры могут иметь как единый кэш инструкций и данных, так и общий. Выделенный кэш инструкций обычно используется только для чтения. Для внутреннего кэша обычно используется наборно-ассоциативная архитектура.

   Строки в кэш-памяти  выделяются  только  при  чтении,  политика  записи

первых процессоров 486 – только Write Through (сквозная запись) – полностью программно-прозрачная. Более поздние модификации 486-го и все старшие процессоры позволяют переключаться на политику Write Back (обратная запись).

   Работу  кэша   рассмотрим   на   примере   четырехканального   наборно-

ассоциативного кэша процессора 486, его физическая структура приведена на рис. 3.1.7. Кэш является несекторированным – каждый бит достоверности (Valid bit) относится к целой строке, так что стока не может являться “частично достоверной”.

   Работу  внутренней   кэш-памяти   характеризуют   следующие   процессы:

обслуживание запросов процессора на обращение к памяти, выделение и замещение строк для кэширования областей физической памяти, обеспечение согласованности данных внутреннего кэша и оперативной памяти, управление кэшированием.

   Любой внутренний запрос процессора на обращение к  памяти  направляется

на внутренний кэш. Теги четырех строк набора, который обслуживает данный адрес, сравниваются со старшими битами запрошенного физического адреса. Если адресуемая область представлена в строке кэш-памяти (случая попадания –cache hit), запрос на чтение обслуживается только кэш-памятью, не выходя на внешнюю шину. Запрос на запись модифицирует данную строку, и в зависимости от политики записи либо сразу выходит на внешнюю шину (при сквозной записи), либо несколько позже (при использовании алгоритма обратной записи).

   В случае промаха (Cache Miss) запрос на запись направляется  только  на

внешнюю шину, а запрос на чтение обслуживается сложнее. Если этот зарос относится к кэшируемой области памяти, выполняется цикл заполнения целой строки кэша – все 16 байт (32 для Pentium) читаются из оперативной памяти и помещаются в одну из строк кэша, обслуживающего данный адрес. Если затребованные данные не укладываются в одной строке, заполняется и соседняя. Заполнение строки процессор старается выполнить самым быстрым способом – пакетным циклом с 32-битными передачами (64-битными для Pentium и старше).

   Внутренний запрос  процессора  на  данные  удовлетворяется  сразу,  как

только затребованные данные считываются из ОЗУ – заполнение строки до конца может происходить параллельно с обработкой полученных данных. Если в наборе, который обслуживает данный адрес памяти, имеется свободная строка (с нулевым битом достоверности), заполнена будет она и для нее установится бит достоверности. Если свободных строк в наборе нет, будет замещена строка, к которой дольше всех не было обращений. Выбор строки для замещения выполняется на основе анализа бит LRU (Least Recently Used) по алгоритму “псевдо-LRU”. Эти биты (по три на каждый из наборов) модифицируются при каждом обращении к строке данного набора (кэш-попадании или замещении).

   Таким образом, выделение  и  замещение  строк  выполнятся  только  кэш-

промахов чтения, при промахах записи заполнение строк не производится. Если затребованная область памяти присутствует в строке внутреннего кэша, то он обслужит этот запрос. Управлять кэшированием можно только на этапе заполнения строк; кроме того, существует возможность их аннулирования – объявления недостоверными и очистка всей кэш-памяти.

   Очистка  внутренней  кэш-памяти  при  сквозной  записи  (обнуление  бит

достоверности всех строк) осуществляется внешним сигналом FLUSH# за один такт системной шины (и, конечно же, по сигналу RESET). Кроме того, имеются инструкции аннулирования INVD и WBINVD. Инструкция INVD аннулирует строки внутреннего кэша без выгрузки модифицированных строк, поэтому ее неосторожное использование при включенной политике обратной записи может привести к нарушению целостности данных в иерархической памяти. Инструкция WBINVD предварительно выгружает модифицированные строки в основную память (при сквозной записи ее действие совпадает с INVD). При обратной записи очистка кэша подразумевает и выгрузку всех модифицированных строк в основную память. Для этого, естественно, может потребоваться и значительное число тактов системной шины, необходимых для проведения всех операций записи.

   Аннулирование строк выполняется внешними схемами  –  оно  необходимо  в

системах, у которых в оперативную память запись может производить не только один процессор, а и другие контроллеры шины – процессор или периферийные контроллеры. В этом случае требуются специальные средства для поддержания согласованности данных во всех ступенях памяти – в первичной и вторичной кэш-памяти и динамического ОЗУ. Если внешний (по отношению к рассматриваемому процессору) контроллер выполняет запись в память, процессору должен быть подан сигнал AHOLD. По этому сигналу процессор немедленно отдает управление шиной адреса A[31:4], на которой внешним контроллером устанавливается адрес памяти, сопровождаемый стробом EADS#. Если адресованная память присутствует в первичном кэше, процессор аннулирует строку – сбрасывает бит достоверности этой строки (она освобождается). Аннулирование строки процессор выполняет в любом состоянии.

   Управление заполнением кэша возможно и на аппаратном и  на  программном

уровнях. Процессор позволяет кэшировать любую область физической памяти. Внешние схемы могут запрещать процессору кэшировать определенные области памяти установкой высокого уровня сигнала KEN# во время циклов доступа к этим областям памяти. Этот сигнал управляет только возможностью заполнения строк кэша из адресованной области памяти. Программно можно управлять кэшируемостью каждой страницы памяти – запрещать единичным значением бита PCD (Page Cache Disable) в таблице или каталоге страниц. Для процессоров с WB-кэшем бит PWT (Page Write Through) позволяет постранично управлять и алгоритмом записи. Общее программное управление кэшированием осуществляется посредством бит управляющего регистра CR0:CD (Cache Disable) и NW (No Write Through). Возможны следующие сочетания бит регистра:

    . CD=1, NW=1 – если после установки такого значения выполнить  очистку
      кэша, кэш будет полностью отключен. Если же перед  установкой  этого
      сочетания бит кэша был заполнен, а  очистка  не  производилась,  кэш
      превращается в “замороженную” область статической памяти;
    .  CD=1,  CW=0  –  заполнение  кэша  запрещено,  но  сквозная   запись
      разрешена. Эффект аналогичен  временному  переводу  сигнала  KEN#  в
      высокое (пассивное) состояние. Этот режим может  использоваться  для
      временного отключения кэша, после которого  возможно  его  включение
      без очистки;
    . CD=0, NW=1 – запрещенная комбинация (вызывает отказ общей защиты);
    . CD=0, NW=0 – нормальный режим работы со сквозной записью.
   Для полного запрета кэша необходимо установить CD=1 и NW=1, после  чего

выполнить очистку (Flush). Без очистки кэш будет обслуживать запросы в случае попаданий.

   Процессоры 486 и старше имеют выходные сигналы PCD и  PWT,  управляющие

работой вторичного (внешнего) кэша (они же управляют и внутренним кэшем). В циклах обращения к памяти, когда страничные преобразования не используются (например, при обращении к таблице каталогов страниц), источником сигналов являются биты PCD и PWT регистра CR3, при обращении к каталогу страниц – биты PCD и PWT из дескриптора соответствующего вхождения каталога, при обращении к самим данным – биты PCD и PWT из дескриптора страницы. Кроме того, оба этих сигнала могут принудительно устанавливаться общими битами управления кэшированием CD и NW регистра CRO.

   Режим обратной  записи  может  разрешаться  только  аппаратно  сигналом

WB/WT#, вырабатываемым внешними схемами.

   В пространстве памяти  РС  имеются  области,  для  которых  кэширование

принципиально недопустимо (например, разделяемая память адаптеров) или непригодна политика обратной записи. Кроме того, кэширование иногда полезно отключать при выполнении однократно исполняемых участков программы (например, инициализации) с тем, чтобы из кэша не вытиснялись более часто используемые фрагменты. Напомним, что запретить можно только заполнение строк, а обращение к памяти, уже представленной действительными строками кэша, все равно будет обслуживаться из кэша. Для полного запрета работы кэша строки должны быть аннулированы.

   Программно   при   включенном   режиме    страничного    преобразования

кэшированием управляют биты атрибутов страниц (на уровне таблицы страниц и их каталога), биты PCD и PWT регистра CR3, и, наконец, глобально кэшированием управляют биты CD и NW регистра CR0.

   Аппаратно (сигналом KEN#) внешние схемы  могут  управлять  кэшированием

(разрешать заполнение строк) для каждого конкретного адреса обращения к физической памяти.

2.2. Процессор 80386

    Микропроцессор 80386 имеет два режима работы: режим реальных  адресов,

называемый реальным режимом, и защищенный режим. При подаче сигнала сброса или при включении питания устанавливается реальный режим, причем 80386 работает как очень быстрый 8086, но, по желанию программиста, с 32- разрядным расширением. В реальном режиме МП 80386 имеет такую же базовую архитектуру, что и МП 8086, но обеспечивает доступ к 32-разрядным регистрам. Механизм адресации, размеры памяти и обработка прерываний МП 8086 полностью совпадают с аналогичными функциями МП 80386 в реальном режиме. Единственным способом выхода из реального режима является явное переключение в защищенный режим. В защищенный режим микропроцессор 80386 входит при установке бита включения защиты (РЕ) в нулевом регистре управления (CR) с помощью команды пересылки (MOV to CR). Для совместимости с МП 80286 с целью установки бита РЕ может быть также использована команда загрузки слова состояния машины LMSW. Процессор повторно входит в реальный режим в том случае, если программа командой пересылки сбрасывает бит РЕ регистра CR.

       Полные  возможности  МП  80386  раскрываются  в  защищенном  режиме.

Программы могут исполнять переключение между процессами с целью входа в задачи, предназначенные для режима виртуального МП 8086. Каждая такая задача проявляет себя в семантике МП 8086 (т.е. в отношениях между символами и приписываемыми им значениями независимо от интерпретирующего их оборудования). Это позволяет выполнять на МП 80386 программное обеспечение для микропроцессора 8086 - прикладную программу или целую операционную систему. В то же время задачи для виртуального МП 8086 изолированы и защищены как друг от друга, так и от главной операционной системы МП 80386.

2.3. Процессор 80486

   В  1989  г.  фирма  Intel  выпустила  микропроцессор  Intel-80486.  Все

процессоры семейства 486 имеют 32-разрядную архитектуру, внутреннюю кэш- память 8 КВ со сквозной записью (у DX4 -16 КВ). Модели SX не имеют встроенного сопроцессора. Модели DX2 реализуют механизм внутреннего удвоения частоты (например, процессор 486DX2-66 устанавливается на 33- мегагерцовую системную плату), что позволяет поднять быстродействие практически в два раза, так как эффективность кэширования внутренней кэш- памяти составляет почти 90 процентов. Процессоры семейства DX4 - 486DX4- 75 и 486DX4-100 предназначены для установки на 25-ти и 33-мегагерцовые платы. По производительности они занимают нишу между DX2-66 и Pentium- 60/66, причем быстродействие компьютеров на 486DX4-100 вплотную приближается к показателям Pentium 60. Напряжение питания составляет 3,3 вольта, то есть их нельзя устанавливать на обычные системные платы. Процессор 486DX4-75 предназначен, прежде всего, для использования к компьютерам типа Notebook, а 486DX4-100 - в настольных системах.

2.4. Процессор Pentium

   В 1993 г. Intel анонсировала  о  новом  детище  –  процессоре  Pentium.

Процессор Pentium является одним из самых мощных в настоящее время. Он относится к процессорам с полным набором команд, хотя его ядро имеет риск- архитектуру. Это 64-разрядный суперскалярный процессор (то есть выполняет более одной команды за цикл), имеет 16 КВ внутренней кэш-памяти - по 8 КВ отдельно для данных и команд, встроенный сопроцессор. Несколько слов о процессорах семейства OverDrive. В основном это процессоры с внутренним удвоением частоты, предназначенные для замены процессоров SX. Что касается широко разрекламированного в свое время процессора OverDrive на основе Pentium (так называемый P24T или Pentium SX), то сроки его выпуска неоднократно срывались. Сейчас начало выпуска перенесено на последнюю четверть текущего года. Хотя на рынке представлено очень много системных плат, предназначенных для установки кроме 486 процессоров и процессора Р24Т, использовать его на этих платах, скорее всего, будет нельзя, так как никакого тестирования плат с этим процессором изготовители не проводят ввиду его отсутствия, а ориентируются при изготовлении только на опубликованную фирмой Intel спецификацию. Представители фирмы Intel заявили недавно, что существуют серьезные сомнения в работоспособности большинства этих плат в связи с недостаточной проработкой вопросов, связанных с перегревом процессоров. Поскольку при работе с существующим программным обеспечением процессоры Pentium не достигают максимального быстродействия, фирма Intel для оценки производительности своих процессоров предложила специальный индекс - iCOMP (Intel COmparative Microprocessor Performance), который, по ее мнению, более точно отражает возрастание производительности при переходе к новому поколению процессоров (некоторые из выпущенных уже моделей компьютеров на основе Pentium при выполнении определенных программ демонстрируют даже меньшее быстродействие, чем компьютеры на основе 486DX2-66, это связано как с недостатками конкретных системных плат, так и с не оптимизированностью программных кодов).

Модель Индекс iCOMP 486SX2-50 180 486DX2-50 231 486DX2-66 297 486DX4-75 319 486DX4-100 435 Pentium 60 510 Pentium 66 567 Pentium 90 735 Pentium 100 815

   Более того, именно величина производительности с использованием индекса

iCOMP используется фирмой Intel в новой системе маркировки процессоров Pentium. например, 735\90 и 815\100 для тактовой частоты 90 и 100 МГц. Кроме фирмы Intel, на рынке широко представлены другие фирмы, выпускающие клоны семейств 486 и Pentium. Фирма AMD (Advanced Micro Devices) производит 486DX-40, 486DX2-50, 486DX2-66. Процессоры 486DX2-80 и 486DX4-120 обеспечивают полную совместимость со всеми ориентированными на платформу Intel программными продуктами и такую же производительность, как и аналогичные изделия фирмы Intel (при одинаковой тактовой частоте). Кроме того, они предлагаются по более низким ценам, а процессор на 40 МГц, отсутствующий в производственной программе Intel, конкурирует с 486DX-33, превосходя его по производительности на 20 процентов при меньшей стоимости. Фирма Cyrix разработала процессоры М6 и М7 (аналоги 486SX2 и 486 0DX 2) на тактовые частоты 33 м 40 МГц, а также с удвоением частоты DX2-50 и DX2- 66. Они имеют более быстродействующую внутреннюю кэш-память 8 КВ с обратной записью и более быстрый встроенный сопроцессор. По некоторым операциям производительность выше, чем у процессоров фирмы Intel, по некоторым - несколько ниже. Соответственно, существенно различаются и результаты на разных тестирующих программах. Цены на 486 процессоры Cyrix значительно ниже, чем на Intel и AMD. По оценкам Intel, эффективность Pentium при работе с таким программным обеспечением составляет около 70 процентов, Cyrix же обещает 90, так как архитектура М1 более "рисковая": он имеет 32 регистра вместо 8 и систему их динамической переадресации для обеспечения совместимости. В то же время М1 по операциям с плавающей точкой уступает процессору фирмы Intel. Собственные варианты процессоров семейства 486 - 486SX-33,486SX-40, 486SX-80, 486DX-40 предлагает фирма UMC. Они полностью совместимы с процессорами Intel. Из-за патентных ограничений они не поставляются в США. Первый клон процессора Pentium - изделие под названием 586 - выпустила фирма NexGen. Этот 64-разрядный процессор рассчитан на работу на тактовых частотах 60 и 66 МГц, построен на основе запатентованной суперскалярной архитектуры RISC86 и полностью совместим с семейством 80х86. Напряжение питания - 3,3 вольта. Стоимость его существенно ниже, чем у Pentium. Для самых простых систем фирмой Texas Instruments выпускала дешевые, но эффективные процессоры 486DLC, которые, занимая промежуточное положение между 80386 и 80486 семейством (они выполнены в конструктиве 386 процессора, обеспечивают производительность на уровне 80486 процессора при цене 80386. Новая версия - 486SXL с увеличенной до 8 КВ внутренней кэш-памятью еще ближе приближается к характеристикам 486 семейства. Все большую популярность завоевывали риск- процессоры семейства Power PC 601 (IBM, Apple, Motorola) , которые имеют отличную от Intel архитектуру (в основе - архитектура Power фирмы IBM с внутренней кэш-памятью 32 КВ). Полагают, что именно конкуренция между Power PC и Pentium является самым существенным фактором для развития рынка процессоров и персональных компьютеров. Power PC 601 примерно в два раза дешевле, чем Pentium, потребляет в два раза меньшую мощность и превосходит Pentium по производительности, особенно по операциям с плавающей точкой. Сначала на процессоре 601 была реализована только система 6000 фирмы IBM и PowerMac фирмы Apple. В настоящее время большинство производителей компьютеров имеют свои варианты систем на базе Power PC, однако, решение об их производстве будет определяться, прежде всего, складывающейся конъюнктурой.

    Объем и сложность данных,  обрабатываемых  современными  компьютерами,

стремительно увеличивается. Новые средства связи, видео - и аудиоприложения выдвигают повышенные требования к производительности микропроцессора. ММХ - технология разработана для ускорения мультимедиа и коммуникационных программ. Она включает в себя новые команды и типы данных, что позволяет создавать приложения нового уровня. Технология основана на параллельной обработке данных. При этом сохраняется полная совместимость с существующими операционными системами и программным обеспечением. ММХ – технология – это самое значительное усовершенствование со времени создания процессора Intel- 80386, т.е. создания 32 – разрядной архитектуры.

   В процессоры семейства  Р5  (Pentium  и  Pentium  MMX)  были  добавлены

следующие команды:

    . CMPXCHG8B  (compare and exchange 8 bytes)
    . CPUID  (CPU identification)
    . RDTSC  (read time-stamp counter)
    . RDMSR  ( read model-specific register)
    . WRMSR  (write model-specific register)
    . RSM  (resume from SSM)
   Форма команды MOV, которая обращалась к регистрам тестирования, удалена

из процессоров Р5 и всех последующих. Функция регистров тестирования теперь выполняют регистры MSR (Model Specific Register). Задействован новый регистр управления CR4. В регистр EFLAGS добавлены следующие флажки:

. VIF (virtual interrupt flag)
. VIP (virtual interrupt pending)
. ID (identification flag)

Рисунок 1. Формат регистра EFLAGS в процессорах Р5

Табл1. Процессоры 70-х годов Модель 4004 8008 8080 8086 8088 Объявлено о выпуске 26252 26390 27120 28649 29007 Тактовая частота 108 КГц 108 КГц 2 МГц 5 МГц, 8 МГц, 10 МГц 5 МГц, 8 МГц Разрядность шины, бит 4 8 8 16 8 Количество транзисторов 2300 3500 6000 29000 29000 Адресуймая памьять 640 байт 16 Кбайт 64 Кбайт 1 Мб 1 Мб Краткая характеристика Первая микросхема, выполняющая арифметические вычисления Обработка цыфровых текстовых даных 10-кратный рост производительности по сравнению с 8008 10-кратный рост производительности по сравнению с 8080 Аналог процессора 8086,но 8 рязрядной шиной

Табл.2. Процессоры 80-х годов Модель 80286 Микропроцессор Intel386TM DX Микропроцессор Intel386TM SX Центральный процессор Intel486TM DX Объявлено о выпуске 29983 31337 32310 32608 Тактовая частота 6 МГц, 8 МГц, 10 МГц,12.5 МГЦ 16 МГц, 20 МГц, 25 МГц, 33 МГЦ 16 МГц, 20 МГц, 25 МГц, 33 МГЦ 25 МГц,33 МГц, 50 МГц Разрядность шины, бит 16 бит 32 бит 16 бит 32 бит Количество транзисторов 134000 275000 275000 1,5 милиона Адресуймая памьять 16 Мб 4 Гб 4 Гб 4 Гб Краткая характеристика Рост производительности в 3-6 раз

по ставнению с процессором 8086	Первая микросхема

архитектуры X86, способная обрабатывать 32-рязрядные наборы данных Недорогое устройство с возможностю 3-рязрядной обработке данных благодаря 16 битной адресной шины Встроеная Кеш-памьять 1-го уровня

(((((((((((((((((((( АБО Камни древности: История развития процессоров x86

16.04.2004 | Версия для печати | Послать ссылку по почте | Комментарии

Процессор (CPU - central processor unit - центральный процессор) - это один из основных компонентов твоего компьютера, его можно сравнить с мозгом. Он выполняет логические и арифметические операции над различными данными. Процессор это большая интегральная схема в едином полупроводниковом кристалле. Это означает, что на куске камня сделали много-много маленьких транзисторов, которые вместе умеют правильно и быстро считать :).

Процессор, наверное, самая быстроразвивающаяся часть компьютера, с каждым годом его производительность только растет. Еще каких-то 20 лет назад люди и не могли мечтать, чтобы на их столах стоял компьютер с частотой 3ГГц.

Всевозможных процессоров существует великое множество. Мы же будет рассматривать самые популярное семейство процессоров х86, которое с 1982 года используется в персональных компьютерах. Прежде чем говорить об истории процессоров, стоит разобраться в том, из чего состоит процессор. Роль процессора В 1945 году Джорджем фон Нейманом была представлена архитектура персонального компьютера, получившая название архитектура фон Неймана. Компьютер с такой архитектурой включал в себя блок управления, арифметико-логическое устройство (АЛУ), память и устройство ввода-вывода. Именно на этой архитектуре, придуманной более 50 лет назад, основаны все современные персональные компьютеры. Процессор в этой архитектуре берет на себя функции АЛУ и блока управления, он выбирает команды из памяти, а затем по очереди исполняет их и результат записывает обратно в память. Что в твоем компьютере память (оперативная память, винчестеры, дисководы и т.д.) и устройства ввода-вывода (клавиатура, мышка, монитор и др.) и какие функции они выполняют, объяснять, я думаю, не нужно. Все устройства в таком компьютере общаются друг с другом через системную шину.

Мозг компьютера - процессор - подключен к системной шине и выполняет программу, находящуюся в памяти компьютера. Программа состоит из последовательности команд. Каждая команда имеет разный размер и включает в себя не только информацию о том, что необходимо сделать, но и данные, которые нужно обработать. Поскольку все компьютеры работают с двоичными данными (нулями и единицами), то и команды и данные представляют собой набор двоичного кода. Длина команды в семействе процессоров х86 может быть от 1 байта (8 бит) до 12 байт. Основные характеристики Для того чтобы процессор мог обрабатывать большие объемы информации, было решено передавать ему команды не по одному байту, а сразу по несколько. Так было введено понятие разрядности процессора и разрядности системной шины. Если процессор способен за раз принимать по одному байту, то он называется восьмиразрядным (или восьмибитовым), если 2 байта - шестнадцатиразрядным (16 бит), если 4 байта, то процессор называют тридцатидвухразрядным (32 бита), и самые последние процессоры могут принимать сразу по 8 байт и называются шестидесятичетырехразрядными (64 бита). Таким образом, чем больше разрядность процессора, тем больше информации он может получить и обработать за один период времени, а значит, тем он быстрее. То же самое и с разрядностью системной шины, чем больше разрядность - тем больше ее пропускная способность, тем больше информации она может доставить процессору. Причем разрядность процессора и системной шины не обязательно должны совпадать.

Кроме разрядности, процессоры отличаются набором команд. Существует некий общий набор команд, которые должны уметь выполнять все процессоры семейства х86, но каждый производитель процессоров добавляет к этому списку свои специализированные команды. Зачем это нужно? Конечно для ускорения работы! Например, существует два процессора: один умеет только складывать числа, другой умеет складывать и умножать. Дадим этим двум процессорам одну задачу: умножить 2 на 3. Первый процессор, умеющий только складывать, будет выполнять три команды (2+2+2), в то время как процессор умеющий умножать выполнит лишь одну команду (2*3), а значит быстрее выдаст результат.

И конечно, процессор характеризуется тактовой частотой. Именно этим показателем сейчас меряются производители процессоров. Тактовая частота - это интервал времени, за который процессор выполняет определенную инструкцию. Для того чтобы понять это, вернемся к операции сложения. Допустим, чтобы сложить два числа процессору нужно потратить целых три такта (выполнить три операции): выбрать команду из памяти, выполнить операцию сложения и поместить результат обратно в память. Понятно, что чем быстрее частота процессора, тем быстрее эти операции будут выполнены. Технологии производства Как было упомянуто в начале статьи, процессор состоит из огромного числа транзисторов, связанных между собой. Опять же, говоря умными словами: транзистор - это полупроводниковый элемент, предназначенный для преобразования, усиления, перенаправления электрических сигналов. То есть, транзистор получает два каких-то сигнала, и, в зависимости от того, что он получил, выдает третий сигнал. Для изготовления транзисторов в процессоре используется кремний, как самый распространенный полупроводниковый материал на Земле. Технология производства следующая: сперва создается тонкая кремниевая пластина, которая тщательно полируется и покрывается различными химическими смесями. Затем пластину в определенных местах облучают ультрафиолетом, создавая на ней специальный рисунок. При попадании ультрафиолета на пластину слой химии выгорает, открывая доступ непосредственно к кремнию. Затем на полученную пластину наносятся зоны проводимости и непроводимости, для этого используется опять же кремний, но уже поликристаллический, а также различные оксиды и металлы. Полученная схема представляет не что иное, как огромное множество транзисторов.

Это, конечно, очень грубое описание технологии производства, но я надеюсь, ты понял основные принципы. А теперь задумайся, чем сложнее становятся процессоры, чем больше команд они должны уметь выполнять, тем больше необходимо использовать транзисторов. А для того чтобы разместить большое число транзисторов на маленькой кремниевой пластине, необходимо уменьшить размер транзисторов и увеличить размер кремниевой пластины. Понятно, что размер пластины сильно увеличивать нельзя, иначе процессоры буду занимать целый стол, поэтому компании производящие процессоры стараются уменьшить размер транзистора. Последние процессоры от Интел имеют размер транзистора всего 0,09 микрон (1 микрон = 0,001 миллиметра). Кроме того, чем меньше размер транзистора, тем меньше тепла он излучает при работе. Первые процессоры Итак, разобравшись с некоторыми основными свойствами процессоров, перейдем непосредственно к истории. В далеком 1971 году корпорация Intel явила миру первый микропроцессор, прадедушку того гигагерцового монстра, что стоит у тебя в компьютере. Первый микропроцессор имел индекс 4004. Это был четырехразрядный процессор, включающий в себя всего две тысячи транзисторов. Он не получил широкого распространения из-за сильно ограниченного набора команд. Затем в 1974 году появился i8080, который выпускается и используется до сих пор в различных устройствах (например в АОНах домашних телефонов), и на основе которого был выпущен популярный компьютер ZX-Spectrum. Кстати, тогда этот процессор стоил чуть меньше 200 долларов.

Сейчас самое время вспомнить о другой компании, производящей процессоры, – Advanced Micro Devices. В 1969 году AMD открыла свою первую фабрику - Fab1. В то время компания не занималась созданием собственных процессоров, а выпускала чужие процессоры со своим логотипом. В начале 70-х годов она подписала соглашение с Intel о кросс-лицензировании и начала выпускать процессор 8080A (клон 8080).

В 1978 году появился первый 16-разрядный процессор от Интел - i8086. Он включал в себя 29 тысяч транзисторов и работал на частоте 4,77 МГц. Через год Intel разработал 8-разрядный процессор i8088, на основе которого и был выпущен первый персональный компьютер от IBM. i8088 был полностью совместим с более совершенным i8086, однако использовал 8-разрядную шину (то есть принимал по 1 байту за такт) и имел ограничение в 256 Кб памяти (а на самом деле компьютеры комплектовались лишь 16 Кб). IBM было проще и дешевле разработать и наладить выпуск компьютера на основе 8-разрядной шины, поэтому появился этот процессор с урезанной шиной. В то же время компания Compaq выпустила компьютер DeskPro на основе i8086, который имел 16-битовую архитектуру и мог работать с целым мегабайтом оперативной памяти. Компьютеры от Compaq не получили большой популярности, а вот IBM PC буквально заполонили рынок персональных компьютеров. Именно на таком IBM PC впервые заработал MS-DOS. Чуть позже появились версии процессора i8088 с частотами 8 и 10 МГц. В то время Интел охотно продавала всем лицензии на производство нового процессора. Среди компаний купивших лицензии были Fujitsu, Hitachi, NEC, Siemens и другие. Процессор i8086 умел хорошо и быстро работать с целыми числами, однако в нем почти не было команд для работы с числами с плавающей точкой (с дробными числами). И в 1980 году появился первый сопроцессор, получивший индекс i8087. Сопроцессор - это специализированный проц, работающий вместе с центральным процессором и предназначенный для выполнения операций с плавающей точкой. Такой сопроцессор был очень полезен для работы с различными электронными таблицами и математическими программами (древние аналоги Excel). Сопроцессор i8087 добавил более 60 дополнительных математических команд.

Примерно в то же время появился процессор i80186, однако дальше тестовой лаборатории компании он не вышел из-за своей несовместимости с процессором i8086 и наличия огромного количества багов. В 1982 году, Интел анонсировала новый i80286. Он расширил набор команд процессора i8086 и имел более высокую частоту (до 20МГц!). Процессор производился по 1.5 микронной технологии и содержал около 134 тысяч транзисторов. "Двойка" могла выполнять до 2,6 млн. операций в секунду, что было довольно круто и в 1984 году. IBM начала производство компьютеров IBM PC/AT. Из радикальных изменений была разработана новая модель распределения и защиты памяти, что позволило использовать память более 1Мб, для этого процессор переводился в специальный "защищенный" (protected mode) режим работы, однако он был реализован весьма сложно и имел множество недоработок. Использование защищенного режима позволило писать многозадачные программы.

В то же время AMD начала выпуск процессора 286А, который практически ничем не отличался от оригинального i80286. Революционная "трешка" В конце 1985 года все та же Интел представила новый процессор i80386. Это был большой прорыв. Во-первых, новый процессор умел работать в 32-битном режиме, а значит, был более производительный. Во-вторых, 386-й имел нормальную поддержку "защищенного" режима и расширенный набор команд, а значит, пришло время многозадачных операционных систем. И наконец, трешка умела выполнять несколько разных задач параллельно, то есть процессор мог выполнять две идущие друг за другом команды одновременно, если они не зависят друг от друга. Процессор производился по 1-микронному техпроцессу и имел более 275 тысяч транзисторов.

Ходят слухи, что 386-й проц был разработан раньше 286, но у Интел были какие-то трудности с его выпуском. Рынок был не готов к 32-битным процессорам. Всего Интел представила 3 разновидности своего процессора: 386DX (Double-word eXternal) настоящий 32-32-разрядный процессор с частотами от 12 до 33МГц. Этот процессор был дорог, и по просьбе IBM Интел выпустила упрощенный вариант - 386SX (Single-word eXternal). Он отличался от DX не только названием, но и урезанной шиной, всего 16 бит. Процессор имел те же частоты что и старший брат, но компьютеры на его основе производить было дешевле. И в октябре 1990 года появилась третья версия процессора - 386SL (Single-word external Laptop). Это был мобильный вариант процессора с частотами 20 и 25МГц. Впервые трешка была использована в компьютере Compaq DeskPro 386. Этим Compaq попросила потесниться лидера того времени IBM на рынке персональных компьютеров.

В то же время Intel отказала AMD в лицензии на выпуск 386 процессоров, разорвав заключенный ранее договор. AMD, естественно, подала в суд и победила. Таким образом, AMD могла выпускать полностью совместимые с Intel процессоры, и в 1991 появился Am386, точная копия i80386, только с более высокой тактовой частотой: до 40МГц. После этого было еще несколько судебных исков, во время которых AMD, фактически, выпускала процессоры без лицензии. И лишь в 1994 году суд запретил использовать AMD любые разработки Intel. Сразу после этого решения в 1995 году AMD и Intel подписывают новое соглашение, в котором AMD разрешается изготавливать и продавать 287, 386, и 486 процессоры.

На "трешку" впервые переносится операционная система UNIX, а также специально разрабатываются OS/2 и Windows. Конечно, не обошлось без сопроцессора, он по традиции назывался i80387. Кроме Intel сопроцессоры стали производить Texas Instruments и Cyrix. Революция номер раз Как уже упоминалось выше, ранее процессор мог выполнять команды только последовательно. В середине 80-х годов появилась деление процессоров на CISC (Complex Instruction Set Computing - процессоры со сложным набором команд) и на RISC (Reduсed Instruction Set Computing - процессоры с сокращенным набором команд). До 386 все процессоры были основаны на архитектуре CISC. Со временем разработчики заметили, что некоторые операции, содержащиеся в сложных командах, выполняются гораздо чаще, а значит, их можно выделить в отдельные короткие команды. Так «трешка» получила в свое распоряжение дополнительный набор коротких команд, которые выполнялись за один такт процессора, в то время как на предыдущих версиях процессора для этого требовалось несколько операций, а значит, много тактов.

Кроме всего прочего, в 386-ом проце был усовершенствован конвейер выполнения команд. Суть конвейерной архитектуры заключается в том, что процессор разбит на несколько блоков, которые могут работать независимо друг от друга и одновременно выполнять операции на разных ступенях конвейера. Процессор может одновременно выбирать из памяти новую команду и в то же время производить операцию с текущей. Такая система сильно ускоряет работу CPU.

Появились компиляторы, которые при компиляции оптимизировали программы специально для 386-х процессоров, определенным образом упорядочивая команды. Желание выполнять больше операций за один такт процессора, привело к появлению так называемой суперскалярной архитектуры, впервые появившейся в процессорах Pentium. Суперскалярная архитектура подразумевает, что ядро самого процессора построено с использованием нескольких независимых конвейеров и умеет выполнять несколько RISC команд за такт, а получает процессор сложные команды, соответствующие CISC архитектуре. "Четверка" Еще одна мини-революция произошла вместе с появлением 486-го процессора. В апреле 1989 года появляется i486DX. От 386 он отличался тем, что имел встроенный кэш (8 Кб), встроенный сопроцессор, мог работать в многопроцессорном (SMP) режиме, а также имел 5-ступенчатый конвейер. Новый процессор работал на частотах от 25 до 33 МГц, имел 1,2 миллиона транзисторов, и был произведен по 0.8 микронному техпроцессу.

Благодаря наличию конвейера и встроенному кэшу, производительность «четверки» была в два-три раза выше, чем у «трешки» с той же частотой. Но из-за усложнения процессора и еще не совершенной технологии производства в 1991 году Интел срочно начал выпуск процессора i486SX (16-33 МГц). Он отличался от DX тем, что не имел сопроцессора, а значит, значительно снижалась стоимость его производства. Первые процессоры SX были ничем иным как перемаркированными процессорами DX, у которых не работал сопроцессор. В то же время появились четверки от АМД: Am486DX-40 и SX-40, которые имели схожие характеристики, но были дешевле. Еще одним конкурентом стала компания Cyrix предложившая покупателям Cx486SLC/DLC. Компания продавала их как 486 процессоры, однако на самом деле это были «трешки» с увеличенной частотой и кэшем. А затем появились Cx486S/DX - которые были полные клоны i486 (только кэш был всего 2 Кб). Еще одним 386 процессором продававшимся под маркой «четверки» бы IBM 486DLC. Тогда же началась рекламная компания, идущая до сих пор: "Intel Inside" (изначально полный лозунг звучал как "Intel: The Computer Inside").

Росли скорости процессоров, и все было бы нормально, но вот однажды процессор стал работать быстрее 25 МГц и даже быстрее 33 МГц. Это принципиальные частоты, поскольку именно со скоростью 25 или 33 МГц работает системная шина, то есть теперь чтобы повысить скорость процессора, нужно было увеличить скорость системной шины. И в 1992 году появилось решение: частоту шины оставить прежней, а процессор заставить работать на вдвое большей частоте. Так появились 486SX2 и DX2 с частотами 50-66 МГц, и был придуман новый термин - коэффициент умножения. В 1994 году начинается производство новой «четверки» - DX4, имеющий утроенную частоту 75 и 100 МГц соответственно, увеличенный объем кэша (16 Кб) и изготовленной по 0.6 мкм технологии. Конкуренты тоже не дремали и выпускали свои версии "разогнанных" процессоров. АМД удалось разогнать свои CPU аж до 120 МГц.

Такое увеличение частоты процессора привело к тому, что новые чипы стали сильно греться... И на них пришлось устанавливать радиаторы, а затем кулеры. Новые процессоры из-за нового техпроцесса требовали пониженное питание, поэтому апгрейд на 486DX4 без смены матери был невозможен, и Интел стала выпускать небольшими партиями процессоры с названием "OverDrive". Это были DX4 процессоры, но они могли работать в старых системных платах. Из-за маленьких партий процессоры были дороги и не пользовались большой популярностью. Intel Pentium После выпуска 486 процессора возникла небольшая заминка, частоты процессора повышались, но ничего нового ни одна компания предложить не могла. Intel решила навести порядок с лицензиями и начала подавать в суд практически на всех крупных производителей процессоров: AMD, Cyrix, UMC.

Мир ждал 586 процессора, но Intel отказалась от такой схемы нумерации процессоров и новый процессор, вышедший в 1993 году, получил название Pentium (кодовое название P5). Он стал первым суперскалярным процессором семейства х86, и мог действительно выполнять несколько команд за один такт. P5 имел встроенный сопроцессор (причем полностью переработанный, с достаточно высокой производительностью). Первые процессоры имели частоты 60 и 66 МГц и работали с 64-битной шиной данных. P5 содержал 3,1 млн. транзисторов, и был построен на 0,8 мкм технологии. Новый процессор был дорог, и не смог завоевать рынок. Кроме того, в первых партиях процессора была обнаружена ошибка и Intel пришлось бесплатно менять уже проданные процессоры на новые. И вот год спустя, в 1994, появляется новая версия "пня" с кодовым названием P54C. Новый процессор имел частоты от 75 до 200 МГц. Он изготавливался по 0,35 мкм технологии и стоил... немногим меньше 900 долларов. Потом цена стала падать.

Занявшись производством "пней", компания полностью перестала выпускать все остальные процессоры, оставив рынок конкурентам. Конкуренты В 1994 году никому не известная компания NexGen Microsystems представила свой процессор Nx586, это был прямой конкурент Pentium'у. За неимением своих заводов их стали производить на заводах IBM. Процессор был хороший: дешевый и быстрый, но он требовал значительных изменений в структуре материнской платы, а на это мало кто мог пойти, учитывая что Интел удерживал около 80% рынка процессоров. И AMD решает купить NexGen вместе со всеми ее разработками. В то время у AMD не было собственного процессора пятого поколения, и они занимались выпуском AMD 5x86-133-P75 (быстрый 486 процессор). Обрати внимание на обозначение P75. АМД придумали сравнивать производительность своих процессоров с аналогичными разработкам Интел, так появился "P-рейтинг" (от слова Pentium).

Купив компанию NexGen, AMD разработала AMD K5 (75- 116МГц) - процессор с новой архитектурой. Внутри это был полностью RISC, получавший CISC команды. Теоретически, он мог выполнять до четырех команд за один такт. Однако процессор появился лишь в 1996 году и уже не мог полноценно конкурировать с более быстрым и известным "пнем". Компания продолжала использовать P-рейтинг, так, процессор AMD K5 PR 166 имел реальную частоту всего 116.5МГц. Cyrix тоже разрабатывали свою альтернативу пентиуму. Их проект назывался М1 (Spike). Технологически М1 мог бы конкурировать с P5 и K5, однако он разрабатывался как замена 486 процессору и из-за этого не стал популярным. Доработав процессор для установки в материнские платы для пентиумов и назвав его 6x86 Cyrix выпустили новый процессор. Он имел частоты от 80 до 150МГц, но также в маркировке использовал P-рейтинг. Cyrix и на этом не остановились и в 1995 году выпустили новый процессор - MediaGX. Новый чип отличался тем, что включал в себя контроллер памяти, графический ускоритель и интерфейс шины PCI. Конечно, такой новый процессор требовал новых материнских плат. MMX и 3DNow! В 1997 году, Intel решила добавить новые команды к процессору (получившему название P55C). До этого набор команд не менялся со времен 386-го проца. Было добавлено 57 новых команд, которые значительно позволяли ускорить обработку видео и звука. Эти команды получили название MMX (MultiMedia eXtension - мультимедийное расширение). Новые процессоры имели частоты 166, 200 и 233МГц.

Чуть позже Cyrix выпускает процессор совместимый с технологией MMX - 6x86MX. Это был самый медленный и самый дешевый процессор, совместимый с "пнем". AMD, в ответ на Pentium MMX, выпускает процессор AMD K6 (основанный на процессоре от компании NexGen и имевший поддержку MMX команд). И начиная с этого процессора АМД отказалась от использования P-рейтинга в маркировках, поскольку реальная частота стала соответствовать процессорам Интел от 166 до 233МГц. В 1998 году был анонсирован K6-2. Он отличался от K6 тем, что имел еще более высокие частоты до 550МГц, но главным отличием было наличие нового набора инструкций "3DNow!". АМД решила пойти против Интела и самостоятельно расширила список команд процессора. Это был некий аналог ММХ команд, но они были предназначены для работы с вещественными, а не целыми числами. А конкретно: для работы с 3D-графикой. Затем, с появлением новых процессоров, стали появляться: SSE (Streaming SIMD (single instruction-multiple data) Extension или MMX2), SSE2 и SSE3. AMD предложила 3DNow! Professional, Enhanced 3DNow! и т.д. Революция номер два Параллельно с Pentium Intel вела разработку принципиально нового по своей структуре процессора Pentium Pro (кодовое название P6). Он состоял из 21 млн. транзисторов, изготавливался по 0,35 мкм технологии и имел частоты от 150 до 200МГц. Революционность процессора состояла в том, что он имел RISC ядро, содержал в себе три независимых конвейера, два кэша и был оптимизирован специально для работы с 32-битным кодом. Новый процессор предназначался для серверов (в 4-процессорных конфигурациях) и рабочих станций, проводящих сложные вычисления. Однако при работе со стандартными 16-битными приложениями Pentium Pro показывал едва ли не худшую производительность, чем обычный Pentium, поэтому на рынке настольных систем он популярности не завоевал. Именно после выхода Pentium Pro начался постепенный переход с 16-битных приложений на 32-битные, который полностью не завершен до сих пор. Шестое поколение Хотя первым процессором шестого поколения на самом деле является Pentium Pro, среди обычных пользователей он не получил большого распространения из-за своей высокой стоимости. И в 1997 году Интел выпускает процессор Pentium II. По своей сути это был оптимизированный Pentium Pro с поддержкой MMX. Для удешевления стоимости производства кэш выносят на плату рядом с процессором, и все это хозяйство запихивают в картридж. Такой процессор имел частоты 233-450МГц и производился по 0.35 (0.25) мкм технологии. В это время появился AMD K6-2, о котором говорилось выше, но из-за более низких частот он не мог составить реальную конкуренцию PII. Также был начат выпуск Cyrix MII, который был дешевый, но медленный. Чуть позже появляется серверный вариант - PentiumII Xeon (усовершенствованная версия PII), стоимостью до 3 тысяч баксов. А для дешевых компьютеров был выпущен Pentium II Celeron (урезанная версия PII). Celeron уступал своему младшему собрату Pentium MMX в скорости, однако он обладал неплохими возможностями для разгона, чем, собственно, и пользовались юзеры. В 1999 году Интел представляет очередной процессор шестого поколения - Pentium III. Вначале он также выпускался в картриджах, но затем, вследствие усовершенствования техпроцесса, стал доступен в привычном для нас виде. P3 пережил четыре разных ядра: Klamath, Deschutes, Coppermine и Tualatin. И опять принес расширенный набор команд SSE. В качестве альтернативы АМД представляет K6-III. Причем новый процессор от АМД появился на три дня раньше процессора Интел. И затем в 1999 году появляется AMD Athlon (K7) и его урезанный вариант Duron. А в это время Cyrix покупается компанией VIA Technologies и прекращает любые попытки конкурировать с Интел и АМД, выпуская абсолютно никакой по производительности процессор Cyrix III. На рынке процессоров х86 остаются два основных игрока. Pentium 4 В ноябре 2000 года Интел представляет последний процессор шестого поколения Pentium 4. Ядро процессора было создано с нуля, при этом была полностью сохранена совместимость с предыдущими поколениями процессоров. По уже сложившейся традиции появились урезанные версии процессоров с маркировкой Celeron. В Pentium 4 была реализована технология Hyper-Threading. Благодаря этой технологии, в системе вместо одного физического процессора видно два "виртуальных" процессора. Операционная система думает, что работает на двухпроцессорной системе, хотя реально установлен только один процессор. Реально технология потоков существовала уже давно, и вывод ее в широкую рекламную кампанию – чисто маркетинговый ход. Таким образом Intel попыталась сохранить привычное для покупателей соотношение: Pentium 2ГГц = 2 х Pentium 1ГГц. С приближением к частотам 3ГГц прямой зависимости уже не получалось, поэтому соотношение приняло такой вид: Pentium 3ГГц + HT = ~ 3 х Pentium 1ГГц. В ответ на Pentium 4, AMD представляет новый процессор Athlon XP... и снова возвращается к использованию P-рейтинга в маркировке процессоров. Ничего революционного не происходит: растут частоты процессоров, появляются новые расширения... Все ждут перехода к 64-битам! На пути к 64-битам Переход с 16-битных на 32-битные приложения произошел почти незаметно для обычного пользователя, примерено так же произойдет и с переходом к 64-битным процессорам. Первым настоящим 64-битным CPU стал Athlon 64 (K8). AMD создала 64-битный процессор для платформы x86, в то же время Intel при разработке своего 64-битного процессора (Itanium) начала с разработки совершенно новой архитектуры IA-64. Процессоры Itanium построены не на базе архитектуры CISC или RISC, а на некой их смеси, получившей название EPIC (Explicitly Parallel Instruction Computing). Такой процессор уже изначально предназначен для выполнения нескольких операций одновременно за счет того, что в процессе компиляции компилятор должен определять какие инструкции процессор может выполнять параллельно, а какие нет. Для совместимости со "старыми" 32-битными приложениями была создана система трансляции команд, при которой 32-битные команды преобразовываются в 64-битные. При этом скорость работы в 32-битных приложениях будет ниже, но новый процессор для этого и не предназначен. В то же время Athlon 64 прекрасно работает как с 32-битными так и с 64-битными приложениями. Чуть позже появился Itanium2, более совершенная версия процессора. Тут возникает одна проблема - для 64-битного процессора требуется специальная ОС. Для Athlon 64 уже есть альфа-версии Windows XP 64 и Unix... Что будет дальше? )))))))))))))))))))))))))))))))))))))))))))))))))))))) (((((((((((((((((((((((((( АБО Часть I - от 4004 до 8088 Чем 386-й отличается от 486-го? А Pentium от Pentium Pro? Было время, когда я мог робко ответить: "Скоростью... Чем же еще?". Вспоминая это, не могу удержаться от улыбки - мои заблуждения и "полузнания" частенько бывали смешными. Например, году в 94-м узнав что "бэкашка" - 16-битный компьютер, я решил что, приходя к дяде, я играю на 486-битном (!) компьютере. И не удивительно - тогда в нашей школе словечки "триставосемьдесятшестой" и "четыреставосемьдесятшестой" были у всех на слуху и многие дети (я!) скороговоркой выпаливали их даже не понимая толком, что все это значит. Как бы то ни было, но мой период ошибок и "полузнаний" благодаря интересу к компьютерам постепенно прошел. Думаю, что я трансформировался из любознательного чайника в слегка утомленного профи. :) С самого начала я завел общую тетрадку, в которой конспектировал все то, что узнавал интересного о процессорах, операционных системах, средствах мультимедиа... Читал все подряд и без разбору: от руководства по БЕЙСИКу к моей любимой "бэкашке" до "PC Magazine" с "Компьютеррой". Именно тогда я узнал, как расшифровывается EDO и PCI, как перезагрузить компьютер одной командой MS-DOS и многое другое. Впоследствии моими источниками стали Фидо и Интернет, а журналы приняли слегка "повторительный" оттенок. Сейчас во мне появилось желание консолидировать все то, что я разузнал о процессорах Intel, и выделить самое главное в рамках этой статьи. НАЧАЛО – ВСЕГО ЛИШЬ 4 БИТА Так с чего же началась история процессоров Intel? Познакомьтесь, пожалуйста, с ее первенцем - микропроцессором 4004! Он был представлен публике 15 ноября 1971 года и сразу же вызвал интерес у компьютерного мира. В то время реализация всех функций большой ЭВМ на одном маленьком чипе казалась просто чудом. Правда, его возможности были скромными даже для тех лет. Он мог обрабатывать данные порциями по 4 бита, длина машинной команды составляла 8 бит, что позволило иметь 46 инструкций. Память была раздельной для кодов и данных, менее 1 Кб для данных и 4 Кб для команд. Внутри у него было шестнадцать 4-битных регистров и 4-х уровневый стек.

Первый микропроцессор в мире! Первый микропроцессор имел 4-битную архитектуру и состоял всего-навсего из 2300 транзисторов (в современных "пентиумах" их десятки миллионов). При этом стандартно он работал на частоте 108 КГц (отдельные экземпляры разгонялись до 740 КГц) - намного меньше мегагерца! Тогда голубой мечтой инженеров Intel было создание мегагерцового варианта, чтобы догнать по скорости IBM 1620 - дорогой, но весьма быстрый по тем временам "шкаф" эпохи 60-х. Техпроцесс по сегодняшним меркам был ужасно "толстым" - целых 10 мкм. Несмотря на то что в компьютерах этот процессор не нашел применения, он все же использовался в калькуляторах Busicom и в различных системах управления (например, уличными светофорами). Через год (1972) был выпущен 4040. Он представлял собой улучшенную версию 4004 - главным нововведением была поддержка прерываний. Кроме того, добавилось 14 новых инструкций и глубина стека была увеличена до 8 уровней, а память команд до 8 Кб. 8 БИТ – ПИОНЕРЫ 70-Х 8008 был разработан в апреле 1972 года и стал первым 8-битным микропроцессором. Он был очень похож на 4040: появившиеся 8-битные регистры и увеличенная до 16 Кб память команд - вот, пожалуй, единственные отличия. Стек по-прежнему находился внутри чипа и был ограничен 8 уровнями вложенности. Он все еще позиционировался как процессор для продвинутых калькуляторов и терминалов ввода-вывода. Однако спустя полтора года Intel создала гораздо более совершенную версию - 8080. Основные идеи архитектуры были взяты с его предшественника, 8008, - но внутренняя организация была улучшена настолько, что именно он стал стандартом де-факто для микропроцессоров того времени, а 8008 был вскоре забыт. Новый процессор имел очень развитую систему команд (78 базовых + более 200 их вариаций). Шина данных была 8-битной, а 16-разрядная адресная шина позволила ему прямо адресовать 64 Кб единой памяти, которая перестала физически разделяться на память команд и память данных. С чипом 8080 связано появление стека внешней памяти, то есть стек стал располагаться не внутри процессора, а в оперативной памяти и мог быть довольно большим. Это позволило использовать в программах алгоритмы рекурсии. "Восьмидесятка" обладала семью 8-битными регистрами (именовавшимися A - E, H и L, - причем пары BC, DE и HL могли быть скомбинированы в 16-битные регистры). Кроме того, был улучшен техпроцесс, он составил 6 мкм. Количество транзисторов: 6000. Тактовая частота достигла 2 МГц. Помимо всего прочего 8080 послужил основой первому персональному компьютеру Альтаир-8800. Выпущенный в 1975 году фирмой MITS "Альтаир" стоил $439 ($621 в сборке). Клавиатура и монитор в стандартный комплект не входили, оперативная память составляла всего 256 байт (да-да, именно байт, а не килобайт), правда позже стали продаваться блоки расширенной памяти (от 1 до 4 Кб). Тогда же фирмой Digital Research была написана операционная система CP/M (Control Program for Microcomputers), ставшей на некоторое время стандартом, и прообразом MS-DOS. Между прочим, программисты "Альтаира" умудрялись писать даже игры, а Билл Гейтс и Пол Аллен - написали интерпретатор Бейсика. Стоит упомянуть о процессоре 8085, представленном в марте 1976 года, в котором Intel добавила две новые команды для управления прерываниями и усовершенствовала конструкцию корпуса. В этом процессоре появился сброс в начальное состояние (RESET) и использовался только один источник питания +5В (микропроцессору 8080 требовалось три источника: +12В, +5В и -5В). Одно из применений, которое нашел себе 8085 - электронные весы Toledo. Однако к середине 70-х рынок 8-битных чипов был уже переполнен. По этой причине Intel оставила попытки закрепиться на нем и сделала качественный шаг в сторону 16-битных процессоров... ДЕБЮТ “ВОСЕМЬДЕСЯТ ШЕСТЫХ” 8086 (86-й) можно назвать прадедушкой всех современных "пентиумов". :) Первый 16-битный процессор, результат усиленных разработок 1976 года. Он содержал рекордное по тому времени количество транзисторов - 29 тысяч! Именно от него ведет свое начало известная на сегодня архитектура x86. Размер его регистров по сравнению с 8080 был увеличен вдвое, что в свою очередь увеличило производительность в 10 раз. Ведь раньше чтобы сложить два больших числа, не умещавшихся в 8-битном регистре, приходилось писать специальную программу на Ассемблере, а теперь это стало доступно на аппаратном уровне. Количество базовых команд процессора 8086 возросло до 92. Кроме того, размер информационной шины был увеличен до 16 разрядов, что дало возможность вдвое увеличить скорость передачи данных на процессор и с него. Размер его адресной шины тоже был существенно увеличен - до 20 бит. Это позволило 86-му иметь 1 Мб (220 байт) оперативной памяти! Ближайший его конкурент, популярный в то время процессор Z80 (1976) фирмы Zilog Corporation, мог адресовать только 64 Кб. Память 8086 была также доработана: весь мегабайт оперативной памяти не представлялся единым полем, а был разделен на 16 сегментов величиной по 64 Кб. Таким образом, память 8086 можно было представить как объединенную вместе память нескольких 8080. При этом впервые в истории микропроцессоров программа перестала работать непосредственно с одним физическим адресом ячейки памяти (как это было, например, в Z80). Вместо этого, для получения физического адреса (20 бит) процессор складывал номер сегмента (16 бит), умноженный на 16, со смещением (16 бит). В действительности 8086 вместо умножения на 16 использовал содержимое регистра так, как если бы оно имело четыре дополнительных нулевых бита (см. рисунок). Такой странный на первый взгляд метод адресации обусловлен тем, что команды и данные процессора 8086 должны были располагаться в разных частях памяти, т. е. в разных сегментах.

Рис. 1 У 86-го процессора было всего 14 регистров. Из них 4 регистра общего назначения (AX, BX, CX, DX), 2 индексных (SI, DI), 2 указательных (BP, SP), 4 сегментных (CS, SS, DS, ES), регистр следующей инструкции IP и регистр флагов (состояний процессора) FLAGS. Все они были 16-битными, причем регистры AX, BX, CX, DX состояли из пары 8-битных (AL - AH, ..., DL - DH соответственно). Несмотря на то, что они являлись частями целых 16-битных регистров, их можно было использовать как отдельные 8-битные. Благодаря этому, программы, разработанные под 8080, можно было с минимальной переделкой использовать и на 8086 процессоре. Через год после презентации 8086, Intel объявила о разработке его более дешевого аналога - 8088. Он являлся близнецом 8086: 16-битные регистры, 20 адресных линий, тот же набор команд - все то же, за исключением одного, - шина данных была уменьшена до 8 бит. Заполнение 16-битных регистров извне теперь проходило в два раза медленнее. Как следствие - меньшая производительность. Его можно назвать своего рода "86SX" (тогда, правда, Intel не обозначала так свои процессоры). Однако стоимость самого чипа заметно не уменьшилась. Так для чего же Intel понадобилось делать этот шаг? Для того, чтобы угодить фирме IBM, решившей начать производство компьютеров на базе этого процессора. Желание IBM вполне объяснимо. Восьмибитная шина данных позволяла использовать имеющиеся на рынке 8-битные микросхемы памяти и сэкономить на развертывании производства 16-битных. При этом внутренняя структура процессора оставалась по-прежнему 16-битной, что давало важные преимущества по сравнению с другими микропроцессорами и задатком на будущее. На его основе в августе 1981 года фирма IBM начала массовое производство компьютеров IBM PC. Тактовая частота первых моделей была небольшой - 4.77 МГц. Однако позже были выпущены модели Turbo-XT с частотами 8, 10 и 12 МГц и встроенным жестким диском на 20 мегабайт. Часть II - 186/286 В предыдущей части речь шла о ранних процессорах Intel: от 4-битного 4004 до основателя нынешней династии - процессора 8086. Они были важнейшими творениями в истории корпорации, и не будь их - думаю, не было бы сейчас "пентиумов" и "целеронов". В этой речь пойдет о процессорах 186 и 286 - последних полностью 16-битных процессорах Intel. Если бы каждый процессор содержал в себе столько новинок, сколько их пришлось на долю 286-го, то наверное сегодня шлем виртуальной реальности был бы такой же привычной "железкой" как мышь или клавиатура... :-) Но не буду забегать вперед, вот что последовало за 86-м чипом. В СЕМЬЕ НЕ БЕЗ... СТО ВОСЕМЬДЕСЯТ ШЕСТОГО Мало кто знает, что 186-й процессор вообще существовал, и еще меньше знают о нем что-нибудь подробное... Тем не менее, он был. Созданный в 1981 году и презентованный в первой половине 1982 года, он стал базовым для реализации турборежима. Почти сразу же был создан процессор 188 - преемник 8088. Эти процессоры сохранили базовую архитектуру процессоров 8086/8088, но содержали на кристалле контроллер прямого доступа к памяти (DMA), трехканальный таймер, генератор синхронизации и контроллер прерываний (а зря - "интегралки" народ не любит и по сей день). Кроме того, было добавлено около десятка новых команд и стартовая частота поднялась до 8 МГц. Затем вышли модели с частотами 10, 12.5, 16 и 20 МГц. Процессоры C186/C188 имели средства управления энергопотреблением, были и редкие модификации со встроенными последовательными портами. Кроме того, добавилась парочка новых команд, ускоряющих вызов функций - pusha (Push All) и popa (Pop All), - запись и чтение всех регистров процессора в стек, раньше приходилось возиться с каждым регистром отдельно. У меня сложилось впечатление, что эти процессоры были созданы не столько для компьютеров, сколько для специальных устройств управления и микроконтроллеров. Но компьютеры на их основе все же были - у меня дома лежит журнал, привезенный в 1983 году мамой из Финляндии, с рекламой компьютеров Nokia на базе 186-го. :-) Правда широкого распространения эти компьютеры не получили. Видимо причины этого кроются в отсутствии качественных нововведений, относительной дороговизне чипа и в замаячившем на горизонте следующем процессоре Intel. Кроме того, встроенная периферия 186-го имела программный интерфейс несовместимый с IBM PC, т. е. для апгрейда писишки он не годился. Одним словом 186-й оказался тупиковой ветвью. 286-Й: ЕЩЕ НЕ СЕРВЕР, НО УЖЕ НЕ "БЭКАШКА" В 1982 году фирма Intel сделала крупный шаг в разработке новых идей: ее следующий 16-битный чип стал первой попыткой создать процессор, который мог бы аппаратно реализовывать многозадачность. Для этого был придуман защищенный режим. Ведь основная проблема многозадачности была в том, что любые программы, работавшие под управлением прежних процессоров, имели полную свободу действий - могли по любому адресу памяти записать все что угодно. Операционная система и другие приложения при этом были не защищены: в любой момент глючная программа могла затереть эти места в памяти и компьютер, скорее всего бы просто повис, даже не выдав знакомой таблички о выполнении "недопустимой операции". Были попытки создать операционную систему, которая сама бы контролировала все действия программ. Но для этого пришлось отказаться от компиляции приложений в готовые машинные коды - они стали интерпретируемыми, а производительность упала раз в двадцать. Стало ясно, что без аппаратной акселерации контроля, т. е. без защищенного режима процессора не обойтись. Суть работы защищенного режима была проста. Все свои команды процессор выполнял точно так же как и в реальном режиме, но программистам пришлось использовать понятие "логического адреса". Логический адрес состоял из 32 бит: селектора (16 бит) и смещения (16 бит). При этом в сегментных регистрах (CS, DS, SS, ES) теперь хранился не сегмент, а селектор. Селектор - это индекс в таблице дескрипторов (рис. 2). Запись в таблице дескрипторов содержала всю необходимую информацию о некотором блоке памяти: его базовый адрес, размер всего блока, его тип (код или данные) и сведения о приоритете программы-владельца. Таким образом, каждый дескриптор полностью описывал один сегмент программы. Размер этого дескриптора был одинаков как для 286-х, так и для 386-х машин - 64 бита или 8 байт, но у 286-го старшие 16 бит не использовались.

Рис. 2 Существовала одна глобальная и несколько локальных таблиц. Глобальная присутствовала всегда и хранила информацию о сегментах операционной системы. Локальные таблицы были для всех остальных программ. Управление памятью в защищенном режиме всегда было связано с конкретной операционной системой и ее версией. В OS/2 2.0 каждой программе были доступны глобальная и локальная (своя) таблицы дескрипторов. Всем приложениям в Windows 3.0 давалась одна общая локальная таблица. Система защиты 286-го процессора позволила разбить всю память и программы на 4 типа (кольца защиты - рис. 3). При этом программа работала только со своими блоками. Если программа обращалась к чужому сегменту памяти, то происходило прерывание с выдачей сообщения об ошибке. Ошибка также возникала, если программа пыталась считать или записать в свой собственный сегмент кода.

Рис. 3 Теперь о параметрах 286-го чипа. 134 000 транзисторов, техпроцесс 1.5 мкм, 68 контактных ножек, 16-битная шина данных, 24-битная адресная шина (до 16 Мб физической памяти), 19 "видимых" регистров (к 14 регистрам 86-го процессора добавилось еще 5, необходимых для реализации защищенного режима) и 6 "невидимых" (у программиста не было к ним никакого доступа, а нужны они были для эффективной работы самого процессора). Максимальный размер виртуальной памяти (файл подкачки) составил 1008 Мб (хотя на практике "двушка" никогда не имела таких больших дисков). Стартовая частота - 6 МГц, затем были созданы модели с частотами от 10 до 25 МГц. Помимо количественного повышения быстродействия было и качественное: некоторые операции 286-й научился выполнять за меньшое число тактов. Процессор 286 с тактовой частотой 12.5 МГц работал примерно в 6 раз быстрее, чем 8086 с частотой 4.77 МГц. Команда push научилась сохранять в стеке константы. Шины адреса и данных теперь стали раздельными, а не совмещенными на одном множестве ножек. Как и в 8086-м новый процессор имел 6-байтную очередь команд - что-то вроде прообраза будущих конвейеров. Команды в эту очередь загружались в последовательном порядке и параллельно с производимыми вычислениями. Несмотря на то, что 286-й процессор был окончательно представлен уже в 1982 году, производство компьютеров на его основе началось только в 1984-м. Новые компьютеры стали называться IBM PC AT (Advanced Technology). Выпуск этой модели подхлестнул интерес и к прежней IBM PC, способствуя популяризации архитектуры x86 в целом. Появилось несколько журналов, посвященных исключительно писишкам, магазинов, торгующих программным обеспечением. Словосочетание "персональный компьютер" становилось обыденным и больше не резало слух. Для меня, поклонника группы "Queen", 1984-й год ассоциируется со словами "I Want To Break Free". :-) Что ж, пожалуй, для писишек этот год стал и впрямь "освободительным". От диктата больших машин и насмешек их приверженцев. К сожалению, защищенный режим 286-го обладал и недостатками: • Несмотря на возможность адресовать 16 Мб памяти, максимальный размер сегмента остался по-прежнему равным 64 Кб, затрудняя программистам работу с большими массивами данных. • Режим работы с виртуальной памятью не был толком продуман - отсутствовал "прозрачный" для приложений способ перемещения данных операционной системой из памяти на жесткий диск - для реализации этого программам приходилось прибегать к разным ухищрениям вроде "запирания" и "отпирания" указателей на блок памяти. • В защищенном режиме отсутствовала совместимость с программами, написанными для реального режима MS-DOS. • Переход из реального режима в защищенный был односторонним, для обратного перехода требовалась перезагрузка компьютера. Таким образом, первый многозадачный "блинчик" у Intel получился слегка "комом" и 286-е компьютеры обычно использовались только в качестве быстрых аналогов 86-го. Сумела ли Intel исправить эти ошибки и подарить миру персоналок истинную многозадачность? Да, в следующем процессоре. Часть III - 386 17 октября 1985 года фирма Intel представила свой первый 32-битный процессор, обладавший уникальным преимуществом: в отличие от своих конкурентов, разработанных к тому времени компанией Motorola, он был аппаратно совместим с огромным парком 86-х и 286-х машин. Это был Intel 80386, сердце легендарной "трешки". Не сочтите меня стариком, но я люблю 386-е машины, люблю за все то, что они дали. Ведь именно на трешке я увидел Wolf3D и Warcraft. Познал миры легендарной Кирандии, заделался магнатом в Transport Tycoon и написал первые программки на Паскале... Даже Windows я впервые увидел на трешке (приняв ее за графический редактор со встроенным калькулятором :). 80386 - едва ли не самый революционный процессор, редко когда в чипах Intel появлялось столько новшеств сразу. КРАТКИЙ ОБЗОР Обладая полностью 32-битной архитектурой, 386-й процессор адресовал до 4 Гб (232 байт) физической оперативной памяти и до 64 Тб виртуальной. Он состоял из 275 000 транзисторов и изготавливался на основе технологии CHMOS III фирмы Intel, вобравшей в себя быстродействие технологии HMOS и низкое энергопотребление CMOS технологии. Толщина транзисторных элементов, как и у 286-го, составляла 1.5 мкм (в дальнейшем - 1 мкм), а число ножек увеличилось с 68 до 132. Новый процессор стал мощнее своих предшественников. Умножение двух 16-битных чисел командой MUL R16 выполнялось, в зависимости от числа единичных разрядов, за 9-22 такта. Для сравнения: то же у 286-го срабатывало всегда за 21 такт, а у 86-го аж за 118-133 такта! Математический сопроцессор 80387 не остался в стороне и тоже был оптимизирован - если 287-й выполнял команду извлечение корня FSQRT за 180-186 тактов, то 387-й чип справлялся с этой задачей уже за 122-129 тактов. В среднем количество тактов, необходимых для выполнения команд, уменьшилось в полтора-два раза в сравнении с 286-м и в 3-8 раз в сравнении с оригинальным IBM PC. Просмотр всего содержимого энциклопедии Britannica с применением 386-го занимал 12,5 секунд (286-у нужно было 45). Кроме того, добавилось несколько продвинутых команд сопроцессора, например вычисление синуса, косинуса и логарифмов. Первые процессоры стали работать с наивысшей частотой, достигнутой к тому времени для 286-го - 16 МГц, затем появилась 20 МГц модель (16 февраля 1987), а к середине 1988 года предел был отодвинут до 25 МГц (4 апреля 1988). В начале 90-х популярность приобрели 33 МГц модели (10 апреля 1989), кстати, все 386-е работали на частоте материнской платы, никаких коэффициентов умножения! Набор регистров в процессоре был существенно изменен - почти все 16-битные регистры были заменены их 32-битными аналогами. Новые регистры именовались как и прежде, только с приставкой "E" (Extended) в начале слова. Так, вместо регистров общего назначения AX, BX, CX, DX появились регистры EAX, EBX, ECX, EDX, младшие части которых (левые 16 бит) использовались 86/286-инструкциями в качестве прежних регистров. Вместо 16-битных IP (указатель следующей инструкции) и FLAGS (флаги процессора) - соответственно 32-битные регистры EIP и EFLAGS. Вместо SI/DI (индексы источника/назначения) - ESI/EDI. Словом, почти все прежние регистры заменились новыми, младшая часть которых использовалась по-старому. В новом процессоре 16-битными остались только сегментные регистры (CS, SS, DS, ES) и регистр локальной таблицы дескрипторов (LDTR). Кстати, к сегментным регистрам добавилась парочка новых, поначалу редко используемых - GS и FS. Напомню, что регистр CS указывает на начало сегмента кодов (исполняемый код программы), регистр SS - на "дно" стека, а остальные 4 регистра (DS, ES, GS, FS) - на разные сегменты данных (там хранятся переменные, массивы, в общем, любые данные программы). Между прочим Intel надолго осталась верна набору регистров 386-го, включая сопроцессор, и при создании следующих моделей (486, Pentium) ограничилась несущественным расширением (TR3-TR5 регистры, появившиеся в 486-м, управляющий регистр CR4, появившийся в Pentium). Все эти дополнительные регистры предназначались не столько для программ-приложений, сколько для операционных систем и средств отладки, т. е. выгоды от них в играх и Windows-приложениях не было никакой. Следующее увеличение числа регистров, полезных для самих приложений, произойдет, по сути дела, только в процессоре Pentium III (1999). Г.

Процессор

Навігаційне меню

Перегляди

Особисті інструменти

Навігація

Пошук

Інструменти

портфоліо