Рефераты

Семантический анализ структуры EXE файла и дисассемблер (с примерами и исходниками), вирусология

|JNGE |SF <> OF |если не больше или равно |

|JNL |SF = OF |если не меньше |

|JNLE |ZF=0 и SF=OF |если не меньше или равно |

|JNO |OF=0 |если нет переполнения |

|JNP |PF = 0 |если количество единичных битов результата |

| | |нечетно (нечетный паритет) |

|JNS |SF = 0 |если знак плюс (знаковый (старший) бит |

| | |результата равен 0) |

|JNZ |ZF = 0 |если нет нуля |

|JO |OF = 1 |если переполнение |

|JP |PF = 1 |если количество единичных битов результата |

| | |четно (четный паритет) |

|JPE |PF = 1 |то же, что и JP, то есть четный паритет |

|JPO |PF = 0 |то же, что и JNP |

|JS |SF = 1 |если знак минус (знаковый (старший) бит |

| | |результата равен 1) |

|JZ |ZF = 1 |если ноль |

Логические условия "больше" и "меньше" относятся к сравнениям целочисленных

значений со знаком, а "выше и "ниже" — к сравнениям целочисленных значений

без знака. Если внимательно посмотреть, то у многих команд можно заметить

одинаковые значения флагов для перехода. Это объясняется наличием

нескольких ситуаций, которые могут вызвать одинаковое состояние флагов. В

этом случае с целью удобства ассемблер допускает несколько различных

мнемонических обозначений одной и той же машинной команды условного

перехода. Эти команды ассемблера по действию абсолютно равнозначны, так как

это одна и та же машинная команда. Изначально в микропроцессоре i8086

команды условного перехода могли осуществлять только короткие переходы в

пределах -128...+127 байт, считая от следующей команды. Начиная с

микропроцессора i386, эти команды уже могли выполнять любые переходы в

пределах текущего сегмента команд. Это стало возможным за счет введения в

систему команд микропроцессора дополнительных машинных команд. Для

реализации межсегментных переходов необходимо комбинировать команды

условного перехода и команду безусловного перехода jmp. При этом можно

воспользоваться тем, что практически все команды условного перехода парные,

то есть имеют команды, проверяющие обратные условия.

Применение jcxz/jecxz:

|Команд|Состояние флагов в |Условие перехода|

|а |eflags/flags | |

|JCXZ |не влияет |если регистр |

| | |CX=0 |

|JECXZ |не влияет |если регистр |

| | |ECX=0 |

Команду jcxz/jecxz удобно использовать со всеми командами, использующими

регистр ecx/cx для своей работы. Это команды организации цикла и цепочечные

команды. Очень важно отметить то, что команда jcxz/jecxz, в отличие от

других команд перехода, может выполнять только близкие переходы в пределах

-128...+127 байт, считая от следующей команды. Поэтому для нее особенно

актуальна проблема передачи управления далее чем в указанном диапазоне. Для

этого можно привлечь команду безусловного перехода jmp. Например, команду

jcxz/jecxz можно использовать для предварительной проверки счетчика цикла в

регистре cx для обхода цикла, если его счетчик нулевой.

JMP

(JuMP)

Переход безусловный

|Схема команды: |jmp метка |

Назначение: используется в программе для организации безусловного перехода

как внутри текущего сегмента команд, так и за его пределы. При определенных

условиях в защищенном режиме работы команда jmp может использоваться для

переключения задач.

Алгоритм работы:

Команда jmp в зависимости от типа своего операнда изменяет содержимое либо

только одного регистра eip, либо обоих регистров cs и eip:

. если операнд в команде jmp — метка в текущем сегменте команд (a8, 16,

32), то ассемблер формирует машинную команду, операнд которой является

значением со знаком, являющимся смещением перехода относительно

следующей за jmp команды. При этом виде перехода изменяется только

регистр eip/ip;

. если операнд в команде jmp — символический идентификатор ячейки памяти

(m16, 32, 48), то ассемблер предполагает, что в ней находится адрес,

по которому необходимо передать управление. Этот адрес может быть трех

видов:

o значением абсолютного смещения метки перехода относительно

начала сегмента кода. Размер этого смещения может быть 16 или 32

бит в зависимости от режима адресации;

o дальним указателем на метку перехода в реальном и защищенном

режимах, содержащим два компонента адреса — сегментный и

смещение. Размеры этих компонентов также зависят от

установленного режима адресации (use16 или use32). Если текущим

режимом является use16, то адрес сегмента и смещение занимают по

16 бит, причем смещение располагается в младшем слове двойного

слова, отводимого под этот полный адрес метки перехода. Если

текущим режимом является use32, то адрес сегмента и смещение

занимают, соответственно, 16 и 32 бит, — в младшем двойном слове

находится смещение, в старшем — адрес сегмента;

o адресом в одном из 16 или 32-разрядных регистров — этот адрес

представляет собой абсолютное смещение метки, на которую

необходимо передать управление, относительно начала сегмента

команд.

Состояние флагов после выполнения команды (за исключением случая

переключения задач):

|выполнение команды не влияет на флаги |

Применение:

Команду jmp применяют для осуществления ближних и дальних безусловных

переходов без сохранения контекста точки перехода.

О б ъ е к т н ы й к о д (пять форматов):

Прямой переход внутри сегмента:

|11101001|disp-low|disp-high|

Прямой переход внутри сегмента (короткий):

|11101011|--disp--|

Косвенный переход внутри сегмента:

|11111111|mod100r/m|

Косвенный межсегментный переход:

|11111111|mod101r/m|

Прямой межсегментный переход:

|11101010|offset-low|offset-high|seg-low|seg-high|

LOOP

(LOOP control by register cx)

Управление циклом по cx

|Схема команды: |loop метка |

Назначение: организация цикла со счетчиком в регистре cx.

Алгоритм работы:

. выполнить декремент содержимого регистра ecx/cx;

. анализ регистра ecx/cx:

o если ecx/cx=0, передать управление следующей за loop команде;

o если ecx/cx=1, передать управление команде, метка которой

указана в качестве операнда loop.

Состояние флагов после выполнения команды:

|выполнение команды не влияет на флаги |

Применение:

Команду loop применяют для организации цикла со счетчиком. Количество

повторений цикла задается значением в регистре ecx/cx перед входом в

последовательность команд, составляющих тело цикла.

О б ъ е к т н ы й к о д: у11100010у--disp—у

MOV

(MOVe operand)

Пересылка операнда(1- применение)

|Схема команды: |mov приемник,источник |

Назначение: пересылка данных между регистрами или регистрами и памятью.

Алгоритм работы:

копирование второго операнда в первый операнд.

Состояние флагов после выполнения команды:

|выполнение команды не влияет на флаги |

Применение:

Команда mov применяется для различного рода пересылок данных, при этом,

несмотря на всю простоту этого действия, необходимо помнить о некоторых

ограничениях и особенностях выполнения данной операции:

. направление пересылки в команде mov всегда справа налево, то есть из

второго операнда в первый;

. значение второго операнда не изменяется;

. оба операнда не могут быть из памяти (при необходимости можно

использовать цепочечную команду movs);

. лишь один из операндов может быть сегментным регистром;

. желательно использовать в качестве одного из операндов регистр

al/ax/eax, так как в этом случае TASM генерирует более быструю форму

команды mov.

О б ъ е к т н ы й к о д (семь форматов):

Регистр/память в/из регистр:

|100010dw|modregr/m|

Непосредственное значение в регистр/память:

|1100011w|mod000r/m|--data--|data если w=1|

Непосредственное значение в регистр:

|1011wreg|--data--|data если w=1|

Память в регистр AX (AL):

|1010000w|addr-low|addr-high|

Регистр AX (AL) в память:

|1010001w|addr-low|addr-high|

Регистр/память в сегментный регистр:

|10001110|mod0sgr/m| (sg - сегментный регистр)

Сегментный регистр в регистр/память:

|10001100|mod0sgr/m| (sg - сегментный регистр)

MOV

(MOVe operand to/from system registers)

Пересылка операнда в (или из них) системные регистры (2-применение)

|Схема команды: |mov приемник,источник |

Назначение: пересылка данных между регистрами или регистрами и памятью.

Алгоритм работы:

копирование второго операнда в первый.

Состояние флагов после выполнения команды:

Назначение: пересылка элементов двух последовательностей (цепочек) в

памяти.

Алгоритм работы:

. выполнить копирование байта, слова или двойного слова из операнда

источника в операнд приемник, при этом адреса элементов предварительно

должны быть загружены:

o адрес источника — в пару регистров ds:esi/si (ds по умолчанию,

допускается замена сегмента);

o адрес приемника — в пару регистров es:edi/di (замена сегмента не

допускается);

. в зависимости от состояния флага df изменить значение регистров esi/si

и edi/di:

o если df=0, то увеличить содержимое этих регистров на длину

структурного элемента последовательности;

o если df=1, то уменьшить содержимое этих регистров на длину

структурного элемента последовательности;

. если есть префикс повторения, то выполнить определяемые им действия

(см. команду rep).

Состояние флагов после выполнения команды:

|выполнение команды не влияет на флаги |

Применение:

Команды пересылают элемент из одной ячейки памяти в другую. Размеры

пересылаемых элементов зависят от применяемой команды. Команда movs может

работать с элементами размером в байт, слово, двойное слово. В качестве

операндов в команде указываются идентификаторы последовательностей этих

элементов в памяти. Реально эти идентификаторы используются лишь для

получения типов элементов последовательностей, а их адреса должны быть

предварительно загружены в указанные выше пары регистров. Транслятор,

обработав команду movs и выяснив тип операндов, генерирует одну из машинных

команд movsb, movsw или movsd. Машинного аналога для команды movs нет. Для

адресации операнда приемник обязательно должен использоваться регистр es.

Для того чтобы эти команды можно было использовать для пересылки

последовательности элементов, имеющих размерность байт, слово, двойное

слово, необходимо использовать префикс rep. Префикс rep заставляет

циклически выполняться команды пересылки до тех пор, пока содержимое

регистра ecx/cx не станет равным нулю.

MUL

(MULtiply)

Умножение целочисленное без учета знака

|Схема команды: |mul множитель_1 |

Назначение: операция умножения двух целых чисел без учета знака.

Алгоритм работы:

Команда выполняет умножение двух операндов без учета знаков. Алгоритм

зависит от формата операнда команды и требует явного указания

местоположения только одного сомножителя, который может быть расположен в

памяти или в регистре. Местоположение второго сомножителя фиксировано и

зависит от размера первого сомножителя:

. если операнд, указанный в команде — байт, то второй сомножитель должен

располагаться в al;

. если операнд, указанный в команде — слово, то второй сомножитель

должен располагаться в ax;

. если операнд, указанный в команде — двойное слово, то второй

сомножитель должен располагаться в eax.

Результат умножения помещается также в фиксированное место, определяемое

размером сомножителей:

. при умножении байтов результат помещается в ax;

. при умножении слов результат помещается в пару dx:ax;

. при умножении двойных слов результат помещается в пару edx:eax.

Состояние флагов после выполнения команды (если старшая половина результата

нулевая):

Назначение: размещение содержимого операнда источник в стеке.

Алгоритм работы:

. уменьшить значение указателя стека esp/sp на 4/2 (в зависимости от

значения атрибута размера адреса — use16 или use32);

. записать источник в вершину стека (адресуемую парой ss:esp/sp).

Состояние флагов после выполнения команды:

|выполнение команды не влияет на флаги |

Применение:

Команда push используется совместно с командой pop для записи значений в

стек и извлечения их из стека. Размер записываемых значений — слово или

двойное слово. Также в стек можно записывать непосредственные значения.

Заметьте, что в отличие от команды pop в стек можно включать значение

сегментного регистра cs. Другой интересный момент связан с регистром sp.

Команда push esp/sp записывает в стек значение esp/sp по состоянию до

выдачи этой команды. В микропроцессоре i8086 по этой команде записывалось

скорректированное значение sp. При записи в стек 8-битных значений для них

все равно выделяется слово или двойное слово (в зависимости от use16 или

use32).

О б ъ е к т н ы й к о д (три формата):

Регистр: |01010reg|

Сегментный регистр: |000sg111| (sg-сегм.рег.)

Регистр/память: |11111111|mod110r/m|

Пример:

my_proc proc near

push ax

push bx

;тело процедуры, в которой изменяется содержимое

;регистров ax и bx

...

pop bx

pop ax

ret

endp

SHL

(SHift logical Left)

Сдвиг логический операнда влево

|Схема команды: |shl |

| |операнд,количество_сдвигов |

Назначение: логический сдвиг операнда влево.

Алгоритм работы:

. сдвиг всех битов операнда влево на один разряд, при этом выдвигаемый

слева бит становится значением флага переноса cf;

. одновременно слева в операнд вдвигается нулевой бит;

. указанные выше два действия повторяются количество раз, равное

значению второго операнда.

Состояние флагов после выполнения команды:

|11|00|

|OF|CF|

|?r|r |

Применение:

Команда shl используется для сдвига разрядов операнда влево. Ее машинный

код идентичен коду sal, поэтому вся информация, приведенная для sal,

относится и к команде shl. Команда shl используется для сдвига разрядов

операнда влево. Так же, как и для других сдвигов, значение второго операнда

(счетчикк сдвига) ограничено диапазоном 0...31. Это объясняется тем, что

микропроцессор использует только пять младших разрядов операнда

количество_разрядов. Аналогично другим командам сдвига сохраняется эффект,

связанный с поведением флага of, значение которого имеет смысл только в

операциях сдвига на один разряд:

. если of=1, то текущее значение флага cf и выдвигаемого слева бита

операнда различны;

. если of=0, то текущее значение флага cf и выдвигаемого слева бита

операнда совпадают.

Этот эффект, как вы помните, обусловлен тем, что флаг of устанавливается в

единицу всякий раз при изменении знакового разряда операнда.

Команду shl удобно использовать для умножения целочисленных операндов без

знака на степени 2. Кстати сказать, это самый быстрый способ умножения;

умножить содержимое ax на 16 (2 в степени 4).

SHR

Сдвиг логический операнда вправо

ASCII-коррекция после сложения

|Схема команды: |shr операнд,кол-во_сдвигов |

Назначение: логический сдвиг операнда вправо.

Алгоритм работы:

. сдвиг всех битов операнда вправо на один разряд; при этом выдвигаемый

справа бит становится значением флага переноса cf;

. одновременно слева в операнд вдвигается нулевой бит;

. указанные выше два действия повторяются количество раз, равное

значению второго операнда.

Состояние флагов после выполнения команды:

Назначение: операция логического исключающего ИЛИ над двумя операндами

размерностью байт, слово или двойное слово.

Алгоритм работы:

. выполнить операцию логического исключающего ИЛИ над операндами: бит

результата равен 1, если значения соответствующих битов операндов

различны, в остальных случаях бит результата равен 0;

. записать результат сложения в приемник;

. установить флаги.

Состояние флагов после выполнения команды:

|00-01 |4D5A - подпись | Компоновщик устанавливает этот код |

| |компоновщика |для идентификации правильного |

| |(признак EXE |EXE-файла |

| |файла) | |

|02-03 |Длина последнего |Число байтов в последнем блоке |

| |блока |EXE-файла |

|04-05 |Длина файла в |Число 512 байтовых блоков EXE-файла, |

| |блоках по 512 байт|включая заголовок |

|06-07 |Количество |Число настраиваемых элементов |

| |элементов таблицы | |

| |настройки адресов | |

| |(Relocation table)| |

|08-09 |Длина заголовка в |Число 16-тибайтовых блоков |

| |параграфах |(параграфов) в заголовке, (необходимо |

| | |для локализации начала выполняемого |

| | |модуля, следующего после заголовка) |

|0A-0B |Минимальный объем |Минимальное число параграфов, которые |

| |памяти который |должны находится после загруженной |

| |надо выделить |программы |

| |после конца | |

| |программы ( в | |

| |параграфах) | |

|0C-0D |Максимальный объем|Переключатель загрузки в младшие или |

| |памяти... |старшие адреса. При компоновке |

| | |программист должен решить, должна ли |

| | |его программа загружаться для |

| | |выполнения в младшие адреса памяти или|

| | |в старшие. Обычным является загрузка в|

| | |младшие адреса. Значение шест.0000 |

| | |указывает на загрузку в старшие |

| | |адреса, а шест. FFFF - в младшие. Иные|

| | |значения определяют максимальное число|

| | |параграфов, которые должны находиться |

| | |после загруженной программы |

|0E-0F |Сегментный адрес |Относительный адрес сегмента стека в |

| |стека относительно|выполняемом модуле |

| |начала программы | |

| |(SS) | |

|10-11 |Значение SP при |Адрес, который загрузчик должен |

| |запуске |поместить в регистр SP перед передачей|

| | |управления в выполнимый модуль |

|12-13 |Контрольная сумма |Контрольная сумма - сумма всех слов в |

| |- результат |файле (без учета переполнений) |

| |сложения без |используется для проверки потери |

| |переноса всех слов|данных |

| |файла | |

|14-15 |Значение IP |Относительный адрес, который загрузчик|

| | |должен поместить в регистр IP до |

| | |передачи управления в выполняемый |

| | |модуль |

|16-17 |Значение CS |Относительный адрес кодового сегмента |

| | |в выполняемом модуле. Этот адрес |

| | |загрузчик заносит в регистр CS |

|18-19 |Адрес первого |Смещение первого настраиваемого |

| |элемента ТHА |элемента в файле. |

|1A-1B |Номер сегмента |Номер оверлейного фрагмента: нуль |

| |перекрытия |обозначает, что заго ловок относится к|

| | |резидентной части EXE-файла |

|1С |Номер сегмента |Таблица настройки, содержащая |

| |перекрытия |переменное число настраиваемых |

| | |элементов, соответствующее значению по|

| | |смещению 06 |

Конец формы

Заголовок имеет минимальный размер 512 байтов и может быть больше, если

программа содержит большое число настраиваемых элементов. Позиция 06 в

заголовке указывает число элементов в выполняемом модуле, нуждающихся в

настройке. Каждый элемент настройки в таблице, начинающейся в позиции 1C

заголовка, состоит из двухбайтовых величин смещений и двухбайтовых

сегментных значений.

Система строит префикс программного сегмента следом за резидентной частью

COMMAND.COM (DOS), которая выполняет операцию загрузки. Затем COMMAND.COM

выполняет следующие действия:

- Считывает форматированную часть заголовка в память.

- Вычисляет размер выполнимого модуля (общий размер файла в позиции 04

минус размер заголовка в позиции 08) и загружает модуль в память с

начала сегмента.

- Считывает элементы таблицы настройки в рабочую область

и прибавляет значения каждого элемента таблицы к началу

сегмента (позиция OE).

- Устанавливает в регистрах SS и SP значения из заголовка

и прибавляет адрес начала сегмента.

- Устанавливает в регистрах DS и ES сегментный адрес

префикса программного сегмента.

- Устанавливает в регистре CS адрес PSP и прибавляет вели

чину смещения в заголовке (позиция 16) к регистру CS.

Если сегмент кода непосредственно следует за PSP, то смещение в

заголовке равно 256 (шест.100). Регистровая пара CS:IP содержит

стартовый адрес в кодовом сегменте, т.е. начальный адрес программы.

После инициализации регистры CS и SS содержат правильные адреса, а

регистр DS (и ES) должны быть установлены в программе для их собственных

сегментов данных:

1. PUSH DS ;Занести адрес PSP в стек

2. SUB AX,AX ;Занести нулевое значение в стек

3. PUSH AX ; для обеспечения выхода из программы

4. MOV AX,datasegname ;Установка в регистре DX

5. MOV DS,AX ; адреса сегмента данных

При завершении программы команда RET заносит в регистр IP нулевое

значение, которое было помещено в стек в начале выполнения программы. В

регистровой паре CS:IP в этом случае получается адрес, который является

адресом первого байта PSP, где расположена команда INT 20H. Когда эта

команда будет выполнена, управление перейдет в DOS.

ПРИМЕР EXE-ПРОГРАММЫ

|Рассмотрим следующую таблицу компоновки|программы: |

|(MAP) | |

|Start Stop Length Name 00000H 0003AH |Class |

|003BH CSEG 00040H 0005AH 001BH DSEG |CODE |

|00060H 0007FH 0020H STACK |DATA |

|Program entry point at 0000:0000 |STACK |

Таблица MAP содержит относительные (не действительные) адреса каждого из

трех сегментов. Символ H после каждого значения указывает на

шестнадцатеричный формат. Заметим, что компоновщик может организовать эти

сегменты в последовательности отличного от того, как они были закодированы

в программе.

В соответствии с таблицей MAP кодовый сегмент CSEG находится по адресу

00000 - этот относительный адрес является началом выполняемого модуля.

Длина кодового сегмента составляет шест.003B байтов. Следующий сегмент по

имени DSEG начинается по адресу шест.00040 и имеет длину шест.001B. Адрес

шест.00040 является первым после CSEG адресом, выровненным на границу

параграфа (т.е. это значение кратно шест.10). Последний сегмент, STACK,

начинается по адресу шест.00060 - первому после DSEG, адресу выровненному

на границу параграфа.

С помощью отладчика DEBUG нельзя проверить содержимое заголовка, так как

при загрузке программы для выполнения DOS замещает заголовок префиксом

программного сегмента. Однако, на рынке программного обеспечения имеются

различные сервисные утилиты (или можно написать собственную), которые

позволяют просматривать содержимое любого дискового сектора в

шестнадцатеричном формате. Заголовок для рассматриваемого примера программы

содержит следующую информацию (содержимое слов представлено в обратной

последовательности байтов).

00 Шест.4D5A.

02 Число байтов в последнем блоке: 5B00.

04 Число 512 байтовых блоков в файле, включая заголовок: 0200

(шест.0002х512=1024).

06 Число элементов в таблице настройки, находящейся после форматированной

части заголовка: 0100, т.е. 0001.

08 Число 16 байтовых элементов в заголовке: 2000 (шест.0020=32 и

32х16=512).

0C Загрузка в младшие адреса: шест. FFFF.

0E Относительный адрес стекового сегмента: 6000 или шест.

60.

10 Адрес для загрузки в SP: 2000 или шест.20.

14 Смещение для IP: 0000.

16 Смещение для CS: 0000.

18 Смещение для первого настраиваемого элемента: 1E00 или шест.1E.

После загрузки программы под управлением отладчика DEBUG регистры

получают следующие значения:

SP = 0020 DS = 138F ES = 138F

SS = 13A5 CS = 139F IP = 0000

Для EXE-модулей загрузчик устанавливает в регистрах DS и ES адрес

префикса программного сегмента, помещенного в доступной области памяти, а в

регистрах IP, SS и SP - значения из заголовка программы.

Регистр SP

Загрузчик использует шест.20 из заголовка для инициализации указателя

стека значением длины стека. В данном примере стек был определен, как 16

DUP (?), т.е. 16 двухбайтовых полей общей длиной 32 (шест.20) байта.

Регистр SP указывает на текущую вершину стека.

Регистр CS

В соответствии со значением в регистре DS после загрузки программы, адрес

PSP равен шест.138F(0). Так как PSP имеет длину шест.100 байтов, то

выполняемый модуль, следующий непосредственно после PSP, находится по

адресу шест.138F0+100=139F0. Это значение устанавливается загрузчиком в

регистре CS. Таким образом, регистр CS определяет начальный адрес кодовой

части программы (CSEG). С помощью команды D CS:0000 в отладчике DEBUG можно

просмотреть в режиме дампа машинный код в памяти. Обратим внимание на

идентичность дампа и шестнадцатеричной части ассемблерного LST файла кроме

операндов, отмеченных символом R.

Регистр SS

Для установки значения в регистре SS загрузчик также использует

информацию из заголовка:

Начальный адрес PSP 138F0

Длина PSP 100

Относительный адрес стека 60

Адрес стека 13A50

Регистр DS

Загрузчик использует регистр DS для установки начального адреса PSP. Так

как заголовок не содержит стартового адреса, то регистр DS необходимо

инициализировать в программе следующим образом:

0004 B8 ---- R MOV AX,DSEG

0007 8E D8 MOV DS,AX

Ассемблер оставляет незаполненным машинный адрес сегмента DSEG, который

становится элементом таблицы настройки в заголовке. С помощью отладчика

DEBUG можно просмотреть завершенную команду в следующем виде:

B8 A313

Значение A313 загружается в регистр DS в виде 13A3. В результате имеем

Регистр Адрес Смещение

CS 139F0 00

DS 13A30 40

SS 13A50 60

Попробуем выполнить трассировку любой скомпонованной программы под

управлением отладчика DEBUG (DOS) и обратим внимание на изменяющиеся

значения в регистрах:

Команда Изменяющиеся регистры

PUSH DS IP и SP

SUB AX,AX IP и AX (если был не нуль)

PUSH AX IP и SP

MOV AX,DSEG IP и AX

MOV DS,AX IP и DS

Регистр DS содержит теперь правильный адрес сегмента данных. Можно

использовать теперь команду D DS:00 для просмотра содержимого сегмента

данных DSEG и команду D SS:00 для просмотра содержимого стека.

ФУНКЦИИ ЗАГРУЗКИ И ВЫПОЛНЕНИЯ ПРОГРАММЫ

Рассмотрим теперь, как можно загрузить и выполнить программу из другой

программы. Функция шест.4B дает возможность одной программе загрузить

другую программу в память и при необходимости выполнить. Для этой функции

необходимо загрузить адрес ASCIIZ-строки в регистр DX, а адрес блока

параметров в регистр BX (в действительности в регистровую пару ES:BX). В

регистре AL устанавливается номер функции 0 или 3:

AL=0. Загрузка и выполнение. Данная операция устанавливает префикс

программного сегмента для новой программы, а также адрес подпрограммы

реакции на Ctrl/Break и адрес передачи управления на следующую команду

после завершения новой программы. Так как все регистры, включая SP,

изменяют свои значения, то данная операция не для новичков. Блок

параметров, адресуемый по ES:BX, имеет следующий формат:

Смещение Назначение

0 Двухбайтовый сегментный адрес строки

параметров для передачи.

2 Четырехбайтовый указатель на командную строку

в PSP+80H.

6 Четырехбайтовый указатель на блок FCB

в PSP+5CH.

10 Четырехбайтовый указатель на блок FCB

в PSP+6CH.

AL=3. Оверлейная загрузка. Данная операция загружает программу или блок

кодов, но не создает PSP и не начинает выполнение. Таким образом можно

создавать оверлейные программы. Блок параметров адресуется по регистровой

паре ES:BX и имеет следующий формат:

Смещение Назначение

0 Двухбайтовый адрес сегмента для загрузки

файла.

2 Двухбайтовый фактор настройки загрузочного

модуля.

Возможные коды ошибок, возвращаемые в регистре AX: 01, 02, 05, 08, 10 и 11.

Программа на рис.22.2 запрашивает DOS выполнить команду DIR для дисковода

D.

2. Структура COM – файла.

Для выполнения компоновки можно также создавать COM-файлы. Примером часто

используемого COM-файла является COMMAND.COM. Программа EXE2BIN.COM в

оперативной системе DOS (3 версия о более) преобразует EXE-файлы в COM-

файлы. Фактически эта программа создает так называемый BIN (двоичный) файл,

поэтому она и называется "преобразователь EXE в Вin (EXE-to-BIN)". Выходной

Вin-файл можно легкостью переименовать в COM-файл.

Какие же различия между EXE и COM-файлах ?

В первую очередь конечно они отличаются заголовками файла. Несмотря на то,

что программа EXE2BIN преобразует EXE-файл в COM-файл, существуют

определенные различия между программой, выполняемой как EXE-файл и

программой, выполняемой как COM-файл.

Размер программы. EXE-программа может иметь любой размер, в то время как

COM-файл ограничен размером одного сегмента и не превышает 64К. COM-файл

всегда меньше, чем соответствующий EXE-файл; одна из причин этого -

отсутствие в COM-файле 512-байтового начального блока EXE-файла.

Сегмент стека. В EXE-программе определяется сегмент стека, в то время как

COM-программа генерирует стек автоматически. Таким образом при создании

ассемблерной программы, которая будет преобразована в COM-файл, стек должен

быть опущен.

Сегмент данных. В EXE программе обычно определяется сегмент данных, а

регистр DS инициализируется адресом этого сегмента. В COM-программе все

данные должны быть определены в сегменте кода. Ниже будет показан простой

способ решения этого вопроса.

Инициализация. EXE-программа записывает нулевое слово в стек и

инициализирует регистр DS. Так как COM-программа не имеет ни стека, ни

сегмента данных, то эти шаги отсутствуют. Когда COM-программа начинает

работать, все сегментные регистры содержат адрес префикса программного

сегмента (PSP),

- 256-байтового (шест. 100) блока, который резервируется операционной

системой DOS непосредственно перед COM или EXE программой в памяти. Так как

адресация начинается с шест. смещения 100 от начала PSP, то в программе

после оператора SEGMENT кодируется директива ORG 100H.

Обработка. Для программ в EXE и COM форматах выполняется ассемблирование

для получения OBJ-файла, и компоновка для получения EXE-файла. Если

программа создается для выполнения как EXE-файл, то ее уже можно выполнить.

Если же программа создается для выполнения как COM-файл, то компоновщиком

будет выдано сообщение:

Warning: No STACK Segment

(Предупреждение: Сегмент стека не определен)

Это сообщение можно игнорировать, так как определение стека в программе

не предполагалось. Для преобразования EXE-файла в COM-файл используется

программа EXE2BIN.

Между прочим размеры EXE и COM-программ - 788 и 20 байт. Учитывая такую

эффективность COM-файлов, производители программных продуктов в большинстве

создают свои программы в COM-формате. Для этого есть такой пример как

Windows.

Несоблюдение хотя бы одного требования COM-формата может послужить

причиной неправильной работы программы. Если EXE2BIN обнаруживает ошибку,

то выдается сообщение о невозможности преобразования файла без указания

Страницы: 1, 2, 3


© 2010 Современные рефераты