Питер Абель. Ассемблер и программирование для IBM PC


          АССЕМБЛЕР И ПРОГРАММИРОВАНИЕ ДЛЯ IBM PC


                    ПИТЕР АБЕЛЬ

               Технологический институт
               Британская Колумбия


Ассемблер для IBM PC                                       2


Содержание
------------------------------------------------------------

Предисловие

 1.  Введение в семейство персональных компьютеров IBM PC

          Введение
          Биты и байты
          ASCII код
          Двойные числа
          Шеснадцатеричное представление
          Сегменты
          Регистры
          Архитектура персональных компьютеров
          Основные положения на память
          Вопросы для самопроверки

 2.  Выполнение программы

          Введение
          Начало работы
          Просмотр памяти
          Пример машинных кодов: непосредственные данные
          Пример машинных кодов: определенные данные
          Машинная адресация
          Пример машинных кодов: определение размера памяти
          Свойства отладчика
          Основные положения на память
          Вопросы для самопроверки

 3.  Формат языка ассемблера

          Введение
          Комментарии
          Формат кодирования
          Псевдокоманды
          Указатели памяти и регистров
          Инициализация программы
          Пример исходной программы
          Основные положения на память
          Вопросы для самопроверки

 4.  Ассемблирование и выполнение программы

          Введение
          Ввод программы
          Подготовка программы для выполнения
          Ассемблирование программы
          Компановка загрузочного модуля
          Выполнение программы
          Пример исходной программы


Ассемблер для IBM PC                                       3


          Файл перекрестных ссылок
          Основные положения на память
          Вопросы для самопроверки

 5.  Определение данных

          Введение
          Псевдокоманды определения данных
          Определение байта (DB)
          Определение слова (DW)
          Определение двойного слова (DD)
          Определение "четверного" слова (DQ)
          Определение десяти байт (DT)
          Непосредственные операнды
          Псевдокоманда (директива) EQU
          Основные положения на память
          Вопросы для самопроверки

 6.  Программные COM-файлы

          Введение
          Различия между EXE- и COM-файлами
          Пример COM-файла
          COM-стек
          Отладка
          Основные положения на память
          Вопросы для самопроверки

 7.  Логика и организация программы

          Введение
          Команда JMP
          Команда LOOP
          Флаговый регистр
          Команды условного перехода
          Процедуры и вызовы (CALL)
          Стековый сегмент
          Программа: команды длинной пересылки
          Логические команды: AND, OR, XOR, TEST, NOT
          Программа: изменение нижнего и верхнего регистров
          Сдвиги и ротация
          Организация программы
          Основные положения на память
          Вопросы для самопроверки

 8.  Работы с экраном I: Основные возможности

          Введение
          Команда прерывания: INT
          Установка курсора
          Очистка экрана
          Команды экрана и клавиатуры: Базовая DOS
          Ввод на экран: стандарт DOS


Ассемблер для IBM PC                                       4


          Программа: Ввод набора ASCII символов
          Ввод с клавиатуры: Базовая DOS
          Программа: Ввод имен с клавиатуры и вывод на экран
          Команды экрана и клавиатуры: Расширенная DOS
          Вывод на экран: Расширенная DOS
          Ввод с клавиатуры: Расширенная DOS
          Использование CR, LF, TAB для вывода на экран
          Основные положения на память
          Вопросы для самопроверки

 9.  Работа с экраном II: Расширенные возможности

          Введение
          Байт атрибутов
          Прерывания BIOS
          Программа: мигание, видеореверс, скроллинг
          Расширенные ASCII коды
          Другие команды ввода/вывода DOS
          BIOS INT 16H для ввода с клавиатуры
          Дополнительные функциональные клавиши
          Основные положения на память
          Вопросы для самопроверки

10.  Работа с экраном III: Цвет и графика

          Введение
          Текстовый (алфавитно-цифровой) режим
          Графический режим
          Режим средней разрешающей возможности
          Программа: Установка цвета и графического режима
          Основные положения на память
          Вопросы для самопроверки

11.  Обработка строк

          Введение
          Особенности команд обработки строк
          REP: Префикс повторения строки
          MOVS: Пересылка строки
          LODS: Загрузка строки
          STOS: Сохранение строки
          CMPS: Сравнение строк
          SCAS: Сканирование строки
          Сканирование и замена
          Альтернативное кодирование
          Дублирование шаблона (образца)
          Программа: Выравнивание справа при выводе на экран
          Основные положения на память
          Вопросы для самопроверки

12.  Арифметика I: Обработка двоичных данных

          Введение


Ассемблер для IBM PC                                       5


          Сложение и вычитание
          Беззнаковые и знаковые данные
          Умножение
          Сдвиг регистров DX:AX
          Деление
          Преобразование знака
          Процессоры Intel 8087 и 80287
          Основные положения на память
          Вопросы для самопроверки

13. Арифметика II: Обработка ASCII и BCD данных

          Введение
          ASCII формат
          Двоично-десятичный формат (BCD)
          Преобразование ASCII формата в двоичный формат
          Преобразование двоичного формата в ASCII формат
          Сдвиг и округление
          Программа: Расчет зарплаты
          Основные положения на память
          Вопросы для самопроверки

14.  Обработка таблиц

          Введение
          Определение таблиц
          Прямой табличный доступ
          Поиск в таблице
          Команда перекодировки (трансляции) (XLAT)
          Программа: Вывод шестнадцатеричных и ASCII кодов
          Программа: Сортировка элементов таблицы
          Операторы TYPE, LENGTH и SIZE
          Основные положения на память
          Вопросы для самопроверки

15.  Дисковая память I: Организация

          Введение
          Объем диска
          Каталог
          Таблица распределения файлов (FAT)
          Основные положения на память
          Вопросы для самопроверки

16.  Дисковая память II: Функции базовой DOS

          Введение
          Управляющий блок файла: FCB
          Использование FCB для создания дискового файла
          Программа: FCB для создания дискового файла
          Последовательное чтение дискового файла
          Программа: FCB для чтения дискового файла
          Прямой доступ


Ассемблер для IBM PC                                       6


          Программа: Прямое чтение дискового файла
          Прямой блочный доступа
          Программа: Прямое чтение блока
          Абсолютный дисковый ввод/вывод
          Другие возможности
          Программа: Выборочное удаление файлов
          Основные положения на память
          Вопросы для самопроверки

17.  Дисковая память III: Функции расширенной DOS

          Введение
          Строка ASCIIZ
          Номер файла и коды возврата по ошибкам
          Создание дискового файла
          Программа: Использование номера для чтения файла
          ASCII файлы
          Другие функции расширенной DOS
          Основные положения на память
          Вопросы для самопроверки

18.  Дисковая память IV: Команды ввода/вывода BIOS

          Введение
          Дисковые команды BIOS
          Байт состояния
          Программа: Использование BIOS для чтения секторов
          Основные положения на память
          Вопросы для самопроверки

19.  Печать

          Введение
          Управляющие символы для печати
          Использование расширенной DOS для печати
          Программа: Постраничная печать с заголовками
          Печать ASCII файлов и управление табуляций
          Печать с использованием базовой DOS
          Специальные команды принтера
          Печать с использованием BIOS INT 17H
          Основные положения на память
          Вопросы для самопроверки

20.  Макрокоманды

          Введение
          Простое макроопределение
          Использование параметров в макрокомандах
          Комментарии
          Использование макро внутри макроопределения
          Директива LOCAL
          Подключение библиотеки макроопределений
          Конкатенация (&amp;)


Ассемблер для IBM PC                                       7


          Повторение: REPT, IRP и IRPC
          Условные директивы
          Директива EXITM
          Макрокоманды, использующие IF и IFNDEF условия
          Макрокоманды, использующие IFIDN условие
          Основные положения на память
          Вопросы для самопроверки

21.  Связь между подпрограммами

          Введение
          Межсегментные вызовы
          Атрибуты EXTRN и PUBLIC
          Программа: Использование EXTRN и PUBLIC для меток
          Программа: Использование PUBLIC в кодовом сегменте
          Программа: Общие данные в подпрограммах
          Передача параметров
          Связь Бейсик-интерпритатор - ассемблер
          Связь Паскаль - ассемблер
          Связь C - ассемблер
          Основные положения на память
          Вопросы для самопроверки

22.  Загрузчик программ

          Введение
          COMМAND.COM
          Префикс программного сегмента
          Выполнение COM-программы
          Выполнение EXE-программы
          Пример EXE-программы
          Функция загрузки или выполнения программ

23.  BIOS и DOS прерывания

          Введение
          Обслуживание прерываний
          BIOS прерывания
          DOS прерывания
          Функции DOS INT 21H
          Резидентные программы
          Порты
          Генерация звука

24.  Справочник по директивам ассемблера

          Введение
          Индексная память
          Команды ассемблера
          Директивы ассемблера

25.  Справочник по командам ассемблера


Ассемблер для IBM PC                                       8


          Введение
          Обозначение регистров
          Байт режима адресации
          Двухбайтовые команды
          Трехбайтовые команды
          Четырехбайтовые команды
          Команды в алфавитном порядке

Приложения

          1.   ASCII коды
          2.   Шестнадцатерично-десятичные преобразования
          3.   Зарезервированные слова
          4.   Режимы ассемблирования и компановки

Ответы на некоторые вопросы

Индексный указатель


Ассемблер для IBM PC                                       9


------------------------------------------------------------

Предисловие

   Появление микропроцессоров в 60-х  годах cвязано  с разра
боткой интегральных схем (ИС). Интегральные схемы объединяли
в себе различные элэктронные компоненты в  единый элемент на
силиконовом "чипе".  Разработчики установили  этот крошечный
чип в устройство,  напоминающие сороконожку и включили его в
функционирующие системы.  В начале  70-х  микрокомпьютеры на
процессоре  Intel 8008  возвестили о  первом поколении микро
процессоров.
   К 1974  году появилось  второе поколение микропроцессоров
oбщего назначения  Intel 8080.  Данный успех  побудил другие
фирмы к производству этих или аналогичных процессоров.
   В  1978  году  фирма Intel  выпустила  процессор третьего
поколения - Intel 8086, который обеспечивал некоторую совмес
тимость с 8080  и являлся значительным продвижением вперед в
данной области. Для поддержки более простых устройств и обес
печения  совместимости  с  устройствами   ввода/вывода  того
времени  Intel разработал  разновидность  процессора  8086 -
процессор 8088,  который в  1981  году был выбран фирмой iВМ
для ее персональных компьютеров.
   Более развитой версией процессора 8088 является процесcор
80188,  а  для процессора  8086  - процессоры 80186, 80286 и
80386,  которые обеспечили дополнительные возможности и повы
cили  мощность вычислений.  Микропроцессор 80286, установлен
ный в компьютерах IBM  AT  появился  в  1984  году.  Все эти
процессоры  имеют отношение к развитой  архитектуре процессо
ров фирмы Intel и обозначаются  как iAPX  86,  iAPX 88, iAPX
86,  iAPX286  и iAPX386,  где APX - Intel Advanced Processor
Architecture.
   Распространение микрокомпьютеров послужило  причиной пеpе
смотра отношения к языку ассемблера  по  двум основным причи
нам.  Во-первых,  программы, написанные на языке ассемблера,
требуют  значительно  меньше  памяти  и  времени выполнения.
Во-вторых,  знание языка ассемблера  и результирующего машин
ного кода  дает  понимание архитектуры машины,  что  вряд ли
обеспечивается  при работе  на  языке высокого  уровня. Хотя
большинство специалистов в  области программного обеспечения
ведут  разработки  на  языках  высокого  уровня,  таких  как
Паскаль  или С,  что проще при написании  программ, наиболее
мощное  и эффективное программное обеспечение  полностью или
частично написано на языке ассемблера.
   Языки  высокого  уровня были разработаны для  того, чтобы
избежать  специальной  технической   особенности  конкретных
компьютеров. Язык ассемблера, в свою очередь, разработан для
конкретной специфики  компьютера  или  точнее  для специфики
процессора.  Следовательно, для того, чтобы написать програм
му на  языке ассемблера для  конкретного компьютера, следует
знать его архитектуру и данная книга содержит  весь необходи
мый  базовый материал.  Для  работы кроме  этого материала и
cоответствующих знаний необходимы следующее:


Ассемблер для IBM PC                                      10


   ъ Доступ персональному компьютеру IBM PC или совместимому
     с ним c оперативной памятью - минимум 64К и одним диско
     водом.  Лучше,  но не  обязательно,  если будет дополни
     тельная память и второй дисковод или винчестер.

   ъ Знакомство с руководством по IBM PC.

   ъ Дискета, содержащая транслятор с языка ассемблера, пред
     почтительно, но не обязательно, последней версии.

   ъ Копию операционной системы PC-DOS или MS-DOS, лучше пос
     ледней версии.

   Cледующее является не обязательным для данной темы:

   ъ Опыт программирования.  Хотя  эти  знания  могут помочь
     быстрее  освоить некоторые  идеи  программирования, они
     не обязательны.

   ъ Хорошие  знания в электронике  или схемотехнике. Данная
     книга  дает  всю необходимую информацию  об архитектуре
     PC,  которая  требуется для  программирования  на языке
     ассемблера.


   Операционные системы

   Назначение операционной системы  - позволить пользователю
yправлять  работой на  компьютере:  вызывать  для выполнения
конкретные  программы,  обеспечивать средства для сохранения
данных (каталог), иметь доступ к информации на диске.
   Основной операционной системой  для PC  и совместимых мо-
делей является MS-DOS фирмы Microsoft,  известная как PC-DOS
для IBM  PC.  Особенности некоторых версий: 2.0 обеспечивает
поддержку  твердого  диска (винчестера),  3.0  применяется в
компьютерах AT,  4.0 обеспечивает работу в многопользователь
ском  режиме.   Рассмотрение  профессиональной  операционной
системы UNIX  и ее  аналога для PC  XENIX  выходит  за рамки
данной книги.

   Подход к книге

   Данная книга приследует две цели: она является учебником,
a  так же  постоянным справочным пособием  для работы. Чтобы
наиболее  эффективно восполнить затраты на  микрокомпьютер и
программное обеспечение,  необходимо тщательно прорабатывать
каждую главу и перечитывать материал, котоpый не сразу ясен.
Ключевые моменты находятся в примерах  программ,  их следует
преобразовать   в   выполнимые   модули   и   выполнить  их.
Прорабатывайте упражнения, приведенные в конце каждой главы.


Ассемблер для IBM PC                                      11


   Первые восемь глав составляют базовый материал для данной
книги  и  для  языка  ассемблера.   После  этих  глав  можно
продолжить с  глав  9,  11,  12,  14,  15,  19,  20  или 21.
Связанными являются главы с 8  по 10,  12  и 13, с 15 по 18,
главы с 22 по 25 cодержат справочный материал.
   Когда вы завертшите работу с книгой, вы сможете:

   - понимать хардвер персонального компьютера;
   - понимать коды машинного языка и шестнадцатиричный
     формат;
   - понимать назначение отдельных шагов при ассемблирова
     нии, компановке и выполнении;
   - писать программы на языке ассемблера для управления
     экраном, арифметических действий, преобразования ASCII
     кодов в двоичные форматы, табличного поиска и сортиро
     вки, дисковых операций ввода/вывода;
   - выполнять трассировку при выполнении программы, как
     средство отладки;
   - писать собственные макрокоманды;
   - компановать вместе отдельные программы.

   Изучение языка ассемблера и  создание работающих программ
-  это захватывающий  процесс.  Затраченное  время  и усилия
несомненно будут вознаграждены.

   Признательность автора

   Автор  благодарен  за  помощь и  сотрудничество всем, кто
внес предложения и просматривал рукопись.


Ассемблер для IBM PC                                      12


Предисловие переводчика

   Книга  представляет собой учебник  по программированию на
языке Ассемблера для персональных компьютерах, совместимых с
IBM PC,  адресованный прежде всего  начинающим. Обилие приме
ров и  исходных  текстов  программ  представляет несомненное
достоинство   книги,   позволяющее   начинать   практическое
программирование  уже с первых  страниц книги. Профессиональ
ные  программисты  смогут  найти  в  книге   много  полезной
информации.  Стиль книги очень живой,  простой, не требующий
никакой   специальной    или    математической   подготовки.
Единственное,  что необходимо  для работы над  книгой, - это
постоянный доступ к персональному компьютеру.
   Переводчик  в  основном  придерживался  терминологии книг
В.М.Брябрина  "Программное  обеспечение   персональных  ЭВМ"
(1988),  С.Писарева,  Б.Шура "Программно-аппаратная организа
ция  компьютера IBM PC"  (1987), В.Л.Григорьева "Программиро
вание  однокристальных  микропроцессоров"  (1987),  а  также
А.Б.Борковского "Англо-русский словарь по программированию и
информатике"    (1987).   Во   многих   случаях   переводчик
придерживался   "профессионального   диалекта"   максимально
щадящего  технические  термины  в  оригинале.  Такой диалект
принят  во  многих  коллективах программистов-разработчиков,
где   чаще   всего   приходится   работать   с  оригинальной
документацией   на   английском   языке,   ввиду  острейшего
дефицита отечественной литературы по данной тематике.
   Большинство   примеров,   приведенных   в  данной  книге,
проверены на компьютерах совместимых с IBM  PC. При переводе
без  специальных  оговорок  исправлены  мелкие  неточности и
опечатки оригинала.
   Текст  перевода сформирован и  отредактирован в интегриро
ванной системе Framework.
   Автор  перевода  благодарен  всем,  кто оказал помощь при
вводе рукописи на машинные носители.  Особую признательность
автор перевода выражает своей жене.


Ассемблер для IBM PC                                       1


        ГЛАВА 1. Введение в семейство персональных компьютеров IBM PC
------------------------------------------------------------

Введение в семейство персональных компьютеров IBM PC

Цель:  объяснить особенности технических средств микрокомпью
тера и организации программного обеспечения.

ВВЕДЕНИЕ
------------------------------------------------------------

   Написание  ассемблерных программ требует  знаний организа
ции  всей  системы  компьютера.  В  основе  компьютера лежат
понятия бита и байта.  Они являются тем средством, благодаря
которым в компьютерной памяти представлены данные и команды.
   Программа в машинном коде состоит из  различных сигментов
для определения данных,  для машинных команд и для сигмента,
названного стеком, для хранения адресов. Для выполнения ариф
метических действий,  пересылки данных и адресации компьютер
имеет ряд регистров.  Данная глава содержит весь необходимый
материал  по этим элэментам компьютера,  так  что вы сможете
продвинутся к главе 2  к вашей первой программе  на машинном
языке.

БИТЫ И БАЙТЫ
------------------------------------------------------------

   Для  выполнения  программ  компьютер  временно записывает
программу  и данные  в основную память.  Это память, которую
люди имеют в виду, когда утверждают, что их компьютер имеет,
например,  512К памяти. Компьютер имеет также ряд pегистров,
которые он использует для временных вычислений.
   Минимальной  единицей  информации  в  компьютере является
бит.  Бит  может быть  выключен,  так что  его значение есть
нуль,   или  включен,  тогда  его  значение  равно  единице.
Единственный бит не  может  представить  много  информации в
отличие от группы битов.
   группа  из  девяти битов представляет собой  байт; восемь
битов которого содержат данные и один бит -  контроль на чет
ность.   Восемь  битов  обеспечивают   основу  для  двоичной
арифметики и для представления символов,  таких  как буква A
или символ  *.  Восемь  битов дают  256 различных комбинаций
включенных  и  выключенных  состояний:  от  "все  выключены"
(00000000) до "все включены" (11111111). Например, сочетание
включенных  и выключенных битов  для  представления  буквы A
выглядит как 01000001,  а  для cимвола  *  -   00101010 (это
можно не запоминать).  Каждый байт в памяти компьютера имеет
уникальный адрес, начиная с нуля.
   Требование контроля на  честность заключается в  том, что
количество  включенных битов  а байте всегда  должно быть не
четно. Контрольный бит для буквы A будет иметь значение еди-
ница,  а  для символа *  -  ноль. Когда команда обращается к


Ассемблер для IBM PC                                       2


байту  в памяти,  компьютер проверяет этот байт.  Если число
включенных  битов является четным,  система выдает сообщение
об ошибке.  Ошибка четности  может  явится  результатом сбоя
оборудования или случайным  явлением,  в  любом  случае, это
бывает крайне редко.
   Может  появится  вопрос,  откуда  компьютер  "знает", что
значения бит 01000001  представляют букву A. Когда на клавиа
туре нажата  клавиша A,  система  принимает  сигнал  от этой
конкретной клавиши в байт памяти.  Этот сигнал устанавливает
биты в значения 01000001. Можно переслать этот байт в памяти
и,  если  передать  его  на  экран  или  принтер,  то  будет
сгенерирована буква A.
   По соглажению биты в байте пронумерованы от 0 до 7 справа
налево, как это показано для буквы A:

          Номера бит:         7 6 5 4 3 2 1 0
          Значения бит:       0 1 0 0 0 0 0 1

   Число 2  в  десятой степени   равно 1024,  что составляет
один килобайт и обозначается буквой К. Например, компьютер с
памятью в 512К содержит 512 х 1024, т.е. 524288 байт.
   Процессор в PC  и в  совместимых  моделях  использует 16-
битовую архитектуру,  поэтому он  имеет доступ  к 16-битовым
значениям  как  в  памяти,  так  и  в  регистрах. 16-битовое
(двухбайтовое)   поле  называется  словом.   Биты   в  слове
пронумерованы от 0 до 15 справа налево, как это показано для
букв PC:

     Номера бит:    15 14 13 12 11 10 9 8   7 6 5 4 3 2 1 0
     Значения бит:   0  1  0  1  0  0 0 0   0 1 0 0 0 0 1 1

ASCII КОД
------------------------------------------------------------

   Для целей стандартизации в  микрокомпьютерах используется
aмериканский национальный стандартный код для обмена информа
цией ASCII (American National Standard Code  for Information
Interchange).  Читается как "аски"  код (прим. переводчика).
Именно  по  этой причине комбинация бит  01000001 обозначает
букву A.  Наличие стандартного кода облегчает  обмен данными
между   различными   устройствами    компьютера.   8-битовый
рассширенный  ASCII-код,   используемый  в  PC  обеспечивает
представление  256   символов,  включая  символы  для  нацио
нальных алфавитов.  В приложении 1  приведен список символов
ASCII кода,  а в главе 8  показано как вывести на экран боль
шинство из 256 символов.

ДВОИЧНЫЕ ЧИСЛА
------------------------------------------------------------


Ассемблер для IBM PC                                       3


   Так как компьютер может различить только нулевое и единич
ное состояние бита,  то  он  работает  системе  исчисления с
базой 2  или в двоичной системе.  Фактически бит унаследовал
cвое  название  от  английского  "BInary   digiT"  (двоичная
цифра).
   Сочетанием двоичных цифр (битов)  можно представить любое
значение.  Значение двоичного числа  определяется относитель
ной позицией каждого  бита и наличием единичных  битов. Ниже
показано восьмибитовое число содержащее все единичные биты:

     Позиционные веса:        128 64 32 16 8 4 2 1
     Включенные биты:           1  1  1  1 1 1 1 1

Самый правый бит имеет весовое значение  1,  следующая цифра
влево -  2,  следующая - 4 и т.д. Общая сумма для восьми еди
ничных битов в данном случае составит 1 + 2 + 4 + ... + 128,
или 255 (2 в восьмой степени - 1).
   Для двоичного числа 01000001  единичные биты представляют
значения 1  и 64,  т.е.  65. Но  01000001 представляет также
букву A!  Действительно,  здесь  момент,  который необходимо
четко  уяснить.  Биты 01000001  могут представлять как число
65, так и букву A:

   - если программа определяет элемент  данных для  арифмети
     ческих целей,  то 01000001  представляет двоичное число
     эквивалентное десятичному числу 65;

   - если программа определяет  элемент данных  (один или бо
     лее смежных  байт),  имея в виду описательный характер,
     как,  например,  заголовок, тогда 01000001 представляет
     собой букву или "строку".

   Пи програмировании это различие становится  понятным, так
как назначение каждого элемента данных определено.
   Двоичное  число неограничено  только  восьмью битами. Так
как процессор  8088  использует  16-битовую  архитектуру, oн
автоматически оперирует с 16-битовыми числами.  2  в степени
16  минус  1  дает  значение  65535,  а  немного творческого
программирования позволит обрабатывать числа до 32  бит (2 в
степени 32 минус 1 равно 4294967295) и даже больше.

   Двоичная арифметика

   Микрокомпьютер выполняет арифметические действия только в
двоичном формате.  Поэтому программист  на  языке ассемблера
должен быть знаком с двоичным форматом и двоичным сложением:

                    0 + 0 = 0
                    1 + 0 = 1
                    1 + 1 = 10
                1 + 1 + 1 = 11


Ассемблер для IBM PC                                       4


   Обратное внимание на перенос единичного бита  в последних
двух операциях.  Теперь, давайте сложим 01000001 и 00101010.
Букву A и символ *? Нет, число 65 и число 42:

          Двоичные             Десятичные

          01000001                  65
          00101010                  42
          01101011                 107

   Проверьте, что двоичная сумма 01101011 действительно
равна 107. Рассмотрим другой пример:

          Двоичные             Десятичные

          00111100                  60
          00110101                  53
          01110001                 113


   Отрицательные числа

   Все представленные  выше двоичные числа  имеют положитель
ные  значения,  что  обозначается  нулевым  значением самого
левого  (старшего)  разряда.  Отрицательные  двоичные  числа
содержат единичный бит в старшем разряде и  выражаются двоич
ным  дополнением.  Т.е.,  для  представления  отрицательного
двоичного   числа   необходимо  инвертировать   все  биты  и
прибавить 1. Рассмотрим пример:

          Число 65:           01000001
          Инверсия:           10111110
          Плюс 1:             10111111  (равно -65)

   Если прибавить единичные значения к числу 10111111, 65 не
получится.  Фактически двоичное  число  считается отрицатель
ным,  если его старший бит равен 1.  Для определения абсолют
ного  значения  отрицательного  двоичного  числа, необходимо
повторить  предыдущие  операции:  инвертировать  все  биты и
прибавить 1:

          Двоичное значение:  10111111
          Инверсия:           01000000
          Плюс 1:             01000001  (равно +65)

   Сумма +65 и -65 должна составить ноль:

                              01000001  (+65)
                              10111111  (-65)
                           (1)00000000


Ассемблер для IBM PC                                       5


   Все восемь бит имеют нулевое значение. Перенос единичного
бита влево потерян.  Однако,  если  был  перенос  в знаковый
pазряд  и из  разрядной  сетки,  то  результат  является кор
ректным.
   Двоичное вычитание выполняется просто: инвентируется знак
вычитаемого и складываются  два числа.  Вычтем, например, 42
из 65.  Двоичное представление для 42  есть  00101010, и eго
двоичное дополнение: - 11010110:

                    65        01000001
                 +(-42)       11010110
                    23     (i)00010111

   Результат 23 является корректным. В рассмотренном примере
произошел перенос в знаковый разряд и из разрядной сетки.
   Если справедливость  двоичного дополнения  не сразу понят
на,  рассмотрим следующие задачи:  Какое значение необходимо
прибавить к двоичному числу 00000001,  чтобы  получить число
00000000?  В терминах  десятичного исчисления  ответом будет
-1. Для двоичного рассмотрим 11111111:

                              00000001
                              11111111
               Результат:   (1)00000000

   Игнорируя перенос  (1),  можно видеть, что двоичное число
11111111 эквивалентно десятичному -1 и соответственно:

                    0         00000000
                 -(+1)       -00000001
                   -1         11111111

   Можно видеть также каким образом  двоичными  числами пред
cтавлены уменьшающиеся числа:

                    +3        00000011
                    +2        00000010
                    +i        00000001
                     0        00000000
                    -1        11111111
                    -2        11111110
                    -3        11111101

   Фактически нулевые биты  в  отрицательном  двоичном числе
определяют его  величину:  рассмотрите  позиционные значения
нулевых битов как если это были единичные  биты, сложите эти
значения и прибавте единицу.
   Данный  материал  по двоичной арифметике  и отрицательным
числам будет особенно полезен при изучении глав 12 и 13.

ШЕСТНАДЦАТИРИЧНОЕ ПРЕДСТАВЛЕНИЕ
------------------------------------------------------------


Ассемблер для IBM PC                                       6


   Представим,  что необходимо просмотреть содержимое некото
pых  байт  в  памяти  (это  встретится  в  следующей главе).
Требуется  oпределить  содержимое  четырех  последовательных
байт (двух слов),  которые имеют двоичные значения.  Так как
четыре  байта  включают  в  себя  32  бита,  то  специалисты
разработали "стенографический"  метод представления двоичных
данных. По этому методу каждый байт делится пополам и каждые
полбайта  выражаются  соответствующим  значением. рассмотрим
следующие четыре байта:

     Двоичное:   0101 1001 0011 0101 1011 1001 1100 1110
   Десятичное:     5    9    3    5   11    9   12   14

   Так как здесь для некоторых  чисел  требуется  две цифры,
расширим  систему счисления  так,  чтобы  10=A,  11=B, 12=C,
13=D,  14=E,  15=F.  таким образом получим более сокращенную
форму, которая представляет содержимое вышеуказанных байт:

                    59  35  B9  CE

   Такая система счисления включает "цифры" от 0 до F, и так
как таких цифр 16, она называется шестнадцатиричным представ
лениeм.  В  таблице  1.1  приведены  двоичные,  десятичные и
шестнадцатиричные значения чисел от 0 до 15.
   Шестнадцатиричный формат нашел большое применение в языке
ассемблера.  В листингах ассемблирования программ в шестнад-
цатеричном формате показаны все адреса, машинные коды команд
и содержимое  констант.  Также для отладки при использовании
программы  DOS DEBUG адреса  и содержимое  байтоа выдается в
шестнадцатиричном формате.
   Если немного поработать с шестнадцатиричным  форматом, то
можно быстро  привыкнуть  к нему.  рассмотрим несколько про-
cтых примеров шестнадцатиричной арифметики. Следует помнить,
что после шестнадцатиричного числа F  следует шестнадцатирич
ное 10, что равно десятичному числу 16.

               6   5   F   F   10   FF
               4   8   1   F   10    1
               A   D  10  1E   20  100

------------------------------------------------------------
------------------------------------------------------------
Таблица 1.1. Двоичное, десятичное и шестнадцатиричное
             представления.

   Заметьте также,  что шест.20 эквивалентно десятичному 32,
шест.100 - десятичному 256 и шест.100 - десятичному 4096.
   В  данной  книге  шестнадцатиричные  числа  записываются,
например,  как  шест.4B,  двоичные числа  как дв.01001011, и
десятичные числа,  как 75  (отсутствие  какого-либо описания
предполагает  десятичное число).  Исключения возможны, когда
база  числа  очевидна  из  контекса.   Для  индикации  шест.
числа в ассемблерной  программе непосредственно  после числа


Ассемблер для IBM PC                                       7


ставится символ "H", например, 25H (десятичное значение 37).
Шест.  число всегда начинается с деcятичной цифры 0-9, таким
образом, B8H записывается как 0B8H.
   В приложении  2  показано как преобразовывать шестнадцати
pичные значения  в десятичные  и обратно.  Теперь расcмотрим
некоторые  характеристики процессора PC,  которые необxодимо
понять для перехода к главе 2.

СЕГМЕНТЫ
------------------------------------------------------------

   Сегментом  называется область, которая начинается на гра-
нице параграфа, т.е. по любому адресу, который делится на 16
без остатка.  Хотя сегмент может располагаться в любом месте
памяти  и иметь  размер  до  64  Кбайт,  он  требует столько
памяти, cколько необходимо для выполнения программы. Имеется
три главных сегмента:

1.   Сегмент кодов. Сегмент кодов содержит машинные команды,
     которые  будут выполняться.  Обычно  первая выполняемая
     команда находится в начале  этого сегмента  и операцион
     ная система  передает управление по  адресу данного сег
     мента для выполнения программы.  Регистр сегмента кодов
     (CS) адресует данный сегмент.

2.   Сегмент данных.  Сегмент  данных  содержит определенные
     данные,   константы  и   рабочие  области,  необходимые
     программе. Регистр сегмента данных (DS) адресует данный
     сегмент.

3.   Сегмент  стека.  Стек содержит адреса  возврата как для
     программы  для возврата  в операционную  систему, так и
     для вызовов подпрограмм для возврата в  главную програм
     му.   Регистр  сегмента  стека   (SS)  адресует  данный
     сегмент.

   Еще  один  сегментный  регистр,  регистр  дополнительного
сегмента  (ES), предназначен для специального использования.
На  pис.1.2  графически представлены  регистры SS,  DS и CS.
Последовательность  регистров и сегментов на  практике может
быть иной. Три сегментных регистра содержат начальные адреса
соответствующих сегментов  и  каждый  сегмент  начинается на
границе параграфа.
   Внутри программы все адреса памяти относительны  к началу
cегмента.   Такие  адреса  называются  смещением  от  начала
сегмента.   Двухбайтовое  смещение  (16-бит)  может  быть  в
пределах от шест.  0000 до шест. FFFF или от 0 до 65535. Для
обращения к любому адресу в  программе, компьютер складывает
адрес в регистре сегмента и смещение.  Например, первый байт
в сегменте кодов имеет смещение  0,  второй байт -  01 и так
далее до смещения 65535.


Ассемблер для IBM PC                                       8


   В  качестве  примера  адресации,  допустим,  что  регистр
сегмента  данных  содержит  шест.  045F и  некоторая команда
обращается  к  ячейке  памяти  внутри   сегмента  данных  со
смещением 0032.  Несмотpя на то, что регистр сегмента данных
содержит 045F,  он указывает на адрес 045F0, т.е. на границе
параграфа.   Действительный  aдрес   памяти   поэтому  будет
следующий:

               Адрес в DS:         045F0
               Смещение:            0032
               Реальный адрес:     04622

   Каким образом процессоры 8086/8088 адресуют память в один
миллион  байт?  В регистре содержится 16  бит. Так как адрес
сегмента  всегда  на границе параграфа,  младшие четыре бита
адреса pавны нулю.  Шест. FFF0 позволяет адресовать до 65520
(плюс смещение)  байт. Но специалисты решили, что нет смысла
иметь  место для битов,  которые всегда  равны нулю. Поэтому
адрес хранится  в cегментном  регистре  как  шест.  nnnn,  а
компьютер полагает,  что имеются еще четыре  нулевых младших
бита  (одна шест.  цифра),  т.е. шест. nnnn0. Таким образом,
шест.  FFFF0  позволяет адресовать до 1048560  байт. Если вы
сомневаeтесь,  то декодируйте каждое  шест.  F  как двоичное
1111,  учтите нулевые биты и сложите  значения для единичных
бит.
   Процессор 80286 использует 24 бита для адресации так, что
FFFFF0   позволяет  адресовать  до  16   миллионов  байт,  а
процессор 80386 может адресовать до четырех миллиардов байт.

РЕГИСТРЫ
------------------------------------------------------------

   Процессоры  8086/8088  имеют  14  регистров, используемых
для  yправления  выполняющейся   программой,  для  адресации
памяти и для обеспечения  арифметических  вычислений. Каждый
регистр имеет длину в одно  слово (16  бит)  и адресуется по
имени. Биты регистра принято нумеровать слева направо:

          15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

   Процессоры 80286  и 80386 имеют ряд дополнительных регист
ров,  некоторые  из  них 16-битовые.  Эти  регистры здесь не
рассматриваются.

   Сегментные регистры CS, DS, SS и ES

   Каждый  сегментный  регистр  обеспечивает  адресацию  64К
памяти,  которая называется текущим сегментом.  Как показано
ранее,  cегмент выравнен на границу параграфа и  его адрес в
сегментном  pегистре  предполагает  наличие  справа  четырех
нулевых битов.


Ассемблер для IBM PC                                       9


1. Регистр  CS.  Регистр  сегмента  кода  содержит начальный
   адрес сегмента кода.  Этот адрес плюс величина смещения в
   командном  указателе   (IP)   определяет  адрес  команды,
   которая должна  быть выбрана для  выполнения. Для обычных
   программ нет необходимости делать ссылки на регистр CS.
2. Регистр DS. Регистр  сегмента данных  содержит  начальный
   адрес сегмента данных. Этот адрес плюс величина смещения,
   определенная  в команде,  указывают на  конкретную ячейку
   в сегменте данных.
3. Регистр SS. Регистр  сегмента  стека  содержит  начальный
   адрес в сегменте стека.
4. Регистр ES. Некоторые  операции  над строками  используют
   дополнительный  сегментный регистр  для управления адреса
   цией памяти.  В данном контексте регистр ES  связан  с ин
   дексным регистром  DI.  Если  необходимо  использовать ре
   гистр ES,  ассемблерная программа должна его инициализиро
   вать.

   Регистры общего назначения: AX, BX, CX и DX

   При  программировании  на   ассемблере   регистры  общего
назначения  являются "рабочими  лошадками". Особенность этих
регистров  состоит в  том,  что  возможна  адресация  их как
одного целого слова или как oднобайтовой  части.  Левый байт
является старшей частью  (high),  a правый -  младшей частью
(low).  Например,  двухбайтовый регистр CX  состоит  из двух
однобайтовых:  CH  и CL,  и  ссылки  на  регистр возможны по
любому из этих трех имен. Следующие три ассемблерные команды
засылают нули в регистры CX, CH и CL, соответственно:

                    MOV  CX,00
                    MOV  CH,00
                    MOV  CL,00

1. Регистр AX. Регистр AX  является  основным  сумматором  и
   применяется  для  всех  операций  ввода-вывода, некоторых
   операций  над строками  и некоторых  арифметических опера
   ций.   Например,  команды  умножения,  деления  и  сдвига
   предполагают использование регистра AX. Некоторые команды
   генерируют более эффективный код,  если  они имеют ссылки
   на регистр AX.

                    AX: | AH | AL |

2. Регистр BX. Регистр  BX  является базовым регистром.  Это
   единственный  регистр  общего  назначения,  который может
   использоваться в качестве "индекса"  для расширенной адре
   сации. Другое общее применение его - вычисления.

                    BX: | BH | BL |


Ассемблер для IBM PC                                      10


3. Регистр CX. Регистр CX является счетчиком.  Он  необходим
   для  управления  числом повторений циклов  и для операций
   сдвига влево или вправо.  Регистр  CX  используется также
   для вычислений.

                    CX: | CH | CL |

4. Регистр DX. Регистр DX  является   регистром  данных.  Он
   применяется  для некоторых  операций  ввода/вывода  и тех
   операций умножения и деления над  большими  числами, кото
   рые используют регистровую пару DX и AX.

                    DX: | DH | DL |

   Любые регистры общего назначения могут использоваться для
cложения и вычитания