Язык программирования Си.


          Производственно-внедренческий кооператив

                    "И Н Т Е Р Ф Е Й С"

                Диалоговая Единая Мобильная

                    Операционная Система

                        Демос/P 2.1


                 Язык программирования Си.

                           Москва

                            1988


     Описан универсальный язык программирования Си.   Приве-
дены  структура  и  синтаксис языка, правила написания прог-
рамм, даны начальные сведения о взаимодействии  программ  на
Си с операционной системой Демос.


         * 1.  ВВЕДЕНИЕ

     Язык Си - это универсальный язык программирования,  для
которого  характерны  экономичность  выражения,  современный
набор операторов и типов данных.  Язык  Си  не  является  ни
языком  "очень  высокого  уровня", ни "большим" языком, и не
предназначается для некоторой специальной  области  примене-
ния,  но  отсутствие ограничений и общность языка делают его
для многих задач более удобным  и  эффективным,  чем  языки,
предположительно более мощные.  Операционная система, компи-
лятор с языка Си и по существу все прикладные программы сис-
темы   "ДЕМОС"  написаны на Си.  Язык Си не связан с какими-
либо определенными аппаратными средствами или  системами,  и
на  нем легко писать программы, которые можно пропускать без
изменений на любой ЭВМ, имеющей Си-компилятор.

     Язык Си является универсальным языком программирования.
Он  первоначально  появился  в  операционной системе <b>UNIX</b>, и
развивался как основной язык систем, совместимых с <b>ОС  UNIX</b>.
Сам язык , однако, не связан с какой-либо одной операционной
системой или машиной; и хотя его называют языком  системного
программирования, так как он удобен для написания операцион-
ных систем, он  может  использоваться  для  написания  любых
больших  вычислительных  программ,  программ  для  обработки
текстов и баз данных.

     Язык Си - это язык относительно "низкого уровня".   Это
означает,  что Си имеет дело с объектами того же вида, что и
большинство ЭВМ, а именно, с символами, числами и  адресами.
Они  могут  объединяться  и пересылаться посредством обычных
арифметических и логических операций, осуществляемых  реаль-
ными ЭВМ.

     В языке Си отсутствуют операции,  имеющие  дело  непос-
редственно  с составными объектами, такими как строки симво-
лов, множества, списки или с массивами, рассматриваемыми как
целое. Здесь, например, нет никакого аналога операциям <b>PL</b>/1,
оперирующим с массивами и строками.  Язык  не  предоставляет
никаких других возможностей распределения памяти, кроме ста-
тического определения и  механизма  стеков,  обеспечиваемого
локальными переменных функций.  Сам по себе язык Си не обес-
печивает никаких возможностей ввода-вывода.  Все  эти  меха-
низмы высокого уровня должны обеспечиваться явно вызываемыми
функциями.

     Аналогично, язык Си предлагает только простые, последо-
вательные конструкции управления: проверки, циклы, группиро-
вание и подпрограммы, но не  мультипрограммирование,  парал-
лельные операции, синхронизацию или сопрограммы.

     Удержание языка в скромных размерах дает реальные преи-
мущества.  Так  как Си относительно мал, он не требует много
места для  своего  описания  и  может  быть  быстро  выучен.


                            <b>-1-</b>


Компилятор  с Си может быть простым и компактным.  Это обес-
печивает высокую степень мобильности языка.  Поскольку  типы
данных  и  структуры управления, имеющиеся в Си, непосредст-
венно поддерживаются большинством существующих ЭВМ,  библио-
тека,  необходимая  во время прогона изолированных программ,
оказывается очень маленькой. На СМ-4, например , она  содер-
жит  только  программы для 32-битового умножения и деления и
для упрятывания и восстановления регистров при входе в функ-
цию.  Конечно, каждая реализация обеспечивает исчерпывающую,
совместимую  библиотеку  функций  для  выполнения   операций
ввода-вывода, обработки строк и распределения памяти, но так
как обращение к ним осуществляется только явно, можно,  если
необходимо,  избежать их вызова; эти функции могут быть ком-
пактно написаны на самом Си.

     Опять же из-за того, что язык Си  отражает  возможности
современных  компьютеров, программы на Си оказываются доста-
точно эффективными, так что не возникает  побуждения  писать
вместо  этого  программы на языке ассемблера.  Хотя Си соот-
ветствует возможностям  многих ЭВМ, он не зависит от  какой-
либо конкретной архитектуры машины и в силу этого без особых
усилий позволяет писать "переносимые" программы, т.е.  прог-
раммы,  которые  можно пропускать без изменений на различных
аппаратных средствах.

     Язык Си  не является языком со строгими типами данных в
смысле  Паскаля или Алгола-68. Он сравнительно снисходителен
к преобразованию данных, хотя и не будет буйно  преобразовы-
вать  типы  данных подобно языку <b>PL</b>/1. Компилятор не предус-
матривает никакой проверки индексов массивов, типов аргумен-
тов и т.д. во время выполнения программы.

     В тех  ситуациях,  когда  желательна  строгая  проверка
типов,  используется  специальная программа <b>lint</b>.  Программа
<b>lint</b>  не генерирует машинного кода, а делает  очень  строгую
проверку всех тех сторон программы, которые можно проконтро-
лировать во время компиляции  и  загрузки.   Она  определяет
несоответствие  типов, несовместимость аргументов, неисполь-
зованные или очевидным образом неинициализированные перемен-
ные, потенциальные трудности переносимости и т.д.

     Из  за  того,  что   в   языке   отсутствуют   средства
ввода/вывода  и т.п., при программировании на нем существен-
ную роль играет библиотека стандартных программ, осуществля-
ющих взаимодействие с системой.  Во всех системах, совмести-
мых с <b>ОС UNIX</b>, к которым относится и ДЕМОС, существует  сов-
местимый   набор   программ   для  ввода/вывода,  управления
памятью, преобразования данных и выполняющих другие функции,
использование   которых  обеспечивает  возможность  переноса
программ на другие ЭВМ.

     В данном документе  описывается  язык  Си,  расширения,
обеспечиваемые  специальным  препроцессором  (фактически они


                            <b>-2-</b>


вошли уже  в  понятие  "язык  Си"),  стандартная  библиотека
ввода/вывода,  и  даются начальные сведения о взаимодействии
программ на Си с <b>ОС  ДЕМОС</b>.   Полное  описание  библиотечных
программ  имеется в руководстве программиста <b>ОС ДЕМОС</b> (части
3 и 4), и в оперативной документации <b>man</b>(2) и <b>man</b>(3).  Хоро-
шим  учебником  по языку Си является книга [1], краткое фор-
мальное описание языка приведено в [2].

     В тексте встречаются примечания, относящиеся к реализа-
ции языка Си в <b>ОС ДЕМОС</b>.  Такие примечания выделяются верти-
кальной чертой справа (как выделен данный абзац).

         * 2.  СИНТАКСИЧЕСКАЯ НОТАЦИЯ

     В используемой в этом руководстве синтаксической  нота-
ции синтаксические категории записываются русскими буквами и
символом "_", а все остальные  символы  рассматриваются  как
литерные  (то  есть изображающие сами себя).  Альтернативные
категории перечисляются на отдельных строчках.  Необязатель-
ный  символ,  терминальный  или  нетерминальный, указывается
индексом "необ", так что

               { выражение      }
                          необ

указывает на необязательное выражение, заключенное в  фигур-
ных скобках.  Синтаксис описывается в Приложении 1.

     Если описание не помещается на одной строке,  оно  про-
должается на следующей с некоторым сдвигом вправо, например:

      описание_структуры:
           спецификатор_типа
                  список_описателей_структуры

Здесь следует читать:

 описание_структуры:
  спецификатор_типа  список_описателей_структуры

     Если сделан разбор входного потока на лексемы вплоть до
данного  символа,  то  в  качестве следующей лексемы берется
самая длинная строка символов,

     <b>IBM/370</b> (<b>OS-360</b>)  7 символов, 1 регистр
     <b>VAX</b> 11  (<b>UNIX</b>)    7 символов, 2 регистра


        2.1.  Ключевые слова

     Следующие идентификаторы зарезервированы для  использо-
вания  в  качестве  ключевых  слов и не могут использоваться
иным образом:


                            <b>-3-</b>


          <b>int            extern          else</b>
          <b>char           register        for</b>
          <b>float          typedef         do</b>
          <b>double         static          while</b>
          <b>struct         goto            switch</b>
          <b>union          return          case</b>
          <b>long           sizeof          default</b>
          <b>short          break           entry</b>
          <b>unsigned       continue</b>
          <b>auto           if</b>

Ключевое слово  <b>entry</b>  в  настоящее  время  не  используется
каким-либо компилятором; оно зарезервировано для использова-
ния в будущем. В некоторых реализациях  резервируются  также
слова <b>fortran</b> и <b>asm</b>.

        2.2.  Константы

     Имеется несколько видов констант,  которые  перечислены
ниже.

        2.2.1.  Целые константы

     Целая константа, состоящая из последовательности  цифр,
считается  восьмеричной,  если  она  начинается  с  0 (цифра
нуль), и десятичной в противном случае. Цифры 8  и  9  имеют
восьмеричные  значения   10  и 11 соответственно. Последова-
тельность цифр, которой предшествуют символы  <b>0х</b>  (нуль,  <b>х</b>-
маленькое)  или  <b>0х</b>  (нуль  <b>X</b>-большое),  рассматривается как
шестнадцатиричное целое.  Шестнадцатиричные  цифры  включают
буквы  от <b>a</b> (маленькое) или <b>A</b> (большое) до <b>f</b> (маленькое) или
<b>F</b> (большое) со значениями от 10 до 15. Десятичная константа,
величина которой превышает наибольшее машинное целое со зна-
ком, считается длинной; восьмеричная  или  шестнадцатиричная
константа,  которая  превышает наибольшее машинное целое без
знака, также считается длинной.

        2.2.2.  Длинные (long) константы

     Десятичная, восьмеричная  или  шестнадцатиричная  конс-
танта,  за которой непосредственно следует <b>l</b> (эль-маленькое)
или <b>L</b> (эль-большое), является длинной константой. На некото-
рых  машинах  целые и длинные значения могут рассматриваться
как идентичные.

        2.2.3.  Символьные константы

     Символьная константа - это символ, заключенный  в  оди-
ночные  кавычки,  как,  например,  '<b>х</b>'. Значением символьной
константы является численное значение этого символа в машин-
ном представлении набора символов.

                            <b>-4-</b>


     Некоторые неграфические символы, одиночная кавычка <b>'</b>  и
обратная  косая черта <b>\</b> могут быть представлены двумя симво-
лами в соответствии со следующей таблицей условных  последо-
вательностей:

      Название                 Код  Обозначение

     новая строка              012     <b>\n</b>
     горизонтальная табуляция  011     <b>\т</b>
     символ возврата на одну   010     <b>\в</b>
     позицию
     возврат каретки           015     <b>\r</b>
     переход на новую страницу 014     <b>\f</b>
     обратная косая черта      0133    <b>\\</b>
     одиночная кавычка         047     <b>\'</b>
     произвольный символ      0ddd     <b>\ddd</b>


     Условная последовательность <b>\ddd</b>  состоит  из  обратной
косой  черты,  за  которой  следуют  1, 2 или 3 восьмеричных
цифры, которые рассматриваются как задающие значение  желае-
мого  символа. Специальным случаем этой конструкции является
последовательность <b>\0</b> (за нулем не следует  цифра),  которая
определяет  нулевой символ. Если следующий за обратной косой
чертой символ не совпадает с одним из указанных, то обратная
косая черта игнорируется.

        2.2.4.  Вещественные константы

     Вещественная константа состоит из целой части, десятич-
ной  точки,  дробной части, буквы <b>e</b> (маленькая) или <b>E</b> (боль-
шая) и целой экспоненты с необязательным знаком. Как  целая,
так  и дробная часть являются последовательностью цифр. Либо
целая, либо дробная часть (но не обе)  может  отсутствовать;
либо десятичная точка, либо <b>e</b>  и экспонента (но не то и дру-
гое одновременно) может отсутствовать.   Вещественные  конс-
танты в большинстве реализаций считаются константами двойной
точности.

        2.3.  Строки

     Строка - это последовательность символов, заключенная в
двойные кавычки, как, например, "...". Строка имеет тип мас-
сив символов и класс памяти <b>static</b> (см. ниже). Строка иници-
ализирована  указанными  в  ней  символами. Все строки, даже
идентично  записанные,  считаются  различными.    Компилятор
помещает  в конец каждой строки нулевой байт <b>\0</b>, с тем чтобы
просматривающая строку программа могла определить ее  конец.
Перед  стоящим внутри строки символом двойной кавычки <b>"</b> дол-
жен быть поставлен символ  обратной  косой  черты  <b>\</b>;  кроме
того,  могут  использоваться  те  же условные последователь-
ности, что и в символьных константах.  Обратная косая  черта
<b>\</b>,  за  которой непосредственно следует символ новой строки,


                            <b>-5-</b>


игнорируется.

     Имеются макропроцессорные средства, позволяющие объеди-
нять  совпадающие  строки  при  трансляции  с целью экономии
памяти (см. команду <b>xstr</b>).

        2.4.  Характеристики аппаратных средств

     Следующая ниже  таблица  суммирует  некоторые  свойства
аппаратного  оборудования,  которые  меняются  от  машины  к
машине. Хотя они и  влияют  на  переносимость  программ,  на
практике  они  представляют  меньшую проблему, чем это может
казаться заранее.
                        Таблица 1.
          -----------------------------------------
          |         <b>CM-ЭВМ   IBM 370 (OS) VAX-11</b>  |
          |           <b>КОИ-8      ebcdic   ASCII</b>   |
          | <b>char</b>      8 бит      8 бит    8 бит   |
          | <b>int</b>       16         32       32      |
          | <b>short</b>     16         16       16      |
          | <b>long</b>      32         32       32      |
          | <b>float</b>     32         32       32      |
          | <b>double</b>    64         64       64      |
          | <b>range</b>   -38/+38     -76/+76   -76/+76 |
          |_______________________________________|

         * 3.  ОБ'ЕКТЫ ЯЗЫКА СИ

        3.1.  Интерпретация идентификаторов

     С каждым идентификатором в Си связано два атрибута: его
класс  памяти  и  его  тип.  Класс памяти определяет место и
время хранения  памяти,  связанной  с  идентификатором;  тип
определяет смысл величин, находящихся в памяти, определенной
под идентификатором.

     Имеются четыре класса памяти: автоматическая, статичес-
кая,  внешняя и регистровая. Автоматические переменные явля-
ются локальными для каждого  вызова  блока  и  исчезают  при
выходе  из  этого  блока.  Статические  переменные  являются
локальными, но сохраняют свои значения даже после того,  как
управление  передается  за пределы блока. Внешние переменные
существуют и сохраняют свои значения  в  течение  выполнения
всей  программы и могут использоваться для связи между функ-
циями, в том  числе  и  между  независимо  скомпилированными
функциями.  Регистровые  переменные  хранятся (если это воз-
можно) в быстрых регистрах  машины;  подобно  автоматическим
переменным они являются локальными для каждого блока и исче-
зают при выходе из этого блока.

     В  языке  Си  предусмотрено  несколько  основных  типов
объектов:

                            <b>-6-</b>


Символьный.
     - Объекты, описанные  как  символы  (<b>char</b>),  достаточно
       велики,  чтобы хранить любой член из соответствующего
       данной реализации внутреннего набора символов, и если
       действительный  символ  из этого набора символов хра-
       нится в символьной переменной, то ее значение эквива-
       лентно  целому коду этого символа. В символьных пере-
       менных можно хранить и другие величины, но реализация
       будет машинно-зависимой. (На СМ ЭВМ значение символь-
       ных переменных изменяется от -0177 до 0177.)

Целый.
     - Можно использовать до трех размеров целых,  описывае-
       мых  как  <b>short  int</b>,  <b>int</b> и <b>long int</b>.  Длинные целые
       занимают не меньше памяти, чем короткие, но  в  конк-
       ретной  реализации может оказаться, что либо короткие
       целые, либо длинные целые, либо  те  и  другие  будут
       эквивалентны  простым  целым.   "Простые" целые имеют
       естественный размер,  предусматриваемый  архитектурой
       используемой  машины;  другие  размеры  вводятся  для
       удовлетворения специальных потребностей.

Беззнаковый.
     - Целые без знака, описываемые как  <b>unsigned</b>,  подчиня-
       ются законам арифметики по модулю 2**n, где n - число
       битов в их представлении.  (На CM-ЭВМ  длинные  вели-
       чины без знака не предусмотрены).

Вещественный.
     - Вещественные одинарной точности (<b>float</b>) и  веществен-
       ные двойной точности (<b>double</b>) в некоторых реализациях
       могут быть синонимами.  (На СМ ЭВМ float занимает  32
       бита памяти, а <b>double</b> - 64).

В языке нет логического типа данных, а в качестве логических
значений  используются  целые  "0" - "ложь" и "1" - "истина"
(при проверках любое целое,  не  равное  0,  трактуется  как
"истина").

     Поскольку объекты  упомянутых  выше  типов  могут  быть
разумно  интерпретированы  как  числа,  эти типы будут назы-
ваться арифметическими.  Типы <b>char</b> и <b>int</b> всех размеров  сов-
местно будут называться целочисленными.  Типы float и <b>double</b>
совместно будут называться вещественными типами.

     Кроме основных арифметических типов существует  концеп-
туально бесконечный класс производных типов, которые образу-
ются из основных типов следующим образом:

     - массивы объектов большинства типов;

     - функции, которые возвращают объекты заданного типа;

                            <b>-7-</b>


     - указатели на объекты данного типа;

     - структуры,  содержащие  последовательность   объектов
       различных типов;

     - объединения, способные содержать один  из  нескольких
       объектов различных типов.

     Вообще говоря, эти  методы  построения  объектов  могут
применяться рекурсивно.

        3.2.  Объекты и l_значения

     Объект является доступным  обработке  участком  памяти;
l_значение  (левое значение) - это выражение, ссылающееся на
объект. Очевидным  примером  выражения  l_значения  является
идентификатор.   Существуют  операции,  результатом  которых
являются l_значения; если, например, e - выражение типа ука-
затель, то <b>*</b>e является выражением l_значения, ссылающимся на
тот объект, на который указывает е.   Название  "l_значение"
происходит  от выражения присваивания e1=e2, в котором левая
часть должна быть  выражением  l_значения.  При  последующем
обсуждении каждой операции будет указываться, ожидает ли она
операндов l_значения и выдает ли она l_значение.

        3.3.  Преобразования

     Ряд операций может в  зависимости  от  своих  операндов
вызывать  преобразование  значения операнда из одного типа в
другой. В этом разделе объясняются результаты, которые  сле-
дует  ожидать  от  таких  преобразований. В конце подводятся
итоги преобразований, требуемые большинством обычных  опера-
ций; эти сведения дополняются необходимым образом при обсуж-
дении каждой операции.

        3.3.1.  Символы и целые

     Символ или короткое целое можно использовать всюду, где
можно  использовать целое. Во всех случаях значение преобра-
зуется  к целому.  Преобразование более короткого  целого  к
более  длинному  всегда сопровождается знаковым расширением;
целые являются величинами со знаком.  Осуществляется или нет
знаковое  расширение  для  символов, зависит от используемой
машины, на СМ-ЭВМ такое преобразование  осуществляется  так,
что  русские буквы при прямом преобразовании получат отрица-
тельные коды.  Область  значений  символьных  переменных  на
CM-ЭВМ  меняется  от  -128  до  127; символы из набора ASCII
имеют положительные значения.  Символьная константа,  задан-
ная с помощью восьмеричной условной последовательности, под-
вергается знаковому расширению и может оказаться отрицатель-
ной; например, '<b>\</b>377' имеет значение -1.

                            <b>-8-</b>


     Когда более длинное целое преобразуется в более  корот-
кое  или  в  <b>char</b>,  оно обрезается слева; лишние биты просто
отбрасываются.

        3.3.2.  Типы float и double

     Вся вещественная арифметика в Си выполняется с  двойной
точностью.  Каждый раз, когда объект типа <b>float</b> появляется в
выражении, он удлиняется до  <b>double</b>  посредством  добавления
нулей  в  его дробную часть. Когда объект типа <b>double</b> должен
быть преобразован к типу <b>float</b>, например, при  присваивании,
перед усечением <b>double</b> округляется до длины <b>float</b>.

     Единственное исключение может быть сделано в компилято-
рах  для ЭВМ, на которых нет аппаратных операций над числами
типа <b>double</b> (например, СМ-4).  Уточнить это можно по  описа-
нию компилятора (команда <b>cc</b>).

        3.3.3.  Вещественные и целочисленные величины

     Преобразование вещественных значений  к  целочисленному
типу в некоторой степени машинно-зависимо; в частности, нап-
равление усечения отрицательных чисел меняется от  машине  к
машине.  Результат не определен, если значение не помещается
в предоставляемое пространство.

     Преобразование целочисленных  значений  в  вещественные
выполняется без осложнений. Может произойти некоторая потеря
точности, если для результата не хватит длины мантиссы.

        3.3.4.  Указатели и целые

     Целое или длинное целое может быть прибавлено к  указа-
телю или вычтено из него; в этом случае первая величина пре-
образуется так, как указывается в  описании операции  сложе-
ния.

     Два указателя на объекты одинакового  типа  могут  быть
вычтены; в этом случае результат преобразуется к целому, как
указывается в описании операции вычитания.

        3.3.5.  Целое без знака

     Всякий раз, когда целое без знака объединяется с  прос-
тым  целым,  простое целое преобразуется в целое без знака и
результат оказывается целым без  знака.  Значением  является
наименьшее целое без знака, соответствующее целому со знаком
(по  модулю  2**размер  слова).  В  двоичном  дополнительном
представлении  это преобразование является чисто умозритель-
ным и не изменяет фактическую комбинацию битов.

     Когда целое без знака преобразуется к типу <b>long</b>, значе-
ние  результата  совпадает  со  значением  целого без знака.


                            <b>-9-</b>


Таким образом,  это  преобразование  сводится  к  добавлению
нулей слева.

        3.3.6.  Арифметические преобразования

     Подавляющее большинство операций вызывает  преобразова-
ние и определяет типы результата аналогичным образом. Приво-
димая ниже схема в  дальнейшем  будет  называться  "обычными
арифметическими  преобразованиями".   Сначала любые операнды
типа <b>char</b> или <b>short</b> преобразуются в <b>int</b>,  а  любые  операнды
типа  <b>float</b>  преобразуются в <b>double</b>.  Затем, если какой-либо
операнд имеет тип <b>double</b>, то  другой  преобразуется  к  типу
<b>double</b>,  и  это будет типом результата.  В противном случае,
если какой-либо операнд имеет тип <b>long</b>,  то  другой  операнд
преобразуется  к  типу <b>long</b>, и это и будет типом результата.
В  противном  случае,  если  какой-либо  операнд  имеет  тип
<b>unsigned</b>, то другой операнд преобразуется к типу <b>unsigned</b>, и
это будет типом результата.  В противном случае оба операнда
будут иметь тип <b>int</b>, и это будет типом результата.

         * 4.  ВЫРАЖЕНИЯ

     Старшинство операций в выражениях совпадает с  порядком
следования  основных подразделов настоящего раздела, начиная
с самого высокого уровня старшинства. Так, например, выраже-
ниями, указываемыми в качестве операндов операции <b>+</b> (п.0.4),
являются выражения, определенные в п.п.0.1-0.3. Внутри  каж-
дого  подраздела  операции  имеют  одинаковое старшинство. В
каждом подразделе для описываемых там  операций  указывается
их  ассоциативность слева или справа. Старшинство и ассоциа-
тивность всех операций в выражениях резюмируются в граммати-
ческой сводке в приложении.

     В противном  случае  порядок  вычислений  выражений  не
определен.  В частности, компилятор может вычислять подвыра-
жения в том порядке, который он находит  наиболее  эффектив-
ным,  даже  если эти подвыражения приводят к побочным эффек-
там. Порядок, в котором происходят побочные эффекты, не спе-
цифицируется. Выражения, включающие коммутативные и ассоциа-
тивные операции (<b>*</b>,<b>+</b>,<b>&</b>,<b>|</b>,<b>^</b>), могут быть переупорядочены про-
извольным  образом  даже  при наличии круглых скобок; в этом
случае необходимо использовать явные промежуточные  перемен-
ные.

     При вычислении выражений обработка переполнения и  про-
верка  при  делении являются машинно-зависимыми. Большинство
реализаций языка Си (в том числе и в  <b>ОС  ДЕМОС</b>)  игнорируют
переполнение  целых; обработка ошибки при делении на 0 и при
всех особых случаях  в  операциях  с  вещественными  числами
меняется  от  машины к машине и обычно выполняется с помощью
библиотечной функции.

                            <b>-10-</b>


        4.1.  Первичные выражения

     Первичные выражения, включающие  <b>.</b>,  <b>-</b>>,  индексацию  и
обращения к функциям, группируются слева направо.

    первичное выражение:
       идентификатор
       константа
       строка
       (выражение)
       первичное_выражение  [выражение]
       первичное_выражение  (список_выражений)
                                           необ
       первичное_l_значение <b>.</b> Идентификатор
       первичное_выражение <b>-</b>> идентификатор
    список_выражений:
       выражение
       список_выражений, выражение

Идентификатор является первичным выражением при условии, что
он  описан подходящим образом, как это обсуждается ниже. Тип
идентификатора определяется  его  описанием.  Если,  однако,
типом идентификатора является массив ..., то значением выра-
жения, состоящего из этого идентификатора,  является  указа-
тель  на  первый  объект  в  этом массиве, а типом выражения
будет указатель на .... Более того, идентификатор массива не
является выражением l_значения. Подобным образом интерпрети-
руется идентификатор, который описан как функция, возвращаю-
щая .... За исключением того случая, когда он используется в
позиции имени функции при обращении, преобразуется в  указа-
тель на функцию, которая возвращает ....

     Константа является первичным выражением. В  зависимости
от ее формы типом константы может быть <b>int</b>, <b>long</b> или <b>double</b>.

     Строка является первичным выражением. Исходным ее типом
является  массив  символов; но следуя тем же самым правилам,
которые приведены выше для идентификаторов,  он  модифициру-
ется  в  указатель на символы, и результатом является указа-
тель на первый символ строки.  (Имеется исключение в некото-
рых инициализаторах; см. ниже.)

     Выражение в круглых скобках является первичным  выраже-
нием,  тип  и  значение  которого  идентичны типу и значению
этого выражения без скобок.  Наличие круглых скобок не  вли-
яет на то, является ли выражение l_значением или нет.

     Первичное выражение, за  которым  следует  выражение  в
квадратных скобках, является первичным выражением. Это выра-
жение с индексом. Обычно первичное выражение имеет тип  ука-
затель  на  ...,  индексное выражение имеет тип <b>int</b>, а типом
результата является "...".  Выражение e1[e2] по  определению
идентично  выражению  <b>*</b> ((e1)  <b>+</b> (e2)).  Все, что необходимо


                            <b>-11-</b>


для понимания этой записи, содержится в этом  разделе;  воп-
росы,  связанные с понятием идентификаторов и операций <b>*</b> и <b>+</b>
рассматриваются в п.п. 0.1, 0.2 и 0.4 соответственно; выводы
суммируются ниже.

     Обращение к функции является первичным  выражением,  за
которым следует заключенный в круглые скобки возможно пустой
список выражений, разделенных запятыми, которые и  представ-
ляют  собой фактические аргументы функции. Первичное выраже-
ние должно быть типа функция, возвращающая ..., а  результат
обращения  к функции имеет тип "...".  Как указывается ниже,
ранее не встречавщийся идентификатор, за которым непосредст-
венно  следует  левая круглая скобка, считается описанным по
контексту, как представляющий функцию,  возвращающую  целое;
следовательно чаще всего встречающийся случай функции, возв-
ращающей целое значение, не нуждается в описании.

     Перед обращением любые фактические аргументы типа <b>float</b>
преобразуются  к  типу <b>double</b>, любые аргументы типа <b>char</b> или
<b>short</b> преобразуются к типу <b>int</b>, и, как обычно, имена  масси-
вов преобразуются в указатели. Никакие другие преобразования
не выполняются автоматически; в частности,  не  сравниваются
типы  фактических аргументов с типами формальных аргументов.
Если преобразование необходимо, используйте явное преобразо-
вание.

     При подготовке к вызову функции делается копия  каждого
фактического параметра; таким образом, все передачи аргумен-
тов в языке Си осуществляются строго  по  значению.  Функция
может  изменять значения своих формальных параметров, но эти
изменения не влияют на значения  фактических  параметров.  С
другой  стороны,  имеется  возможность передавать указатель,
при этом функция может изменять значение объекта, на который
этот  указатель  указывает.  Порядок вычисления аргументов в
языке не определен; различные компиляторы вычисляют по  раз-
ному.

     Допускаются рекурсивные обращения к любой функции.

     Первичное выражение, за которым следует точка и иденти-
фикатор,  является  выражением. Первое выражение должно быть
l_значением, именующим структуру или объединение, а  иденти-
фикатор  должен быть именем члена структуры или объединения.
Результатом является l_значение, ссылающееся на  поименован-
ный член структуры или объединения.

     Первичное выражение, за которым следует  стрелка  (сос-
тавленная из знаков <b>-</b> и >) и идентификатор, является выраже-
нием. Первое выражение должно быть указателем  на  структуру
или  объединение, а идентификатор должен именовать член этой
структуры или объединения. Результатом является  l_значение,
ссылающееся на поименованный член структуры или объединения,
на который указывает указательное выражение.


                            <b>-12-</b>


     Следовательно, выражение e1<b>-</b>>mos является тем же самым,
что  и выражение (<b>*</b>e1)<b>.</b>mos. Структуры и объединения рассмат-
риваются  ниже.   Приведенные  здесь  правила  использования
структур  и  объединений  не  навязываются  строго, для того
чтобы иметь возможность обойти механизм типов (см.   "Допол-
нительная информация о типах").

        4.2.  Унарные операции

     Выражение с  унарными  операциями  группируется  справа
налево.

       унарное_выражение:
                 <b>*</b>  выражение
                 <b>&</b>  l_значение
                 <b>-</b>  выражение
                 <b>!</b>  выражение
                 <b>~</b>  выражение
                 <b>++</b> l_значение
                 <b>--</b> l_значение
                 l_значение <b>++</b>
                 l_значение <b>--</b>
                 <b>(</b>имя-типа) выражение
                 <b>sizeof</b>     выражение
                 <b>sizeof</b>    (имя_типа)

Унарная операция <b>*</b> означает косвенную  адресацию:  выражение
должно  быть  указателем, а результатом является l_значение,
ссылающееся на тот объект, на который  указывает  выражение.
Если  типом  выражения  является  указатель на ..., то типом
результата будет "...".

     Результатом унарной операции <b>&</b>  является  указатель  на
объект,  к  которому  ссылается  l_значение. Если l_значение
имеет тип "...", то типом результата будет указатель на ....

     Результатом унарной операции <b>-</b> (минус) является ее опе-
ранд,  взятый  с  противоположным  знаком. Для величины типа
<b>unsigned</b> результат получается вычитанием ее значения из 2**n
(два в степени n), где n-число битов в <b>int</b>. Унарной операции
<b>+</b> (плюс) не существует.

     Результатом операции логического отрицания  <b>!</b>  является
1,  если значение ее операнда равно 0, и 0, если значение ее
операнда отлично от нуля.  Результат имеет тип <b>int</b>. Эта опе-
рация  применима  к любому арифметическому типу или указате-
лям.

     Операция <b>~</b> (символ "тильда", находится на клавише  <b>^</b>  в
нижнем  регистре)  дает обратный код (или дополнение до еди-
ницы) своего операнда.  Выполняются  обычные  арифметические
преобразования. Операнд должен быть целочисленного типа.

                            <b>-13-</b>


     Объект, на который ссылается  операнд  l_значения  пре-
фиксной операции <b>++</b>, увеличивается. Значением является новое
значение операнда, но это не l_значение. Выражение <b>++</b>х экви-
валентно х <b>+=</b> 1 . Информацию о преобразованиях смотри в раз-
боре операции сложения (п. 0.4) и операции присваивания  (п.
0.14).

     Префиксная операция <b>--</b> аналогична  префиксной  операции
<b>++</b>, но приводит к уменьшению своего операнда l_значения.

     При применении постфиксной  операции  <b>++</b>  к  l_значению
результатом  является значение объекта, на который ссылается
l_значение. После того, как  результат  принят  к  сведению,
объект  увеличивается точно таким же образом, как и в случае
префиксной операции <b>++</b>. Результат имеет тот же  тип,  что  и
выражение l_значения.

     При применении постфиксной  операции  <b>--</b>  к  l_значению
результатом  является значение объекта, на который ссылается
l_значение. После того, как  результат  принят  к  сведению,
объект  уменьшается  точно  таким же образом, как и в случае
префиксной операции <b>--</b>. Результат имеет тот же  тип,  что  и
выражение l_значения.

     Заключенное в круглые скобки имя типа  данных,  стоящее
перед  выражением,  вызывает  преобразование  значения этого
выражения  к указанному типу.   Эта  конструкция  называется
перевод (cast). Имена типов описываются в следующем разделе.

     Операция <b>sizeof</b> выдает размер своего операнда в  байта.
(Понятие  байт в языке не определено, разве только, как зна-
чение операции <b>sizeof</b>. Однако во всех существующих  реализа-
циях  байтом является пространство, необходимое для хранения
объекта типа <b>char</b>). При  применении  к  массиву  результатом
является  полное число байтов в массиве. Размер определяется
из описаний объектов в выражении. Это выражение семантически
является  целой константой и может быть использовано в любом
месте, где требуется константа. Основное применение эта опе-
рация  находит при вызове процедур, подобных распределителям
памяти, и в системах ввода- вывода.

     Операция <b>sizeof</b> может быть также применена и  к  заклю-
ченному  в  круглые  скобки  имени  типа.  В этом случае она
выдает размер в байтах объекта указанного типа.

     Конструкция <b>sizeof</b> (тип) рассматривается как целое, так
что   выражение   <b>sizeof</b> (тип) - 2   эквивалентно  выражению
(<b>sizeof</b> (тип)) - 2.

        4.3.  Мультипликативные операции

     Мультипликативные операции <b>*</b>, <b>/</b>, и <b>%</b> группируются слева
направо.  Выполняются обычные арифметические преобразования.


                            <b>-14-</b>


       мультипликативное_выражение:
                выражение <b>*</b> выражение
                выражение <b>/</b> выражение
                выражение <b>%</b> выражение


     Бинарная операция <b>*</b>  означает  умножение.   Операция  <b>*</b>
ассоциативна, и выражения с несколькими умножениями на одном
и том же уровне могут быть перегруппированы компилятором.

     Бинарная операция <b>/</b> означает деление. При делении поло-
жительных  целых  осуществляется  усечение  по направлению к
нулю, но если один из операндов отрицателен, то форма усече-
ния  зависит  от  используемой машины.  Остаток имеет тот же
знак, что и делимое.  Всегда  справедливо,  что  (a<b>/</b>b)<b>*</b>b<b>+</b>a<b>%</b>b
равно a (если b не равно 0).

     Бинарная операция <b>%</b> выдает остаток от  деления  первого
выражения на второе. Выполняются обычные арифметические пре-
образования. Операнды должны быть целого типа.

        4.4.  Аддитивные операции

     Аддитивные операции <b>+</b> и <b>-</b> группируются  слева  направо.
Выполняются  обычные арифметические преобразования. Для каж-
дой операции имеются некоторые  дополнительные  возможности,
связанные с типами операндов.

         аддитивное_выражение:
              выражение <b>+</b> выражение
              выражение <b>-</b> выражение


Результатом операции <b>+</b> является сумма операндов. Можно также
складывать  указатель  на объект в массиве и значение любого
целочисленного типа.   Последнее  преобразуется  в  адресное
смещение  посредством  умножения  его  на  длину объекта, на
который указывает этот указатель. Результатом является  ука-
затель  того же самого типа, что и исходный указатель, кото-
рый указывает на другой объект в том же  массиве,  смещенный
соответствующим    образом    относительно   первоначального
объекта. Таким образом, если p является указателем объекта в
массиве,  то  выражение p<b>+</b>1 является указателем на следующий
объект в этом массиве.

     Никакие другие комбинации типов для указателей не  раз-
решаются.

     Операция <b>+</b> ассоциативна, и выражение с несколькими сло-
жениями  на одном и том же уровне могут быть переупорядочены
компилятором.

                            <b>-15-</b>


     Результатом операции  <b>-</b>  является  разность  операндов.
Выполняются  обычные  арифметические  преобразования.  Кроме
того, из указателя может быть вычтено значение любого  цело-
численного типа, причем, проводятся те же самые преобразова-
ния, что и при операции сложения.

     Если вычитаются два указателя  на  объекты  одинакового
типа, то результат преобразуется (делением на длину объекта)
к типу <b>int</b>, представляя собой  число  объектов,  разделяющих
указываемые  объекты.  Если  эти  указатели не на объекты из
одного и того же массива, то  такое  преобразование,  вообще
говоря,  даст неожиданные результаты, потому что даже указа-
тели на объекты одинакового типа не  обязаны  отличаться  на
величину, кратную длине объекта.

        4.5.  Операции сдвига

     Операции сдвига <b>&lt;</b><b>&lt;</b> и  >>  группируются  слева  направо.
Для  обеих операций проводятся обычные арифметические преоб-
разования их операндов, каждый из которых должен быть целого
типа. Затем правый операнд преобразуется к типу <b>int</b>; резуль-
тат имеет тип левого операнда. Результат не определен,  если
правый  операнд  отрицателен или больше или равен, чем длина
объекта в битах.

         выражение_сдвига:
              выражение <b>&lt;</b><b>&lt;</b> выражение
              выражение >> выражение

Значением выражения e1<b>&lt;</b><b>&lt;</b>e2 является e1 (интерпретируемое как
комбинация  битов), сдвинутое влево на e2 битов; освобождаю-
щиеся биты заполняются  нулем.  Значением  выражения  e1>>e2
является e1, сдвинутое вправо на e2 битовых позиций. Если e1
имеет тип <b>unsigned</b>, то  сдвиг  вправо  гарантированно  будет
логическим  (заполнение  нулем);  в  противном  случае сдвиг
может быть (как на CM-ЭВМ)  арифметическим  (освобождающиеся
биты заполняются копией знакового бита).

        4.6.  Операции отношения

     Операции отношения группируются слева направо, но  этот
факт не очень полезен; выражение a<b>&lt;</b>b<b>&lt;</b>c не означает того, что
оно ,казалось бы, должно означать, а означает ((a<b>&lt;</b>b)<b>&lt;</b>c).

         выражение_отношения:
              выражение <b>&lt;</b> выражение
              выражение > выражение
              выражение <b>&lt;</b><b>=</b> выражение
              выражение ><b>=</b> выражение

Операции <b>&lt;</b> (меньше), > (больше), <b>&lt;</b><b>=</b> (меньше или равно) и  ><b>=</b>
(больше  или равно)  дают 0, если указанное отношение ложно,
и 1, если оно истинно. Результат имеет тип <b>int</b>.  Выполняются


                            <b>-16-</b>


обычные  арифметические  преобразования.  Могут сравниваться
два указателя; результат зависит от относительного  располо-
жения  указываемых объектов в адресном пространстве. Сравне-
ние указателей переносимо только в том случае,  если  указа-
тели указывают на объекты из одного и того же массива.

        4.7.  Операции равенства

         выражение_равенства:
              выражение <b>==</b> выражение
              выражение <b>!=</b> выражение

Операции <b>==</b> (равно)