уществляет
вызов функции <i>main</i>, находящейся в другой программе, передавая  ей  свои  аргументы  в
качестве входных.
     Системный вызов <i>exec</i> может не удаться, если указанный файл path  не  существует,
либо  вы  не  имеете  права  его  выполнять (такие коды доступа), либо он не является
выполняемой программой (неверное магическое число), либо  слишком  велик  для  данной
машины  (системы), либо файл открыт каким-нибудь процессом (например еще записывается
компилятором).  В этом случае продолжится  выполнение  прежней  программы.   Если  же
вызов  успешен  - возврата из <i>exec</i> не происходит вообще (поскольку управление переда-
ется в другую программу).
     Аргумент argv[0] обычно полагают равным path.  По нему программа,  имеющая  нес-
колько  имен (в файловой системе), может выбрать ЧТО она должна делать. Так программа
<i>/bin/ls</i> имеет альтернативные имена <i>lr</i>, <i>lf</i>, <i>lx</i>, <i>ll</i>.  Запускается одна и  та  же  прог-
рамма, но в зависимости от argv[0] она далее делает разную работу.
     Аргумент envp - это "окружение" программы (см.  начало этой главы).  Если он  не
задан  -  передается  окружение текущей программы (наследуется содержимое массива, на
который указывает переменная <i>environ</i>); если же задан явно (например, окружение скопи-
ровано  в какой-то массив и часть переменных подправлена или добавлены новые перемен-
ные) - новая программа получит новое окружение.  Напомним, что окружение  можно  про-
честь из предопределенной переменной char **<i>environ</i>, либо из третьего аргумента функ-
ции <i>main</i> (см. начало главы), либо функцией <i>getenv</i>().


<i>А. Богатырев, 1992-95                  - 224 -                              Си в UNIX</i>

     Системные вызовы <i>fork</i> и <i>exec</i> не склеены в один вызов потому, что  между  <i>fork</i>  и
<i>exec</i>  в  процессе-сыне  могут  происходить  некоторые  действия, нарушающие симметрию
процесса-отца и порожденного процесса: установка реакций на сигналы,  перенаправление
ввода/вывода, и.т.п. Смотри пример "интерпретатор команд" в приложении.  В <i>MS DOS</i>, не
имеющей параллельных процессов, вызовы <i>fork</i>, <i>exec</i> и <i>wait</i> склеены в один вызов  <i>spawn</i>.
Зато  при  этом приходится делать перенаправления ввода-вывода в порождающем процессе
перед <i>spawn</i>, а после него - восстанавливать все как было.

<i>6.5.4.</i>  Завершить процесс можно системным вызовом

    void <i>exit</i>( unsigned char retcode );

Из этого вызова не бывает возврата. Процесс завершается: сегменты <i>stack</i>, <i>data</i>,  <i>text</i>,
<i>user</i>  уничтожаются (при этом все открытые процессом файлы закрываются); память, кото-
рую они занимали, считается свободной и в нее  может  быть  помещен  другой  процесс.
Причина  смерти отмечается в паспорте процесса - в структуре <i>proc</i> в таблице процессов
внутри ядра. Но паспорт  еще  не  уничтожается!  Это  состояние  процесса  называется
"зомби" - живой мертвец.
     В паспорт процесса заносится код ответа retcode.  Этот код может  быть  прочитан
процессом-родителем  (тем, кто создал этот процесс вызовом <i>fork</i>).  Принято, что код 0
означает успешное завершение процесса, а любое положительное значение 1..255 означает
неудачное  завершение  с  таким кодом ошибки.  Коды ошибок заранее не предопределены:
это личное дело процессов отца и сына - установить между собой какие-то соглашения по
этому  поводу.   В  старых программах иногда писалось <i>exit</i>(-1); Это некорректно - код
ответа должен быть неотрицателен; код -1 превращается в код 255.  Часто  используется
конструкция <i>exit</i>(errno);
     Программа может завершиться не только явно вызывая <i>exit</i>, но и еще  двумя  спосо-
бами:
-    если происходит возврат управления из функции <i>main</i>(), т.е. она  кончилась  -  то
     вызов <i>exit</i>() делается неявно, но с непредсказуемым значением retcode;
-    процесс может быть убит сигналом. В этом  случае  он  не  выдает  никакого  кода
     ответа в процесс-родитель, а выдает признак "процесс убит".

<i>6.5.5.</i>  В действительности <i>exit</i>() - это еще не  сам  системный  вызов  завершения,  а
стандартная  функция.   Сам системный вызов называется _<i>exit</i>().  Мы можем переопреде-
лить функцию <i>exit</i>() так, чтобы по окончании программы происходили некоторые действия:

    void <i>exit</i>(unsigned code){
      /* Добавленный мной дополнительный оператор: */
      printf("Закончить работу, "
             "код ответа=%u\n", code);

      /* Стандартные операторы: */
      _<i>cleanup</i>();  /* закрыть все открытые файлы.
                    * Это стандартная функция <i>|</i>= */
      _<i>exit</i>(code); /* собственно сисвызов */
    }

    int <i>f</i>(){ return 17; }
    void <i>main</i>(){
      printf("aaaa\n"); printf("bbbb\n"); <i>f</i>();
      /* потом откомментируйте это:  exit(77); */
    }

Здесь функция <i>exit</i> вызывается неявно по окончании <i>main</i>, ее  подставляет  в  программу
компилятор.  Дело  в  том,  что при запуске программы <i>exec</i>-ом, первым начинает выпол-
няться код так называемого "стартера", подклеенного при  сборке  программы  из  файла
<i>/lib/crt0.o</i>. Он выглядит примерно так (в действительности он написан на ассемблере):

    ... // вычислить argc, настроить некоторые параметры.
    <i>main</i>(argc, argv, envp);
    <i>exit</i>();


<i>А. Богатырев, 1992-95                  - 225 -                              Си в UNIX</i>

или так (взято из проекта <i>GNU|</i>-<i>|</i>-):

    int errno = 0;
    char **environ;
    _<i>start</i>(int argc, int arga)
    {
    /* OS and Compiler dependent!!!! */
    char **argv = (char **) &arga;
    char **envp = environ = argv + argc + 1;
    /* ... возможно еще какие-то инициализации,
     * наподобие <i>setlocale</i>( <i>LC</i>_<i>ALL</i>, "" ); в <i>SCO UNIX</i> */
    <i>exit</i> (<i>main</i>(argc, argv, envp));
    }

Где должно быть

    <i>int main</i>(int argc, char *argv[], char *envp[]){
              ...
            <i>return</i> 0;  /* вместо exit(0); */
    }

Адрес функции _<i>start</i>() помечается в одном из полей заголовка файла формата <i>a.out</i>  как
адрес,  на  который  система  должна  передать  управление после загрузки программы в
память (точка входа).
     Какой код ответа попадет в <i>exit</i>() в этих примерах (если отсутствует явный  вызов
<i>exit</i> или <i>return</i>) - непредсказуемо.  На <i>IBM PC</i> в вышенаписанном примере этот код равен
17, то есть значению, возвращенному последней вызывавшейся функцией.  Однако  это  не
какое-то  специальное соглашение, а случайный эффект (так уж устроен код, создаваемый
этим компилятором).

<i>6.5.6.</i>  Процесс-отец может дождаться окончания своего потомка.  Это делается  систем-
ным вызовом <i>wait</i> и нужно по следующей причине: пусть отец - это интерпретатор команд.
Если он запустил процесс и продолжил свою работу, то оба процесса будут предпринимать
попытки  читать ввод с клавиатуры терминала - интерпретатор ждет команд, а запущенная
программа ждет данных.  Кому из них будет поступать набираемый нами текст -  непредс-
казуемо!   Вывод:  интерпретатор  команд  должен "заснуть" на то время, пока работает
порожденный им процесс:

    int pid;  unsigned short status;
             ...
    if((pid = <i>fork</i>()) == 0 ){
            /* порожденный процесс */
             ...  // перенаправления ввода-вывода.
             ...  // настройка сигналов.
            <i>exec</i>(....);
            perror("exec не удался"); exit(1);
    }
    /* иначе это породивший процесс */
    while((pid = <i>wait</i>(&status)) > 0 )
      printf("Окончился сын pid=%d с кодом %d\n",
              pid, status >> 8);
    printf( "Больше нет сыновей\n");


____________________
   <i>|</i>= _<i>cleanup</i>() закрывает файлы, открытые <i>fopen</i>()ом, "вытряхая" при этом данные,  на-
копленные в буферах, в файл.  При аварийном завершении программы файлы все равно зак-
рываются, но уже не явно, а операционной системой (в вызове _<i>exit</i>).  При этом  содер-
жимое недосброшенных буферов будет утеряно.
____________________
   <i>|</i>-<i>|</i>- <i>GNU</i> - программы, распространяемые в исходных текстах из <i>Free  Software  Founda-</i>


<i>А. Богатырев, 1992-95                  - 226 -                              Си в UNIX</i>

<i>wait</i> приостанавливает<i>|</i>- выполнение вызвавшего процесса до момента окончания любого  из
порожденных  им  процессов  (ведь  можно  было запустить и нескольких сыновей!).  Как
только какой-то потомок окончится  -  <i>wait</i>  проснется  и  выдаст  номер  (pid)  этого
потомка.   Когда  никого  из живых "сыновей" не осталось - он выдаст (-1).  Ясно, что
процессы могут оканчиваться не в том порядке, в котором их порождали.   В  переменную
status  заносится  в  специальном  виде код ответа окончившегося процесса, либо номер
сигнала, которым он был убит.

    #include &lt;sys/types.h>
    #include &lt;sys/wait.h>
            ...
    int status, pid;
            ...
    while((pid = <i>wait</i>(&status)) > 0){
        if( <i>WIFEXITED</i>(status)){
          printf( "Процесс %d умер с кодом %d\n",
                           pid,            <i>WEXITSTATUS</i>(status));
        } else if( <i>WIFSIGNALED</i>(status)){
          printf( "Процесс %d убит сигналом %d\n",
                           pid,             <i>WTERMSIG</i>(status));
          if(<i>WCOREDUMP</i>(status)) printf( "Образовался core\n" );
          /* core - образ памяти процесса для отладчика adb */
        } else if( <i>WIFSTOPPED</i>(status)){
          printf( "Процесс %d остановлен сигналом %d\n",
                           pid,            <i>WSTOPSIG</i>(status));
        } else if( <i>WIFCONTINUED</i>(status)){
          printf( "Процесс %d продолжен\n",
                           pid);
        }
    }
            ...

Если код ответа нас не интересует, мы можем писать <i>wait</i>(NULL).
     Если у нашего процесса не было или больше нет живых сыновей - вызов <i>wait</i>  ничего
не  ждет, а возвращает значение (-1).  В написанном примере цикл <i>while</i> позволяет дож-
даться окончания всех потомков.
     В тот момент, когда процесс-отец получает информацию о причине  смерти  потомка,
паспорт  умершего  процесса  наконец  вычеркивается из таблицы процессов и может быть
переиспользован новым процессом.  До того, он хранится в таблице процессов в  состоя-
нии  "zombie"  - "живой мертвец".  Только для того, чтобы кто-нибудь мог узать статус
его завершения.
     Если процесс-отец завершился раньше своих сыновей, то  кто  же  сделает  <i>wait</i>  и
вычеркнет  паспорт?   Это  сделает процесс номер 1: <i>/etc/init</i>.  Если отец умер раньше
процессов-сыновей, то система заставляет процесс номер 1  "усыновить"  эти  процессы.
<i>init</i>  обычно  находится  в  цикле,  содержащем в начале вызов <i>wait</i>(), то есть ожидает
____________________
<i>tion</i>  (FSF).  Среди них - <i>C++</i> компилятор <i>g++</i> и редактор <i>emacs</i>. Смысл слов <i>GNU</i> - "gen-
erally not <i>UNIX</i>" - проект был основан как противодействие начавшейся коммерциализации
<i>UNIX</i> и закрытию его исходных текстов. "Сделать как в <i>UNIX</i>, но лучше".
   <i>|</i>- "Живой" процесс может пребывать в одном из нескольких состояний: процесс ожидает
наступления  какого-то события ("спит"), при этом ему не выделяется время процессора,
т.к. он не готов к выполнению; процесс готов к выполнению и стоит в очереди к процес-
сору (поскольку процессор выполняет другой процесс); процесс готов и выполняется про-
цессором в данный момент.  Последнее состояние может происходить  в  двух  режимах  -
пользовательском (выполняются команды сегмента <i>text</i>) и системном (процессом был издан
системный вызов, и сейчас выполняется функция в ядре). Ожидание события бывает только
в  системной фазе - внутри системного вызова (т.е.  это "синхронное" ожидание). Неак-
тивные процессы ("спящие" или ждущие ресурса процессора) могут быть временно откачаны
на диск.


<i>А. Богатырев, 1992-95                  - 227 -                              Си в UNIX</i>

окончания любого из своих сыновей (а они у него всегда есть, о чем мы поговорим  под-
робнее  чуть  погодя).  Таким образом <i>init</i> занимается чисткой таблицы процессов, хотя
это не единственная его функция.
     Вот схема, поясняющая жизненный цикл любого процесса:

        |pid=719,<i>csh</i>
        |
    if(!<i>fork</i>())------->--------* pid=723,<i>csh</i>
        |                      |                  загрузить
     <i>wait</i>(&status)           <i>exec</i>("a.out",...) &lt;-- <i>a.out</i>
        :                    main(...){           с диска
        :                      |
        :pid=719,<i>csh</i>           | pid=723,<i>a.out</i>
      спит(ждет)             работает
        :                      |
        :                    <i>exit</i>(status) умер
        :                    }
     проснулся &lt;---проснись!--RIP
        |
        |pid=719,<i>csh</i>

Заметьте, что номер порожденного процесса не обязан быть следующим за  номером  роди-
теля,  а  только  больше него. Это связано с тем, что другие процессы могли создать в
системе новые процессы до того, как наш процесс издал свой вызов <i>fork</i>.

<i>6.5.7.</i>  Кроме того, <i>wait</i> позволяет отслеживать  остановку  процесса.   Процесс  может
быть  приостановлен  при  помощи  посылки  ему  сигналов  <i>SIGSTOP</i>,  <i>SIGTTIN</i>, <i>SIGTTOU</i>,
<i>SIGTSTP</i>.  Последние три сигнала посылает  при  определенных  обстоятельствах  драйвер
терминала,  к  примеру  <i>SIGTSTP</i>  -  при нажатии клавиши <i>CTRL/Z</i>.  Продолжается процесс
посылкой ему сигнала <i>SIGCONT</i>.
     В данном контексте, однако, нас интересуют не сами эти сигналы, а  другая  схема
манипуляции  с  отслеживанием статуса порожденных процессов.  Если указано явно, сис-
тема может посылать процессу-родителю сигнал <i>SIGCLD</i> в момент изменения статуса любого
из его потомков.  Это позволит процессу-родителю немедленно сделать <i>wait</i> и немедленно
отразить изменение состояние процесса-потомка в  своих  внутренних  списках.   Данная
схема программируется так:

    void <i>pchild</i>(){
            int pid, status;

            <i>sighold</i>(<i>SIGCLD</i>);
            while((pid = <i>waitpid</i>((pid_t) -1, &status, <i>WNOHANG</i>|<i>WUNTRACED</i>)) > 0){
              dorecord:
                    записать_информацию_об_изменениях;
            }
            <i>sigrelse</i>(<i>SIGCLD</i>);

            /* Reset */
            <i>signal</i>(<i>SIGCLD</i>, <i>pchild</i>);
    }
            ...
    <i>main</i>(){
            ...
            /* По сигналу <i>SIGCLD</i> вызывать функцию <i>pchild</i> */
            <i>signal</i>(<i>SIGCLD</i>, <i>pchild</i>);
            ...
            главный_цикл;
    }

Секция  с  вызовом  <i>waitpid</i>  (разновидность  вызова  <i>wait</i>),  прикрыта  парой  функций
<i>sighold</i>-<i>sigrelse</i>,  запрещающих  приход сигнала <i>SIGCLD</i> внутри этой критической секции.


<i>А. Богатырев, 1992-95                  - 228 -                              Си в UNIX</i>

Сделано это вот для чего: если процесс начнет модифицировать  таблицы  или  списки  в
районе  метки  dorecord:,  а  в этот момент придет еще один сигнал, то функция <i>pchild</i>
будет вызвана рекурсивно и тоже попытается модифицировать таблицы и списки, в которых
еще остались незавершенными перестановки ссылок, элементов, счетчиков. Это приведет к
разрушению данных.
     Поэтому сигналы должны приходить последовательно, и  функции  <i>pchild</i>  вызываться
также  последовательно, а не рекурсивно. Функция <i>sighold</i> откладывает доставку сигнала
(если он случится), а <i>sigrelse</i> - разрешает доставить накопившиеся сигналы (но если их
пришло  несколько  одного типа - все они доставляются как один такой сигнал. Отсюда -
цикл вокруг <i>waitpid</i>).
     Флаг <i>WNOHANG</i> - означает "не ждать внутри вызова <i>wait</i>", если ни один из  потомков
не  изменил  своего  состояния;  а  просто вернуть код (-1)".  Это позволяет вызывать
<i>pchild</i> даже без получения сигнала: ничего не произойдет.  Флаг <i>WUNTRACED</i>  -  означает
"выдавать информацию также об остановленных процессах".

<i>6.5.8.</i>  Как уже было сказано, при <i>exec</i> все  открытые  файлы  достаются  в  наследство
новой программе (в частности, если между <i>fork</i> и <i>exec</i> были перенаправлены вызовом <i>dup2</i>
стандартные ввод и вывод, то они останутся перенаправленными и  у  новой  программы).
Что  делать,  если  мы  не  хотим,  чтобы  наследовались все открытые файлы? (Хотя бы
потому, что большинством из них новая программа пользоваться не будет  -  в  основном
она  будет использовать лишь fd 0, 1 и 2; а ячейки в таблице открытых файлов процесса
они занимают).  Во-первых, ненужные дескрипторы можно явно закрыть <i>close</i> в промежутке
между  <i>fork</i>-ом  и  <i>exec</i>-ом.   Однако не всегда мы помним номера дескрипторов для этой
операции.  Более радикальной мерой является тотальная чистка:

    for(f = 3; f &lt; NOFILE; f++)
            close(f);

Есть более элегантный путь.  Можно  пометить  дескриптор  файла  специальным  флагом,
означающим, что во время вызова <i>exec</i> этот дескриптор должен быть автоматически закрыт
(режим file-close-on-exec - <i>fclex</i>):

    #include &lt;fcntl.h>
    int fd = <i>open</i>(.....);
    <i>fcntl</i> (fd, <i>F</i>_<i>SETFD</i>, 1);

Отменить этот режим можно так:

    <i>fcntl</i> (fd, <i>F</i>_<i>SETFD</i>, 0);

Здесь есть одна тонкость: этот флаг устанавливается не для структуры <i>file</i> - "открытый
файл",  а непосредственно для дескриптора в таблице открытых процессом файлов (массив
флагов: char u_pofile[NOFILE]).  Он не сбрасывается при закрытии файла,  поэтому  нас
может ожидать сюрприз:

     ... <i>fcntl</i> (fd, F_SETFD, 1); ... <i>close</i>(fd);
     ...
     int fd1 = <i>open</i>( ... );

Если fd1 окажется равным fd, то дескриптор fd1 будет при <i>exec</i>-е закрыт, чего мы  явно
не ожидали! Поэтому перед <i>close</i>(fd) полезно было бы отменить режим <i>fclex</i>.

<i>6.5.9.</i>  Каждый процесс имеет управляющий терминал (short *u_ttyp).  Он достается про-
цессу  в  наследство от родителя (при <i>fork</i> и <i>exec</i>) и обычно совпадает с терминалом, с
на котором работает данный пользователь.
     Каждый процесс относится к некоторой  группе  процессов  (int  p_pgrp),  которая
также наследуется. Можно послать сигнал всем процессам указанной группы pgrp:
    <i>kill</i>( -pgrp, sig );
Вызов
    <i>kill</i>( 0, sig );
посылает сигнал sig всем  процессам,  чья  группа  совпадает  с  группой  посылающего


<i>А. Богатырев, 1992-95                  - 229 -                              Си в UNIX</i>

процесса.  Процесс может узнать свою группу:
    int pgrp = <i>getpgrp</i>();
а может стать "лидером" новой группы. Вызов
    <i>setpgrp</i>();
делает следующие операции:

    /* У процесса больше нет управл. терминала: */
    if(p_pgrp != p_pid) u_ttyp = NULL;
    /* Группа процесса полагается равной его ид-у: */
    p_pgrp = p_pid;  /* new group */

В свою очередь, управляющий терминал тоже имеет некоторую группу (t_pgrp). Это значе-
ние устанавливается равным группе процесса, первым открывшего этот терминал:

    /* часть процедуры открытия терминала */
    if( p_pid == p_pgrp // лидер группы
     && u_ttyp == NULL  // еще нет упр.терм.
     && t_pgrp == 0 ){  // у терминала нет группы
            u_ttyp = &t_pgrp;
            t_pgrp =  p_pgrp;
    }

Таким процессом обычно является процесс регистрации пользователя в  системе  (который
спрашивает  у вас имя и пароль).  При закрытии терминала всеми процессами (что бывает
при выходе пользователя из системы) терминал теряет группу: t_pgrp=0;
     При нажатии на клавиатуре терминала некоторых клавиш:

    c_cc[ <i>VINTR</i> ]     обычно DEL или CTRL/C
    c_cc[ <i>VQUIT</i> ]     обычно CTRL/\

драйвер терминала посылает соответственно сигналы <i>SIGINT</i>  и  <i>SIGQUIT</i>  всем  процессам
группы терминала, т.е. как бы делает
    <i>kill</i>( -t_pgrp, sig );
Именно поэтому мы можем прервать процесс нажатием клавиши <i>DEL</i>.  Поэтому, если процесс
сделал  <i>setpgrp</i>(),  то сигнал с клавиатуры ему послать невозможно (т.к. он имеет свой
уникальный номер группы != группе терминала).
     Если процесс еще не имеет управляющего терминала (или уже  его  не  имеет  после
<i>setpgrp</i>),  то он может сделать любой терминал (который он имеет право открыть) управ-
ляющим для себя.  Первый же файл-устройство, являющийся интерфейсом драйвера термина-
лов, который будет открыт этим процессом, станет для него управляющим терминалом. Так
процесс может иметь каналы 0, 1, 2 связанные с одним терминалом, а  прерывания  полу-
чать с клавиатуры другого (который он сделал управляющим для себя).
     Процесс регистрации пользователя в системе - <i>/etc/getty</i> (название происходит  от
"get  tty"  -  получить терминал) - запускается процессом номер 1 - <i>/etc/init</i>-ом - на
каждом из терминалов, зарегистрированных в системе, когда
-    система только что была запущена;
-    либо когда пользователь на каком-то терминале вышел  из  системы  (интерпретатор
     команд завершился).
В сильном упрощении <i>getty</i> может быть описан так:

    void <i>main</i>(ac, av) char *av[];
    {   int f; struct termio tmodes;

        for(f=0; f &lt; NOFILE; f++) <i>close</i>(f);

        /* Отказ от управляющего терминала,
         * основание новой группы процессов.
         */
        <i>setpgrp</i>();

        /* Первоначальное явное открытие терминала */


<i>А. Богатырев, 1992-95                  - 230 -                              Си в UNIX</i>

        /* При этом терминал av[1] станет упр. терминалом */
            <i>open</i>( av[1], O_RDONLY ); /* fd = 0 */
            <i>open</i>( av[1], O_RDWR   ); /* fd = 1 */
         f = <i>open</i>( av[1], O_RDWR   ); /* fd = 2 */

        // ... Считывание параметров терминала из файла
        // <i>/etc/gettydefs</i>. Тип требуемых параметров линии
        // задается меткой, указываемой в av[2].
        // Заполнение структуры tmodes требуемыми
        // значениями ... и установка мод терминала.
        <i>ioctl</i> (f, TCSETA, &tmodes);

        // ... запрос имени и пароля ...

        <i>chdir</i> (домашний_каталог_пользователя);

        <i>execl</i> ("/bin/csh", "-csh", NULL);
        /* Запуск интерпретатора команд. Группа процессов,
         * управл. терминал, дескрипторы 0,1,2 наследуются.
         */
    }

Здесь последовательные вызовы <i>open</i> занимают последовательные ячейки в таблице  откры-
тых  процессом файлов (поиск каждой новой незанятой ячейки производится с начала таб-
лицы) - в итоге по дескрипторам 0,1,2 открывается файл-терминал.  После  этого  деск-
рипторы 0,1,2 наследуются всеми потомками интерпретатора команд.  Процесс <i>init</i> запус-
кает по одному процессу <i>getty</i> на каждый терминал, как бы делая

            <i>/etc/getty</i> /dev/tty01 m &
            <i>/etc/getty</i> /dev/tty02 m &
                    ...

и ожидает окончания любого из них.  После входа пользователя в  систему  на  каком-то
терминале,  соответствующий  <i>getty</i>  превращается в интерпретатор команд (pid процесса
сохраняется).  Как только кто-то из них умрет - <i>init</i> перезапустит <i>getty</i> на соответст-
вующем  терминале  (все  они - его сыновья, поэтому он знает - на каком именно терми-
нале).

        6.6.  Трубы и FIFO-файлы.
     Процессы могут обмениваться между  собой  информацией  через  файлы.  Существуют
файлы с необычным поведением - так называемые <i>FIFO</i>-файлы (first in, first out), веду-
щие себя подобно очереди. У них указатели чтения и записи разделены. Работа  с  таким
файлом напоминает проталкивание шаров через трубу - с одного конца мы вталкиваем дан-
ные, с другого конца - вынимаем их.  Операция чтения из пустой "трубы"  проиостановит
вызов  <i>read</i>  (и  издавший его процесс) до тех пор, пока кто-нибудь не запишет в FIFO-
файл какие-нибудь данные.  Операция позиционирования указателя - <i>lseek</i>()  -  неприме-
нима к FIFO-файлам.  FIFO-файл создается системным вызовом

    #include &lt;sys/types.h>
    #include &lt;sys/stat.h>
       <i>mknod</i>( имяФайла, <i>S</i>_<i>IFIFO</i> | 0666, 0 );

где 0666 - коды доступа к файлу.  При помощи FIFO-файла могут общаться даже  неродст-
венные процессы.
     Разновидностью FIFO-файла является  безымянный  FIFO-файл,  предназначенный  для
обмена информацией между процессом-отцом и процессом-сыном.  Такой файл - канал связи
как раз и называется термином "труба" или <i>pipe</i>.  Он создается вызовом <i>pipe</i>:

    int conn[2];   <i>pipe</i>(conn);

Если бы файл-труба имел имя PIPEFILE, то вызов <i>pipe</i> можно было бы описать как


<i>А. Богатырев, 1992-95                  - 231 -                              Си в UNIX</i>

    <i>mknod</i>("PIPEFILE", <i>S</i>_<i>IFIFO</i> | 0600, 0);
    conn[0] = <i>open</i>("PIPEFILE", <i>O</i>_<i>RDONLY</i>);
    conn[1] = <i>open</i>("PIPEFILE", <i>O</i>_<i>WRONLY</i>);
    <i>unlink</i>("PIPEFILE");

При вызове <i>fork</i> каждому из двух процессов достанется в наследство пара дескрипторов:

                 <i>pipe</i>(conn);
                   <i>fork</i>();

    conn[0]----&lt;----    ----&lt;-----conn[1]
                    FIFO
    conn[1]---->----    ---->-----conn[0]
     процесс A                 процесс B

Пусть процесс <i>A</i> будет посылать информацию в процесс <i>B</i>.  Тогда процесс <i>A</i> сделает:

    <i>close</i>(conn[0]);
    // т.к. не собирается ничего читать
    <i>write</i>(conn[1], ... );

а процесс <i>B</i>

    <i>close</i>(conn[1]);
    // т.к. не собирается ничего писать
    <i>read</i> (conn[0], ... );

Получаем в итоге:

    conn[1]---->----FIFO---->-----conn[0]
     процесс A                 процесс B

Обычно поступают еще более элегантно,  перенаправляя  стандартный  вывод  <i>A</i>  в  канал
conn[1]

    <i>dup2</i> (conn[1], 1); <i>close</i>(conn[1]);
    <i>write</i>(1, ... );   /* или printf */

а стандартный ввод <i>B</i> - из канала conn[0]

    <i>dup2</i>(conn[0], 0); <i>close</i>(conn[0]);
    <i>read</i>(0, ... );    /* или gets */

Это соответствует конструкции

         $   <i>A</i> | <i>B</i>

записанной на языке СиШелл.
     Файл, выделяемый под <i>pipe</i>, имеет ограниченный размер (и поэтому  обычно  целиком
оседает  в буферах в памяти машины).  Как только он заполнен целиком - процесс, пишу-
щий в трубу вызовом <i>write</i>, приостанавливается до появления свободного места в  трубе.
Это  может привести к возникновению тупиковой ситуации, если писать программу неакку-
ратно.  Пусть процесс <i>A</i> является сыном процесса <i>B</i>, и пусть  процесс  <i>B</i>  издает  вызов
<i>wait</i>,  не  закрыв канал conn[0].  Процесс же <i>A</i> очень много пишет в трубу conn[1].  Мы
получаем ситуацию, когда оба процесса спят:
<i>A</i>    потому что труба переполнена, а процесс <i>B</i> ничего из нее не читает, так как  ждет
     окончания <i>A</i>;
<i>B</i>    потому что процесс-сын <i>A</i> не окончился, а он не может окончиться пока не  допишет
     свое сообщение.
Решением служит запрет процессу <i>B</i> делать вызов <i>wait</i> до тех пор, пока он не  прочитает
ВСЮ  информацию  из трубы (не получит EOF). Только сделав после этого <i>close</i>(conn[0]);


<i>А. Богатырев, 1992-95                  - 232 -                              Си в UNIX</i>

процесс <i>B</i> имеет право сделать <i>wait</i>.
     Если процесс <i>B</i> закроет свою сторону трубы <i>close</i>(conn[0]) прежде, чем  процесс  <i>A</i>
закончит  запись  в нее, то при вызове <i>write</i> в процессе <i>A</i>, система пришлет процессу <i>A</i>
сигнал <i>SIGPIPE</i> - "запись в канал, из которого никто не читает".

<i>6.6.1.</i>  Открытие <i>FIFO</i> файла приведет к блокированию процесса  ("засыпанию"),  если  в
буфере  <i>FIFO</i> файла пусто. Процесс заснет внутри вызова <i>open</i> до тех пор, пока в буфере
что-нибудь не появится.
     Чтобы избежать такой ситуации, а, например, сделать что-нибудь иное  полезное  в
это  время,  нам  надо  было бы опросить файл на предмет того - можно ли его открыть?
Это делается при помощи флага <i>O</i>_<i>NDELAY</i> у вызова <i>open</i>.

    int fd = <i>open</i>(filename, <i>O</i>_<i>RDONLY</i>|<i>O</i>_<i>NDELAY</i>);

Если <i>open</i> ведет к блокировке процесса внутри вызова, вместо  этого  будет  возвращено
значение  (-1).  Если  же файл может быть немедленно открыт - возвращается нормальный
дескриптор со значением >=0, и файл открыт.
     <i>O</i>_<i>NDELAY</i> является зависимым от семантики того файла, который  мы  открываем.   К
примеру,  можно  использовать  его  с файлами устройств, например именами, ведущими к
последовательным портам. Эти файлы устройств  (порты)  обладают  тем  свойством,  что
одновременно  их  может  открыть только один процесс (так устроена реализация функции
<i>open</i> внутри драйвера этих устройств). Поэтому, если один процесс уже работает с  пор-
том,  а  в  это  время второй пытается его же открыть, второй "заснет" внутри <i>open</i>, и
будет дожидаться освобождения порта <i>close</i> первым процессом.  Чтобы не ждать - следует
открывать порт с флагом <i>O</i>_<i>NDELAY</i>.

    #include &lt;stdio.h>
    #include &lt;fcntl.h>

    /* Убрать больше не нужный O_NDELAY */
    void nondelay(int fd){
            fcntl(fd, F_SETFL, fcntl(fd, F_GETFL, 0) & ~O_NDELAY);
    }
    int main(int ac, char *av[]){
            int fd;
            char *port = ac > 1 ? "/dev/term/a" : "/dev/cua/a";


    retry:  if((fd = open(port, O_RDWR|O_NDELAY)) &lt; 0){
                    perror(port);
                    sleep(10);
                    goto retry;
            }
            printf("Порт %s открыт.\n", port);
            nondelay(fd);

            printf("Работа с портом, вызови эту программу еще раз!\n");
            sleep(60);
            printf("Все.\n");
            return 0;
    }

Вот протокол:


<i>А. Богатырев, 1992-95                  - 233 -                              Си в UNIX</i>

    su# a.out & a.out xxx
    [1] 22202
    Порт /dev/term/a открыт.
    Работа с портом, вызови эту программу еще раз!
    /dev/cua/a: Device busy
    /dev/cua/a: Device busy
    /dev/cua/a: Device busy
    /dev/cua/a: Device busy
    /dev/cua/a: Device busy
    /dev/cua/a: Device busy
    Все.
    Порт /dev/cua/a открыт.
    Работа с портом, вызови эту программу еще раз!
    su#


        6.7.  Нелокальный переход.
     Теперь поговорим про нелокальный переход. Стандартная функция  <i>setjmp</i>  позволяет
установить в программе "контрольную точку"<i>|</i>-, а функция <i>longjmp</i> осуществляет прыжок  в
эту  точку,  выполняя  за  один раз выход сразу из нескольких вызванных функций (если
надо)<i>|</i>=.  Эти функции не являются системными вызовами, но  поскольку  они  реализуются
машинно-зависимым образом, а используются чаще всего как реакция на некоторый сигнал,
речь о них идет в этом разделе.  Вот как, например,  выглядит  рестарт  программы  по
прерыванию с клавиатуры:

    #include &lt;signal.h>
    #include &lt;setjmp.h>
    <i>jmp</i>_<i>buf</i> jmp;  /* контрольная точка */

    /* прыгнуть в контрольную точку */
    void <i>onintr</i>(nsig){ <i>longjmp</i>(jmp, nsig); }

    main(){
       int n;
       n = <i>setjmp</i>(jmp);  /* установить контрольную точку */
       if( n ) printf( "Рестарт после сигнала %d\n", n);
       <i>signal</i> (<i>SIGINT</i>, onintr);     /* реакция на сигнал */
       printf("Начали\n");
       ...
    }

<i>setjmp</i> возвращает 0 при запоминании контрольной  точки.   При  прыжке  в  контрольную
точку  при помощи <i>longjmp</i>, мы оказываемся снова в функции <i>setjmp</i>, и эта функция возв-
ращает нам значение второго аргумента <i>longjmp</i>, в этом примере - nsig.
     Прыжок в контрольную точку очень удобно использовать  в  алгоритмах  перебора  с
возвратом  (backtracking): либо - если ответ найден - прыжок на печать ответа, либо -
если ветвь перебора зашла в тупик - прыжок в точку ветвления и выбор другой альтерна-
тивы.  При этом можно делать прыжки и в рекурсивных вызовах одной и той же функции: с
более высокого уровня рекурсии в вызов более низкого уровня (в  этом  случае  <i>jmp</i>_<i>buf</i>
лучше делать автоматической переменной - своей для каждого уровня вызова функции).


____________________
   <i>|</i>- В некотором буфере запоминается текущее состояние  процесса:  положение  вершины
стека  вызовов  функций (stack pointer); состояние всех регистров процессора, включая
регистр адреса текущей машинной команды (instruction pointer).
   <i>|</i>= Это достигается восстановлением состояния процесса из буфера. Изменения,  проис-
шедшие  за  время между <i>setjmp</i> и <i>longjmp</i> в статических данных не отменяются (т.к. они
не сохранялись).


<i>А. Богатырев, 1992-95                  - 234 -                              Си в UNIX</i>

<i>6.7.1.</i>  Перепишите следующий алгоритм при помощи <i>longjmp</i>.

    #define FOUND    1 /* ответ найден    */
    #define NOTFOUND 0 /* ответ не найден */
    int value;         /* результат */
    main(){    int i;
      for(i=2; i &lt; 10; i++){
          printf( "пробуем i=%d\n", i);
          if( test1(i) == FOUND ){
              printf("ответ %d\n", value); break;
          }
      }
    }
    test1(i){  int j;
      for(j=1; j &lt; 10 ; j++ ){
          printf( "пробуем j=%d\n", j);
          if( test2(i,j) == FOUND ) return FOUND;
          /* "сквозной" return */
      }
      return NOTFOUND;
    }
    test2(i, j){
      printf( "пробуем(%d,%d)\n", i, j);
      if( i * j == 21 ){
          printf( "  Годятся (%d,%d)\n", i,j);
          value = j; return FOUND;
      }
      return NOTFOUND;
    }

Вот ответ, использующий нелокальный переход вместо цепочки <i>return</i>-ов:

    #include &lt;setjmp.h>
    jmp_buf jmp;
    main(){   int i;
      if( i = setjmp(jmp))  /* после прыжка */
            printf("Ответ %d\n", --i);
      else  /* установка точки */
        for(i=2; i &lt; 10; i++)
          printf( "пробуем i=%d\n", i), test1(i);
    }
    test1(i){ int j;
      for(j=1; j &lt; 10 ; j++ )
          printf( "пробуем j=%d\n", j), test2(i,j);
    }
    test2(i, j){
      printf( "пробуем(%d,%d)\n", i, j);
      if( i * j == 21 ){
         printf( "  Годятся (%d,%d)\n", i,j);
         longjmp(jmp, j + 1);
      }
    }

Обратите внимание, что при возврате ответа через второй аргумент <i>longjmp</i> мы прибавили
1,  а  при  печати  ответа  мы эту единицу отняли. Это сделано на случай ответа j==0,
чтобы функция <i>setjmp</i> не вернула бы в этом случае значение 0 (признак установки  конт-
рольной точки).

<i>6.7.2.</i>  В чем ошибка?

    #include &lt;setjmp.h>


<i>А. Богатырев, 1992-95                  - 235 -                              Си в UNIX</i>

    <i>jmp</i>_<i>buf</i> jmp;
    main(){
         g();
         <i>longjmp</i>(jmp,1);
    }
    g(){ printf("Вызвана g\n");
         f();
         printf("Выхожу из g\n");
    }
    f(){
         static n;
         printf( "Вызвана f\n");
         <i>setjmp</i>(jmp);
         printf( "Выхожу из f %d-ый раз\n", ++n);
    }

Ответ: <i>longjmp</i> делает прыжок в функцию <i>f</i>(), из которой уже произошел возврат управле-
ния. При переходе в тело функции в обход ее заголовка не выполняются машинные команды
"пролога" функции - функция остается "неактивированной". При  возврате  из  вызванной
таким  "нелегальным"  путем  функции  возникает ошибка, и программа падает. Мораль: в
функцию, которая НИКЕМ НЕ ВЫЗВАНА, нельзя передавать управление.  Обратный  прыжок  -
из  <i>f</i>()  в <i>main</i>() - был бы законен, поскольку функция <i>main</i>() является активной, когда
управление находится в теле функции <i>f</i>().  Т.е. можно "прыгать" из вызванной функции в
вызывающую: из <i>f</i>() в <i>main</i>() или в <i>g</i>(); и из <i>g</i>() в <i>main</i>();

    --        --
     |   <i>f</i>    |  стек      прыгать
     |   <i>g</i>    |  вызовов   сверху вниз
     |   <i>main</i> |  функций   можно - это соответствует
     ----------            выкидыванию нескольких
                           верхних слоев стека

но нельзя наоборот: из <i>main</i>() в <i>g</i>() или <i>f</i>(); а также  из  <i>g</i>()  в  <i>f</i>().   Можно  также
совершать прыжок в пределах одной и той же функции:

    f(){ ...
            A:   <i>setjmp</i>(jmp);
                 ...
                 <i>longjmp</i>(jmp, ...); ...
                 /* это как бы <i>goto</i> A; */
    }


        6.8.  Хозяин файла, процесса, и проверка привелегий.
     <i>UNIX</i> - многопользовательская система. Это значит,  что  одновременно  на  разных
терминалах, подключенных к машине, могут работать разные пользователи (а может и один
на нескольких терминалах). На каждом терминале работает  свой  интерпретатор  команд,
являющийся потомком процесса <i>/etc/init</i>.

<i>6.8.1.</i>  Теперь - про функции, позволяющие узнать некоторые данные про любого  пользо-
вателя  системы.   Каждый  пользователь  в <i>UNIX</i> имеет уникальный номер: идентификатор
пользователя (user id), а также уникальное имя: регистрационное имя, которое он наби-
рает  для  входа  в  систему.   Вся  информация  о  пользователях  хранится  в  файле
<i>/etc/passwd</i>. Существуют функции, позволяющие по номеру пользователя узнать  регистра-
ционное имя и наоборот, а заодно получить еще некоторую информацию из <i>passwd</i>:


<i>А. Богатырев, 1992-95                  - 236 -                              Си в UNIX</i>

    #include &lt;stdio.h>
    #include &lt;pwd.h>
    struct <i>passwd</i> *p;
    int   uid;   /* номер */
    char *uname; /* рег. имя */

    uid = <i>getuid</i>();
    p   = <i>getpwuid</i>( uid   );
            ...
    p   = <i>getpwnam</i>( uname );

Эти функции возвращают указатели на статические структуры, скрытые внутри этих  функ-
ций.  Структуры эти имеют поля:

    p-><i>pw</i>_<i>uid</i>     идентиф. пользователя (int uid);
    p-><i>pw</i>_<i>gid</i>     идентиф. группы пользователя;

            и ряд полей типа char[]
    p-><i>pw</i>_<i>name</i>    регистрационное имя пользователя (uname);
    p-><i>pw</i>_<i>dir</i>     полное имя домашнего каталога
      (каталога, становящегося текущим при входе в систему);
    p-><i>pw</i>_<i>shell</i>   интерпретатор команд
      (если "", то имеется в виду <i>/bin/sh</i>);
    p-><i>pw</i>_<i>comment</i> произвольная учетная информация (не используется);
    p-><i>pw</i>_<i>gecos</i>   произвольная учетная информация (обычно ФИО);
    p-><i>pw</i>_<i>passwd</i>  зашифрованный пароль для входа в
       систему. Истинный пароль нигде не хранится вовсе!

Функции возвращают значение p==<i>NULL</i>, если указанный пользователь не существует  (нап-
ример,  если  задан неверный uid).  uid хозяина данного процесса можно узнать вызовом
<i>getuid</i>, а uid владельца файла - из поля st_uid структуры, заполняемой системным вызо-
вом <i>stat</i> (а идентификатор группы владельца - из поля st_gid).  Задание: модифицируйте
наш аналог программы <i>ls</i>, чтобы он выдавал в  текстовом  виде  имя  владельца  каждого
файла в каталоге.

<i>6.8.2.</i>  Владелец файла может изменить своему файлу идентификаторы владельца и  группы
вызовом

    <i>chown</i>(char *имяФайла, int uid, int gid);

т.е. "подарить" файл другому пользователю.  Забрать чужой файл себе невозможно.   При
этой операции биты <i>S</i>_<i>ISUID</i> и <i>S</i>_<i>ISGID</i> в кодах доступа к файлу (см. ниже) сбрасываются,
поэтому создать "Троянского коня" и, сделав его хозяином суперпользователя,  получить
неограниченные привелегии - не удастся!

<i>6.8.3.</i>  Каждый файл имеет своего владельца (поле di_uid в I-узле на  диске  или  поле
i_uid в копии I-узла в памяти ядра<i>|</i>-).  Каждый процесс также  имеет  своего  владельца
(поля u_uid и u_ruid в <i>u-area</i>).  Как мы видим, процесс имеет два параметра, обознача-
ющие владельца. Поле ruid называется "<i>реальным идентификатором</i>" пользователя, а uid -
"<i>эффективным  идентификатором</i>".   При вызове <i>exec</i>() заменяется программа, выполняемая
данным процессом:

____________________
   <i>|</i>- При открытии файла и вообще при любой операции с файлом, в таблицах  ядра  заво-
дится  копия  I-узла  (для ускорения доступа, чтобы постоянно не обращаться к диску).
Если I-узел в памяти будет изменен, то при за