of</i>();    double x = <i>atof</i>(str1);
      extern long   <i>atol</i>();    long   y = <i>atol</i>(str2);
      extern int    <i>atoi</i>();    int    i = <i>atoi</i>(str3);

либо

    <i>sscanf</i>(str1, "%f",  &x);
    <i>sscanf</i>(str2, "%ld", &y); <i>sscanf</i>(str3,"%d", &i);

К слову заметим, что обратное преобразование - числа в текст - удобнее всего делается
при  помощи  функции  <i>sprintf</i>(),  которая  аналогична  <i>printf()</i>, но сформированная ею
строка-сообщение не выдается на экран, а заносится в массив:


<i>А. Богатырев, 1992-95                  - 58 -                               Си в UNIX</i>

            char represent[ 40 ];
            int i = ... ;
            <i>sprintf</i>( represent, "<i>%d</i>", i );


<i>1.117.</i>  Составьте программу вычисления полинома n-ой степени:

               n          n-1
     Y = A  * X + A    * X    + ... + A0
          n        n-1

         схема (Горнера):

     Y = A0 + X * ( A1 + X * ( A2 + ... + X * An )))...)

Оформите алгоритм как функцию с переменным числом параметров:

    <i>poly</i>( x, n, an, an-1, ... a0 );

О том, как это сделать - читайте раздел руководства по UNIX <i>man</i> varargs.  Ответ:

    #include &lt;varargs.h>
    double <i>poly</i>(x, n, <i>va</i>_<i>alist</i>)
           double x; int n; <i>va</i>_<i>dcl</i>
    {
      <i>va</i>_<i>list</i> args;
      double sum = 0.0;
      <i>va</i>_<i>start</i>(args); /* инициализировать список арг-тов */
      while( n-- >= 0 ){
         sum *= x;
         sum += <i>va</i>_<i>arg</i>(args, double);
         /* извлечь след. аргумент типа double */
      }
      <i>va</i>_<i>end</i>(args);   /* уничтожить список аргументов */
      return sum;
    }


    main(){
                            /* y = 12*x*x + 3*x + 7 */
      printf( "%g\n", poly(2.0, 2, 12.0,    3.0,  7.0));
    }

Прототип этой функции:

    double <i>poly</i>(double x, int n, <i>...</i> );

В этом примере использованы макросы <i>va</i>_нечто.   Часть  аргументов,  которая  является
списком переменной длины, обозначается в списке параметров как <i>va</i>_<i>alist</i>, при этом она
объявляется как <i>va</i>_<i>dcl</i> в списке типов параметров. Заметьте, что точка-с-запятой после
<i>va</i>_<i>dcl</i>  не нужна!  Описание <i>va</i>_<i>list</i> args; объявляет специальную "связную" переменную;
смысл ее машинно зависим.  <i>va</i>_<i>start</i>(args) инициализирует эту переменную списком  фак-
тических  аргументов,  соответствующих <i>va</i>_<i>alist</i>-у.  <i>va</i>_<i>end</i>(args) деинициализирует эту
переменную (это надо делать обязательно, поскольку инициализация могла быть связана с
конструированием  списка  аргументов при помощи выделения динамической памяти; теперь
мы должны уничтожить этот список и освободить память).  Очередной аргумент типа  TYPE
извлекается из списка при помощи

    TYPE x = <i>va</i>_<i>arg</i>(args, TYPE);

Список аргументов просматривается  слева  направо  в  одном  направлении,  возврат  к


<i>А. Богатырев, 1992-95                  - 59 -                               Си в UNIX</i>

предыдущему аргументу невозможен.
Нельзя указывать в качестве типов <i>char</i>, <i>short</i>, <i>float</i>:

    char ch = <i>va</i>_<i>arg</i>(args, char);

поскольку в языке Си аргументы функции таких типов автоматически расширяются  в  <i>int</i>,
<i>int</i>, <i>double</i> соответственно. Корректно будет так:

    int ch = <i>va</i>_<i>arg</i>(args, int);


<i>1.118.</i>  Еще об одной ловушке в языке Си на <i>PDP-11</i> (и в компиляторах бывают ошибки!):

            unsigned x = 2;
            printf( "%ld %ld",
                    - (long) x,
                    (long)  -x
            );

Этот фрагмент напечатает числа -2 и 65534.  Во втором случае при  приведении  к  типу
<i>long</i>  был  расширен  знаковый  бит.   Встроенная операция <i>sizeof</i> выдает значение типа
<i>unsigned</i>.  Подумайте, каков будет эффект в следующем фрагменте программы?

            static struct point{ int  x,  y    ;}
                          p =  {     33, 13   };
            FILE *fp = <i>fopen</i>( "00", "w" );

            /* вперед на длину одной структуры */
            <i>fseek</i>( fp, (long)  sizeof( struct point ), 0 );

            /* назад на длину одной структуры */
     /*!*/  <i>fseek</i>( fp, (long) -sizeof( struct point ), 1 );

            /* записываем в начало файла одну структуру */
            <i>fwrite</i>( &p, sizeof p, 1, fp );

            /* закрываем файл */
            <i>fclose</i>( fp );

Где должен находиться минус во втором вызове <i>fseek</i> для получения  ожидаемого  резуль-
тата?  (Данный пример может вести себя по-разному на разных машинах, вопросы касаются
<i>PDP-11</i>).

<i>1.119.</i>  Обратимся к указателям на функции:

    void <i>g</i>(x){ printf("%d: here\n", x); }
    main(){
      void (*f)() = <i>g</i>;  /* Указатель смотрит на функцию g() */
      (*f)(1); /* Старая форма вызова функции по указателю */
        f (2); /* Новая  форма вызова */
      /* В обоих случаях вызывается <i>g</i>(x); */
    }

Что печатает программа?

    typedef void (*(*FUN))(); /* Попытка изобразить
            рекурсивный тип typedef FUN (*FUN)(); */
    FUN  g(FUN f){ return f; }
    void main(){
         FUN y = g(g(g(g(g))));
         if(y == g) printf("OK\n");


<i>А. Богатырев, 1992-95                  - 60 -                               Си в UNIX</i>

    }

Что печатает программа?

            char *f(){
                    return "Hello, user!";
            }
            g(func)
                char * (*func)();
            {
                    puts((*func)());
            }
            main(){
                    g(f);
            }

Почему было бы неверно написать

            main(){
                    g(f());
            }

Еще аналогичная ошибка (посмотрите про  функцию  <i>signal</i>  в  главе  "Взаимодействие  с
<i>UNIX</i>"):

            #include &lt;signal.h>
            <i>f</i>(){ <i>printf</i>( "Good bye.\n" ); <i>exit</i>(0); }
            <i>main</i>(){
                 <i>signal</i> ( <i>SIGINT</i>, <i>f</i>() );
                 ...
            }

Запомните, что <i>f</i>() - это ЗНАЧЕНИЕ функции <i>f</i> (т.е. она вызывается и  нечто  возвращает
<i>return</i>-ом;  это-то  значение  мы и используем), а <i>f</i> - это АДРЕС функции <i>f</i> (раньше это
так и писалось &<i>f</i>), то есть метка начала ее машинных кодов ("точка входа").

<i>1.120.</i>  Что напечатает программа? (Пример посвящен указателям на функции  и  массивам
функций):

    int f(n){ return n*2; }
    int g(n){ return n+4; }
    int h(n){ return n-1; }
    int (*arr[3])() = { f, g, h };
    main(){
     int i;
     for(i=0; i &lt; 3; i++ )
         printf( "%d\n", (*arr[i])(i+7) );
    }


<i>1.121.</i>  Что напечатает программа?

    extern double <i>sin</i>(), <i>cos</i>();
    main(){ double x; /* <i>cc</i> -lm */
      for(x=0.0; x &lt; 1.0; x += 0.2)
        printf("%6.4g %6.4g %6.4g\n",
            (x > 0.5 ? <i>sin</i> : <i>cos</i>)(x), <i>sin</i>(x), <i>cos</i>(x));
    }

то же в варианте


<i>А. Богатырев, 1992-95                  - 61 -                               Си в UNIX</i>

    extern double <i>sin</i>(), <i>cos</i>();
    main(){ double x; double (*f)();
      for(x=0.0; x &lt; 1.0; x += 0.2){
            f = (x > 0.5 ? <i>sin</i> : <i>cos</i>);
            printf("%g\n", (*f)(x));
      }
    }


<i>1.122.</i>  Рассмотрите четыре реализации функции факториал:

         n! = 1 * 2 * ... * n
     или n! = n * (n-1)!   где 0! = 1

Все они иллюстрируют определенные подходы в программировании:

    /* ЦИКЛ (ИТЕРАЦИЯ) */
    int <i>factorial1</i>(n){ int res = 1;
        while(n > 0){ res *= n--; }
        return res;
    }

    /* ПРОСТАЯ РЕКУРСИЯ */
    int <i>factorial2</i>(n){
        return (n==0 ? 1 : n * <i>factorial2</i>(n-1));
    }
    /* Рекурсия, в которой функция вызывается рекурсивно
     * единственный раз - в операторе <i>return</i>, называется
     * "хвостовой рекурсией" (tail recursion) и
     * легко преобразуется в цикл */

    /* АВТОАППЛИКАЦИЯ */
    int <i>fi</i>(f, n) int (*f)(), n;
    {   if(n == 0) return 1;
        else       return n * (*f)(f, n-1);
    }
    int <i>factorial3</i>(n){ return <i>fi</i>(fi, n); }

    /* РЕКУРСИЯ С НЕЛОКАЛЬНЫМ ПЕРЕХОДОМ */
    #include &lt;setjmp.h>
    jmp_buf checkpoint;
    void <i>fact</i>(n, res) register int n, res;
    {   if(n) <i>fact</i>(n - 1, res * n);
        else  <i>longjmp</i>(checkpoint, res+1);
    }
    int <i>factorial4</i>(n){ int res;
        if(res = <i>setjmp</i>(checkpoint)) return (res - 1);
        else <i>fact</i>(n, 1);
    }


<i>1.123.</i>  Напишите функцию, печатающую целое число в  системе  счисления  с  основанием
base.  Ответ:


<i>А. Богатырев, 1992-95                  - 62 -                               Си в UNIX</i>

         <i>printi</i>( n, base ){
            register int i;

            if( n &lt; 0 ){  <i>putchar</i>( '-' ); n = -n;   }
            if( i = n / base )
                    <i>printi</i>( i, base );
            i = n % base ;
            <i>putchar</i>( i >= 10 ? 'A' + i - 10 : '0' + i );
         }

     Попробуйте написать нерекурсивный вариант с накоплением ответа в строке.  Приве-
дем рекурсивный вариант, накапливающий ответ в строке s и пользующийся аналогом функ-
ции <i>printi</i>: функция <i>prints</i> - такая же, как <i>printi</i>, но вместо вызовов  <i>putchar</i>(нечто);
в ней написаны операторы

            *res++ = нечто;

и рекурсивно вызывается конечно же <i>prints</i>.  Итак:

    static char *res;
     ... текст функции prints ...
    char *<i>itos</i>( n, base, s )
         char *s; /* указывает на char[] массив для ответа */
    {
            res = s; <i>prints</i>(n, base); *res = '\0';
            return s;
    }
    main(){ char buf[20]; printf( "%s\n", <i>itos</i>(19,2,buf); }


<i>1.124.</i>  Напишите функцию для побитной распечатки целого числа.  Имейте  в  виду,  что
число содержит 8 * sizeof(int) бит.  Указание: используйте операции битового сдвига и
&.  Ответ:

    <i>printb</i>(n){
      register i;
      for(i = 8 * sizeof(int) - 1; i >= 0; --i)
         putchar(n & (1 &lt;&lt; i) ? '1':'0');
    }


<i>1.125.</i>  Напишите функцию, склоняющую существительные русского языка в зависимости  от
их числа. Например:

     printf( "%d кирпич%s", n, <i>grammar</i>( n, "ей", "", "а" ));

Ответ:

     char *<i>grammar</i>( i, s1, s2, s3 )
     char *s1, /* прочее */
          *s2, /* один */
          *s3; /* два, три, четыре */
     {
            i = i % 100;
            if( i > 10 && i &lt;= 20 ) return s1;
            i = i % 10;
            if( i == 1 ) return s2;
            if( i == 2 || i == 3 || i == 4 )
                   return s3;
            return s1;
     }


<i>А. Богатырев, 1992-95                  - 63 -                               Си в UNIX</i>

<i>1.126.</i>  Напишите оператор <i>printf</i>, печатающий числа из интервала 0..99  с  добавлением
нуля перед числом, если оно меньше 10 :

            00 01 ... 09 10 11 ...

Используйте условное выражение, формат.
Ответ:

       printf ("%s%d", n &lt; 10 ? "0" : "", n);
            либо
       printf ("%02d", n );
            либо
       printf ("%c%c", '0' + n/10, '0' + n%10 );


<i>1.127.</i>  Предостережем от одной ошибки, часто допускаемой начинающими.

            <i>putchar</i>( "c" );   является ошибкой.
            <i>putchar</i>( 'c' );   верно.

Дело в том, что <i>putchar</i> требует аргумент - символ, тогда как "c" - СТРОКА  из  одного
символа.  Большинство  компиляторов  (те, которые не проверяют прототипы вызова стан-
дартных функций) НЕ обнаружит здесь никакой синтаксической ошибки (кстати, ошибка эта
- семантическая).
Также ошибочны операторы

            printf ( '\n' ); /* нужна строка */
            putchar( "\n" ); /* нужен символ */
            putchar( "ab" ); /* нужен символ */
            putchar( 'ab' ); /* ошибка в буквенной константе */

            char c; if((c = getchar()) == "q" ) ... ;
            /* нужно писать 'q' */

Отличайте строку из одного символа и символ - это разные вещи!  (Подробнее об этом  -
в следующей главе).

<i>1.128.</i>  Весьма частой является ошибка "промах  на  единицу",  которая  встречается  в
очень многих и разнообразных случаях. Вот одна из возможных ситуаций:

            int m[20]; int i = 0;
            while( <i>scanf</i>( "%d", & m[i++] ) != <i>EOF</i> );
            printf( "Ввели %d чисел\n", i );

В итоге i окажется на 1 больше, чем ожидалось. Разберитесь в чем дело.
     Ответ: аргументы функции вычисляются <i>до</i> ее вызова, поэтому  когда  мы  достигаем
конца файла и <i>scanf</i> возвращает <i>EOF</i>, i++ в вызове <i>scanf</i> все равно делается. Надо напи-
сать

            while( <i>scanf</i>( "%d", & m[i] ) != <i>EOF</i> ) i++;


<i>1.129.</i>  Замечание по стилистике: при выводе сообщения на экран

            <i>printf</i>( "Hello    \n" );

пробелы перед <i>\n</i> достаточно бессмысленны, поскольку на экране никак  не  отобразятся.
Надо писать (экономя память)

            <i>printf</i>( "Hello\n" );


<i>А. Богатырев, 1992-95                  - 64 -                               Си в UNIX</i>

Единственный случай, когда такие пробелы значимы - это когда вы выводите текст инвер-
сией. Тогда пробелы отображаются как светлый фон.
     Еще неприятнее будет

            <i>printf</i>( "Hello\n     " );

поскольку концевые пробелы окажутся в начале следующей строки.

<i>1.130.  printf</i> - интерпретирующая функция, т.е. работает она довольно медленно.  Поэ-
тому вместо

    char s[20]; int i;
      ...
    <i>printf</i>( "%c", s[i] );   и    <i>printf</i>( "\n" );

надо всегда писать

    <i>putchar</i>( s[i] );        и    <i>putchar</i>( '\n' );

поскольку <i>printf</i> в конце-концов (сделав все преобразования по  формату)  внутри  себя
вызывает <i>putchar</i>. Так сделаем же это сразу!

<i>1.131.</i>  То, что параметр "формат" в функции <i>printf</i> может быть  выражением,  позволяет
делать некоторые удобные вещи. Например:

    int x; ...
    <i>printf</i>( x ? "значение x=%d\n" : "x равен нулю\n\n", x);

Формат здесь - условное выражение. Если x!=0, то будет напечатано значение x по  фор-
мату  <i>%d</i>.  Если же x==0, то будет напечатана строка, не содержащая ни одного %-та.  В
результате аргумент x в списке аргументов будет просто проигнорирован.  Однако,  нап-
ример

    int x = ... ;
    <i>printf</i>( x > 30000 ? "%f\n" : "%d\n", x);

(чтобы большие x печатались в виде 31000.000000)  незаконно,  поскольку  целое  число
нельзя  печатать по формату <i>%f</i> ни в каких случаях.  Единственным способом сделать это
является явное приведение x к типу <i>double</i>:

    <i>printf</i>("%f\n", (double) x);

Будет ли законен оператор?

    <i>printf</i>( x > 30000 ? "%f\n" : "%d\n",
            x > 30000 ? (double) x : x );

Ответ: нет. Условное выражение для аргумента будет иметь "старший" тип  -  <i>double</i>.  А
значение  типа  <i>double</i>  нельзя  печатать по формату <i>%d</i>.  Мы должны использовать здесь
оператор <i>if</i>:

    if( x > 30000 ) <i>printf</i>("%f\n", (double)x);
    else            <i>printf</i>("%d\n", x);


<i>1.132.</i>  Напишите функцию, печатающую размер файла в удобном виде:  если  файл  меньше
одного  килобайта  -  печатать  его размер в байтах, если же больше - в килобайтах (и
мегабайтах).

    #define KBYTE    1024L  /* килобайт */
    #define THOUSAND 1024L  /* кб. в мегабайте */


<i>А. Богатырев, 1992-95                  - 65 -                               Си в UNIX</i>

    void <i>tellsize</i>(unsigned long sz){
      if(sz &lt; KBYTE) printf("%lu байт", sz);
      else{
        unsigned long Kb  = sz/KBYTE;
        unsigned long Mb  = Kb/THOUSAND;
        unsigned long Dec = ((sz % KBYTE) * 10) / KBYTE;
          if( Mb ){
              Kb %= THOUSAND;
    printf( Dec ? "%lu.%03lu.%01lu Мб." : "%lu.%lu Мб.",
                    Mb,   Kb,   Dec );
            } else
    printf( Dec ? "%lu.%01lu Кб.":"%lu Кб.", Kb, Dec);
      }
      putchar('\n');
    }


<i>1.133.</i>  Для печати строк используйте

            <i>printf</i>("%s", string);   /* A */
    но не   <i>printf</i>(string);         /* B */

Если мы используем вариант <i>B</i>, а в строке встретится символ '%'

    char string[] = "abc<i>%</i>defg";

то <i>%d</i> будет воспринято как формат для вывода целого числа.  Во-первых, сама строка %d
не  будет  напечатана;  во-вторых - что же будет печататься по этому формату, когда у
нас есть лишь единственный аргумент - string?! Напечатается какой-то мусор!

<i>1.134.</i>  Почему оператор

    char s[20];
    <i>scanf</i>("%s", s); <i>printf</i>("%s\n", s);

в ответ на ввод строки

      Пушкин  А.С.

печатает только "Пушкин"?
     Ответ: потому, что концом текста при вводе по формату <i>%s</i> считается либо <i>\n</i>, либо
пробел,  либо  табуляция,  а  не только <i>\n</i>; то есть формат <i>%s</i> читает слово из текста.
Чтение всех символов до конца строки, (включая пробелы) должно выглядеть так:

    <i>scanf</i>("%[^\n]\n", s);
      %[^\n] - читать любые символы, кроме \n (до \n)
      \n     - пропустить \n на конце строки
      %[abcdef] - читать слово,
                  состоящее из перечисленных букв.
      %[^abcde] - читать слово из любых букв,
        кроме перечисленных (прерваться по букве из списка).

Пусть теперь строки входной информации имеют формат:

       Фрейд Зигмунд 1856 1939

Пусть мы хотим считывать в строку s фамилию, в целое y - год рождения, а прочие  поля
- игнорировать. Как это сделать?  Нам поможет формат "подавление присваивания" <i>%*</i>:

     <i>scanf</i>("%s%*s%d%*[^\n]\n",
            s,   &y );


<i>А. Богатырев, 1992-95                  - 66 -                               Си в UNIX</i>

<i>%*</i> пропускает поле по формату, указанному после <i>*</i>, не занося его значение ни в  какую
переменную, а просто "забывая" его.  Так формат

            "%*[^\n]\n"

игнорирует "хвост" строки, включая символ перевода строки.
     Символы " ", "<i>\t</i>", "<i>\n</i>" в формате вызывают  пропуск  всех  пробелов,  табуляций,
переводов строк во входном потоке, что можно описать как

    int c;
    while((c = <i>getc</i>(stdin))== ' ' || c == '\t' || c == '\n' );

либо как формат

      %*[ \t\n]

     Перед числовыми форматами (<i>%d</i>, <i>%o</i>, <i>%u</i>, <i>%ld</i>, <i>%x</i>, <i>%e</i>, <i>%f</i>),  а  также  <i>%s</i>,  пропуск
пробелов делается автоматически.  Поэтому

            <i>scanf</i>("%d%d",  &x, &y);
                    и
            <i>scanf</i>("%d %d", &x, &y);

равноправны (пробел перед вторым <i>%d</i> просто не нужен).  Неявный  пропуск  пробелов  не
делается перед <i>%c</i> и <i>%[...</i> , поэтому в ответ на ввод строки "<i>12 5 x</i>" пример

    main(){ int n, m; char c;
       <i>scanf</i>("%d%d%c", &n, &m, &c);
       <i>printf</i>("n=%d m=%d c='%c'\n", n, m, c);
    }

напечатает "n=12 m=5 c=' '", то есть в c будет прочитан пробел (предшествовавший  <i>x</i>),
а не <i>x</i>.
     Автоматический пропуск пробелов перед <i>%s</i> не позволяет считывать  по  <i>%s</i>  строки,
лидирующие пробелы которых должны сохраняться.  Чтобы лидирующие пробелы также считы-
вались, следует использовать формат

     <i>scanf</i>("%[^\n]%*1[\n]", s);

в котором модификатор длины 1 заставляет игнорировать только один символ  <i>\n</i>,   а  не
ВСЕ  пробелы  и переводы строк, как "<i>\n</i>".  К сожалению (как показал эксперимент) этот
формат не в состоянии прочесть пустую строку (состоящую только из <i>\n</i>). Поэтому  можно
сделать глобальный вывод: строки надо считывать при помощи функций <i>gets</i>() и <i>fgets</i>()!

<i>1.135.</i>  Еще пара слов про <i>scanf</i>: <i>scanf</i> возвращает число успешно прочитанных им данных
(обработанных  <i>%</i>-ов)  или  <i>EOF</i> в конце файла. Неудача может наступить, если данное во
входном потоке не соответствует формату, например строка

            12 quack
      для
            int d1; double f; <i>scanf</i>("%d%lf", &d1, &f);

В этом случае <i>scanf</i> прочтет 12 по формату <i>%d</i> в переменную d1, но слово quack не отве-
чает формату <i>%lf</i>, поэтому <i>scanf</i> прервет свою работу и выдаст значение 1 (успешно про-
чел один формат).  Строка quack останется невостребованной - ее прочитают последующие
вызовы функций чтения; а сейчас f останется неизмененной.

<i>1.136.</i>  Си имеет квалификатор <i>const</i>, указывающий, что значение является  не  перемен-
ной,  а  константой, и попытка изменить величину по этому имени является ошибкой.  Во
многих случаях <i>const</i> может заменить <i>#define</i>, при этом еще явно указан тип  константы,
что полезно для проверок компилятором.


<i>А. Богатырев, 1992-95                  - 67 -                               Си в UNIX</i>

    <i>const</i> int x = 22;
    x = 33; /* ошибка: константу нельзя менять */

Использование <i>const</i> с указателем:
Указуемый объект - константа

         <i>const</i> char *pc = "abc";
         pc[1]  = 'x';    /* ошибка */
         pc     = "123";  /* OK */

Сам указатель - константа

         char *<i>const</i> cp = "abc";
         cp[1]  = 'x';    /* OK */
         cp     = "123";  /* ошибка */

Указуемый объект и сам указатель - константы

         <i>const</i> char *<i>const</i> cpc = "abc";
         cpc[1] = 'x';    /* ошибка */
         cpc    = "123";  /* ошибка */

Указатель на константу <i>необходимо</i> объявлять как const TYPE*

               int a = 1;
         <i>const</i> int b = 2;

         <i>const</i> int *pca  = &a;   /* OK, просто рассматриваем a как константу */
         <i>const</i> int *pcb  = &b;   /* OK */

               int *pb   = &b;   /* ошибка, так как тогда возможно было бы написать */
                   *pb   = 3;    /* изменить константу b */


<i>1.137.</i>  Стандартная функция быстрой сортировки  <i>qsort</i>  (алгоритм  quick  sort)  имеет
такой формат: чтобы отсортировать массив элементов типа <i>TYPE</i>

    <i>TYPE</i> arr[N];
          надо вызывать
    <i>qsort</i>(arr,/* Что сортировать? Не с начала: arr+m    */
          N,  /* Сколько первых элементов массива?      */
              /* можно сортировать только часть: n &lt; N  */
          sizeof(<i>TYPE</i>),/* Или sizeof arr[0]             */
                       /* размер одного элемента массива*/
          cmp);

где

    int <i>cmp</i>(<i>TYPE</i> *a1, <i>TYPE</i> *a2);

функция сравнения элементов *a1 и *a2.  Ее аргументы - АДРЕСА двух каких-то элементов
сортируемого  массива.   Функцию  cmp мы должны написать сами - это функция, задающая
упорядочение элементов массива.  Для сортировки по возрастанию функция  <i>cmp</i>()  должна
возвращать целое

       &lt; 0, если  *a1 должно идти раньше *a2    &lt;
       = 0, если  *a1 совпадает с        *a2   ==
       > 0, если  *a1 должно идти после  *a2    >

Для массива строк элементы  массива имеют тип (<i>char  *</i>),  поэтому  аргументы  функции
имеют тип (<i>char **</i>).  Требуемому условию удовлетворяет такая функция:


<i>А. Богатырев, 1992-95                  - 68 -                               Си в UNIX</i>

            char *arr[N]; ...
            <i>cmps</i>(s1, s2) char **s1, **s2;
            { return <i>strcmp</i>(*s1, *s2); }

(Про <i>strcmp</i> смотри раздел "Массивы и строки").  Заметим,  что  в  некоторых  системах
программирования (например в <i>TurboC++ |</i>-) вы должны использовать функцию  сравнения  с
прототипом

    int <i>cmp</i> (<i>const void</i> *a1, <i>const void</i> *a2);

и внутри нее явно делать приведение типа:

    <i>cmps</i> (const void *s1, const void *s2)
    { return <i>strcmp</i>(*(char **)s1, *(char **)s2); }

или можно поступить следующим образом:

    int <i>cmps</i>(char **s1, char **s2){
        return <i>strcmp</i>(*s1, *s2);
    }
    typedef int (*CMPS)(const void *, const void *);
    qsort((void *) array, ..., ..., (CMPS) <i>cmps</i>);

Наконец, возможно и просто объявить

    int <i>cmps</i>(const void *A, const void *B){
        return <i>strcmp</i>(A, B);
    }

Для массива целых годится такая функция сравнения:

            int arr[N]; ...
            <i>cmpi</i>(i1, i2) int *i1, *i2;
            { return *i1 - *i2; }

Для массива структур, которые мы сортируем по целому полю key, годится

            struct XXX{ int key; ... } arr[N];
            <i>cmpXXX</i>(st1, st2) struct XXX *st1, *st2;
            { return( st1->key  -  st2->key ); }

Пусть у нас есть массив long. Можно ли использовать

            long arr[N]; ...
            <i>cmpl</i>(L1, L2) long *L1, *L2;
            { return *L1 - *L2; }

Ответ: оказывается, что нет. Функция <i>cmpl</i> должна возвращать целое,  а  разность  двух
<i>long</i>-ов  имеет  тип  <i>long</i>.   Поэтому компилятор приводит эту разность к типу <i>int</i> (как
правило обрубанием старших битов).  При этом (если <i>long</i>-числа были велики)  результат
может изменить знак! Например:

    main(){
      int n; long a = 1L; long b = 777777777L;
      n = a - b;  /* должно бы быть отрицательным... */
      printf( "%ld %ld %d\n", a, b, n );
    }
____________________
   <i>|</i>- <i>TurboC</i> - компилятор Си в <i>MS DOS</i>, разработанный фирмой <i>Borland International</i>.


<i>А. Богатырев, 1992-95                  - 69 -                               Си в UNIX</i>

печатает 1 777777777 3472.  Функция сравнения должна выглядеть так:

            <i>cmpl</i>(L1, L2) long *L1, *L2; {
                    if( *L1 == *L2 ) return   0;
                    if( *L1 &lt;  *L2 ) return (-1);
                                     return   1;
            }

или

            <i>cmpl</i>(L1, L2) long *L1, *L2; {
                return( *L1 == *L2 ?  0 :
                        *L1 &lt;  *L2 ? -1 : 1 );
            }

поскольку важна не величина возвращенного значения, а только ее знак.
     Учтите, что для использования функции сравнения вы должны либо определить  функ-
цию сравнения до ее использования в <i>qsort</i>():

            int <i>cmp</i>(...){ ... } /* реализация */
                    ...
            <i>qsort</i>(..... , <i>cmp</i>);

либо предварительно объявить имя функции сравнения, чтобы компилятор понимал, что это
именно функция:

            int <i>cmp</i>();
            <i>qsort</i>(..... , <i>cmp</i>);
                    ...
            int <i>cmp</i>(...){ ... } /* реализация */


<i>1.138.</i>  Пусть у нас есть две программы, пользующиеся одной и той же структурой данных
W:

     a.c                          b.c
    --------------------------   ------------------------------
    #include &lt;fcntl.h>           #include &lt;fcntl.h>
    struct W{ int x,y; }a;       struct W{ int x,y; }b;
    main(){  int fd;             main(){  int fd;
      a.x = 12; a.y = 77;          fd = open("f", O_RDONLY);
      fd = creat("f", 0644);       read(fd, &b, sizeof b);
      write(fd, &a, sizeof a);     close(fd);
      close(fd);                   printf("%d %d\n", b.x, b.y);
    }                            }

Что будет, если мы изменим структуру на

            struct W { long x,y; };
                    или
            struct W { char c; int x,y; };

в файле a.c и забудем сделать это в b.c?  Будут ли правильно работать эти программы?
     Из наблюдаемого можно сделать вывод, что если две или  несколько  программ  (или
частей одной программы), размещенные в разных файлах, используют общие
-    типы данных (<i>typedef</i>);
-    структуры и объединения;
-    константы (определения <i>#define</i>);
-    прототипы функций;
то их определения лучше выносить в общий include-файл (header-файл), дабы  все  прог-
раммы  придерживались  одних  и тех же общих соглашений.  Даже если эти соглашения со


<i>А. Богатырев, 1992-95                  - 70 -                               Си в UNIX</i>

временем изменятся, то они изменятся во всех файлах синхронно и как бы сами собой.  В
нашем  случае  исправлять определение структуры придется только в include-файле, а не
выискивать все места, где оно написано, ведь при этом немудрено какое-нибудь место  и
пропустить!

             W.h
            -----------------------
            struct W{ long x, y; };

     a.c                          b.c
    --------------------------   ------------------
    #include &lt;fcntl.h>           #include &lt;fcntl.h>
    #include "W.h"               #include "W.h"
    struct W a;                  struct W b;
    main(){  ...                 main(){  ...
                                    printf("%ld...

Кроме того, вынесение общих фрагментов текста программы (определений структур,  конс-
тант,  и.т.п.) в отдельный файл экономит наши силы и время - вместо того, чтобы наби-
вать один и тот же текст много раз в разных файлах, мы теперь пишем  в  каждом  файле
единственную  строку  -  директиву <i>#include</i>. Кроме того, экономится и место на диске,
ведь программа  стала  короче!   Файлы  включения  имеют  суффикс  <i>.h</i>,  что  означает
"header-file" (файл-заголовок).
     Синхронную перекомпиляцию всех программ в случае изменения  include-файла  можно
задать в файле Makefile - программе для координатора <i>make|</i>-:

    all: a b
            echo Запуск a и b
            a ; b
    a: a.c W.h
            <i>cc</i> a.c <i>-o</i> a
    b: b.c W.h
            <i>cc</i> b.c <i>-o</i> b

Правила <i>make</i> имеют вид

    цель: список_целей_от_которых_зависит
            команда

команда  описывает  что  нужно  сделать,  чтобы  изготовить  файл  цель   из   файлов
список_целей_от_которых_зависит.   Команда  выполняется  только если файл цель еще не
существует, либо хоть один из файлов справа от  двоеточия  является  более  "молодым"
(свежим), чем целевой файл (смотри поле st_mtime и сисвызов <i>stat</i> в главе про <i>UNIX</i>).

<i>1.139.</i>  Программа на Си может быть размещена в нескольких файлах.  Каждый файл высту-
пает  в  роли "модуля", в котором собраны сходные по назначению функции и переменные.
Некоторые переменные и функции можно сделать невидимыми для других модулей. Для этого
надо объявить их <i>static</i>:
-    Объявление переменной внутри функции как <i>static</i>  делает  переменную  статической
     (т.е. она будет сохранять свое значение при выходе из функции) и ограничивает ее
     видимость пределами данной функции.
-    Переменные, описанные вне  функций,  и  так  являются  статическими  (по  классу
     памяти). Однако слово <i>static</i> и в этом случае позволяет управлять видимостью этих
     переменных - они будут видимы только в пределах данного файла.
-    Функции, объявленные как <i>static</i>, также видимы только в пределах данного файла.
-    Аргументы функции и локальные (автоматические) переменные функции и так  сущест-
     вуют  только  на  время вызова данной функции (память для них выделяется в стеке
____________________
   <i>|</i>- Подробное описание <i>make</i> смотри в документации по системе <i>UNIX</i>.


<i>А. Богатырев, 1992-95                  - 71 -                               Си в UNIX</i>

     при входе в функцию и уничтожается при выходе) и видимы только внутри  ее  тела.
     Аргументы функции нельзя объявлять <i>static</i>:

         f(x) static x; { x++; }

     незаконно.

Таким образом все переменные и функции в данном файле делятся на две группы:
-    Видимые только внутри данного файла (локальные для модуля).  Такие имена  объяв-
     ляются  с  использованием  ключевого  слова <i>static</i>.  В частности есть еще "более
     локальные" переменные - автоматические локалы функций и их формальные аргументы,
     которые  видимы  только  в пределах данной функции. Также видимы лишь в пределах
     одной функции статические локальные переменные, объявленные в  теле  функции  со
     словом <i>static</i>.
-    Видимые во всех файлах (глобальные имена).

Глобальные имена образуют интерфейс модуля и могут быть использованы в  других  моду-
лях. Локальные имена извне модуля недоступны.
     Если мы используем в файле-модуле функции и  переменные,  входящие  в  интерфейс
другого  файла-модуля, мы должны объявить их как <i>extern</i> ("внешние"). Для функций опи-
сатели <i>extern</i> и <i>int</i> можно опускать:

    // файл A.c
    int x, y, z;              // глобальные
    char ss[200];             // глоб.
    static int v, w;          // локальные
    static char *s, p[20];    // лок.
    int f(){ ... }            // глоб.
    char *g(){ ... }          // глоб.
    static int h(){ ... }     // лок.
    static char *sf(){ ... }  // лок.
    int fi(){ ... }           // глоб.


    // файл B.c
    extern int x, y;
    extern z;           // int можно опустить
    extern char ss[];   // размер можно опустить
    extern int f();
    char *g();          // extern можно опустить
    extern fi();        // int можно опустить

Хорошим тоном является написание комментария - из какого модуля или библиотеки импор-
тируется переменная или функция:

    extern int x, y;  /* import from A.c     */
    char *tgetstr();  /* import from <i>termlib</i> */

Следующая программа собирается из файлов A.c и B.c командой<i>|</i>=
____________________
   <i>|</i>= Можно задать Makefile вида

    CFLAGS = <i>-O</i>
    AB:     A.o     B.o
            <i>cc</i> A.o B.o <i>-o</i> AB
    A.o:    A.c
            <i>cc -c</i> $(CFLAGS) A.c
    B.o:    B.c
            <i>cc -c</i> $(CFLAGS) B.c

и собирать программу просто вызывая команду <i>make</i>.


<i>А. Богатырев, 1992-95                  - 72 -                               Си в UNIX</i>

       <i>cc</i> A.c B.c <i>-o</i> AB

Почему компилятор сообщает "x дважды определено"?

     файл A.c                файл B.c
    -----------------------------------------
    int x=12;               int x=25;
    main(){                 f(y) int *y;
      f(&x);                {
      printf("%d\n", x);       *y += x;
    }                       }

Ответ: потому, что в каждом файле описана глобальная переменная x.  Надо в  одном  из
них  (или  в  обоих  сразу)  сделать  x локальным именем (исключить его из интерфейса
модуля):
   <i>static</i> int x=...;
Почему в следующем примере компилятор сообщает "_<i>f</i> дважды определено"?

     файл A.c               файл B.c
    ----------------------------------------------------
    int x;                  extern int x;
    main(){ f(5); g(77); }  g(n){ f(x+n); }
    f(n)  { x=n;         }  f(m){ printf("%d\n", m); }

Ответ: надо сделать в файле B.c функцию <i>f</i> локальной: <i>static f</i>(m)...
     Хоть в одном файле должна быть определена функция <i>main</i>, вызываемая системой  при
запуске  программы. Если такой функции нигде нет - компилятор выдает сообщение "_<i>main</i>
неопределено". Функция <i>main</i> должна быть определена один раз! В файле она может  нахо-
диться  в  любом  месте  -  не требуется, чтобы она была самой первой (или последней)
функцией файла<i>|</i>=.

<i>1.140.</i>  В чем ошибка?

     файл A.c               файл B.c
    ----------------------------------------------------
    extern int x;           extern int x;
    main(){ x=2;            f(){
            f();               printf("%d\n", x);
    }                       }

Ответ: переменная x в обоих файлах объявлена как <i>extern</i>, в результате память для  нее
нигде  не  выделена,  т.е.  x  не  определена ни в одном файле.  Уберите одно из слов
<i>extern</i>!

<i>1.141.</i>  В чем ошибка?

     файл A.c               файл B.c
    ----------------------------------------------------
     int x;                 extern double x;
     ...                    ...

Типы переменных не совпадают. Большинство компиляторов не ловит  такую  ошибку,  т.к.
каждый файл компилируется отдельно, независимо от остальных, а при "склейке" файлов в
____________________
   <i>|</i>= Если вы пользуетесь "новым" стилем объявления функций, но не используете  прото-
типы,  то  следует определять каждую функцию <i>до</i> первого места ее использования, чтобы
компилятору в точке вызова был известен ее заголовок. Это приведет к тому, что <i>main</i>()
окажется последней функцией в файле - ее не вызывает никто, зато она вызывает кого-то
еще.


<i>А. Богатырев, 1992-95                  - 73 -                               Си в UNIX</i>

общую выполняемую программу компоновщик знает лишь имена переменных и функций, но  не
их типы и прототипы.  В результате программа нормально скомпилируется и соберется, но
результат ее выполнения будет непредсказуем! Поэтому объявления <i>extern</i>  тоже  полезно
выносить в include-файлы:

    файл proto.h
    ------------------
    extern int x;

    файл A.c                файл B.c
    ------------------      ------------------
    #include "proto.h"      #include "proto.h"
    int x;                  ...

то, что переменная x в A.c оказывается описанной и как  <i>extern</i>  -  вполне  допустимо,
т.к. в момент настоящего объявления этой переменной это слово начнет просто игнориро-
ваться (лишь бы типы в объявлении с <i>extern</i> и без него совпадали - иначе ошибка!).

<i>1.142.</i>  Что печатает программа и почему?

    int a = 1;  /* пример Bjarne Stroustrup-а */
    void <i>f</i>(){
      int b = 1;
      static int c = 1;
      printf("a=%d b=%d c=%d\n", a++, b++, c++);
    }
    void <i>main</i>(){
      while(a &lt; 4) <i>f</i>();
    }

Ответ:

    a=1 b=1 c=1
    a=2 b=1 c=2
    a=3 b=1 c=3


<i>1.143.</i>  Автоматическая переменная видима только внутри блока, в котором она  описана.
Что напечатает программа?

    /* файл A.c */
    int x=666;  /*глоб.*/
    main(){
      f(3);
      printf(" ::x = %d\n", x);
      g(2); g(5);
      printf(" ::x = %d\n", x);
    }
    g(n){
      static int x=17; /*видима только в g*/
      printf("g::x = %2d g::n = %d\n", x++, n);
      if(n) g(n-1); else x = 0;
    }


    /* файл B.c */
    extern x;     /*глобал*/
    f(n){         /*локал функции*/
      x++;        /*глобал*/
      { int x;    /*локал блока*/
        x = n+1;  /*локал*/


<i>А. Богатырев, 1992-95                  - 74 -                               Си в UNIX</i>

        n = 2*x;  /*локал*/
      }
      x = n-1;    /*глобал*/
    }


<i>1.144.</i>  Функция, которая
-    не содержит внутри себя  статических  переменных,  хранящих  состояние  процесса
     обработки данных (функция без "памяти");
-    получает значения параметров только через свои аргументы (но не через глобальные
     статические переменные);
-    возвращает значения только через аргументы, либо  как  значение  функции  (через
     <i>return</i>);
называется реентерабельной (повторно входимой)  или  чистой  (pure).   Такая  функция
может параллельно (или псевдопараллельно) использоваться несколькими "потоками" обра-
ботки информации в нашей программе,  без  какого-либо  непредвиденного  влияния  этих
"потоков  обработки"  друг  на  друга.   Первый пункт требований позволяет функции не
зависеть ни  от какого конкретного процесса обработки данных, т.к.  она  не  "помнит"
обработанных  ею ранее данных и не строит свое поведение в зависимости от них. Вторые
два пункта - это требование, чтобы все без исключения пути передачи данных в  функцию
и  из  нее  (интерфейс  функции)  были перечислены в ее заголовке. Это лишает функцию
"побочных эффектов", не предусмотренных  программистом  при  ее  вызове  (программист
обычно  смотрит только на заголовок функции, и не выискивает "тайные" связи функции с
программой через глобальные переменные, если только  это  специально  не  оговорено).
Вот пример <i>не</i> реентерабельной функции:

    FILE *fp; ...  /* глобальный аргумент */
    char <i>delayedInput</i> ()
    {
         static char prevchar;  /* память */
         char c;
         c = prevchar;
         prevchar = <i>getc</i> (fp);
         return c;
    }

А вот ее реентерабельный эквивалент:

    char <i>delayedInput</i> (char *prevchar, FILE *fp)
    {
         char c;
         c = *prevchar;
         *prevchar = <i>getc</i> (fp);
         return c;
    }
    /* вызов: */
    FILE *fp1, *fp2; char prev1, prev2, c1, c2;
     ... x1 = <i>delayedInput</i> (&prev1, fp1);
         x2 = <i>delayedInput</i> (&prev2, fp2); ...

Как видим, все "запоминающие" переменные (т.е. prevchar) вынесены из самой функции  и
подаются в нее в виде аргумента.
     Реентерабельные функции независимы от остальной части программы (их можно скопи-
ровать  в другой программный проект без изменений), более понятны (поскольку все зат-
рагиваемые ими внешние переменные перечислены как аргументы,  не  надо  вы