мя параметрами. Первый параметр -- это имя (большого) файла для чтения, а второй -- цифра 1, 2 или 3, выбирающая функцию <code>workc()</code>, <code>workcpp()</code> или <code>work3()</code> соответственно. Только не забудьте про дисковый кэш, т.е. для получения объективных результатов программу нужно запустить несколько раз для каждого из вариантов.
<p>
Необычным местом здесь является функция <code>work3()</code> и соответствующий ей класс <code>File</code>. Они написаны специально для проверки "честности" реализации стандартных средств ввода-вывода C -- <code>FILE*</code>. Если вдруг окажется, что <code>workc()</code> работает существенно медленнее <code>work3()</code>, то вы имеете полное право назвать создателей такой библиотеки, как минимум, полными неучами.
<p>
А сейчас попробуем получить информацию к размышлению: проведем серию контрольных запусков и посмотрим на результат.
<p>
И что же нам говорят безжалостные цифры? Разница <i>в разы</i>! А для одного широко распространенного коммерческого пакета (не будем показывать пальцем) она порой достигала 11 раз!!!
<p>
Стоит только взглянуть на определения вызываемых функций, как ответ сразу станет очевидным.
<p>
Для C с его <code>getc()</code> в типичной реализации мы имеем:
<pre>#define getc(f) ((--((f)-&gt;level) &gt;= 0) ? (unsigned char)(*(f)-&gt;curp++) : _fgetc (f))</pre>
Т.е. коротенький макрос вместо функции. Как говорится -- всего-ничего. А вот для C++ стандарт требует <i>столько</i>, что очередной раз задаешься вопросом: думали ли господа-комитетчики о том, что горькие плоды их творчества кому-то реально придется применять?!
<p>
Ну и ладно: предупрежден -- вооружен! А что, если задать буфер побольше?
<pre>void workc(char* fn)
{
 // ...

 if (setvbuf(fil, 0, _IOFBF, LARGE_BUFSIZ)) return;

 // ...
}

void workcpp(char* fn)
{
 // ...

 char* buf=new char[LARGE_BUFSIZ];
 fil.rdbuf()-&gt;pubsetbuf(buf, LARGE_BUFSIZ);

 // ...

 delete [] buf;
}</pre>
Как ни странно, по сути ничего не изменится! Дело в том, что современные ОС при работе с диском используют очень качественные алгоритмы кэширования, так что еще один уровень буферизации внутри приложения оказывается излишним (в том смысле, что используемые по умолчанию буферы потоков вполне адекватны).
<p>
Кстати, одним из хороших примеров необходимости использования многопоточных программ является возможность ускорения работы программ копирования файлов, когда исходный файл и копия расположены на разных устройствах. В этом случае программа запускает несколько потоков, осуществляющих асинхронные чтение и запись. Но в современных ОС в этом нет никакого смысла, т.к. предоставляемое системой кэширование кроме всего прочего обеспечивает и прозрачное для прикладных программ асинхронное чтение и запись.
<p>
Подводя итог, хочется отметить, что если ввод-вывод является узким местом вашего приложения, то следует воздержаться от использования стандартных потоков C++ и использовать проверенные десятилетиями методы.

<hr>

<a name="701"></a>
<center><h3>Стр.701: 21.4.6.3. Манипуляторы, определяемые пользователем</h3></center>

Коль скоро с эффективностью потоков ввода-вывода мы уже разобрались, следует поговорить об удобстве. К сожалению, для сколько-нибудь сложного форматирования предоставляемые потоками средства не предназначены. Не в том смысле, что средств нет, а в том, что они чрезвычайно неудобны и легко выводят из себя привыкшего к элегантному формату ...<code>printf()</code> программиста. Не верите? Давайте попробуем вывести обыкновенную дату в формате <code>dd.mm.yyyy</code>:
<pre>int day= 31,
    mon= 1,
    year=1974;

printf("%02d.%02d.%d\n", day, mon, year);  // 31.01.1974

cout&lt;&lt;setfill('0')&lt;&lt;setw(2)&lt;&lt;day&lt;&lt;'.'&lt;&lt;setw(2)&lt;&lt;mon&lt;&lt;setfill(' ')&lt;&lt;'.'
    &lt;&lt;year&lt;&lt;"\n";  // тоже 31.01.1974</pre>
Думаю, что комментарии излишни.
<p>
За что же не любят потоки C и чем потоки C++ могут быть удобнее? У потоков C++ есть только одно существенное достоинство -- типобезопасность. Т.к. потоки C++ все же нужно использовать, я написал специальный манипулятор, который, оставаясь типобезопасным, позволяет использовать формат ...<code>printf()</code>. Он не вызывает существенных накладных расходов и с его помощью приведенный выше пример будет выглядеть следующим образом:
<pre>cout&lt;&lt;c_form(day,"02")&lt;&lt;'.'&lt;&lt;c_form(mon,"02")&lt;&lt;'.'&lt;&lt;year&lt;&lt;'\n';</pre>
Вот исходный код заголовочного файла:
<pre>#include &lt;ostream&gt;

/** личное пространство имен функции c_form, содержащее детали реализации */
namespace c_form_private {

 typedef std::ios_base::fmtflags fmtflags;
 typedef std::ostream ostream;
 typedef std::ios_base ios;

 /**
  * Вспомогательный класс для осуществления форматирования.
  */
 class Formatter {
       /** флаги для установки */
       fmtflags newFlags;
       /** ширина */
       int width;
       /** точность */
       int prec;
       /** символ-заполнитель */
       char fill;
       /** сохраняемые флаги */
       fmtflags oldFlags;

  public:
       /**
        * Создает объект, использующий переданное форматирование.
        */
       Formatter(const char* form, int arg1, int arg2);

       /**
        * Устанавливает новое форматирование для переданного потока, сохраняя
        * старое.
        */
       void setFormatting(ostream&amp; os);

       /**
        * Восстанавливает первоначальное форматирование, сохраненное в функции
        * setFormatting().
        */
       void restoreFormatting(ostream&amp; os);
 };

 /**
  * Вспомогательный класс.
  */
 template &lt;class T&gt;
 class Helper {
       /** выводимое значение */
       const T&amp; val;
       /** объект для форматирования */
       mutable Formatter fmtr;

  public:
       /**
        * Создает объект по переданным параметрам.
        */
       Helper(const T&amp; val_, const char* form, int arg1, int arg2) :
         val(val_), fmtr(form, arg1, arg2) {}

       /**
        * Функция для вывода в поток сохраненного значения в заданном формате.
        */
       void putTo(ostream&amp; os) const;
 };

 template &lt;class T&gt;
 void Helper&lt;T&gt;::putTo(ostream&amp; os) const
 {
  fmtr.setFormatting(os);
  os&lt;&lt;val;
  fmtr.restoreFormatting(os);
 }

 /**
  * Оператор для вывода объектов Helper в поток.
  */
 template &lt;class T&gt;
 inline ostream&amp; operator&lt;&lt;(ostream&amp; os, const Helper&lt;T&gt;&amp; h)
 {
  h.putTo(os);
  return os;
 }
}

/**
 * Функция-манипулятор, возвращающая объект вспомогательного класса, для
 * которого переопределен оператор вывода в ostream. Переопределенный оператор
 * вывода осуществляет форматирование при выводе значения.
 * @param val значение для вывода
 * @param form формат вывода: [-|0] [число|*] [.(число|*)] [e|f|g|o|x]
 * @param arg1 необязательный аргумент, задающий ширину или точность.
 * @param arg2 необязательный аргумент, задающий точность.
 * @throws std::invalid_argument если передан аргумент form некорректного
 *         формата.
 */
template &lt;class T&gt;
inline c_form_private::Helper&lt;T&gt; c_form(const T&amp; val, const char* form,
  int arg1=0, int arg2=0)
{
 return c_form_private::Helper&lt;T&gt;(val, form, arg1, arg2);
}</pre>
и файла-реализации:
<pre>#include &quot;c_form.hpp&quot;
#include &lt;stdexcept&gt;
#include &lt;cctype&gt;

namespace {

 /**
  * Вспомогательная функция для чтения десятичного числа.
  */
 int getval(const char*&amp; iptr)
 {
  int ret=0;
  do ret=ret*10 + *iptr-'0';
     while (std::isdigit(*++iptr));

  return ret;
 }

}

c_form_private::Formatter::Formatter(const char* form, int arg1, int arg2) :
  newFlags(fmtflags()), width(0), prec(0), fill(0)
{
 const char* iptr=form;  // текущий символ строки формата

 if (*iptr=='-') {  // выравнивание влево
    newFlags|=ios::left;
    iptr++;
 }
 else if (*iptr=='0') {  // добавляем '0'ли только если !left
         fill='0';
         iptr++;
      }

 if (*iptr=='*') {  // читаем ширину, если есть
    width=arg1;
    iptr++;

    arg1=arg2;  // сдвигаем агрументы влево
 }
 else if (std::isdigit(*iptr)) width=getval(iptr);

 if (*iptr=='.') {  // есть точность
    if (*++iptr=='*') {
       prec=arg1;
       iptr++;
    }
    else if (std::isdigit(*iptr)) prec=getval(iptr);
         else throw std::invalid_argument(&quot;c_form&quot;);
 }

 switch (*iptr++) {
        case   0: return;  // конец строки формата
        case 'e': newFlags|=ios::scientific; break;
        case 'f': newFlags|=ios::fixed;      break;
        case 'g':                            break;
        case 'o': newFlags|=ios::oct;        break;
        case 'x': newFlags|=ios::hex;        break;
        default: throw std::invalid_argument(&quot;c_form&quot;);
 }

 if (*iptr) throw std::invalid_argument(&quot;c_form&quot;);
}

void c_form_private::Formatter::setFormatting(ostream&amp; os)
{
 oldFlags=os.flags();
 // очищаем floatfield и устанавливаем свои флаги
 os.flags((oldFlags &amp; ~ios::floatfield) | newFlags);

 if (width) os.width(width);
 if (fill)  fill=os.fill(fill);
 if (prec)  prec=os.precision(prec);
}

void c_form_private::Formatter::restoreFormatting(ostream&amp; os)
{
 os.flags(oldFlags);

 if (fill) os.fill(fill);
 if (prec) os.precision(prec);
}</pre>
Принцип его работы основан на следующей идее: функция <code>c_form&lt;&gt;()</code> возвращает объект класса <code>c_form_private::Helper&lt;&gt;</code>, для которого определена операция вывода в <code>ostream</code>.
<p>
Для удобства использования, <code>c_form&lt;&gt;()</code> является функцией, т.к. если бы мы сразу использовали конструктор некоторого класса-шаблона <code>c_form&lt;&gt;</code>, то нам пришлось бы явно задавать его параметры:
<pre>cout&lt;&lt;c_form&lt;int&gt;(day,"02");</pre>
что, мягко говоря, неудобно. Далее. Мы, в принципе, могли бы не использовать нешаблонный класс <code>Formatter</code>, а поместить весь код прямо в <code>Helper&lt;&gt;</code>, но это привело бы к совершенно ненужной повторной генерации общего (не зависящего от параметров шаблона) кода.
<p>
Как можно видеть, реализацию манипулятора <code>c_form</code> вряд ли можно назвать тривиальной. Тем не менее, изучить ее стоит хотя бы из тех соображений, что в процессе разработки было использовано (неожиданно) большое количество полезных приемов программирования.

<hr>

<a name="711"></a>
<center><h3>Стр.711: 21.6.2. Потоки ввода и буфера</h3></center>

<b>Функция <code>readsome()</code> является операцией нижнего уровня, которая позволяет...</b>
<p>
Т.к. приведенное в книге описание <code>readsome()</code> туманно, далее следует перевод соответствующей части стандарта:
<p>
<b>27.6.1.3 Функции неформатированного ввода [lib.istream.unformatted]</b>
<pre>streamsize readsome(char_type* s, streamsize n);</pre>
<ol start=30>
<li>
<b>Действия:</b> Если <code>!good()</code> вызывает <code>setstate(failbit)</code>, которая может возбудить исключение. Иначе извлекает символы и помещает их в массив, на первый элемент которого указывает <code>s</code>. Если <code>rdbuf()-&gt;in_avail() == -1</code>, вызывает <code>setstate(eofbit)</code> (которая может возбудить исключение <code>ios_base::failure</code> (27.4.4.3)) и не извлекает символы;
<ul>
  <li>
если <code>rdbuf()-&gt;in_avail() == 0</code>, не извлекает символы
  </li>
  <li>
если <code>rdbuf()-&gt;in_avail() &gt; 0</code>, извлекает <code>min(rdbuf()-&gt;in_avail(),n))</code> символов
  </li>
</ul>
</li>
<li>
<b>Возвращает:</b> Количество извлеченных символов.
</li>
</ol>

<hr>

<a name="773"></a>
<center><h3>Стр.773: 23.4.3.1. Этап 1: выявление классов</h3></center>

<b>Например, в математике окружность -- это частный случай эллипса, но в большинстве программ окружность не нужно выводить из эллипса, или делать эллипс потомком окружности.</b>
<p>
Думаю, что стоит поподробнее рассмотреть данный конкретный случай, т.к. он иллюстрирует довольно распространенную ошибку проектирования. На первый взгляд может показаться, что идея сделать класс <code>Circle</code> производным от класса <code>Ellipse</code> является вполне приемлемой, ведь они связаны отношением is-a: каждая окружность является эллипсом. Некорректность данной идеи станет очевидной, как только мы приступим к написанию кода.
<p>
У эллипса, кроме прочих атрибутов, есть два параметра: полуоси <code>a</code> и <code>b</code>. И производная окружность их унаследует. Более того, нам нужен один единственный радиус для окружности и мы не можем для этих целей использовать один из унаследованных атрибутов, т.к. это изменит его смысл и полученный от эллипса код перестанет работать. Следовательно мы вынуждены добавить новый атрибут -- радиус и, при этом, поддерживать в корректном состоянии унаследованные атрибуты. Очевидно, что подобного рода наследование лишено смысла, т.к. не упрощает, а усложняет разработку.
<p>
В чем же дело? А дело в том, что понятие окружность в математическом смысле является <i>ограничением</i> понятия эллипс, т.е. его частным случаем. А наследование будет полезно, если конструируемый нами объект содержит подобъект базового класса и все унаследованные операции для него имеют смысл (рассмотрите, например,  операцию изменения значения полуоси <code>b</code> -- она ничего не знает об инварианте окружности и легко его разрушит). Другими словами, объект производного класса должен быть <i>расширением</i> объекта базового класса, но не его частным случаем (изменением), т.к. мы не можем повлиять на поведение базового класса, если он нам не предоставил соответствующих возможностей, например в виде подходящего набора виртуальных функций.

<hr>

<a name="879"></a>
<center><h3>Стр.879: А.5. Выражения</h3></center>

<b>То есть "если нечто можно понять как объявление, это и есть объявление".</b>
<p>
Т.к. сложные объявления C++ могут быть непонятны даже неновичку, стоит прокомментировать приведенные в книге объявления. Неочевидность всех приведенных примеров основана на добавлении лишних скобок:
<p>
<table>
  <tr>
    <td valign=top nowrap><code>T(*e)(int(3));</code></td>
    <td valign=top>эквивалентно</td>
    <td valign=top nowrap><code>T* e(int(3));</code></td>
    <td>То, что инициализация указателя с помощью <code>int</code> запрещена, синтаксичестим анализатором не принимается во внимание: будет распознано объявление указателя и выдана ошибка.</td>
  </tr>
  <tr>
    <td valign=top nowrap><code>T(f)[4];</code></td>
    <td valign=top>эквивалентно</td>
    <td valign=top nowrap colspan=2><code>T f[4];</code></td>
  </tr>
  <tr>
    <td valign=top nowrap><code>T(a);</code></td>
    <td valign=top>эквивалентно</td>
    <td valign=top nowrap colspan=2><code>T a;</code></td>
  </tr>
  <tr>
    <td valign=top nowrap><code>T(a)=m;</code></td>
    <td valign=top>эквивалентно</td>
    <td valign=top nowrap colspan=2><code>T a=m;</code></td>
  </tr>
  <tr>
    <td valign=top nowrap><code>T(*b)();</code></td>
    <td colspan=3>объявление указателя на функцию.</td>
  </tr>
  <tr>
    <td valign=top nowrap><code>T(x),y,z=7;</code></td>
    <td valign=top>эквивалентно</td>
    <td valign=top nowrap colspan=2><code>T x,y,z=7;</code></td>
  </tr>
</table>

<hr>

<a name="931"></a>
<center><h3>Стр.931: B.13.2. Друзья</h3></center>

Приведенный в конце страницы пример нужно заменить на:
<pre>template&lt;class C&gt; class Basic_ops {  // базовые операции с контейнерами
	friend bool operator==&lt;&gt;(const C&amp;, const C&amp;);  // сравнение элементов
	friend bool operator!=&lt;&gt;(const C&amp;, const C&amp;);
	// ...
};</pre>
Уголки (<code>&lt;&gt;</code>) после имен функций означают, что друзьями являются функции-шаблоны (поздние изменения стандарта).
<p>
Этот текст взят из списка авторских исправлений к 10 тиражу.
<p>
Почему в данном случае необходимы <code>&lt;&gt;</code>? Потому что иначе мы объявляем другом <code>operator==()</code> не шаблон, т.к. до объявления класса в окружающем контексте не было объявления <code>operator==()</code>-шаблона. Вот формулировка стандарта:
<p>
<b>14.5.3. Друзья [temp.friend]</b>
<ol>
<li>
Другом класса или класса-шаблона может быть функция-шаблон, класс-шаблон, их специализации или обычная (не шаблон) функция или класс. Для объявления функций-друзей которые не являются объявлениями шаблонов:
<ul>
  <li>
если имя друга является квалифицированным или неквалифицированным <i>template-id</i>, то объявление друга ссылается на специализацию функции-шаблона, иначе
  </li>
  <li>
если имя друга является <i>qualified-id</i> и в указанном классе или пространстве имен найдена соответствующая функция не шаблон, то объявление друга ссылается на эту функцию, иначе
  </li>
  <li>
если имя друга является <i>qualified-id</i> и в указанном классе или пространстве имен найдена соответствующая специализация функции-шаблона, то объявление друга ссылается на эту функцию, иначе
  </li>
  <li>
имя должно быть <i>unqualified-id</i>, который объявляет (или переобъявляет) обычную (не шаблон) функцию.
  </li>
</ul>
Например:
<pre>template&lt;class T&gt; class task;
template&lt;class T&gt; task&lt;T&gt;* preempt(task&lt;T&gt;*);

template&lt;class T&gt; class task {
	//  ...
	friend void next_time();
	friend void process(task&lt;T&gt;*);
	friend task&lt;T&gt;* preempt&lt;T&gt;(task&lt;T&gt;*);
	template&lt;class C&gt; friend int func(C);

	friend class task&lt;int&gt;;
	template&lt;class P&gt; friend class frd;
	//  ...
};</pre>
здесь функция <code>next_time</code> является другом каждой специализации класса-шаблона <code>task</code>; т.к. <code>process</code> не имеет явных <i>template-arguments</i>, каждая специализация класса-шаблона <code>task</code> имеет функцию-друга <code>process</code> соответствующего типа и этот друг не является специализацией функции-шаблона; т.к. друг <code>preempt</code> имеет явный <i>template-argument</i>  <code>&lt;T&gt;</code>, каждая специализация класса-шаблона <code>task</code> имеет другом соответствующую специализацию функции-шаблона <code>preempt</code>; и, наконец, каждая специализация класса-шаблона <code>task</code> имеет другом все специализации функции-шаблона <code>func</code>. Аналогично, каждая специализация класса-шаблона <code>task</code> имеет другом класс-специализацию <code>task&lt;int&gt;</code>, и все специализации класса-шаблона <code>frd</code>.
</li>
</ol>

<hr>

<a name="935"></a>
<center><h3>Стр.935: B.13.6. <code>template</code> как квалификатор</h3></center>

И снова об этом загадочном квалификаторе.
<p>
В данном разделе д-р Страуструп привел пример его использования с функцией-членом шаблоном. А что, если нам нужно вызвать статическую функцию-член или функцию-друга? Полный пример будет выглядеть следующим образом:
<pre>template &lt;class T&gt; void get_new3();  // (1)

template &lt;class Allocator&gt;
void f(Allocator&amp; m)
{
 int* p1=         m.template get_new1&lt;int&gt;( );
 int* p2=Allocator::template get_new2&lt;int&gt;(m);
 int* p3=                    get_new3&lt;int&gt;(m);
}

struct Alloc {
       template &lt;class T&gt;
       T* get_new1() { return 0; }

       template &lt;class T&gt;
       static T* get_new2(Alloc&amp;) { return 0; }

       template &lt;class T&gt;
       friend T* get_new3(Alloc&amp;) { return 0; }
};

int main()
{
 Alloc a;
 f(a);
}</pre>
Итак:
<ol>
<li>
<code>get_new1</code> --- это функция-член, для вызова которой в <i>данном случае</i> обязательно должен быть использован квалификатор <code>template</code>. Дело в том, что в точке определения <code>f</code> класс <code>Allocator</code> является всего лишь именем параметра шаблона и компилятору нужно подсказать, что данный вызов -- это не (ошибочное) выражение <code>(m.get_new1) &lt; int...</code>
</li>
<li>
<code>get_new2</code> -- это статическая функция-член, при вызове из <code>f</code>, ее имя должно быть предварено все тем же квалификатором <code>template</code> по тем же причинам.
</li>
<li>
А вот <code>get_new3</code> -- друг класса <code>Alloc</code>, привносит в наш пример некоторые проблемы. Дело в том, что он используется в <code>f</code> <i>до</i> его определения в классе <code>Alloc</code> (точно так же, как я использую до их определения функции <code>get_new1</code> и <code>get_new2</code>). Чтобы определение <code>f</code> было корректным, мы должны гарантировать, что имя <code>get_new3</code> известно в точке определения <code>f</code> как имя функции-шаблона. Дабы не ограничивать общность <code>f</code>, я не использовал в точке (1) прототип конкретной <code>get_new3</code> -- друга класса <code>Alloc</code>, а просто описал (даже не определил!) некоторую функцию-шаблон <code>get_new3</code>. Очевидно, что она не может быть использована в <code>f</code> -- она просто делает вызов
<pre>p3=get_new3&lt;int&gt;(m);</pre>
легальным, внося в область видимости нужное имя-шаблон. Обратите внимание, что описанная в точке (1) функция <code>get_new3</code> не имеет параметров и не возвращает никакого значения. Это сделано для того, чтобы она не принималась во внимание при выборе подходящей (возможно перегруженной) <code>get_new3</code>, в точке ее вызова в функции <code>f</code>.
</li>
</ol>
Как видите, в случае функции-друга я был вынужден использовать не совсем красивый трюк, т.к. C++ не позволяет мне прямо выразить то, что я хотел, а именно: написать
<pre>p3=template get_new3&lt;int&gt;(m);</pre>
К сожалению, приходится констатировать, что использование квалификатора <code>template</code> не было в достаточной мере продумано комитетом по стандартизации C++.

<hr>

<a name="notes1"></a>
<center><h3>Оптимизация</h3></center>

Поговорим об оптимизации.
<p>
Что нужно оптимизировать? Когда? И нужно ли вообще? В этих вопросах легко заблудиться, если с самого начала не выбрать правильную точку зрения. Взгляд <i>со стороны пользователя</i>, все сразу ставит на свои места:
<ol>
<li>Программа должна делать то, что от нее требуется.</li>
<li>Она должна это делать хорошо.</li>
</ol>
Именно так: глупо оптимизировать неправильно работающий код. Если же пользователя устраивает текущее быстродействие -- не стоит искать неприятности.
<p>
Итак, анализ проведен, решение принято -- ускоряемся! Что может ускорить нашу программу? Да все, что угодно; вопрос поставлен некорректно. Что может <i>существенно</i> ускорить нашу программу? А вот над этим уже стоит подумать.
<p>
Прежде всего, стоит подумать о "внешнем" ускорении, т.е. о не приводящих к изменению исходного кода действиях. Самый широкораспространенный метод -- использование более мощного "железа". Увы, зачастую это не самый эффективный способ. Как правило, гораздо большего можно добиться путем правильного конфигурирования того, что есть. Например, работа с БД -- практически всегда самое узкое место. Должно быть очевидно, что правильная настройка сервера БД -- это одно из самых важных действий и за него всегда должен отвечать компетентный специалист. Вы будете смеяться, но грубые оплошности админов происходят слишком часто, чтобы не обращать на них внимание (из моей практики: неоднократно время работы приложения уменьшалось с нескольких часов до нескольких минут (!) из-за очевидной команды <code>UPDATE STATISTICS</code>; фактически, перед анализом плана испонения тяжелых SQL-запросов всегда полезно невзначай поинтересоваться актуальностью статистики. Не менее частым происшествием является "случайная потеря" индекса важной таблицы в результате реорганизации или резервного копирования БД).
<p>
Коль скоро среда исполнения правильно сконфигурирована, стоит обратить внимание непосредственно на код. Очевидно, что максимальная скорость эскадры определяется скоростью самого медленного корабля. Он-то нам и нужен. Если "эскадрой" является набор SQL-запросов работающего с БД приложения, то, как правило, никаких трудностей с определением узких мест не возникает. Трудности возникают с определением узких мест "обычных" приложений.
<p>
Узкие места нужно искать <i>только</i> с помощью объективных измерений, т.к. интуиция в данной области чаще всего не срабатывает (не стоит утверждать, что не работает вообще). Причем измерять относительную производительность имеет смысл только при "релиз"-настройках компилятора (при отключенной оптимизации узкие места могут быть найдены там, где их нет. Увы, данного рода ошибки допускают даже опытные программисты) и на реальных "входных данных" (так, например, отличные сравнительные характеристики в сортировке равномерно распределенных <code>int</code>, отнють не гарантируют отличную работу на реальных ключах реальных данных). Действительно серьезным подспорьем в поиске узких мест являются профайлеры -- неотъемлемая часть любой профессиональной среды разработки.
<p>
Когда критический участок кода локализован, можно приступать к непосредственному анализу. С чего начать? Начинать нужно с самых ресурсоемких операций. Как правило, по требуемому для исполнения времени, операции легко разделяются на слои, отличающиеся друг от друга на несколько порядков:
<ol>
<li>работа с внешними устройствами</li>
<li>системные вызовы</li>
<li>вызовы собственных функций</li>
<li>локальные управляющие структуры</li>
<li>специальный подбор команд и оптимальное использование регистров</li>
</ol>
Например, не стоит заниматься вопросами размещения управляющей переменной цикла в соответствующем регистре процессора, если в данном цикле происходит обращение к диску. Вызовы собственных функций существенно отличаются от системных вызовов тем, что когда мы обращаемся к системе, происходит переключение контекста потока (системный код имеет больше привилегий, обращаться к нему можно только через специальные шлюзы) и <i>обязательная</i> проверка достоверности переданных аргументов (например, система проверяет действительно ли ей передана корректная строка путем ее посимвольного сканирования; если при этом произойдет нарушение прав доступа или ошибка адресации, то приложение будет об этом проинформировано; тем самым исключается возможность сбоя внутри ядра системы, когда неясно что делать и кто виноват; наиболее вероятный результат -- blue death screen, system trap и т.д., т.е. невосстановимый сбой самой системы).
<p>
Как правило, только в исключительных случаях заметного ускорения работы можно достичь путем локальных улучшений (которыми пестрят древние наставления: <code>a+a</code> вместо <code>2*a</code>, <code>register int i;</code> и т.д.), современные компиляторы прекрасно справляются с ними без нас (вместе с тем, генерация компилятором недостаточно оптимального кода "в данном конкретном месте" все еще не является редкостью). Серьезные улучшения обычно приносит только изменение алгоритма работы.
<p>
Первым делом стоит обратить внимание на сам алгоритм (классическим примером является сортировка с алгоритмами O(N*N), O(N*log(N)) и O(N*M) стоимости или выбор подходящего контейнера). Но не попадите в ловушку! Память современных компьютеров уже не является устройством произвольного доступа, в том смысле, что промах мимо кэша при невинном обращении по указателю может обойтись <i>гораздо</i> дороже вызова тривиальной функции, чей код уже попал в кэш. Известны случаи, когда изменение прохода большой двумерной матрицы с последовательного построчного на "обманывающий" кэш постолбцовый замедляло работу алгоритма в несколько раз!
<p>
Если же принципиальный алгоритм изначально оптимален, можно попробовать использовать замену уровней ресурсоемкости. Классическим примером является все то же кэширование. Например вместо дорогостоящего считывания данных с диска, происходит обращение к заранее подготовленной копии в памяти, тем самым мы переходим с первого уровня на второй-третий. Стоит отметить, что техника кэширования находит свое применение не только в работе с внешними устройствами. Если, например, в игровой программе узким местом становится вычисление <code>sin(x)</code>, то стоит подумать об использовании заранее рассчитанной таблицы синусов (обычно достаточно 360 значений типа <code>int</code> вместо потенциально более дорогой плаваючей арифметики). Более "прикладной" пример -- это длинный <code>switch</code> по типам сообщений в их обработчике. Если он стал узким местом, подумайте об использовании таблицы переходов или хэширования (стоимость O(1)) или же специальной древовидной структуры (стоимость O(log(N))) -- существенно лучше O(N), обычно обеспечиваемого <code>switch</code>. Ну а про возможность использования виртуальной функции вместо <code>switch</code> я даже не стану напоминать.
<p>
Все эти замечания применимы в равной степени к любому языку. Давайте посмотрим на что стоит обратить внимание программистам на C++.
<p>
Прежде всего, стоит отметить, что все более-менее существенные маленькие хитрости собственно C++ уже были рассмотрены в предыдущих примерах, так же как и скрытые накладные расходы. Быть может, за кадром осталась только возможность "облегченного вызова функции", т.к. она является не частью (стандартного) C++, а особенностью конкретных реализаций.
<p>
C++ как и C при вызове функции размещает параметры в стеке. Т.е. имея параметр в регистре, компилятор заносит его в стек, вызывает функцию, а в теле функции опять переносит параметр в регистр. Всего этого можно избежать использовав соответствующее соглашение вызова (в некоторых реализациях используется зарезервированное слово  <code>_fastcall</code>), когда параметры перед вызовом размещаются непосредственно в регистрах, исключая тем самым ненужные стековые операции. Например в простом тесте:
<pre>void f1(int arg)
{
 Var+=arg;
}

void _fastcall f2(int arg)
{
 Var+=arg;
}</pre>
функция <code>f1()</code> работала на 50% медленнее. Конечно, реальную выгоду из этого факта можно получить только при массовом использовании функций облегченного вызова во всем проекте. И эта совершенно бесплатная разница может быть достаточно существенной.
<p>
Еще один немаловажный фактор -- размер программ. Откуда взялись все эти современные мегабайты? Увы, большая их часть -- мертвый код, реально, более 90% загруженного кода никогда не будет вызвано! Не беда, если эти мегабайты просто лежат на диске, реальные трудности появляются, когда вы загружаете на выполнение несколько таких монстров. Падение производительности системы во время выделения дополнительной виртуальной памяти может стать просто катастрофическим.
<p>
Если при разработке большого проекта изначально не придерживаться политики строгого определения зависимостей между исходными файлами (и не принимать серьезных мер для их минимизации), то в итоге, для успешной линковки будет необходимо подключить слишком много мусора из стандартного инструментария данного проекта. В несколько раз больше, чем полезного кода. Из-за чего это происходит? Если функция <code>f()</code> из <code>file1.cpp</code> вызывает <code>g()</code> из <code>file2.cpp</code>, то, очевидно, мы обязаны подключить <code>file2.cpp</code> к нашему проекту. При этом, если не было принято специальных мер, то в <code>file2.cpp</code> почти всегда найдется какая-нибудь <code>g2()</code>, как правило не нужная для работы <code>g()</code> и вызывающая функции еще какого-либо файла; и пошло-поехало... А когда каждое приложение содержит свыше полусотни исходных файлов, а в проекте несколько сотен приложений, то навести порядок постфактум уже не представляется возможным.
<p>
Отличное обсуждение локальных приемов оптимизации можно найти у Paul Hsieh <a href="http://www.azillionmonkeys.com/qed/optimize.html">"Programming Optimization"</a>. Не очень глубокий, а местами и откровенно "слабый", но, тем не менее, практически полезный обзор более высокоуровневых техник представлен в книге Steve Heller <a href="http://www.steveheller.com/opt/">"Optimizing C++"</a>.

<hr>

<a name="notes2"></a>
<center><h3>Макросы</h3></center>

В C++ макросы не нужны! До боли знакомое высказывание, не так ли? Я бы его немного уточнил: не нужны, если вы не хотите существенно облегчить себе жизнь.
<p>
Я полностью согласен с тем, что чрезмерное и необдуманное использование макросов может вызвать большие неприятности, особенно при повторном использовании кода. Вместе с тем, я не знаю ни одного средства C++, которое могло бы принести пользу при чрезмерном и необдуманном его использовании.
<p>
Итак, когда макросы могут принести пользу?
<ol>
<li>
Макрос как надъязыковое средство. Хороший примером является простой, но удивительно полезный отладочный макрос <code>_VAL_</code>, выводящий имя и значение переменной:
<pre>#define _VAL_(var) #var "=" &lt;&lt; var &lt;&lt; " "</pre>
Надъязыковой частью здесь является работа с переменной как с текстом, путем перевода имени переменной (оно существует только в исходном коде программы) в строковый литерал, реально существующий в коде бинарном. Данную возможность могут предоставить только макросы.
</li>
<p>
<li>
Информация о текущем исходном файле и строке -- ее пользу при отладке трудно переоценить. Для этого я использую специальный макрос <code>_ADD_</code>. Например:
<pre>	cout&lt;&lt;_ADD_("Ошибка чтения");</pre>
выведет что-то вроде
<pre>Ошибка чтения &lt;file.cpp:34&gt;</pre>
А если нужен перевод строки, то стоит попробовать
<pre>	cout&lt;&lt;"Ошибка чтения" _ADD_("") "\n";</pre>
Такой метод работает, потому что макрос <code>_ADD_</code> возвращает строковый литерал. Вроде бы эквивалентная функция
<pre>	char* _ADD_(char*);</pre>
вполне подошла бы для первого примера, но не для второго. Конечно, для вывода в <code>cout</code> это не имеет никакого значения, но в следующем пункте я покажу принципиальную важность подобного поведения.
<p>
Рассмотрим устройство <code>_ADD_</code>:
<pre>#define _ADD_tmp_tmp_(str,arg) str " &lt;" __FILE__ ":" #arg "&gt;"
#define _ADD_tmp_(str,arg) _ADD_tmp_tmp_(str,arg)
#define _ADD_(str) _ADD_tmp_(str,__LINE__)</pre>
Почему все так сложно? Дело в том, что <code>__LINE__</code> в отличие от <code>__FILE__</code> является числовым, а не строковым литералом и чтобы привести его к нужному типу придется проявить некоторую смекалку. Мы, конечно, не можем написать:
<pre>#define _ADD_(str) str " &lt;" __FILE__ ":" #__LINE__ "&gt;"</pre>
т.к. <code>#</code> может быть применен только к аргументу макроса. Решением является передача <code>__LINE__</code> в виде параметра некоторому вспомогательному макросу, но очевидное
<pre>#define _ADD_tmp_(str,arg) str " &lt;" __FILE__ ":" #arg "&gt;"
#define _ADD_(str) _ADD_tmp_(str,__LINE__)</pre>
не работает: результатом <code>_ADD_("Ошибка чтения")</code> будет
<pre>"Ошибка чтения &lt;file.cpp:__LINE__&gt;"</pre>
что нетрудно было предвидеть. В итоге мы приходим к приведенному выше варианту, который обрабатывается препроцессором следующим образом: <code>_ADD_("Ошибка чтения")</code> последовательно подставляется в
<pre>_ADD_tmp_("Ошибка чтения",__LINE__)
_ADD_tmp_tmp_("Ошибка чтения",34)
"Ошибка чтения" " &lt;" "file.cpp" ":" "34" "&gt;"
"Ошибка чтения &lt;file.cpp:34&gt;"</pre>
</li>
<p>
<li>
Получение значения числового макроса в виде строки. Как показывает практика, данная возможность находит себе применение и за пределами подробностей реализации "многоэтажных" макросов. Допустим, что для взаимодействия с SQL-сервером у нас определен класс <code>DB::Query</code> с соответствующей функцией
<pre>void DB::Query::Statement(const char *);</pre>
и мы хотим выбрать все строки некоторой таблицы, имеющие равное некому "магическому числу" поле <code>somefield</code>:
<pre>#define FieldOK 7
// ...
DB::Int tmp(FieldOK);
q.Statement(" SELECT * "
            " FROM sometable "
            " WHERE somefield=? "
);
q.SetParam(), tmp;</pre>
Излишне многословно. Как бы это нам использовать <code>FieldOK</code> напрямую? Недостаточно знакомые с возможностями макросов программисты делают это так:
<pre>#define FieldOK 7
// ...
#define FieldOK_CHAR "7"
// ...
q.Statement(" SELECT * "
            " FROM sometable "
            " WHERE somefield=" FieldOK_CHAR
);</pre>
В результате чего вы получаете все прелести синхронизации изменений взаимосвязанных наборов макросов со всеми вытекающими из этого ошибками. Правильным решением будет
<pre>#define FieldOK 7
// ...
q.Statement(" SELECT * "
            " FROM sometable "
            " WHERE somefield=" _GETSTR_(FieldOK)
);</pre>
где <code>_GETSTR_</code> определен следующим образом:
<pre>#define _GETSTR_(arg) #arg</pre>
Кстати, приведенный пример наглядно демонстрирует невозможность полностью эквивалентной замены всех числовых макросов на принятые в C++
<pre>const int FieldOK=7;
enum { FieldOK=7 };</pre>
макрос <code>_GETSTR_</code> не сможет с ними работать.
</li>
<p>
<li>
Многократно встречающиеся части кода. Рассмотрим еще один пример из области работы с SQL-сервером. Предположим, что нам нужно выбрать данные из некоторой таблицы. Это можно сделать в лоб:
<pre>struct Table1 {  // представление данных таблицы
       DB::Date  Field1;
       DB::Int   Field2;
       DB::Short Field3;
};

void f()
{
 Table1 tbl;
 DB::Query q;
 q.Statement(" SELECT Field1, Field2, Field3 "
             " FROM Table1 "
 );
 q.BindCol(), tbl.Field1, tbl.Field2, tbl.Field3;
 // ...
}</pre>
И этот метод действительно работает. Но что, если представление таблицы изменилось? Теперь нам придется искать и исправлять все подобные места -- чрезвычайно утомительный процесс! Об этом стоило позаботиться заранее:
<pre>#define TABLE1_FLD      Field1, Field2, Field3
#define TABLE1_FLD_CHAR "Field1, Field2, Field3"

struct Table1 {  // представление данных таблицы
       DB::Date  Field1;
       DB::Int   Field2;
       DB::Short Field3;

       // вспомогательная функция
       void BindCol(DB::Query&amp; q) { q.BindCol(), TABLE1_FLD; }
};

void f()
{
 Table1 tbl;
 DB::Query q;
 q.Statement(" SELECT " TABLE1_FLD_CHAR
             " FROM Table1 "
 );
 tbl.BindCol(q);
 // ...
}</pre>
Теперь изменение структуры таблицы обойдется без зубовного скрежета. Стоит отметить, что в определении <code>TABLE1_FLD_CHAR</code> я не мог использовать очевидное <code>_GETSTR_(TABLE1_FLD)</code>, т.к. <code>TABLE1_FLD</code> содержит запятые. К сожалению, данное печальное ограничение в примитивном препроцессоре C++ никак нельзя обойти.
</li>
<p>
<li>
Многократно встречающиеся подобные части кода. Представим себе, что мы пишем приложение для банковской сферы и должны выбрать информацию по некоторым счетам. В России, например, счет состоит из многих полей, которые для удобства работы собирают в специальную структуру, а в таблице он может быть представлен смежными полями с одинаковым префиксом:
<pre>q.Statement(" SELECT Field1, AccA_bal, AccA_cur, AccA_key, AccA_brn, "
            " AccA_per, Field2 "
            " FROM Table1 "
);
q.BindCol(), tbl.Field1, tbl.AccA.bal, tbl.AccA.cur, tbl.AccA.key,
             tbl.AccA.brn, tbl.AccA.per, tbl.Field2;
// ...</pre>
Можете себе представить, сколько писанины требуется для выбора четырех счетов (<code>tbl.AccA</code>, <code>tbl.AccB</code>, <code>tbl.KorA</code>, <code>tbl.KorB</code>). И снова на помощь приходят макросы:
<pre>#define _SACC_(arg) #arg"_bal, "#arg"_cur, "#arg"_key, "#arg"_brn, " \
                    #arg"_per "
#define _BACC_(arg) arg.bal, arg.cur, arg.key, arg.brn, arg.per

// ...

q.Statement(" SELECT Field1, " _SACC_(AccA) " , Field2 "
            " FROM Table1 "
);
q.BindCol(), tbl.Field1, _BACC_(tbl.AccA), tbl.Field2;
// ...</pre>
Думаю, что комментарии излишни.
</li>
<p>
<li>
Рассмотрим более тонкий пример подобия. Пусть нам потребовалось создать таблицу для хранения часто используемой нами структуры данных:
<pre>struct A {
       MyDate Date;
       int    Field2;
       short  Field3;
};</pre>
Мы не можем использовать идентификатор <code>Date</code> для имени столбца таблицы, т.к. <code>DATE</code> является зарезервированным словом SQL. Эта проблема легко обходится с помощью приписывания некоторого префикса:
<pre>struct TableA {
       DB::Date  xDate;
       DB::Int   xField2;
       DB::Short xField3;

       TableA&amp; operator=(A&amp;);
       void Clear();
};</pre>
А теперь определим функции-члены:
<pre>TableA&amp; TableA::operator=(A&amp; a)
{
 xDate=ToDB(a.Date);
 xField2=ToDB(a.Field2);
 xField3=ToDB(a.Field3);

 return *this;
}

void TableA::Clear()
{
 xDate="";
 xField2="";
 xField3="";
}</pre>
Гарантирую, что если <code>TableA</code> содержит хотя бы пару-тройку десятков полей, то написание подобного кода вам очень быстро наскучит, мягко говоря! Нельзя ли это сделать один раз, а потом использовать результаты? Оказывается можно:
<pre>TableA&amp; TableA::operator=(A&amp; a)
{
// используем склейку лексем: ##
#define ASS(arg) x##arg=ToDB(a.arg);
 ASS(Date);
 ASS(Field2);
 ASS(Field3);
#undef ASS

 return *this;
}

void TableA::Clear()
{
#define CLR(arg) x##arg=""
 CLR(Date);
 CLR(Field2);
 CLR(Field3);
#undef CLR
}</pre>
Теперь определение <code>TableA::Clear()</code>по <code>TableA::operator=()</code> не несет никакой нудной работы, если, конечно, ваш текстовый редактор поддерживает команды поиска и замены. Так же просто можно определить и обратное присваивание: <code>A&amp; A::operator=(TableA&amp;)</code>.
</li>
</ol>
Надеюсь, что после приведенных выше примеров вы по-новому посмотрите на роль макросов в C++.

<hr>

Copyright &copy; <a href="mailto:derevyago@yahoo.com">С. Деревяго</a>, 2000-2004
<p>
Никакая часть данного материала не может быть использована в коммерческих целях без письменного разрешения автора.
`T(*e)(int(3));`	эквивалентно	`T* e(int(3));`	То, что инициализация указателя с помощью `int` запрещена, синтаксичестим анализатором не принимается во внимание: будет распознано объявление указателя и выдана ошибка.
`T(f)[4];`	эквивалентно	`T f[4];`
`T(a);`	эквивалентно	`T a;`
`T(a)=m;`	эквивалентно	`T a=m;`
`T(*b)();`	объявление указателя на функцию.
`T(x),y,z=7;`	эквивалентно	`T x,y,z=7;`