интервью technonews Date: Mon, 21 Nov 2005 16:21:03 +0300 From: Igor Veselov To: moshkow@systud.msk.su Без формуляров Электронная библиотека Максима Мошкова - настоящее явление. В том смысле, что в повседневной жизни мы о ее существовании редко вспоминаем - но при этом всегда, на уровне рефлекса, знаем, куда пойти, если нужно прочитать, законспектировать или процитировать редкую книгу, а времени рыскать по книжным магазинам и "бумажным" библиотекам нет. Создатель популярнейшего ресурса Lib.ru рассказал нам о том, как все начиналось. И о том, каково быть виртуальным библиотекарем в "самой читающей стране". Вас можно поздравить: недавно прошла весть, что ваша библиотека получила грант в один миллион рублей... Да, весть прошла недавно, но грант был выделен еще в мае этого года. Правда, деньги дошли только вчера. Грант выделило Российское агентство по печати. Вам не кажется, что царит атмосфера двойных стандартов: с одной стороны, вам выделяют деньги на государственном уровне, с другой - множество судебных процессов вокруг Lib.ru? Ну, ситуация нормальная. Процессы организует скандальная лавка, известная своим не очень этичным поведением ("Кирилл и Мефодий" - И.В.), а гранты дает государство. Кто с какой стороны, мы видим. На чью же сторону встает закон? Суть последнего разбирательства такова: "КМ" подбила писателя (речь идет об Эдуарде Геворкяне - И.В.), который до этого разрешил мне размещать его книги в библиотеке. Разрешение выдал на словах, а потом подал в суд. В суде заявил, что разрешение должно быть в письменной форме, а слова - они ничего не стоят. Судились мы с ним полтора года, во время суда выяснилось, что права на свою книжку он продал, а значит, ни с кем судиться из-за нее не имеет права. На этом основании суд отказал в имущественных требованиях, зато присудил ему 3000 рублей за обнародование произведения. Правда то, что оно было уже обнародовано в 1983 году, суд во внимание не принял. Поэтому наша тяжба продолжается, и судиться буду до последнего конца. Впрочем, этот молодец судился не только со мной, он еще несколько исков подал. Теперь ему последовательно отказывают во всех делах, что он организовал. А почему нынешний правообладатель не судится с вами? Почему "КМ Онлайн" не пошла в суд, я догадываюсь. Во-первых, доказательства нарушения имущественных прав пришлось бы собирать им самим. Потом, они не могли бы требовать морального ущерба, как требовал Геворкян. В-третьих, они бы все равно проиграли. Но наверняка у "КМ-Онлайн" мощный юридический отдел? Весь их юридический отдел состоит из одной барышни, которая проиграла уже три дела и еще четыре сейчас проиграет - все потому, что она не удосужилась перечитать бумажки заявлений. Суд - это уже последний аргумент в споре. Много ли приходится убирать книг, не доводя дело до суда? За последнее время несколько десятков книг я из библиотеки убрал. За это же время несколько сотен мне прислали читатели и авторы. Счет в нашу пользу. Сейчас в Думе активно обсуждается закон о регулировании Рунета... На каждой сессии в Думе предлагают несколько десятков новых законов. Помнится, был даже закон про пчел. Но до финального принятия доходит примерно один из ста предложенных законов. Например, уже год, как обсуждаются поправки в закон о библиотечном деле. Нынешний закон давно устарел: в частности, в нем не рассмотрены электронные библиотеки, за бортом оставлено множество имущественных вопросов. Год прошел, поправки не приняты, и даже их обсуждение заглохло. Вспоминается история про то, как собирались оцифровать архивы Ленинской библиотеки. Несколько лет назад в "Ленинку" пришла с коммерческим предложением фирма, которая хотела оцифровать миллион книг (всего в "Ленинке" порядка 30 миллионов). На сегодняшний день оцифровано довольно много, несколько десятков тысяч, но до миллиона там еще далеко. Дело постепенно движется. К тому же, в Россию сейчас приходит Google, которая хочет оцифровать все на свете, - я думаю, они договорятся и с "Ленинкой" и с питерской библиотекой. У "Гугля" денег гораздо больше, чем у всех других коммерческих структур, которые приходили в библиотеки. Сервис Google Print, тоже подвергался нападкам сумасшедших адвокатов и нескольких сотен активистов, которые решили посудиться. С Google судиться всегда выгодно: если тем станет лень, они запросто могут просто откупиться от истцов. На Google Print, в отличие от вашей библиотеки, выложены не оцифрованные тексты, а отсканированные страницы в виде картинок. Какой подход, по-вашему, прогрессивнее? Прогрессивнее то, что работает. Одну книжку лучше распознать, но вот когда их миллионы, - приходится выкладывать как есть. Это все-таки лучше, чем если бы этих книг в Сети не было совсем. Но для индексации их все равно приходится переводить в текст. С распространением электронных библиотек остро встает проблема подлинности. Неизбежно возникают ошибки, опечатки, разночтения. Как устанавливается идентичность электронной и бумажной версий? Есть только одно решение, но оно не универсально. По-хорошему, каждый писатель должен быть представлен в интернете. На своем сайте он должен размещать те книги, которые считает нужным представить - они и будут цифровыми оригиналами. Это единственный способ избавить публику от разных версий непонятно какого качества. Люди будут знать, какие книги написал ты, а не твои подражатели, сколько в них страниц и где их можно купить через интернет. Сейчас половина пополнений моей библиотеки - не то, что сканируют читатели, а то, что авторы сами выкладывают. Каждый получает свой логин, пароль и собственный раздел, отображающийся в каталоге библиотеки. Это все касается тех писателей, что уже печатаются. Для тех, чьи книги еще не опубликованы на бумаге, я сделал специальный сайт - "Самиздат" . Там - восемнадцать тысяч человек, 200 тысяч произведений. Темп пополнения "Самиздата" больше чем в 10 раз выше, чем в библиотеке. Каждый день выкладывается около 200 текстов. "Самиздат" - это аналог Proza.ru? Да, только лучше. Во-первых, его делаю я. А во-вторых, его раскручивает моя библиотека, обеспечивая проекту приток читателей. В итоге аудитория в 4-5 раз шире, чем на других подобных сайтах. Плюс к этому, более простое оформление, легче доступ, быстрее все загружается. Часто ли случается, что электронная версия попадает в вашу библиотеку раньше печатной? В основном бывает, что выкладывают книги в интернете, потому что не могут издать на бумаге, а потому вдруг издают. Довольно типичная ситуация, но не единственная. Автор может выложить текст в Сети с целью найти издателя, а может - чтобы иметь онлайн-коллекцию всех своих текстов. Есть переводчики, которые книжки для своего переиздания брали у меня в библиотеке. Были уже случаи, чтобы автор при заключении договора с издательством оговаривал размещение в электронной библиотеке? Я подозреваю, что да, хотя чаще авторы вообще ничего не оговаривают и подписывают такие бумажки, что просто диву даешься. А потом задним числом хватаются за голову. В среднем 95 процентов писателей абсолютно юридически безграмотны. Но оставшиеся 5 процентов - это такие волки, что пообщаться на тему авторского права с ними ужасно интересно. Не жалеете о том, что для поддержания электронной библиотеки пришлось овладеть квалификацией юриста? Менять пути невозможно, как бы этого ни хотелось. Может, жил бы по другому, если б знал, чем все это кончится, но с другой стороны, не жалею. Все-таки судиться с неким писателем по поводу его электронного файла в некоторым смысле лучше, чем с бывшей женой о разделе детей. Все случайности - они и положительны, и отрицательны. На какие цели был выдан грант и каковы представления о его трате у государства и у вас? Все довольно просто. Куплю новые сервера для библиотеки, машину для обработки текстов, несколько сканеров. Найму человека, который будет всесторонне заниматься русской классикой: искать, собирать, заказывать сканирование и все остальное. Оставшиеся деньги заплачу людям, которые будут сканировать книжки, которых не хватает библиотеке. Все-таки миллион рублей - это не та сумма, чтобы ей хвастаться. Пока денег этих нет, я просто сижу и жду, и любую книгу мне могут прислать сейчас либо через десять лет. Из ближайших планов - выложить недостающие книги, присутствующие в школьной программе. Расскажите подробнее о принципе функционирования библиотеки. Есть несколько десятков человек, сканирующих не по одной книжке, а методически. Некоторые отсканировали десятки и сотни мегабайт электронных текстов. Их труды составляют половину наполнения библиотеки. Из оставшегося четверть присылают случайные читатели, которые однажды отсканировали одну книжку. Последняя четверть - это оригинальные книжки от самих писателей. Сколько времени уходит на оцифровку одной книги? Сканирование одного разворота - это 30 секунд. Чтобы просто "прохлопать" книжку, перелистывая страницы, нужно четыре часа. После этого получаем сырой электронный текст с большим количеством ошибок. Его можно отправить прямо так, а можно просмотреть и подправить. Для этого нужно еще часа четыре. В итоге добротное сканирование книги занимает один рабочий день. А если еще заняться сверкой с оригиналом, то уйдет и вовсе три дня. В библиотеку попадают и первые, и вторые, и третьи. Если сканировщик не занимался исправлением ошибок, вы ставите соответствующую пометку? Я смотрю присланный файл, и если с первой же страницы начинается ужас, то помечаю. Например, однажды мне прислали текст, начинавшийся со слов: "Лолита, огонь моих кресел..." Книги от писателей тоже часто содержат ошибки. Авторы иногда присылают "рукописи" текстов, а бывают книги опубликованные, прошедшие корректуру, угробленные редактурой и потом еще криво оцифрованные. Какой из этих вариантов лучше - спорный вопрос. Случается ли публиковать две версии одного текста? Я обычно ухитряюсь опознать, какая из них лучше, и ставлю одну. Вводить разные версии по принципу корректуры я не хочу. Бывают разные переводы, бывает, автор напрочь переписывает книжку и хочет иметь обе версии. Только в этих случаях я публикую два варианта. Есть ли у вас планы заключить договоры с традиционными библиотеками? Для "бумажных" библиотек то, что делаю я, - это заоблачные вершины технологии. У них огромные трудовые ресурсы, время и доступ к книжкам, но почти никто из них не умеет переводить книги в электронный формат. А договоры я заключал. У меня есть договор с Библиотекой имени Ленина: в фонд "Ленинки" я предоставил свою электронную библиотеку. Надо сказать, объемы их электронных хранилищ в десятки раз больше, чем у меня, но они пока не выкладывают это в интернет. Вообще, думаю, пускай лучше у каждой библиотеки будет свой собственный сайт, чем все это будет валиться на мои плечи и мой сервер. Какие вычислительные мощности занимает ваша библиотека? Сейчас она живет на трех серверах. Сама библиотека на одном (самом старом и слабом), второй сервер содержит "Самиздат", а третий сервер обслуживает как библиотеку, так и наш новый проект для художников (http://www.artlib.ru/). Объем самой библиотеки - пять гигабайт. На "Самиздате" литературная часть занимает около двадцати гигабайт, а музыкальная - порядка 150. Планируете ли вы введение новых веб-технологий, вроде XML или RSS? RSS нужен для того, чтобы все желающие узнавали об обновлениях сайта. Эту систему я уже года три назад прикрутил к Lenta.ru, а до библиотеки все руки не доходят. Но в плане это у нас есть, так что сделаем. Возможен ли в будущем вариант, при котором наравне с простыми отсканированными книгами на сайте будут размещены и коммерческие электронные книги в форматах PDF, E-book или других? Я думаю, что так будет рано или поздно, но основное направление развития - это возможность автору самому управлять своим разделом. Сейчас у меня на самоуправлении около 150 разделов. В таком разделе автор может делать все, что захочет. Один из вариантов - когда он кладет в Сеть фрагменты текстов, а самими книгами торгует. Задача - сделать децентрализованную систему. Библиотека должна стать просто местом встречи. Вы рассчитывали на такую популярность, когда создавали электронную библиотеку? Одиннадцать лет назад у меня цель была одна - сделать домашнюю страничку, которую бы хоть кто-нибудь увидел. Я гордился, когда на этот "хомячок" заходило восемнадцать человек в день. О том, что это будет пользоваться спросом, я начал понимать году в 95-м. Живых людей, которым нужна была библиотека, я увидел в 98 году. До этого момента я ориентировался только по счетчикам посещаемости. Где-то с 96 года мне стали присылать книжки. Возможна ли миграция библиотеки в сети Peer-to-peer? Библиотека - это просто коллекция текстов. Как именно она свои тексты раздает читателям, это вопрос технологии. Насколько мне известно, один энтузиаст уже транслирует содержание библиотеки в p2p-сети. Если слишком сильно будет мешать копирайт, можно уйти туда. На западе почти все уже ушли. Насколько влиятельно сообщество, сложившееся вокруг Lib.ru? Для меня это просто источник информации. Так, чтобы все дружно встали и пошли гурьбой защищать библиотеку Мошкова, - этого я не замечал. В интернет-сообществе "За Lib.ru" есть несколько адвокатов, готовых проконсультировать или даже поучаствовать в деле. Но мне достаточно знать, что библиотека многим нужна и почти все к ней относятся с симпатией. А с проблемами я справлюсь и сам. ╘ Игорь Веселов