среда, 27 сентября 2006 г.

Сетевая букинистика

Ради упрощения изложения постулируем ряд очевидных утверждений:

1) уничтожение информации – худший сорт вандализма;
2) ценность информации не зависит от формы ее представления;
3) однако от формы представления информации всецело зависят технологии ее обработки.

Сомнения у критически настроенного читателя может вызвать разве что первое утверждение. Однако требуется совсем немного подумать, чтобы понять, что с потерей любого материального памятника ничего, кроме него самого, не теряется, в то время как в случае потери информации гибнет все. Возьмите для примера Стоунхэндж, или письменность майа. Что, спрашивается, важнее – наличие живого и здорового памятника, или информация о нем? В качестве контрпримера вспомним храм Христа Спасителя, который сначала взорвали, а потом восстановили, потому что информации о том, каким он был, хватало. С пирамидами, случись их кому-то взорвать, этот номер не пройдет. Как не прошел этот номер, увы, и с плохо описанной при жизни Сухаревой башней.

Да и вообще. Если уж у нас информационное общество, извольте относиться к информации с тем же трепетом, с каким относились в индустриальную эпоху к продукции машиностроения, скажем, к «Мерседесу». В частности, распространяйте на информацию заповеди «не убий» и «не укради».


Для информации в бумажной форме ее представления соблюдение заповедей худо-бедно обеспечивается. Библиотечное дело – целая отрасль, со своей культурой и традициями. В Российской Государственной библиотеке на предмет борьбы с вандалами дежурит у входа милиционер. И правильно делает, потому что среди москвичей есть те, кто жалеют 10 копеек за лист ксерокопии и предпочитают вырывать листы из книг. Это настолько ясно, даже интернетоборец Лужков спорить не станет. Однако как только информация оставляет свою бумажную форму и становится электронной, за ее судьбу, вот ведь странно, никто ни перед каким милиционером более не отвечает.

Поясним на примере того же Лужкова, который наверняка не стал бы приветствовать идею вечного хранения первоначального содержимого сайта lujkov.ru. Спрашивается, почему? Не страшнее же это, чем «Майн кампф». Переместить в спецхран – куда ни шло, но уничтожать... Безусловный вандализм. Эти соображения справедливы также в отношении «Кавказ-центра» и вообще любого ресурса, каким бы он ни был. Не надо осложнять работу будущих историков, тем более что в наш просвещенный век никаких технических проблем с хранением данных нет.

Но что нам здравый смысл! С нами может справиться только инструкция и надзирающий за ее исполнением милиционер. А до тех пор, пока в отношении публичной электронной информации не действует никакая законная защита, любой гражданин вправе принять посильное участие в актах вандализма. Как это происходит, например, в тех же «Известиях»: чтобы масса сведений оказалась вне зоны доступа, достаточно было всего-то угробить поиск по сайту. Вы представляете, чтобы в РГБ изъяли подшивки газеты только из-за того, что она сменила макет? А вот при смене дизайна сайта проделать такую штуку не проблема. Даже онлайн-издания умудряются лишить пользователя доступа к архивам. Пример – «Спорт сегодня». Гридасов, правда, обещает вернуть людям свое культурное наследие, но когда именно, сам не знает.

Видимо, нам нужна вертикальная власть и Путин на третьем сроке, чтобы сделать что-то подобное World Digital Library. Сами мы в одной отдельно взятой редакции не понимаем, что, тщательно оберегая информацию, помогаем обществу.

У геополитического супостата с бережным отношением к информации все, заметим, в порядке. Google оцифровывает бумагу еще с 2004-го года, причем делает это и за себя, и за того парня. Несмотря на то, это даже не рынок, а, скорее, меценатство, Microsoft здесь тоже присутствует. Не слишком отстают галлы, желающие защитить свою письменность от наглых американцев – вслед за патриотическим выступлением президента Франции Жака Ширака они открыли против Google свой цифровой фронт на базе французского цифрового архива Gallica.

Из сказанного вытекает, в частности, небесперспективность коллекционирования сетевого антиквариата. В восьмидесятых ушлые японцы малую часть только что сошедших с конвейера автомобилей герметично, как ветчину, паковали в полиэтилен и отправляли на склад с идеей лет через 100 дорого продать коллекционерам. Не исключено, что досужему человеку имеет смысл консервировать нынешний Рунет. Кто знает, сколько через четверть века будут стоить диски (чипы?) с исчезнувшими ресурсами? Скажем, kremlin.ru за 2008-й год. Или «Пресс-центр Михаила Ходорковского». Или Ежелист-2000. Да мало ли чем станут торговать на Кузнецком мосту ближе к концу века.

Закончим описанием немногих доступных приемов, которые иной раз помогают извлечь из небытия сайты и веб-страницы. Прежде всего, кэш Google. Иной раз с его помощью можно парировать 404-й удар судьбы. Второй способ возвращения утраченного – Archive.org, он же Internet Archive, он же Wayback Machine. Похож он скорее на коллекцию минералов, чем на природный парк - но все лучше, чем ничего. Вероятность успешного поиска исчезнувших ресурсов далека от единицы (архивирование поневоле выборочно, не создашь же копию Интернета), но и не равна нулю. Недавно Internet Archive, кстати, начал еще и книги оцифровывать на некоммерческой основе - справедливо решив, что IT-гигантам вроде Google и Microsoft нельзя доверить "приватизацию" человеческих знаний.

Возможно, есть и другие археологические приемы подъема данных с погибших или покалеченных сайтов, но я о них ничего не знаю. Если знаете вы – откомментируйте, пожалуйста.

Автор: Андрей Анненков.

Комментарии:

27.09.2006 10:56
Jack
Смотрел я свой сайт трёхлетней давности на Archive.org - структуру сайта показывает, но сайт начинался с русской версии, а посему весь контекст не читабелен:-( , хотя некоторые страницы на английском языке выдаёт хорошо.
Archive.org расчитан на англоязычный контекст, если кто-нибудь сделает такую фишку на русском, то это будет неплохо:-)

27.09.2006 13:48
Эдзо Хогусава
Про постулацию простых утверждений:
Если к вашим трем добавить еще один: "ценность информации обратно пропорциональна её доступности и количеству" - то многие вопросы отпадут сами по себе. Правда это категории уже скорее человеческие-психологические, но от того они еще важнее, так как разговор всё же про информацию и людей, а не про инф. и машины. Именно люди готовы не ценить (и похерить по ходу дела) информацию, потому что её очень много.
Сильно ли вы цените свою музыку в MP3 или архив ибуксов? Если очередной винт навернется с музыкой, фильмами и книжками с lib.ru, пойдете ли вы в сервис восстанавливать за сотни кровнозаработанных, или подумаете "черт с ним, завтра снова скачаю!". Тем не менее если там были ваши фотографии с прошлого года (вами же и отснятые), или диссертация - то бегом в сервис, аккуратненько завернув винт в три упаковки, чтоб по пути не убить окончательно.
А по поводу вандализма - как раз примеров из индустриальной (и доиндустриальной тем более) эпохи выше крыши: если ты уничтожаешь собственность врага (ну или недруга) - то ты если не герой, то уже почти друг. А собирать что-то и сохранять сейчас - это уже что-то из практик "тактической реальности", а также усложнение жизни министерствам правды ;-)

27.09.2006 17:14
Анненков
Я не знаю, что такое "ценность информации" (на известную статью Харкевича кивать не надо, читал). Что такое "количество информации", тоже не знаю (к Шеннону тоже отсылать не надо, читал). Но даже если трактовать эти словосочетания так, как требует естественный смысл слов, все равно ваш постлат не выдержит критики. Хотя бы потому, что шесть байт "cancer" в медицинской книжке для кого-то содержат не меньшее количество информации, нежели вся библиотека Конгресса.

27.09.2006 17:20
Анненков
Ах нет, сорри :)) Не заметил, что _обратно_ пропорционально :)

27.09.2006 19:27
Эдзо Хогусава
Угу! Кстати может у пофигистов из Известий и иже с ними проявляется эффект отрыва "создателя от результатов его труда с последующей его денрадацией". Сложно представить себе Гоголя случайно сжигающего свои мертвые души. (Кавычки в названиях ставить наверное не буду :-} )
PS Харкевича и Шеннона не чиатал, если поделитесь "ссылками", то эти буковки станут для меня намного ценнее :-)

27.09.2006 20:29
Невер
А есть же ХАРТИЯ О СОХРАНЕНИИ ЦИФРОВОГО НАСЛЕДИЯ (ЮНЕСКО) (www.ifap.ru/ofdocs/digit.htm). Там как раз и говорится, что среднее жизни веб-страницы в сети достаточно мало (месяц с небольшим), поэтому ЮНЕСКО всех призывает что-то делать, чтобы сохранить цифровое наследие.
Ясно, что, в первую очередь, государство должно озаботиться национальным цифровым наследием и принять все возможные меры для его сохранения.
Кроме того, могли бы и некие частные фонды здесь что-то предпринять - сохранить для общества будущего (для народа) нечто ценное (по мнению экспертов этих фондов).
Однако, не верю я, что наши богатые и власть имущие соотечественники думают о будущем народа, пекутся о нем - им хочется самим насладиться своим богатством и властью, а что после них останется - им это не интересно (души у них если и были когда живые, то сейчас уж точно мертвые). Единицы только могут устоять против денег и власти - сохранить и развить в себе человеческое (читай духовное).
Поэтому, народ сам должен о себе позаботиться, чтобы сохранить себя, в том числе и свое цифровое наследие.

28.09.2006 14:11
Анненков
Ага, спасибо, раньше не видел. Декларировать и поднимать шум они (ЮНЕСКО т.е.) мастера

02.10.2006 02:06
Неизвестный
Что касается библиотек, особенно государственных, то там уже давно не 10 коп. за лист(если точно, то в Ленинке 4 руб. 50 коп., кто не верит: http://www.rsl.ru/index.php?doc=610). Учитывая, что согласно правилам библиотеки я могу либо переписывать все от руки, либо сохранять в памяти на долгие годы, либо ксерокопировать у них за 4,50(450 руб. за 100 листов кто не понял; дешевле купить новую/старую книгу целиком, да вот только где ее найдешь). Короче, пора бы ФАС заняться этой темой. Но это все оффтопик, а что касается касается проблемы сохранения информации - мы живем в современном обществе:
Собираются энтузиасты(хотя бы на форуме), создают общественную организацию(лучше как юридическое лицо, но изначально можно и без таких формальностей), скидываются (потом можно и спонсоров поискать, а изначально лучше даже и не деньгами, а исключительно своим собственным трудом) и создается всем нужный сетевой ресурс. Если обществу это действительно нужно, то всегда можно добиться от него поддержки(при условии вменяемости энтузиастов).
Только где они эти вменяемые энтузиасты?..

31.10.2006 21:08
Cromwell
>> ценность информации не зависит от формы ее представления
Недавно вышла очень интересная книга французского историка Роже Шартье "Письменная культура и общество", в которой доказывается обратное. Рекомендую, очень интересная работа! :)

01.11.2006 09:49
Иван Сильвестров
А вот - речи человеческие тоже ведь исчезают бесследно ...
Давайте будем все разгаворы записывать и сохранять для будущих поколений!

01.11.2006 12:25
Олег
>Ради упрощения изложения постулируем ряд очевидных утверждений...
Простите меня Андрей... но для меня, например, эти утверждения не являются ОЧЕВИДНЫМИ....
Если в самом начале изложения в качестве аксиом постулируются утверждения, требующие доказательств, желание читать дальше просто пропадает....
Банальный опыт современного человека говорит о том, что проблемой является не недостаток информации, а информационный мусор... Уничтожение ЛИШНЕЙ информации, с точки зрения рутинной логики для меня, является благом...
Если смотреть на информацию более узко - как на меру снижающую энтропию...(неопределенность), уничтожение информации становится более опасным преступлением, но это реально сложно сделать, потому, что информация в узком научном смысле обладает малым временем полураспада. Она, то есть ее ценность, испаряется сама и очень быстро... каждый кто имел дело с фондовым рынком и с инвестициями знают это на уровне ежедневного опыта....
Что касается формы представления информации...
Ценность (именно ценность) информации в узком смысле от формы конечно не зависит...но вот на уровне жизненного опыта эта фишка просто не проходит...
В книжном магазине можно найти два издания книги Майерса и Брейли "Корпоративные финансы". Издания эти отличаются лишь формой представления (одно из них является подарочным), ну и ценой естественно....Объяснять продавцу этих книг, что форма представления не влияет на ценность - затея пустая...
По существу проблемы - сохранения всех страниц и документов (заметте не информации) появляющихся в Интернете - выгода от сохранения многих из этих документов никогда не превысит затрат на хранение и каталогизацию... а потом с ростом количества информационного хлама реально выудить от туда информацию будет все дороже и сложнее...
Та же информация, которая имеет действительную ценность и длинный период полураспада будет сохраняться естественным образом через ссылки, цитирование, копирование... это как в биологии... ценные гены (читай идеи) сохраняются в популяции через копирование в следующие поколения....
Отдельная страница газеты Ведомости имеет ценность разве что для коллекционера... идеи, написанные там куда более ценны... если так, то они будут реплицированны в сети быстро...очень бытро... более того, они будут скопированы и многократно сохранены...и если вдруг произойдут события, повышающие ценность изложенной там информации...поверьте, их извлекут на свет еще быстрее. В этом и ценность сети... децентрализация - вся суть ее... и решать чисто сетевые проблемы не сетевыми способами - суть бороться с мельницами.....ветряными....




Другие посты по этой теме:



0 коммент.:

Отправить комментарий

Ваш комментарий появится в блоге после проверки администратором