Храмцовская Наталья Александровна,
ведущий эксперт по управлению документацией,
член Гильдии управляющих документацией и ARMA International,
"Электронные Офисные Системы" (ЭОС)

Опубликовано на сайте CNews

Электронный документооборот в России становится все более распространенным. E-документы уже активно использует бизнес, на электронную форму работы переходят суды. И это только начало. В ближайшее время архивам придется принять тысячи, миллионы, и, возможно, миллиарды e-документов. Хранить их нужно будет на протяжении многих лет, не нарушая при этом целостности, аутентичности, сохраняя информацию, которая может понадобиться в любое время. А это неизбежно вызовет массу проблем.

Тема "электронного правительства", электронного документооборота, электронных библиотек, счетов-фактур и документов в последнее время стала довольно популярной. Руководство страны, кажется, осознало, что государственное управление, – какие бы технологии при этом не использовались, - осуществляется посредством документов, а не просто информации; и что для того, чтобы "догнать и перегнать" другие капиталистические страны в области "электронного правительства" и "электронной коммерции", нужно срочно решать правовые и технические проблемы, сдерживающие электронный документооборот.

Однако, сказав "А", неизбежно придется сказать и "Б". Использование в государственном управлении и в коммерческой деятельности электронных документов неизбежно приводит к тому, что какие-то из них придется хранить достаточно долго (а в электронном мире "долго" означает более 5-7 лет). Можно, конечно, еще какое-то время "прятать голову в песке", но рано или поздно проблему долговременного и постоянного хранения электронных документов, проблему создания электронных архивов придется решать.

Удивительно, но факт: уже сейчас существуют крупные государственные базы данных, которым установлен постоянный срок хранения, хотя никто не потрудился объяснить государственным органам - владельцам этих баз - что и как они должны сохранить и какими способами будет обеспечиваться юридическая значимость сохраняемой информации и документов. Одновременно наблюдается стойкое нежелание заниматься проблемами электронных архивов на государственном уровне.

Чтобы оценить объемы информации, можно привести два примера из жизни американских архивов. Так, на конец 2007 года в 36 филиалах и подразделениях национальных архивов США на постоянном хранении находилось 3,5 млрд электронных документов. Что касается электронного архива штата Вашингтон, то если в январе 2007 года только в онлайн-доступе было размещено более 10 млн документов, то к январю 2008 эта цифра достигла 27 миллионов.

Отечественный бизнес уже сейчас активно использует электронные документы. Что очень важно, суды, которые сами постепенно переходят на электронные формы работы, уже к ним привыкли и регулярно выносят решения на основе доказательств, представленных в электронном виде.

Если добавить к этому, что в течение года-двух ожидается принятие решения об использовании в России электронных счетов-фактур, то вопрос о том, как все это хранить и каким образом можно обеспечить целостность и аутентичность электронных документов, из теоретической плоскости плавно переходит в область практического применения. От того, насколько быстро и качественно будут разработаны "правила игры" на "электронном поле", в существенной степени зависит дальнейшее экономическое и политическое развитие страны, ее конкурентоспособность на мировой арене.

В организации долговременного и постоянного хранения электронных документов можно выделить две задачи. Первая - сохранить информационное содержание документов (их контент) с тем, чтобы обеспечить возможность их использования в деловой деятельности и в государственном управлении. При всей своей сложности задача понятна. В этом направлении имеется большой практический опыт, в том числе и отечественный – достаточно вспомнить продолжающиеся программы спасения ценно научной информации с магнитных лент, записанных в 80-е и 90-е годы. Задача вторая - сохранить не только содержание, но и юридическую значимость документов, чтобы всегда можно было доказать их целостность и аутентичность. Здесь отечественный опыт пока невелик, поэтому часто приходится использовать зарубежный. Но и там далеко не все проблемы решены. Поэтому эту задачу можно рассматривать как наиболее сложную из двух.

Сохранить целостность и аутентичность

Для того чтобы электронные документы могли быть приняты судом или государственным органом и им была придана максимальная доказательная сила, необходим целый комплекс мер, охватывающий все этапы жизненного цикла документа. Ключевой задачей стратегии долговременной сохранности является обеспечение аутентичности и целостности документов.

Стандарты о целостности и аутентичности

Стандарт ISO 15489, п. 7.2.2. Аутентичным считается документ, в отношении которого может быть доказано:

  • то, что он является именно тем, чем он претендует быть,
  • то, что он был создан или послан именно тем лицом, которое указано в качестве его создателя или отправителя
  • то, что он был создан или послан именно в то время, которое в нем указано.

Стандарт ISO 15489, п. 7.2.4. Целостность документа означает его полноту и неизменность.

Работа с документами должна быть организована так, чтобы в любой момент существовала возможность доказать, что это надежная информация, которая не была искажена, изменена или как-либо иначе испорчена с течением времени.

Сохранность электронных документов, как правило, обеспечивают несколько служб. ИТ-отдел обычно организовывает хранение и оперативный доступ к информации, решает технические проблемы хранения. Департамент ИБ видит свою основную задачу в обеспечении конфиденциальности, т.е. в ограничении доступа к информации. Наконец, архивную службу (и иногда – и юристов) волнует обеспечение сохранности электронной информации в качестве юридически значимых документов.

Содержать "в котнексте"

С точки зрения архивного дела основной целью является не обеспечение сохранности отдельных документов, а сохранение массивов документов вместе с их взаимосвязями с тем, чтобы была возможность понять роль этих документов в деловой деятельности организации. Значение отдельного документа в большой степени зависит от контекста – от обстоятельств его создания и использования, от его взаимосвязей с другими документами.

Если в бумажном делопроизводстве то или иное дело физически объединяет "бумаги" по определенному признаку или признакам, то в системе электронного документооборота документы, как правило, физически не лежат в соответствующих делах. Очень часто номенклатура и состав самих дел – это всего лишь логическое представление содержимого базы данных, причем могут существовать и альтернативные представления. Документы "раскладываются по делам" виртуально, и эта логика – тот самый контекст - также может быть искажена или утрачена – можно сохранить все индивидуальные документы, но потерять информацию об их логических взаимосвязях.

В бумажном делопроизводстве то или иное дело физически объединяет "бумаги" по определенным признакам

Разрушение контекста может привести к потере юридической значимости документа, поскольку контекст создания и использования включает также и связи с другими документами. Для их фиксации используются различные способы, включая ссылки в "карточке" на другой документ по тому же вопросу или классификационный код, позволяющий связать все документы, относящиеся к одной и той же теме.

В этой связи необходимо обратить серьезное внимание на то, что обеспечение осмысленности электронных данных кардинально отличается от решения той же задачи в отношении бумажной документации. В отличие от бумаг, где физические характеристики обычно передают основную часть контекста создания и использования, в случае с электронными документами на физическом уровне он не зафиксирован, а потому и более хрупок.

На практическом уровне это означает, что, например, электронная структура размещения документов по рубрикам и делам – не простой документ – он имеет огромную важность и равноценен всем описям бумажного архива месте взятым.

Обеспечить читаемость

Одной из основных проблем, которую необходимо решить при организации долговременного хранения электронных документов, является обеспечение их читаемости на протяжении всего жизненного цикла. Задача это многоплановая: необходимо сделать так, чтобы электронный документ можно было прочитать на той компьютерной системе или устройстве, на которой они первоначально были созданы и/или где они в настоящее время хранятся и/или которая в настоящее время используется для доступа к ним и/или которая будет использована для хранения электронной документов в будущем.

Сохраненная на цифровом носителе информация может со временем стать нечитаемой. К этому может привести несколько причин.

Воздействие плохих условий хранения приводит к физическому износу или порче носителей. Все виды носителей, используемые в настоящее время для хранения электронных документов, чувствительны к воздействию неблагоприятной окружающей среды, - например, к перепадам температуры и влажности. Подобные неблагоприятные условия или повреждают носитель, или ускоряют процесс его "старения" и деградации. Для обеспечения максимального срока службы различных типов цифровых носителей требуются различные уровни контроля параметров окружающей среды в местах хранения.

При использовании некоторых технологий записи информации порча данных возможна вследствие воздействия магнитных полей, пыли и загрязняющих окружающую среду веществ (магнитные носители), в то время как другие виды носителей (оптические) менее подвержены влиянию внешних факторов и менее чувствительны к повреждениям, случающимся вне строго контролируемой среды хранения.

Моральное устаревание носителей и оборудования, которое происходит в том случае, когда устройство (например, лента или диск) физически несовместимо с имеющимся компьютерным оборудованием (например, приводом для чтения лент или дисков), и, следовательно, информация не может быть прочитана. Моральное устаревание носителей неизбежно, поскольку технологические достижения постоянно изменяют способы физического хранения электронных документов (происходят, например, изменения в технологии записи, в интерфейсах оборудования и программного обеспечения приводов); изменяются конструктивные параметры устройств. Как следствие, со временем более старые носители информации становятся несовместимыми с появившимися позднее носителями и оборудованием.

Устаревание форматов документов – электронные документы создаются и используются в различных форматах. Многие из них являются "закрытыми" - либо недоступны их подробные описания, либо их использование может быть затруднено вследствие прав интеллектуальной собственности. Это создает угрозу доступности информации при долговременном хранении, поэтому уже сейчас при передаче электронных документов на длительное хранение из широкого набора форматов, используемых создателями и получателями документов, выбирается небольшое число часто используемых стандартов, подходящих для целей архивного хранения.

Именно поэтому сейчас так популярны открытые форматы, которые позволяют работать с электронными документами даже в отсутствие программного обеспечения, использовавшегося для их создания. Специалисты рекомендуют в случае необходимости сохранения электронных документов в "нестандартном" формате постараться оставить максимально подробное его описание и также само ПО.

Среди форматов для длительного и постоянного хранения пока что доминируют (среди текстовых) PDF/A, другие версии открытого формата PDF, SGML, XML и TXT. Для хранения веб-страниц используется HTML. Стоит отметить, что новые открытые форматы ODF и OOXML для длительного и постоянного хранения документов пока не используются.

Устаревание программного обеспечения. При создании и использовании электронных документов организации и отдельные лица используют широкий набор пакетов программ. Для обеспечения сохранности документов чрезвычайно сложно сделать доступ к соответствующему ПО или поддерживать все эти пакеты в работающем состоянии.

Часть электронных документов может оказаться зависимой от программного обеспечения, - и, соответственно, их можно будет использовать лишь в устаревших информационных системах.

Воздействие плохих условий хранения приводит к физическому износу или порче носителей

Операционные системы и прикладное ПО неизбежно будут вытесняться более новыми и производительными, имеющими больше функциональных возможностей. Это означает, что для сохранения документов придется периодически перемещать электронные документы из текущей программной среды в новую.

Выбрать стратегию

Существует несколько основных стратегий обеспечения долговременной сохранности информации, которые могут также использоваться в различных комбинациях.

Копирование. Для кратко- и среднесрочного хранения самым простым и надежным решением является копирование электронных документов на новые носители. Таким образом решается проблема замены поврежденных и устаревших носителей.

Миграция. По оценкам специалистов, трудно ожидать, что старые форматы будут поддерживаться 10 лет и дольше. В этом случае может потребоваться преобразование документов в другие форматы и/или перенос в другие операционные системы. Однако при миграции часто не удается избежать определенных искажений и изменений в документах.

Одним из важных видов миграции является перевод электронных документов на аналоговые носители, – бумагу, микропленку и т.д., - в тех случаях, когда дальнейшее сохранение информации в электронной форме признается неоправданным.

Следует отметить, что если в целях "просто" сохранения информации допустима "ручная" миграция, то для сохранения юридически значимых документов миграция должна проводиться автоматически – только тогда можно будет более-менее уверенно защититься от обвинений в том, что операторы исказили или могли исказить документы.

Эмуляция – пока что популярна в основном у теоретиков. Привлекательна она тем, что если написать для нового компьютера программу, точно эмулирующего работу старого, то для доступа к информации можно использовать оригинальные электронные объекты и ПО. В то же время эмуляция является практически единственным решением, если нужно сохранить, например, исполняемую программу, исходных кодов к которой нет.

Обеспечить организационные меры

Технические меры позволяют сохранить информацию и, в некоторых случаях, доказать ее целостность, однако их, как правило, недостаточно для того, чтобы убедить суд или государственные органы, что она сохранила аутентичность и не была искажена.

США: первый опыт "досрочной" передачи в Национальные архивы электронных документов постоянного срока хранения

В январе 2006 года Министерство обороны передало на депозитарное хранение в Национальные архивы 800 тысяч документов в формате PDF – документацию бывшей штаб-квартиры коалиционных сил в Багдаде.

Документы еще 25 лет останутся под контролем военных, но досрочная передача документов позволяет специалистам Американских национальных архивов начать работу по обеспечению их сохранности.

Эту часть задачи решают организационные меры. Среди них можно выделить определение методов хранения и путей обеспечения целостности и аутентичности. Здесь определяется позиция организации в отношении выбора одного из двух способов хранения электронных документов: на съемных носителях (предпочтительно – однократной записи: CD, DVD и т.п.) или "онлайн" в системах электронного документооборота или в электронных архивах, использования криптографии и разработки комплекса организационных мер по методологии "менеджмента качества" (СМК). Кроме того, среди организационных мер - опережающая сдача документов на архивное хранение и использование стандартных форматов для длительного хранения.

В конечном итоге, как и в случае бумажных архивов, надежность документов определяется тем, насколько хорошо организована деятельность архива и насколько надежен его персонал.

Использовать "однократные" носители?

При хранении электронных документов на носителях однократной записи "мастер-копия" находится на носителях. Те же документы в онлайн-системе рассматриваются как рабочие копии.

У такого способа есть несомненные достоинства. Если электронные документы записываются на носитель однократной записи в момент времени, максимально близкий ко времени их создания, и носитель "закрывается", - то дальнейшее управление электронными документами аналогично управлению привычными бумажными делами. Не требуется переучивать архивных специалистов, и можно использовать апробированные стандарты и методики работы.

Рекомендации Национальных архивов США (NARA) по сохранению электронных документов на носителях однократной записи (разработаны в 2003 году для федеральных государственных учреждений)

  • Использовать носители с ожидаемым сроком службы не менее 20 лет, поддерживаемые многими производителями
  • Мигрировать документы со старых носителей на новые каждые 10 лет
  • Контролировать отсутствие изменений в документах
  • Миграцию документов осуществлять на технологически нейтральные файлы форматов XML, RTF
  • Хранить электронные носители в стабильной среде: температура 15-18 градусов, влажность 35-45%
  • Ежегодно проводить выборочную проверку документов, чтобы убедиться в их сохранности, их проверка на читаемость, и при 10 ошибках чтения - заменять носитель и восстанавливать данных; если высокий уровень ошибок характерен для определенной партии носителей - перезаписывать всю партию
  • Протоколировать все действия с документами

Этот метод также имеет и свои недостатки. Так, проблемой является оперативный доступ к документам. Более того, этот метод неудобен при больших объемах документов и при большом размере самих документов. Сложно проводить частичное уничтожение документов, а также обслуживание, конверсию и миграцию - поскольку может потребоваться вставить в привод, прочитать и извлечь из привода тысячи носителей. Кроме всего прочего, носители могут "потеряться" в хранилище, при их перемещении и использовании.

Отечественных рекомендаций по обеспечению долговременной сохранности электронных документов на носителях пока нет.

Существует несколько зарубежных норм, детально регламентирующих хранение электронных документов на съемных носителях однократной записи. Наиболее авторитетными из являются французский стандарт NF Z 42-013 "Требования к разработке и использованию информационных систем по обеспечению целостности содержащихся в них документов" и британский BIP 0008-1:2004 "Практика, обеспечивающая юридическую и доказательную силу информации, сохраняемой электронным образом".

Оба эти стандарта успешно используются в своих странах уже более десяти лет. Оба следуют принципам, предложенным в стандартах менеджмента качества.

Хранить ли онлайн?

Этот метод хранения архивных документов появился сравнительно недавно. Внешне его отличие от первого метода не бросается в глаза, поскольку, как и там, документы хранятся и в онлайн-системе (это может быть, в том числе, иерархическая система хранения данных), и на съемных носителях. Однако в данном случае мастер-копией являются данные в системе, а данные на носителях рассматриваются исключительно как резервные копии.

Принципиальное отличие этого метода заключается в том, что если нужно выполнить какие либо операции, охватывающие большие массивы документов, то не нужно тратить время на установку, извлечение и считывание носителей. Кроме того, становится возможной более глубокая автоматизация архивных операций, в том числе такой трудоемкой, как миграция.

Суды регулярно выносят решения на основе доказательств, представленных в электронном виде

Дополнительным плюсом является то, что информация постоянно доступна для использования, и архив может окупать себя, информационно поддерживая основную деловую деятельность или же оказывая платные услуги. Съемные носители такую оперативность обеспечить не могут, поэтому все чаще и государственные и коммерческие организации используют именно "онлайн"-метод.

Методических материалов по данному методу пока что немного. Можно, в частности, использовать ряд рекомендаций, содержащихся в упомянутом выше британском стандарте BIP 0008-1:2004.

Самой сложной проблемой при организации долговременного хранения электронных документов с ЭЦП является необходимость поддержания возможности в любой момент убедиться в подлинности ЭЦП. Для архивов это означает, что придется сохранять в рабочем состоянии множество версии и поколений инфраструктуры открытых ключей PKI. Большинство российских организаций (а что уж говорить про государственные архивы!), не готовы сейчас к решению таких задач, у них для этого нет ни финансовых, ни технических, ни кадровых ресурсов.

По мнению авторитетных специалистов, подтверждаемому уже имеющимся практическим опытом, решением проблемы является отказ от сохранения ЭЦП "в рабочем состоянии". Главное, по их мнению, чтобы при постоянном хранении электронных подписей (включая ЭЦП) можно было бы удостоверить роль, которую подпись выполнила в прошлом, в отношении интересов создавшей документы организации, интересов третьих сторон, культурных и исторических интересов общества.

При поступлении таких документов на постоянное или длительное архивное хранение, ЭЦП рекомендуется проверять и "снимать", фиксируя всю содержащуюся в ней информацию в метаданных документов. В дальнейшем защита целостности и аутентичности документов должна уже обеспечиваться силами и средствами архива.

Хотя электронные архивисты не горят желанием возиться с ЭЦП, те же самые технологии, на которых базируется ЭЦП, начинают все более активно использоваться в электронном архивном деле – в первую очередь для защиты целостности документов. Поскольку подписывать миллионы документов архивными ЭЦП нереально, то используется система иерархического определения дайджестов (хэшей), когда в итоге вычисляется дайджест всего архива или крупной его части. Тогда одна архивная ЭЦП способна подтвердить целостность всего огромного архива.

В статье перечислен далеко не полный перечень проблем, которые придется преодолевать в самом ближайшем будущем. К сожалению, как показывает российский опыт решения других проблем "электронного правительства", затягивание приводит тому, что все придется определять в авральном порядке, рискуя принять неверные или ошибочные решения. Государство должно в срочном порядке создать электронные архивы на федеральном и региональном уровне, с тем, чтобы успеть подготовиться к тому моменту, когда придется в массовом порядке принимать на хранение электронные документы. Иначе есть вполне ощутимый риск потерять значительную часть документального наследия страны.

Наталья Храмцовская

Виталий Шилов: Хранилище долговременных документов и ЦОД почти не пересекаются между собой

На вопросы CNews ответил Виталий Шилов, руководитель систем электронного документооборота компании "Крок".

CNews: В чем, на ваш взгляд, сложность организации хранилища электронных документов?

Виталий Шилов: Сложности в организации хранилища данных документов можно разделить на две части: технические и управленческие. Если первая на сегодняшний день довольно легко может быть решена и фактически зависит только от готовности заказчика инвестировать требуемое количество денежных ресурсов в создание эффективной программно-аппаратной инфраструктуры и опыта подрядчика, который эту задача решает. То вторая - а именно, готовность людей работать с электронными документами и централизовать разрозненные данные в единых комплекс, обеспечивающих сквозной поиск и единообразное управление документами, - является, на мой взгляд, самой сложной.

CNews: Какие проблемы встают перед создателями такого хранилища? Как их обычно решают?

Виталий Шилов: Следуя описанному выше разделению, примерами проблем технического уровня являются отсутствие каналов связи требуемой пропускной способности до потребителей документов, нехватка существующих аппаратных ресурсов для централизации информации, обеспечение удобных и эффективных механизмов поиска документов в хранилищах.

 

Решения этих задач известны и поэтому я не буду их подробно описывать. Отмечу лишь, что производители ИТ-оборудования и ПО начинают все более активно работать именно на рынке долговременного хранения информации, что приводит к появлению интересных систем, таких как EMC Centera – CAS (Content Address Storage) устройство, предназначенное именно для архивного хранения неизменяемых данных. Оно способно автоматически мигрировать данные на более современные носители информации по мере их появления и подключения к системе.

Для повышения лояльности потенциальных пользователей системы стандартных подходов нет, и здесь приходится выбираться алгоритм действий для каждого конкретного случая. Вот почему наши проекты зачастую не ограничиваются внедрением хранилища электронных документов, мы разрабатываем и проводим тренинги повышения квалификации пользователей, семинары, на которых рассказываем, зачем создается система, какие преимущества она дает, организовываем индивидуальную работу с отдельными ключевыми пользователями.

CNews: Насколько важно, на ваш взгляд, сохранить контекст документа. Какие системы ДО это позволяют сделать?

Виталий Шилов: Хранение контекста является важной задачей, так как он дает дополнительную информацию о документе и облегчает принятие решений на ее основании. Но если говорить про контекст документа в привязке в системам ДО, то это просто набор атрибутивных данных, хранящихся, чаще всего, в системе управления базами данных. Поэтому технически хранить эту информацию в дополнение к собственно самому файлу документа особого труда не составляет. Главной задачей здесь является не столько сохранение самого контекста, сколько обеспечение его целостности.

CNews: Насколько хранилище долговременных документов отличается от обычного ЦОДа?

Виталий Шилов: ужно путать хранилище долговременных документов и ЦОД. Это совершенно два разных понятия, которые между собой почти не пересекаются. ЦОД - это комплекс программно-аппаратных средств. Он, как правило, состоит из вычислительной системы, системы хранения данных, сетевой инфраструктуры и инженерных систем. Хранилище долговременных документов в качестве инфраструктуры может использовать ресурсы ЦОД, но помимо этого оно включает в себя прикладную систему или системы, которые обеспечивают логику работы, а также окружения в составе набора регламентов, инструкций, правил по работе с ней и с документами, которые в ней хранятся; рабочих станций пользователей, на которых установлены приложения для взаимодействия непосредственно с файлами документов; PKI-инфраструктуры, обеспечивающей функционирования подсистемы ЭЦП.

CNews: Согласны ли вы, что хранить ЭЦП вместе с документами излишне? И достоверность документа достаточно обеспечивать встроенными средствами системы хранения?

Виталий Шилов: тот вопрос сейчас сложно ответить, так как основная цель использования и, следовательно, хранения ЭЦП – это возможность в случае необходимости представить данный документ в суде или других органах, где могут потребоваться доказательства его значимости. С учетом текущего состояния законодательства в этой области, а также отсутствия значимого количества судебной практики по данным вопросам, потребуется время, чтобы выработать правильное решение, которое позволит защитить интересы пользователя. Если обратиться к западной практике, то существуют специальные сертификации программно-аппаратных комплексов, гарантирующие, что данный продукт способен обеспечить достоверность документа. В России аналогов таких сертификации пока не существует, поэтому компании должны принимать решение, довериться или нет такой системе, самостоятельно.