Организация архива цифровых фотографий
Чтобы сохранить ваши снимки так, чтобы они прожили 100 лет, недостаточно просто сделать архивный отпечаток и поставить его в надёжную рамку. Современные цифровые изображения требуют чёткого понимания таких понятий, как формат файла, потери данных, тип носителя и постоянно меняющиеся технологии хранения. Эта глава сводит воедино лучшие стратегии решения трёх вопросов — что, как и где хранить, а также что делать после того, как все архивы готовы — так чтобы быть уверенным в том, что ваши фотографии выдержат проверку временем.
Форматы архивных файлов для хранения фотографий
Это тема, которая многим фотографам не даёт спать ночами: как можно быть абсолютно уверенным в том, что хранимые фотографии будут читаемы на компьютерах спустя 10, 50 или 100 лет, с существенно другими технологиями? Будут ли форматы файлов RAW камер Canon, Nikon, Sony или других производителей всё ещё полностью поддерживаться программами, будут ли изображения после загрузки воспроизводиться так же, как и раньше?
примерно 1890-й год | примерно 2008-й год |
К сожалению, правый снимок необязательно проживёт настолько же долго, насколько сохранился левый. Однако, с соблюдением необходимых мер предосторожности, правый снимок не только сохранится, но и не подвергнется выцветанию и деградации, как фото из 1890-го года.
Таким образом, первым важным соображением при создании архивов фотографий является выбор типа файла. Нижеприведенная таблица сравнивает наиболее распространённые форматы файлов:
Формат архивного файла | Размер | Качество | Поддержка |
---|---|---|---|
JPEG | минимальный | наихудшее | отличная |
TIFF (8 бит) | средний | среднее | отличная |
TIFF (16 бит) | максимальный | высокое | отличная |
файлы RAW: CR2, NEF, и т.д. | большой | наивысшее | сейчас нормальная; годы спустя под вопросом |
DNG | большой | наивысшее | сейчас посредственная; годы спустя отличная (в теории) |
Файлы JPEG имеют больше всего шансов широко поддерживаться много лет спустя; в конце концов, JPEG стал практически стандартом для фотографий в интернете. Если у вас уже есть масса снимков в формате JPEG, выбор формата хранения для них прост: оставьте их в том же виде. Однако, если ваша камера поддерживает съёмку в RAW, крайне рекомендуется снимать в этом формате по причинам, рассмотренным позже.
Файлы TIFF следуют близко к JPEG в вопросах совместимости, однако имеют намного более высокое качество, поскольку не используют сжатие JPEG с потерями. TIFF окажется оптимальным балансом для многих. Однако TIFF либо сохраняет намного меньше информации об исходном фото (если имеет разрядность 8 бит), либо значительно больше, чем файлы RAW, и при этом сохраняет несколько меньше информации об исходном изображении (если используется разрядность 16 бит).
Файлы RAW очевидно лучше всего подходят для сохранности исходной информации об изображении, будучи при этом меньше, чем 16-битные файлы TIFF. Однако, формат RAW практически у каждой камеры свой, и потому крайне маловероятно, что спустя 10-20 лет распространённые программы смогут корректно прочитать эти файлы. Поэтому архив файлов RAW оставляет два варианта: преобразовать их в какой-то другой формат или хранить их в первозданном виде до момента, когда появятся вопросы совместимости, надеясь, что к тому времени появится подходящий формат на замену.
Многим покажется, что подходящий формат уже существует: формат цифрового негатива DNG (Digital Negative), который был создан компанией Adobe для решения многих проблем, связанных с долговременным хранением. Это открытый стандарт, использование которого бесплатно, используя его, можно надеяться, что файлы можно будет более легко и универсально открыть в будущем. DNG ставит своей целью соединить преимущество в совместимости форматов TIFF и JPEG с преимуществом в качестве и эффективности исходных файлов RAW вашей цифровой камеры.
Однако даже DNG не является гарантом будущего. За вычетом программ от Adobe его не так широко поддерживают, чтобы считать его достаточно универсальным для целей архивирования (хотя это быстро меняется). Потом, компании появляются и исчезают (помните когда-то всемогущий Kodak?), у самого формата DNG есть номера версий, и DNG не поможет, если технологии производства сенсоров радикально изменятся.
Ещё один вопрос заключается в том, как хранить разнообразные редакции файлов, для чего DNG очевидно не предназначен. Много 16-битных файлов TIFF, PSD или других форматов могут быстро стать слишком большими и неуправляемыми. Неплохим способом сократить объём будет хранить файлы, которые сохраняют историю операций над ними, это займёт меньше места, чем несколько файлов или страниц в одном файле TIFF. Программы преобразования RAW зачастую способны сохранять параметры преобразования, например, во вспомогательные файлы XMP (Camera RAW), файлы каталога (Lightroom) или библиотеки (Aperture). При использовании Фотошопа, применение и хранение слоёв коррекции тоже является прекрасным способом избежать множества промежуточных файлов для каждой редакции.
К сожалению, многие из форматов, используемых для хранения редакций, тоже подвержены вопросам будущей совместимости. К счастью, это тот случай, когда технологические новшества могут побудить вас заново обработать отдельные изображения, используя новейшие программы и методы. Просто проследите, чтобы у вас сохранилась в архиве нетронутая версия исходного фото.
В конце концов, единственный отказоустойчивый метод — это поддерживать актуальность данных. Хорошей идеей является пересматривать свои архивы каждые несколько лет и преобразовывать те типы файлов, которые устаревают.
Выбор носителя
Даже используя совместимый формат файлов, как мы можем быть уверены в том, что эти файлы впоследствии можно будет считать с выбранного нами резервного устройства или носителя? Помните дискеты 5.25"? На самом деле правительство США настолько озабочено этим вопросом, что они хранят и поддерживают компьютеры разных стадий развития — просто на случай, что файл сможет быть открыт только на одном из этих старых устройств.
CD, DVD, Blu-Ray и другие съёмные носители долгое время были основным методом резервного копирования для пользователей. Они имеют преимущество относительной дешевизны и широкой распространённости. Вероятно, наибольший их недостаток — это ненадёжность; одни носители живут всего 5-10 лет, для других заявлен срок жизни в 50-100 лет. Часть бывает сложно сказать, в какую из категорий долговечности попадает купленный вами носитель.
Не стоит думать, что все записываемые носители одинаковы. Зачастую есть огромная разница в долговечности между различными производителями. Уделите внимание типу используемых красителей (синий, золотой, серебряный и т.д.), доступным в сети ускоренным тестам старения, а также на сообщения о проблемах с конкретной моделью или серией.
Внешние жёсткие диски, недавно появившись на сцене резервного копирования, сделали на ней большие шаги, поскольку значительно упали в цене за последние несколько лет. Жёсткие диски могут хранить невероятные объёмы информации в малом физическом объёме, весьма быстры и предоставляют возможность мгновенного доступа к чтению и изменению данных. С течением времени они могут постепенно размагничиваться, но наибольший риск вносит их внутренний мотор, который может отказать (и хотя данные при этом не теряются, извлечение их может влететь в копеечку). Ещё один риск состоит в устаревании интерфейсов eSATA, USB или Firewire.
Ленточный архив, когда-то единственный метод архивации данных, становится всё более маргинальным и на сегодняшний день в действительности используется только для резервирования больших корпоративных архивов. Потребительские модели гораздо менее распространены, и они не смогли угнаться за прогрессом плотности хранения, достигнутой на жёстких дисках. Далее, некоторые ленты значительно более чувствительны к влажности, воде и другим внешним факторам, чем внешние жёсткие диски или другие съёмные носители. Основные их преимущества в том, что они, во-первых, совсем недороги для архивов большого объёма,а во-вторых, не содержат внутри мотора и таким образом не имеют проблем со стартом, в (отличие от жёстких дисков).
К сожалению, единственным надёжным решением является миграция данных на современный носитель каждые 3-5 лет. К счастью, технологии хранения данных показали экспоненциальный рост вместительности, так что ваши старые 10 DVD с фотографиями могут поместиться на один Blu-Ray или занять некоторую часть внешнего жёсткого диска — и можно предполагать, что 10 или более таковых смогут легко уместиться в одну единицу следующей технологии хранения данных, и так далее. Это означает, что даже если вы продолжите делать снимки, объём работы по их переносу на новые носители необязательно будет расти.
Сохранность целостности изображений
Каким бы ни был архивный носитель, любые данные со временем портятся, и при переносе файлов могут возникнуть ошибки. Компоненты DVD-диска постепенно разлагаются, ленты и диски размагничиваются, а флэш-память теряет заряд. Все эти процессы неотвратимы. Ниже приведен пример того, как файл с фотографией может быть относительно безболезненно повреждён:
Чтобы заметить подобные повреждения, нужно проверять специфические области в изображении в масшатбе 100%, и даже тогда на отпечатке их будет легко заметить. Это несколько дискомфортно, учитывая, что у большинства людей есть как минимум несколько сотен, а то и тысяч фотографий; обнаружить все повреждения при таких объёмах кажется просто нереальным. Далее, повреждения изображений распространяются на все последующие резервные копии и могут оставаться незамеченными до тех пор, пока их не попытаются напечатать много лет спустя. |
Использование методов хранения, которые контролируют целостность данных, является единственным способом систематически обнаруживать подобные проблемы прежде, чем они необратимо изменят ваши фотоархивы. Это единственная причина, по которой показанный выше снимок был обнаружен до того, как создал проблемы. Следующая таблица рассматривает некоторые наииболее распространённые способы предотвращения, контроля и восстановления повреждений в фотографиях:
Тип | Применение | Принцип работы |
---|---|---|
RAID 1,5,10* | Предотвращение | RAID 1, 5 или 10 — это массив из жёстких дисков с защитой на случай отказа одного из дисков. Он может продолжить работу даже после отказа одного из дисков, без потерь информации. Однако, он может заметно повысить стоимость хранения, поскольку требует дополнительных дисков и RAID-контроллера. |
Контрольные суммы SFV или MD5 | Проверка | Файлы контрольных сумм позволяют проверить, что файл или его копия идентичны оригиналу. По сути это цифровые отпечатки пальцев, которые создаются на основе каждого бита информации в файле, и когда хотя бы один бит в файле изменится, контрольная сумма практически гарантированно не совпадёт. Однако это всё, что они делают: информируют вас о появлении ошибки. |
Чётность или восстанавливаемые файлы | Восстановление | Файлы чётности можно использовать для устранения малых повреждений без полного дубликата оригинала. Они сохраняют аккуратно подобранную избыточную информацию о файле; если файл окажется повреждён, файл чётности совместно с уцелевшими частями исходного файла могут быть использованы для воссоздания исходных данных. Однако файлы чётности занимают всё большее пространство по мере нарастания степени повреждения файлов, которые необходимо восстановить. |
* Технические примечания: хотя это выходит за рамки предмета данной статьи, технология массивов RAID имеет массу вариантов; RAID 1 в действительности состоит из двух дисков, которые являются идентичными копиями; RAID 5 состоит из трёх или более дисков, из которых один содержит данные чётности; RAID 10 требует четырёх дисков и в целом похож на RAID 1, однако улучшает производительность путём одновременного чтения и записи на разные диски. RAID 0 не должен использоваться для критически важных данных, поскольку он повышает не сохранность, а только производительность, объединяя два диска в один.
Если вы регулярно работаете с очень важными фотографиями, наилучшей защитой будет использование RAID во время редактирования и между этапами резервирования и хранение контрольных сумм и файлов чётности в архиве.
Простейшим решением является создание двух резервных копий сразу после съёмки. Тем самым вам не придётся беспокоиться о сложных конструкциях с использованием RAID или файлов чётности, но озаботиться контрольными суммами SFV или MD5** для каждого из архивных снимков. Существует масса программ, способных создавать контрольные суммы, быстрый запрос в поисковых системах покажет несколько свободно распространяемых вариантов. Если вы обнаружите повреждённый файл, для восстановления можно использовать вторую копию. Отсутствие RAID означает отсутствие защиты от потерь промежуточных редакций файла на вашем компьютере, но это обычно намного менее важно, чем сохранить неповреждённый оригинал.
** Технические примечания: контрольная сумма является цифровым аналогом отпечатка пальца, который гарантирует целостность/идентичность файла. SFV расшифровывается как «single file verify» (один проверочный файл), и он содержит список контрольных сумм, соответствующих списку проверяемых файлов. Контрольные суммы MD5 создавались не только для проверки целостности файла, но и для подтверждения его подлинности (то есть, что файл не был кем-либо умышленно изменён). Циклические контрольные суммы CRC рассчитываются намного быстрее, чем эквивалентные контрольные суммы MD5, но последние гораздо более чувствительны к изменениям файла. Существуют и другие типы контрольных сумм файлов, но SFV и MD5 в настоящий момент наиболее широко поддерживаются.
Вне зависимости от вышесказанного, важно сохранять ваши данные «свежими», копируя их на новый носитель каждые 5-10 лет — даже если формат файла или носителя ещё не устаревает.
Где хранить фотоархивы
Лучше всего хранить ваши резервные копии фотоархива в прохладном сухом месте с достаточно постоянными условиями окружающей среды и минимальной необходимостью в перемещениях. Если в помещении возможна повышенная влажность, не забудьте упаковать носитель в пластиковый пакет, прежде чем положить на хранение.
Однако возможны и непредвиденные случайности, такие как кража или пожар, так что любая устойчивая стратегия резервирования должна использовать распределённое хранение копий. Это может означать хранение копии архива в безопасной депозитной ячейке, у друзей, родных или на каком-то сервере в сети. Если ваше соединение с интернетом имеет достаточно высокую скорость, резервные копии можно регулярно и систематически передавать по FTP. В зависимости от размера и количества фотографий, можно даже рассматривать сайты обмена фотографиями в качестве резервных копий. Однако, этот вариант не подходит для цифровых негативов, таких как файлы RAW, поскольку их невозможно показать на сайте.
Попробуйте приучить себя к регулярному расписанию резервного копирования по какой-нибудь простой для запоминания системе. В конце концов, если вы не можете найти фото, помещённое в архив, это всё равно что его потерять.
Минимизация риска случайного удаления
Ну что ж, мы проделали большой путь, чтобы удостовериться в том, что во-первых, формат файла сохранит читаемость, во-вторых, носитель архива будет загружаем и в-третьих, каждое фото сохранит свою первозданность. Что же препятствует кому-то по ошибке удалить или перезаписать часть вашего фотоархива? Конечно, необходимо чётко подписывать носители, но хорошей идее может оказаться также сделать архивные фото доступными только для чтения, а также защитить их паролем на уровне папки или носителя. Однако, установка пароля является обоюдоострым мечом, поскольку пароль можно и забыть. Если вас это беспокоит, используйте в качестве пароля слово «пароль», коль скоро его целью является дополнительное препятствие для случайной невнимательности, а не предотвращение неавторизованного доступа.
Сводка вариантов организации фотоархива
Фотографов можно в целом разделить на две категории:
Стратегия архивирования: лучше всего хранить JPEG максимально возможного качества, чтобы минимизировать дефекты, вызванные сжатием с потерями. Каждый фотоальбом лучше хранить в двух экземплярах на съёмных носителях, в идеале вместе с файлами контрольных сумм SFV или MD5, чтобы обнаружить повреждение изображений. Архивные фото нужно перезаписывать на новый носитель каждые 5 лет, чтобы избежать устаревания носителей и повреждения данных.
Стратегия архивирования: разборчивым фотографам всегда следует хранить свои снимки в формате RAW. Любое редактирование в идеале должно производиться на компьютере с резервированием дисков не хуже RAID 1, иначе нужно делать резервные копии исходных снимков немедленно после съёмки. Файлы перед архивацией RAW нужно либо преобразовывать в формат DNG, либо сохранять в неизменном виде. Если это возможно, обработанные версии снимков нужно хранить с записью шагов обработки (как, например, в формате каталога XMP), в противовес отдельным файлам TIFF. Каждый резервный набор снимков должен быть записан по меньшей мере на два носителя, и все файлы нужно снабжать контрольными суммами SFV или MD5 и данными чётности, на случай если потребуется восстановление. Каждый набор копий нужно хранить в разных помещениях (зданиях). Файлы в форматах RAW или DNG следует преобразовывать в новый формат по мере его появления, чтобы сохранять программную совместимость; каждая из новых резервных копий должна быть сделана на новом носителе с использованием новых технологий хранения, чтобы хранить данные в свежем виде.