Хард, облако, бумага: где нам хранить информацию?

Хард, облако, бумага: где нам хранить информацию?

В 21 веке мы привыкли хранить нашу информацию в облаке, что имеет явные преимущества перед бумажными архивами и жесткими дисками. Было время, когда люди считали, что компакт-диски являются лучшим средством для длительного хранения. Некоторые производители обещали срок службы дисков в сто лет. Затем исследователи обнаружили, что такие частицы, как пыль, могут окисляться на поверхности компакт-диска. Как можно догадаться, это приводит к потере данных. Давайте выясним, какой метод сегодня является наиболее подходящим для хранения человеческих знаний в долгосрочной перспективе?

Долгосрочное хранилище и облако

Облако — это множество центров обработки данных, распределенных по всему миру. А если проще, то это просто компьютеры с "хардами", которые коммутируют с вашими личными устройствами через интернет. Жесткий диск представляет собой набор круглых пластин с высокоскоростным вращением, которые создают воздушный поток. Этот поток воздуха жизненно важен для правильного функционирования магнитной считывающей головки, которая должна иметь возможность постоянного перемещения, поэтому пыль, загрязнения или механический удар могут привести к повреждению. Производители обычно гарантируют 5 лет использования таких дисков.

Возможно, сейчас вы немного беспокоитесь о своих праздничных фотографиях или важных документах. Однако вы можете расслабиться, потому что облако решает проблемы жесткого диска, дублируя данные. Он хранит достаточное количество копий, поэтому даже если один жесткий диск "накроется", та же информация будет сохранена на других дисках. Вопрос в том, сколько информации он может хранить и с каким воздействием на окружающую среду? Это сложная тема сама по себе, поэтому мы будем считать, что при постоянном повышении вычислительной эффективности и устойчивом производстве энергии, это не станет проблемой в ближайшем будущем.

Длительное хранение и бумага

Хотя в настоящее время бумага устарела, она когда-то была важной формой хранения компьютерных данных, поскольку и бумажная лента, и перфокарты были обычным продуктом для работы с компьютерами до 1980-х годов. До того, как бумага стала использоваться для хранения данных, она использовалась в нескольких приложениях для хранения инструкций, определяющих работу машины. Самое раннее использование бумаги для хранения инструкций для машины было работой Базиля Бушона, который в 1725 году использовал перфорированные бумажные рулоны для управления ткацкими станками. В 19 веке бумага использовалась для управления машинами еще несколькими способами. В 1846 году телеграммы можно было предварительно записывать на перфоленту и быстро передавать с помощью автоматического телеграфа Александра Бейна. Несколько изобретателей взяли концепцию механического органа и использовали бумагу для музыки.

В конце 1880-х годов Герман Холлерит изобрел запись данных на носитель, который затем мог быть прочитан машиной. После некоторых первоначальных испытаний с бумажной лентой он остановился на перфокартах. Метод Холлерита использовался при переписи 1890 года. В конечном итоге компания Холлерита стала ядром IBM. Были также разработаны другие технологии, которые позволили машинам работать с отметками на бумаге вместо пробитых отверстий. Эта технология широко использовалась для подсчета голосов и оценки стандартизированных тестов. Банки использовали магнитные чернила на чеках, поддерживающих сканирование MICR.

Бумага — это надежный носитель для долгосрочного хранения и архивирования информации. Мы точно знаем, что книги могут храниться более тысячи лет, и они могли бы сохраниться еще дольше в контролируемой и стабильной среде. Текущее цифровое хранилище не сопоставимо к бумаге, когда дело доходит до длительного хранения. Книгам не нужно электричество, но им нужно пространство. Много места. Например, огромная библиотека с 6 миллионами книг эквивалентна всего 1 ТБ цифрового хранилища. Не говоря уже о проблемах, связанных с анализом информации, скрытой на бумажных страницах.

Хранилище всех знаний людей

Человеческое знание может означать все, что угодно. Я бы определил это как то, что будущие поколения должны знать о нашем понимании мира до сих пор и о нас, людях этой эпохи. Коллекция самых важных научных открытий, лучших произведений искусства и литературы и самых больших ошибках, которые мы когда-либо совершали. Кроме того, будущих историков будут интересовать микроистории обычных людей.

Вопрос в том, какие знания должны сохранять люди. Например, существует динамический тип знаний, генерируемых с использованием Интернета. Еще одно соображение заключается в том, что динамические данные должны быть записаны в моментальные снимки. Представьте, что у вас есть блог, вы публикуете статью, и кто-то комментирует ее. Через два часа кто-то другой расширяет обсуждение, а на следующий день разговор продолжается и так далее. Все это ценно, и поэтому архивирование версий источника информации во времени имеет решающее значение. Для сравнения, достижение консенсуса по любому вопросу требует длительных периодов времени и с меньшей вероятностью может измениться.

А как насчет людей в интернете и их знаний?

Нам нужна альтернатива бумаге и цифровому хранилищу, которое у нас есть сейчас. Не только для того, чтобы запечатлеть нашу деятельность в интернете, поскольку это не самый насущный вопрос. Например, подумайте о радиоактивных отходах и документации о том, где они находятся и как долго. Такие документы должны храниться сотни лет. Исследователи знают об этом, и за последнее десятилетие они придумали несколько захватывающих инноваций. Например, лаборатория Hitachi разработала цифровой носитель на основе кварца, который может хранить данные в течение тысяч лет. Проект Microsoft Silica также изучает кварцевое стекло.

Другой пример — ДНК. Да, вы правильно это поняли. Ученые работают над хранением ДНК. Они уже разработали алгоритм, который переводит с 0 и 1 на язык генетики — A, C, T, G. Мы уже знаем, что ДНК является отличным долговременным хранилищем, которое может сохранять высокое качество данных в течение сотен тысяч лет. Обе эти инновации способны изменить способ хранения всех видов человеческих знаний.

Так все же Облако или Хард

Когда вы решаете сохранить документ на компьютер, ваш жесткий диск раскручивается, а его механический рычаг поворачивается по большой магнитной пластине, чтобы намагничивать или размагничивать крошечные ячейки, которые представляют вашу информацию. Вашему жесткому диску требуется всего около 2 Вт для записи данных. Для записи на диск текстового файла размером 25 килобайт требуется около 0,0002 секунды. Общая энергия, затрачиваемая на это, составляет около 0,1 микроватт-часа: примерно 0,005 ватт-часа на гигабайт. Для простоты мы не будем учитывать мощность, потребляемую вашим жестким диском в режиме ожидания.

Но, возможно, вы решите сохранить свой документ в облачной службе хостинга, такой как Dropbox, iCloud или OneDrive. На этот раз ваш текстовый документ разделен на поток пакетов данных. Его первая остановка — это ваш Wi-Fi роутер, а затем ваш кабельный модем. Отсюда он перемещается с места на место, используя преимущества сетевой инфраструктуры, такой как серверы, маршрутизаторы, сетевые коммутаторы и оптические повторители, когда он перемещается по оптоволоконным кабелям примерно со скоростью света. Вскоре он входит в огромное здание. Это чудовище, площадью несколько акров, содержит что-то вроде бесконечных рядов кукурузы. Но овощей здесь нет — ряды состоят из огромных стеллажей, уложенных ввысь винчестерами. В здании шумно, гудит система вентиляции и жужжат жесткие диски. Последние маршрутизаторы центра обработки данных отправляют ваши пакеты в серверную стойку,

Нет единого мнения о том, сколько энергии расходуется на это путешествие. Но сами центры обработки данных потребляют много энергии — их невозможно выключить, а их стойки с серверами постоянно перемешивают и проверяют данные, даже создавая избыточные копии. Требования к охлаждению огромны, так как все это оборудование выделяет огромное количество тепла.

Сочетание передачи данных и их хранения в центре обработки данных, вероятно, требует от 3 до 7 кВтч на гигабайт. Это примерно в миллион раз больше, чем энергия, которую вы потратили на сохранение на жестком диске. Вместо 0,1 микроватт-часа ваш текстовый документ потребил 0,1 ватт-часа электроэнергии — этого достаточно, чтобы зажечь светодиодную лампочку примерно на 30 секунд. Если вы храните 100 гигабайт данных в облаке в течение года, количество электроэнергии, необходимое для этого, приведет к выбросу около 0,2 тонны CO2.

Суть в том, что для хранения ваших данных в облаке требуется гораздо больше энергии, чем для их хранения на вашем компьютере, и, таким образом, оказывает воздействие на окружающую среду, соизмеримое с этой разницей. И это вдобавок к различиям в землепользовании — облачное хранилище требует строительства обширных центров обработки данных, а хранение этих данных на вашем компьютере — нет. Но облачное хранилище данных дает множество преимуществ. Вы можете хранить свою музыку в облаке через iTunes Match, редактировать документы в облаке на Google Диске, создавать резервные копии iPhone в облаке, хранить документы в Dropbox (и редактировать их с любого компьютера), хранить свой календарь в облаке через Календарь Google и обменивайтесь фотографиями через облако через Photo Stream. Вы даже можете создать резервную копию всего содержимого вашего компьютера, всего сотни гигабайт, через облачные сервисы резервного копирования, такие как EaseUS или Carbonite. Хранение данных в облаке стало частью повседневной жизни многих людей.

Альтернативы облачному копированию

Есть альтернативы облачному резервному копированию. На компьютерах Mac есть функция под названием Time Machine, а на ПК с Windows есть аналогичная функция под названием File History, позволяющая создавать резервную копию всей вашей машины на внешнем жестком диске. Хотя это не поможет, если ваш дом разрушен в результате катастрофы, внешний жесткий диск может защитить данные от более распространенных угроз, таких как вирусы или поврежденные данные.

Итак, где же человечество должно хранить свои знания в долгосрочной перспективе? Что ж, облако — лучший вариант для наших динамичных повседневных данных. Благодаря непрерывным инновациям в цифровых носителях, лежащим в основе облака, вероятно, будет развиваться, и мы, пользователи, даже не заметим этого. А бумага, в свою очередь, как хранилище информации, скорее всего, будет становиться все менее и менее актуальной.