人類のデータを保存する最善の方法の探求

人類のデータを保存する最善の方法の探求

ワシントン DC の議会図書館には、生きたタイムカプセルがあります。映画、放送、録音部門が運営するこの巨大な保管施設には、ワックス シリンダー、レコード プレーヤー、その他の時代遅れの視聴覚機器が詰まっています。時代遅れの技術の廃品置き場と見る人もいるかもしれませんが、ステファニー バーブはこの場所を「失われたおもちゃの国」と呼んでいます。

「昔はレコードをいつも聴いていた」と議会図書館の IT サービス運営担当副部長バーブさんは言う。今ではレコードプレーヤーを所有することはほとんど気まぐれなことになっている。

マシンが時代遅れになると、そこに保存されているデータも失われることがあります。ソフトウェアとハ​​ードウェアは、新しい製品やサービスに取って代わられるにつれて、一般的に使用されなくなります。これは、Barb のような技術者やアーカイブ担当者が、情報を長期保管するために保存しようとする中で、常にぶつかるいくつかの障害の 1 つです。現時点では、データを永久に保存できるストレージ デバイスは 1 つもないと専門家は言います。磁気テープ、Blu-ray ディスク、さらには DNA などのオプションは、より優れたテクノロジがテストされ、市場に投入されるまでの間、データを保存できる、安定的でありながら比較的一時的なストレージ バンクを提供する可能性があります。ただし、これらの選択肢にはそれぞれ欠点があり、容量と耐久性の両面で完璧な方法は 1 つもありません。常に新しいイノベーションが生まれています。

たとえば、議会図書館のデジタル フットプリントは 176,000 テラバイトで、書籍、写真、ビデオ、その他のメディアの Web サイト カタログだけで 5,350 テラバイト (3 分間の MP3 約 20 億個に相当) を占めています。現在、この膨大なデータは年間約 1,500 テラバイトのペースで増加しています。アーキビストは、重要な文書やメディアの寿命を延ばすために時間との戦いを繰り広げています。

「保存プロセスの一環として、オペレーティング システムとハードウェアを最新の状態に保つことも含まれます」と、議会図書館のデジタル戦略ディレクター、ナタリー・ブダ・スミス氏は語る。

永遠に続くものは何もない

製造中止になった LP レコードやゲーム機などの古いメディアに保存されているファイルを保存するには、ちょっとした DIY 作業が必要です。図書館では、アーカイブ担当者がビンテージ メディア プレーヤーを再構築してデータを復元し、より現代的なストレージ形式に転送します。時には、チームが特殊な技術を開発することもあります。たとえば、図書館がローレンス バークレー国立研究所と共同設計した IRENE というシステムは、壊れたレコードの溝の奥まで読み取り、音楽をデジタル形式に変換します。

テープデッキ、レコードプレーヤー、その他のビンテージデータ読み取りツールが「失われたおもちゃの国」に溢れています。議会図書館

これは著作権の対象となる資料では特に重要だとバーブは言います。書籍は適切に保存すれば永久に保存できますが、DVD、CD、DVR などのより劣化しやすい素材で著作権を申請された資料は、時間の経過とともに劣化する可能性があります。「そのため、私たちは時代遅れの技術からデータを取り出してデジタルで保存するという緊急の課題に直面しています。なぜなら、そこに保存されているものを失うことになるからです」とバーブは説明します。著作権申請ごとに複製が提供されるため、議会図書館は通常、より現代的な方法に更新する目的でそれをコレクションに追加します。

作業をバックアップする

将来のためにデータを保存する場合、コンテンツが存在するコンテキストを維持することが重要です。「コンテンツは『ここにビットがあります』と言い、コンテキストは『ここにそれらのビットを理解するために必要な他のすべてのものがあります』と言います」と、国立科学財団のストレージ システム研究センターの名誉所長である Ethan Miller 氏は指摘します。追加のコンテキストには、メタデータ、ソフトウェア、およびビデオ ゲーム エミュレーターなどのハードウェアが含まれます。これは、過去の書き言葉や記号に意味を与える鍵であるロゼッタ ストーンの現代版です。

現在収集されているデータの多くは、デジタル化する必要があったコンテンツではなく、「デジタル生まれのコンテンツ」であるとブダ・スミス氏は言います。インターネット アーカイブから収集されたアーティファクトが良い例です。仮想ファーストの情報は最終的にはテープなどの物理メディアに保存されるかもしれませんが、その過程でさまざまな他のストレージ形式で保存される可能性があります。複数のバックアップを異なるメディアに保存することも良い方法です。

テープで留める

図書館は、データの大部分を、これまで何十年も使用されてきた、シンプルで手頃な磁気テープという媒体に保存しています。この媒体は、密度、データ書き込み速度、低コストで高く評価されている、まさに理想的な媒体です。

テープ ストレージは 1900 年代半ばから存在していますが、テープ 1 インチあたりにより多くのデータ ビットを詰め込むために、現在でも絶えず改良が続けられています。IBM などの企業は、新しい世代でカートリッジあたりの容量を 2 倍 (最大 45 テラバイト) に増やすとともに、フォーマットを将来に向けて適切なものにしようと取り組んでいます。ただし、テープは万能ではありません。磁気テープが破損したり過熱したりすると、データが消去される可能性があります。また、テープは新しいメディアよりも読み取りと書き込みが高速ですが、フラッシュ ドライブやハード ディスク ドライブ (HDD) に保存されている情報ほど、保存されているデータにアクセスしたり編集したりするのは簡単ではありません。

原動力

データの使用方法と頻度によって、どのストレージ メディアが最適かが決まります。IBM のストレージ ストラテジストである Shawn Brume 氏は、クラウド インフラストラクチャの基盤である HDD は、デジタル コレクションを持つ小規模企業にとって最適な初期ソリューションであると語ります。映画スタジオを例に挙げてみましょう。

スターウォーズの前編の撮影はもう25年近くになります」とブルームは言う。「ディズニーは、それらの撮影で撮影した生の映像をデジタル技術から移動させたことは一度もありませんし、今後もそうしないと明言しています」。なぜなら、それらをハードドライブに保存しておけば、映画製作者が変更を加えたいと思ったときに、映像をカットしたり挿入したりするのがずっと簡単になるからだ。

しかし、HDD は時間と規模が大きくなるにつれて高価になるため、自動運転車のように大量のデータを継続的に生成するシステムでは、HDD の使用はコストのかかる面倒なものになると、Brume 氏は付け加えます。平均的な無人運転車システムは、年間 400 テラバイト以上のデータを生成します。何百万台もの車がすべて同じことを行うとしたら、企業は簡単に HDD に圧倒されるでしょう。Brume 氏によると、業界全体で、1 テラバイトのデータを HDD 高密度ストレージに保存するための総コスト (インフラストラクチャ運用コストを含む) は、月額約 0.70 ドルから約 0.80 ドルです。テープの場合は、月額約 0.08 ドルから 0.12 ドルと、はるかに低くなります。したがって、この方法では、最終的には情報をテープに移行して、より低コストで長期にわたるオフライン ストレージにする必要があります。「これは、取り込み、照合、調整、テープへのコピーのプロセスです」と Brume 氏は言います。

歴史を振り返ると、洞窟の壁に彫られたもの以外には永遠に残る媒体はなかった。

IBMのストレージストラテジスト、ショーン・ブルーム

IBM は、将来的にデータを取得する必要がある場合に備えて、データを HDD から長期テープ インフラストラクチャに移行する方法について企業にアドバイスしています。しかし、ハード ドライブとは異なり、テープは変更が非常に難しいという欠点があります。1 つの詳細を変更するだけでも、すべてを消去して書き直す必要があります。

スペース確保のための競争

永久保存の競争で、見過ごされがちな競争相手が、まもなくテープやクラウド ストレージを追い抜くかもしれない。多くの専門家は、ブルーレイ、つまりポリカーボネートの光ディスクは、特に何十年、あるいは何世紀にもわたって、触れられていない箱の中にデータを保存するという点で、非常に有望であると認めている。リーダーの紫色のレーザーにちなんで名付けられたこのシステムは、部品が摩耗しないため、フラッシュ ドライブやハード ドライブよりも優れているとミラー氏は説明する。

結局は基本的な仕組みの問題だ。HDD は、しばらく電源を切ると、読み取りや書き込みがうまくいかなくなる。同様に、フラッシュ ドライブの寿命も限られている。これは、デバイスのトランジスタ内の電子が使用とともに漏れ出し、障壁を通過して、数か月から数年かけて材料の電荷が変化するためだ。「つまり、フラッシュを定期的に読み取り、データを書き直す必要があるのです」とミラー氏は言う。

ブルーレイが優れているのはそこだ。ミラー氏によると、ディスクをスキャンするために必要な技術は、構造が比較的単純で、基本的には回転するモーター、出し入れするリーダー、低出力レーザーだ。光学ドライブは、磁気テープに使用されるものよりもさらに単純だ。ドライブ 1 台あたり 50 ドルから 200 ドルという低価格も魅力だ。

ミラー氏にとって、データをどこに保存するかという問題は、100年から1,000年後にデータを読み取るためにどのような技術が利用可能になるかという問題、つまりブルーレイからか、ガラスやDNAのようなより実験的な形式のストレージからかという問題に帰着する。

「歴史を振り返ると、洞窟の壁に彫られたもの以外には、永遠に残る媒体は存在しません」とブルーム氏は言う。しかし、その情報でさえも腐食する。石、紙、コードなど、記録保存のための新しい発明が生まれても、知識は引き継がれ、次の場所へと翻訳されなければならない。「私たちは常にデータを管理しなければなりませんでした」と同氏は付け加える。「永遠に残るものなどありません」

PopSci+のストーリーをもっと読む。

<<:  NASAはアルテミス計画で再び月を目指している。しかし、どこに着陸するのだろうか?

>>:  プラズマビームはいつか過熱した電子機器を瞬時に冷却できるかもしれない

推薦する

より短く、より太く、より毛深い:世界最小のトナカイに関する 5 つの興味深い事実

すぐにサンタのそりを引くことはないだろうが、スヴァールバルトナカイ(学名: Rangifer tar...

この500ポンドのオーストラリアの有袋類は歩くために作られた足を持っていた

300万年以上前、体重500ポンドを超える有袋類がオーストラリアを歩き回り、大陸初の長距離歩行チャン...

ラスベガスの衛星画像は、都市ヒートアイランドがいかに極端になるかを示している

米国南西部の夏はすでに焼けつくような暑さになっている。6月9日以来、ネバダ州ラスベガスはヒートドーム...

ノーベル賞に忘れられた女性、ヴェラ・ルビンを偲んで

暗黒物質を発見して天文学に新たな分野を創り出したヴェラ・ルビン氏は、長年にわたりノーベル物理学賞の最...

銀河系内に数百のブラックホールが共存している可能性

天文学者たちは、これまで不可能だと考えられていた現象である、数百個のブラックホールが存在する星団を発...

高圧酸素療法室は本当に若返りの泉なのでしょうか?

老化は身体の避けられない一部です。しかし、人類は何世紀にもわたってこの自然なプロセスを逆転させようと...

復元:虹色の4枚の翼を持つ恐竜

恐竜ファンは、一部の恐竜が鱗ではなく羽毛に覆われていたという衝撃からまだ立ち直っていない。今、そのフ...

あなたの脳が「間違い探し」ゲームで苦手な理由はこれだ

これらの画像には3つの重要な違いがあります。写真はブライアン・クラッチによるものです。皆さんが今、家...

この小さな小惑星には小さな衛星がある

8 月 16 日、NASA のルーシー ミッションの科学チームは、小惑星ポリメレを周回する衛星を発見...

古代の人類は埋葬洞窟から出土した古い骨を道具に彫り込んだ

人類学者や考古学者は、過去の社会の価値観や生活様式を、死や死者の埋葬との関係を通してしばしば知る。死...

エレベーターで私たちが立っている場所

認知科学の博士課程の学生、レベッカ・ルーシさんは、オーストラリアのアデレードにある最も高いオフィスビ...

NASAの宇宙船ルーシーが遠距離飛行ミッションで「ディンキー」小惑星に挨拶

11月1日、NASAのルーシー宇宙船は初の小惑星フライバイに成功しました。全長56フィートの宇宙船は...

飛行経験のないアフリカ系アメリカ人宇宙飛行士、エド・ドワイト

NASA の初期の宇宙飛行士団は、多様性に欠けていた。1950 年代後半から 1960 年代にかけて...

2020 年の最も大胆な航空宇宙イノベーション

COVID-19パンデミックは民間航空業界にとって大きな打撃となっているが、過去1年間の航空宇宙分野...

テキサス州で猛威を振るう異常な山火事の背後にあるもの

先週、テキサス州中部では約 200 件の山火事が発生、10 万エーカーの土地が焼け、東はヒューストン...