データインテグリティとは何か?

デジタル社会の現代、日々、どこかの誰かがデータを改ざんしたり、書類を偽造したり、といったことが起こっている。また、そうした意図がなくても、データ転送中のエラーでデータが破損したり、宇宙放射線などの影響で、データが書き換えられてしまう、ということも起こっている。今、そうしたデータが完全なものであるか否か、ということを判別し、正しいデータであることを保証することが求められるシーンが増えている。

「データインテグリティ(Data Integrity:DI)」は、データが本来あるべき姿で存在しており、改変ができない、もしくは改変が起こったことを知らせることを担保する、つまりデータの完全性を確保しようという考え方で、古くは医薬品業界などで守らなければいけないこととして知られてきたものだ。デジタル化が急速に進む現在では、医薬品のみならず、化学薬品や食品、エネルギー、環境、法医学などさまざまな業界でもその重要性が認識されつつある。

現在、データインテグリティを定義する基準は、FDAやEMAが、紙や電子など媒体に係わらず原資料に求める以下のような基本要素を示しており、それらの頭文字をとって、ALCOA+やALCOA-CCEAなどと呼ばれている。

帰属性(Attribute) :誰が何を行ったのか確認できること

:誰が何を行ったのか確認できること 判読性(Legible) :ファイルを読める状態にすること

:ファイルを読める状態にすること 同時性(Contemporaneous) :測定と同時にデータが記録されること

:測定と同時にデータが記録されること 原本性(Original) :データが生成された時と同じフォーマットで残っていること

:データが生成された時と同じフォーマットで残っていること 正確性(Accurate) :生データと分析結果が確かに存在すること

:生データと分析結果が確かに存在すること 完結性(Complete) :データにはすべてが含まれていること

:データにはすべてが含まれていること 一貫性(Consistent) :一連の作業を1つのシステムで行うこと

:一連の作業を1つのシステムで行うこと 永続性(Enduring) :記録の保存と保護を確実に行えるメディアを使用すること

:記録の保存と保護を確実に行えるメディアを使用すること 有用性(Available):必要なときに記録にアクセスできること

データインテグリティが守られていない状態とは、データの削除ができたり、捏造や偽造、修正、改ざんといったことが可能な状態を指す。こうしたことが行われる背景には、欲しいデータが出なかったため、納期を厳守するため、顧客や社内を満足/納得させるためなどなど、さまざまな要因が見られるが、一度、外部にその事実が漏れ出れば、その組織は大きくそのブランド価値を損なうこととなる。

どうやってデータインテグリティに対応するのか

では、データインテグリティが守られているか否かを判断するにはどうするか。大きく分けて、2つの管理手法がある。1つはSOP(標準作業手順書:Standard Operating Procedures)による「手順管理」、もう1つがデジタル技術を活用して管理する「技術管理」である。

とはいえ、手順管理の場合、SOPが存在(用意)しており、それに対するトレーニングがメンバーに施され、かつ厳密に監視されている状態で、SOPに従って行動がなされていることを記録し、従ったことを確認する必要があるなど、手間が多い。そのため、必然的にシステムを活用しやすい技術管理も選択肢となるが、こちらも前提として、必ず存在しており、それが必ず有効になっている必要があることには変わりが無い。

そうして求められる主な技術管理の内容は、以下のとおりとなる。

記録の保護:データを削除、偽装、損失から守る

アクセス管理:適切なユーザーが適切に情報にアクセスする

監査証跡:作成されたファイルの変更や実行に対するすべてを記録する

電子署名:署名者、日時、理由を消去できない方法で記録する

レポート機能:生データと分析結果を正しく保管する

データインテグリティの重要性は、さまざまな業界で論じられるが、その基本的な対策には違いがなく、基本としてはARCOA+の原則を守ることであり、データの取り扱い方を決めて、それを扱うためのシステムを導入するということである。

Agilentが進めるデータインテグリティ対策

データインテグリティはライフサイエンス分野が先行して取り入れてきた経緯もあり、分析機器メーカーであるAgilent Technologiesも早い段階からデータインテグリティへの対応を進めてきており、そうした動向の説明を2018年3月14日、都内で記者向けに行った。

データインテグリティに対応する同社のソリューションは現在2種類あるという。1つ目は「OpenLAB CDS 2」と呼ばれるガスクロマトグラフ(GC)や液体クロマトグラフ(LC)、GC/MS、LC/MSなどを制御するクロマトグラフィデータシステム。同社製のGCやLCのみならず、他社製の製品もコントロール可能で、かつスタンドアロンでもネットワーク経由でも利用することができるという。

もう1つは「OpenLAB ECM」と呼ばれるデータ管理サーバシステム(科学データ管理システム:SDMS)で、電子ファイルとして存在するものをメーカーや機種問わずにネットワーク経由で一元管理することを可能とするものとなっている。

データインテグリティを実現するアジレントのソリューション

これらのソリューションを開発する上で、同社では、以下の3つの優先事項を決め、推進を図ってきたという。

手順管理よりも技術管理を優先

探知管理よりも予防管理を優先

印刷紙管理よりもオンライン管理を優先

要は、ソフトウェアの機能で管理できる部分は、ソフトに任せて、人の介在を減らすことによるミスの低減を図りつつ、そもそも論としての偽装や不正を起こらないようにするという考えのもと、オンライン管理を重視。それにより、紙での管理ではなく、改ざんされにくいように処理が施された形での電子ファイルでも保存に行き着いたというものとなっている。

「予防こそが最大の防御というポリシーの下、アクセス管理には、適切なユーザーが適切な情報にアクセスできるようになっているほか、監査承認をオンラインで可能とすることによるペーパーレス化と、恒久的なデータ保存、そして電子書名による証跡管理の実現。レポートの作成時も、内蔵のレポート作成機能を活用することで、改ざんはもとより、データの複写ミスなども防ぐことが可能となっている」(アジレント・テクノロジー 市場開発グループ ネットワークデータシステム担当の西山大介氏)という。

また、データそのものも安全な方法で保存されているほか、分析終了後には、安全なところで保存されるなど、データそのものの保存にも工夫を施しているとする。そのため、記録管理としても、前のデータを書き換えたとしても、前に記述したデータとは別のバージョンとして振り分けられ、そのいずれもが安全な場所に自動的に保存されるなど、その記録時刻やユーザー名、変更前後のデータ変更の理由なども含めて、厳密な運用が実現できるという。

アジレントのOpenLABが提供するデータインテグリティの特徴

同氏は「データインテグリティの構築にはいろいろと手間がかかるが、一度構築できれば、信頼性の高い訴求が可能になる」としており、これにより、製品や組織の信頼性の向上を図ったり、データの取り扱いに対する透明性の確保、責任の所在の明確化、そして最終的には仕事の生産性向上につなげることも可能だとしている。

なお、同社のシステムは、同じシステムを自社のみならず受託製造メーカーなどにも導入することで、相互に管理を行うといったことにも使えるため、トレーサビリティなどの観点にも対応することができるとしている。