<img height="1" width="1" style="display:none;" alt="" src="https://px.ads.linkedin.com/collect/?pid=1205042&amp;fmt=gif">

データの価値を引き出す

目次

デジタル成熟度から産業変革へ

すべての産業組織にとって、運用技術(OT)システムで生成されたデータのインテリジェントな使用は、オペレーショナルエクセレンスを高めるための中心的な取り組みです。したがって、デジタルトランスフォーメーション、データの使用、スケーリング、価値実現までの時間を誰もが話題にしている一方で、産業界で実際に利益を得ている企業はほとんどありません。

また、課題となるのはデータではありません。OTのデータは、組織がさらに効率的で回復力の高い運用を構築し、従業員の生産性と顧客満足度を高めるための素材です。このOTデータは豊富にありますが、産業組織はますますつながっていく運用から価値を生み出そうと奮闘しています。IDCが示すところによると、データを分析し、そのデータからかなりの程度まで価値を引き出している組織は4社中1社にとどまるとのことです。

適切なツールとプロセスがないというのは、相当に支障を来します。その結果として、データ作業者が自分の時間のほぼ90%をデータの検索、準備、管理に費やすことになります。データの価値を失うという不安から、組織は往々にしてデータの整理よりもデータの集中化を優先してきました。その結果、思慮を欠いた「データスワンプ」が生じ、不明瞭でコンテキスト化されていないデータの問題だけがいつまでも残ることになったのです。

機械学習(ML)を導入して予測アルゴリズムを開発した企業は、信頼できる品質のデータを持つことがいかに重要であり、ヒストリカルデータが常に信頼できるわけではないということをすぐに理解しました。また、データドリブンのイノベーションをサポートするにはデータガバナンスが必要ですが、多くの組織は、その実現に必要な要件に対応できていません。

実際には、運用アセットがさらに複雑さを増し、つながり、インテリジェントになり、さらに多くのリアルタイム情報も提供するようになるにつれて、計画・運用・メンテナンスを可能にするデータドリブンの意思決定がますます複雑になっています。これを大局的な視点から考えると、製造、石油・ガス、ユーティリティ、鉱業にわたる組織は、毎日の運用・制御データのスループットが今後12か月間で16%成長すると見込んでいます。マーケットインテリジェンスプロバイダーであるIDCは、これらの組織のサイロ全体にわたる運用によって毎日生成されるデータを測定しており、産業分野全体のデータとその使用の将来的な拡張をモデル化しています。運用のデジタル化が拡大していることを考慮しても、2025年にはこのデータの約30%しか十分に活用されないとIDCは予測しています(図5)。

welding-worker

データの価値をかなりの程度まで引き出している組織は、4社中1社にとどまります。データの分散に加え、データを接続、コンテキスト化、管理するためのツールとプロセスの不足が、デジタルトランスフォーメーションの妨げとなっています。

産業向けDataOpsを利用することで、運用・制御データ分析ライフサイクルの価値実現までの時間、品質、予測可能性、規模が確実に向上します。また、産業向けDataOpsは広範囲の組織での新しいデータ管理方法に向けた足掛かりでもあり、データ多様性の高まりに対処し、データユーザー数の増加に対応します。

definitive-guide-to-industrial-dataops-chapter-two-figure-1
図5:2億5,000万ドルの産業オペレーションでのデータの生成と利用(2019~2025年)

分野としてのDataOps

産業向けDataOpsを詳細に検討する前に、銀行、小売、医薬品など、DataOpsをいち早く導入した業界がデータ運用化の課題にどのように対処したのかを見てみましょう。

重厚長大産業は多くの固有の課題に直面しますが、価値を引き出すためのデータの運用化に関する幅広い課題は多くの分野で共有されています。この普遍的なニーズは分野としてのDataOpsを生み出し、さまざまな領域で勢いを増しました。

IOTの急増によって、データ、およびデータの可能性が世界中のビジネス戦略の最前線に躍り出ました。有意義な変化を推進するデータの可能性に向けて世界が突き進むにつれて、DataOpsがエンタープライズでのデータ運用化のリーダーとして浮上しました。

第1章のForresterによる定義を見て分かるとおり、DataOpsの威力は以下の機能にあります。

「ソリューションの実現、データ製品の開発、データのアクティブ化によって、インフラストラクチャからエクスペリエンスに至るすべてのテクノロジー階層でビジネスの価値を実現する機能」

「2023年までに、組織の60%がDataOpsプログラムの実装を開始することになるでしょう。これにより、データおよび分析のエラーが80%減少し、分析結果の信頼性およびGen-D作業者の効率が向上します」

DataOpsのプラットフォームは、データ作業者が自動化されたワークフローを展開して、産業データソース(従来の運用機器やテクノロジーを含む)からデータを抽出、取り込み、統合するのに役立ちます。

DataOpsでは、データの品質、変換、強化のためのワークベンチ、さらにはデータのコンテキスト化とモデル化のために産業の知識、階層、相互依存性を適用するインテリジェントなツールを利用できます。これは、人、マシン、システムが利用する特定のアプリケーションサービスから入手できます。

definitive-guide-to-industrial-dataops-chapter-three-figure-5
図6:DataOpsのコンポーネントの対話でビジネス価値を継続的にもたらす仕組み

DataOpsの直接的な利点と間接的な利点

効率的なデータ管理

DataOpsは、指定されたガバナンス境界内でデータを安全かつ自由に操作・使用するための自動化されたデータプロビジョニング、管理ツール、分析ワークスペースにより、データ作業者の生産時間を最大化します。このアプローチによって、メタデータ管理、非構造化データ管理、データ統合など、データ管理のさまざまな側面に対応するAIベースの自動化による強化が可能になり、データ作業者はユースケースの開発にさらに多くの時間を費やせるようになります。

データアクセシビリティの向上

多くの組織において、現在のデータの使用は、サイロ全体にわたる分散、不規則な統合、1か所に集められたアプリケーションのアクセシビリティによって制限されます。データソースがどこに接続されている場合でも、データには、データの起源でドキュメントが制限されていることによるコンテキストの不足、構造またはタグ付けの不一致による情報の損失が起こりがちです。

DataOpsテクノロジーは、AIを使用して大量のデータを迅速に取り込み、コンテキスト化することができます。また、データアクセシビリティの向上により、DataOpsは組織でのビジネスクリティカルな情報へのアクセスにパラダイムシフトをもたらします。これにより、意思決定の質が改善され、リスクが軽減され、データイノベーションの障壁(およびスキル)が緩和されます。

worker-with-hardhat-and-tablet

ユースケースの迅速な開発とアプリケーションの使用可能性

DataOpsが目的としているのは、概念実証(PoC)を迅速かつ安価に設計できるようにし、その運用化とスケーリングに使用するツールを提供することによって、データの価値実現までの時間を短縮することです。

副産物としてのエンタープライズデータガバナンス

DataOpsを使用することで、企業はデータを管理するための基本原則を設定し、実施できます。このアプローチの実装に成功すると、テクノロジー、プロセス、組織の構造に一貫性とROIがもたらされ、運用のデータ品質、統合とアクセシビリティ、および管理が向上します。DataOpsのプラットフォームは、追跡、監査、マスキング、衛生のツールを使用して、データセキュリティ、プライバシー、コンプライアンスを強化する必要もあります。

definitive-guide-to-industrial-dataops-chapter-two-figure-3
図7:データ管理ソリューション

産業向けDataOpsが重厚長大企業に潜在的な価値をもたらす

産業変革の推進力となる最有力候補は、紛れもなくDataOpsです。

新たに生まれている包括的な分野としてのDataOpsの定義はビジネス環境全体にわたって意味がありますが、産業においては特に重要です。すべての組織が抱いていた従来のデータの課題が、産業分野において(運用結果と固有のデータの複雑さの両面で)さらに重要になるだけではありません。産業独自の固有の課題もあります。

データは産業のコンテキストで利用可能な、有用かつ価値のあるものでなければなりません。

産業界が変化を求めて突き進む中で、データの可能性はすぐに失望へと変わりました。デジタルの実行を示す取り組みにおいて、多くの企業がAIの誇大宣伝を受け入れています。14これによって、直ちに実証できるデジタルPoCはもたらされていますが、真に運用化された(さらに、あまりスケーリングされていない)具体的なビジネスのOPEXの価値を得るには至っていません。

産業用データの洞察の価値を十分に引き出すには、データの運用化をビジネス戦略の核にすることが不可欠です。このことは、安全性、効率性、サステナビリティにわたるミッションクリティカルなユースケースの作成とスケーリングにつながります。データは産業のコンテキストで利用可能な、有用かつ価値のあるものでなければなりません。ここで、産業組織でのDataOpsの展開に関連する重要なステップ、機会、課題について考えてみましょう。これこそが、データから十分な価値を引き出すための道です。

産業用データを利用可能にする

産業でのデジタル化の価値の潜在力を活用する最速の経路は、適切な状況において、適切な問題に対する適切なデータを適切なタイミングで適切なユーザーに提供することです。とは言え、産業用データへのアクセスは依然として容易ではないのが現実です。データはさまざまなシステムに閉じ込められたままになっているため、データサイエンティストは何時間もかけてデータを探し、意味があるように寄せ集め、分析のために準備する必要があります。

データを信頼する

産業企業は使用開始するデータを信頼できなくてはなりません。これは単純に失敗のコストが高すぎるからです。

「データを信用しない限り運用化はできません。何かが失敗した場合に監査能力を提供できなければ、産業としてはおしまいです」

Aker BP社、デジタルオペレーションマネージャー

windmill

分析対象のデータの性質を考えると、産業は特に困難な課題に直面しています。このデータは標準的な表形式のエンタープライズデータの範囲を越えています。運用から収集されたデータの大部分はプロセスと計器のデータを中心に展開し、その意味を理解するには特定分野の専門知識が必要です。

産業に非常に固有であることに加え、収集された時系列データには独特の課題が伴います。ストリーミングデータを扱う人は誰でも、データの品質と整合性がデータサイエンティストにとっての主な悩みの種であることを理解しています。データ品質の課題は確認が難しいので、常時監視の重要性を強調し、継続的に実施する必要があります。

IT/OT/ET/Xデータのコンバージェンス

従来のデータサイロは、データから価値を引き出すうえでの障害になっています。企業は産業向けDataOpsを最大限に活用して、アセットとデータのライフサイクルをIT、OT、ET (エンジニアリング技術)、X (その他のタイプ)のデータにわたって展開する統合プロセスを開始できます。結果として生成されるコンバージドデータは、組織全体で回復力のある意思決定をサポートし、本格的なデジタルツインアプリケーションの潜在能力を引き出します。

worker-sitting-down

テクノロジーの境界を越えた進歩により、IT/OT/ET/Xデータのコンバージェンスがかつてないほど可能に

IT/OT/ET/Xデータのコンバージェンスは、ITの専門家を設備技術者にすることでもなければ、マシンオペレーターをデータサイエンティストにすることでもありません(ただし、後者はそれとは関係なく実際に起こっています)。そうではなく、統一された目標とKPIを利用して運用実績を向上させるために、以前はばらばらだった特定分野の専門家(SME)、文化、プラットフォーム、OTおよびITチームが展開したデータを調整し、まとめる戦略を遂行することです。

このことは実際に、IT、OT、ET、およびその他のデータタイプ(オーディオビジュアルデータなど)をコンテキストに基づいて融合する新しいデータとデジタルプラットフォームの採用を通じて起こっています。これにより、エンタープライズ内とそのパートナーエコシステム全体の両方において、増加するデータ利用者のオーディエンスがこのコンテキスト化されたデータを便利に利用できるようになります。

definitive-guide-to-industrial-dataops-chapter-two-figure-4
図8: IOT、従来のITデータ、OTデータ、ETデータ、およびその他のデータタイプ(Xデータ)の関係

データの活用

産業データは、統合およびコンテキスト化され、産業企業の内外のすべてのデータ利用者(人間およびマシン)による安全な利用、探索、実行が可能な場合に、本当に役に立つものになります(運用目的に適したものになる)。これは、センサーデータ、プロセス図、3Dモデル、イベント履歴、アセットモデル、非構造化データを含む、各種のソースおよびフォーマットすべてを含むものでなければなりません。

コンテキスト化

データのコンテキスト化では、アセットまたは設備をさらに明確に理解するためにすべてのデータを接続し、データソースとタイプの間に意味のある関係を確立する必要があります。これにより、オペレーション全体にわたってアセットから関連するデータを探し、利用できるようユーザーを支援します。これが、産業向けDataOpsプラットフォームの核となるべきものです。

たとえば、石油技術者は油井現場の電動水中ポンプから伝送されるセンサーデータを理解しますが、データサイエンティストは理解できない可能性があります。コンテキスト化によって、アセット階層にあるポンプIDをそのセンサーデータおよび関連の作業指示書にリンクし、アセットの3Dモデルに接続します。

workers-at-powergrid

同様に製鋼業では、基礎となる化学物質および物理法則のしっかりとした知識がなければ、データサイエンティストは予測品質および鋼グレードのモニタリングの複雑さを把握できない可能性があります。ただし、この異常検出のケースでは、3Dモデルや知識グラフによってさらに多くのコンテキストが与えられる場合は、運用のコンテキストを視覚化してモデルおよびデータアプリケーションを開発できます。

産業向けハイブリッドMLOpsの有効化

産業向けDataOpsのプラットフォームでは、データドリブンの統計と物理駆動型のプロセスモデリングおよびシミュレーションの組み合わせを利用できます。各アプローチには長所と短所がありますが、この2つのハイブリッドに基づくMLモデルを使用すると、多くの場合、最良の結果が得られます。これらのツールは、ハイブリッドMLモデルを開発、トレーニング、管理するためのサードパーティ製のAIツールおよびその他の必要なツールと互換性のあるワークフローを開発者に与えます。これによって、開発者はユースケース固有のデータサブセットを効率的に、そして希望するスケールで運用化できます。

さらに複雑さを増す状況

大規模に展開している、サイロ化された産業組織には、固有の課題があります。たとえば、異なる指揮命令系統、さまざまな分析ワークフロー、相反するビジネス上の利益、さまざまなインセンティブなどがあります。産業が複雑さから解放されるには、ツールとテクノロジーが変化の原動力とならなければなりません。

さらに追い打ちをかけるように、AI/MLの台頭と、データサイエンティストを見つける困難さとが相まって、データモデリング、データソースの可用性、データ整合性、すぐに使用できるコンテキストメタデータに独自の要件が課せられています。多くの場合、これらの要件は従来のBIユーザーの要件と大きく異なります。

産業のデジタル化プロジェクトに従事するデータエンジニアは、2010年の非産業分野を連想させるやり方で、主要なソースシステムデータへのアクセスに取り組んでいます。たとえば産業企業は、小売業の他社と同じ課題に直面しているだけでなく、IT/OTコンバージェンスの結果として生じる課題、ならびに関連する非従来型のITのみのデータ速度、多様性、および量に基づく課題の上位セットも示されています。

definitive-guide-to-industrial-dataops-chapter-two-figure-5
図9: A 関連するワークフローの課題を伴う典型的な分析のデータパイプライン

データの価値を高める

データの価値を最大限に引き出すには、高度なモデルを適用して最適な意思決定に導く洞察を生み出し、オペレーターが自信をもって行動できるようにする必要があります。要するにこれは、価値を引き出すためにデータを運用化して本番環境に移すということです。

高度なモデルでは、データサイエンスと物理学を組み合わせて合成データと高度な洞察を生み出します。これは、スケールのための機械学習と深層学習で補完されます。信頼性ある予測と実行可能な洞察をもたらすには、観察、分析、最適化が非常に重要です。

DataOpsの民主化

産業向けDataOpsのプラットフォームは、ローコードまたはノーコードのアプリケーション開発ツールとモデルのライフサイクル管理ツールによってデータユーザーを支援します。これにより、DataOpsが民主化され、より協調的な作業モデルが促進されます。ここで、専門家ではないデータユーザーは、データ管理タスクを実行し、指定されたガバナンス境界内で高度な分析を独自に開発できます。データの民主化は、プロセスの知識の保存と技術的な継続性の維持に役立ちます。したがって新人のエンジニアは既存のモデルをすばやく理解し、管理し、その価値を高めることができます。

概念実証の先へ

往々にして、デジタル運用のイニシアチブはパイロットのスケーリングに時間がかかりすぎたり、費用が掛かりすぎたりといった「PoC地獄」に陥ります。足を引っ張っているのは、IT/OTとOT/データサイエンスの分断に加え、コンテキスト化された品質データの作成とアクセスを大規模に実施できないことです。

産業向けDataOpsのプラットフォームは、データユーザーを本質的に異なる運用・制御データのソースに接続することによって、ユースケース運用化の途上にあるこうした分断の穴埋めをします。標準的な産業のユースケースのMLライブラリのおかげで、開発者はデータの収集およびモデルの開発とトレーニングの時間を節約できます。データサイエンティストはこのライブラリを活用し、コンポーネントレベルのデータとともに使用できます。ユースケースが開発され、工場の1つのコンポーネントの成果が満足できるものとなったら、アセットデータのコンテキスト化によって工場またはフリートのレベルにスケーリングできます。

chains

重厚長大産業での一般的なユースケースの例として、メンテナンスワークフローの最適化、エンジニアリングシナリオの分析、インタラクティブかつ共有可能にするためのアセットP&ID図(配管計装図)のデジタル化、アセット管理をサポートする3Dデジタルツインモデルなどがあります。

産業向けDataOpsを採用するときの考慮事項

IT/OT/ET/Xデータの潜在力を余すところなく引き出し、従来の運用モデルを一変させるために、重厚長大産業の組織は産業向けDataOpsに目を向ける必要があります。産業向けDataOpsを開始するときは、以下を考慮する必要があります。

  • AIとは、事実に基づく意思決定にも、その意思決定をサポートするデータの効率的な管理にも対応する重要なツールであると考えてください。人間による「中間点」でのデータ処理を省略することが重要です。
  • DataOpsの価値を十分に得るには、「データの民主化」が非常に重要です。データ抽出能力を最大化することで、既存のITおよびOTアーキテクチャでDataOpsを実現しやすくなります。これにより、追加のシステム統合およびOTデータソースへの投資の必要性が抑えられます。
  • IT/OT/ET/Xデータに対応する強力なデータガバナンスモデルを構築します。これにより、どのように新しいデータが接続され、データアーキテクチャ全体に統合されるのかが決まります。これは、データおよび分析ビジネスユーザー数の増加にも対応します。
  • データの集中化よりもデータの整理を優先します。対象となるユースケースの明確なリストを考慮して、関連するすべてのデータソースの接続およびマッピングの推進を開始します。ガバナンスモデルの一部として、新しいデータソースにはすべて、接続、タグ付け、共有、および統合計画が必要です。
  • DataOpsのプラットフォームすべてに同じ能力が備わっているわけではありません。目標、産業での実績、および特定分野の専門知識を調整するには、選択基準を推進する必要があります(プロバイダーの評価の完全なガイドについては、付録を参照)。

理論から実践へ

前章までで述べたとおり、産業向けDataOpsでは、組織は順調なスタートを切るために重要な策を講じる必要があります。第一に、データ関係者間での強力な結束が必要です。データサイエンス部門とIT部門はデータアクセスとリソース割り当ての範囲をはるかに超えて協力する必要があります。これに対し、事業部門は一般的な需要および検証のステージをはるかに超えてデータプロジェクトに関わる必要があります。

組織の分断によって、企業は大規模なデータにアクセスできなくなるため、アセット分析パイロットが長期化し、運用化のコストが高くなりすぎます。こうした組織および運用上の溝を埋めることは、重点的な取り組みとリーダーシップが要求される調整策です。

tank-ship

適切なツール(機能が豊富で、直感的、スケーリングが容易なツール)の展開によって、永続的で積極的な変化を促進することができます。