皆さんはDataOpsという言葉をお聞きになったことがあるでしょうか?DataOpsは比較的新しい概念で、デジタルトランスフォーメーションにも関わるデータに対する取り組みです。本記事ではDataOpsとは?からそのような取り組みが必要になった背景、導入の方法について解説します。
産業のデジタルトランスフォーメーションを推進する上で、産業データを円滑に活用し、データから価値を生み出すためにDataOps という概念がとても重要です。
DataOpsについて考える前提として、ITの世界で広まっている「アジャイル」、そして「DevOps」の概念を意識することが必要です。
DataOpsとは、組織をまたいだデータ管理者と利用者の間の、データフローに関わるコミュニケーションやインテグレーション、自動化を改善・強化することに焦点を置いた、協調的なデータ管理の取り組み手法です。もしかすると、外部のサードパーティーやパートナー企業もこれに関わるかもしれません。
そしてDataOpsのゴールですが、「DevOps」と非常によく似ています。「DevOps」の場合はコードですが、DataOpsの目的は、データ、データモデル、関連する成果物の生成・提供と変更管理を行い、データの業務活用を常に行うことです。
DataOps では、日々変化する環境の中でデータの価値や活用方法を改善するために、必要なレベルのセキュリティ、データ品質およびメタデータを維持しながら、テクノロジーを活用してデータ展開の自動化を行います。
つまり、簡単にまとめると、DataOpsとは、データを管理する人とデータを利用する人を結びつけ、データを大規模に運用・活用することです。DataOpsにおいては、コミュニケーションやインテグレーション、自動化、青果物の生成・提供(スケジュール通りに期待通りのレベルのデータを届けるという意味)、そして、変更管理、セキュリティ、品質、メタデータ、がキーワードになります。
産業界の現状はというと、多くの会社はデータ収集の重要性には気づき始め、業務データが分断されているデータのサイロ化の問題で苦労している会社も多いものの、総じてデータを収集やクラウドの利用は進んできています。
ただ、データを収集した後のプロセス、つまり、データを相互接続し、業務に適用し、大規模展開する段階にはまだ至っていません。本当の意味でのROIを手にするには、これら4つのプロセスが必須になります。
データから価値を生み出すために、これからの時代は残りの3つのステージ、データの相互接続から、業務運用、大規模展開、を実現することが必要です。これらが、DataOpsという取り組みが必要になった背景となります。そして、これはCogniteがまさに製品開発で注力し、実現したい分野でもあります。
Cogniteは2016年に創立されて以来、大企業と緊密に協働してきましたが、デジタル技術によりROIを実現する道には2つの側面があると考えています。
1つは、より多くのデータの活用用途を業務として適用していくこと、そしてもう1つ、さらに重要なこととして、データの活用用途を組織全体にまたがって大規模に展開していくことです。
ところが、産業界の現状について前項でお話しましたが、業務運用とその大規模展開には様々な課題があります。
主要なものを例に挙げると、OT・ITデータの分断、つまり装置運用システムと情報システムが別々に運用されているということであったり、IT部門とデータサイエンスチームの分断、データ品質の低さや、スケール能力の欠如、が挙げられます。そして、PoC (Proof-Of-Concept) から本番運用への移行が遅かったり、想定以上のコストがかかったり、あるいは完全な失敗も起こりえます。
弊社では様々な失敗事例もみてきました。例えばAIプロジェクトというと聞こえがよいのですが、PoCがすごくいいものに見えたとしても、実運用まで持っていくことができず終わってしまった、というケースです。
皆様も同じような経験や課題を抱えているのではないでしょうか?
企業が、競争力を維持するために必要なデジタルトランスフォーメーションとそのROIを達成するためには、中核的な課題に取り組まなければなりません。もちろん、これらの課題はROIを最大に引き上げるチャンスでもあります。
1つは、本番投入に至るまでのユースケース開発のコストを削減すること、そしてもう1つは、成功したユースケースを組織全体に展開することです。
これを達成した場合には、相応のメリットを得ることになります。低コストで多くのユースケース開発を行い、それらの中で成功したユースケースを実運用レベルまでスムーズに展開する、これができれば、産業のDXにおける最大の差別化要因になります。
この図は高度な分析ダッシュボードを開発するときのワークフロー、関係各所との関わりを示していますが、見ての通り、複雑で非効率的であることがわかります。
データが違う部署に存在していたり、プロジェクトマネージャーだけではなくデータサイエンティスト、エンジニア、データオーナーと非常に多くの関係者が複雑に関係していることがわかるかと思います。そのために、複数にまたがっているデータを統合し、データを活用していくためのデータプラットフォーム、つまりDataOpsのプラットフォームが必要不可欠なのです。
DataOps、つまりデータを業務運用すること、とスケーラビリティを達成した組織は、相応のメリットを得ることになります。業務運用への移行と大規模展開の達成という困難を乗り越えることは、産業デジタルトランスフォーメーションの勝ち組と負け組を隔てる、非常に大きな差別化要因になります。
Cogniteでは、お客様のDataOpsの実現のために、DataOpsプラットフォームであるCognite Data Fusionを提供しています。
Cognite Data Fusion(CDF)は重厚長大産業のDXをサポートするDataOpsおよびAIプラットフォームです。
DataOpsを実現するために、複数のシステムからのデータ統合を行います。また、タグ名などの表記ゆれなどがあった場合でも統合できるように、独自のコンテキスト化技術を提供しています。統合後はデータの活用方法に応じたダッシュボードとの連携やAPI/SDKによる外部へのデータ連携を行います。
Cogniteでは、CDFを通して、お客様の企業内にあるデータを短期間で活用する取り組みを支援しています。例えば、日本の横河電機様の事例では、時系列データ、機器情報、過去の保守履歴、取扱説明書など、横河電機様のソースシステムからデータの統合を2日間で達成しました。また、400枚の撮影した画像データから、フォトグラメトリー技術によって30分で3Dモデルを作成し、デジタルツインの構築に繋がりました。
このように、DataOpsプラットフォームを準備すれば、お客様の社内のデータ活用までにかかる時間を短縮することができます。第3社評価機関であるIDCも、DataOps実現の課題と解決方法についてまとめていますので、そちらもご覧ください。