記事

何千ものデータプロダクトを生み出すデータファクトリーの構築

アナリティクスと機械学習を自動車ビジネスに統合するプレッシャーは容赦ない。自動車業界がデジタルプロミスを実現するために何が必要かをご紹介します。

Chris Hillman
Chris Hillman
2021年8月4日 7 分で読める
Building Data Factories for the Auto Industry

自動車産業が変貌を遂げるにつれて、ソフトウェアは製品の電気機械的要素と同じくらい重要になってきている。同様に、ビジネスプロセスをデジタル化し、インダストリー4.0テクノロジーをサプライチェーン全体に展開することは、データプロダクトがビジネスを変革する上でソフトウェアパッケージと同じくらい重要になってきていることを意味する。自動車産業が変化のペースに遅れないよう俊敏性と革新性を追求する中、アナリティクスや機械学習などのデータプロダクトを自動車ビジネスに統合するプレッシャーは容赦がない。しかし、デジタルスレッドを実現するためには、アナリティクスを効率的で効果的な「データファクトリー」に産業化し、何千ものデータプロダクトを生み出すことができなければなりません。

データファクトリは、ソースデータからビジネス価値を引き出すための効率的で信頼性の高いプロセスとして考えることができる。これは、孤立したインサイトを得るためのデータ収集能力だけでなく、一貫して効率的にデータプロダクトを構築する能力を意味する。これらは、コールセンターや機械オペレーターからC-suiteに至るまで、組織のあらゆるレベルで使用され、日常的に意思決定に活用されるようになります。.

エンタープライズフィーチャーストアへ

反復可能で合理化されたプロセスと共通機能の再利用が、データファクトリのコンセプトの中心にある。データサイエンティストがビジネス全体からデータにアクセスできるようになったら、次のステップは、そのデータを効率的に使用して、企業規模で真の問題を解決できるようにすることだ。個々のデジタルスレッドは、部門や機能内で価値を付加することができるが、本当の乗数効果は、個々のスレッドを形成するデータが再利用され、組み合わされ、拡張されることで生まれる。エンタープライズフィーチャーストアは、この再利用の基盤となる。

エンタープライズフィーチャストアは、データプロダクトを大規模に展開する際の基本的な課題を解決するために作成されます。データプロダクトの作業の80%は、分析データセットを形成するためのデータ検索、データクレンジング、データ統合に費やされ、実際にデータプロダクトを作成、展開する時間は残り20%しかないため、データサイエンティストやアナリストは才能を無駄にしています。

エンタープライズフィーチャーストアの本質は、有用性が実証された、事前に準備されたデータセットの管理されたリポジトリです。この「特徴量」は、データサイエンティストが予測分析モデルを構築してテストする際に作成されますが、次のモデルに移行する際に廃棄されたり忘れられたりすることがよくあります。フィーチャーストアは、有用性が実証された変換データを保存し、カタログ化することで、後続のプロジェクトや組織全体の他のデータサイエンティストが再利用できるようにします。これにより、ゼロから新しいモデルを作成する代わりに、再利用、再現性、効率性を促進します。

ステップバイステップで

エンタープライズフィーチャーストアは、モデルごとにステップバイステップで作成するのが最適である。データサイエンティストとして、製造工場のある側面における品質問題の根本原因を理解するための予測モデルを作成する仕事を任されたとしよう。ある機械から温度、振動、サイクルなどのデータを取得し、工程に投入される原材料に関するサプライチェーンデータ、シフトパターンに関する人事データ、時間帯、温度などの環境データと組み合わせるとします。これらのデータセットはそれぞれ、データの意味とコンテクストが明確になるようにキュレーションされる必要があります。このように明確にすることで、信頼性が高く、監査可能で、意味のある方法でデータを組み合わせることができるのです。

エンタープライズフィーチャーストアは、このような苦労をカタログ化し、他の人が利用できるようにする。そのため、次にデータサイエンティストがそのマシンからデータを使用する必要が生じた時には、すでにテンプレートが用意されていることになる。他の結果を予測するために新しいフィーチャーを作成することもできる。このようにして、各プロジェクトは高品質なデータと分析モデルの包括的なライブラリに貢献する。本番稼動に至らなかったプロジェクトも、クレンジングされたデータセットや文書化されたモデルという形で貢献することができるのです。

テストと検証

このアプローチによって生み出される効率性は明らかだ。しかし、ますます複雑化し、価値のあるモデルが複数のソースからのデータを接続するようになると、このような保存された変換は、信頼性、安全性、ガバナンスのためにも不可欠となるでしょう。

モデルを作成するデータサイエンティストは、ビジネスのあらゆる分野の専門家である必要はない。よく構築され、テストされ、実証された特徴量は、専門的なデータセットへのアクセスを民主化し、同時に、それが正しく統合され使用されることを保証する標準的なメタデータを作成することができる。先の例であれば、データサイエンティストは、温度センサーからのデータを使ってモデルをすぐに構築することができる。

データプライバシー規制の対象となる機密データについては、エンタープライズフィーチャーストアがデータガバナンスに大きく貢献する。適切なスケーリング機能により、保存されるデータのコピーは少なくなり、監視や能動的な管理も少なくて済む。また、十分に文書化された分析モデルは、データがどこでどのように使用され、誰がそれにアクセスできるのかという疑問に答えるのに役立ちます。

データプロダクトのテストと検証も改善される。データサイエンスモデルは、エンジニアが自動車用に作成したソフトウェアやハードウェアと同じレベルの厳密さを適用することができる。また、連続的な開発サイクルによって改良・拡張することができ、新しいモデルをより速く、より良く、より効率的に本番運用することができる。

データファクトリー

自動車業界は、美しく、効率的で、安全な製品を消費者に提供するために、複雑だが、よく整備されたエコシステムを進化させてきた。今、自動車業界は、洞察力に富み、安全で、データ主導のビジネスプロセスに適応可能なデータプロダクトを効率的に提供する必要がある。そのためには、堅牢で弾力性があり、かつ俊敏な「データファクトリー」への投資が必要であり、そこではデータサイエンティストは、常に新しいモデルのために機能を作り直すのではなく、価値を提供することに集中できる。

これまでの進化と同様、これは急激な変化ではない。このシリーズの前回のブログで述べたように、必要なデータファクトリの基盤構築には時間がかかる。しかし、その努力は反復的であり、価値を提供する各プロジェクトは、既存のデータ基盤とフィーチャーストアを活用し、拡張していく。

エンタープライズフィーチャーストアは、データプロダクトファクトリーの中核です。このフィーチャーストアを作成し、管理することで、データサイエンティストにリソース、ツール、スペースを提供し、自動車ビジネス全体におけるアナリティクスの利用を迅速に加速させるとともに、データプロダクトの作成における効率性、俊敏性、監査性を向上させます。これにより、急速に進化する自動車とモビリティのエコシステムにおいて、イノベーションを加速させる俊敏性がもたらされるのです。

Tags

Chris Hillman について

Chris Hillman is the Senior Director, AI/ML in the International region and has been responsible for developing and articulating the Teradata Analytics 1-2-3 strategy and supporting the direction and development of ClearScape Analytics. Prior to this current role, Chris led the International Data Science Practice and has worked on a large number of AI projects in the International Region focusing on the generation of measurable ROI from Analytics in production at scale using Teradata, open source and other vendor technologies. Chris has spoken regularly at leading conferences including Strata, Gartner Analytics, O’Reilly AI and Hadoop World. Chris also worked to establish the Art of Analytics practice, promoting the value of producing striking visualisations that draw people into Data Science projects, while retaining a solid business-outcome foundation.

Chris Hillmanの投稿一覧はこちら

最新情報をお受け取りください

メールアドレスをご登録ください。ブログの最新情報をお届けします。



テラデータはソリューションやセミナーに関する最新情報をメールにてご案内する場合があります。 なお、お送りするメールにあるリンクからいつでも配信停止できます。 以上をご理解・ご同意いただける場合には「はい」を選択ください。

テラデータはお客様の個人情報を、Teradata Global Privacy Policyに従って適切に管理します。