Active Data Warehouseとは

Active Data WarehouseとはActive Enterprise Intelligenceのビジネス戦略をサポートする製品、機能、サービス、およびビジネス・パートナーシップの組み合わせのことで、この用語は2001年にテラデータによって作られました。

詳しくはこちら

アルゴリズムとは

アルゴリズムは、数学的な「論理」または計算を行うために使用される一連のルールです。初期入力 (ゼロまたはヌル) から始まり、論理またはルールは、計算の実行、データの処理、またはその他の機能の実行に従う一連のステップとして、ソフトウェアにコード化または書き込まれ、最終的に出力につながります。

詳しくはこちら

What is an Analytics Platform?

An analytics platform is a full-featured technology solution designed to address the needs of large enterprises. Typically, it joins different tools and analytics systems together with an engine to execute, a database or repository to store and manage the data, data mining processes, and techniques and mechanisms for obtaining and preparing data that is not stored.

詳しくはこちら

Apache®Hive™とは

Apache Hive は、データの要約、クエリ、および分析のためのツールを提供するオープンソースのデータ ウェアハウス インフラストラクチャです。特に、Hadoop ファイルに格納されている大規模なデータセットや、Amazon S3 などの互換性のあるファイルシステムの分析をサポートするように設計されています。Hiveは2008年にFacebookのデータエンジニアによって開発されましたが、現在では他の多くの企業で使用されています。

詳しくはこちら

行動分析とは

行動分析は、消費者やアプリケーションが何をするのか、またどのように、そしてなぜ特定の方法で行動をするのかを理解することに焦点を当てた、ビジネス分析のサブセットです。特に、eコマースやオンライン小売業、オンラインゲーム、Webアプリケーションの分野で広く普及しています。

詳しくはこちら

ビッグデータとは

ビッグデータとは「従来のデータ処理アプリケーションで処理することが困難なほど大規模または複雑なデータセットの集合体を包括的に指す用語」のことを指します。

詳しくはこちら

ビッグデータ分析とは

ビッグデータ分析とは、ソーシャルネットワーク、動画、デジタル画像、センサー、販売取引記録など、さまざまな情報源から収集された大量のデータを分析することです。これらのデータを分析する目的は、他の方法では見えないパターンやつながりを発見し、データを作成したユーザーに関する貴重な洞察を得ることです。この洞察によって、企業は競合他社よりも優位に立ち、優れたビジネス上の意思決定を行うことができる可能性があります。

詳しくはこちら

ビジネスインテリジェンスとは

ビジネスインテリジェンス(BI)とは、意思決定やパフォーマンスを改善、最適化するための情報へのアクセスや分析を可能にするアプリケーション、インフラストラクチャやツール、ベストプラクティスなどを含む包括的な用語です。

詳しくはこちら

カスケードとは

カスケードは、Hadoop上でビッグデータアプリケーションを開発するためのプラットフォームです。計算エンジン、システム統合フレームワーク、データ処理、スケジューリング機能を提供します。カスケードの重要な利点のひとつは、開発チームに移植性を提供し、既存のアプリケーションを書き換えるコストをかけずに移動できることです。カスケード接続のアプリケーションは、MapReduce、Apache Tez、Apache Flinkを含む異なるプラットフォーム間で実行され、それらの間で移植することができます。

詳しくはこちら

CDP(カスタマーデータプラットフォーム )とは

カスタマーデータプラットフォーム (CDP) は、マーケターが管理するシステムで、永続的で統一された顧客データベースを構築するシステムです。既存のソフトウェアやマーケティング活動を補完するとともに、組織がより良い顧客関係を構築できるようにします。CDPの経験者もいれば初心者もいます。CDPの詳細については、こちらをご覧ください。

詳しくはこちら

クラウドコンピューティングとは

クラウドコンピューティングとは、インターネット (クラウド) を介して、オンプレミスサーバーやパーソナルコンピューターではなく遠隔地にあるサーバーのネットワークを利用して、データの保存、管理、処理を行うことです。プログラム、アプリケーション、その他のサービスもクラウド上で提供されるため、企業はデータセンターやその他のインフラストラクチャを構築、維持する作業やコストから解放されます。

詳しくはこちら

クラスター分析とは

クラスター分析またはクラスター化は、統計的な分類手法または活動であり、同じグループ (クラスターと呼ばれる)に属するものは互いに似ているが、他のクラスターに属するものとは異なるように、一連のオブジェクトまたはデータをグループ化することです。データマイニングや発見には不可欠なもので、機械学習、パターン認識、画像解析、バイオインフォマティクスなど、大規模なデータセットを分析する分野で頻繁に使用されます。

詳しくはこちら

比較分析とは

比較分析とは、2 つ以上のプロセス、文書、データセット、その他のオブジェクトを比較することです。パターン分析、フィルタリング、デシジョンツリー分析などが比較分析の一種です。医療分野では、大量のカルテ、文書、センサーデータなどを比較し、診断の有効性を評価するために比較分析が用いられます。

詳しくはこちら

コネクション分析とは

コネクション分析は、ネットワーク内の人、製品、プロセス、機械、システム間の相互に関係したつながりや影響を、それらの繋がりをマッピングし相互作用を継続的に監視することで発見するという、新しい学問分野です。これは、たとえば、オピニオンリーダーの影響力、外部の出来事や人物が財務リスクに及ぼす影響、ネットワークパフォーマンスを評価する際のノード間の因果関係など、ビジネス上の難問に対処するために使用されています。

詳しくはこちら

同時実行/並行コンピューティングとは

同時実行または並行コンピューティングとは、複数のコンピューティングタスクが同時に、または重複して発生するコンピューティングの形式を指します。これらのタスクは、個々のコンピュータ、特定のアプリケーション、またはネットワーク全体を介して処理されます。大規模なデータセットを処理するビッグデータ環境では、同時実行コンピューティングがよく使用されます。効率的かつ効果的に動作させるためには、タスクのスケジューリング、データの交換、メモリの割り当てに関して、システム間やビッグデータのアーキテクチャ間での慎重な調整が必要です。

詳しくはこちら

相関分析とは

相関分析とは、統計分析やその他の数学的手法を用いて、変数間の関係を評価または測定することです。相関分析は、ある特定の結果をもたらす最も可能性の高い一連の要因を定義するために使用できます。たとえば、あるオファーに反応する顧客や、金融市場のパフォーマンスなどです。

詳しくはこちら

データアナリストとは

データアナリストの主な仕事は、データの収集、操作、分析に加えて、グラフ、チャート、ダッシュボードなどの視覚化されたレポートを作成することです。データアナリストは一般的に、組織のデータ担当者として、情報資産の一貫性、完全性、最新性を確保する役割を果たします。データアナリストやビジネスアナリストの多くは、高度な技術的知識や業界の専門知識を持っています。

詳しくはこちら

データ分析とは

アドバンスト(高度な)分析やビッグデータ分析とも呼ばれるデータ分析は、従来のビジネスインテリジェンス(BI)を超える高度な技術やツールを使用して、データやコンテンツを自律的または半自律的に検証し、より深いインサイトを得たり、予測を行ったり、推奨事項を提案することです。技術としては、データ/テキストマイニング、機械学習、パターンマッチング、予測、視覚化、セマンティック分析、センチメント分析、ネットワーク/クラスター分析、多変量統計、グラフ分析、シミュレーション、複雑なイベント処理、ニューラルネットワークなどがあります。

詳しくはこちら

データアーキテクチャとは

テラデータの統合データアーキテクチャは、業界初の包括的なビッグデータアーキテクチャです。このフレームワークは、SQLおよび非SQL分析を使用して、リレーショナルリポジトリと非リレーショナルリポジトリを活用します。

詳しくはこちら

データクレンジングとは

データクレンジング(またはデータスクラビング)とは、データベースから不正確なデータや記録を検出し、修正または削除するプロセスです。

詳しくはこちら

データグラビティ(重力)とは

データグラビティ(重力)は、リポジトリ内のデータ量が増加し、使用回数も増加したときに表れます。ある時点で、データをコピーしたり移行したりすることが負担になり、コストがかかるようになります。

詳しくはこちら

データレイクとは何ですか?

データレイクとデータウェアハウスはどちらも設計パターンですが、これらは反対です。データウェアハウスは、高い同時実行性を備えた品質、一貫性、再利用、およびパフォーマンスを実現するために、データの構造とパッケージ化を実現します。データレイクは、元の生データの忠実性と長期保存に焦点を当てた設計パターンでデータウェアハウスを補完し、新しい形式の分析的な俊敏性を提供しながら、低コストで保管します。

詳しくはこちら

データレイテンシーとは

データレイテンシーとは、クエリワークロードをサポートすると同時に、ほぼリアルタイムでデータを読み込み、更新する機能のことです。

詳しくはこちら

データマートとは何ですか?

データマートは、狭いユーザーグループに対応するデータ ウェアハウス論理モデルのサブジェクト指向の切り出しです。多くのデータマートは、データウェアハウス内の完全なテーブルのデータのサブセットのみを必要とします。たとえば、マートには、販売トランザクション、製品、および在庫レコードのみを含む場合があります。ほとんどのデータマートには、4,000 個ではなく 5 ~ 20 個のテーブルしかありません。

詳しくはこちら

データマイニングとは

データマイニングとは、データウェアハウスなどの共通領域で収集および組み立てられたデータを、有用な情報に分類するためのプロセスです。

詳しくはこちら

データモデリングとは

特定の業界やビジネス機能に合わせたデータモデルは、ビッグデータプログラムや投資に対して強力な基盤や「ジャンプスタート」を提供します。

詳しくはこちら

記述的分析とは

アナリティクスの最も基本的なタイプと考えられている記述的分析は、ビッグデータを使用可能な情報の小さな塊に分割し、企業が特定のオペレーション、プロセス、または一連のトランザクションで何が起こったのかを理解できるようにします。

詳しくはこちら

エンタープライズ データウェアハウスとは

コンピューティングの世界では、データウェアハウス (DW または DWH) は、エンタープライズ データウェアハウス (EDW) としても知られており、レポート作成やデータ分析に使用されるシステムです。

詳しくはこちら

データボリュームとは

データボリュームとは、ネイティブストレージやオブジェクトストレージに保存されたペタバイト単位のデータを効率的に保存、処理する能力のことです。

詳しくはこちら

データウェアハウスとは

データウェアハウスのコンセプトは、1988年にBarry Devlin(バリー・デブリン)氏とPaul Murphy(ポール・マーフィー)氏がIBM Systems Journalに画期的な論文を発表したことから始まりました。この論文がきっかけとなり、1990年代初頭にBill Inmon(ビル・インモン)氏と Ralph Kimball(ラルフ・キンボール)氏がデータベースの実装方法をより具体的に定義し、2005年にはGartner社がさらに定義を明確化しました。現在では、クラウドやオンプレミスとクラウドのハイブリッドなど、どこにどのように実装するかということも議論の対象となっています。

詳しくはこちら

深層学習とは

深層学習は、ディープニューラルラーニングやディープニューラルネットワークとも呼ばれ、人間の脳の働きを模倣してデータを処理し、意思決定を促進するパターンを作り出す人工知能(AI) の機能です。人工知能の機械学習のサブセットである深層学習は、非構造化データまたはラベルのないデータから教師なしの学習が可能なネットワークを備えています。

詳しくはこちら

ETLとは

抽出、変換、および読み込み (ETL) とは、データウェアハウスにおいて、ソースシステムからのデータ読み取り(または抽出)、クエリーや分析に適したフォーマットへの変換、 データウェアハウスやオペレーション・データストア、またデータマートへ読み込むプロセスを指します。

詳しくはこちら

エクサバイトとは

デジタルデータの非常に大きな単位で、 1 エクサバイト (EB) は、1,000 ペタバイトまたは 10 億ギガバイト (GB) に相当します。一部の技術者は、人類がこれまでに話したすべての言葉は、5エクサバイトに相当すると推定しています。

詳しくはこちら

ファイナンスアナリティクスとは

ファイナンスアナリティクスとは、財務アナリティクスとも呼ばれ、特定のビジネスの財務データを異なる視点から分析し、ビジネス全体のパフォーマンスを向上させるための戦略的な意思決定や行動を促進するための洞察を提供するものです。ビジネス・インンテリジェンスやエンタープライズ・パフォーマンス・マネジメントに関連して、ファイナンスアナリティクスはビジネスのほぼすべての側面に影響を与え、利益の計算、ビジネスに関する質問への回答、将来のビジネス予測に重要な役割を果たします。

詳しくはこちら

Hadoopとは

Hadoopは、ビッグデータを保存、処理するための分散型データ管理プラットフォームまたはオープンソースソフトウェアフレームワークです。カットダウン分散型オペレーティング・システムと表現される場合があります。

詳しくはこちら

ハイブリッドクラウドとは

ハイブリッドクラウドは、ハイブリッド・クラウド・アーキテクチャとも呼ばれ、パブリック・クラウド、プライベート・クラウド、マルチ・クラウドなどの種類を問わず、オンプレミスとクラウドの導入を組み合わせたものです。企業のリソースがオンプレミス、プライベート、パブリック、マネージドクラウドのいずれであっても、ハイブリッドクラウドのエコシステムは、必要に応じてオンプレミス、クラウドというように、それぞれの長所の最良の状況を提供することができます。

詳しくはこちら

モノのインターネット(IoT)とは

IoTとも呼ばれるモノのインターネットは、日常的に使われている物理的な対象物や製品をインターネットに接続し、(固有の識別子によって)認識し、他のデバイスと関連付けることができるようにする概念です。この用語は、機械間通信と密接に関連しており、例えば、電力会社の「スマートグリッド」や遠隔監視などの革新的な技術の開発に使われています。Gartner社は、 自動車やコーヒーメーカーなど、2020年までに260億台のデバイスが接続されると予測しています。

詳しくはこちら

機械学習(ML)とは

機械学習(ML)は人工知能 (AI) の一種で、明示的にプログラムされていなくてもコンピューターが学習する能力を提供するものです。機械学習は、新しいデータに触れたときに成長や変化を自ら学習することができるコンピュータープログラムの開発に焦点を当てています。

詳しくはこちら

マスターデータ管理 (MDM) とは

マスターデータマネジメント (MDM) は、グローバルビジネスの分析ニーズを満たすために、複数のシステム間にまたがるデータの統一されたビューを提供します。MDMは、顧客、製品、サプライヤー、ロケーション、その他の重要な属性などについて、マスターデータとリファレンスデータの単一のビューを作成します。

詳しくはこちら

メタデータとは

メタデータとは、他のデータを記述するデータのことです。メタデータは、データに関する基本的な情報をまとめたもので、データの特定のインスタンスの検索や作業を容易にします。たとえば、作成者、作成日、更新日、ファイルサイズなどは、文書のごく基本的なメタデータです。

詳しくはこちら

混合ワークロードとは

混合ワークロードとは、単一の環境でSLAの異なる複数のアプリケーションをサポートする機能のことです。

詳しくはこちら

MongoDBとは

MongoDBは、クロスプラットフォームのオープンソースデータベースで、従来のテーブルベースのリレーショナルデータベース構造ではなく、ドキュメント指向のデータモデルを採用しています。このタイプのモデルは、構造化されたデータと非構造化データの統合を簡単かつ迅速に行うことができるように設計されています。

詳しくはこちら

自然言語処理(NLP)とは

人工知能の一分野である自然言語処理(NLP)は、人間の言語(書き言葉と話し言葉の両方)をコンピュータに理解させることです。

詳しくはこちら

パターン認識とは

パターン認識とは、大規模なデータセットや異なるデータセットの中から、アルゴリズムによって反復性や規則性を見つけ出すことです。パターン認識は、機械学習やデータマイニングと密接に関連しており、同義とさえ考えられています。

詳しくはこちら

ペタバイトとは

デジタルデータの非常に大きな単位で、1ペタバイトは1,000テラバイトに相当します。一説によると、1ペタバイトは背の高い書類棚2,000万枚分、または通常の印刷物5,000億ページ分に相当すると考えてられています。

詳しくはこちら

予測的分析とは

予測的分析とは、ビッグデータを分析して予測を行い、将来の結果、トレンド、またはイベントの可能性を判断することです。ビジネスにおいては、新製品の提供やプロモーションに対する顧客の反応、また異常気象や需要急増によるサプライチェーンへの影響など、さまざまなシナリオをモデル化するために使用されます。

詳しくはこちら

処方的分析とは

処方的分析は、予測的分析の一種であり、特定の情報状態に達したとき、あるいは条件が満たされたときに、特定のアクションを推奨したり、処方するために使用されます。アルゴリズム、数学的手法、ビジネスルールを用いて、目的(ビジネスパフォーマンスの向上など)に沿った、様々な要件や制約を認識した複数の異なるアクションの中から選択します。

詳しくはこちら

Pythonとは何ですか?

Pythonは、Guido van Rossumによって開発された、動的なセマンティクスを持つ、インタープリタ型のオブジェクト指向の高水準のプログラミング言語です。1991年にリリースされました。楽しいだけでなく、簡単に使用できるように設計されています。「Python」という名前は、英国のコメディグループ「モンティパイソン」にちなんでつけられたものです。Pythonは初心者に優しい言語として定評があり、Javaに代わって最も広く使用されている入門用言語になっています。Pythonがユーザーのために複雑な処理を行うため、、初心者は細かい部分よりもプログラミングの概念を把握することに集中することができます。

詳しくはこちら

Rとは

Rは、統計分析のためのオープンソースプログラミング言語です。コマンドラインインターフェイスといつくかのグラフィカルインターフェイスが含まれています。一般的なアルゴリズムタイプには、線形および非線形モデリング、時系列解析、分類、クラスタリングなどがあります。

詳しくはこちら

リテールアナリティクスとは

リテールアナリティクスとは、収益性を向上させる (または妨げる) ビジネス上の意思決定を行うことを目的として、小売業で発生するデータを分析することです。リテールアナリティクスの利用は、消費者行動のかつてない変化、マージンへの圧力の強まり、店舗の役割の変化、オン・オフライン両方のチャネルにおける競争の激化など、小売業の変革への対応として発展してきました。

詳しくはこちら

リスクマネジメントとは

リスクマネジメントは、ある活動に対する全体的なリスクの最大許容レベルを計算し、リスクアセスメント(評価)手法を用いて初期のリスクレベルを特定し、もし過剰であることが判明した場合には、全体的なリスクレベルが許容レベルになるまで個々のリスクを軽減する戦略を策定するプロセスであり、リスク軽減とも呼ばれています。

詳しくはこちら

RTIMとは

RTIMは、リアルタイム・ンタラクション・マネージャまたはマネジメントとも呼ばれ、リアルタイムのカスタマーインタラクション、予測モデリング、および機械学習を使用して、一貫してパーソナライズされたカスタマーエクスペリエンスをチャネル間で提供します。多くのユーザーは、マーケティング担当者がショッピング体験の重要な瞬間を即座に把握できるため、RTIMをビジネス価値向上への近道だと見なしています。マーケティングチームは、顧客満足度とエンゲージメントを最大化し、オファーをパーソナライズし、買い物客の行動をビジネス目標に合わせるために、予測分析 、AI、リアルタイムの意思決定にますます依存するようになってきています。マーケティングチームは、最高情報責任者(CIO)と協力して、データの統合、プロセスの改善、あらゆるアナリティクスアプローチの活用、さらにはビジネスモデル全体の再構築を行い、顧客体験の向上に努めています。

詳しくはこちら

半構造化データとは

半構造化データとは、従来のデータベースのフィールドや一般的なデータモデルに関連付けられているような、従来の方法で取得またはフォーマットされていないデータを指します。また、生データではなく、全く構造化されていないデータで、データテーブルやタグなどの構造要素を含んでいる場合があります。

詳しくはこちら

センチメント分析とは

センチメント分析とは、ソーシャルメディア、顧客サービス担当者への電話、アンケートなど、様々な種類のやり取りや文書の中で消費者が表現した意見、感情、感気持ちを捉え、追跡することです。

詳しくはこちら

構造化データとは

構造化データとは、強固で一貫性のある構造を持つデータセットを指します。構造化データは、内容が予測可能な行と列で編成されています。各列には、日付、テキスト、金額、パーセンテージなど、特定のデータタイプが含まれます。

詳しくはこちら

テラバイトとは

デジタルデータの比較的大きな単位で、1テラバイト(TB)は1,000ギガバイトに相当します。10テラバイトで米国議会図書館の印刷された全蔵書、1テラバイトでブリタニカ百科事典の1,000部を格納できると推定されています。

詳しくはこちら

非構造化データとは

非構造化データとは、フィルター処理されていない情報で、一定の組織化された原則を持たないデータを指します。生データと呼ばれることもあります。一般的な例としては、Webログ、XML、JSON、テキスト文書、画像、動画、音声ファイルなどがあります。

詳しくはこちら

VPCとは

VPCはvirtual private cloudの略で、仮想プライベートクラウドを指します。VPCは、パブリッククラウド環境内でホストされた個人的でプライベートな仮想ネットワーク空間です。各VPCはセキュリティで保護され、同じパブリッククラウド内の他の仮想ネットワークから論理的に分離されています。これにより、自分のVPCを完全にコントロールして、データリソースのカスタマイズや設定を行うことができます。VPCでは、コンピューティング、ストレージ、ネットワークなどのクラウド・インフラストラクチャ・リソースを展開できます。

詳しくはこちら

Vとは

ビッグデータ、およびそれに関連するビジネス上の課題や機会は、しばしば複数のVの文脈で議論または説明されることがあります。

詳しくはこちら

Want to see these concepts in action?

Explore Vantage