共有する

非構造化データとは

非構造化データとは、フィルター処理されていない情報で、一定の組織化された原則を持たないデータを指します。生データと呼ばれることもあります。一般的な例としては、Webログ、XML、JSON、テキスト文書、画像、動画、音声ファイルなどがあります。非構造化データは、有用な情報を抽出するために、検索、解析されます。企業データの80%は非構造化データです。つまり、多くの人にとって最も目に見える形のビッグデータの形式であると言えます。非構造化データのサイズは、インサイトを生み出すためにスケーラブルな分析を必要とします。非構造化データは、ストレージのコストが低いため、ほとんどのデータレイクに含まれていますが、すべてのデータレイクに含まれているわけではありません。

テラデータの見解:非構造化データは、価値よりもノイズが多いです。このようなファイルに隠された価値を引き出すには、強力なスキルとツールが必要です。リレーショナル・データベースでは非構造化データを処理できないという説がありますが、これは誤りです。テラデータのUnified Data Architectureは、いくつかの方法で非構造化データを取り入れています。Teradata Databaseと競合他社は、XML、JSON、Avroなどの非構造化データを保存、処理することができます。