共有する

機械学習(ML)とは

機械学習(ML)とは
テラデータでは、機械学習は、大規模なデータを使って仮説を検証し、状況の変化に応じてビジネスルールを改善し、異常値や外れ値を迅速かつ正確に特定することができるため、ビッグデータの中でも特に強力であると捉えています。

TechTargetは機械学習をこう定義しています。「人工知能 (AI) の一種で、明示的にプログラムされていなくても学習する能力をコンピューターに与えるもの。機械学習は、新しいデータに触れたときに成長や変化を自ら教えることができるコンピュータープログラムの開発に焦点を当てています。機械学習のプロセスは、データマイニングに似ています。どちらのシステムも、データを検索してパターンを探します。しかし、機械学習では、データマイニングのように人間が理解できるようにデータを抽出するのではなく、プログラム自身の理解を深めるためにデータを利用します。機械学習プログラムは、データのパターンを検出し、それに応じてプログラムの動作を調整します。」

機械学習ベースのソフトウェアシステムは、大量のデータを使用して学習し、また経験に基づいて行動を学習するため、問題解決において機械学習の能力が発揮できるようになっています。

機械学習は何に使われるのですか?
画像認識:機械学習の最も重要な適用例の1つである画像認識は、デジタル画像内の特徴や物体を識別、検出する方法です。この同じ手法は、パターン認識、顔検出、顔認識、光学式文字認識など、さらに多くのシナリオに使用できます。機械学習を画像認識に使用するには、画像から主要な特徴を引き出し、それらの主要な特徴を信頼性の高い機械学習モデルに移行する必要があります。

データ検索: データ検索して知られる、非構造化データから知識や構造化データを引き出すプロセスは、使用されている多くのデバイスによって作成される膨大な量のデータのため、機械学習のもう一つの重要な用途です。ビッグデータに関しては、非構造化データを取得し、そこに含まれるインサイトを抽出するために、機械学習が不可欠です。

センチメント分析:センチメント分析プロセスは、オピニオンマイニングや感情分類とも呼ばれ、個人の文章内の感情的な手がかりに基づいて個人の態度を判断します。センチメント分析の目的は、人々が何を考えているか、良いのか悪いのか、あるいは無関心なのかを判断することです。レビューサイトや意思決定アプリなどにも、センチメント分析が役立っています。機械学習は、教師ありと教師なしの学習アルゴリズムがあり、どちらもセンチメント分析に使用されます。

不正検出:不正検出、特にオンライン詐欺検出は、機械学習のより高度なアプリケーションであり、ユーザーにサイバーセキュリティを効率的に提供し、さらには企業が損失を減らして利益を最大化する方法を提供します。機械学習を使った不正検出は、従来の不正検出方法よりも圧倒的に優れています。

顧客のショッピングに関する推奨事項: 顧客がよく利用するオンラインショッピングサイトでは、機械学習により、製品、サービス、特典など、顧客にとって魅力的なオファーを提供することがあります。推奨システムには、教師あり、教師なし、強化などの機械学習が不可欠です。

様々な種類の機械学習があるのですか?
機械学習アルゴリズムの種類を定義する方法にはいくつかのバリエーションがありますが、一般的には目的に応じてカテゴリに分けられ、主に以下のように分類されています。

教師あり学習:入力と出力の両方のパラメーターを持つラベル付きデータセットでモデルを学習します。訓練データセットと検証データセットの両方にラベルが付けられます。

半教師あり学習: 通常、少量のラベル付きデータと大量のラベルなしデータを用いて学習します。

教師なし学習: 自己組織化とも呼ばれる教師なし学習は、既存のラベルがないデータセットから未知のパターンを見つけるために使用され、与えられた入力の確率密度をモデル化することができます。

強化学習:ソフトウェアエージェントが、ある累積報酬を最大化するために、環境内でどのように行動すべきかを扱います。教師あり学習とは異なり、ラベル付きの入出力ペアは必要なく、最適でないアクションを明示的に修正する必要もありません。診断と効果的な利用のバランスを取ることが重要です。

機械学習と深層学習の違いは何ですか?
機械学習と深層学習の基本的な違いは、以下の通りです。

仕組み
機械学習は、入力されたデータをもとに、将来の意思決定の予測や機能のモデル化を学習する自動アルゴリズムを使用します。
深層学習は、データの特徴や関係性をニューラルネットワークを用いて解釈し、関連する情報を複数の段階のデータ処理に通します。

管理、方向性
機械学習では、アナリストがアルゴリズムに指示を出し、様々なデータセットの変数を調べます。
深層学習では、アルゴリズムは通常、関連するデータ分析のために自己管理されます。

データポイントのボリューム
機械学習では、数千のデータポイントを分析に使用します。
深層学習では、数百万のデータポイントを分析に使用します。

出力
機械学習の出力は、通常、スコアや分類などの数値です。
深層学習の出力は、スコア、要素、テキスト、サウンド、その他の識別子など様々です。

機械学習と人工知能の違いは何ですか?
それぞれの特徴

機械学習(ML)は、知識やスキルの習得です。
人工知能(AI)は、知識を習得し、応用する能力です。

それぞれの目的
AIは正確さではなく成功率を重視します。
MLは成功率ではなく正確さを重視します。

それぞれの目的
AIは「スマート」コンピュータプログラムとして機能します。
MLは、データを取り込み、データから学習するシンプルなマシンです。

それぞれの目的
AIは、自然な知能をシミュレートすることで、複雑な問題を解決します。
MLは、タスクに焦点を当て、指定されたタスクに対してマシンが最大限のパフォーマンスを発揮するように働きます。

それぞれの役割
AIは、データに基づいて意思決定を行います。
MLは、取り込まれたデータから学習していくシステムです。

何を創るか
AIは、特定の状況下で人間の反応や行動を模倣するシステムを開発します。
MLは、自己学習型のアルゴリズムを生み出します。

それぞれの最終的な製品
AIはインテリジェンス(ビジネス、消費者、市場など)を生み出します。
MLは、さらに検討可能な知識を生み出します。