テラデータ、Open Table Format(OTF)の Apache IcebergとDelta Lakeのサポートを開始

2024年5月15日 | サンディエゴ発

最新のオープンソースのデータレイクストレージツールとの新たな統合により、 生産性を向上し、AI活用を加速

[2024年4月30日にTeradata Corporationより発表されたプレスリリースの抄訳です]

TeradataNYSE: TDC)は本日、Open Table FormatOTFApache IcebergLinux Foundation Delta Lakeサポートを開始したことを発表します。これは、業界におけるオープンソース指向の転換点を支援するもので、データマネジメントにきわめて多彩な選択肢を提供します。今回の発表は、2024年第2四半期中にAWSおよびAzureの各マーケットプレイスでの一般プレビューが予定されているクラウドネイティブなAI向けデータ分析基盤「Teradata VantageCloud Lake」およびオンデマンドのクラウドネイティブなAI/MLエンジン「Teradata AI Unlimited」が、さらに先見性に富んだ機能およびテクノロジーを搭載したことを意味します。徹底したオープン性とクラウド指向を追求したこのTeradataのアプローチは、今後必須となることが予想される様々なテクノロジーにも対応できるよう設計され、今日の企業が、信頼できるAIを大規模展開して最先端のデータ戦略を推進できるよう、比類ない俊敏性と柔軟性を備えています。

 

各種OTFいずれも、個々に独立したデータストレージを脱しさまざまなプラットフォーム間を横断して使用できるよりオープンで柔軟なストレージへと向かう大きな変化を象徴するフォーマットであり、相互運用性や選択肢を拡大しつつ、高いコスト効率を指向するものです。一方、OTF対応によるオープン性を謳う既存の各種製品に対しては、ユーザーが規定のフォーマットに拘束され、現在および将来のユーザーが期待する創造性やイノベーションが阻害されるリスクが懸念されていました。

 

今回Teradataが発表した、特定のフォーマットに依存しないマルチOTFサポートおよびオープンカタログ統合予測能力を備えた実行モデルにより将来にわたり様々なデータカタログを読み込めるよう設計されています。オープン性においても業界をリードするTeradataのプラットフォームは、Apache IcebergおよびLinux Foundation Delta Lake OTFのファーストパーティサービスを提供し、複数のOTFに格納されたデータのクロスリードおよびクロスライトを完全サポートします。この相互運用性は、AWS GlueUnityApache Hiveカタログにも拡張されマルチクラウドおよびマルチデータレイク環境で機能しデータ移動変換を要することなく、論理的に統合されたデータ体験提供されますまた共有データの並列処理、ワークロード管理、クエリ最適化に対する独自の実装とアプローチにより、市場における最高レベルのパフォーマンスを発揮します

 

ISGグループのVentana Research社のエグゼクティブ・ディレクター David Menninger氏は次のように述べています。今日、51%の企業Delta Lakeを、27%の企業Apache Icebergを積極的に採用し、オープンテーブル形式が広く採用されています。この傾向は、業界が単一のデータソースと、そのデータに対して複数のエンジンを活用できる能力に注目していることを示しています。TeradataOTFへのコミットメントは、これらのフォーマットで動作するTeradata VantageCloud LakeTeradata AI Unlimitedエンジンの導入と並んで、顧客が低コストのストレージとエンタープライズのパフォーマンスや機能を組み合わせることを可能にします

 

Teradataの最高製品責任者 Hillary Ashtonは、次のように述べています。

「これからはオープンの時代です。Teradataは、長年にわたり活発なエコシステムを構築してきました。OTFの採用や、オンデマンドAI/MLの提供拡大は、クラウド分析やデータに最適な最もオープンかつコネクテッドなエコシステムを企業に提供することに対するTeradataの真摯な取り組みを示すものです。そして、企業が自社のエコシステムに「信頼できるAI」を導入したい場合にきわめて重要な観点は、それがイノベーションの加速や生産性の向上などの大きなメリットを提供するというだけでは足りず、透明性や説明責任など、データが信頼できるものであることを担保する様々な機能を強固にサポートしているかどうかを見極めるべき点です」

 

AI活用は、データウェアハウス、アナリティクス、データサイエンスのワークロード統合されたレイクハウスへと急速にシフトさせています。OTFのサポートは、Teradataのレイクハウス機能をさらに強化し、柔軟性、コスト効率、使いやすさを追求したストレージ抽象化レイヤーを提供します。ユーザーは、独自のクラウド・オブジェクトストアで、独自のデータセットに対してTeradata AI Unlimitedやその他の分析エンジンを活用でき、データ移動などに伴う工数課題や費用を伴うことなく、俊敏で最適なアプローチを採用できます。

 

Teradata AI Unlimitedについて

AIデータセットは、今日、OTFを使用する最も一般的な方法の1つです。Teradata AI UnlimitedのようなAIモデルの開発と実装を加速するためのプラットフォームが、このデータ形式をサポートすることは非常に重要です。Teradata AI Unlimitedは、完全にオープンでコネクテッドなオンデマンドかつクラウドネイティブなAI/MLエンジンで、今回、OTFをサポートしました。Teradata AI Unlimitedは、AWSとAzure Marketplacesで間もなくリリースするパブリックプレビュー版を提供します。データサイエンティスト、データエンジニア、開発者は、AIプロジェクトを大規模に調査、実験、運用することができます。

 

Teradata AI Unlimitedは、高性能な演算能力、大規模な並列処理、AIワークロードの実行と運用に必要な高度なIn-Databaseアナリティクスを提供します。AWS SageMakerとAzure Machine LearningはTeradata AI Unlimitedのワークロードに統合でき、Azure OpenAI Servicesは生成AIアプリケーションの開発に使用できる大規模言語モデル(LLM)を提供します。Teradata AI Unlimitedでプロトタイプを作成したモデルは、Teradata VantageCloud上でスムーズに本番稼動に移行することが可能であり、企業は迅速かつ大幅なビジネス価値を獲得することができます。

 

Teradata AI Unlimitedには、信頼できるAIに必要な透明性、説明可能性、再現性を提供する業界をリードするTeradataの強力な分析機能ClearScape Analyticsを含みます。

 

Teradata AI Unlimitedとの新たな統合について

OTFとTeradata AI Unlimitedは、データの移動やレプリケーションの必要性だけでなく、データストレージのコストも最小限に抑えることで、AIワークロードのコストと複雑さを軽減します。また、モダンデータスタックの一部であるAirbyte Cloud、Apache Airflow™、dbt™(data build tool)といったサードパーティツールと新たに統合しました。これらの統合は、データパイプラインの構築を加速し、データエンジニアを反復作業から解放し、生産性を向上させ、収益性の高い成長を促進します。

 

  • Airbyte Cloud:Teradata VantageCloudへのデータ取り込みを効率化するフルマネージド・ホスティングサービスにより、時間のかかるインフラのセットアップや管理が不要になります。
  • Apache Airflow:ワークフローをプログラムで作成、スケジュール、監視します。
  • dbt(data build tool):ELT(Extract Load Transform)のT(Transform)を管理し、データベース、データレイク、データウェアハウスにおけるデータ変換します。

提供状況

  • OTFのサポート2024年6月にAWSとAzure上のTeradata VantageCloud LakeとTeradata AI Unlimitedで利用可能となります。
  • Teradata AI Unlimited:2024年第2四半期にパブリックプレビューとして、AWSとAzureのマーケットプレイスで提供予定です。
  • Airbyte Cloud、Apache Airflow、dbtとの統合:現在利用可能です。詳細はこちらのブログ記事をご覧ください。 

 

投資家の皆様へ

本リリースには、1934年証券取引所法第21E条に定義される「将来予想に関する記述(forward-looking statements)」が含まれています。将来予想に関する記述は一般的に、特に将来予想される財務および営業業績、事業動向、流動性、市場環境などに関する意見、確信、予測に関するものです。これらの将来見通しに関する記述は、現時点での予想や仮定に基づいており、多くの場合、「期待する」、「努力する」、「先を見通す」、「見通し」、「指針」、「予測する」、「予想する」、「継続する」、「計画する」、「推定する」、「信じる」、「予定する」、「だろう」、「可能性が高い」、「意図する」、「可能性がある」などの言葉や同様の表現で特定することができます。本リリースにおける将来予想に関する記述には、Open Table Format(OTF)とデータプラットフォームTeradata VantageCloudおよびTeradata AI Unlimitedとの統合によって提供される可用性、機能、および利点に関するにTeradataの予想が含まれます。  将来の見通しに関する記述には、情報技術業界、データ分析ビジネス、人工知能機能の急速な変化と激しい競争の性質、人工知能(AI)を含む新製品および既存製品、製品機能、サービスのタイムリーかつ成功裏の開発、生産、買収、可用性、および/または市場での受け入れ、ならびに米国証券取引委員会へのテラデータの提出書類に随時記載されるその他の要因に関連するものを含め、実際の結果が大きく異なる原因となり得るリスクと不確実性が含まれています。また、最新の年次報告書(Form 10-K)、その後の四半期報告書(Form 10-Q)または最新報告書(Form 8-K)、およびTeradataの年次株主報告書など、Teradataが米国証券取引委員会に提出する書類に随時記載されるその他の要因も含まれます。Teradataは、法律で義務付けられている場合を除き、新たな情報、将来の出来事、その他の結果にかかわらず、将来予想に関する記述を公に更新または修正する義務を負いません。

Teradataについて

Teradataは、より良い情報が人と企業を成長させると信じています。Teradataが提供する最も包括的なAI向けクラウドデータ分析基盤は、信頼できる統合されたデータと信頼できるAI/MLを提供し、確実な意思決定、迅速なイノベーション、価値あるビジネス成果を実現します。詳しくは、Teradata.jpをご覧ください。

テラデータからもっと見る