Databricks

Databricks とは

2013年にカリフォルニア大学バークレー校から発祥したグローバルで唯一のデータ&AI企業です。
設立7年で5,000以上の世界のリーディング企業に導入されており、2020~2021年のガートナー社によって発表された、データサイエンス & 機械学習部門における、マジック・クアドラント・レポートでは、2年連続リーダー企業に指名されています。
Apache Sparkのクリエーターによって創立され、データエンジニアリング、機械学習、アナリティクスなどのデータプロジェクトを支えるためのオープン、且つ統合されたプラットフォームを提供しています。

単なるクラウドシフトではなくビジネス変革を推進

データ・エンジニアリング、データ・サイエンス、データ・アナリティクスの分野において、イノベーションを加速させる統合データ分析基盤を提供します。
高速な分散フレームワークであるSparkをベースとしており、構造化/非構造化データに加え、バッチ/リアルタイム処理をすることができます。

Databricks 概要

データのサイロ化を解決

  • 構造化 & 非構造化データを統合して管理可能
  • 常時処理(ストリーミング) & 都度処理(バッチ処理)の処理プロセスを統合可能
  • BIツールから直接データレイクにアクセス可能

データチームの生産性を向上させます

  • データ解析のインフラ構築/管理は一切不要
  • 1つの共同の仮想ワークスペースを用意
  • ブラウザーベースで異なる職種のユーザーがインタラクティブに協業可能

高速処理 & 大量データへの対応

  • 並列分散処理アルゴリズムにより、超膨大なデータ量に対しても高速処理が可能
  • データの”保存”と”処理”を構造上で分離

データ分析基盤の柔軟性とオープン性を担保

  • 従量課金モデルを選択可能
  • オープンソースベースの技術を採用
  • 複数のクラウド事業者にて同じ機能/環境を利用可能

Databricksの統合データ分析プラットフォーム

データのサイロ化を解決

  • 構造化 & 非構造化データを統合して管理可能
  • 常時処理(ストリーミング) & 都度処理(バッチ処理)の処理プロセスを統合可能
  • BIツールから直接データレイクにアクセス可能

BI & SQL アナリティクス

ネイティブのクエリと視覚化機能に加えて、既存のあらゆるBIアプリケーションをサポートしています。Delta Lakeテーブルとの接続は容易かつ信頼性が高く、主要な認証ソリューションとの統合も可能です。

SQL ネイティブなインターフェース
データアナリストは使い慣れた構文でクエリを記述し、Delta Lakeテーブルスキーマを容易に探索できます。

容易な視覚化とダッシュボードの共有
直感的なドラッグ&ドロップインターフェースにより、視覚化された分析結果がダッシュボード上にわかりやすく表示されます。ダッシュボードへはWebブラウザからアクセス可能です。ダッシュボードの自動更新および、重要な変更についてのアラートの設定がサポートされており、組織内外の関係者間で常に最新の情報を共有できます。

データチームの生産性を向上させます

  • データ解析のインフラ構築/管理は一切不要
  • 1つの共同の仮想ワークスペースを用意
  • ブラウザーベースで異なる職種のユーザーがインタラクティブに協業可能

コラボレーション可能なノートブック

高速処理 & 大量データへの対応

  • 並列分散処理アルゴリズムにより、超膨大なデータ量に対しても高速処理が可能
  • データの”保存”と”処理”を構造上で分離

超高速性能
Apache Spark™ を基盤とする Delta Lake は、大規模なスケーリングと高速性を実現します。インデックス機能などの最適化により、ETLワークロードの実行が最大48%高速化したことが実証されています。

コロンビアスポーツウェア社 導入事例
クラウドで切り拓く
小売業界のデータドリブンな新時代

https://databricks.com/jp/customers/columbia

データ分析基盤の柔軟性とオープン性を担保

  • 従量課金モデルを選択可能
  • オープンソースベースの技術を採用
  • 複数のクラウド事業者にて同じ機能/環境を利用可能
  • Databricks on AWS
  • Azure Databricks
  • Databricks on Google Cloud

AWS、Azure、GCPのそれぞれのプラットフォームで、Databricksをすぐに利用できるようにプリセットされています。

Databricksマーケットプレイス

Databricksマーケットプレイスに、ジールが提供しているオープンデータ提供サービス「CO-ODE(コ・オード)」を載せています。
Databricksマーケットプレイスは、 Databricksのプラットフォーム上で様々な企業が提供するサードパーティーデータを利用できる仕組みです。
気象データ・人口データ・家計調査データ・有価証券報告書データ・人流データなどを簡単に使えるため、
自社データに掛け合わせることで、要因分析・原因分析・将来予測に利用することが可能です。

オープンデータ提供サービス「CO-ODE(コ・オード)」については、以下のリンクよりご覧いただけます。

ジールが用意する導入支援サービス

  • Databricksコンサルテーションサービス
  • Databricksインテグレーションサービス
  • Databricks日本語トレーニングサービス(ジール独自の日本語コンテンツ)

関連事例

お客様が実現したいことに寄り添ったご提案をいたします。
少しでも気になることがございましたら、まずはジールまでご相談ください

無料お役立ち資料のダウンロードはこちら

無料お役立ち資料

Webでのお問い合わせはこちら

無料相談・お問い合わせ