BIとは? 図で理解するBIの構造と仕組み | VizHacker

BIとは? 図で理解するBIの構造と仕組み

今回はBIそのものについて、考えてみようと思います。

AIと同じ様に、漠然としていていますが意外と奥が深く面白いテクノロジーです。

BIを活用するには、そもそもBIとは何かから理解する必要があります。

 

BIとは

ビジネスインテリジェンス(英: Business IntelligenceBI)は、経営・会計・情報処理などの用語で、企業などの組織のデータを、収集・蓄積・分析・報告することで、経営上などの意思決定に役立てる手法や技術のこと[1]

出典:wikipedia『ビジネスインテリジェンス』

 

出典にもあるように。BIとは一言で言うと「BigDataを収集・統合・分析をしたのち、組織の意思決定に役立てる技術」です。

よく、Tableau =BI、と言われますが私はそれは正確ではないと思います。

というのもTableauはあくまで「データを可視化することに秀でたツール」です。

Tableauのみではデータの収集からそれをビジュアライズするところまで一貫して行うのは困難です。

TableauはBIのパーツの1つである、と私は考えています。

BIは何か特定のテクノロジーというより、「BigDataをビジネスに役立てるような形へ変えていくフローそのもの」と言えるのかもしれません。

同時に、BIツールにデータを取り込めばなんとかなる、と言うほど単純なものでもありません。

 

では、BIの構造はどのようになっているんでしょうか。それを次に解説します。

 

BIの構造とは?

データはどのように回収されて、そしてダッシュボードなど人が末端で見る形まで変化していくのか、図が一番わかりやすいので以下にまとめました。

要素としては、「ETL」「DWH」「データマート」「BIツール」がメインとなります。

(正確にはキューブ、データモデル、スタースキーマも含まれますが便宜上今回は省略します。)

①ETL

Extract Transform Loadの略。データを目的に合わせた使いやすい形に加工・統合し、別の場所へ書き込むこと

②DWH

Data Ware Houseの略。分析に適したデータをまとめて格納する巨大なデータベース。

③データマート

DWHから、目的に合わせて必要な分だけデータを切り出して作成したテーブル。

④BIツール

③で作成した、テーブルを読み込んでビジュアライズして、人・組織が活用できる形にするツール。

大雑把に分けると以上のようになります。

 

これだけだとまだ実感が湧かないので、具体例に当てはめてみます。

 

具体例でみるBI活用

設定は、「あるEコマース事業の会社・たぶろう商店が1ヶ月の分析レポートを作成している」としましょう。

①ETL

Eコマース事業なので、データとしては「顧客データ」「売上データ」「商品データ」「webアクセスデータ」「配送データ」を活用したい。

現在は、データは別々に収集しているがそれらを統合し、

「どのお客さんがどの商品を買っていて、それら商品の発送状況」

「売れている商品のwebアクセスはどのくらいで、どの層のお客さんに見られているか」

などを関連づけられるようになります。

②DHW

①で統合したデータは、日々蓄積されていきます。

たぶろう商店は2年前からEコマース事業を動かしているので、2年分の膨大なデータをGoogleのインフラサービス、Google Cloud Platformに格納。

※他サービスとして、AWSやMicrosoft Azureなどもあります。

③データマート

DHWの2年分のデータをTableauなどのBIツールに読み込ませるのはほぼ不可能です。容量が莫大すぎてクラッシュします。

なので、その場に応じて部分的に切り出す必要があります。ここでは2年分のデータから、

「最近の売上状況が知りたいから、直近1ヶ月分のデータを持ってくる」「DHWのデータから集計されたテーブルを作成する」

などとなります。具体的操作としてはSQLなどで処理をしてテーブルを作成する、といったところです。

④BIツール

必要なデータが準備できたら、後はビジュアライズしてアウトプットとして出すのみです。

今回の例でいうと、直近1ヶ月の売上分析ダッシュボードとかでしょうか。

製品ごとの売上や、webアクセスの推移などが閲覧できます。

ビジュアライズすることで、初めはただの数字の羅列・集合に過ぎなかったデータが意味のあるものに生まれ変わっていきます。

 

BIのメリットと使用者が理解すべきこと

以上の工程全てを総合して、「BI」となっていると私は思います。

ではBIの導入のメリットは何でしょうか。

それは、「誰でも必要なデータを分析し、高速で意思決定をできること」の一言につきます。

一箇所に集められた組織に関わるデータが、BIツールの簡単な操作により、誰でもデータに接続し活用できるのです。

 

引用:企業におけるデータ活用のフェーズをまとめてみる

打って付けの資料があったので引用しました。

「誰でも必要なデータを分析し、高速で意思決定できる」というフェーズは、4段階目の「民主化」にあたります。

それは裏を返せばユーザーならば誰でもデータを弄くり回せるセキュリティ的にアカン状況なので、

正しいガバナンスを効かせて、次のフェーズへと移っていきます(Tableau Serverがそれに近いソリューションですね)

 

ここで一番重要なのは、「今自分(自社)はどの工程をしているのか」を把握すること。

BIというのは、工程ごとにそれぞれの製品やサービスが要素となって構成された集合体です。

TableauでETLを行うのは困難ですし、BigQueryでビジュアライズするのは不可能です(当然ですが)

ETLをメインで行っている領域に対し、Tableauの価値訴求をするのはお門違いですし、「ビジュアライズの必要性がある領域」で価値訴求をするべきです。

それを理解していないと、BI万能説が流布してしまいます。

領域・工程に応じてテクノロジーを使い分けるためにもデータ活用の工程を把握しておく必要があります。

本サイトではリクエスト募集しています。