4.8 KiB
slug | title | toc_hidden | toc_priority |
---|---|---|---|
/ja/faq/general/olap | OLAPとは何ですか? | true | 100 |
OLAPとは何ですか?
OLAPは、オンライン分析処理(Online Analytical Processing)の略です。技術的視点とビジネス的視点の2つの視点から見ることができますが、非常に高いレベルではこれらの単語を逆から読むだけで理解できます。
- 処理
- いくつかのソースデータが処理され…
- 分析
- …分析レポートや洞察を生成し…
- オンライン
- …リアルタイムで行われます。
ビジネスの視点から見たOLAP
近年、ビジネス関係者はデータの価値に気づき始めました。盲目的に意思決定を行う企業は多くの場合、競争に追いつけなくなります。成功している企業のデータ駆動アプローチは、ビジネス決定を行う上で遠くからでも役立つ可能性のあるすべてのデータを収集し、それらをタイムリーに分析するメカニズムを必要とします。そこでOLAPデータベース管理システム(DBMS)が登場します。
ビジネスの観点から、OLAPは企業が継続的に計画し、分析し、運用活動を報告することを可能にし、その結果、効率を最大化し、経費を削減し、最終的には市場シェアを獲得することができます。これは社内のシステムで行うことも、ウェブやモバイルの分析サービス、CRMサービスなど、SaaSプロバイダーにアウトソースすることも可能です。OLAPは、多くのBIアプリケーション(ビジネスインテリジェンス)の背後にある技術です。
ClickHouseは、特定のドメインデータを分析するためのSaaSソリューションのバックエンドとしてよく使用されるOLAPデータベース管理システムです。しかし、いまだに第三者プロバイダーとデータを共有することを躊躇するビジネスもあり、社内データウェアハウスというシナリオも現実的です。
技術的視点から見たOLAP
すべてのデータベース管理システムは、OLAP(オンライン分析処理)とOLTP(オンライン取引処理)の2つのグループに分類できます。前者は、大量の履歴データに基づくレポートを作成することに重点を置いていますが、それほど頻繁には行っていません。一方、後者は通常、トランザクションの連続ストリームを処理し、データの現在の状態を常に変更します。
実際には、OLAPとOLTPはカテゴリではなく、スペクトラムです。ほとんどの実際のシステムはそのどちらかに焦点を当てていますが、反対の種類のワークロードが望ましい場合に備えて、いくつかのソリューションや回避策を提供しています。この状況は、多くのストレージシステムを統合して操作することを企業に強制し、それは大したことではないかもしれませんが、システムを増やすことでメンテナンスがより高価になります。したがって、最近のトレンドは、HTAP(ハイブリッド取引/分析処理)に移行しており、両方の種類のワークロードが単一のデータベース管理システムで同等にうまく処理されます。
もしDBMSが純粋なOLAPまたは純粋なOLTPとして始まったとしても、それらは競争に追いつくためにHTAPの方向に進むことを強いられます。ClickHouseも例外ではありません。最初はできるだけ速いOLAPシステムとして設計されており、完全なトランザクションサポートはまだありませんが、一貫した読み書きやデータの更新/削除のためのミューテーションのような機能は追加する必要がありました。
OLAPとOLTPシステム間の基本的なトレードオフは変わりません:
- 分析レポートを効率的に構築するには、カラムを別々に読み取ることが重要であるため、ほとんどのOLAPデータベースは列指向です。
- カラムを別々に保存すると、行の追加やインプレースの修正などの操作のコストが、カラムの数(システムがイベントのすべての詳細を万が一に備えて収集しようとする場合は膨大になる可能性がある)に比例して増加します。したがって、ほとんどのOLTPシステムはデータを行ごとに配置して保存しています。