ClickHouse/docs/ja/faq/general/olap.md

Ignoring revisions in .git-blame-ignore-revs. Click here to bypass and see the normal blame view.

41 lines
4.8 KiB
Markdown
Raw Normal View History

2024-11-18 02:58:58 +00:00
---
slug: /ja/faq/general/olap
title: OLAPとは何ですか
toc_hidden: true
toc_priority: 100
---
# OLAPとは何ですか {#what-is-olap}
[OLAP](https://en.wikipedia.org/wiki/Online_analytical_processing)は、オンライン分析処理Online Analytical Processingの略です。技術的視点とビジネス的視点の2つの視点から見ることができますが、非常に高いレベルではこれらの単語を逆から読むだけで理解できます。
処理
: いくつかのソースデータが処理され…
分析
: …分析レポートや洞察を生成し…
オンライン
: …リアルタイムで行われます。
## ビジネスの視点から見たOLAP {#olap-from-the-business-perspective}
近年、ビジネス関係者はデータの価値に気づき始めました。盲目的に意思決定を行う企業は多くの場合、競争に追いつけなくなります。成功している企業のデータ駆動アプローチは、ビジネス決定を行う上で遠くからでも役立つ可能性のあるすべてのデータを収集し、それらをタイムリーに分析するメカニズムを必要とします。そこでOLAPデータベース管理システムDBMSが登場します。
ビジネスの観点から、OLAPは企業が継続的に計画し、分析し、運用活動を報告することを可能にし、その結果、効率を最大化し、経費を削減し、最終的には市場シェアを獲得することができます。これは社内のシステムで行うことも、ウェブやモバイルの分析サービス、CRMサービスなど、SaaSプロバイダーにアウトソースすることも可能です。OLAPは、多くのBIアプリケーションビジネスインテリジェンスの背後にある技術です。
ClickHouseは、特定のドメインデータを分析するためのSaaSソリューションのバックエンドとしてよく使用されるOLAPデータベース管理システムです。しかし、いまだに第三者プロバイダーとデータを共有することを躊躇するビジネスもあり、社内データウェアハウスというシナリオも現実的です。
## 技術的視点から見たOLAP {#olap-from-the-technical-perspective}
すべてのデータベース管理システムは、OLAPオンライン**分析**処理とOLTPオンライン**取引**処理の2つのグループに分類できます。前者は、大量の履歴データに基づくレポートを作成することに重点を置いていますが、それほど頻繁には行っていません。一方、後者は通常、トランザクションの連続ストリームを処理し、データの現在の状態を常に変更します。
実際には、OLAPとOLTPはカテゴリではなく、スペクトラムです。ほとんどの実際のシステムはそのどちらかに焦点を当てていますが、反対の種類のワークロードが望ましい場合に備えて、いくつかのソリューションや回避策を提供しています。この状況は、多くのストレージシステムを統合して操作することを企業に強制し、それは大したことではないかもしれませんが、システムを増やすことでメンテナンスがより高価になります。したがって、最近のトレンドは、HTAP**ハイブリッド取引/分析処理**)に移行しており、両方の種類のワークロードが単一のデータベース管理システムで同等にうまく処理されます。
もしDBMSが純粋なOLAPまたは純粋なOLTPとして始まったとしても、それらは競争に追いつくためにHTAPの方向に進むことを強いられます。ClickHouseも例外ではありません。最初は[できるだけ速いOLAPシステム](/ja/concepts/why-clickhouse-is-so-fast)として設計されており、完全なトランザクションサポートはまだありませんが、一貫した読み書きやデータの更新/削除のためのミューテーションのような機能は追加する必要がありました。
OLAPとOLTPシステム間の基本的なトレードオフは変わりません
- 分析レポートを効率的に構築するには、カラムを別々に読み取ることが重要であるため、ほとんどのOLAPデータベースは[列指向](/ja/faq/general/columnar-database)です。
- カラムを別々に保存すると、行の追加やインプレースの修正などの操作のコストが、カラムの数システムがイベントのすべての詳細を万が一に備えて収集しようとする場合は膨大になる可能性があるに比例して増加します。したがって、ほとんどのOLTPシステムはデータを行ごとに配置して保存しています。