3.7 KiB
machine_translated | machine_translated_rev | toc_priority | toc_title |
---|---|---|---|
true | d734a8e46d |
78 | 一般的な質問 |
一般的な質問
なぜmapreduceのようなものを使わないのですか?
MapReduceのようなシステムは、reduce操作が分散ソートに基づいている分散計算システムとして参照することができます。 このクラ Apache Hadoop. Yandexのは、その社内ソリューション、YTを使用しています。
これらのシス つまり、webインターフェイスのバックエンドとして使用することはできません。 これらのシステムなに役立つリアルタイムデータの更新をした。 分散ソートは、操作の結果とすべての中間結果(存在する場合)が単一のサーバーのramにある場合、reduce操作を実行する最善の方法ではありません。 このような場合、ハッシュテーブルはreduce操作を実行するのに最適な方法です。 map-reduceタスクを最適化する一般的なアプローチは、ramのハッシュテーブルを使用した事前集約(部分削減)です。 ユーザーはこの最適化を手動で実行します。 分散ソートは、単純なmap-reduceタスクを実行するときのパフォーマンス低下の主な原因の一つです。
ほとんどのmapreduce実装では、クラスター上で任意のコードを実行できます。 しかし、宣言的なクエリ言語は、実験を迅速に実行するためにolapに適しています。 たとえば、hadoopにはhiveとpigがあります。 また、sparkのためのcloudera impalaまたはshark(旧式)、spark sql、presto、およびapache drillも検討してください。 このようなタスクを実行するときのパフォーマンスは、特殊なシステムに比べて非常に低いですが、比較的待ち時間が長いため、これらのシステムを
ORACLEをODBC経由で使用するときにエンコードに問題がある場合はどうなりますか?
外部辞書のソースとしてodbcドライバーを使用してoracleを使用する場合は、正しい値を設定する必要があります。 NLS_LANG
の環境変数 /etc/default/clickhouse
. 詳細については、 Oracle NLS_LANG FAQ.
例えば
NLS_LANG=RUSSIAN_RUSSIA.UTF8
ClickHouseからファイルにデータをエクスポートするには?
INTO OUTFILE句の使用
追加 INTO OUTFILE クエリへの句。
例えば:
SELECT * FROM table INTO OUTFILE 'file'
デフォルトでは、clickhouseは タブ区切り 出力データの形式。 を選択する データ形式、を使用 フォーマット句.
例えば:
SELECT * FROM table INTO OUTFILE 'file' FORMAT CSV
ファイルエンジンテーブルの使用
見る ファイル.
コマンドラインのリダイ
$ clickhouse-client --query "SELECT * from table" --format FormatName > result.txt
見る クリックハウス-顧客.
{## 元の記事 ##}