2022-08-26 19:07:59 +00:00
|
|
|
|
---
|
2023-03-23 20:20:26 +00:00
|
|
|
|
slug: /zh/faq/general/overview
|
2022-08-26 19:07:59 +00:00
|
|
|
|
---
|
2020-03-20 18:20:59 +00:00
|
|
|
|
# 常见问题 {#chang-jian-wen-ti}
|
2018-10-09 06:53:47 +00:00
|
|
|
|
|
2020-03-20 18:20:59 +00:00
|
|
|
|
## 为什么不使用MapReduce之类的产品呢? {#wei-shi-yao-bu-shi-yong-mapreducezhi-lei-de-chan-pin-ni}
|
2018-10-09 06:53:47 +00:00
|
|
|
|
|
2018-12-25 15:25:43 +00:00
|
|
|
|
我们可以将MapReduce这类的系统称为分布式计算系统,其reduce操作基于分布式排序。其中最常见的开源解决方案是 [Apache Hadoop](http://hadoop.apache.org)。 Yandex使用他们的内部解决方案YT。
|
2018-10-09 06:53:47 +00:00
|
|
|
|
|
|
|
|
|
这些系统不适合在线查询,因为它们的延迟高。换句话说,它们不能用作Web接口的后端服务。这些系统对于实时数据更新是没有用的。如果操作的结果和所有中间结果(如果有的话)位于单个服务器的内存中,则分布式排序不是执行reduce操作的最佳方式,但这通常是在线查询的情况。在这种情况下,哈希表是执行reduce操作的最佳方式。优化map-reduce任务的常用方法是使用内存中的哈希表进行预聚合(部分reduce),用户手动执行此优化操作。分布式排序是运行简单map-reduce任务时性能降低的主要原因之一。
|
|
|
|
|
|
|
|
|
|
大多数MapReduce系统允许您在集群上执行任意代码。但是,声明性查询语言更适合OLAP,以便快速运行实验。例如,Hadoop包含Hive和Pig,Cloudera Impala或Shark(过时)for Spark,以及Spark SQL、Presto和Apache Drill。与专业系统相比,运行此类任务时的性能非常不理想,所以将这些系统用作Web接口的后端服务是不现实的,因为延迟相对较高。
|
|
|
|
|
|
2020-04-08 14:22:25 +00:00
|
|
|
|
## 如果我在通过ODBC使用Oracle时遇到编码问题,该怎么办? {#oracle-odbc-encodings}
|
2019-04-24 08:30:08 +00:00
|
|
|
|
|
2020-10-13 17:23:29 +00:00
|
|
|
|
如果您通过ODBC驱动程序使用Oracle作为外部字典的源,则需要为 `NLS_LANG` 在变量 `/etc/default/clickhouse`. 欲了解更多详情,请参阅 [Oracle NLS_常见问题](https://www.oracle.com/technetwork/products/globalization/nls-lang-099431.html).
|
2019-04-24 08:30:08 +00:00
|
|
|
|
|
2020-04-08 14:22:25 +00:00
|
|
|
|
**示例**
|
2019-04-24 08:30:08 +00:00
|
|
|
|
|
2020-03-21 04:11:51 +00:00
|
|
|
|
NLS_LANG=CHINESE_CHINA.ZHS16GBK
|