相关文章
Clickhouse基本概念
Clickhouse 系统架构
ClickHouse 拥有完备的管理功能,所以它称得上是一个 DBMS(Database Management System,数据库 管理系统),而不仅是一个数据库。作为一个 DBMS,它具备了一些基本功能,如下所…
建站知识
2025/1/24 13:10:44
Clickhouse引擎三: 外部存储引擎
Clickhouse引擎三: 外部存储引擎
HDFS
Clickhouse 可以直接从 HDFS 中指定的目录下加载数据 , 自己根本不存储数据, 仅仅是读取数据 ENGINE HDFS(hdfs_uri,format) hdfs_uri 表示 HDFS 的文件存储路径; format 表示文件格式(指 ClickHouse…
建站知识
2024/10/8 12:01:07
Clickhouse引擎四: 内存引擎
Clickhouse引擎四: 内存引擎
表引擎,都是面向内存查询的,数据会从内存中被直接访问,所以它们被归纳 为内存类型。但这并不意味着内存类表引擎不支持物理存储,事实上,除了 Memory 表引擎之外,其…
建站知识
2024/12/8 10:35:18
Flink停止任务并保存savepoint
线上作业会有需求需要改动的时候, 希望不要丢失数据的进行需求迭代。注意:这中线上的任务迭代最好在数据量低谷的时候进行,对任务造成的影响最小。 需要用到一下命令:
flink取消任务并保存savepoint
flink cancel -s hdfs:///f…
建站知识
2025/1/14 13:32:13
ClickHouse 内核分析--MergeTree 的存储结构和查询加速
ClickHouse 内核分析–MergeTree 的存储结构和查询 加速
ClickHouse 是最近比较火的一款开源列式存储分析型数据库,它最核心的特点就是极致存储压缩率和查询 性能,本人最近正在学习 ClickHouse 这款产品中。从我个人的视角来看存储是决定一款数据库核心…
建站知识
2024/10/8 5:15:13
hive语法在presto语法差异转化
1、字段切分
hive实现: select
results
,split_results
from table
LATERAL VIEW explode(split(results,\\|)) t1 as split_results
;presto实现:
select
results
,split_results
from table
cross JOIN unnest(split(results, |)) as t (split_res…
建站知识
2025/1/6 10:33:43
pip下载报错:pip._vendor.urllib3.exceptions.SSLError: [SSL: DECRYPTION_FAILED_OR_BAD_RECORD_MAC] decry
pip下载报错: pip下载命令如下:
sudo pip3 install keras-bert -i https://pypi.tuna.tsinghua.edu.cn/simple/报错内容: pip._vendor.urllib3.exceptions.SSLError: [SSL: DECRYPTION_FAILED_OR_BAD_RECORD_MAC] decryption failed or ba…
建站知识
2025/1/6 2:42:22
tensorflow读取hdfs文件(parquet、csv)
tensorflow API读取csv
官网地址:https://tensorflow.google.cn/api_docs/python/tf/data/experimental/make_csv_dataset?hlen
tf.data.experimental.make_csv_dataset(file_pattern,batch_size,column_namesNone,column_defaultsNone,label_nameNone,select_co…
建站知识
2024/12/31 6:36:05