相关文章
Clickhouse引擎一: Log 系列引擎
Clickhouse引擎一: Log 系列引擎
Log 家族具有最小功能的轻量级引擎。当您需要快速写入许多小表(最多约 100 万行)并在以后整体 读取它们时,该类型的引擎是最有效的。
TinyLog 引擎
最简单的表引擎,用于将数据存储在…
建站知识
2025/1/24 13:11:23
Clickhouse 架构设计
Clickhouse 架构设计
Column 与 Field
Column 和 Field 是 ClickHouse 数据最基础的映射单元。作为一款百分之百的列式存储数据库, ClickHouse 按列存储数据,内存中的一列数据由一个 Column 对象表示。
Column 对象分为接口和实现 两个部分࿰…
建站知识
2025/1/19 4:09:33
Clickhouse基本概念
Clickhouse 系统架构
ClickHouse 拥有完备的管理功能,所以它称得上是一个 DBMS(Database Management System,数据库 管理系统),而不仅是一个数据库。作为一个 DBMS,它具备了一些基本功能,如下所…
建站知识
2025/1/24 13:10:44
Clickhouse引擎三: 外部存储引擎
Clickhouse引擎三: 外部存储引擎
HDFS
Clickhouse 可以直接从 HDFS 中指定的目录下加载数据 , 自己根本不存储数据, 仅仅是读取数据 ENGINE HDFS(hdfs_uri,format) hdfs_uri 表示 HDFS 的文件存储路径; format 表示文件格式(指 ClickHouse…
建站知识
2024/10/8 12:01:07
Clickhouse引擎四: 内存引擎
Clickhouse引擎四: 内存引擎
表引擎,都是面向内存查询的,数据会从内存中被直接访问,所以它们被归纳 为内存类型。但这并不意味着内存类表引擎不支持物理存储,事实上,除了 Memory 表引擎之外,其…
建站知识
2024/12/8 10:35:18
Flink停止任务并保存savepoint
线上作业会有需求需要改动的时候, 希望不要丢失数据的进行需求迭代。注意:这中线上的任务迭代最好在数据量低谷的时候进行,对任务造成的影响最小。 需要用到一下命令:
flink取消任务并保存savepoint
flink cancel -s hdfs:///f…
建站知识
2025/1/14 13:32:13
ClickHouse 内核分析--MergeTree 的存储结构和查询加速
ClickHouse 内核分析–MergeTree 的存储结构和查询 加速
ClickHouse 是最近比较火的一款开源列式存储分析型数据库,它最核心的特点就是极致存储压缩率和查询 性能,本人最近正在学习 ClickHouse 这款产品中。从我个人的视角来看存储是决定一款数据库核心…
建站知识
2024/10/8 5:15:13
hive语法在presto语法差异转化
1、字段切分
hive实现: select
results
,split_results
from table
LATERAL VIEW explode(split(results,\\|)) t1 as split_results
;presto实现:
select
results
,split_results
from table
cross JOIN unnest(split(results, |)) as t (split_res…
建站知识
2025/1/6 10:33:43