相关文章
KedProcessFunction实现窗口定时计算
一、EventTime
// 数据进过清洗过滤后生成水位线
val dsenv.addSource(consumer).map(x>{val sx.split(",")AdData(s(0).toInt,s(1),s(2).toLong)}).assignTimestampsAndWatermarks(new BoundedOutOfOrdernessTimestampExtractor[AdData](Time.minutes(1)) {over…
建站知识
2025/1/24 8:23:38
触发器Trigger与剔除器Evictor
一、Trigger
窗口的计算是依赖触发器进行的,每种类型的窗口都有自己的触发器机制,如果用户没有指定,那么会使用默认的触发器。
EventTimeTrigger:通过对比 Watermark 和窗口的 Endtime 确定是否触发窗口计算,如果 Wa…
建站知识
2025/1/14 5:42:51
Flink:定时加载维表
业务背景:原先有大量数据会去从redis中查询,造成频繁的连接和查询,而且redis中的数据量很小,因此可以采用定时加载维表,将数据加载进每个subtask中。
code:
class CommercialAdvRichMapFunction(redisHos…
建站知识
2024/12/7 9:09:21
Spark读取Mysql性能优化
spark读取MySQL默认的并行度只有1,即使手动指定了并行度numPartitions,也不会生效,这在读取大表的时候会成为性能瓶颈
想要提高并行度读取MySQL,则需要获取到该表主键的上下界,然后指定numPartitions,程序…
建站知识
2025/1/14 1:05:41
国际时区 TimeZone ID列表
Calendar c new GregorianCalendar();c.setTime( new Date());String s[] c.getTimeZone().getAvailableIDs();for (int i 0; i < s.length; i) {System.out.println(s[i]);}列表如下:
Etc/GMT12 Etc/GMT11 MIT Pacific/Apia Pacific/Midway Pacific/Niue Pac…
建站知识
2024/12/4 21:51:14
tensorflow安装serving:No versions of servable found under base path /models/
报错:No versions of servable FM found under base path /models/FM.
解决:model dir下没有版本目录,新建一个dir 1即可。1表示模型的版本号。
目录如下:
|- model_dir|- 1|- svaed_model.pb|- variables|- variables.data-00…
建站知识
2024/12/30 14:03:14
keras-Embedding层
嵌入层(Embedding Layer)是使用在模型第一层的一个网络层,其目的是将所有索引标号映射到致密的低维向量中,比如文本集[[4],[32],[67]]被映射为[[0.3,0.9,0.2],[-0.2,0.1,0,8],[0.1,0.3,0.9]]。该层通常用于文本数据建模。输入数据…
建站知识
2024/12/20 10:24:14