关于 Flink checkpoint,都在这里(二)
coco在上一篇我们提到 Flink 基于 checkpoint 机制进行容错,保障了精确一次(exactly-once)语义。那么业界的其他分布式计算框架,如 spark streaming、storm 它们的容错思路与 Flink 相同吗?容错到底是在做什么呢?本篇将从更高的角度了解容错机制,深入理解容错的本质和核心思想。
关于 Flink checkpoint,都在这里(一)
cocoFlink checkpoint 一直以来都是 Flink 引以为豪的机制之一,它为 Flink 状态流处理保驾护航。但是一直以来笔者都对于 checkpoint 的理解仅限于 Flink 官网和一些博客中的介绍,在实践层面一直是开箱即用的阶段,没有进行过深入的了解和研究。但是作为 Flink 的重要机制之一,无论从一个 Flink 粉的角度,还是从问题定位与优化的角度,都应该对它有更深入、更全面的了解。本篇文章中以问题驱动的方式进行讨论。同时也欢迎在评论区留言,评论区的一些问题会收录到本系列的博客中。
Apache Flink 大状态管理:增量 checkpointing 介绍
cocoApache Flink 专门为状态流(stateful stream)计算而搭建。那什么是流计算中的状态(state)?我在上一篇博客中定义了状态和状态流计算,简单回顾一下:状态是被定义在算子(operator)中的一块内存空间,通过存储过去事件中的信息来影响未来事件的处理。