流式计算模式:什么意思、特点特征
流式计算模式是针对流数据的高实时性计算模式。在一些应用中,数据价值随时间的流逝而降低,因此最好在事件出现时便立即对其进行处理,而不是缓存起来进行批处理。
2011年,Storm系统带着“流式计算”的标签华丽登场,它依靠其分布式、简单运维、高度容错、无数据丢失等特点,成为业界的大数据明星,弥补了Hadoop延迟大、响应缓慢、运维复杂的缺点。
随后,S4、Streams、Puma、Flume、SuperMario等流数据实时计算模式相继诞生,成为了瞬间建模或计算处理的典型产品。