Kafka流使用案例以添加全局存储_随笔

Kafka流使用案例以添加全局存储

是的，这是一个很奇怪的小问题22，但是文档是正确的。全局状态存储的处理器不得对记录做任何事情，而应将其持久存储到存储中。

AFAIK，这不是一个哲学问题，只是一个实际问题。原因很简单，就是您观察到的行为…
Streams将输入主题视为存储的changelog主题，因此在还原过程中会绕过处理器（以及反序列化）。

状态恢复绕过任何处理的原因是通常
变更日志中的数据与存储中的数据相同，因此对它进行任何新 *** 作实际上都是错误的。另外，仅将字节从线中删除并将它们批量写入状态存储区就更有效。我之所以说“通常”，是因为在这种情况下，输入主题与普通的changelog主题并不完全一样，因为在存储放置期间它不会接收其写入。

对于它的价值，我也很难理解用例。看来，我们应该：

完全摆脱那个处理器，就像恢复一样，总是将二进制数据从网络中转储到存储中。
重新设计全局存储，以允许在全局存储之前进行任意转换。我们可以：
- 继续使用输入主题并在还原期间反序列化并调用处理器，或者
- 为全局商店添加 真实的 变更日志，以便我们轮询输入主题，进行一些转换，然后写入全局商店和 global-store-changelog。然后，我们可以使用变更日志（而非输入）进行还原和复制。

顺便说一句，如果您想要后一种行为，则可以立即应用转换，然后使用

to(my-global-changelog)

来制造“
变更日志”主题，以对其进行近似。然后，您将创建全局存储以从您

my-global-changelog

的输入而不是输入中读取。

因此，给您一个直接的答案，KAFKA-7663不是错误。我将对建议将票证转换为功能请求的票证进行评论。

最佳答案：不能为保留状态配置充当状态存储的更改日志的主题。实际上，这意味着您应该通过启用压缩来防止无限增长，并禁用日志保留。

实际上，旧数据因保留而丢失和丢失不是“事件”，消费者无法知道是否/何时发生。因此，无法响应此非事件而从状态存储中删除数据。就像您描述的那样，它将发生……记录将无限期地存在于全局存储中。如果/当替换实例时，新实例将从输入中恢复，并且（显然）仅接收当时该主题中存在的记录。因此，Streams集群作为一个整体将在全局状态不一致的情况下结束。这就是为什么您应该禁用保留。

从存储中“删除”旧数据的正确方法是将所需键的逻辑删除写入输入主题。然后，它将被正确传播到群集的所有成员，在还原期间正确应用，并由代理正确压缩。

希望对您有帮助。肯定的，请输入票证并帮助我们使API更加直观！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/zaji/5490685.html

Kafka流使用案例以添加全局存储

发表评论

评论列表（0条）