要解析一个配置文件,当打开文件的时候我崩溃了_java

薛定谔的猫

首先,说一些题外话,按照我一贯的风格,这篇文章本应该叫《浅谈如何优雅读取特殊格式配置文件》,但是最近被某些网站的推送恶心到了,我是不太喜欢这种标题的,所以我一直尽量避免使用这种标题党式的标题,但是,好奇心驱使我,想做一次实验,欢迎大家留言,说出你的想法,你更喜欢哪个标题?


A. 要解析一个配置文件,当打开文件的时候我崩溃了 | 为人性癖耽佳句,语不惊人死不休

B. 浅谈如何优雅读取特殊格式配置文件 | 少一点套路,多一点真诚

C. 冇所谓

一点点创意

最近需要读取一些配置文件,但他并不是常用格式,而且需要我们对该文件进行操作除了正常的读写外,还要尽量保存原文件的注释、顺序等信息。

这个配置文件原本也是键值对性质的文件,但是这里键值的分隔符,用了空格和制表符而不是等号。

键也不是唯一的,同名键可能有多个值的情况。

如何满足这个需求呢?将文件加载进来,处理成一个特殊的数据结构,标记出来注释,字段,值等信息,直接对这个结构进行操作,然后再落盘回去,即形成如下图结构。

要解析一个配置文件,当打开文件的时候我崩溃了_python_02

如上所示,尽管也可以完成需求,但是总觉得不够优雅,逻辑结构混杂在一起。

那么如何能更优雅一些呢?作为一名老CRUD,我是这么想的,在原始数据加载时候,引入一个纯数据缓存队列,用于应对读取操作,引入一个辅助元数据队列, 用于协助判断键具体的类型,例如,键值对、键多值对等情况。

在进行数据更新的时候,引入变更队列,用于处理数据变更,这里并不会直接更新实际数据,而是在落盘的时候,才会合并处理。在外层加入一个布隆过滤器,用于在遍历的时候,先抵消部分无变更键。

这样,还能顺便实现一波恢复操作。

要解析一个配置文件,当打开文件的时候我崩溃了_python_03

整体架构,归结如上图所示。架构设计,有时就是这样,一点点的变更,看着能笑出来。

希望能对正在读文章的你有所启发,也欢迎与我交流。