结构化数据可以通过固有键值获取相应信息,且数据的格式固定,如RDBMS data

半结构化数据可以通过灵活的键值调整获取相应信息,且数据的格式不固定,如json,同一键值下存储的信息可能是数值型的,可能是文本型的,也可能是字典或者列表

非结构化数据不可以通过键值获取相应信息。

其实感觉也不能笼统地说文档就是非结构化数据,这要看你想要获取的信息层次,比如我就是要统计公司的财报,且把财报整体作为我的信息单元,那么在这里财报也是结构化数据;而如果我想要获取的是财报里面的具体信息,比如总收入,那么在这里财报就是非结构化数据。