一直很欣赏pandas对数据的理解,以及其灵活优雅的数据处理方式。一直在考虑是否可以做一套基于REST的API来进行数据处理。今天突然灵感来了,画了一下时序图(如下图),准备后续做一些简单实现来趟趟路。

      首先需要创建会话,这是为了日后共享数据,以及自己在数据处理的过程当中,保留状态。

       会话创建完成以后,就可以加载数据了。目前数据分成两个部分,源数据和内存数据,这里的事源数据而不是元数据,是因为这里指的是,基础的数据,可以是从数据库或是其他途径现抓取进入内存的,然后创建一个内存模型,后续的执行全部需要依赖内存数据。

        基于内存数据可以进行行列转换,索引,数据整理等操作,然后可以获取数据。

        这只是一个简单模型,实在在大脑里乱撞的想法在梳理的过程,目前我也不知道这条路是否正确。

 

未完待续.......