在公司项目运营过程中,上司一直苦于,系统的数据库的东西太少,能给用户提供的信息太少,系统开始建立的时候主要是提供企业信息的检索,其实,要采集出所有企业的数据信息,对于,我个人来说,跟本是很难实现了,只能通过外接数据的购买在往数据库导入数据,代价就是成本高,还有就是数据质量不高,上百万的数据,很多数据基本都是垃圾数据,但是又很难逐一的进行清洗,数据的质量参差不齐,对于用户查询出来的结果,淡然也不尽人意了。
 
     偶然间接触一些数据挖掘的公司,在沟通过程,当中他们好像能满足我们数据的要求,数据的归档,分类,要和我们的数据库一致,我想他们也得需要大量的技术处理,同时也不知道,数据库存在的问题,一是数据量的庞大,一是数据的重复数据,还有就是数据库一些垃圾数据的。剩下的就是数据库数据填充,但是要完善那几百万数据,当当从技术考虑,不知道,结果会怎么样》基于对技术的不了解,只能等待合作后的结果