1.理想挖掘信息spider,我认为应该是能够像
人一样给个大目标,就会自动的去互联网
抓取符合的和有关的有价值的信息,并且
不断的自我学习。给个种子然后人工智能
查找,提取,分析出满意结果。
2.比较高的档次的,我认为应该是给个入口
站点,自己去寻找和抽取符合本行业或既
定要求的信息。特点,某类站点一些语言
特征和一个入口种子站完毕,剩下的就是
自动提取和分析出结果。
3.我现在的挖掘信息还停留在给个站和规则
来提取所需信息;所以还需向上努力。
4.再向下就原始了。