针对Web信息可信度问题,提出了一种为Deep Web数据记录计算可信度的有效方法C-Rank。该方法为每一条记录构造一个S-R可信度网络,包含两种类型顶点及三种类型边。首先基于可信度传播的思想,利用顶点出度为每一个顶点计算其局部可信度值,再利用Record顶点入度及相邻Site顶点的可信度值,为该Record顶点计算权值,继而求得整个S-R网络的全局可信度值。实验证明,C-Rank方法能够合理而有效地评价数据记录的可信度,从而达到甄别虚假信息,为用户推荐可信数据记录的目的。该方法普遍适用于Deep Web的各个领域。

                                                   摘自——《互联网信息可信性问题》摘要

 

    互联网上的信息不可谓不多不详细,然而相对应的虚假信息所占比例也是较大的。基于互联网的虚拟性(用户可以不实名制,可以不用对某些虚假信息负责),互联网上因此也就有了许多散发假消息的用户,戏称“水军”。基于这种情况,互联网上信息的可信性真假掺半,因此需要用户整个别虚假信息。虽然《互联网信息可信性问题》提出“C-Rank方法能够合理而有效地评价数据记录的可信度,从而达到甄别虚假信息,为用户推荐可信数据记录的目的。该方法普遍适用于Deep Web的各个领域。”但是在实际中,仍旧存在大量的虚假信息,用户需谨慎辨别。