图片太大且规格不统一,显示的控制需要靠JavaScript来完成,用在移动设备上时显示效果不好且流量巨大,需要对现有图片库的图片进行一次处理,生成符合移动设备用的缩略图,将原来客户端JS做的工作转移到服务器端用PHP的GD库来集中处理。图片源与需要的大小:$src_img = "wallpaper.jpg"; $dst_w = 300; $dst_h = 200;剪裁图像,保证图像区域最大化显示,
改自韩顺平老师的算法公开课。1、单链表。使用单链表解决水浒英雄排行问题。<!doctype html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <title>链表</title> </head&
计算tf/idf在使用fileStr获取新闻的内容和长度后,我们就可以计算他们的tf和idf://计算tf\idf static public function tf_df($seg){ $str=self::fileStr(); $file_dir=self::fileDir(TEXT_PATH); $df=array(); for($i=0;$i<coun
在实验记录一中我们提到了一个获取所有txt格式的IT新闻内容的方法fileStr,在获取内容的同时我们也计算出了每篇新闻的长度(包括标点符号)://获取每篇文档的内容和长度 static public function fileStr(){ $file_dir=self::fileDir(TEXT_PATH); $str=array(); //存储文档和长度 for($
在进行实验之前,先了解相关反馈和盲反馈的一些概念:相关反馈是基于用户的,由用户标出初次查询结果相关还是不相关,再经过Rocchio算法或其他算法使检索结果更能满足用户需求;盲反馈也称伪反馈,是由计算机自动处理检索结果,不需要用户的参与也可以得到比较满意的检索效果。这种方法假定用户初始检索结果的前k篇文档是相关的,再由系统抽选出这k篇文档的特征词,然后把这些特征词和初始查询词再放入搜索框中进行二次检
windows下安装SCWS的中文扩展:去官网下载php_scws.dll(PHP-5.2.x根据php版本选择) 、XDB 词典文件(简体中文(UTF-8)可选gbk,也可以把两个词典文件都下载)、规则集文件(rules.tgz)创建c:\Program Files\scws(建议)目录,吧XDB、和规则文件解压后的文件都拷贝到该目录中把php_scws.dll文件拷贝到php安装目录的\ext
步骤:读取三篇文档1.txt,2.txt,3.txt,里边的内容分别为“this is php”,“this is html html”,“this is java”分词,并统计词频tf计算文档频率df计算每篇文档的特征向量计算搜索词与文档的夹角余弦值<?php $_txts = array('1.txt','2.txt','3.txt'); $_len = count($_
步骤:(1)读取3篇txt格式的英文文档;(2)对每篇文档进行分词;(3)利用正则表达式去掉逗号、句号等标点符号;(4)计算文档频率; (5)统计特征向量<?php $_txts = array('1.txt','2.txt','3.txt'); $_len = count($_txts); for ($i = 0;$i < $_le
实现这个功能的步骤:首先打开百度百科,在搜索框输入“php”关键词,得到搜索列表,一般都是10条;然后使用火狐的Firebug分析百度列表的内容组成,主要是html标签,发现去向百科内容的连接的格式都是http://baike.baidu.com/view/5721060.htm,于是使用正则匹配链接,得到10条链接;之后把链接交由curl()批处理函数(自定义)处理,得到结果页面的内容;然后在对
腾讯PHP工程师笔试有道题,要你把《圣经》中的单词能够检索出来,并显示单词所在的行列数,稍微思考了一下,写出了一个最简单的计算单词行列的php程序,但是算法复杂度已经超出了要求,有兴趣的同学可以改进.$_fp = fopen('test.txt','rb'); if (!$_fp){ echo 'failing to open the file,pl
根据tf*idf计算权重;求出相似度,最大的即为符合的检索结果的文档.有不懂的请留言
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号