上次给大家演示了抓取IE内核浏览器的网页,这次和大家一起写一个抓取firefox页面文本的例子。Firefox有自身的一套结构良好的插件机制,但要深入开发Firefox插件的话要了解javascript,XUL,XPCOM以及一些c++的基本常识,本贴算是给想开发Firefox插件的朋友入门。 Read More
原创 2022-01-21 15:06:54
288阅读
google推出了自己的网页浏览器,现在web浏览器的竞争更激烈了,各有各的用户群。其实有另一个领域没有多少竞争,那就是应用程序浏览器,今天给大家演示的浏览器,不仅可以浏览网页,还可以浏览.net应用程序,通信方面你可以使用webservice,remoting
原创 2022-01-21 15:28:57
314阅读
困了,不多说了,就是教你怎样把邮件建立索引,再搜索出来。用MAPI把邮件读取到里,用SharpICTCLAS做一个lucene的中文的语汇单元器,用lucene建立索引及查询索引。 Read More
原创 2022-01-21 15:43:02
204阅读
做网络应用,封包,解包是家常便饭,但如何做到准确、稳定而且性能好,却不太容易做到,这次和大家分享一下我在解析网络包上的经验。 Read More
原创 2022-01-21 15:39:34
71阅读
在用XML传输数据的时候,XML本身的元素名称,属性名称可能比有效的信息量占的地方还要大,本文示例一种简单实用的算法来进行XML压缩,主要思路是把XML标签和属性用整数来表示以便降低传输量。 Read More
原创 2022-01-21 14:46:56
105阅读
你有没有看到一篇好文章想保存到本地,有没有想过只保存网页选中的部分而不要那些不必要的导航和广告,本贴告诉你达到这个目的的思路及主要代码。 Read More
原创 2022-01-21 15:13:58
193阅读
上次和大家讨论了一些正文提取的细节问题,这次我把一些关键问题解决了,给大家上一下代码,并做了演示,能提取不少网站的正文了,当然在功能和代码组织上还有不少改进的地方。 摘要: 上次和大家讨论了一些正文提取的细节问题,这次我把一些关键问题解决了,给大家上一下代码,并做了演示,能提取不少网站的正文了,当然在功能和代码组织上还有不少改进的地方。思路: 1、抓取远
原创 2022-01-21 15:24:06
122阅读
最近云计算,云存储炒的是热火朝天,本也来凑个热闹,和大家一起来DIY一个云存储服务。像live mesh目前就是个网络的OS,能把本机的东西存上去,也不是结构化的,我觉得云存储最好能够存储结构化的数据,而且管理起来要像数据库一样灵活。这样人人都可以把自己的备忘录,联系人信息放在自己的云存储服务里
原创 2022-01-21 15:34:25
589阅读
文本聚类是搜索引擎和语义web的基本技术,这次本和大家一起学习一下简单的文本聚类算法,可能不能直接用于实际应用中,但对于想学搜索技术的初学者还是有一定入门作用的。这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。关于这些概念可以去google,
原创 2022-01-21 11:56:02
109阅读
Tag系统是Web2.0的一个招牌应用,如果你有一个经营了好几年的论坛,是不是也想生成自己的一套TAG
原创 2022-01-21 16:01:00
327阅读
辛辛苦苦写个共享软件,又怕被人,所以就会想到用注册码的方式来激活软件。本给大家一个简单的思路来实现软件注册码算法,当然.net做的东西很容易被人
原创 2022-01-21 15:53:36
1667阅读
昨天给大家演示简单的文本聚类,但要给每个聚类再提取一两个关键词用于表示该聚类。我们还是用TFIDF算法来做,因为这是比较简单的提取特征算法,不过这里的TF是指某词在本聚类内所有文章的词频,而不是本文章内出现的次数,IDF还是在所有文章里出现的倒文档频率。
原创 2022-01-21 15:47:32
90阅读
net一般配合sqlserver使用,但mysql在性能和成本上也很有优势,本文介绍如何搭建一个mysql服务器,以及演示如何用.net使用mysql。 Read More
原创 2022-01-21 14:38:29
149阅读
现在web应用的发展大大快于桌面应用,但桌面应用在某些场合确实也有很大的有事,其实.net 2.0在windows form方面做了不少的改进,大家也许也零零散散的知道一些,本文来综合这些技术点来做一个模仿outlook2003的桌面应用程序框架。 Read More
原创 2022-01-21 15:30:29
290阅读
小节:好久不发帖子了,想不到
原创 2022-01-25 13:44:39
150阅读
概要:本篇博客主要介绍JavaScript的原型1.对象实例化- 初始化的优先级初始化操作的优先级如下:  ● 通过原型给对象实例添加的属性  ● 在构造器函数内给对象实例添加的属性  在构造器内的绑定操作优先级永远都高于在原型上的绑定操作优先级。因为构造器的this上下文指向的是实例自身,所以我们可以在构造器内对核心内容执行初始化操作。- 协调引用  如下代码观察原型变化时的行为: funct
介绍矩阵的编程表示,矩阵的初等变换,化阶梯矩阵及求方阵的行列式。 Read More
原创 2022-01-21 14:20:43
237阅读
MyService网站策划 在线应用托管(ASP)和软件服务(Saas)已经成了比较有前景的商业模式,Web API才是真正发挥了互联网的威力,让Internet真正有价值,我也做一些比较实用的在线应用,
原创 2022-01-25 14:16:26
96阅读
信息安全基础信息安全目标真实性:对信息的来源进行判断,能对伪造来源的信息予以鉴别, 就是身份认证。保密性:保证机密信息不被窃听,盗取,或窃听者不能了解信息的真实含义。完整性:保证数据的一致性,防止数据被非法用户篡改或部分丢失。可用性:保证合法用户对信息和资源的使用不会被不正当地拒绝。不可抵赖性:建立有效的责任机制,防止用户否认其行为。常见手段破坏信息
原创 2022-01-21 11:46:00
141阅读
为了降低前端代码的数量,提高可维护性,可测试性,学习了下AngularJS,正在准备投入项目开发中。AngularJS的概念比较多,如果面向对象方面的书理解的不透的话学习起来有些费劲,它的官方有个快速入门不错,中文版如下://www.ituring.com.cn/minibook/303但除了入门外,要真实的写项目还是得把模块划分,依赖关系处理,组件间通信,文件目录安排等问题解决好才能
原创 2022-01-21 11:49:35
97阅读
  • 1
  • 2
  • 3
  • 4
  • 5