java 定义工具类 java的工具包

转载

davisl 2023-09-05 15:16:33

文章标签 java 定义工具类 Maximum entropy classifier java 文章分类 Java 后端开发

1.stanford-classifier入手

stanford-classifier是开源软件，实现了最大熵分类器。其主页是http://nlp.stanford.edu/software/classifier.shtml，提供了下载地址，下载后的解压目录：

java 定义工具类 java的工具包_java

其中 stanford-classifier.jar 是可执行的jar文件；对stanford-classifier-3.5.2-sources.jar 进行解压得到Java源码，可以进行二次开发。

注意Java版本要1.8，Java1.7是不行的。

2.用eclipse进行二次开发

二次开发可以借助eclipse ，将源码拷贝到eclipse项目时，有两个Java文件提示有误，找到错误所在行发现是中文乱码。解决办法是用记事本打开然后保存为ANSI 编码。eclipse项目如下所示：

java 定义工具类 java的工具包_classifier_02

main函数所在的文件名是ColumnDataClassifier.java ,在包 edu.stanford.nlp.classify. 下。

用eclipse导出可执行的jar文件，执行方式与下载包中所包含的可执行包用法相同。

java 定义工具类 java的工具包_java 定义工具类_03

java 定义工具类 java的工具包_Maximum_04

3.Makefile文件来编译jar文件

解压目录下有个Makefile文件，执行make命令编译时默认会用到该文件。内容如下

# This is a rudimentary Makefile for rebuilding the classifier.
# We actually use ant (q.v.) or a Java IDE.
JAVAC = javac
JAVAFLAGS = -O -d classes
classifier:
mkdir -p classes
$(JAVAC) $(JAVAFLAGS) src/edu/stanford/nlp/*/*.java src/edu/stanford/nlp/*/*/*.java src/edu/stanford/nlp/*/*/*/*.java
cd classes ;
jar -cfm ../stanford-classifier-new.jar ../src/edu/stanford/nlp/classify/classifier-manifest.txt edu ; cd ..
cp stanford-classifier-new.jar stanford-classifier.jar
rm -rf classes

命令行进入该文件所在目录，执行如下命令进行编译

make

对Makefile 文件内容的解释：

1.$(JAVAC) $(JAVAFLAGS) src/edu/stanford/nlp/*/*.java src/edu/stanford/nlp/*/*/*.java src/edu/stanford/nlp/*/*/*/*.java
(JAVAC)即javac命令，将Java文件编译成class文件；(JAVAFLAGS)即-O -d classes 表示将编译生成的class文件存放在classes文件夹下；src/edu/stanford/nlp/*/*.java，src/edu/stanford/nlp/*/*/*.java 和src/edu/stanford/nlp/*/*/*/*.java表示要编译的Java文件地址，之所以用三个是因为Java源码有三个深度，从第二部分的eclipse项目可以看出。
2.jar -cfm ../stanford-classifier-new.jar ../src/edu/stanford/nlp/classify/classifier-manifest.txt edu ;
此命令将class文件封装成可执行的jar包(stanford-classifier-new.jar)，其中 classifier-manifest.txt 指示了main函数文件的地址，只有一行内容，为 Main-class: edu.stanford.nlp.classify.ColumnDataClassifier，因为该项目的main函数所在的文件名是ColumnDataClassifier.java。

编译命令的三个输入参数src/edu/stanford/nlp/*/*.java，src/edu/stanford/nlp/*/*/*.java 和src/edu/stanford/nlp/*/*/*/*.java 一个都不能少，否则会找不到类文件出现以下错误：

java 定义工具类 java的工具包_classifier_05