国际象棋通用引擎协议

2004年9月初稿,2006年2月修订

一、UCI协议的特点

UCI协议,全称是国际象棋通用引擎协议(Universal Chess Interface,直译作通用象棋接口)。它是开放的象棋引擎协议,所谓“开放的”引擎协议,指的是:

(1)协议内容是公开的,并且可以免费使用;

(2)你可以根据该协议自己编写象棋引擎,凡是支持该协议的界面,都可以使用你编写的引擎;

(3)你可以根据该协议自己编写象棋界面,凡是支持该协议的引擎,都可以被你编写的界面调用。

UCI协议的前身是象棋引擎SOS和Shredder使用的引擎协议,在他们的作者Rudolf Huber和Stefan Meyer-Kahlen对该协议的改进下,2000年11月28日UCI协议问世了。

UCI协议具有以下特点:

(1)引擎程序是可执行文件,它同界面程序之间通过“标准输入”和“标准输出”(即C语言中的stdin和stdout)来通讯。

(2)输入和输出是以“行方式”来完成的,界面发给引擎的每条指令都必须以“回车”(即C语言中的'\n')结束,界面接收引擎的反馈也一样。

注:引擎不能跨平台使用,如果引擎从一个平台(如Windows)移植到另一平台(如Unix),需要重新编译源代码,或使用跨平台接口。引擎的平台通常由三类:

A. DOS平台,但是由于DOS平台过于陈旧,现在很难找到这样的引擎;

B. Windows平台,需要在Windows下用Console方式编译引擎源代码,WinBoard只能使用这类引擎;

C. Unix/Linux平台;需要在Unix或Linux下编译源代码(也用Console方式),XBoard能够使用Linux的引擎。

(3)引擎启动时,必须用“uci”指令让引擎进入UCI协议状态。当然,引擎也可以保留不使用UCI协议的权利,只要它接受的第一条有效指令允许不是“uci”。例如,很多UCI引擎允许第一条有效指令是“xboard”,这样引擎就转而进入WinBoard协议状态。

(4)无论引擎是否在思考,都必须随时接收指令,这样界面程序就可以随时中断引擎的工作或改变引擎的思考方式了。每条指令都以特定的关键字开头,关键字和参数之间必须用空格隔开,这样可以简化引擎识别指令的过程。

(5)界面必须随时接收引擎的反馈信息,每条反馈信息也都以特定的关键字开头(空格后面才是信息的实质内容),这样可以让界面更方便地识别每一条反馈信息。

(6)引擎在搜索一个局面前,先要让界面把局面的位置告诉引擎,作为“内置局面”;

(7)引擎必须接收到"go"指令后才开始思考(搜索);

(8)如果对局是计时的,那么每次思考时都必须设定时钟,引擎仅仅根据时钟来决定思考策略,时钟的改变需要界面来完成;

(9)当引擎完成一个局面的搜索,得到一步最佳着法后,并不改变“内置局面”,只是把这个着法反馈给界面,界面来完成这一步(当然,界面也可以让引擎走别的着法),再把走完这一步后的局面告诉引擎;

(10)开局库通常由界面来指定给引擎,即通常引擎是不自带开局库的,当然引擎也可以自带开局库,此时界面可以让引擎根据引擎自己的开局库来完成开局的某步。

以上10个特点中,前5点和WinBoard协议是类似的,而后5点WinBoard协议和UCI协议则完全相反,因此WinBoard协议和UCI协议的指令也截然不同。

二、走棋格式

UCI协议用的走棋格式是“长代数格式”,即走动子的起始位置和到达位置,这里有几点需要注意:

(1)不要标明“到达记号”、“吃子记号”、“将军记号”以及其他评注记号,例如第一步走e4,则记作e2e4,而不是e2-e4;

(2)不要标明所走的子,例如走Nf6,则记作g8f6,而不是Ng8f6;

(3)王车易位时只标明王的路线,例如走O-O,则记作e1g1;

(4)兵升变时在最后注明只用一个字母注明升变的子,例如走e8=Q,则记作e7e8q。

三、输入和输出协议

输入协议就是界面向引擎发送指令的协议,协议内容通常由一系列指令集组成(用红色表示),输出协议则规定了引擎反馈给界面的信息,以及这些信息具体的含义(用蓝色表示)。

1.uci

这是引擎启动后,界面需要给引擎发送的第一条指令,通知引擎现在使用的是UCI协议。

2.id {name | author }

这是uci指令的反馈信息,显示引擎的版本号和作者。

3.option name

type [default ] [min ] [max

] [var [var [...]]]

也是uci指令的反馈信息,表示引擎所支持的选项,指选项的名称(后面会介绍),指选项的类型,可以是以下5种:

(1)check,检查框,取值只能是true或false;

(2)spin,旋钮,取值是整数,可以用min和max来限定范围;

(3)combo,列表框,取值是由var来指定;

(4)button,按钮,没有取值,仅仅用来触发某个事件;

(5)string,字符串,取值可以是任何字符串。

通常的UCI引擎支持以下选项:

(1)Hash(spin),以MB为单位规定Hash表的大小;

(2)NalimovPath(string),指定Nalimov残局库的路径,可以设置多个路径,用';'隔开;

(3)NalimovCache(spin),以MB为单位规定Nalimov残局库的缓冲区;

(4)Ponder(check),指定引擎是否后台思考(Ponder),设定该参数的目的仅仅是让引擎改变时间分配策略,后台思考仍然需要界面发出指令;

(5)OwnBook(check),指定引擎是否要使用引擎自带的开局库;

(6)MultiPV(spin),引擎给出多少步最佳着法,Alpha-Beta搜索通常只给出一步,增加这个数值会降低引擎的运行效率,但扩大了界面对引擎提供着法的选择空间;

4.uciok

这是uci指令的最后一条反馈信息,表示引擎已经进入用uci协议通讯的状态。

5.setoption name [value ]

设置引擎参数,这些参数必须是option反馈信息所列出的。

6.isready

检测引擎是否处于“就绪”状态,如果引擎发送回readyok信息,则说明引擎已经就绪,可以界面可以向引擎发出其他指令。

7.readyok

这是isready的反馈信息,仅仅表示引擎可以接收指令了。即使引擎在思考,接收到isready指令后也会返回readyok。

8.position {fen |

startpos } [moves .... ]

设置“内置棋盘”的局面,用fen来指定FEN格式串,或用startpos来指定起始局面,它等价于

fen rnbqkbnr/pppppppp/8/8/8/8/PPPPPPPP/RNBQKBNR

w KQkq - 0 1。

一般来说,界面发送给引擎的是最近一次吃子或进兵后的局面(称为“不可逆局面”),该局面到当前局面的一系列着法则跟在moves后,目的是让引擎掌握重复检测的策略。FEN格式串的写法参阅《国际象棋译文苑》文摘——关于PGN和FEN记谱规范(下)一文。

9.go ...

让引擎根据内置棋盘的设置和设定的搜索方式来思考,有以下搜索方式可供选择(可以多选,直接跟在go后面):

(1)searchmoves

.... ,只让引擎在这几步中选择一步;

(2)wtime ,白方剩余时间(单位是毫秒);

btime ,黑方剩余时间;

winc ,白方每步增加的时间(适用于Fischer制);

binc ,黑方每步增加的时间;

movestogo ,还有多少回合进入下一时段(适用于时段制);

这些选项用来设定时钟,它决定了引擎的思考时间;

(3)ponder,让引擎进行后台思考(即对手在用时,引擎的时钟不起作用);

(4)depth ,指定搜索深度;

(5)nodes ,指定搜索的节点数(即分析的局面数,一般它和时间成正比);

(6)mate ,在指定步数内只搜索杀棋;

(7)movetime ,只花规定的时间搜索;

(8)infinite,无限制搜索,直到杀棋。

10.info ...

显示引擎思考信息,信息有以下内容(可以是很多信息,都跟在info后面):

(1)depth ,当前搜索到的深度;

(2)seldepth ,选择性搜索(不完全搜索)达到的深度,通常会跟在depth后面;

(3)pv

... ,已经搜索到的最佳路线;

(4)multipv ,这只会出现在设定了MultiPV选项以后,紧跟在pv后面,说明它是最佳的路线中的第几条(排名第几);

(5)time ,已经搜索的时间,它往往跟在pv后面;

(6)score {pv

| mate } [lowerbound | upperbound],引擎对当前局面的评价,pv 指当前局面的评分,单位是“百分兵值”,mate 指在多少步之内会形成杀棋,lowerbound指该评价是最低估计(为白方估计),upperbound指该评价是最高估计(为黑方估计);

(7)currmovenumber

,当前搜索着法的序号;

(8)currmove ,当前搜索的着法,它往往跟在currmovenumber

的后面;

(9)nodes ,已经搜索的节点数(即分析的局面数,它会隔一定时间显示出来;

(10)hashfull ,Hash表的占用率(单位是千分之一),它也会隔一定时间显示出来;

(11)nps ,引擎速度,用每秒搜索的节点数,它也会隔一定时间显示出来;

(12)tbhits ,在残局库中找到局面的数目;

(13)cpuload ,处理器的占用率(单位是千分之一);

(14)string ,其他信息,通常是调试信息。

11.stop

中断引擎的思考;

12.ponderhit

在后台思考(go ponder)还没有输出结果(bestmove )时,告诉引擎后台思考命中(正在后台思考的着法正好是对手的着法),随后引擎就自动转入正常思考(时钟开始有效)。如果后台思考没有命中,就必须用stop中止思考,重新设置局面让引擎思考。

13.bestmove [ponder

]

引擎思考结束后(不管是否被stop中断)所显示的结果,ponder指为对手思考的结果,通常引擎会提供此信息。

14.quit

让引擎退出运转,无论引擎思考与否。

四、举例

在下面的例子中,输入部分(从界面到引擎)用红色表示,输出部分(从引擎到界面)用蓝色表示。

uci,告诉引擎使用UCI协议;

id name

Shredder 5

id author

Stefan MK,引擎显示版本信息。

option name

Hash type spin default 1 min 1 max 128,Hash表的上限是128MB;

option name

NalimovPath type string default c:\,说明引擎支持Nalimov残局库,注意在C语言中'\'要打印成'\\';

option name

NalimovCache type spin default 1 min 1 max 32

option name

Nullmove type check default true

option name

Style type combo default Normal var Solid var Normal var

Risky,说明引擎有三种风格(保守、均衡和冒进,缺省是均衡);

uciok,所有可设置的参数已经显示出来,此时引擎可以接收指令;

setoption

name Hash value 32,把Hash表增加到32MB;

setoption

name NalimovCache value 1,把残局库缓冲区设置为1MB(这句话没有必要,因为缺省值就是1);

setoption

name NalimovPath value d:\tb;c\tb,设置残局库的路径;

isready,等待引擎初始化;

readyok,引擎初始化完成,现在可以让引擎思考了;

position

startpos moves e2e4 e7e5,给定开局e4 e5(在这里,最好直接将当前局面用position fen 的形式给出,因为当前局面是不可逆局面);

go infinite,让引擎无限制思考,到时候用stop中断;

info depth 1
seldepth 0
info score
cp 13 depth 1 nodes 13 time 15 pv f1b5
info depth 2
seldepth 2
info nps
15937
info score
cp 14 depth 2 nodes 255 time 15 pv f1c4 f8c5
info depth 2
seldepth 7 nodes 255
info depth 3
seldepth 7
info nps
26437
info score
cp 20 depth 3 nodes 423 time 15 pv f1c4 g8f6 b1c3
info nps
41562

...,以后还有很多信息,这里省略;

stop,用户不再等待,让引擎中止思考;

bestmove g1f3

ponder d8f6,引擎输出白方最佳着法Nf3,黑方的应对是Bf6(由于思考被用户中止,所以这步多少有些问题),如果用户要继续进行思考,可再输入go。