前文参考:

FTP文件服务器配置介绍

https://www.gbase.cn/community/post/4391

HTTP文件服务器配置介绍

https://www.gbase.cn/community/post/4397

HDFS服务器配置介绍

https://www.gbase.cn/community/post/4402

SFTP服务器配置介绍

https://www.gbase.cn/community/post/4409

今天给大家介绍下GBFS专用文件服务器配置,以及加载状态监控方法。

1 GBFS专用文件服务器介绍

GBFS专用文件服务器,是一款专门用于GBase 8a MPP Cluster数据库数据加载的二进制可执行程序。

通常以gbfs-9.5.3.22-redhat7.3.tar.bz2文件包的形式提供给用户,用户只需要使用以下命令将该压缩包解压,然后运行即可。

以gbfs-9.5.3.22-redhat7.3.tar.bz2为例进行说明:

# tar xvf gbfs-9.5.3.22-redhat7.3.tar.bz2

解压完成后,会在当前目录生成gbfs文件夹,文件夹内包括gbfs主程序以及BUILDINFO(编译信息),使用gbfs -?命令可能查看gbfs程序的帮助信息。

[root@rhel73-1 gbfs]# ./gbfs -?
./gbfs ver 9.5.3.22.126635 for unknown-linux-gnu on x86_64
Copyright 2004-2021 General Data Technology Co.Ltd.
GBase File Server
Usage: ./gbfs [OPTIONS]
-V, --version Get version info.
-?, --help    Get help info.
-P, --port    Port number to use for connection or 6666 for default,
             valid range: [1025,65535] order of preference.
-H, --home-dir The GBase file server home dir, default: current user home dir.
-L, --log-dir  The GBase file server logs dir, default: /tmp/.

帮助信息中,包括gbfs的版本信息,以及使用方法的简介。参数介绍如下:

-P & --port 是gbfs专用服务器工作时监听的端口号。默认是6666。

-H & --home-dir 是gbfs工作时的HOME目录,类似于FTP的HOME目录功能,默认是当前启动用户的HOME目录,这个参数主要用于gbfs的相对路径功能的支持。

例如:

以gbase用户运行。那么gbfs的默认HOME目录就是:/home/gbase/, 如果用户数据存放于/home/gbase/data/下。用户就可能直接使用以下URL加载文件。

gbfs://192.168.146.20/data/test.tbl

与之相对的绝对路径的URL如下所示:

gbfs://192.168.146.20//home/gbase/data/test.tbl

用户可以根据实际场景,对该参数进行配置。

-L & --log-dir 是gbfs的日志文件存储目录,gbfs启动后,会在该目录下新建gbfs_port.log。默认是在/tmp/目录下。 

通常建议将gbfs专用文件服务器放至后台运行:

[gbase@rhel73-1 gbfs]$ ./gbfs &
[1] 23302
[gbase@rhel73-1 gbfs]$ IPv6 is available.
gbfs is ready for connections. home dir:/home/gbase/, log dir:/tmp/, port:6666.

示例:

加载位于GBFS服务器上的part.tbl文件,使用默认行分隔符和‘|’列分隔符。

gbase> load data infile 'gbfs://192.168.146.20//opt/ssbm/part.tbl' into table part data_format 3  FIELDS TERMINATED BY '|';

2 加载状态监控

功能说明

加载任务启动后,可以通过SQL方式查看本次加载任务的状态信息。

语法格式

SELECT * FROM information_schema.load_status;

图 :状态信息表中记录正在运行的所有加载任务的状态信息。

南大通用GBase 8a MPP Cluster数据加载GBFS专用文件服务器部署及加载状态监控_8a

状态信息表各字段定义如下:

字段名称

含 义 说 明

SCN

SCN number

DB_NAME

库名

TB_NAME

表名

IP

加载机IP

STATE

加载状态

START_TIME

加载启动时间

ELAPSED_TIME

加载结束时间

AVG_SPEED

加载速度

PROGRESS

加载进度

TOTAL_SIZE

文件总长度

LOADED_SIZE

已加载数据量

LOADED_RECORDS

已加载数据条数

SKIPPED_RECORDS

跳过数据条数

DATA_SOURCE

数据源

SQL_CMD

加载任务的SQL

以上就是今天的内容,感谢阅读!