influxdb java写入性能 influxdb数据格式

转载

mob64ca1402d47a 2024-01-24 23:39:11

文章标签 influxdb java写入性能数据数据库 HTTP 文章分类 Java 后端开发

这是一个大数据爆发的时代。面对信息的激流、多元化数据的涌现，我们在获取、存储、传输、理解、分析、应用、维护大数据时，无疑需要一种便捷的信息交流通道，以便快速、有效、准确地理解和驾驭这个过程。本文将通过时序数据库(InfluxDB)+Grafana的实践，来介绍如何将数据便捷地展现出来。

一、InfluxDB

开源的分布式时序、时间和指标数据库，使用Go语言编写，无需外部依赖。其中，时间序列数据库是数据格式里包含Timestamp字段的数据，比如某一时间用户上网流量、通话详单等。但是，有什么数据不包含Timestamp呢？几乎所有的数据都可以打上一个Timestamp字段。时间序列数据更重要的一个属性是如何去查询它，包括数据的过滤、计算等。

它有三大特性：

时序性（Time Series）：与时间相关的函数的灵活使用（例如最大、最小、求和等）；
度量（Metrics）：对实时大量数据进行计算；
事件（Event）：支持任意的事件数据，换句话说，任意事件的数据我们都可以做操作。

个人认为InfluxDB的几个优点：

无特殊依赖，几乎开箱即用（如ElasticSearch需要Java）
自带数据过期功能；
自带权限管理，精细到“表”级别；
原生的HTTP支持，内置HTTP API
强大的类SQL语法，支持min, max, sum, count, mean, median 等一系列函数，方便统计。
自带管理界面(如下图)，免插件配置。

influxdb java写入性能 influxdb数据格式_数据库

InfluxDB基本概念

1、与传统数据库中的名词做比较

InfluxDB中的名词	传统数据库中的概念
database	数据库
measurement	数据库中的表
points	表里面的一行数据

2、InfluxDB中特有的概念

1）Point

Point由时间戳（time）、数据（field）、标签（tags）组成。

Point相当于传统数据库里的一行数据，如下表所示：

Point属性	传统数据库中的概念
time	每个数据记录时间，是数据库中的主索引(会自动生成)
fields	各种记录值（没有索引的属性）也就是记录的值：温度，湿度
tags	各种有索引的属性：地区，海拔

2）series

所有在数据库中的数据，都需要通过图表来展示，而这个series表示这个表里面的数据，可以在图表上画成几条线：通过tags排列组合算出来。

如下所示：

influxdb java写入性能 influxdb数据格式_数据库_02

3、InfluxDB相关API

InfluxDB 支持http api 方式写入数据。使用curl这个工具来模拟HTTP 请求，在实际使用中，可以将请求写入代码中，通过其他编程语言来模拟HTTP请求。

例如：通过HTTP API向Internet_users这张表添加数据

curl -v –XPOST "http:// localhost:8086/write?db=Internet&u=user&p=password" --data-binary "Internet_users,users=小区上网用户,mobile=移动端上网用户,users_num=56,

mobile_num=21 1493571600000000000"

influxdb java写入性能 influxdb数据格式_influxdb java写入性能_03

说明：

db=Interne是指使用Interne数据库；
--data-binary后面是需插入数据，其中：

Internet_users：表名（measurement）
tag字段：users和mobile,值分别为：小区上网用和移动端上网用户
field key字段：users_num和mobile_num，值分别为56和21
时间戳（timestamp）：1493571600000000000

这样，就向Interne数据库的Internet_users表中插入了一条数据。

需要注意，DB参数必须指定一个数据库中已经存在的数据库名，数据体的格式遵从InfluxDB规定格式，首先是表名，后面是tags，然后是field，最后是时间戳。tags、field和时间戳三者之间以空格相分隔。

InfluxDB 数据可视化工具

InfluxDB 用于存储基于时间的数据，比如监控数据，因为InfluxDB本身提供了Http API，所以可以使用InfluxDB很方便的搭建了个监控数据存储中心。对于InfluxDB中的数据展示，这里不得不提数据展示利器-Grafana。

二、实践案例

1、数据采集规划

目前采集数据主要来源于Hadoop的jmx监控，获取相关Cluster、Queue等Metrics信息以及部分Oracle日志信息，通过相关接口写入InfluxDB数据库，根据来源及日志信息从数据库层进行独立管理设计，以便后续维护。

2、InfluxDB数据库权限配置

InfluxDB自带权限控制，权限分别为：

ADMIN：所有者
READ :只读（精确到库与表）
WRITE：只写（精确到库与表）
ALL (READ 和 WRITE ) ：读和写

鉴于源数据流，目前只会用到三个角色，对于这三个角色分工如下：

ADMIN：维护人员
READ：数据展示与后台查询（Grafana上设置的Influnxdb为只读）
WRITE：外部程序（插入数据至Influnxdb）

配置数据库权限需开启相关认证，操作如下：

vi /etc/InfluxDB/InfluxDB.conf

把 [http] 标签下的 auth-enabled 选项值改为 true

[http] 
enabled = true 
bind-address = ":8086" 
auth-enabled = true
log-enabled = true 
write-tracing = false 
pprof-enabled = false 
https-enabled = false 
https-certificate = "/etc/ssl/InfluxDB.pem"

3、Influnxdb和Grafana高可用配置

本次实践为了避免因主机通断而导致Influnxdb和Grafana服务无法使用的情况，所以在部署应用时用了2台虚拟机，2台虚拟机安装的服务如下：

主机	服务
Localhost-01	InfluxDB+Grafana
Localhost-02	InfluxDB+Grafana

在系统层方面又做了如下设置：

主机域名设置

将两台主机设置为主备模式，共用同一个域名http://xxx.xxx.com

域名	主机	主备模式
http://xxx.xxx.com	Localhost-01	主
http://xxx.xxx.com	Localhost-02	备

负载均衡设置

负载均衡设置即VIP主用与容灾端域名+端口与的Localhost-01～02主备节点域名+端口映射。大家都知道InfluxDB和Grafana端口如下图展示：

服务	端口
InfluxDB	8083
InfluxDB	8086
InfluxDB	8088
Grafana	3000

所以映射关系可设计成这样：

VIP：主用ip、容灾ip
VPORT：8083
均衡算法：pi 32 rr
健康检查：tcp
实例IP及端口：
Localhost-01的ip 8083
Localhost-02的ip 8083

其它端口均按此设置，负载均衡设置完成后，这里不得不提Grafana配置，如果要做到可视化展示的高可用，那么Grafana配置数据源就必须采用域名+端口的方式：

influxdb java写入性能 influxdb数据格式_HTTP_04

至此数据安全设置完毕。

4、Grafana界面配置

完成以上环境配置，根据相关需求进行Grafana界面配置以及监控配置，具体操作可以参照官网操作教程，这里不再赘述。

HDFS目录配额监控：

influxdb java写入性能 influxdb数据格式_数据_05

HDFS空间使用率监控：

influxdb java写入性能 influxdb数据格式_数据库_06

三、数据库备份

命令格式
influxd backup -database [name] [path-to-backup]

更多的使用方式可以利用命令 influxd help 进行查看进行举一反三。

示例
influxd backup -database metric ./data

由于我这里的 InfluxDB 的版本为 v1.1.1 所以需要指定数据库进行进行备份；可能新版的不需要指定就可以默认备份所有的。

数据库恢复
influxd restore -database metric -metadir /var/lib/influxdb/meta -datadir /var/lib/influxdb/data ./data

注意：恢复数据的时候 InfluxDB 是支持版本兼容的（但可能不是全部，我恢复的版本为 vv1.5.4 ），不同的版本的话具体情况具体分析吧！

重启生效
以上命令执行完毕之后请一定要重新启动方能生效，重启之后我们就能利用相应的工具查看数据库信息了。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。