概念
NoSQL 泛指非关系型的数据库。近年来,非关系型数据库非常迅速的发展,为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。NoSQL数据库分为四大类:键值存储数据库,如redis;类存储数据库,如HBASE;文档型数据库,如mongodb和图形数据库,如Graph。
- 这四种NoSQL数据库普遍存在下面一些共同特征:
- 不需要预定义模式:不需要事先定义数据模式,预定义表结构。数据中的每条记录都可能有不同的属性和格式。当插入数据时,并不需要预先定义它们的模式。
- 无共享架构:相对于将所有数据存储的存储区域网络中的全共享架构。NoSQL往往将数据划分后存储在各个本地服务器上。因为从本地磁盘读取数据的性能往往好于通过网络传输读取数据的性能,从而提高了系统的性能。
- 弹性可扩展:可以在系统运行的时候,动态增加或者删除结点。不需要停机维护,数据可以自动迁移。
- 分区:相对于将数据存放于同一个节点,NoSQL数据库需要将数据进行分区,将记录分散在多个节点上面。并且通常分区的同时还要做复制。这样既提高了并行性能,又能保证没有单点失效的问题。
- 异步复制:和RAID存储系统不同的是,NoSQL中的复制,往往是基于日志的异步复制。这样,数据就可以尽快地写入一个节点,而不会被网络传输引起迟延。缺点是并不总是能保证一致性,这样的方式在出现故障的时候,可能会丢失少量的数据。
- BASE:相对于事务严格的ACID特性,NoSQL数据库保证的是BASE特性。BASE是最终一致性和软事务。
Python操作redis
redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步。
- redis的安装
- 安装redisRedis一般都是安装在linux系统中,具体安装步骤如下:
- cd /usr/local/src
- wget http://download.redis.io/releases/redis-3.0.1.tar.gz
- tar xzf redis-3.0.1.tar.gz
- cd redis-3.0.1
- make
- src/redis-server & 或者在他的配置文件中把daemonise 改成yes
- 修改62行的bind 127.0.0.1 。注释该行,根据51,52行的英文说明,可以知道注释所有bind后,任何主机都能连这个电脑的redis
- 修改81行的protected-mode yes为 no,根据英文说明,no掉这个可以和bind所有主机结合,实现免认证,任何主机都能连。
7,8两项要特别注意修改好,不然连接不上
- 检查redis是否启动成功
- ps –ef |grep redis
- netstat –lnp |grep 6379
- 安装python端的redis
- pip install redis
- 连接redis服务器
必须知道redis服务器的ip地址和redis的端口,默认端口为6379
#!/usr/bin/env python
import redis
r = redis.Redis(host="10.148.60.61", port=6379,db=0) # db参数表示选择哪个库,默认为0,最大为16,配置文件里可以设置
print(r.ping())
# 如果打印的结果为True,则表示连接成功
r.set("hello","world") # 设置键值,类似{"hello":"world"}
print(r.get("hello")) # 得到hello的值,为world
- 在redis服务端查看键值的方法和上面类似
[root@localhost redis-4.0.9]# src/redis-cli
127.0.0.1:6379> select 0
OK
127.0.0.1:6379> keys *
1) "hello"
127.0.0.1:6379> get hello
"world"
- redis连接池
redis-py使用connection pool来管理对一个redis server的所有 连接,避免每次建立、释放连接的开销。默认,每个Redis实例都会维护一个自己的连接。可以直接建立一个连接池,然后作为Redis参数,这样就可以实现多个Redis实例共享一个连接池,具体方法如下:
#!/usr/bin/env python
import redis
pool = redis.ConnectionPool(host="10.148.60.61", port=6379,db=0)
r = redis.Redis(connection_pool=pool)
r.set('keys1','values1')
print(r.get("keys1"))
输出结果为:
b'values1'
- python操作redis
- String操作:
- set(name, value, ex=None, px=None, nx=False, xx=False)
- ex,过期时间(秒)
- px,过期时间(毫秒)
- nx,如果设置为True,则只有name不存在时,当前set操作才执行,同setnx(name,value)
- xx,如果设置为True,则只有name存在时,当前set操作才执行
- get(name)获取值
- mset(name1=“ling”)批量设置值,()为dict类型
In [6]: r.mset(k1="v1",k2="v2",k3="v3")
Out[6]: True
In [7]: r.mget("k1","k2")
Out[7]: [b'v1', b'v2']
- mget(‘name1’,‘name2’)批量获取key的值,()为tuple类型
- append(name, value) 插入键值
- List操作
Redis中存储list类型的数据是在内存中,一个name对应一个list
- lpush(name,value) 向左边开始插入以name为key的列表
r.lpush("testList",2)
r.lpush("testList",3,4,5) #保存在列表中的顺序为5,4,3,2
- rpush(name, value) 向右边开始插入列表
- llen(name)# name对应的list元素的个数
- linsert(name,where,refvalue,value)
- name 代表的是list对应的key值
- where AFTER BEFORE
- refvalue list中的某个元素
- value 你要增加的值是什么
r.linsert("testList","AFTER",3,"a") # 向testList列表中的值为3的后面插入"a"
print(r.lrange("testList",0,-1)) # 打印列表0代表起始位置,-1代表结束位置(最后)
结果
[b'5', b'4', b'3', b'a', b'2']
- r.lset(name,index,value)表示对name对应的list中的某一个索引位置重新赋值。
- name,redis的name
- index,list的索引位置
- value,要设置的值
r.lset("testList",0,"b") # 把testList列表中的第一个元素修改为"b"
结果:
[b'b', b'4', b'3', b'a', b'2']
- r.lrem(name,value,num):在name对应的list中删除指定的值
- name,redis的name
- value,要删除的值
- num=0,删除列表中所有的指定值 ;
- num=2,从前到后,删除2个;
- num=-2,从后向前,删除2个
r.lrem("testList","b",num=0) # 把testList列表中所有的值"b"删除
[b'4', b'3', b'a', b'2']
- lpop(name)在name对应的列表的左侧获取第一个元素并在列表中移除,返回值删除那个元素的值扩展:
r.lpop("testList") # 删除最左边的元素,这里为4,执行完的结果为:
[b'3', b'a', b'2']
- rpop(name)表示从右向左操作
- lindex(name,index):在name对应的列表中根据索引取列表元素
r.lindex("testList",0)
返回:
b'3'
- lrange(name,start,end):在name对应的列表分片获取数据
r.lrange("testList",0,1) # 切片获取第一个,第二个元素
[b'3', b'a']