Redis 1 基础

2023-01-22

Redis

一、Nosql概述

为什么使用Nosql

1、单机Mysql时代

在这里插入图片描述

90年代,一个网站的访问量一般不会太大，单个数据库完全够用。随着用户增多，网站出现以下问题

数据量增加到一定程度，单机数据库就放不下了数据的索引（B+ Tree）,一个机器内存也存放不下访问量变大后（读写混合），一台服务器承受不住。

2、Memcached(缓存) + Mysql + 垂直拆分（读写分离）

网站80%的情况都是在读，每次都要去查询数据库的话就十分的麻烦！所以说我们希望减轻数据库的压力，我们可以使用缓存来保证效率！

在这里插入图片描述

优化过程经历了以下几个过程：

1.优化数据库的数据结构和索引(难度大)

2.文件缓存，通过IO流获取比每次都访问数据库效率略高，但是流量爆炸式增长时候，IO流也承受不了

3.MemCache,当时最热门的技术，通过在数据库和数据库访问层之间加上一层缓存，第一次访问时查询数据库，将结果保存到缓存，后续的查询先检查缓存，若有直接拿去使用，效率显著提升。

3、分库分表 + 水平拆分 + Mysql集群

在这里插入图片描述

4、如今最近的年代

如今信息量井喷式增长，各种各样的数据出现（用户定位数据，图片数据等），大数据的背景下关系型数据库（RDBMS）无法满足大量数据要求。Nosql数据库就能轻松解决这些问题。

目前一个基本的互联网项目

在这里插入图片描述

# 商品信息
- 一般存放在关系型数据库：Mysql,阿里巴巴使用的Mysql都是经过内部改动的。

# 商品描述、评论(文字居多)
- 文档型数据库：MongoDB

# 图片
- 分布式文件系统 FastDFS
- 淘宝：TFS
- Google: GFS
- Hadoop: HDFS
- 阿里云: oss

# 商品关键字 用于搜索
- 搜索引擎：solr,elasticsearch
- 阿里：Isearch 多隆

# 商品热门的波段信息
- 内存数据库：Redis，Memcache

# 商品交易，外部支付接口
- 第三方应用

为什么要用NoSQL ？

用户的个人信息，社交网络，地理位置。用户自己产生的数据，用户日志等等爆发式增长！这时候我们就需要使用NoSQL数据库的，Nosql可以很好的处理以上的情况！

什么是Nosql

NoSQL = Not Only SQL（不仅仅是SQL）

Not Only Structured Query Language

关系型数据库：列+行，同一个表下数据的结构是一样的。

非关系型数据库：数据存储没有固定的格式，并且可以进行横向扩展。

NoSQL泛指非关系型数据库，随着web2.0互联网的诞生，传统的关系型数据库很难对付web2.0时代！尤其是超大规模的高并发的社区，暴露出来很多难以克服的问题，NoSQL在当今大数据环境下发展的十分迅速，Redis是发展最快的。Redis入门

Redis入门

应用场景

配合关系型数据库做高速缓存

在这里插入图片描述

解决CPU及内存压力

在这里插入图片描述

解决IO压力

在这里插入图片描述

安装步骤

【超详细】2021最新版Redis安装教程（基于Redis 6.2.x版本）

Redis数据库成功安装后，默认安装目录为：/usr/local/bin

查看默认安装目录：

redis-benchmark：性能测试工具，可以在自己本子运行，看看自己本子性能如何
redis-check-aof：修复有问题的AOF文件，rdb和aof后面讲
redis-check-dump：修复有问题的dump.rdb文件
redis-sentinel：Redis集群使用
redis-server：Redis服务器启动命令
redis-cli：客户端，操作入口

启动

前台启动（不推荐）

前台启动，命令行窗口不能关闭，否则服务器停止！

启动命令：

redis-server

后台启动（推荐）

1.先做备份，将redis.conf复制到其他目录下：

cp redis.conf /etc/redis.conf

2.修改redis.conf(128行)文件将里面的daemonize no 改成 yes，让服务在后台启动

vim redis.conf

3.启动Redis：redis-server /etc/redis.conf

redis-server /etc/redis.conf

4.然后可以用客户端访问：redis-cli

5.用ping测试联通状态

在这里插入图片描述

6.Redis关闭单实例关闭：redis-cli shutdown 也可以进入终端后再关闭：shutdown

在这里插入图片描述

也可以ps -ef找到进程再kill

Redis是单线程+多路IO复用技术，与Memcache三点不同: 支持多数据类型，支持持久化，单线程+多路IO复用

在这里插入图片描述

多路复用是指使用一个线程来检查多个文件描述符（Socket）的就绪状态，比如调用select和poll函数，传入多个文件描述符，如果有一个文件描述符就绪，则返回，否则阻塞直到超时。得到就绪状态后进行真正的操作可以在同一个线程里执行，也可以启动线程执行（比如使用线程池）

常用五大数据类型

注意：代码块中的key都表示key的名字

1.Redis中的键（key）

查看当前库所有key（匹配：keys *1）：

keys *

我们当前库是空的，所以先添加一个kv：

set k1 ikun
set k2 black
set k3 jack

判断某个key是否存在：

exists key(key的name)

查看你的key是什么类型：

type key

删除指定的key数据：

del key

根据value选择非阻塞删除：

// 仅将keys从keyspace元数据中删除，真正的删除会在后续异步操作
unlink key

为给定的key设置过期时间，10秒：

expire key 10

查看还有多少秒过期，-1表示永不过期，-2表示已过期：

ttl key

select命令：切换数据库//0到15共16个库
dbsize命令：查看当前数据库的key的数量
flushdb命令：清空当前库
flushall命令：清空全部库

2.数据类型—字符串（String）

2.1 简介

String是Redis最基本的类型，你可以理解成与Memcached一模一样的类型，一个key对应一个value。

String类型是二进制安全的。意味着Redis的string可以包含任何数据。比如jpg图片或者序列化的对象。

String类型是Redis最基本的数据类型，一个Redis中字符串value最多可以是512M

2.2 常用命令

添加键值对：

set key value

查询对应键值：

get key

将给定的value追加到原值的末尾：

append key value

获得值的长度：

strlen key

只有在key不存在时设置key的值：

setnx key value

将 key 中储存的数字值增1 只能对数字值操作，如果为空，新增值为1

incr key

将 key 中储存的数字值减1 只能对数字值操作，如果为空，新增值为-1

decr key

将key中储存的数字值增减，自定义步长：

incrby / decrby key 数字值

增减操作只能操作数字值！字符串不行

说到incr命令，这里有个扩展知识点：

Redis具有原子性（不是事务中的原子性）所谓原子操作是指不会被线程调度机制打断的操作；这种操作一旦开始，就一直运行到结束，中间不会有任何 context switch（切换到另一个线程）（1）在单线程中，能够在单条指令中完成的操作都可以认为是”原子操作”，因为中断只能发生于指令之间。（2）在多线程中，不能被其它进程（线程）打断的操作就叫原子操作。 Redis单命令的原子性主要得益于Redis的单线程。

java中的i++是否为原子操作？

不是原子操作 i++分为取值， ++ ，赋值操作极端情况：b抢到线权，开始取值取到0，还没开始++时a抢到了线权，i取值为0，一直加到99； b又抢回线权，开始++操作，i从0加到1。a中i=99就相当于被覆盖了，此时a只能再加1次了，b还能加99次。 a抢回线权，取值为1，还没开始++时，又被b抢到线权，i一直加到100结束，a抢回线权，i+1=2，再赋值操作。 ab都各自加了100次，最后i就是2。问题出在i++分为三步，取值，++，赋值。a取值后，还没开始++之前，是可以被另一线程b打断的，即使a后面抢回线权，它也不会再取值，会继续执行++操作。

更加准确的解释

private static int i = 0;
i++；

对应的字节码也是分成三步

getstatic #2 <Test22.i>//将变量i压入操作数栈
iconst_1//将常量1压入操作数栈
iadd//弹出栈顶两个数，相加

看字节码就更好懂了，a线程将i压入操作数栈后，被b线程打断，即使b线程把i加到100，a抢回线权会执行第二步，将常量1压入操作数栈，第一步已经执行过了，不会再取了

即使i被volatile之后，还是会出现线程安全问题，因为volatile只保证了可见性和有序性，不保证原子性。volatile只保证getstatic这操作拿到的i值是正确的，但是在 iconst和iadd指令时，其他线程可能吧i的值修改了，操作栈顶的值就变成了过期的数据。

换个说法，i++操作是从内存取值到cpu寄存器，寄存器计算加1后再写入内存。于是，当a线程执行完第99次，寄存器为99，内存值为99。而b线程此时的寄存器计算完后值还只是为1，写入内存，内存值被改为1.a线程执行最后一次寄存器值拿到为1. 然后，b线程又执行完100次，此时b线程cpu寄存器值为100，写入内存值为100. 最后，a线程寄存器由于拿到的值为1，计算加一后得到2，写入内存，修改内存值100改为2. 于是得到极端情况下的最小值2。

然后继续学习redis中的字符串

同时设置一个或多个key-value对：

mset key1 value1 key2 value2...

同时获取一个或多个value：

mget key1 key2 key3...

同时设置一个或多个key-value对，当且仅当所有给定key都不存在：

// 原子性，有一个失败则都失败
msetnx key1 value1 key2 value2...

用value覆写key所储存的字符串值，从起始位置开始(索引从0开始)：

setrange key 起始位置 value

设置键值的同时，设置过期时间，单位秒：

setex key 过期时间 value

以新换旧，设置了新值同时获得旧值：

getset key value

2.3 数据结构

String的数据结构为简单动态字符串(Simple Dynamic String,缩写SDS)。是可以修改的字符串，内部结构实现上类似于Java的ArrayList，采用预分配冗余空间的方式来减少内存的频繁分配

在这里插入图片描述

如图中所示，内部为当前字符串实际分配的空间capacity一般要高于实际字符串长度len。当字符串长度小于1M时，扩容都是加倍现有的空间，如果超过1M，扩容时一次只会多扩1M的空间。需要注意的是字符串最大长度为512M。

3.数据类型—列表（List）

3.1 简介

单键多值

Redis 列表是简单的字符串列表，按照插入顺序排序。你可以添加一个元素到列表的头部（左边）或者尾部（右边）

它的底层实际是个双向链表，对两端的操作性能很高，通过索引下标的操作中间的节点性能会较差。

在这里插入图片描述

3.2 常用命令

从左边/右边插入一个或多个值：

lpush / rpush key1 value1 value2 value3...

从左边/右边吐出一个值。值在键在，值光键亡：

lpop / rpop key

从key1列表右边吐出一个值，插到key2列表左边：

rpoplpush key1 key2

按照索引下标获得元素(从左到右)：

lrange key 起始索引 结束索引
lrange key 0 -1   //0左边第一个，-1右边第一个，（0-1表示获取所有）也就代表左右两端，此命令也就是取全部元素

按照索引下标获得元素(从左到右)：

lindex key 索引号

获得列表长度：

llen key

在value的前面插入newvalue插入值：

linsert key before oldvalue newvalue

从左边删除n个value(从左到右)：

lrem key n value

将列表key下标为index的值替换成value：

lset key index value

3.3 数据结构

List的数据结构为快速链表quickList

首先在列表元素较少的情况下会使用一块连续的内存存储，这个结构是ziplist，也即是压缩列表。

它将所有的元素紧挨着一起存储，分配的是一块连续的内存。

当数据量比较多的时候才会改成quicklist。

因为普通的链表需要的附加指针空间太大，会比较浪费空间。比如这个列表里存的只是int类型的数据，结构上还需要两个额外的指针prev和next。

在这里插入图片描述 Redis将链表和ziplist结合起来组成了quicklist。也就是将多个ziplist使用双向指针串起来使用。这样既满足了快速的插入删除性能，又不会出现太大的空间冗余。

4.数据类型—集合（Set）

4.1 简介

Redis set对外提供的功能与list类似是一个列表的功能，特殊之处在于set是可以自动排重的，当你需要存储一个列表数据，又不希望出现重复数据时，set是一个很好的选择，并且set提供了判断某个成员是否在一个set集合内的重要接口，这个也是list所不能提供的。

Redis的Set是string类型的无无序集合。它底层其实是一个value为null的hash表，所以添加，删除，查找的复杂度都是O(1)。

一个算法，随着数据的增加，执行时间的长短，如果是O(1)，数据增加，查找数据的时间不变

4.2 常用命令

将一个或多个 member 元素加入到集合 key 中，已经存在的 member 元素将被忽略：

sadd key value1 value2...

取出该集合的所有值：

smembers key

判断集合key是否为含有该value值，有1，没有0：

sismember key value

返回该集合的元素个数：

scard key

删除集合中的某个元素：

srem key value1 value2...

随机从该集合中吐出一个值（随机吐出，注意吐出完了就不存在数据了）：

spop key

随机从该集合中取出n个值。不会从集合中删除：

srandmember key n

把集合中一个值从一个集合移动到另一个集合：

smove 集合1 集合2 value

返回两个集合的交集元素：

sinter key1 key2

返回两个集合的并集元素：

sunion key1 key2

返回两个集合的差集元素(key1中的，不包含key2中的)：

sdiff key1 key2

4.3 数据结构

Set数据结构是dict字典，字典是用哈希表实现的。

Java中HashSet的内部实现使用的是HashMap，只不过所有的value都指向同一个对象。Redis的set结构也是一样，它的内部也使用hash结构，所有的value都指向同一个内部值。

5.数据类型—哈希（Hash）

5.1 简介

Redis hash 是一个键值对集合。

Redis hash是一个string类型的field和value的映射表，hash特别适合用于存储对象。

类似Java里面的Map<String,Object>

用户ID为查找的key，存储的value用户对象包含姓名，年龄，生日等信息，如果用普通的key/value结构来存储

主要有以下2种存储方式：

在这里插入图片描述

5.2 常用命令

给key集合中的field键赋值value：

hset key field value

从key1集合field取出 value ：

hget key1 field

批量设置hash的值：

hmset key1 field1 value1 field2 value2...

查看哈希表 key 中，给定域 field 是否存在：

hexists key1 field

列出该hash集合的所有field：

hkeys key

列出该hash集合的所有value：

hvals key

为哈希表 key 中的域 field 的值加上增量 1 -1

hincrby key field 增量

将哈希表 key 中的域 field 的值设置为 value ，当且仅当域 field 不存在：

hsetnx key field value

5.3 数据结构

Hash类型对应的数据结构是两种：ziplist（压缩列表），hashtable（哈希表）。当field-value长度较短且个数较少时，使用ziplist，否则使用hashtable。

6.数据类型—有序集合（Zset）

6.1 简介

Redis有序集合zset与普通集合set非常相似，是一个没有重复元素的字符串集合

不同之处是有序集合的每个成员都关联了一个评分（score）,这个评分（score）被用来按照从最低分到最高分的方式排序集合中的成员。**集合的成员是唯一的，但是评分可以是重复了。**

因为元素是有序的, 所以你也可以很快的根据评分（score）或者次序（position）来获取一个范围的元素。

访问有序集合的中间元素也是非常快的,因此你能够使用有序集合作为一个没有重复成员的智能列表。

6.2 常用命令

将一个或多个 member 元素及其 score 值加入到有序集 key 当中：

zadd key score1 value1 score2 value2

返回有序集 key 中，下标在start、stop之间的元素带WITHSCORES，可以让分数一起和值返回到结果集：

zrange key start stop [withscores]

返回有序集 key 中，所有 score 值介于 min 和 max 之间(包括等于 min 或 max )的成员。有序集成员按 score 值递增(从小到大)次序排列：

zrangebyscore key min max [withscores] [limit offset count]

同上，改为从大到小排列：

zrevrangebyscore key max min [withscores] [limit offset count]

为元素的score加上增量：

zincrby key 增量 value

删除该集合下，指定值的元素：

zrem key value

统计该集合，分数区间内的元素个数：

zcount key min max

返回该值在集合中的排名，从0开始：

zrank key value

6.3 数据结构

SortedSet(zset)是Redis提供的一个非常特别的数据结构，一方面它等价于Java的数据结构Map<String, Double>，可以给每一个元素value赋予一个权重score，另一方面它又类似于TreeSet，内部的元素会按照权重score进行排序，可以得到每个元素的名次，还可以通过score的范围来获取元素的列表。

zset底层使用了两个数据结构：

hash，hash的作用就是关联元素value和权重score，保障元素value的唯一性，可以通过元素value找到相应的score值。
跳跃表，跳跃表的目的在于给元素value排序，根据score的范围获取元素列表。

6.4 跳跃表（跳表）

简介：有序集合在生活中比较常见，例如根据成绩对学生排名，根据得分对玩家排名等。对于有序集合的底层实现，可以用数组、平衡树、链表等。数组不便元素的插入、删除；平衡树或红黑树虽然效率高但结构复杂；链表查询需要遍历所有效率低。Redis采用的是跳跃表。跳跃表效率堪比红黑树，实现远比红黑树简单。
实例：对比有序链表和跳跃表，从链表中查询出51

有序链表要查找值为51的元素，需要从第一个元素开始依次查找、比较才能找到。共需要6次比较。

跳跃表从第2层开始，1节点比51节点小，向后比较。 21节点比51节点小，继续向后比较，后面就是NULL了，所以从21节点向下到第1层在第1层，41节点比51节点小，继续向后，61节点比51节点大，所以从41向下在第0层，51节点为要查找的节点，节点被找到，共查找4次。从此可以看出跳跃表比有序链表效率要高

Redis配置文件介绍

自定义目录：/etc/redis.conf

1.Units单位

配置大小单位,开头定义了一些基本的度量单位，只支持bytes，不支持bit 大小写不敏感

在这里插入图片描述

2.INCLUDES包含

在这里插入图片描述

类似jsp中的include，多实例的情况可以把公用的配置文件提取出来

3.网络相关配置

3.1 bind

默认情况bind=127.0.0.1只能接受本机的访问请求不写的情况下，无限制接受任何ip地址的访问生产环境肯定要写你应用服务器的地址；服务器是需要远程访问的，所以需要将其注释掉

如果开启了protected-mode，那么在没有设定bind ip且没有设密码的情况下，Redis只允许接受本机的响应

在这里插入图片描述

保存配置，停止服务，重启启动查看进程，不再是本机访问了。

在这里插入图片描述

3.2 protected-mode

将本机访问保护模式设置no 在这里插入图片描述

3.3 Port

端口号，默认 6379 在这里插入图片描述

3.4 tcp-backlog

设置tcp的backlog，backlog其实是一个连接队列，backlog队列总和=未完成三次握手队列 + 已经完成三次握手队列。

在高并发环境下你需要一个高backlog值来避免慢客户端连接问题。

注意Linux内核会将这个值减小到/proc/sys/net/core/somaxconn的值（128），所以需要确认增大/proc/sys/net/core/somaxconn和/proc/sys/net/ipv4/tcp_max_syn_backlog（128）两个值来达到想要的效果在这里插入图片描述

3.5 timeout

一个空闲的客户端维持多少秒会关闭，0表示关闭该功能。即永不关闭。在这里插入图片描述

3.6 tcp-keepalive

对访问客户端的一种心跳检测，每个n秒检测一次。

单位为秒，如果设置为0，则不会进行Keepalive检测，建议设置成60 在这里插入图片描述

4.GENERAL通用

4.1 daemonize

是否为后台进程，设置为yes

守护进程，后台启动在这里插入图片描述

4.2 pidfile

存放pid文件的位置，每个实例会产生一个不同的pid文件在这里插入图片描述

4.3 loglevel

指定日志记录级别，Redis总共支持四个级别：debug、verbose、notice、warning，默认为notice

四个级别根据使用阶段来选择，生产环境选择notice 或者warning 在这里插入图片描述

4.4 logfile

日志文件名称在这里插入图片描述

4.5 databases 16

设定库的数量默认16，默认数据库为0，可以使用SELECT 命令在连接上指定数据库id 在这里插入图片描述

5.SECURITY安全（重要）

5.1 设置密码

在这里插入图片描述访问密码的查看、设置和取消

在命令中设置密码，只是临时的。重启redis服务器，密码就还原了

永久设置，需要再配置文件中进行设置，将注释去掉，并将后面对应的字段设置成自己想要的密码，保存退出。重启redis服务，即可。密码设置后，再一次连接不输入密码是不能够操作的,然后在cli中用auth password才可以pingpong：

[root@boserver ~]# redis-server /etc/redis.conf 
[root@boserver ~]# redis-cli
127.0.0.1:6379> ping
(error) NOAUTH Authentication required.
127.0.0.1:6379> auth wyb17780902277
OK
127.0.0.1:6379> ping
PONG

6.LIMITS限制

6.1 maxclients

设置redis同时可以与多少个客户端进行连接

默认情况下为10000个客户端。

如果达到了此限制，redis则会拒绝新的连接请求，并且向这些连接请求方发出“max number of clients reached”以作回应。在这里插入图片描述

6.2 maxmemory（重要）

建议必须设置，否则，将内存占满，造成服务器宕机

设置redis可以使用的内存量。一旦到达内存使用上限，redis将会试图移除内部数据，移除规则可以通过maxmemory-policy来指定。

如果redis无法根据移除规则来移除内存中的数据，或者设置了“不允许移除”，那么redis则会针对那些需要申请内存的指令返回错误信息，比如SET、LPUSH等。

但是对于无内存申请的指令，仍然会正常响应，比如GET等。如果你的redis是主redis（说明你的redis有从redis），那么在设置内存使用上限时，需要在系统中留出一些内存空间给同步队列缓存，只有在你设置的是“不移除”的情况下，才不用考虑这个因素。在这里插入图片描述

6.3 maxmemory-policy

volatile-lru：使用LRU算法移除key，只对设置了过期时间的键；（最近最少使用）

allkeys-lru：在所有集合key中，使用LRU算法移除key

volatile-random：在过期集合中移除随机的key，只对设置了过期时间的键

allkeys-random：在所有集合key中，移除随机的key

volatile-ttl：移除那些TTL值最小的key，即那些最近要过期的key

noeviction：不进行移除。针对写操作，只是返回错误信息在这里插入图片描述

Redis的发布和订阅

1.什么是发布和订阅

Redis 发布订阅 (pub/sub) 是一种消息通信模式：发送者 (pub) 发送消息，订阅者 (sub) 接收消息。

Redis 客户端可以订阅任意数量的频道。

2.Redis的发布和订阅

客户端可以订阅频道如下图

在这里插入图片描述

当给这个频道发布消息后，消息就会发送给订阅的客户端

3.发布订阅命令行实现

打开一个客户端订阅channel1

127.0.0.1:6379> SUBSCRIBE channel1
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "channel1"
3) (integer) 1

打开另一个客户端，(即在xhell再添加一个会话并且连接上redis客户端)给channel1发布消息hello publish channel1 hello

[root@boserver ~]# /usr/local/bin/redis-cli
127.0.0.1:6379> publish channel1 hello
(error) NOAUTH Authentication required.
127.0.0.1:6379> auth wyb17780902277
OK
127.0.0.1:6379> publish channel1 hello
(integer) 1

返回的1是订阅者数量

打开第一个客户端可以看到发送的消息

127.0.0.1:6379> SUBSCRIBE channel1
Reading messages... (press Ctrl-C to quit)
1) "subscribe"
2) "channel1"
3) (integer) 1
1) "message"
2) "channel1"
3) "hello"#得到hello

注：发布的消息没有持久化，如果在订阅的客户端收不到hello，只能收到订阅后发布的消息

Redis新数据类型

1.Bitmaps

1.1 简介

现代计算机用二进制（位）作为信息的基础单位， 1个字节等于8位，例如“abc”字符串是由3个字节组成，但实际在计算机存储时将其用二进制表示， “abc”分别对应的ASCII码分别是97、 98、 99，对应的二进制分别是01100001、 01100010和01100011，如下图：在这里插入图片描述合理地使用操作位能够有效地提高内存使用率和开发效率。

Redis提供了Bitmaps这个“数据类型”可以实现对位的操作：

Bitmaps本身不是一种数据类型，实际上它就是字符串（key-value），但是它可以对字符串的位进行操作。

Bitmaps单独提供了一套命令，所以在Redis中使用Bitmaps和使用字符串的方法不太相同。可以把Bitmaps想象成一个以位为单位的数组，数组的每个单元只能存储0和1，数组的下标在Bitmaps中叫做偏移量。

1.2 常用命令

1.setbit

设置Bitmaps中某个偏移量的值（0或1）：

setbit key offset value
注意：offset:偏移量从0开始

实例：每个独立用户是否访问过网站存放在Bitmaps中，将访问的用户记做1，没有访问的用户记做0，用偏移量作为用户的id。设置键的第offset个位的值（从0算起），假设现在有20个用户，userid=0，1， 6， 11， 1,的用户对网站进行了访问

127.0.0.1:6379> setbit users:20230101 0 1
(integer) 0
127.0.0.1:6379> setbit users:20230101 1 1
(integer) 0
127.0.0.1:6379> setbit users:20230101 6 1
(integer) 0
127.0.0.1:6379> setbit users:20230101 11 1
(integer) 0
127.0.0.1:6379> setbit users:20230101 15 1
(integer) 0

注意：很多应用的用户id以一个指定数字（例如10000) 开头，直接将用户id和Bitmaps的偏移量对应势必会造成一定的浪费，通常的做法是每次做setbit操作时将用户id减去这个指定数字。

在第一次初始化Bitmaps时，假如偏移量非常大，那么整个初始化过程执行会比较慢，可能会造成Redis的阻塞。

2.getbit

获取Bitmaps中某个偏移量的值：

getbit key offset

获取键的第offset位的值（从0开始算）

实例：获取id=8的用户是否在2020-11-06这天访问过，返回0说明没有访问过：在这里插入图片描述注：因为100根本不存在，所以也是返回0

3.bitcount

统计字符串被设置为1的bit数。一般情况下，给定的整个字符串都会被进行计数，通过指定额外的 start 或 end 参数，可以让计数只在特定的位上进行。start 和 end 参数的设置，都可以使用负数值：比如 -1 表示最后一个位，而 -2 表示倒数第二个位，start、end 是指bit组的字节的下标数，二者皆包含。

统计字符串从start字节到end字节比特值为1的数量：

bitcount key [start end]

实例：计算2022-11-06这天的独立访问用户数量在这里插入图片描述 start和end代表起始和结束字节数，下面操作计算用户id在第1个字节到第3个字节之间的独立访问用户数，对应的用户id是11， 15， 19。举例： K1 【01000001 01000000 00000000 00100001】，对应【0，1，2，3】

bitcount K1 1 2 ：统计下标1、2字节组中bit=1的个数，即01000000 00000000 –》bitcount K1 1 2 　–》1

bitcount K1 1 3 ：统计下标1、2字节组中bit=1的个数，即01000000 00000000 00100001 –》bitcount K1 1 3　 –》3

bitcount K1 0 -2 ：统计下标0到下标倒数第2，字节组中bit=1的个数，即01000001 01000000 00000000 –》bitcount K1 0 -2　 –》3

注意：redis的setbit设置或清除的是bit位置，而bitcount计算的是byte位置。

1.3 Bitmaps与set对比

假设网站有1亿用户，每天独立访问的用户有5千万，如果每天用集合类型和Bitmaps分别存储活跃用户可以得到表在这里插入图片描述很明显，这种情况下使用Bitmaps能节省很多的内存空间，尤其是随着时间推移节省的内存还是非常可观的但Bitmaps并不是万金油，假如该网站每天的独立访问用户很少，例如只有10万（大量的僵尸用户），那么两者的对比如下表所示，很显然，这时候使用Bitmaps就不太合适了，因为基本上大部分位都是0。在这里插入图片描述

2.HyperLogLog

2.1 简介

在工作当中，我们经常会遇到与统计相关的功能需求，比如统计网站PV（PageView页面访问量）,可以使用Redis的incr、incrby轻松实现。

但像UV（UniqueVisitor，独立访客）、独立IP数、搜索记录数等需要去重和计数的问题如何解决？这种求集合中不重复元素个数的问题称为基数问题。

解决基数问题有很多种方案： （1）数据存储在MySQL表中，使用distinct count计算不重复个数 （2）使用Redis提供的hash、set、bitmaps等数据结构来处理

以上的方案结果精确，但随着数据不断增加，导致占用空间越来越大，对于非常大的数据集是不切实际的。

能否能够降低一定的精度来平衡存储空间？Redis推出了HyperLogLog

Redis HyperLogLog 是用来做基数统计的算法，HyperLogLog 的优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。

在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。

但是，因为 HyperLogLog 只会根据输入元素来计算基数，而不会储存输入元素本身，所以 HyperLogLog 不能像集合那样，返回输入的各个元素。

什么是基数? 比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数。

2.2 常用命令

1.pfadd

添加指定元素到 HyperLogLog 中：

pfadd key element element...

实例：在这里插入图片描述将所有元素添加到指定HyperLogLog数据结构中。如果执行命令后HLL估计的近似基数发生变化，则返回1，否则返回0。

2.pfcount

计算HLL的近似基数，可以计算多个HLL，比如用HLL存储每天的UV，计算一周的UV可以使用7天的UV合并计算即可：

pfcount key [key...]

实例：在这里插入图片描述

3.pfmerge

将一个或多个HLL合并后的结果存储在另一个HLL中，比如每月活跃用户可以使用每天的活跃用户来合并计算可得：

pfmerge destkey sourcekey [sourcekey ...]

实例：在这里插入图片描述

3.Geospatial

3.1 简介

Redis 3.2 中增加了对GEO类型的支持。GEO，Geographic，地理信息的缩写。该类型，就是元素的2维坐标，在地图上就是经纬度。redis基于该类型，提供了经纬度设置，查询，范围查询，距离查询，经纬度Hash等常见操作。

3.2 常用命令

1.geoadd

添加地理位置（经度，纬度，名称）：

geoadd key longitude latitude member [longitude latitude member...]

实例：

geoadd china:city 121.47 31.23 shanghai
geoadd china:city 106.50 29.53 chongqing 114.05 22.52 shenzhen 116.38 39.90 beijing

在这里插入图片描述两极无法直接添加，一般会下载城市数据，直接通过 Java 程序一次性导入。有效的经度从 -180 度到 180 度。有效的纬度从 -85.05112878 度到 85.05112878 度。当坐标位置超出指定范围时，该命令将会返回一个错误。已经添加的数据，是无法再次往里面添加的。

2.geopos

获得指定地区的坐标值：

geopos key member [member...]

实例：在这里插入图片描述

3.geodist

获取两个位置之间的直线距离：

geodist key member1 member2 [m|km|ft|mi]

实例：

获取两个位置之间的直线距离在这里插入图片描述单位： m 表示单位为米[默认值]。 km 表示单位为千米。 mi 表示单位为英里。 ft 表示单位为英尺。如果用户没有显式地指定单位参数，那么 GEODIST 默认使用米作为单位

4.georadius

以给定的经纬度为中心，找出某一半径内的元素：

经度 纬度 距离 单位
georadius key longitude latitude radius  m|km|ft|mi

实例：在这里插入图片描述

###