redis存储使用方法_redis 怎么存数组和获取数组

1. 怎么样使用Redis来存储和查询ip数据

今天朋友打了个电话，他们网站的业务要根据客户的ip地址快速定位客户的地理位置。网上已经有一大堆类似的ip地址库可以用，但问题是这些地址库的数据表结构大多如下所示
+--------------+------------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+--------------+------------------+------+-----+---------+----------------+
| ip_id | int(11) unsigned | NO | PRI | NULL | auto_increment |
| ip_country | varchar(50) | NO | | NULL | |
| ip_startip | bigint(11) | NO | MUL | NULL | |
| ip_endip | bigint(11) | NO | MUL | NULL | |
| country_code | varchar(2) | NO | | NULL | |
| zone_id | int(11) | NO | | 0 | |
+--------------+------------------+------+-----+---------+----------------+

最核心的部分是三个： ip_startip ， ip_endip 以及 ip_id 。其中 ip_id 是要查询的结果，当然也可以把 zone_id 和 ip_country 包括进去。这里就用 ip_id 来特指查询结果了。
面对这个表，没什么其它办法，查询语句只能是
SELECT * FROM who_ip WHERE ip_startip <= {ip} AND ip_endip >= {ip}

其中 {ip} 是要查询的ip地址，为了方便查询，在php中一般要用 ip2long函数把它转换为一个整数。现在问题来了，这个表有400万条数据，无论你怎么优化它的索引结构（实际上我觉得这没啥用），在以上查询语句中都要耗费2秒以上的时间，对于一个高频使用的接口，这显然是不可忍受的。
REDIS能不能解决这个问题。实际上这也是朋友最关心的问题，因为知道Redis有强大数据结构和超快的速度，那么能不能设计出适应这种查询场景的结构。
范围查询，首先想到的就是Redis里面的 Sorted Sets 结构，这也是redis中唯一可以指定范围( SCORE 值)查询的结构了，所以基本上希望都寄托在它身上了。
最简单粗暴的方法就是把 ip_startip 和 ip_endip 都转化为 Sorted Sets 里的 Score ，然后把 ip_id 定义为 Member 。这样我们的查询就很简单了，只需要用 ZRANGESCORE 查询出离ip最近SCORE对应的两个 ip_id 即可。然后再分析，如果这两个 ip_id 是相同的，那么说明这个ip在这个地址段，如果不同的话证明这个ip地址没有被任何地址段所定义，是一个未知的ip。
基本逻辑是没有问题的，但是最大的问题还是性能上的挑战。根据我的经验，一个SET 里面放10万条数据以上就已经很慢了，如果放到400万这种量级，我非常怀疑它跟mysql相比还有优势吗？
我设计的存储结构
我的解决方案是把这个地址库切分，每一片区最多保存65536个地址。也就是说如果一个ip地址段为 188.88.77.22 - 188.90.78.10 ，那么我们就把它切分为
188.88.77.22 - 188.88.77.255
188.89.0.0 - 188.89.255.255
188.90.0.0 - 189.90.78.10

也就是我们保证每一个ip地址段都被保存在 xxx.xxx.0.0 - xxx.xxx.255.255的一个区段中，这个区段的理论极限是保存65536个值，实际上要远小于这个数字。而这样的区段理论上也有65536个，这都是ip地址的设计所限，当然实际上也远小于这个值。
因此这样的设计基本上就能满足我们的性能需要了。以下是我用php写的数据切分程序
<?php

// redis 参数
define('REDIS_HOST', '127.0.0.1');
define('REDIS_PORT', 6379);
define('REDIS_DB', 10);

define('MYSQL_HOST', 'localhost');
define('MYSQL_PORT', 3306);
define('MYSQL_USER', 'root');
define('MYSQL_PASS', '123456');
define('MYSQL_DB', 'who_brand');

define('MYSQL_TABLE', 'who_ip');
define('MYSQL_COLUMN_START', 'ip_startip');
define('MYSQL_COLUMN_END', 'ip_endip');
define('MYSQL_COLUMN_ID', 'ip_id');
define('MYSQL_PAGESIZE', 1000);

mysql_connect(MYSQL_HOST . ':' . MYSQL_PORT, MYSQL_USER, MYSQL_PASS);
mysql_select_db(MYSQL_DB);

function add_ip($page, $offset, $value) {
static $redis;

if (!$redis) {
$redis = new Redis();
$redis->connect(REDIS_HOST, REDIS_PORT);
$redis->select(REDIS_DB);
}

$key = 'ip:' . $page;
$redis->zAdd($key, $offset, $value);
}

$page = 0;
do {
$offset = $page * MYSQL_PAGESIZE;
$count = 0;

$res = mysql_query('SELECT * FROM ' . MYSQL_TABLE . ' LIMIT ' . MYSQL_PAGESIZE . " OFFSET {$offset}");

while ($ip = mysql_fetch_assoc($res)) {
$start = $ip[MYSQL_COLUMN_START];
$end = $ip[MYSQL_COLUMN_END];
$value = $ip[MYSQL_COLUMN_ID];

$startOffset = $start % 65536;
$endOffset = $end % 65536;

$start -= $startOffset;
$end -= $endOffset;

$startPage = $start / 65536;
$endPage = $end / 65536;

for ($i = $startPage; $i <= $endPage; $i ++) {
if ($i == $startPage) {
add_ip($i, $startOffset, 's:' . $value);

if ($i != $endPage) {
add_ip($i, 65535, 'e:' . $value);
}
}

if ($i == $endPage) {
add_ip($i, $endOffset, 'e:' . $value);

if ($i != $startPage) {
add_ip($i, 0, 's:' . $value);
}
}

if ($i != $endPage && $i != $startPage) {
add_ip($i, 0, 's:' . $value);
add_ip($i, 65535, 'e:' . $value);
}
}

echo ($page * MYSQL_PAGESIZE + $count) . "\n";
$count ++;
}

$page ++;
} while ($count = MYSQL_PAGESIZE);

<?php

define('REDIS_HOST', '127.0.0.1');
define('REDIS_PORT', 6379);
define('REDIS_DB', 10);

$redis = new Redis();
$redis->connect(REDIS_HOST, REDIS_PORT);
$redis->select(REDIS_DB);

$ip = ip2long('173.255.218.70');
$offset = $ip % 65536;
$page = ($ip - $offset) / 65536;

// 取出小于等于它的最接近值
$start = $redis->zRevRangeByScore('ip:' . $page, 0, $offset, array(
'limit' => array(0, 1)
));

// 取出大于等于它的最接近值
$end = $redis->zRangeByScore('ip:' . $page, $offset, 65535, array(
'limit' => array(0, 1)
));

if (empty($start) || empty($end)) {
echo 'unknown';
exit;
}

$start = $start[0];
$end = $end[0];

list ($startOp, $startId) = explode(':', $start);
list ($endOp, $endId) = explode(':', $end);

if ($startId != $endId) {
echo 'unknown';
exit;
}

echo $startId;

2. 怎么样使用 Redis 来存储和查询 ip 数据

最简单粗暴的方法就是把ip_startip和ip_endip都转化为Sorted Sets里的Score，然后把ip_id定义为Member。
这样我们的查询就很简单了，只需要用ZRANGESCORE查询出离ip最近SCORE对应的两个ip_id即可。
然后再分析，如果这两个ip_id是相同的，那么说明这个ip在这个地址段，如果不同的话证明这个ip地址没有被任何地址段所定义，是一个未知的ip！

3. redis 怎么存数组和获取数组

有两种方法：

1.把要存的数组序列化或者 json_encode后变成字符串再存。取的时候反序列号或者json_decode处理成数组。

2.可以使用hash结构,以key作为1维,以hash中的field作为第二维。

4. Redis数据库适合使用于哪些应用场景

redis开创了一种新的数据存储思路，使用redis，我们不用在面对功能单调的数据库时，而是利用redis灵活多变的数据结构和数据操作。

5. Redis 都有哪些应用场景

缓存：这应该是 Redis 最主要的功能了，也是大型网站必备机制，合理地使用缓存不仅可以加快数据的访问速度，而且能够有效地降低后端数据源的压力。
共享Session：对于一些依赖 session 功能的服务来说，如果需要从单机变成集群的话，可以选择 redis 来统一管理 session。
消息队列系统：消息队列系统可以说是一个大型网站的必备基础组件，因为其具有业务解耦、非实时业务削峰等特性。Redis提供了发布订阅功能和阻塞队列的功能，虽然和专业的消息队列比还不够足够强大，但是对于一般的消息队列功能基本可以满足。比如在分布式爬虫系统中，使用 redis 来统一管理 url队列。
分布式锁：在分布式服务中。可以利用Redis的setnx功能来编写分布式的锁，虽然这个可能不是太常用。当然还有诸如排行榜、点赞功能都可以使用 Redis 来实现，但是 Redis 也不是什么都可以做，比如数据量特别大时，不适合 Redis，我们知道 Redis 是基于内存的，虽然内存很便宜，但是如果你每天的数据量特别大，比如几亿条的用户行为日志数据，用 Redis 来存储的话，成本相当的高。

6. 如何使用redis存储海量小数据

redis自带的 redis-cli 的 --pipe 参数可以实现快速加载数据，但是需要我们把数据转成redis协议。 --pipe-timeout 参数设置为0，防止redis响应太晚redis-cli过早退出。
但是pl的性能稍弱，还没到redis的吞吐量瓶颈，自己CPU先100%了，为此，使用20个进程，每个进程500万数据，这样redis的CPU使用率到了100%，数据加载可以在5分钟内完成

7. redis适合什么场景

1、缓存。缓存现在几乎是所有中大型网站都在用的必杀技，合理的利用缓存不仅能够提升网站访问速度，还能大大降低数据库的压力。Redis提供了键过期功能，也提供了灵活的键淘汰策略，所以，现在Redis用在缓存的场合非常多。（推荐：《 Redis视频教程》）
2、排行榜。很多网站都有排行榜应用的，如京东的月度销量榜单、商品按时间的上新排行榜等。Redis提供的有序集合数据类构能实现各种复杂的排行榜应用。
3、计数器。什么是计数器，如电商网站商品的浏览量、视频网站视频的播放数等。为了保证数据实时效，每次浏览都得给+1，并发量高时如果每次都请求数据库操作无疑是种挑战和压力。Redis提供的incr命令来实现计数器功能，内存操作，性能非常好，非常适用于这些计数场景。
4、分布式会话。集群模式下，在应用不多的情况下一般使用容器自带的session复制功能就能满足，当应用增多相对复杂的系统中，一般都会搭建以Redis等内存数据库为中心的session服务，session不再由容器管理，而是由session服务及内存数据库管理。
5、分布式锁。在很多互联网公司中都使用了分布式技术，分布式技术带来的技术挑战是对同一个资源的并发访问，如全局ID、减库存、秒杀等场景，并发量不大的场景可以使用数据库的悲观锁、乐观锁来实现，但在并发量高的场合中，利用数据库锁来控制资源的并发访问是不太理想的，大大影响了数据库的性能。可以利用Redis的setnx功能来编写分布式的锁，如果设置返回1说明获取锁成功，否则获取锁失败，实际应用中要考虑的细节要更多。

8. Redis是什么，用来做什么

Redis是一个nosql数据库，可以存储key-value值。因为其底层实现中，数据读写是基于内存，速度非常快，所以常用于缓存；进而因其为独立部署的中间件，常用于分布式缓存的实现方案。

常用场景有：缓存、秒杀控制、分布式锁。

虽然其是基于内存读写，但底层也有持久化机制；同时具备集群模式；不用担心其可用性。

关于Redis的使用，可以参考《Redis的使用方法、常见应用场景》

9. Redis存储格式

redis目前提供四种数据类型：string,list,set及zset(sorted set)。
redis使用了两种文件格式：全量数据和增量请求。全量数据格式是把内存中的数据写入磁盘，便于下次读取文件进行加载；增量请求文件则是把内存中的数据序列化为操作请求，用于读取文件进行replay得到数据，序列化的操作包括SET、RPUSH、SADD、ZADD。redis的存储分为内存存储、磁盘存储和log文件三部分，配置文件中有三个参数对其进行配置。save seconds updates，save配置，指出在多长时间内，有多少次更新操作，就将数据同步到数据文件。这个可以多个条件配合，比如默认配置文件中的设置，就设置了三个条件。appendonly yes/no ，appendonly配置，指出是否在每次更新操作后进行日志记录，如果不开启，可能会在断电时导致一段时间内的数据丢失。因为redis本身同步数据文件是按上面的save条件来同步的，所以有的数据会在一段时间内只存在于内存中。appendfsync no/always/everysec ，appendfsync配置，no表示等操作系统进行数据缓存同步到磁盘，always表示每次更新操作后手动调用fsync()将数据写到磁盘，everysec表示每秒同步一次。

10. redis怎么存储list对象

方案一：直接使用List结构，List里面存储二进制的任务Bean信息，这样做查询全部任务很方便，查询单条任务速度较慢，并且删除和修改状态很麻烦；方案二：直接使用Hash结构，Hash的key存储任务ID，value存储二进制的Bean信息，这样做查询所有任务、查询单条任务以及删除任务都很快，但是修改状态也必须先取出数据再修改再插入！

redis存储使用方法

与redis存储使用方法相关的内容