脚本之家 服务器常用软件
微信 投稿 交流社区 在线工具

mysql建立高效的索引实例分析

 更新时间:2019年07月11日 11:53:14   作者:webbc   我要评论

这篇文章主要介绍了mysql建立高效的索引,结合实例形式分析了mysql建立高效索引的相关实现技巧与相关操作注意事项,需要的朋友可以参考下

本文实例讲述了mysql建立高效的索引。分享给大家供大家参考,具体如下:

如何建立理想的索引?

  • 查询频繁度
  • 区分度
  • 索引长度
  • 覆盖字段

区分度

假设100万用户,性别基本上男/女各为50W, 区分度就低。

长度小

索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多).

区分度高,长度小

问题:如果让区分度高,而长度小?

答:可以针对列中的值,从左往右截取部分,来建索引

(1)截的越短, 重复度越高,区分度越小, 索引效果越不好
(2)截的越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大–增删改变慢,并间影响查询速度.

所以, 我们要在 区分度 + 长度 两者上,取得一个平衡。惯用手法:截取不同长度,并测试其区分度。

假设我们有一张表:英语4级的单词表,里面有13324条记录,我们怎么给name字段加索引呢?

这里写图片描述

如果计算区分度?

截取单词第1位的不重复数:

select count(distinct left(name,1)) from dict

总的数量:

select count(*) from dict

区分度:不重复数/总的数量,sql语句如下:

select (select count(distinct left(name,1)) from dict) / (select count(*) from dict) as rate;

然后按照这样的步骤把其他长度所对应的区分度给找出来,看一个这个图表,可以知道当长度为11的时候重复度仅仅为1%,我们可以考虑建立11位长的索引

这里写图片描述

alter table dict add index name name(11);

左前缀不好区分的情况

对于左前缀不易区分的列 ,建立索引的技巧

如url列

http://www.baidu.com
http://www.web-bc.cn

列的前11个字符都是一样的,不易区分, 可以用如下2个办法来解决

(1)把列内容倒过来存储,并建立索引

moc.udiab.www//:ptth
nc.cb-bew.www//://ptth

这样左前缀区分度大

(2)伪hash索引效果

同时存url和url_hash列

#建表
create table t10 (
id int primary key,
url char(60) not null default ''
);
#插入数据
insert into t10 values
(1,'http://www.baidu.com'),
(2,'http://www.sina.com'),
(3,'http://www.sohu.com.cn'),
(4,'http://www.onlinedown.net'),
(5,'http://www.gov.cn');
#修改表结构,添加urlcrc列
alter table t10 add urlcrc int unsigned not null;

在存储的时候,将url对应的crc32码一同插入到数据库中,然后按照urlcrc字段建立索引,然后查找的时候,我们在业务层中将对应的url转换为crc32进行查找,就可以利用上索引了。

因为crc的结果是32位int无符号数,因此当数据超过40亿,也会有重复,但这是值得的.(索引长度为int4个字节)

多列索引

多列索引的考虑因素—列的查询频率 , 列的区分度, 注意一定要结合实际业务场景

以ecshop商城为例, goods表中的cat_id,brand_id,做多列索引,从区分度看,brand_id区分度更高, 但从 商城的实际业务业务看, 顾客一般先选大分类->小分类->品牌,最终选择建立2个索引:

(1)index(cat_id,brand_id)
(2)index(cat_id,shop_price)

甚至可以再加 (3)index(cat_id,brand_id,shop_price),3个冗余索引

但(3)中的前2列和(1)中的前2列一样,所以可以再去掉(1),建立2个索引

index(cat_id,price)index(cat_id,brand_id,shop_price);

更多关于MySQL相关内容感兴趣的读者可查看本站专题:《MySQL索引操作技巧汇总》、《MySQL常用函数大汇总》、《MySQL日志操作技巧大全》、《MySQL事务操作技巧汇总》、《MySQL存储过程技巧大全》及《MySQL数据库锁相关技巧汇总

希望本文所述对大家MySQL数据库计有所帮助。

  • mysql
  • 索引

相关文章

  • MySQL数据库-错误1166 Incorrect column name

    MySQL数据库-错误1166 Incorrect column name

    这篇文章主要介绍了MySQL数据库-错误1166 Incorrect column name,需要的朋友可以参考下
    2016-04-04
  • MySQL存储时间类型选择的问题讲解

    MySQL存储时间类型选择的问题讲解

    今天小编就为大家分享一篇关于MySQL存储时间类型选择的问题讲解,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • MySql查询时间段的方法

    MySql查询时间段的方法

    这篇文章主要介绍了MySql查询时间段的方法,包括了传统的针对时间字段的查询方法与UNIX时间戳的查询技巧,非常具有实用价值,需要的朋友可以参考下
    2014-12-12
  • MySQL的索引详解

    MySQL的索引详解

    这篇文章主要介绍了MySQL的索引的一些资料,对于mysql的优化来说索引是不得不说的,这里就为大家介绍一下,需要的朋友可以参考一下
    2018-01-01
  • MySQL如何查看元数据锁阻塞在哪里

    MySQL如何查看元数据锁阻塞在哪里

    这篇文章主要介绍了MySQL如何查看元数据锁阻塞在什么地方的相关资料,希望通过本文能帮助到大家,让大家实现这样的功能,需要的朋友可以参考下
    2017-10-10
  • MySql判断汉字、日期、数字的具体函数

    MySql判断汉字、日期、数字的具体函数

    这篇文章主要大家详细介绍了MySql判断汉字、日期、数字的具体函数,感兴趣的小伙伴们可以参考一下
    2016-05-05
  • MySQL操作之JSON数据类型操作详解

    MySQL操作之JSON数据类型操作详解

    这篇文章主要介绍了MySQL操作之JSON数据类型操作详解,内容较为详细,具有收藏价值,需要的朋友可以参考。
    2017-10-10
  • MYSQL必知必会读书笔记 第一章(基础)

    MYSQL必知必会读书笔记 第一章(基础)

    数据库(database)是一个以某种有组织的方式存储的数据集合。本文是小编日常收集整理些有关mysql的知识,非常具有参考价值,感兴趣的朋友一起学习吧
    2016-05-05
  • MySQL OOM 系统二 OOM Killer

    MySQL OOM 系统二 OOM Killer

    前面一节重点分享了Linux的内存分配策略,基于上述的分配策略,为了规避超售的风险,Linux采了一种OOM Killer的机制,即系统可用内存(包括Swap)即将使用完之前,选择性的Kill掉一些进程以求释放一些内存
    2016-07-07
  • 具有负载均衡功能的MySQL服务器集群部署及实现

    具有负载均衡功能的MySQL服务器集群部署及实现

    MySQL是一个高速度、高性能、多线程的关系型数据库管理系统,适用平台多,可扩展性强。
    2011-05-05

最新评论