搜索
首页数据库SQL为什么代码规范要求SQL语句不要过多的join?

送分题

面试官:有操作过Linux吗?

我:有的呀

面试官:我想查看内存的使用情况该用什么命令

我:free 或者 top

面试官:那你说一下用free命令都可以看到啥信息

我:那,如下图所示 可以看到内存以及缓存的使用情况

  • total 总内存

  • used 已用内存

  • free 空闲内存

  • buff/cache 已使用的缓存

  • avaiable 可用内存

为什么代码规范要求SQL语句不要过多的join?

面试官:那你知道怎么清理已使用的缓存吗(buff/cache)

我:em… 不知道

面试官:sync; echo 3 > /proc/sys/vm/drop_caches就可以清理buff/cache了,你说说我在线上执行这条命令做好不好?

为什么代码规范要求SQL语句不要过多的join?

我:(送分题,内心大喜)好处大大的有,清理出缓存我们就有更多可用的内存空间, 就跟pc上面xx卫士的小火箭一样,点一下,就释放出好多的内存

面试官:em…., 回去等通知吧

再谈SQL Join

面试官:换个话题,谈谈你对join的理解

我:好的(再答错就彻底完了,把握住机会)

回顾

SQL中的join可以根据某些条件把指定的表给结合起来并将数据返回给客户端

join的方式有

inner join 内连接

为什么代码规范要求SQL语句不要过多的join?

left join 左连接

为什么代码规范要求SQL语句不要过多的join?

right join 右连接

为什么代码规范要求SQL语句不要过多的join?

full join 全连接

为什么代码规范要求SQL语句不要过多的join?


图片来源:https://www.cnblogs.com/reaptomorrow-flydream/p/8145610.html

面试官:在项目开发中如果需要使用join语句,如何优化提升性能?

我:分为两种情况,数据规模小的,数据规模大的。

面试官: 然后?

我:对于

1.数据规模较小 全部干进内存就完事了嗷

2.数据规模较大

  • 可以通过增加索引来优化join语句的执行速度

  • 可以通过冗余信息来减少join的次数

  • 尽量减少表连接的次数,一个SQL语句表连接的次数不要超过5次

面试官:可以总结为join语句是相对比较耗费性能,对吗?

我:是的

面试官: 为什么?

缓冲区

我: 在执行join语句的时候必然要有一个比较的过程

面试官: 是的

我:逐条比较两个表的语句是比较慢的,因此我们可以把两个表中数据依次读进一个内存块中, 以MySQL的InnoDB引擎为例,使用以下语句我们必然可以查到相关的内存区域show variables like '%buffer%'

为什么代码规范要求SQL语句不要过多的join?

如图所示join_buffer_size的大小将会影响我们join语句的执行性能

面试官: 除此之外呢?

一个大前提

我:任何项目终究要上线,不可避免的要产生数据,数据的规模又不可能太小

面试官: 是这样的

我:大部分数据库中的数据最终要保存到硬盘上,并且以文件的形式进行存储。

以MySQL的InnoDB引擎为例

  • InnoDB以页(page)为基本的IO单位,每个页的大小为16KB

  • InnoDB会为每个表创建用于存储数据的.ibd文件

为什么代码规范要求SQL语句不要过多的join?

验证

为什么代码规范要求SQL语句不要过多的join?

我:这意味着我们有多少表要连接就需要读多少个文件,虽然可以利用索引,但还是免不了频繁的移动硬盘的磁头

面试官:也就是说频繁的移动磁头会影响性能对吧

我:是的,现在的开源框架不都喜欢说自己通过顺序读写大大的提升了性能吗,比如hbase、kafka

面试官:说的没错,那你认为Linux有对此做出优化吗?提示,你可以再执行一次free命令看一下

我:奇怪缓存怎么占用了1.2G多

为什么代码规范要求SQL语句不要过多的join?

为什么代码规范要求SQL语句不要过多的join?

图片来源:https://www.linuxatemyram.com/

面试官:你有没有想过

  • buff/cache 里面存的是什么?

  • 为什么buff/cache 占了那么多内存,可用内存即availlable还有1.1G?

  • 为什么你可以通过两条命令来清理buff/cache占用的内存,而想要释放used只能通过结束进程来实现?

品,你细品

思考了几分钟后

为什么代码规范要求SQL语句不要过多的join?

我:这么随便就释放了buff/cache所占用的内存,说明它就不重要, 清除它不会对系统的运行造成影响

面试官: 不完全对

我:难道是?想起来《CSAPP》(深入理解计算机系统)里面说过一句话

存储器层次结构的本质是,每一层存储设备都是较低一层设备的缓存

为什么代码规范要求SQL语句不要过多的join?

通俗来说,就是说Linux会把内存当作是硬盘的高速缓存

相关资料:http://tldp.org/LDP/sag/html/buffer-cache.html

面试官:现在知道那道送分题应该怎么回答了吧

我:我….

为什么代码规范要求SQL语句不要过多的join?

Join算法

面试官:再给你个机会,如果让你来实现Join算法你会怎么做?

我:无索引的话,嵌套循环就完事了嗷。有索引的话,则可以利用索引来提升性能.

面试官:说回join_buffer 你认为join_buffer里面存储的是什么?

我:在扫描过程中,数据库会选择一个表把他要返回以及需要进行和其他表进行比较的数据放进join_buffer

面试官:有索引的情况下是怎么处理的?

我:这个就比较简单了,直接读取两个表的索引树进行比较就完事了嗷,我这边介绍一下无索引的处理方式

Nested Loop Join

为什么代码规范要求SQL语句不要过多的join?

嵌套循环,每次只读取表中的一行数据,也就是说如果outerTable有10万行数据, innerTable有100行数据,需要读取10000000次(假设这两个表的文件没有被操作系统给缓存到内存, 我们称之为冷数据表)

当然现在没啥数据库引擎使用这种算法(太慢了)

Block nested loop

为什么代码规范要求SQL语句不要过多的join?

Block 块,也就是说每次都会取一块数据到内存以减少I/O的开销

当没有索引可以使用的时候,MySQL InnoDB 就会使用这种算法

考虑以下两个表 t_a 和t_b

为什么代码规范要求SQL语句不要过多的join?

当无法使用索引执行join操作的时候,InnoDB会自动使用Block nested loop 算法

为什么代码规范要求SQL语句不要过多的join?

总结

上学时,数据库老师最喜欢考数据库范式,直到上班才学会一切以性能为准,能冗余就冗余,实在冗余不了的就join如果join真的影响到性能。试着调大你的join_buffer_size, 或者换固态硬盘。

参考资料

《深入理解计算机系统》- 第6章 存储器层次结构
《Experiments and fun with the Linux disk cache》作者通过几个例子来说明硬盘缓存对程序执行性能的影响
《Linux ate my ram》 Free参数的解释
How to clear the buffer/pagecache (disk cache) under Linux 文章开头送分题命令的解释
MySQL 是怎样运行的:从根儿上理解 MySQL
Block bested loop 来自MariaDB官方文档解释了Block-Nested-Loop算法的实现

以上是为什么代码规范要求SQL语句不要过多的join?的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:Java学习指南。如有侵权,请联系admin@php.cn删除
sql怎么删除约束sql怎么删除约束Apr 10, 2025 pm 12:21 PM

在 SQL 中删除约束,请执行以下步骤:识别要删除的约束名称;使用 ALTER TABLE 语句:ALTER TABLE 表名 DROP CONSTRAINT 约束名;确认删除。

sql触发器怎么设置sql触发器怎么设置Apr 10, 2025 pm 12:18 PM

SQL 触发器是一种在指定表上执行特定事件时自动执行特定操作的数据库对象。要设置 SQL 触发器,可以使用 CREATE TRIGGER 语句,其中包括触发器名称、表名称、事件类型和触发器代码。触发器代码使用 AS 关键字进行定义,并包含 SQL 或 PL/SQL 语句或块。通过指定触发器条件,可以使用 WHERE 子句限制触发器的执行范围。可以使用 INSERT INTO、UPDATE 或 DELETE 语句在触发器代码中执行触发器操作。NEW 和 OLD 关键字可以在触发器代码中用来引用受影

sql查询怎么加索引sql查询怎么加索引Apr 10, 2025 pm 12:15 PM

索引是一种通过排序数据列来加速数据查找的数据结构。为 SQL 查询添加索引的步骤如下:确定需要索引的列。选择合适的索引类型(B 树、哈希或位图)。使用 CREATE INDEX 命令创建索引。定期重建或重新组织索引以维护其效率。添加索引的好处包括提高查询性能、减少 I/O 操作、优化排序和筛选以及提高并发性。当查询经常使用特定列、返回大量数据需要排序或分组、涉及多个表或数据库表较大时,应该考虑添加索引。

sql语句ifelse怎么用sql语句ifelse怎么用Apr 10, 2025 pm 12:12 PM

IFELSE 语句是一种条件语句,用于根据条件评估结果返回不同值。其语法结构为:IF (condition) THEN return_value_if_condition_is_true ELSE return_value_if_condition_is_false END IF;。

sql数据库错误怎么查看sql数据库错误怎么查看Apr 10, 2025 pm 12:09 PM

SQL数据库错误查看方法有:1. 直接查看错误消息;2. 使用SHOW ERRORS和SHOW WARNINGS命令;3. 访问错误日志;4. 使用错误代码查找错误原因;5. 检查数据库连接和查询语法;6. 使用调试工具。

sql distinct怎么用sql distinct怎么用Apr 10, 2025 pm 12:06 PM

DISTINCT 操作符用于 SQL 查询中排除重复行,仅返回唯一值,适用于获取唯一值列表、统计唯一值数量和结合 GROUP BY 使用等场景。

sql候选键怎么设置sql候选键怎么设置Apr 10, 2025 pm 12:03 PM

SQL 中设置候选键的方法:确定唯一标识列;使用 PRIMARY KEY 约束创建主键;使用 UNIQUE 约束添加唯一约束;创建唯一索引。设置候选键可以确保数据完整性、提高查询性能和防止数据重复。

sql怎么写更新语句sql怎么写更新语句Apr 10, 2025 pm 12:00 PM

SQL 中的 UPDATE 语句用于修改现有记录:语法: UPDATE table_name SET column1 = new_value1, column2 = new_value2, ... WHERE condition用法:指定表名在 SET 子句中列出要更新的列及新值使用 WHERE 子句指定更新条件(可选)

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

SecLists

SecLists

SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用