search
HomeDatabaseMysql Tutorial为什么要从关系型数据库转向NoSQL

NoSQL系统一般都会宣传一个特性,那就是性能好。为什么呢?关系型数据库发展了这么多年,各种优化工作已经做得很深了,NoSQL系统一般都是吸收关系型数据库的技术,然后,到底是什么因素束缚了关系型数据库的性能呢?我们从系统设计的角度看这个问题。 1. ?索

NoSQL系统一般都会宣传一个特性,那就是性能好。为什么呢?关系型数据库发展了这么多年,各种优化工作已经做得很深了,NoSQL系统一般都是吸收关系型数据库的技术,然后,到底是什么因素束缚了关系型数据库的性能呢?我们从系统设计的角度看这个问题。

1. ?索引支持。

关系型数据库创立之初没有想到今天的互联网应用对可扩展性提出如此高的要求。因此,设计时主要考虑的是简化用户的工作,SQL语言的产生促成数据库接口的标准化,从而形成了Oracle这样的数据库公司并带动了上下游产业链的发展。关系型数据库在单机存储引擎支持索引,比如MySQL的InnoDB存储引擎需要支持索引,而NoSQL系统的单机存储引擎是纯粹的,只需要支持基于主键的随机读取和范围查询。NoSQL系统在系统层面提供对索引的支持,比如有一个用户表,主键为user_id,每个用户有很多属性,包括用户名,照片ID(photo_id),照片URL,在NoSQL系统中如果需要对photo_id建立索引,可以维护一张分布式表,表的主键为形成的二元组。关系型数据库由于需要在单机存储引擎层面支持索引,大大降低了系统的可扩展性,使得单机存储引擎的设计变得很复杂。

2. 事务并发处理。

关系型数据库有一整套的关于事务并发处理的理论,比如锁的粒度是表级,页级还是行级,多版本并发控制机制MVCC,事务的隔离级别,死锁检测,回滚,等等。然而,互联网应用大多数的特点都是多读少写,比如读和写的比例是10 : 1,并且很少有复杂事务需求,因此,一般可以采用更为简单的copy-on-write技术:单线程写,多线程读,写的时候执行copy-on-write,写不影响读服务。NoSQL系统这样的假设简化了系统的设计,减少了很多操作的overhead,提高了性能。

3. 动态还是静态的数据结构。

关系型数据库的存储引擎总是一颗磁盘B+树,为了提高性能,可能需要有insert buffer聚合写,query cache缓存读,经常需要实现类似Linux page cache的缓存管理机制。数据库中的读和写是互相影响的,写操作也因为时不时需要将数据flush到磁盘而性能不高。简而言之,关系型数据库存储引擎的数据结构是通用的动态更新的B+树,然而,在NOSQL系统中,比如Bigtable中采用SSTable + MemTable的数据结构,数据先写入到内存的MemTable,达到一定大小或者超过一定时间才会dump到磁盘生成SSTable文件,SSTable是只读的。如果说关系型数据库存储引擎的数据结构是一颗动态的B+树,那么SSTable就是一个排好序的有序数组。很明显,实现一个有序数据比实现一个动态B+树且包含复杂的并发控制机制要简单高效地多。

4 . Join操作。

关系型数据库需要在存储引擎层面支持Join,而NoSQL系统一般根据应用来决定Join实现的方式。举个例子,有两张表:用户表和商品表,每个用户下可能有若干个商品,用户表的主键为,用户和商品的关联属性存放在用户表中,商品表的主键为item_id,商品属性包括商品名,商品URL,等等。假设应用需要查询一个用户的所有商品并显示商品的详细信息,普通的做法是先从用户表查找指定用户的所有item_id,然后对每个item_id去商品表查询详细信息,即执行一次数据库Join操作,这必然带来了很多的磁盘随机读,并且由于Join带来的随机读的局部性不好,缓存的效果往往也是有限的。在NoSQL系统中,我们往往可以将用户表和商品表集成到一张宽表中,这样虽然冗余存储了商品的详细信息,却换来了查询的高效。

关系型数据库的性能瓶颈往往不在SQL语句解析上,而是在于需要支持完备的SQL特性。互联网公司面临的问题是应用对性能和可扩展性要求很高,并且DBA和开发工程师水平比较高,可以通过牺牲一些接口友好性来换取更好的性能。NoSQL系统的一些设计,比如通过宽表实现Join操作,互联网公司的DBA和开发工程师也做过,NOSQL系统只是加强了这种约束。从长远来看,可以总结一套约束集合,并且定义一个SQL子集,只需要支持这个SQL子集就可以在不牺牲可扩展性的前提下支持比如90%以上的互联网应用。我想,NoSQL技术发展到这一步的时候就算是比较成熟了,这也是我们最终想做的事情。我们在设计和使用NoSQL系统的时候也可以适当转化一下思维,如下:

1. 更大的数据量。很多人在使用MySQL的过程遇到记录条数超过一定值,比如2000W的时候,数据库性能开始下降,这个值的得出往往需要经过大量的测试。然而,大多数的NoSQL系统可扩展性都比较好,能够支持更大的数据量,因此也可以采用一些空间换时间的做法,比如通过宽表的方式实现Join。

2. 性能预估更加容易。关系型数据库由于复杂的并发控制,insert buffer及类似page cache的读写优化机制,性能估算相对较难,很多时候需要凭借经验或者经过测试才能得出系统的性能。然后,NOSQL系统由于存储引擎实现,并发控制机制等相对简单,可以通过硬件的性能指标在系统设计之处大致预估系统的性能,性能预估可操作性相对更强。

Statement
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
为什么wallpaper engine一直在更新为什么wallpaper engine一直在更新Mar 15, 2024 pm 07:10 PM

用户在使用wallpaperengine时可以下载各种不同类型的壁纸,有很多用户不知道为什么wallpaperengine一直在更新,它是一款创意制作软件,软件中需要时刻更新最新的工具以及素材。为什么wallpaperengine一直在更新1、WallpaperEngine每次使用时都要进行更新,这是正常现象。2、WallpaperEngine是一款创意制作软件,软件中需要时刻更新最新的工具以及素材。3、每次使用都要更新,但更新文件包并不大,更新速度很快。4、订阅的壁纸只要有一个有更新他就跟着更

SUPRA币2025年会暴涨吗SUPRA币2025年会暴涨吗Dec 09, 2024 pm 12:14 PM

这篇分析报告探讨了 SUPRA 币在 2025 年的潜在增长潜力,识别了影响其价值的潜在市场因素、技术发展和监管变化。该报告评估了 OKX 生态系统的扩展、DeFi 行业的增长、机构投资、技术创新和监管环境改善等因素,这些因素可能会在未来几年推动 SUPRA 币的上涨。报告还考虑了潜在的下跌因素,包括市场竞争、监管风险、技术问题、市场情绪和经济衰退。

币圈跨链桥重要么 简单通俗解释什么是跨连桥币圈跨链桥重要么 简单通俗解释什么是跨连桥Dec 19, 2024 pm 02:45 PM

币圈犹如独立岛屿组成的世界,每个区块链(岛屿)拥有独特货币和规则。跨链桥就像一座连接岛屿的桥梁,让用户可以安全地跨链转移代币。它提升了互操作性,促进了价值流动,拓展了应用场景,甚至可以提升效率。不过,跨链桥也存在安全、中心化和技术复杂性等风险,选择信誉良好的跨链桥至关重要。通过跨链桥,币圈得以构建一个更加互联互通的区块链新世界。

为什么笔记本电脑能够使用充电宝作为电源?为什么笔记本电脑能够使用充电宝作为电源?Jan 15, 2024 pm 06:54 PM

笔记本可以用充电宝供电吗由于笔记本电脑的电池电压、充电电流以及充电接口与充电宝不一致,因此无法使用充电宝给笔记本电脑充电。这是由于技术规格的差异导致的。充电宝通常的输出电压是5V或者5.2V。而笔记本电脑的充电电压要求至少为13.5V,有些甚至需要更高的电压,如19.5V或者20V,才能正常充电。所以,如果想要用充电宝给笔记本电脑充电,需要确保充电宝能够提供足够的电压。当笔记本电脑充电时,通常需要3A以上的电流。然而,充电宝的标称电流只有2.1A。现在市面上的笔记本电脑都使用圆型接口,不同厂家的

比特币发行至今价格一览 历年最高和最低价分别是多少比特币发行至今价格一览 历年最高和最低价分别是多少Dec 14, 2024 am 06:17 AM

比特币自 2009 年发行以来经历了剧烈的价格波动,从 2011 年的 2.01 美元低点飙升至 2021 年的 68,000 美元高点。价格波动受供需关系、监管政策、经济状况和技术创新等因素影响。例如,2017 年,由于需求激增,比特币价格飙升至近 20,000 美元,而 2022 年,美联储收紧货币政策导致价格大幅下跌。

私募币都要锁仓吗?为什么?私募币都要锁仓吗?为什么?Jun 25, 2024 pm 07:57 PM

锁仓是一种常见的机制,私募币锁仓也是市场上常见的一个策略,指将一定数量的代币锁定在特定的钱包地址或智能合约中,使其在一段时间内无法自由交易或转移。作为投资者可能会好奇是不是市场上的私募币都要锁仓吗?通常来说是要锁仓的,有的投资者就会疑惑为什么私募币都要锁仓?就资料分析来看,锁仓的目的通常是为了促进项目的长期发展,增加代币的价值,同时显示项目方的承诺和信心。接下来小编为大家详细说说这个问题。私募币都要锁仓吗?私募币都要锁仓,私募币锁仓就是投资者在购买私募代币后,需要在一定时期内不得出售或转移这些代

ai用混合工具有锯齿ai用混合工具有锯齿Nov 28, 2024 pm 08:24 PM

AI混合工具边缘锯齿的原因包括:低图像分辨率、小羽化半径、锋利边缘、算法限制、抗锯齿设置、混合模式和图像噪点。

BTC币上线了哪些交易所_BTC币在哪些交易所上架了BTC币上线了哪些交易所_BTC币在哪些交易所上架了Jan 10, 2025 pm 12:41 PM

本文介绍了 BTC 币上线的知名交易所,并提供了详细的分步指南,指导读者如何购买和交易 BTC 币。列出的交易所包括 OKX、币安、火币、Coinbase 和 Kraken,每家交易所都提供了独特的平台功能。指南涵盖账户创建、入金、购买 BTC 币和安全存储等关键步骤。本文还讨论了选择交易所的因素,以及确保 BTC 币安全性的最佳实践。通过遵循本文中的说明,读者可以轻松开始使用 BTC 币的交易和投资。

See all articles

Hot AI Tools

Undresser.AI Undress

Undresser.AI Undress

AI-powered app for creating realistic nude photos

AI Clothes Remover

AI Clothes Remover

Online AI tool for removing clothes from photos.

Undress AI Tool

Undress AI Tool

Undress images for free

Clothoff.io

Clothoff.io

AI clothes remover

AI Hentai Generator

AI Hentai Generator

Generate AI Hentai for free.

Hot Article

R.E.P.O. Energy Crystals Explained and What They Do (Yellow Crystal)
2 weeks agoBy尊渡假赌尊渡假赌尊渡假赌
Repo: How To Revive Teammates
1 months agoBy尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: How To Get Giant Seeds
1 months agoBy尊渡假赌尊渡假赌尊渡假赌

Hot Tools

Atom editor mac version download

Atom editor mac version download

The most popular open source editor

Dreamweaver CS6

Dreamweaver CS6

Visual web development tools

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser is a secure browser environment for taking online exams securely. This software turns any computer into a secure workstation. It controls access to any utility and prevents students from using unauthorized resources.

MantisBT

MantisBT

Mantis is an easy-to-deploy web-based defect tracking tool designed to aid in product defect tracking. It requires PHP, MySQL and a web server. Check out our demo and hosting services.

Zend Studio 13.0.1

Zend Studio 13.0.1

Powerful PHP integrated development environment