数据库和数据仓库的区别是什么?

数据库和数据仓库的区别是什么?

它们不是相同的东西,或者至少写在相同的东西(例如 Oracle RDBMS)中吗?

203957 次浏览

查看 这个了解更多信息。

来自以前的链接:

数据库

  1. 用于联机事务处理(OLTP) ,但也可用于其他目的,如数据仓库。这将记录来自用户的数据作为历史记录。
  2. 表和联接是复杂的,因为它们是规范化的(对于 RDMS)。这样做是为了减少冗余数据和节省存储空间。
  3. 实体关系建模技术用于 RDMS 数据库设计。
  4. 优化了写操作。
  5. 分析查询的性能较低。

数据仓库

  1. 用于在线分析处理(OLAP)。它为业务决策用户读取历史数据。
  2. 表和联接很简单,因为它们是反规范化的。这样做是为了减少分析查询的响应时间。
  3. 数据建模技术用于数据仓库的设计。
  4. 为读操作进行了优化。
  5. 高性能的分析查询。
  6. 通常是一个数据库吗。

同样需要注意的是,数据仓库可以从零到多个数据库来源。

解释它的最简单方法是说明数据仓库不仅仅由数据库组成。数据库是以某种方式组织起来的数据集合,但数据仓库的组织是为了“方便报告和分析”。然而,这并不是故事的全部,因为数据仓库还包含“检索和分析数据、提取、转换和加载数据以及管理数据字典的手段也被认为是数据仓库系统的重要组成部分”。

数据仓库

数据仓库是数据库的 TYPE。

除了人们已经说过的,数据仓库倾向于 OLAP,索引等等是为了读而不是写而调整的,数据被反规范化/转换成更容易读和分析的表单。

有些人说“数据库”和 OLTP 是一样的——这是不正确的。OLTP 也是一种数据库类型。

其他类型的“数据库”: 文本文件、 XML、 Excel、 CSV... 、平面文件: -)

从非技术角度看: 数据库受限于特定的应用程序或一组应用程序。

数据仓库是企业级的数据存储库。它将包含来自业务的所有/多个部分的数据。它将共享这些信息,以提供业务的全球情况。它对于业务的不同部分之间的集成也是至关重要的。

从技术角度来看: “数据仓库”这个词没有得到公认的定义。就个人而言,我将数据仓库定义为数据集市的集合。每个数据集市由一个或多个数据库组成,其中的数据库特定于特定的问题集(应用程序、数据集或进程)。

简单地说,数据库是数据仓库的一个组件。有很多地方可以探索这个概念,但是因为没有“定义”,你给出的任何答案都会给你带来挑战。

用简单的话说: 用于分析/存储/复制和分析的大量数据。 数据库—— > 使用常用数据的 CRUD 操作。

数据仓库是一种你不经常使用的仓库,数据库是你经常处理的东西。

艾格。如果我们要求的银行对帐单,那么它给我们最后3/4/6/多个月 bbecause 它是在数据库中。如果你想要更多,它存储在数据仓库。

数据库 :- 联机事务处理过程

  • 它是当前数据,最新的详细数据,平面关系 独立数据。
  • 采用实体关系设计数据库
  • DB 大小为100MB-GB 的简单事务或查询

数据仓库

  • 在线分析过程
  • 它是关于历史数据星模式,雪弯曲模式和星系
  • 架构用于设计 数据仓库
  • DB size 100GB-TB 改进的查询性能基础 数据挖掘数据可视化
  • 使用户能够更深入地理解和了解各种 通过快速、一致、交互式的访问,他们公司数据的各个方面 各种可能的数据视图

例句: 一所房子值 $100,000,它每年增值 $1000

为了跟踪当前的房屋价值,您可以使用一个数据库,因为价值每年都在变化。

三年后,你可以看到房子的价值是 $103,000.

为了跟踪房子的历史价值,您可以使用数据仓库作为房子的价值

$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.

应用程序的任何数据存储通常都使用数据库。当前的趋势可能是没有 sql 数据库,也可能是关系数据库数据库。

数据仓库也是数据库。我们可以将数据仓库数据库称为专门的数据存储,用于公司的分析报告目的。 此数据用于关键业务决策。

有组织的数据有助于有效地报告和做出业务决策。

Data Warehouse vs Database: 数据仓库是专门为数据分析而设计的,它需要读取大量数据,以了解数据之间的关系和趋势。数据库用于捕获和存储数据,例如记录事务的详细信息。

数据仓库: 适当的工作负载 -分析、报告、大数据。 数据源 -从多个数据源收集和规范化的数据。 数据捕获 -通常在预先确定的批处理计划上执行批量写操作。 数据规范化 -非规范化模式,例如 Star 模式或 Snowflake 模式。 数据存储 -优化了访问的简单性和高速查询。使用柱状存储的性能。 数据访问 -优化到最小化 I/O 和最大化数据吞吐量。

事务性数据库: 适当的工作负载 -事务处理。 数据源 -从单个源(例如事务系统)捕获的数据。 数据捕获 -优化连续写操作,因为新数据可用,以最大限度地提高事务吞吐量。 数据规范化 -高度规范化的静态模式。 数据存储 -优化了对单个面向行的物理块的高整体写操作。 数据访问 -大量的小型读操作。

数据库:

用于联机事务处理(OLTP)。

  • 以事务为导向。
  • 面向应用。
  • 最新数据。
  • 详细数据。
  • 可伸缩数据。
  • 许多用户、管理员/操作人员。
  • 执行时间: 短。

数据仓库:

用于联机分析处理(OLAP)。

  • 定向分析。
  • 以主题为导向。
  • 历史数据。
  • 聚合数据。
  • 静态数据。
  • 用户不多,经理。
  • 处决时间: 很长。

数据仓库的源可以是数据库集群,因为数据库用于联机事务处理,如保存当前记录。.而在数据仓库中存储历史数据,用于在线分析处理。

数据仓库是一种通常位于数据库上的数据结构类型。Data Warehouse 指的是数据模型以及存储在其中的数据类型——为服务器建模(数据模型)以实现分析目的。

数据库可以分类为包含数据的任何结构。传统上,应该是像 Oracle、 SQLServer 或 MySQL 这样的 RDBMS。然而,数据库也可以是像 Cassandra 一样的 NoSQL 数据库,或者像 AWS RedShift 一样的柱状 MPP。

您可以看到,数据库仅仅是存储数据的地方; 数据仓库是存储数据的特定方式,并且服务于特定用途,即服务于分析查询。

OLTP 和 OLAP 并不能告诉您 DW 和数据库之间的区别,OLTP 和 OLAP 都位于数据库中。它们只是以不同的方式存储数据(不同的数据模型方法) ,并服务于不同的目的(OLTP 记录事务,针对更新进行了优化; OLAP 分析信息,针对读取进行了优化)。

数据仓库(DW)是从不同来源收集和管理数据以提供有意义的业务见解的过程。数据仓库通常用于连接和分析来自异构源的业务数据。数据仓库是为数据分析和报表而构建的 BI 系统的核心。