数据库种类 - 关系型、NoSQL、时序数据库

📚 数据库类型详解

📊

关系型数据库（RDBMS）

使用表格（行和列）来存储数据，数据之间通过关系连接。遵循ACID原则，提供强一致性和事务保证。主要用于OLTP（在线事务处理）。

✨ 核心特性

✓ 表结构固定
✓ 支持SQL查询
✓ ACID事务保证
✓ 强一致性
✓ 外键约束
✓ 数据完整性

🎯 应用场景

• 金融系统（银行、支付）
• ERP系统
• 电商平台
• 内容管理系统
• 用户管理系统

📦 代表产品

MySQL PostgreSQL Oracle SQL Server SQLite

📊

列式数据库（Columnar Database / OLAP）

按列存储数据而非按行。特别适合分析查询，压缩率高，查询速度快。专为OLAP（在线分析处理）优化，支持大量数据的聚合查询。

✨ 核心特性

✓ 列式存储
✓ 高压缩比
✓ 快速聚合查询
✓ OLAP分析优化
✓ 列级索引
✓ 并行处理

🎯 应用场景

• 数据仓库和BI
• 实时分析
• 日志分析
• 用户行为分析
• 监控指标分析

📦 代表产品

ClickHouse Apache Druid Vertica Amazon Redshift Snowflake

📄

文档数据库（Document Database）

以JSON或XML等格式存储半结构化文档。文档可以包含任意字段，Schema灵活，适合快速迭代开发。

✨ 核心特性

✓ 灵活的Schema
✓ 嵌套文档支持
✓ JSON/BSON格式
✓ 水平扩展
✓ 嵌入关联数据
✓ 读性能高

🎯 应用场景

• 内容管理系统
• 用户配置文件
• 产品目录
• 日志存储
• IoT传感器数据

📦 代表产品

MongoDB CouchDB RavenDB Amazon DocumentDB

🗝️

键值数据库（Key-Value Store）

简单的键值对存储模型，通过key快速访问value。性能极高，适合缓存、会话存储和配置管理。

✨ 核心特性

✓ 极简数据结构
✓ 极高性能
✓ 低延迟
✓ 水平扩展
✓ 内存存储
✓ 支持TTL过期

🎯 应用场景

• 缓存系统
• 会话存储
• 配置管理
• 计数器
• 排行榜
• 分布式锁

📦 代表产品

Redis Memcached Amazon DynamoDB Riak

📈

宽列存储（Wide Column Store）

也称为列族存储。数据按列族组织，支持动态列。结合了键值存储的简单性和关系数据库的查询能力。适合大规模、稀疏数据集。

✨ 核心特性

✓ 列族存储
✓ 动态列支持
✓ 稀疏数据结构
✓ 水平扩展
✓ 高写入性能
✓ 最终一致性

🎯 应用场景

• 物联网数据收集
• 时间序列数据
• 日志系统
• 用户行为追踪
• 推荐系统

📦 代表产品

Cassandra HBase ScyllaDB Amazon Keyspaces

🕸️

图数据库（Graph Database）

以节点（Node）和边（Edge）的形式存储图数据。擅长处理复杂关系查询，适合社交网络、推荐系统等场景。

✨ 核心特性

✓ 节点-边-属性模型
✓ 快速关系遍历
✓ 复杂查询优化
✓ 路径查询
✓ 社区发现
✓ 推荐算法

🎯 应用场景

• 社交网络分析
• 推荐系统
• 知识图谱
• 欺诈检测
• 访问控制
• 网络拓扑

📦 代表产品

Neo4j ArangoDB Amazon Neptune OrientDB

⏱️

时序数据库（Time Series Database）

专门优化用于存储和查询时间序列数据。提供高效的压缩算法、时间窗口查询和连续查询功能。

✨ 核心特性

✓ 时间戳索引优化
✓ 高压缩比
✓ 聚合函数丰富
✓ 连续查询
✓ 保留策略
✓ 降采样

🎯 应用场景

• IoT监控
• 系统指标收集
• 金融数据
• 运维监控
• 日志分析
• 传感器数据

📦 代表产品

InfluxDB TimescaleDB Prometheus QuestDB

🔍

向量数据库（Vector Database）

专为存储和检索高维向量数据设计。支持相似度搜索，是AI和机器学习应用的关键基础设施。

✨ 核心特性

✓ 高维向量存储
✓ 相似度搜索
✓ 近似最近邻（ANN）
✓ 语义搜索
✓ 混合检索
✓ 实时更新

🎯 应用场景

• RAG检索增强生成
• 图像搜索
• 推荐系统
• 异常检测
• 语义搜索
• 知识图谱

📦 代表产品

Pinecone Weaviate Qdrant Milvus Chroma

🔗

联邦查询引擎（Federated Query Engine）

分布式SQL查询引擎，可以在不同数据源上执行查询。提供统一的SQL接口访问多个数据源，无需数据迁移。

✨ 核心特性

✓ 多数据源查询
✓ SQL标准接口
✓ 分布式查询优化
✓ 连接器生态丰富
✓ 无需数据迁移
✓ 统一数据视图

🎯 应用场景

• 数据湖查询
• 跨系统数据分析
• 联合查询
• 数据虚拟化
• 统一数据平台

📦 代表产品

Trino Presto Apache Drill Apache Spark SQL

🔎

搜索引擎（Search Engine）

提供全文搜索能力，支持复杂的搜索查询、模糊匹配、相关性排序等功能。基于倒排索引实现快速检索。

✨ 核心特性

✓ 倒排索引
✓ 全文搜索
✓ 相关性排序
✓ 模糊匹配
✓ 高亮显示
✓ 分布式搜索

🎯 应用场景

• 电商搜索
• 企业搜索
• 日志检索
• 内容推荐
• 文档搜索

📦 代表产品

Elasticsearch Apache Solr OpenSearch

特性	关系型	列式	文档型	键值型	图	向量	搜索引擎
主要用途	OLTP事务	OLAP分析	内容管理	缓存	关系分析	相似搜索	全文搜索
数据模型	表格	列式	文档	键值对	节点-边	向量	倒排索引
查询语言	SQL	SQL	类SQL	API	Cypher/GraphQL	API	REST/Dedicated
一致性	强	强/最终	最终	最终	强/最终	最终	最终
扩展性	垂直	水平	水平	水平	水平	水平	水平
事务	✓ ACID	△ 有限	△ 部分	✗ 无	✓ 支持	✗ 无	✗ 无
复杂查询	✓ 强	✓ 聚合强	△ 中等	✗ 弱	✓ 关系查询强	✓ 向量搜索强	✓ 搜索强
代表产品	MySQL	ClickHouse	MongoDB	Redis	Neo4j	Pinecone	Elasticsearch

💡 如何选择合适的数据库类型？

✅ 选择关系型数据库

适合场景：需要ACID事务、固定结构数据、复杂JOIN查询

示例：电商订单、用户管理、金融系统

✅ 选择列式数据库

适合场景：海量数据分析、聚合查询、数据仓库

示例：ClickHouse用于日志分析、用户行为分析

✅ 选择文档数据库

适合场景：Schema变化频繁、非结构化数据

示例：内容管理、产品目录、IoT数据

✅ 选择键值数据库

适合场景：缓存、会话存储、简单查询

示例：Redis用于缓存、计数器、分布式锁

✅ 选择图数据库

适合场景：复杂关系查询、社交网络、推荐系统

示例：好友关系、知识图谱、欺诈检测

✅ 选择向量数据库

适合场景：语义搜索、AI应用、相似度检索

示例：RAG应用、图像检索、推荐系统

✅ 选择联邦查询引擎

适合场景：跨数据源查询、数据湖分析、多源数据整合

示例：Trino连接多个数据源

✅ 选择搜索引擎

适合场景：全文搜索、相关性排序、日志检索

示例：电商搜索、日志分析、企业搜索

🗂️ 数据库种类

📚 数据库类型详解

关系型数据库（RDBMS）

✨ 核心特性

🎯 应用场景

📦 代表产品

列式数据库（Columnar Database / OLAP）

✨ 核心特性

🎯 应用场景

📦 代表产品

文档数据库（Document Database）

✨ 核心特性

🎯 应用场景

📦 代表产品

键值数据库（Key-Value Store）

✨ 核心特性

🎯 应用场景

📦 代表产品

宽列存储（Wide Column Store）

✨ 核心特性

🎯 应用场景

📦 代表产品

图数据库（Graph Database）

✨ 核心特性

🎯 应用场景

📦 代表产品

时序数据库（Time Series Database）

✨ 核心特性

🎯 应用场景

📦 代表产品

向量数据库（Vector Database）

✨ 核心特性

🎯 应用场景

📦 代表产品

联邦查询引擎（Federated Query Engine）

✨ 核心特性

🎯 应用场景

📦 代表产品

搜索引擎（Search Engine）

✨ 核心特性

🎯 应用场景

📦 代表产品

📊 数据库类型对比

⚖️ OLTP vs OLAP

📝 OLTP

📊 OLAP

💡 如何选择合适的数据库类型？

✅ 选择关系型数据库

✅ 选择列式数据库

✅ 选择文档数据库

✅ 选择键值数据库

✅ 选择图数据库

✅ 选择向量数据库

✅ 选择联邦查询引擎

✅ 选择搜索引擎

🏗️ 现代数据架构：多数据库组合

Lambda架构

AI数据栈

联邦查询

全栈组合