🗂️ 数据库种类

全面了解不同类型的数据库系统

📊 关系型 📄 NoSQL 📊 列式 🗝️ 键值 🕸️ 图 ⏱️ 时序 🔍 向量 🔗 联邦

📚 数据库类型详解

📊

关系型数据库(RDBMS)

使用表格(行和列)来存储数据,数据之间通过关系连接。遵循ACID原则,提供强一致性和事务保证。主要用于OLTP(在线事务处理)。

✨ 核心特性

  • ✓ 表结构固定
  • ✓ 支持SQL查询
  • ✓ ACID事务保证
  • ✓ 强一致性
  • ✓ 外键约束
  • ✓ 数据完整性

🎯 应用场景

  • • 金融系统(银行、支付)
  • • ERP系统
  • • 电商平台
  • • 内容管理系统
  • • 用户管理系统

📦 代表产品

MySQL PostgreSQL Oracle SQL Server SQLite
📊

列式数据库(Columnar Database / OLAP)

按列存储数据而非按行。特别适合分析查询,压缩率高,查询速度快。专为OLAP(在线分析处理)优化,支持大量数据的聚合查询。

✨ 核心特性

  • ✓ 列式存储
  • ✓ 高压缩比
  • ✓ 快速聚合查询
  • ✓ OLAP分析优化
  • ✓ 列级索引
  • ✓ 并行处理

🎯 应用场景

  • • 数据仓库和BI
  • • 实时分析
  • • 日志分析
  • • 用户行为分析
  • • 监控指标分析

📦 代表产品

ClickHouse Apache Druid Vertica Amazon Redshift Snowflake
📄

文档数据库(Document Database)

以JSON或XML等格式存储半结构化文档。文档可以包含任意字段,Schema灵活,适合快速迭代开发。

✨ 核心特性

  • ✓ 灵活的Schema
  • ✓ 嵌套文档支持
  • ✓ JSON/BSON格式
  • ✓ 水平扩展
  • ✓ 嵌入关联数据
  • ✓ 读性能高

🎯 应用场景

  • • 内容管理系统
  • • 用户配置文件
  • • 产品目录
  • • 日志存储
  • • IoT传感器数据

📦 代表产品

MongoDB CouchDB RavenDB Amazon DocumentDB
🗝️

键值数据库(Key-Value Store)

简单的键值对存储模型,通过key快速访问value。性能极高,适合缓存、会话存储和配置管理。

✨ 核心特性

  • ✓ 极简数据结构
  • ✓ 极高性能
  • ✓ 低延迟
  • ✓ 水平扩展
  • ✓ 内存存储
  • ✓ 支持TTL过期

🎯 应用场景

  • • 缓存系统
  • • 会话存储
  • • 配置管理
  • • 计数器
  • • 排行榜
  • • 分布式锁

📦 代表产品

Redis Memcached Amazon DynamoDB Riak
📈

宽列存储(Wide Column Store)

也称为列族存储。数据按列族组织,支持动态列。结合了键值存储的简单性和关系数据库的查询能力。适合大规模、稀疏数据集。

✨ 核心特性

  • ✓ 列族存储
  • ✓ 动态列支持
  • ✓ 稀疏数据结构
  • ✓ 水平扩展
  • ✓ 高写入性能
  • ✓ 最终一致性

🎯 应用场景

  • • 物联网数据收集
  • • 时间序列数据
  • • 日志系统
  • • 用户行为追踪
  • • 推荐系统

📦 代表产品

Cassandra HBase ScyllaDB Amazon Keyspaces
🕸️

图数据库(Graph Database)

以节点(Node)和边(Edge)的形式存储图数据。擅长处理复杂关系查询,适合社交网络、推荐系统等场景。

✨ 核心特性

  • ✓ 节点-边-属性模型
  • ✓ 快速关系遍历
  • ✓ 复杂查询优化
  • ✓ 路径查询
  • ✓ 社区发现
  • ✓ 推荐算法

🎯 应用场景

  • • 社交网络分析
  • • 推荐系统
  • • 知识图谱
  • • 欺诈检测
  • • 访问控制
  • • 网络拓扑

📦 代表产品

Neo4j ArangoDB Amazon Neptune OrientDB
⏱️

时序数据库(Time Series Database)

专门优化用于存储和查询时间序列数据。提供高效的压缩算法、时间窗口查询和连续查询功能。

✨ 核心特性

  • ✓ 时间戳索引优化
  • ✓ 高压缩比
  • ✓ 聚合函数丰富
  • ✓ 连续查询
  • ✓ 保留策略
  • ✓ 降采样

🎯 应用场景

  • • IoT监控
  • • 系统指标收集
  • • 金融数据
  • • 运维监控
  • • 日志分析
  • • 传感器数据

📦 代表产品

InfluxDB TimescaleDB Prometheus QuestDB
🔍

向量数据库(Vector Database)

专为存储和检索高维向量数据设计。支持相似度搜索,是AI和机器学习应用的关键基础设施。

✨ 核心特性

  • ✓ 高维向量存储
  • ✓ 相似度搜索
  • ✓ 近似最近邻(ANN)
  • ✓ 语义搜索
  • ✓ 混合检索
  • ✓ 实时更新

🎯 应用场景

  • • RAG检索增强生成
  • • 图像搜索
  • • 推荐系统
  • • 异常检测
  • • 语义搜索
  • • 知识图谱

📦 代表产品

Pinecone Weaviate Qdrant Milvus Chroma
🔗

联邦查询引擎(Federated Query Engine)

分布式SQL查询引擎,可以在不同数据源上执行查询。提供统一的SQL接口访问多个数据源,无需数据迁移。

✨ 核心特性

  • ✓ 多数据源查询
  • ✓ SQL标准接口
  • ✓ 分布式查询优化
  • ✓ 连接器生态丰富
  • ✓ 无需数据迁移
  • ✓ 统一数据视图

🎯 应用场景

  • • 数据湖查询
  • • 跨系统数据分析
  • • 联合查询
  • • 数据虚拟化
  • • 统一数据平台

📦 代表产品

Trino Presto Apache Drill Apache Spark SQL
🔎

搜索引擎(Search Engine)

提供全文搜索能力,支持复杂的搜索查询、模糊匹配、相关性排序等功能。基于倒排索引实现快速检索。

✨ 核心特性

  • ✓ 倒排索引
  • ✓ 全文搜索
  • ✓ 相关性排序
  • ✓ 模糊匹配
  • ✓ 高亮显示
  • ✓ 分布式搜索

🎯 应用场景

  • • 电商搜索
  • • 企业搜索
  • • 日志检索
  • • 内容推荐
  • • 文档搜索

📦 代表产品

Elasticsearch Apache Solr OpenSearch

📊 数据库类型对比

特性 关系型 列式 文档型 键值型 向量 搜索引擎
主要用途 OLTP事务 OLAP分析 内容管理 缓存 关系分析 相似搜索 全文搜索
数据模型 表格 列式 文档 键值对 节点-边 向量 倒排索引
查询语言 SQL SQL 类SQL API Cypher/GraphQL API REST/Dedicated
一致性 强/最终 最终 最终 强/最终 最终 最终
扩展性 垂直 水平 水平 水平 水平 水平 水平
事务 ✓ ACID △ 有限 △ 部分 ✗ 无 ✓ 支持 ✗ 无 ✗ 无
复杂查询 ✓ 强 ✓ 聚合强 △ 中等 ✗ 弱 ✓ 关系查询强 ✓ 向量搜索强 ✓ 搜索强
代表产品 MySQL ClickHouse MongoDB Redis Neo4j Pinecone Elasticsearch

⚖️ OLTP vs OLAP

📝 OLTP

在线事务处理(Online Transaction Processing)

特点:

  • • 支持大量并发事务
  • • 读写操作频繁
  • • 数据量相对较小
  • • 响应时间要求低

适合:

  • • 银行交易系统
  • • 电商订单系统
  • • 库存管理系统

数据库:

MySQL、PostgreSQL、Oracle

📊 OLAP

在线分析处理(Online Analytical Processing)

特点:

  • • 查询操作为主
  • • 复杂聚合查询
  • • 数据量极大
  • • 批量读取数据

适合:

  • • 数据仓库
  • • 商业智能(BI)
  • • 数据分析报表

数据库:

ClickHouse、Snowflake、Redshift

💡 如何选择合适的数据库类型?

✅ 选择关系型数据库

适合场景:需要ACID事务、固定结构数据、复杂JOIN查询

示例:电商订单、用户管理、金融系统

✅ 选择列式数据库

适合场景:海量数据分析、聚合查询、数据仓库

示例:ClickHouse用于日志分析、用户行为分析

✅ 选择文档数据库

适合场景:Schema变化频繁、非结构化数据

示例:内容管理、产品目录、IoT数据

✅ 选择键值数据库

适合场景:缓存、会话存储、简单查询

示例:Redis用于缓存、计数器、分布式锁

✅ 选择图数据库

适合场景:复杂关系查询、社交网络、推荐系统

示例:好友关系、知识图谱、欺诈检测

✅ 选择向量数据库

适合场景:语义搜索、AI应用、相似度检索

示例:RAG应用、图像检索、推荐系统

✅ 选择联邦查询引擎

适合场景:跨数据源查询、数据湖分析、多源数据整合

示例:Trino连接多个数据源

✅ 选择搜索引擎

适合场景:全文搜索、相关性排序、日志检索

示例:电商搜索、日志分析、企业搜索

🏗️ 现代数据架构:多数据库组合

Lambda架构

OLTP + OLAP

MySQL处理事务,ClickHouse处理分析,Kafka实时同步

AI数据栈

PostgreSQL + 向量DB

PostgreSQL存储结构化数据,向量库支持RAG检索

联邦查询

Trino统一查询

通过Trino连接MySQL、ClickHouse、S3等多种数据源

全栈组合

多类型数据库

关系型+列式+向量+搜索,各司其职,优势互补

← 返回数据库首页