一条数据的HBase之旅,简明HBase入门教程-开篇

这是hbase入门系列的第1篇文章,介绍HBase的数据模型、适用场景、集群关键角色、建表流程以及所涉及的HBase基础概念,本文内容基于HBase 2.0 beta2版本。本文既适用于HBase新手,也适用于已有一定经验的HBase开发人员。转载自:https://blog.csdn.net/nosqlnotes/article/details/79647096


一些常见的HBase新手问题

  1. 什么样的数据适合用HBase来存储?
  2. 既然HBase也是一个数据库,能否用它将现有系统中昂贵的oracle替换掉?
  3. 存放于HBase中的数据记录,为何不直接存放于HDFS之上?
  4. 能否直接使用HBase来存储文件数据?
  5. Region(HBase中的数据分片)迁移后,数据是否也会被迁移?
  6. 为何基于spark/hive分析HBase数据时性能较差?

开篇

用惯了Oracle/mysql的同学们,心目中的数据表,应该是长成这样的:

约定

  1. 本文范围内针对一些关键特性/流程,使用了加粗以及加下划线的方式做了强调,如”ProcedureV2“。这些特性往往在本文中仅仅被粗浅提及,后续计划以独立的文章来介绍这些特性/流程。

  2. 术语缩写:对于一些进程/角色名称,在本文范围内可能通过缩写形式来表述:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

一条数据的HBase之旅,简明HBase入门教程-开篇