HBase全网学习资料汇总

摘要: 这些资料以供有大规模结构化需求的用户及HBase爱好者学习交流,以使用HBase更好的解决实际的问题。

12-11 09:31 首页 云栖社区

前言


HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。

注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。另外,数据需求,很多公司是mysql+hbase+hadoop(spark),满足关系型数据库需求,满足大规模结构化存储需求,满足复杂分析的需求。如此流行的原因来源于很多方面,如:


  • 开源繁荣的生态:1. 任何公司倒闭了,开源的HBase还在 2.几乎每家公司都可以去下载源码,改进它,再反馈给社区,就如阿里已经反馈了数百个patch了。加入的人越多,引擎就越好


  • 跟HADOOP深度结合:本就同根同源,在数据存储在HBase后,如果想复杂分析,则非常方便


  • 高扩展、高容量、高性能、低成本、低延迟、稀疏宽表、动态列、TTL、多版本等最为关键,起源google论文,发扬社区及广大互联网公司,设计之初就是为存储互联网,后经过多年的改进升级,如今已经是结构化存储的事实标准



以下资料会一直更新中......请大家关注!

书籍

最好买纸质书籍,集中时间看下

  • HBase权威指南(HBase: The Definitive Guide):理论多一些

  • HBase实战:实践多一些


总结性

  • HBase2.0: 

    预计今年会发布,hbase2.0是革命性的版本

  • HBase Phoenix:

    Apache Phoenix与HBase:HBase之上SQL的过去,现在和未来

    https://yq.aliyun.com/articles/71097

  • 社区hbase博客:https://blogs.apache.org/hbase/

方法论

  • HBase使用场景和成功案例:http://blog.sina.com.cn/s/blog_ae33b83901016azb.html

    存储互联网的初心不变

  • 一种基于物联网大数据的设备信息采集系统及方法:https://www.google.com/patents/CN106657394A

    怎么使用HBase、sparkStreaming、redis处理物联网大数据

  • 一种基于HBase的智能电网时序大数据处理方方案:

    http://www.doc88.com/p-3969721101293.html

  • HBase配合GeoHash算法支持经纬度:

    http://blog.jobbole.com/80633/

    此文主要讲GeoHash算法的


各大公司的实践

基本围绕在用户画像、安全风控、订单存储、交通轨迹、物理网、监控、大数据中间存储、搜索、推荐等方面:


阿里巴巴-大数据时代的结构化存储HBase在阿里的应用实践:

讲述在阿里巴巴集团的实践,HBase在阿里集团已经10000台左右,主要在订单、监控、风控、消息、大数据计算等领域使用

文章链接:http://www.raincent.com/content-10-8535-1.html


阿里巴巴搜索-Hbase在阿里巴巴搜索中的完美应用实践:

讲述在搜索场景下hbase的应用及相关的改进

文章链接:http://www.cnn6.net/html/bigdata/2017524/201869.html


日均采集1200亿数据点,腾讯千亿级服务器监控数据存储实践:

本文将从当前存储架构存在的问题出发,介绍从尝试使用 Opentsdb 到自行设计 Hbase 存储方案来存储 TMP 服务器海量监控数据的实践历程。

文章链接:http://server.51cto.com/sOS-547974.htm


滴滴-HBase在滴滴出行的应用场景和最佳实践:

统计结果、报表类数据、原始事实类数据、中间结果数据、线上系统的备份数据的一些应用

文章链接:http://server.51cto.com/sOS-547974.htm


HBase上搭建广告实时数据处理平台:

主要分享:

  1. 如何通过HBase实现数据流实时关联

  2. 如何保证重要的计费数据不重不丢

  3. HBase实战经验,优化负载均衡、读写缓存、批量读写等性能问题

文章链接:http://www.infoq.com/cn/presentations/build-advertising-real-time-data-processing-platform-on-hbase/


HBase在京东的实践 :

跟阿里一样,京东各个业务线使用了HBase,如:风控、订单、商品评价等

文章链接:https://pan.baidu.com/s/1cKZxb4


中国人寿基于HBase的企业级大数据平台:

使用一个大跨表存储所有的保单,HBase宽表的实践

文章链接:https://pan.baidu.com/s/1kVA7GTT


HBase在Hulu的使用和实践:

用户画像、订单存储系统、日志存储系统的使用

文章链接:https://pan.baidu.com/s/1kVA7GTT


Apache HBase at Netease:

在报表、监控、日志类业务、消息类业务、推荐类业务、风控类业务有所使用,另外讲述了一些优化的点。

文章链接:https://pan.baidu.com/s/1i5ehHMP


10 Million Smart Meter Data with Apache HBase:

讲述Hitachi为什么选择hbase及在HBase方面的应用

文章链接:https://pan.baidu.com/s/1cewbxG


G7:如何用云计算链接30万车辆--EMR&Hbase 在物联网领域的实践及解决方案 

讲述了怎么使用spark及hbase来满足物联网的需求

文章链接:https://yq.aliyun.com/articles/70748


HBase资料库

HBase:

https://pan.baidu.com/s/1jILzgns

知乎HBase讨论:

https://www.zhihu.com/topic/19600820/hot


结尾

这些资料是由阿里技术专家封神整理,以供有大规模结构化需求的用户及HBase爱好者学习交流,以使用HBase更好的解决实际的问题。

精彩活动

你关注人工智能吗?

你知道全球人工智能顶级专家都在研究什么吗?

30日,杭州阿里巴巴西溪园区,三位阿里人工智能专家将为你独家解密温哥华ACL 2017会议!

识别下方二维码即可报名参与!


点击“阅读原文”查看详细资料



首页 - 云栖社区 的更多文章: