HBase là một trong hệ đại lý dữ liệu mã mối cung cấp mlàm việc được thi công dựa trênBigTable được diễn tả vào nghiên cứu: “BigTable: A Distributed Storage Systemystem for Structure Data”. HBase hỗ trợ tài năng tàng trữ dữ liệu to lên tới sản phẩm tỷ dòng, hàng ngàn cột khác biệt cũng như hàng petabytes dung lượng. HBase là một trong những NoSQL điển hình thế cho nên các tables của HBase không có một schemas thắt chặt và cố định với không có những quan hệ tình dục thân các bảng, không cung ứng phnghiền join thân những bảng. Hadoop có khả năng không ngừng mở rộng tốt với có phong cách thiết kế để mở rộng theo chiều ngang (Scale horizontally).

Bạn đang xem: Hbase là gì


Lúc bấy giờ HBase sẽ là 1 trong những trong số top-cấp độ project của tổ chức triển khai Apabít Software Foundation với được cung ứng dưới giấy phép: Apabít Lisence 2.0.
HBase được xây đắp dựa trên xây dựng của Google BigTable cho nên vì vậy nó cũng có nhiều điểm kiểu như với BigTable.Dữ liệu được lưu trong 1 table của HBase được xác minh bởi vì các khóa: “Table, Rowkey, Column Families, Column, Timestamp”.
*


Mỗi table bao hàm rất nhiều row, hoàn toàn có thể lên tới mức hàng tỷ rows trong một table của HBase, những row được khẳng định với nhau do 1 khóa duy nhất “rowkey”, rowkeytrong HBase tất cả công dụng giống như cùng với Primary key trong số hệ cửa hàng tài liệu thông thường.Các row vào cùng 1 talbe luôn luôn được bố trí theo vật dụng từ trường đoản cú điển theorowkey.Hình sau cho biết cách cơ mà HBase bố trí dữ liệu Lúc ta thêm các row với các rowkey không giống nhau:

Trong Khi vào nghiên cứu và phân tích gốc BigTable chỉ diễn đạt về single index, tuy nhiên trong HBase còn cung cấp Secondary IndexIndexes.

Xem thêm: Come Over Là Gì ? Giải Thích Nghĩa Từ, Ví Dụ » Tiếng Anh 24H


Mỗi row lại bao hàm các columns không giống nhau, những column này lại được gộp thành “column families”.Chúng giúp chúng ta đội những dữ liệu có cùng điểm tầm thường lại với nhau, phân đội những loại dữ liệu cùng thực hiện các chế độ vận dụng lên từng team, ví dụ: nén… Tất cả các columns ở vào cùng 1 column families hồ hết được tàng trữ cùng mọi người trong nhà sinh sống trong storage file được Call làHFile. Các column families này rất cần được được khai báo khi ta tạo thành bắt đầu tables phía bên trong HBase với trong 1 table HBase không nên có quá nhiều column families, hiện tại HBase vẫn chưa vận động xuất sắc với các table có không ít hơn 2 tốt 3 columns families.
Không hệt như các hệ các đại lý tài liệu tình dục, column vào HBase không quan trọng phải tạo lập từ bỏ Lúc khởi tạo thành bảng mà ta hoàn toàn có thể tạo new column ngay trong quy trình chuyển động. Trong 1 table rất có thể bao gồm số lượng column lên đến mức hàng ngàn hoặc nhiều hơn nữa. 1 column của Hbase được knhì báo dưới dạng:”families: qualifier”, trong những số đó familieslà tên của columnsfamiliescơ mà colums được nhóm vào trong số đó,qualifierđể xác định column.

Gía trị của mỗi columns được hotline là cell, từng cells chứa được nhiều cặp “version(timestamp, value)”.Trong số đó timestamp là giá trị được ra đời bởi vì khối hệ thống hoăc được khẳng định vì người tiêu dùng. Các version khác nhau được khác nhau cùng nhau bởitimestamp, trong một cells rất có thể tàng trữ các version của data ứng cùng với thời gian được gửi vào hệ thống khác biệt. Các version này được bố trí theo thiết bị trường đoản cú trường đoản cú new mang đến cũ. vì vậy ta đã gọi những version new của data trước tiếp nối đọc mang đến các version cũ hơn của nó…Hình sau mô tả một cách xúc tích cách những version được bố trí trong những rows:

Một điểm khác hoàn toàn nữa của HBase đối với các hệ cơ sở tài liệu thường thì không giống là các cực hiếm “null” sẽ không còn được lưu trữ trong đại lý tài liệu HBase. Hình sau bộc lộ sự khác nhau trong bí quyết lưu trữ thân 2 loại cửa hàng dữ liệu:
Đơn vị lưu trữ cơ bạn dạng của HBase là region, bài toán phân chia tables thành các region bảo đảm an toàn kĩ năng phân tán cùng cân bảng mua của HBase. Mỗi region đựng 1 dải những row xếp tức tốc nhau cùng chúng sẽ tiến hành auto chia thành 2 ví như tài liệu vào nó trsống lên quá lớn.
Mỗi region ở trong 1 RegionServer tốt nhất, cơ mà từng RegionServer lại có thể cất thuộc 1 cơ hội nhiều region khác nhau nhỏng hình sau:
Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *