HBase 读取数据

 

1. 使用HBase Shell读取数据

HTable 类的 get 命令和 get() 方法用于从HBase中的表中读取数据。使用 get 命令,您可以一次获取单行数据。其语法如下:

get ’<table name>’,’row1’

范例

以下示例显示如何使用get命令。让我们扫描 emp 表的第一行。

hbase(main):012:0> get 'emp', '1'

   COLUMN                     CELL

personal : city timestamp = 1417521848375, value = hyderabad

personal : name timestamp = 1417521785385, value = ramu

professional: designation timestamp = 1417521885277, value = manager

professional: salary timestamp = 1417521903862, value = 50000

4 row(s) in 0.0270 seconds

 

2. 读一个特定的列

下面给出了使用 get 方法读取特定列的语法。

hbase> get 'table name', ‘rowid’, {COLUMN ⇒ ‘column family:column name ’}

范例

下面给出的是读取HBase表中特定列的示例。

hbase(main):015:0> get 'emp', 'row1', {COLUMN ⇒ 'personal:name'}
  COLUMN                CELL  
personal:name timestamp = 1418035791555, value = raju
1 row(s) in 0.0080 seconds

 

3. 使用Java API读取数据

要从HBase表读取数据,请使用HTable类的 get() 方法。此方法需要 Get 类的一个实例。按照以下步骤从HBase表中检索数据。

步骤1:实例化配置类

配置 类将HBase配置文件添加到其对象。您可以使用 HbaseConfiguration 类的 create() 方法创建一个配置对象,如下所示。

Configuration conf = HbaseConfiguration.create();

第2步:实例化HTable类

您有一个名为 HTable 的类,它是HBase中Table的一个实现。该类用于与单个HBase表进行通信。在实例化这个类时,它接受配置对象和表名作为参数。你可以实例化HTable类,如下所示。

HTable hTable = new HTable(conf, tableName);

第3步:实例化Get类

您可以使用 HTable 类的 get() 方法从HBase表中检索数据。此方法从给定行中提取单元格。它需要一个 Get 类对象作为参数。如下所示创建它。

Get get = new Get(toBytes("row1"));

第4步:读取数据

在检索数据时,可以通过id获取单个行,也可以通过一组行ID获取一组行,也可以扫描整个表或行的子集。

您可以使用 Get 类中的add方法变体来检索HBase表格数据。

要从特定列族获取特定列,请使用以下方法。

get.addFamily(personal)

要获取特定列族的所有列,请使用以下方法。

get.addColumn(personal, name)

第5步:获得结果

通过将您的 Get 类实例传递给 HTable 类的get方法来获得 结果 。此方法返回 Result 类对象,该对象保存请求的结果。下面给出了 get() 方法的用法。

Result result = table.get(g);

第6步:从结果实例中读取值

结果 类提供 的getValue() 方法来从它的实例中读取的值。如下所示使用它来读取 Result 实例中的值。

byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name"));
byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city"));

下面给出了从HBase表读取值的完整程序。

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Get;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.util.Bytes;

public class RetriveData{

   public static void main(String[] args) throws IOException, Exception{

      // Instantiating Configuration class
      Configuration config = HBaseConfiguration.create();

      // Instantiating HTable class
      HTable table = new HTable(config, "emp");

      // Instantiating Get class
      Get g = new Get(Bytes.toBytes("row1"));

      // Reading the data
      Result result = table.get(g);

      // Reading values from Result class object
      byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name"));

      byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city"));

      // Printing the values
      String name = Bytes.toString(value);
      String city = Bytes.toString(value1);

      System.out.println("name: " + name + " city: " + city);
   }
}

编译并执行上述程序,如下所示。

$javac RetriveData.java
$java RetriveData

以下应该是输出:

name: Raju city: Delhi

 1. 删除表格中的特定单元格使用 delete 命令,您可以删除表中的特定单元格。 delete 命令的语法如下所示:delete ‘<table name>’, &ls ...