HBase 读取数据
1. 使用HBase Shell读取数据
HTable 类的 get 命令和 get() 方法用于从HBase中的表中读取数据。使用 get 命令,您可以一次获取单行数据。其语法如下:
get ’<table name>’,’row1’
范例
以下示例显示如何使用get命令。让我们扫描 emp 表的第一行。
hbase(main):012:0> get 'emp', '1' COLUMN CELL personal : city timestamp = 1417521848375, value = hyderabad personal : name timestamp = 1417521785385, value = ramu professional: designation timestamp = 1417521885277, value = manager professional: salary timestamp = 1417521903862, value = 50000 4 row(s) in 0.0270 seconds
2. 读一个特定的列
下面给出了使用 get 方法读取特定列的语法。
hbase> get 'table name', ‘rowid’, {COLUMN ⇒ ‘column family:column name ’}
范例
下面给出的是读取HBase表中特定列的示例。
hbase(main):015:0> get 'emp', 'row1', {COLUMN ⇒ 'personal:name'} COLUMN CELL personal:name timestamp = 1418035791555, value = raju 1 row(s) in 0.0080 seconds
3. 使用Java API读取数据
要从HBase表读取数据,请使用HTable类的 get() 方法。此方法需要 Get 类的一个实例。按照以下步骤从HBase表中检索数据。
步骤1:实例化配置类
配置 类将HBase配置文件添加到其对象。您可以使用 HbaseConfiguration 类的 create() 方法创建一个配置对象,如下所示。
Configuration conf = HbaseConfiguration.create();
第2步:实例化HTable类
您有一个名为 HTable 的类,它是HBase中Table的一个实现。该类用于与单个HBase表进行通信。在实例化这个类时,它接受配置对象和表名作为参数。你可以实例化HTable类,如下所示。
HTable hTable = new HTable(conf, tableName);
第3步:实例化Get类
您可以使用 HTable 类的 get() 方法从HBase表中检索数据。此方法从给定行中提取单元格。它需要一个 Get 类对象作为参数。如下所示创建它。
Get get = new Get(toBytes("row1"));
第4步:读取数据
在检索数据时,可以通过id获取单个行,也可以通过一组行ID获取一组行,也可以扫描整个表或行的子集。
您可以使用 Get 类中的add方法变体来检索HBase表格数据。
要从特定列族获取特定列,请使用以下方法。
get.addFamily(personal)
要获取特定列族的所有列,请使用以下方法。
get.addColumn(personal, name)
第5步:获得结果
通过将您的 Get 类实例传递给 HTable 类的get方法来获得 结果 。此方法返回 Result 类对象,该对象保存请求的结果。下面给出了 get() 方法的用法。
Result result = table.get(g);
第6步:从结果实例中读取值
的 结果 类提供 的getValue() 方法来从它的实例中读取的值。如下所示使用它来读取 Result 实例中的值。
byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name")); byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city"));
下面给出了从HBase表读取值的完整程序。
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.client.Get; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Result; import org.apache.hadoop.hbase.util.Bytes; public class RetriveData{ public static void main(String[] args) throws IOException, Exception{ // Instantiating Configuration class Configuration config = HBaseConfiguration.create(); // Instantiating HTable class HTable table = new HTable(config, "emp"); // Instantiating Get class Get g = new Get(Bytes.toBytes("row1")); // Reading the data Result result = table.get(g); // Reading values from Result class object byte [] value = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("name")); byte [] value1 = result.getValue(Bytes.toBytes("personal"),Bytes.toBytes("city")); // Printing the values String name = Bytes.toString(value); String city = Bytes.toString(value1); System.out.println("name: " + name + " city: " + city); } }
编译并执行上述程序,如下所示。
$javac RetriveData.java $java RetriveData
以下应该是输出:
name: Raju city: Delhi
1. 删除表格中的特定单元格使用 delete 命令,您可以删除表中的特定单元格。 delete 命令的语法如下所示:delete ‘<table name>’, &ls ...