Pig 运行模式
Apache Pig 以两种模式执行: 本地模式和 MapReduce 模式。
本地模式
- 它在单个 JVM 中执行,用于开发实验和原型设计。
- 在这里,使用本地主机安装和运行文件。
- 本地模式适用于本地文件系统。存储在本地文件系统中的输入和输出数据。
本地模式grunt shell的命令:
$ pig-x local
MapReduce 模式
- MapReduce 模式也称为 Hadoop 模式。
- 这是默认模式。
- 在此 Pig 中,将 Pig Latin 渲染为 MapReduce 作业并在集群上执行它们。
- 它可以针对半分布式或完全分布式的 Hadoop 安装执行。
- 此处,输入和输出数据存在于 HDFS 上。
Map reduce 模式的命令:
$ pig
或者,
$ pig-x mapreduce
Pig 程序的执行方式
以下是在本地和 MapReduce 模式下执行 Pig 程序的方式::
- 交互模式-在这种模式下,Pig 在 Grunt shell 中执行。要调用 Grunt shell,请运行 pig 命令。一旦 Grunt 模式执行,我们就可以在命令行中以交互方式提供 Pig Latin 语句和命令。
- 批处理模式-在此模式下,我们可以运行扩展名为 .pig 的脚本文件。这些文件包含 Pig Latin 命令。
- 嵌入式模式-在这种模式下,我们可以定义自己的功能。这些函数可以称为 UDF(用户定义函数)。在这里,我们使用 Java 和 Python 等编程语言。
Pig Latin 是一种数据流语言,Apache Pig 使用它来分析 Hadoop 中的数据。它是一种文本语言,将 Java MapReduce 习语中的编程抽象为符号。 Pig Latin 语句Pig L ...