分类
apache pig big data tutorials 教程

Apache Pig upper

此函数用于将字符串中的所有字符转换为大写。 句法 UPPER()函数的语法如下- grunt> UPPER(expression) 例 假设在HDFS目录/ pig_data /中有一个名为emp.txt的文件。此文件包含员工详细信息,例如ID,姓名,年龄和城市。 emp.txt 001,Robin,22,newyork 002,BOB,23,Kolkata 003,Maya,23,Tokyo 004,Sara,25,London 005,David,23,Bhuwaneshwar 006,Maggy […]

分类
apache pig big data tutorials 教程

Apache Pig union算子

Pig Latin的UNION运算符用于合并两个关系的内容。要对两个关系执行UNION操作,它们的列和域必须相同。 句法 下面给出的是UNION运算符的语法。 grunt> Relation_name3 = UNION Relation_name1, Relation_name2; 例 假设我们在HDFS的/ pig_data /目录中有两个文件,即student_data1.txt和student_data2.txt,如下所示。 Student_data1.txt 001,Rajiv,Reddy,9 […]

分类
apache pig big data tutorials 教程

Apache Pig ucfirst

该函数接受一个字符串,将其首字母转换为大写,然后返回结果。 句法 这是UCFIRST()函数的语法。 grunt> UCFIRST(expression) 例 假设在HDFS目录/ pig_data /中有一个名为emp.txt的文件,如下所示。此文件包含员工详细信息,例如ID,姓名,年龄和城市。 emp.txt 001,Robin,22,newyork 002,BOB,23,Kolkata 003,Maya,23,Tokyo 004,Sara,25,London 005,David,23,Bhuwa […]

分类
apache pig big data tutorials 教程

Apache Pig trim

TRIM()函数接受一个字符串,并在删除字符串前后的多余空格后返回其副本。 句法 这是TRIM()函数的语法。 grunt> TRIM(expression) 例 假设在emp_data关系的记录中,雇员姓名前后有一些多余的空格。 grunt> Dump emp_data; (1, Robin ,22,newyork) (2,BOB,23,Kolkata) (3, Maya ,23,Tokyo) (4,Sara,25,London) (5, David ,23,Bhuwaneshwar) (6, […]

分类
apache pig big data tutorials 教程

Apache Pig tutuple

TOTUPLE()函数用于将一个或多个表达式转换为数据类型元组。 句法 下面给出的是TOTUPLE()函数的语法。 grunt> TOTUPLE(expression [, expression …]) 例 假设我们在HDFS目录/ pig_data /中有一个名为employee_details.txt的文件,内容如下。 employee_details.txt 001,Robin,22,newyork 002,BOB,23,Kolkata 003,Maya,23,Tokyo 004,Sara, […]

分类
apache pig big data tutorials 教程

Apache Pig top

Pig Latin的TOP()函数用于获取包的前N个元组。作为输入,我们必须传递一个关系,所需的元组数以及要比较其值的列名作为该函数。此函数将返回包含所需列的包。 句法 下面给出的是函数TOP()的语法。 grunt> TOP(topN,column,relation) 例 假设我们在HDFS目录/ pig_data /中有一个名为employee_details.txt的文件,内容如下。 employee_details.txt 001,Robin,22,newyork 002,BOB,23,Kol […]

分类
apache pig big data tutorials 教程

Apache Pig tomap

Pig Latin的TOMAP()函数用于将键值对转换为Map。 句法 下面给出的是TOMAP()函数的语法。 grunt> TOMAP(key-expression, value-expression [, key-expression, valueexpression …]) 例 假设我们在HDFS目录/ pig_data /中有一个名为employee_details.txt的文件,内容如下。 employee_details.txt 001,Robin,22,newyork 002,BOB […]

分类
apache pig big data tutorials 教程

Apache Pig tokenize

Pig Latin的TOKENIZE()函数用于在单个元组中分割字符串(包含一组单词),并返回包含分割操作输出的包。 句法 下面给出的是TOKENIZE()函数的语法。 grunt> TOKENIZE(expression [, ‘field_delimiter’]) 作为TOKENIZE()函数的代号,我们可以传递空格[],双引号[“”],逗号[,],括号[()],星号[*]。 例 假设我们在HDFS目录/ pig_data /中有一个名为student_details.txt的文件,如下所示。该文 […]

分类
apache pig big data tutorials 教程

Apache Pig todate

此函数用于根据给定的参数生成DateTime对象。 句法 ToDate()函数的语法可以是以下任意一种: grunt> ToDate(milliseconds) grunt> ToDate(iosstring) grunt> ToDate(userstring, format) grunt> ToDate(userstring, format, timezone) 例 假设在HDFS目录/ pig_data /中有一个名为date.txt的文件。该文件包含特定人员的出生日期详细信息, […]

分类
apache pig big data tutorials 教程

Apache Pig tobag

Pig Latin的TOBAG()函数将一个或多个表达式转换为单个元组。然后将这些元组放在袋子中。 句法 下面给出的是TOBAG()函数的语法。 TOBAG(expression [, expression …]) 例 假设我们在HDFS目录/ pig_data /中有一个名为employee_details.txt的文件,内容如下。 employee_details.txt 001,Robin,22,newyork 002,BOB,23,Kolkata 003,Maya,23,Tokyo 004,Sa […]