Apache Pig - RANDOM() 函式



RANDOM() 函式用於獲取一個偽隨機數(double 型別),該數大於等於 0.0 且小於 1.0。

grunt> RANDOM()

示例

假設在 HDFS 目錄 /pig_data/ 中有一個名為 math.txt 的檔案。此檔案包含如下所示的整數和浮點值。

math.txt

5 
16 
9 
2.5 
5.9 
3.1 

並且,我們已使用名為 math_data 的關係將此檔案載入到 Pig 中,如下所示。

grunt> math_data = LOAD 'hdfs://:9000/pig_data/math.txt' USING PigStorage(',')
   as (data:float);

現在,讓我們使用 RANDOM() 函式生成 math.txt 檔案內容的隨機值,如下所示。

grunt> random_data = foreach math_data generate (data), RANDOM();

上述語句將結果儲存在名為 random_data 的關係中。使用 Dump 運算子驗證關係的內容,如下所示。

grunt> Dump random_data;
  
(5.0,0.6842057767279982) 
(16.0,0.9725172591786139) 
(9.0,0.4159326414649489) 
(2.5,0.30962777780713147) 
(5.9,0.705213727551145) 
(3.1,0.24247708413861724)
apache_pig_math_functions.htm
廣告
© . All rights reserved.