Apache Tajo - 自定義函式



Apache Tajo 支援自定義/使用者自定義函式 (UDF)。自定義函式可以用 Python 建立。

自定義函式只是帶有裝飾器 “@output_type(<tajo sql 資料型別>)” 的普通 Python 函式,如下所示 −

@ouput_type(“integer”) 
def sum_py(a, b): 
   return a + b; 

可以透過在 “tajosite.xml” 中新增以下配置來註冊帶有 UDF 的 Python 指令碼。

<property> 
   <name>tajo.function.python.code-dir</name> 
   <value>file:///path/to/script1.py,file:///path/to/script2.py</value> 
</property>

一旦指令碼註冊,請重新啟動叢集,UDF 就會直接在 SQL 查詢中可用,如下所示 −

select sum_py(10, 10) as pyfn; 

Apache Tajo 還支援使用者自定義聚合函式,但不支援使用者自定義視窗函式。

廣告
© . All rights reserved.