- Apache Tajo 教程
- Apache Tajo - 主頁
- Apache Tajo - 介紹
- Apache Tajo - 架構
- Apache Tajo - 安裝
- Apache Tajo - 配置設定
- Apache Tajo - Shell 命令
- Apache Tajo - 資料型別
- Apache Tajo - 運算子
- Apache Tajo - SQL 函式
- Apache Tajo - 數學函式
- Apache Tajo - 字串函式
- Apache Tajo - 日期時間函式
- Apache Tajo - JSON 函式
- Apache Tajo - 資料庫建立
- Apache Tajo - 表管理
- Apache Tajo - SQL 語句
- 聚合和視窗函式
- Apache Tajo - SQL 查詢
- Apache Tajo - 儲存外掛
- 與 HBase 整合
- Apache Tajo - 與 Hive 整合
- OpenStack Swift 整合
- Apache Tajo - JDBC 介面
- Apache Tajo - 自定義函式
- Apache Tajo 有用資源
- Apache Tajo - 快速指南
- Apache Tajo - 有用資源
- Apache Tajo - 討論
Apache Tajo - 自定義函式
Apache Tajo 支援自定義/使用者自定義函式 (UDF)。自定義函式可以用 Python 建立。
自定義函式只是帶有裝飾器 “@output_type(<tajo sql 資料型別>)” 的普通 Python 函式,如下所示 −
@ouput_type(“integer”) def sum_py(a, b): return a + b;
可以透過在 “tajosite.xml” 中新增以下配置來註冊帶有 UDF 的 Python 指令碼。
<property> <name>tajo.function.python.code-dir</name> <value>file:///path/to/script1.py,file:///path/to/script2.py</value> </property>
一旦指令碼註冊,請重新啟動叢集,UDF 就會直接在 SQL 查詢中可用,如下所示 −
select sum_py(10, 10) as pyfn;
Apache Tajo 還支援使用者自定義聚合函式,但不支援使用者自定義視窗函式。
廣告