Hive中實現自訂函數UDF詳細過程

來源:互聯網
上載者:User

Hive的UDF,其實很類似Mysql之類的自訂函數

不過它需要用java來編寫,而不是用傳統的SQL來完成

實現一個UDF的步驟如下:

  1. 實現一個Java Class,繼承自UDF
  2. 打成jar包,並加入到Hive的ClassPath中
  3. 產生自訂函數,執行select
  4. 刪除剛才建立的臨時函數

下面這個UDF,是我給hive的array增加的一個函數

用來判斷array中是否包含某個值,hive的標準函數中並沒有此功能函數

12345678910111213141516171819202122232425262728293031323334
package com.sohu.hadoop.hive.udf;import java.util.*;import org.apache.hadoop.hive.ql.exec.UDF;import org.apache.hadoop.io.Text;import org.apache.hadoop.io.BooleanWritable;import org.apache.hadoop.io.Text; public final class ArrayContains extends UDF {   public BooleanWritable evaluate(ArrayList<String> arr,Text ele)    {        BooleanWritable rtn = new BooleanWritable(false);        if (arr == null || arr.size() < 1)        {            return rtn;        }        try {            String cstr = ele.toString();               for (String str : arr)            {                if (str.equals(cstr))                {                    rtn = new BooleanWritable(true);                    break;                }            }         } catch (Exception e) {            e.printStackTrace();        }         return rtn;    }}

然後執行編譯打包:

javac -classpath /opt/hadoop_client/hadoop/hadoop-0.20.2+228-core.jar:/opt/hadoop_client/hive/lib/hive-exec-0.5.0.jar src/com/sohu/hadoop/hive/udf/ArrayContains.java -d build
jar -cvf hadooop-mc-udf.jar -C build .

最後執行Hive QL查詢:

hive -e "add jar /opt/ysz/udf/hadooop-mc-udf.jar;drop temporary function array_contains;create temporary function array_contains as 'com.sohu.hadoop.hive.udf.ArrayContains';select suv,channelid from pvlog_pre where array_contains(channelid,'2')"

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.