日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

hive源代碼解析之一hive主函數入口

系統 4381 0

hive源代碼解析之一hive主函數入口

hive其實做的就是解析一條sql然后形成到mapreduce任務,就是一個代碼解釋器。hive源代碼本身就可以分為ql/metasotre/service/serde 這幾塊;其中

? 對于Hive來說,ql是整個Hive最最核心的一個模塊,Hive主要的功能都集中在這樣一個模塊中,即 org.apache.hadoop.hive.ql.*,其中最重要的幾個模塊:

  • parse:語法解析器和語義分析器,將SQL轉化為執行計劃。
  • optimizer:優化器,包括執行計劃Operator圖的改寫(邏輯優化)和Task圖的改寫(物理優化)
  • exec:執行器,作業提交和執行相關。
  • udf:Hive內置的用戶自定義函數,包括操作符加、減、乘、除、與、或、非,常用數學操作(sin、cos等)、字符串操作(substr、instr)、聚合操作(count、sum、avg等)等。

?

?

?

?

?

? ? ? 無論使用CLI、Thrift Server、JDBC還是自定義的提交工具,最終的HQL都會傳給Driver實例,執行Driver.run()方法。從這種設計也可以看出,如果您要開發一套自定義的Hive作業提交工具,最好的方式是引用Driver實例,調用相關方法進行開發。
? ? ? 而Driver.run()方法,獲得了這樣一個HQL,則會執行兩個重要的步驟:編譯和執行,即Driver.complie()和Driver.execute()。對于Driver.comile()來說,其實就是調用parse和optimizer包中的相關模塊,執行語法解析、語義分析、優化(回想一下大學時的編譯原理,編譯的過程是不是語法分析、語法解析、語義分析);對于Driver.run()來說,其實就是調用exec包中的相關模塊,將解析后的執行計劃執行,如果解析后的結果是一個查詢計劃,那么通常的作法就是提交一系列的MapReduce作業。

以查詢的執行為例,整個Hive的流程是非常簡單的一條直線,由上到下進行。

hive源代碼解析之一hive主函數入口

?

對于main函數,其中主要做了三件事情:

(1)初始化各種配置和參數;

(2)循環執行解析執行各種命令;

?

?

?

hive源代碼解析之一hive主函數入口


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 巴林右旗| 烟台市| 瑞金市| 汾西县| 南木林县| 肇庆市| 泸水县| 当雄县| 汾阳市| 雷山县| 池州市| 竹北市| 那曲县| 巨鹿县| 罗山县| 宜川县| 隆尧县| 冷水江市| 扶风县| 康平县| 赣州市| 星子县| 章丘市| 汉寿县| 诸城市| 万年县| 义乌市| 哈尔滨市| 汉沽区| 竹北市| 五指山市| 岚皋县| 阳朔县| 汨罗市| 聊城市| 双鸭山市| 宁蒗| 独山县| 元氏县| 双峰县| 清水县|