日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

oracle批量update数据_东方国信大数据面试真题

發布時間:2023/12/10 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 oracle批量update数据_东方国信大数据面试真题 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

東方國信

學長1

Hadoop工程師筆試題(金融事業部)

1)技術基礎題(共十題,每題5分)

(1)列舉在Linux系統下可以在看系統各項性能的工具(區分CPU、內存、硬盤、網絡等)

(2)HDFS寫入數據的實現機制

(3)Yarn支持的調度器及管理硬件資源種類

(4)如何決定一個job的map和reduce的數量

(5)在map、reduce 迭代模型中,如何實現數據去重

(6)簡單描述HBase的rowkey設計原則

(7)HBase海量歷史數據入庫方案

(8)Hive中內部表與外部表的區別

(9)Hive中UDF、UDAF、UDTF的區別

(10)Spark Job運行架構

2)場景設計題(共二題,每題10分)

假設海量小文件使用HBase進行管理,要求對一批文件進行批量存儲,并支持對單文件進行更新操作,保留歷史版本信息。查詢時可根據批次號獲取該批次的全部文件內容,也可根據文件標識可獲取單文件內容,支持最新版本及所有版本查詢。根據業務場景,設計HBase存儲方案。

學長2

大數據工程師筆試題

1)理論題

(1)HDFS的存儲機制是什么?

(2)mapreduce的工作原理,請舉個例子說明mapreduce是怎么運行的?Combiner的作用?

(3)簡單介紹對Hadoop的理解,包括系統架構和Hadoop整個生態系統,詳細介紹工作中曾用到過的?

(4)對流式計算storm的認識?其與Spark streaming有何區別?項目中應用到storm的應用場景簡介。

2)實踐題

(1)利用Spark或者mapreduce或者hive(要求建表)編寫搜索日志分析:用戶在0點12點對各個APP的搜索量。搜索日志存放路徑為/input/data.txt.文件用豎線分割,第一列為時間字段,第三列為APP名稱。字段名及字段類型可自己定義。

日志內容如下:

00:00:0012982199073774412|[網易新聞]|8|3

00:01:00|0759422001082479|[今日頭條|1|1

13:01:00|2982199073774412|[網易新聞]|1|1

14:30:00|07594220010824791|今日頭條]1|1

(2)現有圖書管理數據庫的三個數據模型如下:

圖書(數據表名:BOOK)

讀者(數據表名:READER)

借閱記錄(數據表名:BORROW LOG)

(1)創建圖書管理庫的圖書、讀者和借閱三個基本表的表結構。請寫出建表語句。(Oracle實現)

(2)找出姓李的讀者姓名(NAME)和所在單位(COMPANY)。(Oracle 實現)

(3)查找“高等教育出版社”的所有圖書名稱(BOOK_NAME)及單價(PRICE),結果按單價降序排序。(Oracle實現)

(4)查找價格介于10元和20元之間的圖書種類(SORT)出版單位(OUTPUT)和單價(PRICE),結果按出版單位(OUTPUT)和單價(PRICE)升序排序。(Oracle 實現)

(5)查找所有借了書的讀者的姓名(NAME)及所在單位(COMPANY)。(Oracle實現)

(6)求”科學出版社”圖書的最高單價、最低單價、平均單價。(Oracle實現)

(7)找出當前至少借閱了2本圖書(大于等于2本)的讀者姓名及其所在單位。(Oracle實現)

(8)考慮到數據安全的需要,需定時將“借閱記錄”中數據進行備份,請使用一條SQL語句,在備份用戶bak下創建與“借閱記錄”表結構完全一致的數據表BORROW_LOG_BAK.井且將“借閱記錄”中現有數據全部復制到BORROW_1.0G_ BAK中。(Oracle實現)

(9)現在需要將原Oracle數據庫中數據遷移至Hive倉庫,請寫出“圖書”在Hive中的建表語句(Hive實現,提示:列分隔符|;數據表數據需要外部導入:分區分別以month_part、day_part 命名)

(10)Hive中有表A,現在需要將表A的月分區 201505 中 user_id為20000的user_dinner字段更新為bonc8920,其他用戶user_dinner字段數據不變,請列出更新的方法步驟。(Hive實現,提示:Hlive中無update語法,請通過其他辦法進行數據更新)

7.SQL優化題

(1)SELECT TAB_NAME FROM TABLES WHERE TAB_NAME =

(SELECT TAB_NAME FROM TAB_COLUMNS WHERE VERSION=604)AND DB_VER=(SELECT DB_VER FROM TAB_COLUMNS WHERE VERSION = 604),

考慮到過多子查詢造成SQL性能下降,請針對上述SQL.語句進行優化,提升執行效率(Oracle實現)

UPDATE EMP SET EMP_CAT =(SELECT MAX(CATEGORY)FROM EMP_CATEGORIES),SAL_RANGE=(SELECT MAX(SAL RANGE)FROM EMP_CATEGORIES)WHERE EMP_DEPT = 0020,在含有子查詢的SQL語句中,過多對表的查詢會造成SQL性能下降,請針對上述SQL.語句進行優化,提升執行效率(Oracle實現)

EMP表數據量很大,user_id存在空值,以下語句會造成數據處理結果存儲傾斜,請提供優化策略解決數據傾斜問題。(注:數據傾斜由關聯字段空值引起,Hive實現)

SELECT* FROM EXP A  JOIN  DEPT B ON A.USER_ID= B.USER_ID

(2)Hbase 常用基本命令,創建表,添加記錄,查看記錄,刪除記錄。

文章來源:尚硅谷大數據培訓

總結

以上是生活随笔為你收集整理的oracle批量update数据_东方国信大数据面试真题的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。