當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

oracle批量update数据_东方国信大数据面试真题

發布時間：2023/12/10 编程问答 35 豆豆

生活随笔收集整理的這篇文章主要介紹了 oracle批量update数据_东方国信大数据面试真题小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

東方國信

學長1

Hadoop工程師筆試題（金融事業部）

1）技術基礎題（共十題，每題5分）

（1）列舉在Linux系統下可以在看系統各項性能的工具（區分CPU、內存、硬盤、網絡等）

（2）HDFS寫入數據的實現機制

（3）Yarn支持的調度器及管理硬件資源種類

（4）如何決定一個job的map和reduce的數量

（5）在map、reduce 迭代模型中，如何實現數據去重

（6）簡單描述HBase的rowkey設計原則

（7）HBase海量歷史數據入庫方案

（8）Hive中內部表與外部表的區別

（9）Hive中UDF、UDAF、UDTF的區別

（10）Spark Job運行架構

2）場景設計題（共二題，每題10分）

假設海量小文件使用HBase進行管理，要求對一批文件進行批量存儲，并支持對單文件進行更新操作，保留歷史版本信息。查詢時可根據批次號獲取該批次的全部文件內容，也可根據文件標識可獲取單文件內容，支持最新版本及所有版本查詢。根據業務場景，設計HBase存儲方案。

學長2

大數據工程師筆試題

1）理論題

（1）HDFS的存儲機制是什么？

（2）mapreduce的工作原理，請舉個例子說明mapreduce是怎么運行的？Combiner的作用？

（3）簡單介紹對Hadoop的理解，包括系統架構和Hadoop整個生態系統，詳細介紹工作中曾用到過的？

（4）對流式計算storm的認識？其與Spark streaming有何區別？項目中應用到storm的應用場景簡介。

2）實踐題

（1）利用Spark或者mapreduce或者hive（要求建表）編寫搜索日志分析：用戶在0點12點對各個APP的搜索量。搜索日志存放路徑為/input/data.txt.文件用豎線分割，第一列為時間字段，第三列為APP名稱。字段名及字段類型可自己定義。

日志內容如下：

00：00：0012982199073774412|[網易新聞]|8|3

00：01：00|0759422001082479|[今日頭條|1|1

13：01：00|2982199073774412|[網易新聞]|1|1

14：30：00|07594220010824791|今日頭條]1|1

（2）現有圖書管理數據庫的三個數據模型如下：

圖書（數據表名：BOOK）

讀者（數據表名：READER）

借閱記錄（數據表名：BORROW LOG）

（1）創建圖書管理庫的圖書、讀者和借閱三個基本表的表結構。請寫出建表語句。（Oracle實現）

（2）找出姓李的讀者姓名（NAME）和所在單位（COMPANY）。（Oracle 實現）

（3）查找“高等教育出版社”的所有圖書名稱（BOOK_NAME）及單價（PRICE），結果按單價降序排序。（Oracle實現）

（4）查找價格介于10元和20元之間的圖書種類(SORT）出版單位（OUTPUT）和單價（PRICE），結果按出版單位（OUTPUT）和單價（PRICE）升序排序。（Oracle 實現）

（5）查找所有借了書的讀者的姓名（NAME）及所在單位（COMPANY）。（Oracle實現）

（6）求”科學出版社”圖書的最高單價、最低單價、平均單價。（Oracle實現）

（7）找出當前至少借閱了2本圖書（大于等于2本）的讀者姓名及其所在單位。（Oracle實現）

（8）考慮到數據安全的需要，需定時將“借閱記錄”中數據進行備份，請使用一條SQL語句，在備份用戶bak下創建與“借閱記錄”表結構完全一致的數據表BORROW_LOG_BAK.井且將“借閱記錄”中現有數據全部復制到BORROW_1.0G_ BAK中。（Oracle實現）

（9）現在需要將原Oracle數據庫中數據遷移至Hive倉庫，請寫出“圖書”在Hive中的建表語句（Hive實現，提示：列分隔符|；數據表數據需要外部導入：分區分別以month＿part、day＿part 命名）

（10）Hive中有表A，現在需要將表A的月分區　201505　中　user＿id為20000的user＿dinner字段更新為bonc8920，其他用戶user＿dinner字段數據不變，請列出更新的方法步驟。（Hive實現，提示：Hlive中無update語法，請通過其他辦法進行數據更新）

7.SQL優化題

（1）SELECT　TAＢ＿NAME　FROM　TABLES　ＷHERE　TAB＿NAME =

（SELECT　TAB＿NAME　FROM　TAB＿COLUMNS　WＨERE　VERSION＝604）AND　DB＿VER=（SELECT　DB_VER　FROM　TAB＿COLＵMNS　ＷHERE　VERSION = 604），

考慮到過多子查詢造成SQL性能下降，請針對上述SQL.語句進行優化，提升執行效率（Oracle實現）

UPDATE　EMP　SET　EMP＿CAT　＝（SELECT　MAX（CATEGORY）FROM　EMP＿CATEGORIES），SAL＿RANGE＝（SELECT　MAX（SAL RANGE）FROM　EMP＿CATEGORIES）WHERE　EMP＿DEPT = 0020，在含有子查詢的SQL語句中，過多對表的查詢會造成SQL性能下降，請針對上述SQL.語句進行優化，提升執行效率（Oracle實現）

EMP表數據量很大，user＿id存在空值，以下語句會造成數據處理結果存儲傾斜，請提供優化策略解決數據傾斜問題。（注：數據傾斜由關聯字段空值引起，Hive實現）

SELECT* FROM　EXP A 　JOIN 　DEPT B　ON A.USER＿ID= B.USER＿ID

（2）Hbase 常用基本命令，創建表，添加記錄，查看記錄，刪除記錄。

文章來源：尚硅谷大數據培訓

總結

以上是生活随笔為你收集整理的oracle批量update数据_东方国信大数据面试真题的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： java推送数据给安卓,java – 如
下一篇： vi编辑器常用命令