sqoop数据倾斜_北京卓越讯通大数据岗位面试题分享
北京卓越訊通面試題
學(xué)長(zhǎng)1
1)筆試
(1)JAVA支持的數(shù)據(jù)類型有哪些?什么是自動(dòng)拆裝箱?
(2)AtomicInteger和Volatile等線程安全操作的關(guān)鍵字的理解個(gè)使用
(3)創(chuàng)建線程有幾種不同的方式?你喜歡哪一種?為什么?啟動(dòng)線程調(diào)用什么方法?
(4)什么是死鎖(deadlock),如何確保N個(gè)線程可以訪問(wèn)N個(gè)資源同時(shí)又不導(dǎo)致死鎖?
(5)JAVA中的HashMap的工作原理是什么?
(6)GC算法有哪些、垃圾回收器有哪些、如何調(diào)優(yōu)JVM?
(7)JAVA中堆和棧有什么區(qū)別?
(8)Spring有哪些不同類型的IOC(依賴注入)方式?
(9)判斷下列表達(dá)式是否相等
String a = “abc”;String b = “abc”;String c = new String(“abc”);String d = “ab” + “c”;(10)常用的spring mvc 注解有哪些?
(11)Spring 框架中的單例bean是線程安全的嗎?為什么?
(12)Mysql單表數(shù)據(jù)量過(guò)大可以采取什么措施進(jìn)行性能調(diào)優(yōu)?
(13)請(qǐng)寫出二叉樹(shù)的遍歷算法
(14)寫出一個(gè)單例模式
2)面試題1
(1)pv量,數(shù)據(jù)量,集群規(guī)模
(2)ES分片
(3)Spark Streaming 特點(diǎn)
(4)項(xiàng)目組件的選擇,為什么用spark streaming 不用storm
(5) ALS模型參數(shù)調(diào)優(yōu)
學(xué)長(zhǎng)2
(1)做大數(shù)據(jù)多久?
(2)用過(guò)ES、OZ嗎
(3)ES集群多大?配置怎么樣?服務(wù)器配置?數(shù)據(jù)量?處理速度?ES做過(guò)什么優(yōu)化?主要負(fù)責(zé)哪個(gè)模塊?項(xiàng)目的架構(gòu)和工作流?
(4)你們的Flume怎么做數(shù)據(jù)監(jiān)聽(tīng)?有沒(méi)有做ETL?
(5)有沒(méi)有自己寫過(guò)UDF函數(shù)?寫的是什么UDF函數(shù) 功能?
(6) HiveSQL 轉(zhuǎn)MapReduce join 實(shí)現(xiàn)怎么處理join關(guān)系。寫程序,怎么實(shí)現(xiàn)兩個(gè)表join
(7)數(shù)據(jù)分析有沒(méi)有用過(guò)算法?
(8)在項(xiàng)目中主要的工作是什么
(9)整個(gè)工作流,架構(gòu)的設(shè)計(jì),集群搭建 ETL 數(shù)據(jù)展示能否獨(dú)立完成
(10)協(xié)同過(guò)濾、隨機(jī)森林、能不能靠自己經(jīng)驗(yàn)完成?
(11)項(xiàng)目中遇到的問(wèn)題 特別的 怎么解決 哪個(gè)Bug 印象最深的部分
(12) wordCount 機(jī)制
(13)MapReduce怎么解決數(shù)據(jù)均衡問(wèn)題 如何確定分區(qū)號(hào)
(14)提升多少效率 ?數(shù)據(jù)傾斜使用隨機(jī)數(shù) + key打散原有的key
(15)項(xiàng)目中使用Hive的作用?建的是外表?
(16)有沒(méi)有試過(guò)OZ調(diào)度Sqoop
(17)集群的監(jiān)控用的什么
(18)有沒(méi)有用過(guò)HDP CDH
(19)有沒(méi)有使用OZ調(diào)度hadoop任務(wù)
學(xué)長(zhǎng)3
(1)公司的集群架構(gòu),每臺(tái)部署了什么東西
(2)介紹離線數(shù)倉(cāng)的架構(gòu)
(3)HDFS讀寫流程
(4)都做了哪些需求,最難的是哪個(gè)需求
(5)離線數(shù)倉(cāng),都有什么進(jìn)程
(6)HQL常用的函數(shù),HQL調(diào)優(yōu)
(7)SparkStreaming集群架構(gòu)
(8)數(shù)據(jù)洪峰怎么解決
(9)最難的是哪個(gè)需求,怎么做的
(10)怎么優(yōu)化的,遇到過(guò)什么故障,怎么解決的
(11)用什么采集數(shù)據(jù)庫(kù)的,遇到過(guò)哪些問(wèn)題
(12)為什么要用Flink
(13)做過(guò)哪些需求,哪個(gè)最有難度
(14)Flink項(xiàng)目遇到過(guò)什么難題,怎么解決的
(15)延遲大約多少
(16)FlinkSQL了解嗎?
(17)ES用過(guò)嗎,架構(gòu)
(18)ES規(guī)模,文件存儲(chǔ)機(jī)制,設(shè)置幾個(gè)副本
(19)Flink需求,都實(shí)現(xiàn)精確一致性了嗎?怎么實(shí)現(xiàn)的,有沒(méi)有什么漏洞
(20)Phoenix二級(jí)索引用法,原理
(21)某張表,分庫(kù)存儲(chǔ)的,怎么采集?可能會(huì)遇到什么問(wèn)題,怎么解決?
(22)哪里用過(guò)Redis,為什么要用Redis
與50位技術(shù)專家面對(duì)面20年技術(shù)見(jiàn)證,附贈(zèng)技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的sqoop数据倾斜_北京卓越讯通大数据岗位面试题分享的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: QT QNetworkInterface
- 下一篇: tcpip路由技术卷一_减少与开发的撕战