数据库相关的论文笔记
db-readings
數據庫相關的論文筆記
分布式理論-自問自答
- GFS閱讀問題
為什么存儲三個副本?而不是兩個或者四個?
Chunk的大小為何選擇64MB?這個選擇主要基于哪些考慮?
GFS主要支持append,overwrite操作比較少。為什么這樣設計?如何基于一個只支持Append操作的文件系統構建分布式表格系統Bigtable?
為什么要將數據流和控制流分開?如果不分開,如何實現Append流程?
GFS有時會出現重復記錄或者padding,為什么?
Lease是什么?在GFS起什么作用?它與heartbeat有何區別?
GFS append過程中如果Secondary出現故障,如何處理?如果Primary出現故障,如何處理?
GFS Master需要存儲哪些信息?Master數據結構如何設計?
假設服務一千萬個文件,每個文件1GB,Master中存儲的元數據大概占用多少內存?
Master如何實現高可用性?負載的影響因素有哪些?如何計算一臺機器的load值?
Master新建chunk時如何選擇ChunkServer?如果新機器上線,load值特別低,是否需要有些特殊考慮?
如果某臺ChunkServer報廢,GFS如何處理?
如果ChunkServer下線后過一會重新上線,GFS如何處理?
如何實現分布式文件系統的快照操作?
ChunkServer數據結構如何設計?
磁盤可能出現“位翻轉”錯誤,ChunkServer如何應對?
ChunkServer重啟后可能有一些過期的chunk,Master如何能夠發現?
- MapReduce閱讀問題
MapReduce和MPP架構的主要區別在哪里?
如何采用MapReduce實現分布式排序?需要考慮什么問題?
如何設計Map Worker存儲中間結果的數據結構?
Reduce Worker執行過程中如果數據量超過內存怎么處理?
Master數據結構如何設計?
如何實現Map任務本地化?
Master如何切分任務?
為什么要有backup task?
- Bigtable閱讀問題
GFS可能出現重復記錄或者padding,Bigtable如何處理這種情況使得對外提供強一致性模型?
為什么Bigtable設計成Root、Meta、User三級結構,而不是兩級或者四級結構?
讀取某一行用戶數據,最多需要幾次請求?分別是什么?
如何保證同一個tablet不會被多臺機器同時服務?
Tablet在內存中的數據結構如何設計?
如何設計SSTable的存儲格式?
minor、merging、major這三種compaction有什么區別?
Tablet Server的緩存如何實現?
如果tablet出現故障,需要將服務遷移到其它機器,這個過程需要排序操作日志。如何實現?
如何使得tablet遷移過程停服務時間盡量短?
tablet分裂的流程是怎樣的?
tablet合并的流程是怎樣的?
分布式 理論/工程實現
- 分布式系統原理介紹
- 分布式系統工程實踐
轉載于:https://www.cnblogs.com/weloveshare/p/8727194.html
總結
以上是生活随笔為你收集整理的数据库相关的论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2018第九届蓝桥杯省赛真题 C语言B组
- 下一篇: 原生JS封装时间运动函数