日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > linux >内容正文

linux

linux 2行数据为一条记录 该如何操作这一条记录_Linux 日志文件系统原来是这样工作的...

發(fā)布時(shí)間:2023/12/10 linux 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 linux 2行数据为一条记录 该如何操作这一条记录_Linux 日志文件系统原来是这样工作的... 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文件系統(tǒng)要解決的一個(gè)關(guān)鍵問題是怎樣防止掉電或系統(tǒng)崩潰造成數(shù)據(jù)損壞,在此類意外事件中,導(dǎo)致文件系統(tǒng)損壞的根本原因在于寫文件不是原子操作,因?yàn)閷懳募婕暗牟粌H僅是用戶數(shù)據(jù),還涉及元數(shù)據(jù)(metadata)包括 Superblock、inode bitmap、inode、data block bitmap等,所以寫操作無法一步完成,如果其中任何一個(gè)步驟被打斷,就會(huì)造成數(shù)據(jù)的不一致或損壞。

舉一個(gè)簡化的例子,我們對(duì)一個(gè)文件進(jìn)行寫操作,要涉及以下步驟:

  • 從data block bitmap中分配一個(gè)數(shù)據(jù)塊;

  • 在inode中添加指向數(shù)據(jù)塊的指針;

  • 把用戶數(shù)據(jù)寫入數(shù)據(jù)塊。

    • 如果步驟2完成了,3未完成,結(jié)果是數(shù)據(jù)損壞,因?yàn)樵撐募J(rèn)為數(shù)據(jù)塊是自己的,但里面的數(shù)據(jù)其實(shí)是垃圾;

    • 如果步驟2完成了,1未完成,結(jié)果是元數(shù)據(jù)不一致,因?yàn)樵撐募呀?jīng)把數(shù)據(jù)塊據(jù)為己有,然而文件系統(tǒng)卻還認(rèn)為該數(shù)據(jù)塊未分配、隨后又可能會(huì)把該數(shù)據(jù)塊分配給別的文件、造成數(shù)據(jù)覆蓋;

    • 如果步驟1完成了、2未完成,結(jié)果就是文件系統(tǒng)分配了一個(gè)數(shù)據(jù)塊,但是沒有任何文件用到這個(gè)數(shù)據(jù)塊,造成空間浪費(fèi);

    • 如果步驟3完成了,2未完成,結(jié)果就是用戶數(shù)據(jù)寫入了硬盤數(shù)據(jù)塊中,但白寫了,因?yàn)槲募恢肋@個(gè)數(shù)據(jù)塊是自己的。

    日志文件系統(tǒng)(Journal File System)就是為解決上述問題而誕生的。

    它的原理是在進(jìn)行寫操作之前,把即將進(jìn)行的各個(gè)步驟(稱為transaction)事先記錄下來,保存在文件系統(tǒng)上單獨(dú)開辟的一塊空間上,這就是所謂的日志(journal),也被稱為write-ahead logging,日志保存成功之后才進(jìn)行真正的寫操作、把文件系統(tǒng)的元數(shù)據(jù)和用戶數(shù)據(jù)寫進(jìn)硬盤(稱為checkpoint),這樣萬一寫操作的過程中掉電,下次掛載文件系統(tǒng)之前把保存好的日志重新執(zhí)行一遍就行了(術(shù)語叫做replay),避免了前述的數(shù)據(jù)損壞場(chǎng)景。

    有人問如果保存日志的過程中掉電怎么辦?最初始的想法是把一條日志的數(shù)據(jù)一次性寫入硬盤,相當(dāng)于一個(gè)原子操作,然而這并不可行,因?yàn)橛脖P通常以512字節(jié)為單位進(jìn)行操作,日志數(shù)據(jù)一超過512字節(jié)就不可能一次性寫入了。所以實(shí)際上是這么做的:給每一條日志設(shè)置一個(gè)結(jié)束符,只有在日志寫入成功之后才寫結(jié)束符,如果一條日志沒有對(duì)應(yīng)的結(jié)束符就會(huì)被視為無效日志,直接丟棄,這樣就保證了日志里的數(shù)據(jù)是完整的。

    一條日志在它對(duì)應(yīng)的寫操作完成之后就沒用了,占用的硬盤空間就可以釋放。保存日志的硬盤空間大小是有限的,被循環(huán)使用,所以日志也被稱為circular log。

    至此可以總結(jié)一下日志文件系統(tǒng)的工作步驟了:

  • Journal write : 把transaction寫入日志中;

  • Journal commit : 在一條日志保存好之后,寫入結(jié)束符;

  • Checkpoint : 進(jìn)行真正的寫操作,把元數(shù)據(jù)(metadata)和用戶數(shù)據(jù)(user data)寫入文件系統(tǒng);

  • Free : 回收日志占用的硬盤空間。

  • 以上方式把用戶數(shù)據(jù)(user data)也記錄在日志中,稱為Data Journaling,Linux EXT3文件系統(tǒng)就支持這種方式,這種方式存在效率問題:

    就是每一個(gè)寫操作涉及的元數(shù)據(jù)(metadata)和用戶數(shù)據(jù)(user data)實(shí)際上都要在硬盤上寫兩次,一次寫在日志里,一次寫在文件系統(tǒng)上。元數(shù)據(jù)倒也罷了,用戶數(shù)據(jù)通常比較大,拷貝幾個(gè)GB的電影文件也要乘以2實(shí)在是降低了效率。

    一個(gè)更高效的方式是Metadata Journaling,不把用戶數(shù)據(jù)(user data)記錄在日志中,它防止數(shù)據(jù)損壞的方法是先寫入用戶數(shù)據(jù)(user data)、再寫日志,即在上述”Journal write”之前先寫用戶數(shù)據(jù),這樣就保證了只要日志是有效的,那么它對(duì)應(yīng)的用戶數(shù)據(jù)也是有效的,一旦發(fā)生掉電故障,最壞的結(jié)果也就是最后一條日志沒記完,那么對(duì)應(yīng)的用戶數(shù)據(jù)也會(huì)丟,效果與Data Journaling丟棄日志一樣,重要的是文件系統(tǒng)的一致性和完整性是有保證的。

    Metadata Journaling又叫Ordered Journaling,大多數(shù)文件系統(tǒng)都采用這種方式。像Linux EXT3文件系統(tǒng)也是可以選擇Data Journaling還是Ordered Journaling的。

    參考資料:
    Crash Consistency: FSCK and Journaling

    來源:http://linuxperf.com/?p=153

    提高軟件的可靠性和效率,是每個(gè) IT 人的使命

    GOPS 2019 · 深圳站,4.12-13,不要錯(cuò)過軟件工程的第三次革命

    點(diǎn)擊,訪問大會(huì)官網(wǎng)

    總結(jié)

    以上是生活随笔為你收集整理的linux 2行数据为一条记录 该如何操作这一条记录_Linux 日志文件系统原来是这样工作的...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。