HTTPS详解
本文轉(zhuǎn)載!
HTTPS 做了什么
HTTPS 協(xié)議提供了三個(gè)關(guān)鍵的指標(biāo)
- 加密(Encryption), HTTPS 通過對數(shù)據(jù)加密來使其免受竊聽者對數(shù)據(jù)的監(jiān)聽,這就意味著當(dāng)用戶在瀏覽網(wǎng)站時(shí),沒有人能夠監(jiān)聽他和網(wǎng)站之間的信息交換,或者跟蹤用戶的活動(dòng),訪問記錄等,從而竊取用戶信息。
- 數(shù)據(jù)一致性(Data integrity),數(shù)據(jù)在傳輸?shù)倪^程中不會(huì)被竊聽者所修改,用戶發(fā)送的數(shù)據(jù)會(huì)完整的傳輸?shù)椒?wù)端,保證用戶發(fā)的是什么,服務(wù)器接收的就是什么。
- 身份認(rèn)證(Authentication),是指確認(rèn)對方的真實(shí)身份,也就是證明你是你(可以比作人臉識別),它可以防止中間人攻擊并建立用戶信任。
有了上面三個(gè)關(guān)鍵指標(biāo)的保證,用戶就可以和服務(wù)器進(jìn)行安全的交換信息了。那么,既然你說了 HTTPS 的種種好處,那么我怎么知道網(wǎng)站是用 HTTPS 的還是 HTTP 的呢?給你兩幅圖應(yīng)該就可以解釋了。
?
?
HTTPS 協(xié)議其實(shí)非常簡單,RFC 文檔很小,只有短短的 7 頁,里面規(guī)定了新的協(xié)議名,默認(rèn)端口號443,至于其他的應(yīng)答模式、報(bào)文結(jié)構(gòu)、請求方法、URI、頭字段、連接管理等等都完全沿用 HTTP,沒有任何新的東西。
也就是說,除了協(xié)議名稱和默認(rèn)端口號外(HTTP 默認(rèn)端口 80),HTTPS 協(xié)議在語法、語義上和 HTTP 一樣,HTTP 有的,HTTPS 也照單全收。那么,HTTPS 如何做到 HTTP 所不能做到的安全性呢?關(guān)鍵在于這個(gè) S 也就是 SSL/TLS 。
什么是 SSL/TLS
認(rèn)識 SSL/TLS
TLS(Transport Layer Security) 是 SSL(Secure Socket Layer) 的后續(xù)版本,它們是用于在互聯(lián)網(wǎng)兩臺(tái)計(jì)算機(jī)之間用于身份驗(yàn)證和加密的一種協(xié)議。
注意:在互聯(lián)網(wǎng)中,很多名稱都可以進(jìn)行互換。我們都知道一些在線業(yè)務(wù)(比如在線支付)最重要的一個(gè)步驟是創(chuàng)建一個(gè)值得信賴的交易環(huán)境,能夠讓客戶安心的進(jìn)行交易,SSL/TLS 就保證了這一點(diǎn),SSL/TLS 通過將稱為 X.509 證書的數(shù)字文檔將網(wǎng)站和公司的實(shí)體信息綁定到加密密鑰來進(jìn)行工作。每一個(gè)密鑰對(key pairs) 都有一個(gè) 私有密鑰(private key) 和 公有密鑰(public key),私有密鑰是獨(dú)有的,一般位于服務(wù)器上,用于解密由公共密鑰加密過的信息;公有密鑰是公有的,與服務(wù)器進(jìn)行交互的每個(gè)人都可以持有公有密鑰,用公鑰加密的信息只能由私有密鑰來解密。
什么是 X.509:X.509 是公開密鑰證書的標(biāo)準(zhǔn)格式,這個(gè)文檔將加密密鑰與(個(gè)人或組織)進(jìn)行安全的關(guān)聯(lián)。X.509 主要應(yīng)用如下
- SSL/TLS 和 HTTPS 用于經(jīng)過身份驗(yàn)證和加密的 Web 瀏覽
- 通過 S/MIME 協(xié)議簽名和加密的電子郵件
- 代碼簽名:它指的是使用數(shù)字證書對軟件應(yīng)用程序進(jìn)行簽名以安全分發(fā)和安裝的過程。
通過使用由知名公共證書頒發(fā)機(jī)構(gòu)(例如http://SSL.com)頒發(fā)的證書對軟件進(jìn)行數(shù)字簽名,開發(fā)人員可以向最終用戶保證他們希望安裝的軟件是由已知且受信任的開發(fā)人員發(fā)布;并且簽名后未被篡改或損害。
- 還可用于文檔簽名
- 還可用于客戶端認(rèn)證
- 政府簽發(fā)的電子身份證(詳見 https://www.ssl.com/article/pki-and-digital-certificates-for-government/)
我們后面還會(huì)討論。
HTTPS 的內(nèi)核是 HTTP
HTTPS 并不是一項(xiàng)新的應(yīng)用層協(xié)議,只是 HTTP 通信接口部分由 SSL 和 TLS 替代而已。通常情況下,HTTP 會(huì)先直接和 TCP 進(jìn)行通信。在使用 SSL 的 HTTPS 后,則會(huì)先演變?yōu)楹?SSL 進(jìn)行通信,然后再由 SSL 和 TCP 進(jìn)行通信。也就是說,HTTPS 就是身披了一層 SSL 的 HTTP。(我都喜歡把騷粉留在最后。。。)
?
?
SSL 是一個(gè)獨(dú)立的協(xié)議,不只有 HTTP 可以使用,其他應(yīng)用層協(xié)議也可以使用,比如 SMTP(電子郵件協(xié)議)、Telnet(遠(yuǎn)程登錄協(xié)議) 等都可以使用。
探究 HTTPS
我說,你起這么牛逼的名字干嘛,還想吹牛批?你 HTTPS 不就抱上了 TLS/SSL 的大腿么,咋這么牛批哄哄的,還想探究 HTTPS,瞎胡鬧,趕緊改成 TLS 是我主,贊美我主。
SSL 即安全套接字層,它在 OSI 七層網(wǎng)絡(luò)模型中處于第五層,SSL 在 1999 年被 IETF(互聯(lián)網(wǎng)工程組)更名為 TLS ,即傳輸安全層,直到現(xiàn)在,TLS 一共出現(xiàn)過三個(gè)版本,1.1、1.2 和 1.3 ,目前最廣泛使用的是 1.2,所以接下來的探討都是基于 TLS 1.2 的版本上的。
TLS 用于兩個(gè)通信應(yīng)用程序之間提供保密性和數(shù)據(jù)完整性。TLS 由記錄協(xié)議、握手協(xié)議、警告協(xié)議、變更密碼規(guī)范協(xié)議、擴(kuò)展協(xié)議等幾個(gè)子協(xié)議組成,綜合使用了對稱加密、非對稱加密、身份認(rèn)證等許多密碼學(xué)前沿技術(shù)(如果你覺得一項(xiàng)技術(shù)很簡單,那你只是沒有學(xué)到位,任何技術(shù)都是有美感的,牛逼的人只是欣賞,并不是貶低)。
說了這么半天,我們還沒有看到 TLS 的命名規(guī)范呢,下面舉一個(gè) TLS 例子來看一下 TLS 的結(jié)構(gòu)(可以參考 https://www.iana.org/assignments/tls-parameters/tls-parameters.xhtml)
ECDHE-ECDSA-AES256-GCM-SHA384這是啥意思呢?我剛開始看也有點(diǎn)懵啊,但其實(shí)是有套路的,因?yàn)?TLS 的密碼套件比較規(guī)范,基本格式就是密鑰交換算法 - 簽名算法 - 對稱加密算法 - 摘要算法組成的一個(gè)密碼串,有時(shí)候還有分組模式,我們先來看一下剛剛是什么意思
使用 ECDHE 進(jìn)行密鑰交換,使用 ECDSA 進(jìn)行簽名和認(rèn)證,然后使用 AES 作為對稱加密算法,密鑰的長度是 256 位,使用 GCM 作為分組模式,最后使用 SHA384 作為摘要算法。
TLS 在根本上使用對稱加密和 非對稱加密 兩種形式。
對稱加密
在了解對稱加密前,我們先來了解一下密碼學(xué)的東西,在密碼學(xué)中,有幾個(gè)概念:明文、密文、加密、解密
- 明文(Plaintext),一般認(rèn)為明文是有意義的字符或者比特集,或者是通過某種公開編碼就能獲得的消息。明文通常用 m 或 p 表示
- 密文(Ciphertext),對明文進(jìn)行某種加密后就變成了密文
- 加密(Encrypt),把原始的信息(明文)轉(zhuǎn)換為密文的信息變換過程
- 解密(Decrypt),把已經(jīng)加密的信息恢復(fù)成明文的過程。
對稱加密(Symmetrical Encryption)顧名思義就是指加密和解密時(shí)使用的密鑰都是同樣的密鑰。只要保證了密鑰的安全性,那么整個(gè)通信過程也就是具有了機(jī)密性。
?
?
TLS 里面有比較多的加密算法可供使用,比如 DES、3DES、AES、ChaCha20、TDEA、Blowfish、RC2、RC4、RC5、IDEA、SKIPJACK 等。目前最常用的是 AES-128, AES-192、AES-256 和 ChaCha20。
DES 的全稱是 Data Encryption Standard(數(shù)據(jù)加密標(biāo)準(zhǔn)) ,它是用于數(shù)字?jǐn)?shù)據(jù)加密的對稱密鑰算法。盡管其 56 位的短密鑰長度使它對于現(xiàn)代應(yīng)用程序來說太不安全了,但它在加密技術(shù)的發(fā)展中具有很大的影響力。
3DES 是從原始數(shù)據(jù)加密標(biāo)準(zhǔn)(DES)衍生過來的加密算法,它在 90 年代后變得很重要,但是后面由于更加高級的算法出現(xiàn),3DES 變得不再重要。
AES-128, AES-192 和 AES-256 都是屬于 AES ,AES 的全稱是Advanced Encryption Standard(高級加密標(biāo)準(zhǔn)),它是 DES 算法的替代者,安全強(qiáng)度很高,性能也很好,是應(yīng)用最廣泛的對稱加密算法。
ChaCha20 是 Google 設(shè)計(jì)的另一種加密算法,密鑰長度固定為 256 位,純軟件運(yùn)行性能要超過 AES,曾經(jīng)在移動(dòng)客戶端上比較流行,但 ARMv8 之后也加入了 AES 硬件優(yōu)化,所以現(xiàn)在不再具有明顯的優(yōu)勢,但仍然算得上是一個(gè)不錯(cuò)算法。
(其他可自行搜索)
加密分組
對稱加密算法還有一個(gè)分組模式 的概念,對于 GCM 分組模式,只有和 AES,CAMELLIA 和 ARIA 搭配使用,而 AES 顯然是最受歡迎和部署最廣泛的選擇,它可以讓算法用固定長度的密鑰加密任意長度的明文。
最早有 ECB、CBC、CFB、OFB 等幾種分組模式,但都陸續(xù)被發(fā)現(xiàn)有安全漏洞,所以現(xiàn)在基本都不怎么用了。最新的分組模式被稱為 AEAD(Authenticated Encryption with Associated Data),在加密的同時(shí)增加了認(rèn)證的功能,常用的是 GCM、CCM 和 Poly1305。
比如 ECDHE_ECDSA_AES128_GCM_SHA256 ,表示的是具有 128 位密鑰, AES256 將表示 256 位密鑰。GCM 表示具有 128 位塊的分組密碼的現(xiàn)代認(rèn)證的關(guān)聯(lián)數(shù)據(jù)加密(AEAD)操作模式。
我們上面談到了對稱加密,對稱加密的加密方和解密方都使用同一個(gè)密鑰,也就是說,加密方必須對原始數(shù)據(jù)進(jìn)行加密,然后再把密鑰交給解密方進(jìn)行解密,然后才能解密數(shù)據(jù),這就會(huì)造成什么問題?這就好比《小兵張嘎》去送信(信已經(jīng)被加密過),但是嘎子還拿著解密的密碼,那嘎子要是在途中被鬼子發(fā)現(xiàn)了,那這信可就是被完全的暴露了。所以,對稱加密存在風(fēng)險(xiǎn)。
非對稱加密
非對稱加密(Asymmetrical Encryption) 也被稱為公鑰加密,相對于對稱加密來說,非對稱加密是一種新的改良加密方式。密鑰通過網(wǎng)絡(luò)傳輸交換,它能夠確保及時(shí)密鑰被攔截,也不會(huì)暴露數(shù)據(jù)信息。非對稱加密中有兩個(gè)密鑰,一個(gè)是公鑰,一個(gè)是私鑰,公鑰進(jìn)行加密,私鑰進(jìn)行解密。公開密鑰可供任何人使用,私鑰只有你自己能夠知道。
使用公鑰加密的文本只能使用私鑰解密,同時(shí),使用私鑰加密的文本也可以使用公鑰解密。公鑰不需要具有安全性,因?yàn)楣€需要在網(wǎng)絡(luò)間進(jìn)行傳輸,非對稱加密可以解決密鑰交換的問題。網(wǎng)站保管私鑰,在網(wǎng)上任意分發(fā)公鑰,你想要登錄網(wǎng)站只要用公鑰加密就行了,密文只能由私鑰持有者才能解密。而黑客因?yàn)闆]有私鑰,所以就無法破解密文。
混合加密
RSA 的運(yùn)算速度非常慢,而 AES 的加密速度比較快,而 TLS 正是使用了這種混合加密方式。在通信剛開始的時(shí)候使用非對稱算法,比如 RSA、ECDHE ,首先解決密鑰交換的問題。然后用隨機(jī)數(shù)產(chǎn)生對稱算法使用的會(huì)話密鑰(session key),再用公鑰加密。對方拿到密文后用私鑰解密,取出會(huì)話密鑰。這樣,雙方就實(shí)現(xiàn)了對稱密鑰的安全交換。
現(xiàn)在我們使用混合加密的方式實(shí)現(xiàn)了機(jī)密性,是不是就能夠安全的傳輸數(shù)據(jù)了呢?還不夠,在機(jī)密性的基礎(chǔ)上還要加上完整性、身份認(rèn)證的特性,才能實(shí)現(xiàn)真正的安全。而實(shí)現(xiàn)完整性的主要手段是摘要算法(Digest Algorithm)
摘要算法
如何實(shí)現(xiàn)完整性呢?在 TLS 中,實(shí)現(xiàn)完整性的手段主要是摘要算法(Digest Algorithm)。摘要算法你不清楚的話,MD5 你應(yīng)該清楚,MD5 的全稱是Message Digest Algorithm 5,它是屬于密碼哈希算法(cryptographic hash algorithm)的一種,MD5 可用于從任意長度的字符串創(chuàng)建 128 位字符串值。盡管 MD5 存在不安全因素,但是仍然沿用至今。MD5 最常用于驗(yàn)證文件的完整性。但是,它還用于其他安全協(xié)議和應(yīng)用程序中,例如 SSH、SSL 和 IPSec。一些應(yīng)用程序通過向明文加鹽值或多次應(yīng)用哈希函數(shù)來增強(qiáng) MD5 算法。
什么是加鹽?在密碼學(xué)中,鹽就是一項(xiàng)隨機(jī)數(shù)據(jù),用作哈希數(shù)據(jù),密碼或密碼的單向函數(shù)的附加輸入。鹽用于保護(hù)存儲(chǔ)中的密碼。例如
什么是單向?就是在說這種算法沒有密鑰可以進(jìn)行解密,只能進(jìn)行單向加密,加密后的數(shù)據(jù)無法解密,不能逆推出原文。
我們再回到摘要算法的討論上來,其實(shí)你可以把摘要算法理解成一種特殊的壓縮算法,它能夠把任意長度的數(shù)據(jù)壓縮成一種固定長度的字符串,這就好像是給數(shù)據(jù)加了一把鎖。
除了常用的 MD5 是加密算法外,SHA-1(Secure Hash Algorithm 1)也是一種常用的加密算法,不過 SHA-1 也是不安全的加密算法,在 TLS 里面被禁止使用。目前 TLS 推薦使用的是 SHA-1 的后繼者:SHA-2。
SHA-2 的全稱是Secure Hash Algorithm 2,它在 2001 年被推出,它在 SHA-1 的基礎(chǔ)上做了重大的修改,SHA-2 系列包含六個(gè)哈希函數(shù),其摘要(哈希值)分別為 224、256、384 或 512 位:SHA-224, SHA-256, SHA-384, SHA-512。分別能夠生成 28 字節(jié)、32 字節(jié)、48 字節(jié)、64 字節(jié)的摘要。
有了 SHA-2 的保護(hù),就能夠?qū)崿F(xiàn)數(shù)據(jù)的完整性,哪怕你在文件中改變一個(gè)標(biāo)點(diǎn)符號,增加一個(gè)空格,生成的文件摘要也會(huì)完全不同,不過 SHA-2 是基于明文的加密方式,還是不夠安全,那應(yīng)該用什么呢?
安全性更高的加密方式是使用 HMAC,在理解什么是 HMAC 前,你需要先知道一下什么是 MAC。
MAC 的全稱是message authentication code,它通過 MAC 算法從消息和密鑰生成,MAC 值允許驗(yàn)證者(也擁有秘密密鑰)檢測到消息內(nèi)容的任何更改,從而保護(hù)了消息的數(shù)據(jù)完整性。
HMAC 是 MAC 更進(jìn)一步的拓展,它是使用 MAC 值 + Hash 值的組合方式,HMAC 的計(jì)算中可以使用任何加密哈希函數(shù),例如 SHA-256 等。
現(xiàn)在我們又解決了完整性的問題,那么就只剩下一個(gè)問題了,那就是認(rèn)證,認(rèn)證怎么做的呢?我們再向服務(wù)器發(fā)送數(shù)據(jù)的過程中,黑客(攻擊者)有可能偽裝成任何一方來竊取信息。它可以偽裝成你,來向服務(wù)器發(fā)送信息,也可以偽裝稱為服務(wù)器,接受你發(fā)送的信息。那么怎么解決這個(gè)問題呢?
認(rèn)證
如何確定你自己的唯一性呢?我們在上面的敘述過程中出現(xiàn)過公鑰加密,私鑰解密的這個(gè)概念。提到的私鑰只有你一個(gè)人所有,能夠辨別唯一性,所以我們可以把順序調(diào)換一下,變成私鑰加密,公鑰解密。使用私鑰再加上摘要算法,就能夠?qū)崿F(xiàn)數(shù)字簽名,從而實(shí)現(xiàn)認(rèn)證。
到現(xiàn)在,綜合使用對稱加密、非對稱加密和摘要算法,我們已經(jīng)實(shí)現(xiàn)了加密、數(shù)據(jù)認(rèn)證、認(rèn)證,那么是不是就安全了呢?非也,這里還存在一個(gè)數(shù)字簽名的認(rèn)證問題。因?yàn)樗借€是是自己的,公鑰是誰都可以發(fā)布,所以必須發(fā)布經(jīng)過認(rèn)證的公鑰,才能解決公鑰的信任問題。
全世界具有認(rèn)證的 CA 就幾家,分別頒布了 DV、OV、EV 三種,區(qū)別在于可信程度。DV 是最低的,只是域名級別的可信,EV 是最高的,經(jīng)過了法律和審計(jì)的嚴(yán)格核查,可以證明網(wǎng)站擁有者的身份(在瀏覽器地址欄會(huì)顯示出公司的名字,例如 Apple、GitHub 的網(wǎng)站)。不同的信任等級的機(jī)構(gòu)一起形成了層級關(guān)系。
通常情況下,數(shù)字證書的申請人將生成由私鑰和公鑰以及證書簽名請求(CSR)組成的密鑰對。CSR是一個(gè)編碼的文本文件,其中包含公鑰和其他將包含在證書中的信息(例如域名,組織,電子郵件地址等)。密鑰對和 CSR生成通常在將要安裝證書的服務(wù)器上完成,并且 CSR 中包含的信息類型取決于證書的驗(yàn)證級別。與公鑰不同,申請人的私鑰是安全的,永遠(yuǎn)不要向 CA(或其他任何人)展示。
生成 CSR 后,申請人將其發(fā)送給 CA,CA 會(huì)驗(yàn)證其包含的信息是否正確,如果正確,則使用頒發(fā)的私鑰對證書進(jìn)行數(shù)字簽名,然后將其發(fā)送給申請人。
HTTP和HTTPS的區(qū)別:
1、HTTPS需要到CA申請證書,HTTP不需要
2、HTTPS密文傳輸,HTTP明文傳輸
3、連接方式不同,HTTPS默認(rèn)使用443端口,HTTP使用80端口
4、HTTPS=HTTP+加密+認(rèn)證+完整性保護(hù),比HTTP安全
?
文章參考:
https://www.ssl.com/faqs/what-is-a-certificate-authority/
https://www.ibm.com/support/knowledgecenter/en/SSFKSJ_7.1.0/com.ibm.mq.doc/sy10670_.htm
https://en.wikipedia.org/wiki/Message_authentication_code
https://en.wikipedia.org/wiki/HMAC
https://www.quora.com/What-does-it-mean-to-add-a-salt-to-a-password-hash
https://hpbn.co/transport-layer-security-tls/
https://www.ssl2buy.com/wiki/symmetric-vs-asymmetric-encryption-what-are-differences
https://crypto.stackexchange.com/questions/26410/whats-the-gcm-sha-256-of-a-tls-protocol
https://en.wikipedia.org/wiki/Advanced_Encryption_Standard
https://www.comparitech.com/blog/information-security/3des-encryption/
《極客時(shí)間-透析 HTTP 協(xié)議》
https://www.tutorialsteacher.com/https/how-ssl-works
https://baike.baidu.com/item/密碼系統(tǒng)/5823651
https://baike.baidu.com/item/對稱加密/2152944?fr=aladdin
https://www.ssl.com/faqs/faq-what-is-ssl/
https://en.wikipedia.org/wiki/HTTPS
https://support.google.com/webmasters/answer/6073543?hl=en
https://www.cloudflare.com/learning/ssl/why-is-http-not-secure/
https://www.cisco.com/c/en/us/products/security/what-is-network-security.html
作者:程序員cxuan
鏈接:https://www.zhihu.com/question/19577317/answer/1157658840
?
總結(jié)
- 上一篇: kafka 出现Java heap sp
- 下一篇: 使用OpenSSL进行RSA加密和解密(