protocol buffer没那么难,不信你看这篇
文章目錄
- 簡介
- 定義一個消息
- 類型定義
- 字段的值
- 字段描述符
- 添加注釋
- 嵌套類型
- Map
- 總結
簡介
上一篇文章我們對google的protobuf已經有了一個基本的認識,并且能夠使用相應的工具生成對應的代碼了。但是對于.proto文件的格式和具體支持的類型還不是很清楚。今天本文將會帶大家一探究竟。
注意,本文介紹的協議是proto3版本的。
定義一個消息
protobuf中的主體被稱為是message,可以將其看做是我們在程序中定義的類。我們可以在.proto文件中定義這個message對象,并且為其添加屬性,如下所示:
syntax = "proto3";message SearchRequest {string query = 1;int32 page_number = 2;int32 result_per_page = 3; }上例的第一行指定了.proto文件的協議類型,這里使用的是proto3,也是最新版的協議,如果不指定,默認情況下是proto2。
類型定義
這里我們為SearchRequest對象,定義了三個屬性,其類型分別是String和int32。
String和int32都是簡單類型,protobuf支持的簡單類型如下:
| double | 雙精度浮點類型 | double |
| float | 浮點類型 | float |
| int32 | 整型數字,最好不表示負數 | int |
| int64 | 整型數字,最好不表示負數 | long |
| uint32 | 無符號整數 | int |
| uint64 | 無符號整數 | long |
| sint32 | 帶符號整數 | int |
| sint64 | 帶符號整數 | long |
| fixed32 | 四個字節的整數 | int |
| fixed64 | 8個字節的整數 | long |
| sfixed32 | 4個字節的帶符號整數 | int |
| sfixed64 | 8個字節的帶符號整數 | long |
| bool | 布爾類型 | boolean |
| string | 字符串 | String |
| bytes | 字節 | ByteString |
當然protobuf還支持復雜的組合類型和枚舉類型。
枚舉類型在protobuf中用enum來表示,我們來看一個枚舉類型的定義:
message SearchRequest {string query = 1;int32 page_number = 2;int32 result_per_page = 3;enum Corpus {UNIVERSAL = 0;WEB = 1;IMAGES = 2;LOCAL = 3;NEWS = 4;PRODUCTS = 5;VIDEO = 6;}Corpus corpus = 4; }上面我們定義了一個枚舉類型Corpus,枚舉類型中定義的枚舉值是從0開始的,0也是枚舉類型的默認值。
在枚舉中,還可以定義具有相同value的枚舉類型,但是這樣需要加上allow_alias=true的選項,如下所示:
message MyMessage1 {enum EnumAllowingAlias {option allow_alias = true;UNKNOWN = 0;STARTED = 1;RUNNING = 1;} } message MyMessage2 {enum EnumNotAllowingAlias {UNKNOWN = 0;STARTED = 1;// RUNNING = 1; // Uncommenting this line will cause a compile error inside Google and a warning message outside.} }在枚舉類型中,如果我們后續對某些枚舉類型進行了刪除,那么被刪除的值可能會被后續的用戶使用,這樣就會造成潛在的代碼隱患,為了解決這個問題,枚舉提供了一個reserved的關鍵詞,被這個關鍵詞聲明的枚舉類型,就不會被后續使用,如下所示:
enum Foo {reserved 2, 15, 9 to 11, 40 to max;reserved "FOO", "BAR"; }reserved關鍵字也可以用在message的字段中,表示后續不要使用到這些字段,如下:
message Foo {reserved 2, 15, 9 to 11;reserved "foo", "bar"; }字段的值
我們可以看到,每個message的字段都分配了一個值,每個字段的值在message中都是唯一的,這些值是用來定位在二進制消息格式中的字段位置。所以一旦定義之后,不要隨意修改。
要注意的是值1-15在二進制中使用的1個字節來表示的,值16-2047需要使用2個字節來表示,所以通常將1-15使用在最常見的字段和可能重復的字段,這樣可以節約編碼后的空間。
最小的值是1,最大的值是2的29次方-1,或者536,870,911。這中間從19000-19999是保留數字,不能使用。
當消息被編譯之后,各個字段將會被轉成為對應的類型,并且各個字段類型將會被賦予不同的初始值。
strings的默認值是空字符串,bytes的默認值是空bytes,bools的默認值是false,數字類型的默認值是0,枚舉類型的默認值是枚舉的第一個元素。
字段描述符
每個消息的字段都可以有兩種描述符,第一種叫做singular,表示message中可以有0個或者1個這個字段,這是proto3中默認的定義方式。
第二種叫做repeated,表示這個字段在message中是可以重復的,也就是說它代表的是一個集合。
添加注釋
在proto中的注釋和C++的風格類似,可以使用: // 或者 /* … */ 的風格來注釋,如下所示:
/* 這是一個注釋. */message SearchRequest {string query = 1;int32 page_number = 2; // 頁面的numberint32 result_per_page = 3; // 每頁的結果 }嵌套類型
在一個message中還可以嵌入一個message,如下所示:
message SearchResponse {message Result {string url = 1;string title = 2;repeated string snippets = 3;}repeated Result results = 1; }在上例中,我們在SearchResponse定義了一個Result類型,在java中,實際上可以將其看做是嵌套類。
如果希望在message的定義類之外使用這個內部的message,則可以通過_Parent_._Type_來定義:
message SomeOtherMessage {SearchResponse.Result result = 1; }嵌套類型可以任意嵌套,如下所示:
message Outer { // Level 0message MiddleAA { // Level 1message Inner { // Level 2int64 ival = 1;bool booly = 2;}}message MiddleBB { // Level 1message Inner { // Level 2int32 ival = 1;bool booly = 2;}} }Map
如果想要在proto中定義map,可以這樣寫:
map<key_type, value_type> map_field = N;這里的value_type可以是除map之外的任意類型。注意map不能是repeated。
map中的數據的順序是不定的,我們不能依賴存入的map順序來判斷其取出的順序。
總結
以上就是proto3中定義聲明文件該注意的事項了,大家在使用protobuf的時候要多加注意。
本文已收錄于 http://www.flydean.com/02-protocolbuf-detail/
最通俗的解讀,最深刻的干貨,最簡潔的教程,眾多你不知道的小技巧等你來發現!
歡迎關注我的公眾號:「程序那些事」,懂技術,更懂你!
總結
以上是生活随笔為你收集整理的protocol buffer没那么难,不信你看这篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在java程序中使用protobuf
- 下一篇: protocol buffer的高效编码