golang 接口类型 interface 简介使用
1. Go 語言與鴨子類型的關系
先直接來看維基百科里的定義:
If it looks like a duck, swims like a duck, and quacks like a duck, then it probably is a duck.
翻譯過來就是:如果某個東西長得像鴨子,像鴨子一樣游泳,像鴨子一樣嘎嘎叫,那它就可以被看成是一只鴨子。
Duck Typing,鴨子類型,是動態編程語言的一種對象推斷策略,它更關注對象能如何被使用,而不是對象的類型本身。Go 語言作為一門靜態語言,它通過通過接口的方式完美支持鴨子類型。
例如,在動態語言 python 中,定義一個這樣的函數:
def hello_world(coder):coder.say_hello()當調用此函數的時候,可以傳入任意類型,只要它實現了?say_hello()?函數就可以。如果沒有實現,運行過程中會出現錯誤。
而在靜態語言如 Java, C++ 中,必須要顯示地聲明實現了某個接口,之后,才能用在任何需要這個接口的地方。如果你在程序中調用?hello_world?函數,卻傳入了一個根本就沒有實現?say_hello()?的類型,那在編譯階段就不會通過。這也是靜態語言比動態語言更安全的原因。
動態語言和靜態語言的差別在此就有所體現。靜態語言在編譯期間就能發現類型不匹配的錯誤,不像動態語言,必須要運行到那一行代碼才會報錯。插一句,這也是我不喜歡用?python?的一個原因。當然,靜態語言要求程序員在編碼階段就要按照規定來編寫程序,為每個變量規定數據類型,這在某種程度上,加大了工作量,也加長了代碼量。動態語言則沒有這些要求,可以讓人更專注在業務上,代碼也更短,寫起來更快,這一點,寫 python 的同學比較清楚。
Go 語言作為一門現代靜態語言,是有后發優勢的。它引入了動態語言的便利,同時又會進行靜態語言的類型檢查,寫起來是非常 Happy 的。Go 采用了折中的做法:不要求類型顯示地聲明實現了某個接口,只要實現了相關的方法即可,編譯器就能檢測到。
來看個例子:
先定義一個接口,和使用此接口作為參數的函數:
type IGreeting interface {sayHello() }func sayHello(i IGreeting) {i.sayHello() }再來定義兩個結構體:
type Go struct {} func (g Go) sayHello() {fmt.Println("Hi, I am GO!") }type PHP struct {} func (p PHP) sayHello() {fmt.Println("Hi, I am PHP!") }最后,在 main 函數里調用 sayHello() 函數:
func main() {golang := Go{}php := PHP{}sayHello(golang)sayHello(php) }程序輸出:
Hi, I am GO! Hi, I am PHP!在 main 函數中,調用?sayHello() 函數時,傳入了?golang, php?對象,它們并沒有顯式地聲明實現了 IGreeting 類型,只是實現了接口所規定的 sayHello() 函數。實際上,編譯器在調用 sayHello() 函數時,會隱式地將?golang, php?對象轉換成 IGreeting 類型,這也是靜態語言的類型檢查功能。
順帶再提一下動態語言的特點:
變量綁定的類型是不確定的,在運行期間才能確定
函數和方法可以接收任何類型的參數,且調用時不檢查參數類型
不需要實現接口
總結一下,鴨子類型是一種動態語言的風格,在這種風格中,一個對象有效的語義,不是由繼承自特定的類或實現特定的接口,而是由它”當前方法和屬性的集合”決定。Go 作為一種靜態語言,通過接口實現了?鴨子類型,實際上是 Go 的編譯器在其中作了隱匿的轉換工作。
2. 值接收者和指針接收者的區別
方法
方法能給用戶自定義的類型添加新的行為。它和函數的區別在于方法有一個接收者,給一個函數添加一個接收者,那么它就變成了方法。接收者可以是值接收者,也可以是指針接收者。
在調用方法的時候,值類型既可以調用值接收者的方法,也可以調用指針接收者的方法;指針類型既可以調用指針接收者的方法,也可以調用值接收者的方法。
也就是說,不管方法的接收者是什么類型,該類型的值和指針都可以調用,不必嚴格符合接收者的類型。
來看個例子:
package mainimport "fmt"type Person struct {age int }func (p Person) howOld() int {return p.age }func (p *Person) growUp() {p.age += 1 }func main() {// qcrao 是值類型qcrao := Person{age: 18}// 值類型 調用接收者也是值類型的方法fmt.Println(qcrao.howOld())// 值類型 調用接收者是指針類型的方法qcrao.growUp()fmt.Println(qcrao.howOld())// ----------------------// stefno 是指針類型stefno := &Person{age: 100}// 指針類型 調用接收者是值類型的方法fmt.Println(stefno.howOld())// 指針類型 調用接收者也是指針類型的方法stefno.growUp()fmt.Println(stefno.howOld()) }上例子的輸出結果是:
18 19 100 101調用了?growUp?函數后,不管調用者是值類型還是指針類型,它的?Age?值都改變了。
實際上,當類型和方法的接收者類型不同時,其實是編譯器在背后做了一些工作,用一個表格來呈現:
| 值類型調用者 | 方法會使用調用者的一個副本,類似于“傳值” | 使用值的引用來調用方法,上例中,qcrao.growUp()?實際上是?(&qcrao).growUp() |
| 指針類型調用者 | 指針被解引用為值,上例中,stefno.howOld()?實際上是?(*stefno).howOld() | 實際上也是“傳值”,方法里的操作會影響到調用者,類似于指針傳參,拷貝了一份指針 |
值接收者和指針接收者
前面說過,不管接收者類型是值類型還是指針類型,都可以通過值類型或指針類型調用,這里面實際上通過語法糖起作用的。
先說結論:實現了接收者是值類型的方法,相當于自動實現了接收者是指針類型的方法;而實現了接收者是指針類型的方法,不會自動生成對應接收者是值類型的方法。
來看一個例子,就會完全明白:
package mainimport "fmt"type coder interface {code()debug() }type Gopher struct {language string }func (p Gopher) code() {fmt.Printf("I am coding %s language\n", p.language) }func (p *Gopher) debug() {fmt.Printf("I am debuging %s language\n", p.language) }func main() {var c coder = &Gopher{"Go"}c.code()c.debug() }上述代碼里定義了一個接口?coder,接口定義了兩個函數:
code() debug()接著定義了一個結構體?Gopher,它實現了兩個方法,一個值接收者,一個指針接收者。
最后,我們在?main?函數里通過接口類型的變量調用了定義的兩個函數。
運行一下,結果:
I am coding Go language I am debuging Go language但是如果我們把?main?函數的第一條語句換一下:
func main() {var c coder = Gopher{"Go"}c.code()c.debug() }運行一下,報錯:
./main.go:23:6: cannot use Gopher literal (type Gopher) as type coder in assignment:Gopher does not implement coder (debug method has pointer receiver)看出這兩處代碼的差別了嗎?第一次是將?&Gopher?賦給了?coder;第二次則是將?Gopher?賦給了?coder。
第二次報錯是說,Gopher?沒有實現?coder,很明顯了吧?因為?Gopher?類型并沒有實現?debug?方法。表面上看,?*Gopher?類型也沒有實現?code?方法,但是因為?Gopher?類型實現了?code?方法,所以讓?*Gopher?類型自動擁有了?code?方法。
當然,上面的說法有一個簡單的解釋:接收者是指針類型的方法,很可能在方法中會對接收者的屬性進行更改操作,從而影響接收者;而對于接收者是值類型的方法,在方法中不會對接收者本身產生影響。
所以,當實現了一個接收者是值類型的方法,就可以自動生成一個接收者是對應指針類型的方法,因為兩者都不會影響接收者。但是,當實現了一個接收者是指針類型的方法,如果此時自動生成一個接收者是值類型的方法,原本期望對接收者的改變(通過指針實現),現在無法實現,因為值類型會產生一個拷貝,不會真正影響調用者。
最后,只要記住下面這點就可以了:
如果實現了接收者是值類型的方法,會隱含地也實現了接收者是指針類型的方法。
兩者分別在何時使用
如果方法的接收者是值類型,無論調用者是對象還是對象指針,修改的都是對象的副本,不影響調用者;如果方法的接收者是指針類型,則調用者修改的是指針指向的對象本身。
使用指針作為方法的接收者的理由:
- 方法能夠修改接收者指向的值。
- 避免在每次調用方法時復制該值,在值的類型為大型結構體時,這樣做會更加高效。
是使用值接收者還是指針接收者,不是由該方法是否修改了調用者(也就是接收者)來決定,而是應該基于該類型的本質。
如果類型具備“原始的本質”,也就是說它的成員都是由 Go 語言里內置的原始類型,如字符串,整型值等,那就定義值接收者類型的方法。像內置的引用類型,如 slice,map,interface,channel,這些類型比較特殊,聲明他們的時候,實際上是創建了一個?header, 對于他們也是直接定義值接收者類型的方法。這樣,調用函數時,是直接 copy 了這些類型的?header,而?header?本身就是為復制設計的。
如果類型具備非原始的本質,不能被安全地復制,這種類型總是應該被共享,那就定義指針接收者的方法。比如 go 源碼里的文件結構體(struct File)就不應該被復制,應該只有一份實體。
這一段說的比較繞,大家可以去看《Go 語言實戰》5.3 那一節。
3. iface 和 eface 的區別是什么
iface?和?eface?都是 Go 中描述接口的底層結構體,區別在于?iface?描述的接口包含方法,而?eface?則是不包含任何方法的空接口:interface{}。
從源碼層面看一下:
type iface struct {tab *itabdata unsafe.Pointer }type itab struct {inter *interfacetype_type *_typelink *itabhash uint32 // copy of _type.hash. Used for type switches.bad bool // type does not implement interfaceinhash bool // has this itab been added to hash?unused [2]bytefun [1]uintptr // variable sized }iface?內部維護兩個指針,tab?指向一個?itab?實體, 它表示接口的類型以及賦給這個接口的實體類型。data?則指向接口具體的值,一般而言是一個指向堆內存的指針。
再來仔細看一下?itab?結構體:_type?字段描述了實體的類型,包括內存對齊方式,大小等;inter?字段則描述了接口的類型。fun?字段放置和接口方法對應的具體數據類型的方法地址,實現接口調用方法的動態分派,一般在每次給接口賦值發生轉換時會更新此表,或者直接拿緩存的 itab。
這里只會列出實體類型和接口相關的方法,實體類型的其他方法并不會出現在這里。如果你學過 C++ 的話,這里可以類比虛函數的概念。
另外,你可能會覺得奇怪,為什么?fun?數組的大小為 1,要是接口定義了多個方法可怎么辦?實際上,這里存儲的是第一個方法的函數指針,如果有更多的方法,在它之后的內存空間里繼續存儲。從匯編角度來看,通過增加地址就能獲取到這些函數指針,沒什么影響。順便提一句,這些方法是按照函數名稱的字典序進行排列的。
再看一下?interfacetype?類型,它描述的是接口的類型:
type interfacetype struct {typ _typepkgpath namemhdr []imethod }可以看到,它包裝了?_type?類型,_type?實際上是描述 Go 語言中各種數據類型的結構體。我們注意到,這里還包含一個?mhdr?字段,表示接口所定義的函數列表,?pkgpath?記錄定義了接口的包名。
這里通過一張圖來看下?iface?結構體的全貌:
iface 結構體全景
接著來看一下?eface?的源碼:
type eface struct {_type *_typedata unsafe.Pointer }相比?iface,eface?就比較簡單了。只維護了一個?_type?字段,表示空接口所承載的具體的實體類型。data?描述了具體的值。
eface 結構體全景
我們來看個例子:
package mainimport "fmt"func main() {x := 200var any interface{} = xfmt.Println(any)g := Gopher{"Go"}var c coder = gfmt.Println(c) }type coder interface {code()debug() }type Gopher struct {language string }func (p Gopher) code() {fmt.Printf("I am coding %s language\n", p.language) }func (p Gopher) debug() {fmt.Printf("I am debuging %s language\n", p.language) }執行命令,打印出匯編語言:
go tool compile -S ./src/main.go可以看到,main 函數里調用了兩個函數:
func convT2E64(t *_type, elem unsafe.Pointer) (e eface) func convT2I(tab *itab, elem unsafe.Pointer) (i iface)上面兩個函數的參數和?iface?及?eface?結構體的字段是可以聯系起來的:兩個函數都是將參數組裝一下,形成最終的接口。
作為補充,我們最后再來看下?_type?結構體:
type _type struct {// 類型大小size uintptrptrdata uintptr// 類型的 hash 值hash uint32// 類型的 flag,和反射相關tflag tflag// 內存對齊相關align uint8fieldalign uint8// 類型的編號,有bool, slice, struct 等等等等kind uint8alg *typeAlg// gc 相關gcdata *bytestr nameOffptrToThis typeOff }Go 語言各種數據類型都是在?_type?字段的基礎上,增加一些額外的字段來進行管理的:
type arraytype struct {typ _typeelem *_typeslice *_typelen uintptr }type chantype struct {typ _typeelem *_typedir uintptr }type slicetype struct {typ _typeelem *_type }type structtype struct {typ _typepkgPath namefields []structfield }這些數據類型的結構體定義,是反射實現的基礎。
4. 接口的動態類型和動態值
從源碼里可以看到:iface包含兩個字段:tab?是接口表指針,指向類型信息;data?是數據指針,則指向具體的數據。它們分別被稱為動態類型和動態值。而接口值包括動態類型和動態值。
【引申1】接口類型和?nil?作比較
接口值的零值是指動態類型和動態值都為?nil。當僅且當這兩部分的值都為?nil?的情況下,這個接口值就才會被認為?接口值 == nil。
來看個例子:
package mainimport "fmt"type Coder interface {code() }type Gopher struct {name string }func (g Gopher) code() {fmt.Printf("%s is coding\n", g.name) }func main() {var c Coderfmt.Println(c == nil)fmt.Printf("c: %T, %v\n", c, c)var g *Gopherfmt.Println(g == nil)c = gfmt.Println(c == nil)fmt.Printf("c: %T, %v\n", c, c) }輸出:
true c: <nil>, <nil> true false c: *main.Gopher, <nil>一開始,c?的 動態類型和動態值都為?nil,g?也為?nil,當把?g?賦值給?c?后,c?的動態類型變成了?*main.Gopher,僅管?c?的動態值仍為?nil,但是當?c?和?nil?作比較的時候,結果就是?false?了。
【引申2】
來看一個例子,看一下它的輸出:
函數運行結果:
<nil> false這里先定義了一個?MyError?結構體,實現了?Error?函數,也就實現了?error?接口。Process?函數返回了一個?error?接口,這塊隱含了類型轉換。所以,雖然它的值是?nil,其實它的類型是?*MyError,最后和?nil?比較的時候,結果為?false。
【引申3】如何打印出接口的動態類型和值?
直接看代碼:
package mainimport ("unsafe""fmt" )type iface struct {itab, data uintptr }func main() {var a interface{} = nilvar b interface{} = (*int)(nil)x := 5var c interface{} = (*int)(&x)ia := *(*iface)(unsafe.Pointer(&a))ib := *(*iface)(unsafe.Pointer(&b))ic := *(*iface)(unsafe.Pointer(&c))fmt.Println(ia, ib, ic)fmt.Println(*(*int)(unsafe.Pointer(ic.data))) }代碼里直接定義了一個?iface?結構體,用兩個指針來描述?itab?和?data,之后將 a, b, c 在內存中的內容強制解釋成我們自定義的?iface。最后就可以打印出動態類型和動態值的地址。
運行結果如下:
{0 0} {17426912 0} {17426912 842350714568} 5a 的動態類型和動態值的地址均為 0,也就是 nil;b 的動態類型和 c 的動態類型一致,都是?*int;最后,c 的動態值為 5。
5. 編譯器自動檢測類型是否實現接口
經常看到一些開源庫里會有一些類似下面這種奇怪的用法:
var _ io.Writer = (*myWriter)(nil)這時候會有點懵,不知道作者想要干什么,實際上這就是此問題的答案。編譯器會由此檢查?*myWriter?類型是否實現了?io.Writer?接口。
來看一個例子:
package mainimport "io"type myWriter struct {}/*func (w myWriter) Write(p []byte) (n int, err error) {return }*/func main() {// 檢查 *myWriter 類型是否實現了 io.Writer 接口var _ io.Writer = (*myWriter)(nil)// 檢查 myWriter 類型是否實現了 io.Writer 接口var _ io.Writer = myWriter{} }注釋掉為 myWriter 定義的 Write 函數后,運行程序:
src/main.go:14:6: cannot use (*myWriter)(nil) (type *myWriter) as type io.Writer in assignment:*myWriter does not implement io.Writer (missing Write method) src/main.go:15:6: cannot use myWriter literal (type myWriter) as type io.Writer in assignment:myWriter does not implement io.Writer (missing Write method)報錯信息:*myWriter/myWriter 未實現 io.Writer 接口,也就是未實現 Write 方法。
解除注釋后,運行程序不報錯。
實際上,上述賦值語句會發生隱式地類型轉換,在轉換的過程中,編譯器會檢測等號右邊的類型是否實現了等號左邊接口所規定的函數。
總結一下,可通過在代碼中添加類似如下的代碼,用來檢測類型是否實現了接口:
var _ io.Writer = (*myWriter)(nil) var _ io.Writer = myWriter{}6. 接口的構造過程是怎樣的
我們已經看過了?iface?和?eface?的源碼,知道?iface?最重要的是?itab?和?_type。
為了研究清楚接口是如何構造的,接下來我會拿起匯編的武器,還原背后的真相。
來看一個示例代碼:
package mainimport "fmt"type Person interface {growUp() }type Student struct {age int }func (p Student) growUp() {p.age += 1return }func main() {var qcrao = Person(Student{age: 18})fmt.Println(qcrao) }執行命令:
go tool compile -S main.go得到 main 函數的匯編代碼如下:
0x0000 00000 (./src/main.go:30) TEXT "".main(SB), $80-0 0x0000 00000 (./src/main.go:30) MOVQ (TLS), CX 0x0009 00009 (./src/main.go:30) CMPQ SP, 16(CX) 0x000d 00013 (./src/main.go:30) JLS 157 0x0013 00019 (./src/main.go:30) SUBQ $80, SP 0x0017 00023 (./src/main.go:30) MOVQ BP, 72(SP) 0x001c 00028 (./src/main.go:30) LEAQ 72(SP), BP 0x0021 00033 (./src/main.go:30) FUNCDATA$0, gclocals·69c1753bd5f81501d95132d08af04464(SB) 0x0021 00033 (./src/main.go:30) FUNCDATA$1, gclocals·e226d4ae4a7cad8835311c6a4683c14f(SB) 0x0021 00033 (./src/main.go:31) MOVQ $18, ""..autotmp_1+48(SP) 0x002a 00042 (./src/main.go:31) LEAQ go.itab."".Student,"".Person(SB), AX 0x0031 00049 (./src/main.go:31) MOVQ AX, (SP) 0x0035 00053 (./src/main.go:31) LEAQ ""..autotmp_1+48(SP), AX 0x003a 00058 (./src/main.go:31) MOVQ AX, 8(SP) 0x003f 00063 (./src/main.go:31) PCDATA $0, $0 0x003f 00063 (./src/main.go:31) CALL runtime.convT2I64(SB) 0x0044 00068 (./src/main.go:31) MOVQ 24(SP), AX 0x0049 00073 (./src/main.go:31) MOVQ 16(SP), CX 0x004e 00078 (./src/main.go:33) TESTQ CX, CX 0x0051 00081 (./src/main.go:33) JEQ 87 0x0053 00083 (./src/main.go:33) MOVQ 8(CX), CX 0x0057 00087 (./src/main.go:33) MOVQ $0, ""..autotmp_2+56(SP) 0x0060 00096 (./src/main.go:33) MOVQ $0, ""..autotmp_2+64(SP) 0x0069 00105 (./src/main.go:33) MOVQ CX, ""..autotmp_2+56(SP) 0x006e 00110 (./src/main.go:33) MOVQ AX, ""..autotmp_2+64(SP) 0x0073 00115 (./src/main.go:33) LEAQ ""..autotmp_2+56(SP), AX 0x0078 00120 (./src/main.go:33) MOVQ AX, (SP) 0x007c 00124 (./src/main.go:33) MOVQ $1, 8(SP) 0x0085 00133 (./src/main.go:33) MOVQ $1, 16(SP) 0x008e 00142 (./src/main.go:33) PCDATA $0, $1 0x008e 00142 (./src/main.go:33) CALL fmt.Println(SB) 0x0093 00147 (./src/main.go:34) MOVQ 72(SP), BP 0x0098 00152 (./src/main.go:34) ADDQ $80, SP 0x009c 00156 (./src/main.go:34) RET 0x009d 00157 (./src/main.go:34) NOP 0x009d 00157 (./src/main.go:30) PCDATA $0, $-1 0x009d 00157 (./src/main.go:30) CALL runtime.morestack_noctxt(SB) 0x00a2 00162 (./src/main.go:30) JMP 0我們從第 10 行開始看,如果不理解前面幾行匯編代碼的話,可以回去看看公眾號前面兩篇文章,這里我就省略了。
| 10-14 | 構造調用?runtime.convT2I64(SB)?的參數 |
我們來看下這個函數的參數形式:
func convT2I64(tab *itab, elem unsafe.Pointer) (i iface) {// …… }convT2I64?會構造出一個?inteface,也就是我們的?Person?接口。
第一個參數的位置是?(SP),這里被賦上了?go.itab."".Student,"".Person(SB)?的地址。
我們從生成的匯編找到:
go.itab."".Student,"".Person SNOPTRDATA dupok size=400x0000 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 0x0010 00 00 00 00 00 00 00 00 da 9f 20 d4 rel 0+8 t=1 type."".Person+0rel 8+8 t=1 type."".Student+0size=40?大小為40字節,回顧一下:
type itab struct {inter *interfacetype // 8字節_type *_type // 8字節link *itab // 8字節hash uint32 // 4字節bad bool // 1字節inhash bool // 1字節unused [2]byte // 2字節fun [1]uintptr // variable sized // 8字節 }把每個字段的大小相加,itab?結構體的大小就是 40 字節。上面那一串數字實際上是?itab?序列化后的內容,注意到大部分數字是 0,從 24 字節開始的 4 個字節?da 9f 20 d4?實際上是?itab?的?hash?值,這在判斷兩個類型是否相同的時候會用到。
下面兩行是鏈接指令,簡單說就是將所有源文件綜合起來,給每個符號賦予一個全局的位置值。這里的意思也比較明確:前8個字節最終存儲的是?type."".Person?的地址,對應?itab?里的?inter?字段,表示接口類型;8-16 字節最終存儲的是?type."".Student?的地址,對應?itab?里?_type?字段,表示具體類型。
第二個參數就比較簡單了,它就是數字?18?的地址,這也是初始化?Student?結構體的時候會用到。
| 15 | 調用?runtime.convT2I64(SB) |
具體看下代碼:
func convT2I64(tab *itab, elem unsafe.Pointer) (i iface) {t := tab._type//...var x unsafe.Pointerif *(*uint64)(elem) == 0 {x = unsafe.Pointer(&zeroVal[0])} else {x = mallocgc(8, t, false)*(*uint64)(x) = *(*uint64)(elem)}i.tab = tabi.data = xreturn }這塊代碼比較簡單,把?tab?賦給了?iface?的?tab?字段;data?部分則是在堆上申請了一塊內存,然后將?elem?指向的?18?拷貝過去。這樣?iface?就組裝好了。
| 17 | 把?i.tab?賦給?CX |
| 18 | 把?i.data?賦給?AX |
| 19-21 | 檢測?i.tab?是否是 nil,如果不是的話,把 CX 移動 8 個字節,也就是把?itab?的?_type?字段賦給了 CX,這也是接口的實體類型,最終要作為?fmt.Println?函數的參數 |
后面,就是調用?fmt.Println?函數及之前的參數準備工作了,不再贅述。
這樣,我們就把一個?interface?的構造過程說完了。
【引申1】
如何打印出接口類型的?Hash?值?
這里參考曹大神翻譯的一篇文章,參考資料里會寫上。具體做法如下:
type iface struct {tab *itabdata unsafe.Pointer } type itab struct {inter uintptr_type uintptrlink uintptrhash uint32_ [4]bytefun [1]uintptr }func main() {var qcrao = Person(Student{age: 18})iface := (*iface)(unsafe.Pointer(&qcrao))fmt.Printf("iface.tab.hash = %#x\n", iface.tab.hash) }定義了一個山寨版的?iface?和?itab,說它山寨是因為?itab?里的一些關鍵數據結構都不具體展開了,比如?_type,對比一下正宗的定義就可以發現,但是山寨版依然能工作,因為?_type?就是一個指針而已嘛。
在?main?函數里,先構造出一個接口對象?qcrao,然后強制類型轉換,最后讀取出?hash?值,非常妙!你也可以自己動手試一下。
運行結果:
iface.tab.hash = 0xd4209fda值得一提的是,構造接口?qcrao?的時候,即使我把?age?寫成其他值,得到的?hash?值依然不變的,這應該是可以預料的,hash?值只和他的字段、方法相關。
7. 類型轉換和斷言的區別
我們知道,Go 語言中不允許隱式類型轉換,也就是說?=?兩邊,不允許出現類型不相同的變量。
類型轉換、類型斷言本質都是把一個類型轉換成另外一個類型。不同之處在于,類型斷言是對接口變量進行的操作。
類型轉換
對于類型轉換而言,轉換前后的兩個類型要相互兼容才行。類型轉換的語法為:
<結果類型> := <目標類型> ( <表達式> )
package mainimport "fmt"func main() {var i int = 9var f float64f = float64(i)fmt.Printf("%T, %v\n", f, f)f = 10.8a := int(f)fmt.Printf("%T, %v\n", a, a)// s := []int(i) }上面的代碼里,我定義了一個?int?型和?float64?型的變量,嘗試在它們之前相互轉換,結果是成功的:int?型和?float64?是相互兼容的。
如果我把最后一行代碼的注釋去掉,編譯器會報告類型不兼容的錯誤:
cannot convert i (type int) to type []int斷言
前面說過,因為空接口?interface{}?沒有定義任何函數,因此 Go 中所有類型都實現了空接口。當一個函數的形參是?interface{},那么在函數中,需要對形參進行斷言,從而得到它的真實類型。
斷言的語法為:
<目標類型的值>,<布爾參數> := <表達式>.( 目標類型 ) // 安全類型斷言
<目標類型的值> := <表達式>.( 目標類型 ) //非安全類型斷言
類型轉換和類型斷言有些相似,不同之處,在于類型斷言是對接口進行的操作。
還是來看一個簡短的例子:
package mainimport "fmt"type Student struct {Name stringAge int }func main() {var i interface{} = new(Student)s := i.(Student)fmt.Println(s) }運行一下:
panic: interface conversion: interface {} is *main.Student, not main.Student直接?panic?了,這是因為?i?是?*Student?類型,并非?Student?類型,斷言失敗。這里直接發生了?panic,線上代碼可能并不適合這樣做,可以采用“安全斷言”的語法:
func main() {var i interface{} = new(Student)s, ok := i.(Student)if ok {fmt.Println(s)} }這樣,即使斷言失敗也不會?panic。
斷言其實還有另一種形式,就是用在利用?switch?語句判斷接口的類型。每一個?case?會被順序地考慮。當命中一個?case?時,就會執行?case?中的語句,因此?case?語句的順序是很重要的,因為很有可能會有多個?case?匹配的情況。
代碼示例如下:
func main() {//var i interface{} = new(Student)//var i interface{} = (*Student)(nil)var i interface{}fmt.Printf("%p %v\n", &i, i)judge(i) }func judge(v interface{}) {fmt.Printf("%p %v\n", &v, v)switch v := v.(type) {case nil:fmt.Printf("%p %v\n", &v, v)fmt.Printf("nil type[%T] %v\n", v, v)case Student:fmt.Printf("%p %v\n", &v, v)fmt.Printf("Student type[%T] %v\n", v, v)case *Student:fmt.Printf("%p %v\n", &v, v)fmt.Printf("*Student type[%T] %v\n", v, v)default:fmt.Printf("%p %v\n", &v, v)fmt.Printf("unknow\n")} }type Student struct {Name stringAge int }main?函數里有三行不同的聲明,每次運行一行,注釋另外兩行,得到三組運行結果:
// --- var i interface{} = new(Student) 0xc4200701b0 [Name: ], [Age: 0] 0xc4200701d0 [Name: ], [Age: 0] 0xc420080020 [Name: ], [Age: 0] *Student type[*main.Student] [Name: ], [Age: 0]// --- var i interface{} = (*Student)(nil) 0xc42000e1d0 <nil> 0xc42000e1f0 <nil> 0xc42000c030 <nil> *Student type[*main.Student] <nil>// --- var i interface{} 0xc42000e1d0 <nil> 0xc42000e1e0 <nil> 0xc42000e1f0 <nil> nil type[<nil>] <nil>對于第一行語句:
var i interface{} = new(Student)i?是一個?*Student?類型,匹配上第三個 case,從打印的三個地址來看,這三處的變量實際上都是不一樣的。在?main?函數里有一個局部變量?i;調用函數時,實際上是復制了一份參數,因此函數里又有一個變量?v,它是?i?的拷貝;斷言之后,又生成了一份新的拷貝。所以最終打印的三個變量的地址都不一樣。
對于第二行語句:
var i interface{} = (*Student)(nil)這里想說明的其實是?i?在這里動態類型是?(*Student), 數據為?nil,它的類型并不是?nil,它與?nil?作比較的時候,得到的結果也是?false。
最后一行語句:
var i interface{}這回?i?才是?nil?類型。
【引申1】
fmt.Println?函數的參數是?interface。對于內置類型,函數內部會用窮舉法,得出它的真實類型,然后轉換為字符串打印。而對于自定義類型,首先確定該類型是否實現了?String()?方法,如果實現了,則直接打印輸出?String()?方法的結果;否則,會通過反射來遍歷對象的成員進行打印。
再來看一個簡短的例子,比較簡單,不要緊張:
package mainimport "fmt"type Student struct {Name stringAge int }func main() {var s = Student{Name: "qcrao",Age: 18,}fmt.Println(s) }因為?Student?結構體沒有實現?String()?方法,所以?fmt.Println?會利用反射挨個打印成員變量:
{qcrao 18}增加一個?String()?方法的實現:
func (s Student) String() string {return fmt.Sprintf("[Name: %s], [Age: %d]", s.Name, s.Age) }打印結果:
[Name: qcrao], [Age: 18]按照我們自定義的方法來打印了。
【引申2】
針對上面的例子,如果改一下:
注意看兩個函數的接受者類型不同,現在?Student?結構體只有一個接受者類型為?指針類型?的?String()?函數,打印結果:
{qcrao 18}為什么?
類型?T?只有接受者是?T?的方法;而類型?*T?擁有接受者是?T?和?*T?的方法。語法上?T?能直接調?*T?的方法僅僅是?Go?的語法糖。
所以,?Student?結構體定義了接受者類型是值類型的?String()?方法時,通過
fmt.Println(s) fmt.Println(&s)均可以按照自定義的格式來打印。
如果?Student?結構體定義了接受者類型是指針類型的?String()?方法時,只有通過
fmt.Println(&s)才能按照自定義的格式打印。
8. 接口轉換的原理
通過前面提到的?iface?的源碼可以看到,實際上它包含接口的類型?interfacetype?和 實體類型的類型?_type,這兩者都是?iface?的字段?itab?的成員。也就是說生成一個?itab?同時需要接口的類型和實體的類型。
<interface 類型, 實體類型> ->itable
當判定一種類型是否滿足某個接口時,Go 使用類型的方法集和接口所需要的方法集進行匹配,如果類型的方法集完全包含接口的方法集,則可認為該類型實現了該接口。
例如某類型有?m?個方法,某接口有?n?個方法,則很容易知道這種判定的時間復雜度為?O(mn),Go 會對方法集的函數按照函數名的字典序進行排序,所以實際的時間復雜度為?O(m+n)。
這里我們來探索將一個接口轉換給另外一個接口背后的原理,當然,能轉換的原因必然是類型兼容。
直接來看一個例子:
package mainimport "fmt"type coder interface {code()run() }type runner interface {run() }type Gopher struct {language string }func (g Gopher) code() {return }func (g Gopher) run() {return }func main() {var c coder = Gopher{}var r runnerr = cfmt.Println(c, r) }簡單解釋下上述代碼:定義了兩個?interface:?coder?和?runner。定義了一個實體類型?Gopher,類型?Gopher?實現了兩個方法,分別是?run()?和?code()。main 函數里定義了一個接口變量?c,綁定了一個?Gopher?對象,之后將?c?賦值給另外一個接口變量?r?。賦值成功的原因是?c?中包含?run()?方法。這樣,兩個接口變量完成了轉換。
執行命令:
go tool compile -S ./src/main.go得到 main 函數的匯編命令,可以看到:?r = c?這一行語句實際上是調用了?runtime.convI2I(SB),也就是?convI2I?函數,從函數名來看,就是將一個?interface?轉換成另外一個?interface,看下它的源代碼:
func convI2I(inter *interfacetype, i iface) (r iface) {tab := i.tabif tab == nil {return}if tab.inter == inter {r.tab = tabr.data = i.datareturn}r.tab = getitab(inter, tab._type, false)r.data = i.datareturn }代碼比較簡單,函數參數?inter?表示接口類型,i?表示綁定了實體類型的接口,r?則表示接口轉換了之后的新的?iface。通過前面的分析,我們又知道,?iface?是由?tab?和?data?兩個字段組成。所以,實際上?convI2I?函數真正要做的事,找到新?interface?的?tab?和?data,就大功告成了。
我們還知道,tab?是由接口類型?interfacetype?和 實體類型?_type?組成。所以最關鍵的語句是?r.tab = getitab(inter, tab._type, false)。
因此,重點來看下?getitab?函數的源碼,只看關鍵的地方:
func getitab(inter *interfacetype, typ *_type, canfail bool) *itab {// ……// 根據 inter, typ 計算出 hash 值h := itabhash(inter, typ)// look twice - once without lock, once with.// common case will be no lock contention.var m *itabvar locked intfor locked = 0; locked < 2; locked++ {if locked != 0 {lock(&ifaceLock)}// 遍歷哈希表的一個 slotfor m = (*itab)(atomic.Loadp(unsafe.Pointer(&hash[h]))); m != nil; m = m.link {// 如果在 hash 表中已經找到了 itab(inter 和 typ 指針都相同)if m.inter == inter && m._type == typ {// ……if locked != 0 {unlock(&ifaceLock)}return m}}}// 在 hash 表中沒有找到 itab,那么新生成一個 itabm = (*itab)(persistentalloc(unsafe.Sizeof(itab{})+uintptr(len(inter.mhdr)-1)*sys.PtrSize, 0, &memstats.other_sys))m.inter = interm._type = typ// 添加到全局的 hash 表中additab(m, true, canfail)unlock(&ifaceLock)if m.bad {return nil}return m }簡單總結一下:getitab 函數會根據?interfacetype?和?_type?去全局的 itab 哈希表中查找,如果能找到,則直接返回;否則,會根據給定的?interfacetype?和?_type?新生成一個?itab,并插入到 itab 哈希表,這樣下一次就可以直接拿到?itab。
這里查找了兩次,并且第二次上鎖了,這是因為如果第一次沒找到,在第二次仍然沒有找到相應的?itab?的情況下,需要新生成一個,并且寫入哈希表,因此需要加鎖。這樣,其他協程在查找相同的?itab?并且也沒有找到時,第二次查找時,會被掛住,之后,就會查到第一個協程寫入哈希表的?itab。
再來看一下?additab?函數的代碼:
// 檢查 _type 是否符合 interface_type 并且創建對應的 itab 結構體 將其放到 hash 表中 func additab(m *itab, locked, canfail bool) {inter := m.intertyp := m._typex := typ.uncommon()// both inter and typ have method sorted by name,// and interface names are unique,// so can iterate over both in lock step;// the loop is O(ni+nt) not O(ni*nt).// // inter 和 typ 的方法都按方法名稱進行了排序// 并且方法名都是唯一的。所以循環的次數是固定的// 只用循環 O(ni+nt),而非 O(ni*nt)ni := len(inter.mhdr)nt := int(x.mcount)xmhdr := (*[1 << 16]method)(add(unsafe.Pointer(x), uintptr(x.moff)))[:nt:nt]j := 0for k := 0; k < ni; k++ {i := &inter.mhdr[k]itype := inter.typ.typeOff(i.ityp)name := inter.typ.nameOff(i.name)iname := name.name()ipkg := name.pkgPath()if ipkg == "" {ipkg = inter.pkgpath.name()}for ; j < nt; j++ {t := &xmhdr[j]tname := typ.nameOff(t.name)// 檢查方法名字是否一致if typ.typeOff(t.mtyp) == itype && tname.name() == iname {pkgPath := tname.pkgPath()if pkgPath == "" {pkgPath = typ.nameOff(x.pkgpath).name()}if tname.isExported() || pkgPath == ipkg {if m != nil {// 獲取函數地址,并加入到itab.fun數組中ifn := typ.textOff(t.ifn)*(*unsafe.Pointer)(add(unsafe.Pointer(&m.fun[0]), uintptr(k)*sys.PtrSize)) = ifn}goto nextimethod}}}// ……m.bad = truebreaknextimethod:}if !locked {throw("invalid itab locking")}// 計算 hash 值h := itabhash(inter, typ)// 加到Hash Slot鏈表中m.link = hash[h]m.inhash = trueatomicstorep(unsafe.Pointer(&hash[h]), unsafe.Pointer(m)) }additab?會檢查?itab?持有的?interfacetype?和?_type?是否符合,就是看?_type?是否完全實現了?interfacetype?的方法,也就是看兩者的方法列表重疊的部分就是?interfacetype?所持有的方法列表。注意到其中有一個雙層循環,乍一看,循環次數是?ni * nt,但由于兩者的函數列表都按照函數名稱進行了排序,因此最終只執行了?ni + nt?次,代碼里通過一個小技巧來實現:第二層循環并沒有從 0 開始計數,而是從上一次遍歷到的位置開始。
求 hash 值的函數比較簡單:
func itabhash(inter *interfacetype, typ *_type) uint32 {h := inter.typ.hashh += 17 * typ.hashreturn h % hashSize }hashSize?的值是 1009。
更一般的,當把實體類型賦值給接口的時候,會調用?conv?系列函數,例如空接口調用?convT2E?系列、非空接口調用?convT2I?系列。這些函數比較相似:
9. 如何用 interface 實現多態
Go?語言并沒有設計諸如虛函數、純虛函數、繼承、多重繼承等概念,但它通過接口卻非常優雅地支持了面向對象的特性。
多態是一種運行期的行為,它有以下幾個特點:
看一個實現了多態的代碼例子:
package mainimport "fmt"func main() {qcrao := Student{age: 18}whatJob(&qcrao)growUp(&qcrao)fmt.Println(qcrao)stefno := Programmer{age: 100}whatJob(stefno)growUp(stefno)fmt.Println(stefno) }func whatJob(p Person) {p.job() }func growUp(p Person) {p.growUp() }type Person interface {job()growUp() }type Student struct {age int }func (p Student) job() {fmt.Println("I am a student.")return }func (p *Student) growUp() {p.age += 1return }type Programmer struct {age int }func (p Programmer) job() {fmt.Println("I am a programmer.")return }func (p Programmer) growUp() {// 程序員老得太快 ^_^p.age += 10return }代碼里先定義了 1 個?Person?接口,包含兩個函數:
job() growUp()然后,又定義了 2 個結構體,Student?和?Programmer,同時,類型?*Student、Programmer?實現了?Person?接口定義的兩個函數。注意,*Student?類型實現了接口,?Student?類型卻沒有。
之后,我又定義了函數參數是?Person?接口的兩個函數:
func whatJob(p Person) func growUp(p Person)main?函數里先生成?Student?和?Programmer?的對象,再將它們分別傳入到函數?whatJob?和?growUp。函數中,直接調用接口函數,實際執行的時候是看最終傳入的實體類型是什么,調用的是實體類型實現的函數。于是,不同對象針對同一消息就有多種表現,多態就實現了。
更深入一點來說的話,在函數?whatJob()?或者?growUp()?內部,接口?person?綁定了實體類型?*Student?或者?Programmer。根據前面分析的?iface?源碼,這里會直接調用?fun?里保存的函數,類似于:?s.tab->fun[0],而因為?fun?數組里保存的是實體類型實現的函數,所以當函數傳入不同的實體類型時,調用的實際上是不同的函數實現,從而實現多態。
運行一下代碼:
I am a student. {19} I am a programmer. {100}10. Go 接口與 C++ 接口有何異同
接口定義了一種規范,描述了類的行為和功能,而不做具體實現。
C++ 的接口是使用抽象類來實現的,如果類中至少有一個函數被聲明為純虛函數,則這個類就是抽象類。純虛函數是通過在聲明中使用 “= 0” 來指定的。例如:
class Shape {public:// 純虛函數virtual double getArea() = 0;private:string name; // 名稱 };設計抽象類的目的,是為了給其他類提供一個可以繼承的適當的基類。抽象類不能被用于實例化對象,它只能作為接口使用。
派生類需要明確地聲明它繼承自基類,并且需要實現基類中所有的純虛函數。
C++ 定義接口的方式稱為“侵入式”,而 Go 采用的是 “非侵入式”,不需要顯式聲明,只需要實現接口定義的函數,編譯器自動會識別。
C++ 和 Go 在定義接口方式上的不同,也導致了底層實現上的不同。C++ 通過虛函數表來實現基類調用派生類的函數;而 Go 通過?itab?中的?fun?字段來實現接口變量調用實體類型的函數。C++ 中的虛函數表是在編譯期生成的;而 Go 的?itab?中的?fun?字段是在運行期間動態生成的。原因在于,Go 中實體類型可能會無意中實現 N 多接口,很多接口并不是本來需要的,所以不能為類型實現的所有接口都生成一個?itab, 這也是“非侵入式”帶來的影響;這在 C++ 中是不存在的,因為派生需要顯示聲明它繼承自哪個基類。
總結
以上是生活随笔為你收集整理的golang 接口类型 interface 简介使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [SCOI2008] 奖励关
- 下一篇: CC攻击(N个免费代理形成的DDOS)