摘要:原文地址與性能分析概要前言在項目中,常常會遇到循環交換賦值的數據處理場景,尤其是,數據交互格式要轉為,賦值是無法避免的。如下預編譯生成代碼提前確定類型,可以解決運行時的反射帶來的性能開銷。
原文地址:for-loop 與 json.Unmarshal 性能分析概要
前言在項目中,常常會遇到循環交換賦值的數據處理場景,尤其是 RPC,數據交互格式要轉為 Protobuf,賦值是無法避免的。一般會有如下幾種做法:
for
for range
json.Marshal/Unmarshal
這時候又面臨 “選擇困難癥”,用哪個好?又想代碼量少,又擔心性能有沒有影響啊...
為了弄清楚這個疑惑,接下來將分別編寫三種使用場景。來簡單看看它們的性能情況,看看誰更 “好”
功能代碼... type Person struct { Name string `json:"name"` Age int `json:"age"` Avatar string `json:"avatar"` Type string `json:"type"` } type AgainPerson struct { Name string `json:"name"` Age int `json:"age"` Avatar string `json:"avatar"` Type string `json:"type"` } const MAX = 10000 func InitPerson() []Person { var persons []Person for i := 0; i < MAX; i++ { persons = append(persons, Person{ Name: "EDDYCJY", Age: i, Avatar: "https://github.com/EDDYCJY", Type: "Person", }) } return persons } func ForStruct(p []Person, count int) { for i := 0; i < count; i++ { _, _ = i, p[i] } } func ForRangeStruct(p []Person) { for i, v := range p { _, _ = i, v } } func JsonToStruct(data []byte, againPerson []AgainPerson) ([]AgainPerson, error) { err := json.Unmarshal(data, &againPerson) return againPerson, err } func JsonIteratorToStruct(data []byte, againPerson []AgainPerson) ([]AgainPerson, error) { var jsonIter = jsoniter.ConfigCompatibleWithStandardLibrary err := jsonIter.Unmarshal(data, &againPerson) return againPerson, err }測試代碼
... func BenchmarkForStruct(b *testing.B) { person := InitPerson() count := len(person) b.ResetTimer() for i := 0; i < b.N; i++ { ForStruct(person, count) } } func BenchmarkForRangeStruct(b *testing.B) { person := InitPerson() b.ResetTimer() for i := 0; i < b.N; i++ { ForRangeStruct(person) } } func BenchmarkJsonToStruct(b *testing.B) { var ( person = InitPerson() againPersons []AgainPerson ) data, err := json.Marshal(person) if err != nil { b.Fatalf("json.Marshal err: %v", err) } b.ResetTimer() for i := 0; i < b.N; i++ { JsonToStruct(data, againPersons) } } func BenchmarkJsonIteratorToStruct(b *testing.B) { var ( person = InitPerson() againPersons []AgainPerson ) data, err := json.Marshal(person) if err != nil { b.Fatalf("json.Marshal err: %v", err) } b.ResetTimer() for i := 0; i < b.N; i++ { JsonIteratorToStruct(data, againPersons) } }測試結果
BenchmarkForStruct-4 500000 3289 ns/op 0 B/op 0 allocs/op BenchmarkForRangeStruct-4 200000 9178 ns/op 0 B/op 0 allocs/op BenchmarkJsonToStruct-4 100 19173117 ns/op 2618509 B/op 40036 allocs/op BenchmarkJsonIteratorToStruct-4 300 4116491 ns/op 3694017 B/op 30047 allocs/op
從測試結果來看,性能排名為:for < for range < json-iterator < encoding/json。接下來我們看看是什么原因導致了這樣子的排名?
性能對比 for-loop在測試結果中,for range 在性能上相較 for 差。這是為什么呢?在這里我們可以參見 for range 的 實現,偽實現如下:
for_temp := range len_temp := len(for_temp) for index_temp = 0; index_temp < len_temp; index_temp++ { value_temp = for_temp[index_temp] index = index_temp value = value_temp original body }
通過分析偽實現,可得知 for range 相較 for 多做了如下事項
ExpressionRangeClause = [ ExpressionList "=" | IdentifierList ":=" ] "range" Expression .
在循環開始之前會對范圍表達式進行求值,多做了 “解” 表達式的動作,得到了最終的范圍值
Copy... value_temp = for_temp[index_temp] index = index_temp value = value_temp ...
從偽實現上可以得出,for range 始終使用值拷貝的方式來生成循環變量。通俗來講,就是在每次循環時,都會對循環變量重新分配
小結通過上述的分析,可得知其比 for 慢的原因是 for range 有額外的性能開銷,主要為值拷貝的動作導致的性能下降。這是它慢的原因
那么其實在 for range 中,我們可以使用 _ 和 T[i] 也能達到和 for 差不多的性能。但這可能不是 for range 的設計本意了
json.Marshal/Unmarshal encoding/jsonjson 互轉是在三種方案中最慢的,這是為什么呢?
眾所皆知,官方的 encoding/json 標準庫,是通過大量反射來實現的。那么 “慢”,也是必然的。可參見下述代碼:
... func newTypeEncoder(t reflect.Type, allowAddr bool) encoderFunc { ... switch t.Kind() { case reflect.Bool: return boolEncoder case reflect.Int, reflect.Int8, reflect.Int16, reflect.Int32, reflect.Int64: return intEncoder case reflect.Uint, reflect.Uint8, reflect.Uint16, reflect.Uint32, reflect.Uint64, reflect.Uintptr: return uintEncoder case reflect.Float32: return float32Encoder case reflect.Float64: return float64Encoder case reflect.String: return stringEncoder case reflect.Interface: return interfaceEncoder case reflect.Struct: return newStructEncoder(t) case reflect.Map: return newMapEncoder(t) case reflect.Slice: return newSliceEncoder(t) case reflect.Array: return newArrayEncoder(t) case reflect.Ptr: return newPtrEncoder(t) default: return unsupportedTypeEncoder } }
既然官方的標準庫存在一定的 “問題”,那么有沒有其他解決方法呢?目前在社區里,大多為兩類方案。如下:
預編譯生成代碼(提前確定類型),可以解決運行時的反射帶來的性能開銷。缺點是增加了預生成的步驟
優化序列化的邏輯,性能達到最大化
接下來的實驗,我們用第二種方案的庫來測試,看看有沒有改變。另外也推薦大家了解如下項目:
json-iterator/go
mailru/easyjson
pquerna/ffjson
json-iterator/go目前社區較常用的是 json-iterator/go,我們在測試代碼中用到了它
它的用法與標準庫 100% 兼容,并且性能有較大提升。我們一起粗略的看下是怎么做到的,如下:
利用 modern-go/reflect2 減少運行時調度開銷
... type StructDescriptor struct { Type reflect2.Type Fields []*Binding } ... type Binding struct { levels []int Field reflect2.StructField FromNames []string ToNames []string Encoder ValEncoder Decoder ValDecoder } type Extension interface { UpdateStructDescriptor(structDescriptor *StructDescriptor) CreateMapKeyDecoder(typ reflect2.Type) ValDecoder CreateMapKeyEncoder(typ reflect2.Type) ValEncoder CreateDecoder(typ reflect2.Type) ValDecoder CreateEncoder(typ reflect2.Type) ValEncoder DecorateDecoder(typ reflect2.Type, decoder ValDecoder) ValDecoder DecorateEncoder(typ reflect2.Type, encoder ValEncoder) ValEncoder }
類型為 struct 時,只需要反射一次 Name 和 Type,會緩存 struct Encoder 和 Decoder
var typeDecoders = map[string]ValDecoder{} var fieldDecoders = map[string]ValDecoder{} var typeEncoders = map[string]ValEncoder{} var fieldEncoders = map[string]ValEncoder{} var extensions = []Extension{} .... fieldNames := calcFieldNames(field.Name(), tagParts[0], tag) fieldCacheKey := fmt.Sprintf("%s/%s", typ.String(), field.Name()) decoder := fieldDecoders[fieldCacheKey] if decoder == nil { decoder = decoderOfType(ctx.append(field.Name()), field.Type()) } encoder := fieldEncoders[fieldCacheKey] if encoder == nil { encoder = encoderOfType(ctx.append(field.Name()), field.Type()) }
相較于官方標準庫,第三方庫 json-iterator/go 在運行時上做的更好。這是它快的原因
有個需要注意的點,在 Go1.10 后 map 類型與標準庫的已經沒有太大的性能差異。但是,例如 struct 類型等仍然有較大的性能提高
總結在本文中,我們首先進行了性能測試,再分析了不同方案,得知為什么了快慢的原因。那么最終在選擇方案時,可以根據不同的應用場景去抉擇:
對性能開銷有較高要求:選用 for,開銷最小
中規中矩:選用 for range,大對象慎用
量小、占用小、數量可控:選用 json.Marshal/Unmarshal 的方案也可以。其重復代碼少,但開銷最大
在絕大多數場景中,使用哪種并沒有太大的影響。但作為工程師你應當清楚其利弊。以上就是不同的方案分析概要,希望對你有所幫助 :)
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/30119.html
摘要:方案二掛單交易所是基于的去中心化交易所,它性能一流。完整的步驟如下檢查比特幣或的余額,錢包地址。比特幣的到帳時間是個區塊的高度,約分鐘。 showImg(https://segmentfault.com/img/remote/1460000018378805?w=1200&h=659); 上一章介紹了Exincore,你可以1秒完成資產的市價買賣。如果你想限定價格買賣,或者買賣一些ex...
摘要:在中的或者循環之后還可以有子句,作用是循環中條件一直不滿足,則最后就執行語句。而當循環是由語句中斷時,就不被執行。等效于下面這段代碼,可以類似語言那樣添加一個與語句相似,語句中的子句用法是一樣的,塊在循環正常結束和循環條件不成立時執行。 在Python中的while或者for循環之后還可以有else子句,作用是for循環中if條件一直不滿足,則最后就執行else語句。 for i in...
摘要:帳號之間的比特幣支付通過,我們可以先轉比特幣給機器人,然后讓機器人轉幣給新用戶。下面的代碼,可以讀取比特幣錢包余額讀取的余額,來確認比特幣是不是轉成功了注意是新用戶的。 showImg(https://github.com/wenewzhang/mixin_labs-go-bot/raw/master/Bitcoin_go.jpg);我們已經創建過一個回復消息的機器人和一個能自動支付比...
摘要:在上一課中,我們介紹了如何在交易比特幣。支持交易任何上的,包括所有的和,不需要任何手續和費用,直接掛單即可。下面介紹如何將將一個掛上交易在掌握了之后,就可以把任何在上買賣。 showImg(https://segmentfault.com/img/remote/1460000018378805?w=1200&h=659); 在上一課中,我們介紹了如何在OceanOne交易比特幣。Oce...
摘要:而一個編譯器本身是有一個上限的,雖然大部分情況下是用不滿的。我們將此稱作友好或者不友好的分割。同時,也不要無緣無故就覺得人家損害了你應用的性能,那是你自己用得不好。 Java 8提供的流的基于Lambda表達式的函數式的操作寫法讓人感覺很爽,筆者也一直用的很開心,直到看到了Java8 Lambda表達式和流操作如何讓你的代碼變慢5倍,筆者當時是震驚的,我讀書少,你不要騙我。瞬間我似乎為...
閱讀 2451·2021-10-13 09:40
閱讀 3338·2019-08-30 13:46
閱讀 1125·2019-08-29 14:05
閱讀 2961·2019-08-29 12:48
閱讀 3657·2019-08-26 13:28
閱讀 2148·2019-08-26 11:34
閱讀 2284·2019-08-23 18:11
閱讀 1163·2019-08-23 12:26