摘要:阿里巴巴資深技術專家毗盧毗盧,阿里巴巴資深技術專家,主導設計了框架,并基于該框架完成交易平臺架構升級改造,目前負責商品中心,專注電商領域業務建模與工程交付相結合的研究與平臺推廣。
摘要: 本文是《2017雙11交易系統TMF2.0技術揭秘》演講整理,主要講解了基于TMF2.0框架改造的交易平臺,通過業務管理域與運行域分離、業務與業務的隔離架構,大幅度提高了業務在可擴展性、研發效率以及可維護性問題,同時以更好的開放模式,讓業務方能自助進行無侵入的需求開發。
12月13-14日,由云棲社區與阿里巴巴技術協會共同主辦的《2017阿里巴巴雙11技術十二講》順利結束,集中為大家分享了2017雙11背后的黑科技。本文是《2017雙11交易系統TMF2.0技術揭秘》演講整理,主要講解了基于TMF2.0框架改造的交易平臺,通過業務管理域與運行域分離、業務與業務的隔離架構,大幅度提高了業務在可擴展性、研發效率以及可維護性問題,同時以更好的開放模式,讓業務方能自助進行無侵入的需求開發。內容如下。
阿里巴巴資深技術專家 毗盧
毗盧,阿里巴巴資深技術專家,主導設計了TMF2.0框架,并基于該框架完成交易平臺架構升級改造,目前負責商品中心,專注電商領域業務建模與工程交付相結合的研究與平臺推廣。
交易平臺遇到的挑戰
在剛剛過去的2017雙11,交易峰值達到了32.5萬筆/秒,這給整個交易系統帶來了非常大的挑戰。一方面,系統需要支撐全集團幾十個事業部的所有交易類需求:要考慮如何能更快響應需求、加快發布周期;如何能為新小業務提供快速支撐、降低準入門檻;是否足夠開放使得業務方能做到自助式擴展;新需求是否已經在其他事業部有可復用資產等問題。另一方面,整個電商體系涉及的應用高達7000+:要考慮需求的評估是否具有全鏈路視角;業務需求的技術評估是否分析全面、技術方案的影響范圍是否評估到位;業務的全鏈路穩定性保障、調用鏈路監控、強弱依賴等問題。此外面對每天幾百個業務需求,500+個獨立的發布變更:要考慮各業務方的需求發布是否會相互產生影響;需求代碼是否對平臺有侵入、導致平臺腐化;高頻率的需求發布下如何管控質量;能否按業務維度進行業務監控、故障分析等等。
TMF2.0解決的關鍵問題
面對這些挑戰,TMF2.0框架需要六大關鍵問題。
業務可視化:平臺能力、業務規則決定是否對外透出;
需求結構化支持:基于透出的業務能力、已有的業務規則完成需求結構化分解降低溝通成本;
業務配置化:這是可視化的前提,要在需求明確的情況下在線配置業務、快速發布上線;
業務測試一體化:根據修改的代碼進行自動化用例篩選、自動化測試;
業務監控:以精細化的業務維度進行監控,而不僅僅局限于交易大盤;
故障排查:當業務故障時快速拿到故障快照、還原故障現場以及迅速定位問題原因。
針對以上六大關鍵問題,TMF2.0的關鍵設計點有以下三個層面。
首先,需要實現業務/平臺分離插件化架構。平臺提供插件包注冊機制,實現業務方插件包在運行期的注冊。業務代碼只允許存在于插件包中,與平臺代碼嚴格分離。業務包的代碼配置庫也與平臺的代碼庫分離,通過二方包的方式,提供給容器加載。
其次,要統一業務身份。平臺需要能有按“業務身份”進行業務與業務之間邏輯隔離的能力,而不是傳統SPI架構不區分業務身份,簡單過濾的方式。如何設計這個業務身份,也成為業務與業務之間隔離架構的關鍵。
另外,要注重管理域與運行域分離。業務邏輯不能依靠運行期動態計算,要能在靜態期進行定義并可視化呈現。業務定義中出現的規則疊加沖突,也在靜態器進行沖突決策。在運行期,嚴格按照靜態器定義的業務規則、沖突決策策略執行。
下文將針對這三塊的內容分別展開來詳細介紹。
業務定制包與平臺分離的架構
如上所示的業務定制包與平臺分離架構可以分為四個層次。最底層是交易規范層,包括一些交易模型、交易領域的劃分、業務領域的劃分、以及交易啟動環境下的配置項。基于這個理論模型,就可以進行一些定義及規范工作,比如接口定義、流程規范、模型規范等,而且其中的很多內容都可以在不同的領域進行復用。
上面一層是解決方案層。大家都知道阿里巴巴目前正在走國際化的戰略,所以面對不同的市場會構建不同的解決方案,不同的解決方案中也就有自己不同的業務玩法、業務邏輯。所以要將不同的市場解決方案和他們自身的流程、規則結合起來。但是這一過程中會發現,不同的市場解決方案會有很多可以復用的地方,比如營銷模式。所以形成的可復用基礎實現就可以在不同的解決方案中得到復用,所那么在面對不同的市場時就不用考慮可復用基礎實現的內容,只需要關注市場相關的業務就可以了。
往上一層是業務定制層。即使是在一個市場內,也會有各種細分的定制玩法,這些不同的細分點就會有各自不同的業務邏輯,這就是制定業務定制層的原因。團隊會根據底層的需求點來進行一些業務定制包的組裝,就可以實現不同的業務邏輯和玩法了。
在這樣一個復雜的分離架構中,最重要的是要將不同層次間的職責劃分清晰,整個代碼都嚴格地、有意識地進行分離。所以在最后的部署過程中,首先要完成底層業務的復用,然后形成不同市場的解決方案,再在解決方案下對不同的業務實現差異化的點。
業務身份定義標準化
上面所講的是業務和平臺的分離,在業務和平臺分離之后就要進行業務和業務之間的隔離,即統一的業務身份,類似于身份證號碼,在整個交易鏈路上必須是唯一的。業務身份需要通過人、貨、場三個維度進行抽象,比如市場類型、垂直市場、渠道來源等等,確定了這個唯一的業務身份后就可以將業務流程和業務規則進行關聯。
基于業務識別,團隊也提供了一個基于UIL的業務身份識別方案,總體設計基于標準模型來抽象,自定義語法,統一管理模型。事實上,通過樣品模型、買家模型、賣家模型、類目模型這四個維度,99%的商品都可以有效地進行標識。業務身份確定后,就可以按照業務身份維度,對業務配置、部署進行統一管理,在這其中要注意配置隔離性、熱部署、配置回滾、配置確定性等核心要素。
業務管理域與運行域分離的框架
業務身份確定后就要進行業務定義,這其中就涉及管理域和運行域分離的問題。管理域就是指對業務生命周期、業務身份、業務對象進行定義,包括業務流程、業務管理等。這些操作完成之后就會將配置文件下發到,運行域上的各種平臺就會自動解析配置域所下發的配置文件,然后將配置文件解析成業務命令來執行。
在上面所講的業務域中,一個核心的問題就是如何定義業務:核心三要素是業務身份、業務疊加關系、沖突決策,即基于業務協議標準定義業務,執行單元按協議執行業務邏輯。
在業務疊加關系中,業務的復雜度就在于業務規則在不同維度下產生的沖突。業務的復雜度可以分為兩個維度,一個是橫向維度,一個是垂直維度。
垂直維度,也可稱之為“行業”。往往一個特定的“業務對象”(如商品),在靜態期就能確認其具體歸屬于哪個行業。行業與行業之間的業務規則是不會有疊加的。比如,付款超時時間,各可以都設置為1天超時。但“天貓汽車”把超時時間改了,一定不會聯動改其他業務的超時設置。橫向維度,也稱為產品維度,特點有:產品是可以被多個垂直業務所使用的、一個垂直業務是可以使用多個產品的、產品是否生效是需要結合業務會話的。比如,“電子憑證”是否生效,要看用戶是否選擇了“電子憑證”的交付方式。
通過業務復雜度的分析,可以得出一個結論是:一次業務會話完整的規則=1個垂直業務規則集合+ N個水平業務規則集。所以在做業務定義和管理的時候,具體就是在管某一個垂直業務是和哪些橫向業務在疊加。在疊加之后產生的業務沖突又是怎么解決的?要基于這一點進行業務管理。這是比較關鍵的一點。
TMF 2.0的關鍵模型介紹
基于以上的業務域介紹,下面詳細闡述一下TMF 2.0的關鍵模型,主要包括業務配置主線和業務運行主線。
在業務配置主線中,由項目的業務PD來看一下當前業務涉及到哪些業務域,以及這些業務域下面有哪些功能和產品可以去使用,哪些業務點是可以去擴展的。這其中就需要能力域模型的支撐,通過這個模型所透出的結構化數據,來研究平臺中每個域具備的能力、每個能力具有的可變點,從而有針對性地進行設置。在配置模型里,通過關鍵的視圖模板,進行模板透出,然后保存、下發配置數據到業務運行主線。業務配置主線和業務運行主線是相交互的。
基于TMF 2.0關鍵模型,整個交易平臺實現了業務定義可視、可管、可配。業務定義可視化包括系統能力可視化、業務流程可視化、業務規則可視化、產品疊加可視化等;業務可配置,所見即所得的業務規則可配置能力,凡是基于TMF2標準構建的系統均立刻可獲取業務可配置能力,不需做額外的開發;配置版本化,針對業務配置有完善的版本化管理機制,配置推送可實現按版本快速生效或者回退;業務多租戶管理,不同的業務系統之間可以通過租戶完全隔離的。不同的租戶有自己的數據空間,以及配置推送策略。
在實際應用中,基于TMF2.0交易平臺改造效果具體如下:
業務需求平均開發周期縮短至12天。比如汽車4S服務中,在老系統上做了一個月(未完成),新系統7天完成;五道口業務中,在老系統中評估工作量兩個月,新系統12個工作日完成;餓了么業務中,老系統評估要兩周,基于新系統2天完成。
平臺與業務解耦。目前已完成的業務,其業務定制均只存在于業務包;在平臺未改動情況下,業務方的發布更加靈活(有多次單業務發布,不需要其他業務方進行回歸的案例)。
業務資產庫。積累形成了50+業務資產庫,新業務可快速進行快速復制、調整并發布。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/11801.html
摘要:今年的無論是常態全鏈路壓測或者是雙十一當天,面臨的主要問題是如何保障自身系統在海量數據沖擊下的穩定性,以及如何更快的展現各個系統的狀態及更好的幫助開發同學發現及定位問題。在整個雙十一備戰過程中,遇到并解決了很多疑難雜癥。 摘要: EagleEye作為阿里集團老牌的鏈路跟蹤系統,其自身業務雖不在交易鏈路上,但卻監控著全集團的鏈路狀態,特別是在中間件的遠程調用上,覆蓋了集團絕大部分的場景,...
摘要:每秒實時處理超過萬項監控指標,讓異常無所遁形。此外,對于復雜數據庫故障事后排查故障根源現場還原歷史事件追蹤也迫使我們建設一個覆蓋線上所有環境數據庫實例事件的監控系統,做到覆蓋阿里全球子公司所有機房。所有性能指標做到秒級連續不間斷監控。 摘要: 2017雙11再次創下了32.5萬筆/秒交易創建的紀錄,在這個數字后面,更是每秒多達幾千萬次的數據庫寫入,如何大規模進行自動化操作、保證數據庫的...
閱讀 3842·2021-09-06 15:00
閱讀 2177·2019-08-30 15:53
閱讀 3282·2019-08-23 16:44
閱讀 950·2019-08-23 15:19
閱讀 1397·2019-08-23 12:27
閱讀 4196·2019-08-23 11:30
閱讀 589·2019-08-23 10:33
閱讀 374·2019-08-22 16:05