摘要:每個消息都會被一個線程消費,同時最大并發(fā)量為。然后提交一個任務到線程池中,這個任務的內(nèi)容是從等待隊列中取出一個,如果等待隊列為空,則刪除這個等待隊列的。小結本文分析了的久經(jīng)生產(chǎn)考驗的核心組件線程池。
本文首發(fā)于泊浮目的專欄:https://segmentfault.com/blog...前言
在ZStack中,最基本的執(zhí)行單位不僅僅是一個函數(shù),也可以是一個任務(Task。其本質(zhì)實現(xiàn)了Java的Callable接口)。通過大小合理的線程池調(diào)度來并行的消費這些任務,使ZStack這個Iaas軟件有條不紊運行在大型的數(shù)據(jù)中心里。
對線程池不太了解的同學可以先看我的一篇博客:Java多線程筆記(三):線程池演示代碼
在這里,將以ZStack中ThreadFacade最常用的方法為例進行演示。
syncSubmit提交同步任務,線程將會等結果完成后才繼續(xù)下一個任務。
這里先參考ZStack中ApiMediatorImpl ,其中有一段用于API消息調(diào)度的邏輯。
@Override public void handleMessage(final Message msg) { thdf.syncSubmit(new SyncTask
每個API消息都會被一個線程消費,同時最大并發(fā)量為5(apiWorkerNum=5)。每個線程都會等著API消息的回復,等到回復后便給用戶。
chainSubmit提交異步任務,這里的任務執(zhí)行后將會執(zhí)行隊列中的下一個任務,不會等待結果。
參考VmInstanceBase關于虛擬機啟動、重啟、暫停相關的代碼:
//暫停虛擬機 protected void handle(final APIStopVmInstanceMsg msg) { thdf.chainSubmit(new ChainTask(msg) { @Override public String getName() { return String.format("stop-vm-%s", self.getUuid()); } @Override public String getSyncSignature() { return syncThreadName; } @Override public void run(SyncTaskChain chain) { stopVm(msg, chain); } }); } //重啟虛擬機 protected void handle(final APIRebootVmInstanceMsg msg) { thdf.chainSubmit(new ChainTask(msg) { @Override public String getName() { return String.format("reboot-vm-%s", self.getUuid()); } @Override public String getSyncSignature() { return syncThreadName; } @Override public void run(SyncTaskChain chain) { rebootVm(msg, chain); } }); } //啟動虛擬機 protected void handle(final APIStartVmInstanceMsg msg) { thdf.chainSubmit(new ChainTask(msg) { @Override public String getName() { return String.format("start-vm-%s", self.getUuid()); } @Override public String getSyncSignature() { return syncThreadName; } @Override public void run(SyncTaskChain chain) { startVm(msg, chain); } }); }通用特性
getSyncSignature則指定了其隊列的key,這個任務隊列本質(zhì)一個Map。根據(jù)相同的k,將任務作為v按照順序放入map執(zhí)行。單從這里的業(yè)務邏輯來看,可以有效避免虛擬機的狀態(tài)混亂。
chainTask的默認并發(fā)度為1,這意味著它是同步的。在稍后的源碼解析中我們將會看到。它的實現(xiàn)
先從接口ThreadFacade了解一下方法簽名:
public interface ThreadFacade extends Component {Future submit(Task task);//提交一個任務 Future syncSubmit(SyncTask task); //提交一個有返回值的任務 Future chainSubmit(ChainTask task); //提交一個沒有返回值的任務 Future submitPeriodicTask(PeriodicTask task, long delay); //提交一個周期性任務,將在一定時間后執(zhí)行 Future submitPeriodicTask(PeriodicTask task); //提交一個周期性任務 Future submitCancelablePeriodicTask(CancelablePeriodicTask task); //提交一個可以取消的周期性任務 Future submitCancelablePeriodicTask(CancelablePeriodicTask task, long delay); //提交一個可以取消的周期性任務,將在一定時間后執(zhí)行 void registerHook(ThreadAroundHook hook); //注冊鉤子 void unregisterHook(ThreadAroundHook hook); //取消鉤子 ThreadFacadeImpl.TimeoutTaskReceipt submitTimeoutTask(Runnable task, TimeUnit unit, long delay); //提交一個過了一定時間就算超時的任務 void submitTimerTask(TimerTask task, TimeUnit unit, long delay); //提交一個timer任務 }
以及幾個方法邏輯實現(xiàn)類DispatchQueueImpl中的幾個成員變量。
private static final CLogger logger = Utils.getLogger(DispatchQueueImpl.class); @Autowired ThreadFacade _threadFacade; private final HashMapsyncTasks = new HashMap (); private final HashMap chainTasks = new HashMap (); private static final CLogger _logger = CLoggerImpl.getLogger(DispatchQueueImpl.class); public static final String DUMP_TASK_DEBUG_SINGAL = "DumpTaskQueue";
關鍵就是syncTasks(同步隊列)和chainTasks(異步隊列) ,用于存儲兩種類型的任務隊列。
因此當我們提交chainTask時,要注意記得顯示的調(diào)用next方法,避免后面的任務調(diào)度不到。
接著,我們從最常用的幾個方法開始看它的代碼。
chainSubmit方法從ThreadFacadeImpl作為入口
@Override public FuturechainSubmit(ChainTask task) { return dpq.chainSubmit(task); }
DispatchQueue中的邏輯
//公有方法,即入口之一 @Override public FuturechainSubmit(ChainTask task) { return doChainSyncSubmit(task); }
//內(nèi)部邏輯 privateFuture doChainSyncSubmit(final ChainTask task) { assert task.getSyncSignature() != null : "How can you submit a chain task without sync signature ???"; DebugUtils.Assert(task.getSyncLevel() >= 1, String.format("getSyncLevel() must return 1 at least ")); synchronized (chainTasks) { final String signature = task.getSyncSignature(); ChainTaskQueueWrapper wrapper = chainTasks.get(signature); if (wrapper == null) { wrapper = new ChainTaskQueueWrapper(); chainTasks.put(signature, wrapper); } ChainFuture cf = new ChainFuture(task); wrapper.addTask(cf); wrapper.startThreadIfNeeded(); return cf; } }
這段邏輯大致為:
斷言syncSignature不為空,并且必須并行度必須大于等于1。因為1會被做成隊列,由一個線程完成這些任務。而1以上則指定了可以有幾個線程來完成同一個signature的任務。
加鎖HashMap
接下來就是startThreadIfNeeded。所謂ifNeeded就是指給這個隊列的線程數(shù)尚有空余。然后提交一個任務到線程池中,這個任務的內(nèi)容是:從等待隊列中取出一個Feture,如果等待隊列為空,則刪除這個等待隊列的Map。
private class ChainTaskQueueWrapper { LinkedList pendingQueue = new LinkedList(); final LinkedList runningQueue = new LinkedList(); AtomicInteger counter = new AtomicInteger(0); int maxThreadNum = -1; String syncSignature; void addTask(ChainFuture task) { pendingQueue.offer(task); if (maxThreadNum == -1) { maxThreadNum = task.getSyncLevel(); } if (syncSignature == null) { syncSignature = task.getSyncSignature(); } } void startThreadIfNeeded() { //如果運行線程數(shù)量已經(jīng)大于等于限制,不start if (counter.get() >= maxThreadNum) { return; } counter.incrementAndGet(); _threadFacade.submit(new TasksyncSubmit方法() { @Override public String getName() { return "sync-chain-thread"; } // start a new thread every time to avoid stack overflow @AsyncThread private void runQueue() { ChainFuture cf; synchronized (chainTasks) { // remove from pending queue and add to running queue later cf = (ChainFuture) pendingQueue.poll(); if (cf == null) { if (counter.decrementAndGet() == 0) { //并且線程只有一個(跑完就沒了),則將相關的signature隊列移除,避免占用內(nèi)存 chainTasks.remove(syncSignature); } //如果為空,則沒有任務,返回 return; } } synchronized (runningQueue) { // add to running queue runningQueue.offer(cf); } //完成以后將任務挪出運行隊列 cf.run(new SyncTaskChain() { @Override public void next() { synchronized (runningQueue) { runningQueue.remove(cf); } runQueue(); } }); } //這個方法將會被線程池調(diào)用,作為入口 @Override public Void call() throws Exception { runQueue(); return null; } }); } }
syncSubmit的內(nèi)部邏輯與我們之前分析的chainSubmit極為相似,只是放入了不同的隊列中。
同樣,也是從ThreadFacadeImpl作為入口
@Override publicFuture syncSubmit(SyncTask task) { return dpq.syncSubmit(task); }
然后是DispatchQueue中的實現(xiàn)
@Override publicFuture syncSubmit(SyncTask task) { if (task.getSyncLevel() <= 0) { return _threadFacade.submit(task); } else { return doSyncSubmit(task); } }
內(nèi)部邏輯-私有方法
privatesubmitPeriodicTaskFuture doSyncSubmit(final SyncTask syncTask) { assert syncTask.getSyncSignature() != null : "How can you submit a sync task without sync signature ???"; SyncTaskFuture f; synchronized (syncTasks) { SyncTaskQueueWrapper wrapper = syncTasks.get(syncTask.getSyncSignature()); if (wrapper == null) { wrapper = new SyncTaskQueueWrapper(); //放入syncTasks隊列。 syncTasks.put(syncTask.getSyncSignature(), wrapper); } f = new SyncTaskFuture(syncTask); wrapper.addTask(f); wrapper.startThreadIfNeeded(); } return f; }
提交一個定時任務本質(zhì)上是通過了線程池的scheduleAtFixedRate來實現(xiàn)。這個方法用于對任務進行周期性調(diào)度,任務調(diào)度的頻率是一定的,它以上一個任務開始執(zhí)行時間為起點,之后的period時間后調(diào)度下一次任務。如果任務的執(zhí)行時間大于調(diào)度時間,那么任務就會在上一個任務結束后,立即被調(diào)用。
調(diào)用這個方法時將會把任務放入定時任務隊列。當任務出現(xiàn)異常時,將會取消這個Futrue,并且挪出隊列。
public FuturesubmitCancelablePeriodicTasksubmitPeriodicTask(final PeriodicTask task, long delay) { assert task.getInterval() != 0; assert task.getTimeUnit() != null; ScheduledFuture ret = (ScheduledFuture ) _pool.scheduleAtFixedRate(new Runnable() { public void run() { try { task.run(); } catch (Throwable e) { _logger.warn("An unhandled exception happened during executing periodic task: " + task.getName() + ", cancel it", e); final Map > periodicTasks = getPeriodicTasks(); final ScheduledFuture> ft = periodicTasks.get(task); if (ft != null) { ft.cancel(true); periodicTasks.remove(task); } else { _logger.warn("Not found feature for task " + task.getName() + ", the exception happened too soon, will try to cancel the task next time the exception happens"); } } } }, delay, task.getInterval(), task.getTimeUnit()); _periodicTasks.put(task, ret); return ret; }
而submitCancelablePeriodicTask則是會在執(zhí)行時檢測ScheduledFuture是否被要求cancel,如果有要求則取消。
@Override public Future初始化操作submitCancelablePeriodicTask(final CancelablePeriodicTask task, long delay) { ScheduledFuture ret = (ScheduledFuture ) _pool.scheduleAtFixedRate(new Runnable() { private void cancelTask() { ScheduledFuture> ft = cancelablePeriodicTasks.get(task); if (ft != null) { ft.cancel(true); cancelablePeriodicTasks.remove(task); } else { _logger.warn("cannot find feature for task " + task.getName() + ", the exception happened too soon, will try to cancel the task next time the exception happens"); } } public void run() { try { boolean cancel = task.run(); if (cancel) { cancelTask(); } } catch (Throwable e) { _logger.warn("An unhandled exception happened during executing periodic task: " + task.getName() + ", cancel it", e); cancelTask(); } } }, delay, task.getInterval(), task.getTimeUnit()); cancelablePeriodicTasks.put(task, ret); return ret; }
不同與通常的ZStack組件,它雖然實現(xiàn)了Component接口。但是其start中的邏輯并不全面,初始化邏輯是基于spring bean的生命周期來做的。見ThreadFacade。
再讓回頭看看ThreadFacadeImpl的init與destory操作。
//init 操作 public void init() { //根據(jù)全局配置讀入線程池最大線程數(shù)量 totalThreadNum = ThreadGlobalProperty.MAX_THREAD_NUM; if (totalThreadNum < 10) { _logger.warn(String.format("ThreadFacade.maxThreadNum is configured to %s, which is too small for running zstack. Change it to 10", ThreadGlobalProperty.MAX_THREAD_NUM)); totalThreadNum = 10; } // 構建一個支持延時任務的線程池 _pool = new ScheduledThreadPoolExecutorExt(totalThreadNum, this, this); _logger.debug(String.format("create ThreadFacade with max thread number:%s", totalThreadNum)); //構建一個DispatchQueue dpq = new DispatchQueueImpl(); jmxf.registerBean("ThreadFacade", this); }
//destory public void destroy() { _pool.shutdownNow(); }
看了這里可能大家會有疑問,這種關閉方式未免關于暴力(執(zhí)行任務的線程會全部被中斷)。在此之前,我們曾提到過,它實現(xiàn)了Component接口。這個接口分別有一個start和stop方法,使一個組件的生命周期能夠方便的在ZStack中注冊相應的鉤子。
//stop 方法 @Override public boolean stop() { _pool.shutdown(); timerPool.stop(); return true; }線程工廠
ThreadFacadeImpl同時也實現(xiàn)了ThreadFactory,可以讓線程在創(chuàng)建時做一些操作。
@Override public Thread newThread(Runnable arg0) { return new Thread(arg0, "zs-thread-" + String.valueOf(seqNum.getAndIncrement())); }
在這里可以看到ZStack為每一個新的線程賦予了一個名字。
線程池ZStack對JDK中的線程池進行了一定的擴展,對一個任務執(zhí)行前后都有相應的鉤子函數(shù),同時也開放注冊鉤子。
package org.zstack.core.thread; import org.apache.logging.log4j.ThreadContext; import org.zstack.utils.logging.CLogger; import org.zstack.utils.logging.CLoggerImpl; import java.util.ArrayList; import java.util.List; import java.util.concurrent.RejectedExecutionHandler; import java.util.concurrent.ScheduledThreadPoolExecutor; import java.util.concurrent.ThreadFactory; public class ScheduledThreadPoolExecutorExt extends ScheduledThreadPoolExecutor { private static final CLogger _logger =CLoggerImpl.getLogger(ScheduledThreadPoolExecutorExt.class); List_hooks = new ArrayList (8); public ScheduledThreadPoolExecutorExt(int corePoolSize, ThreadFactory threadFactory, RejectedExecutionHandler handler) { super(corePoolSize, threadFactory, handler); this.setMaximumPoolSize(corePoolSize); } public void registerHook(ThreadAroundHook hook) { synchronized (_hooks) { _hooks.add(hook); } } public void unregisterHook(ThreadAroundHook hook) { synchronized (_hooks) { _hooks.remove(hook); } } @Override protected void beforeExecute(Thread t, Runnable r) { ThreadContext.clearMap(); ThreadContext.clearStack(); ThreadAroundHook debugHook = null; List tmpHooks; synchronized (_hooks) { tmpHooks = new ArrayList (_hooks); } for (ThreadAroundHook hook : tmpHooks) { debugHook = hook; try { hook.beforeExecute(t, r); } catch (Exception e) { _logger.warn("Unhandle exception happend during executing ThreadAroundHook: " + debugHook.getClass().getCanonicalName(), e); } } } @Override protected void afterExecute(Runnable r, Throwable t) { ThreadContext.clearMap(); ThreadContext.clearStack(); ThreadAroundHook debugHook = null; List tmpHooks; synchronized (_hooks) { tmpHooks = new ArrayList (_hooks); } for (ThreadAroundHook hook : tmpHooks) { debugHook = hook; try { hook.afterExecute(r, t); } catch (Exception e) { _logger.warn("Unhandle exception happend during executing ThreadAroundHook: " + debugHook.getClass().getCanonicalName(), e); } } } }
另外,ScheduledThreadPoolExecutorExt是繼承自ScheduledThreadPoolExecutor。本質(zhì)上是一個任務調(diào)度線程池,用的工作隊列也是一個延時工作隊列。
小結本文分析了ZStack的久經(jīng)生產(chǎn)考驗的核心組件——線程池。通過線程池,使并行編程變得不再那么復雜。
當然,其中也有一些可以改進的地方:
一些加鎖的地方(synchronized),可以通過使用并發(fā)容器解決。這樣可以有效提升吞吐量,節(jié)省因為競爭鎖而導致的開銷。
在提交大量任務的情況下,HashMap會因為擴容而導致性能耗損。可以考慮換一種Map或在不同的策略下使HashMap的初始大小有個較為合理的設置。
隊列是無界的。在大量任務請求時,會對內(nèi)存造成極大的負擔。
任務隊列無超時邏輯判斷。ZStack中的調(diào)用絕大多數(shù)都是由MQ完成,每一個msg有著對應的超時時間。但是每一個任務卻沒有超時判定,這意味著一個任務執(zhí)行時間過長時,后面的任務有可能進入了超時狀態(tài),而卻沒有挪出隊列,配合之前提到的無界隊列,就是一場潛在的災難。
文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/70783.html
摘要:本文首發(fā)于泊浮目的專欄在語言中,有一個關鍵字叫做其作用是在函數(shù)前執(zhí)行。一般有兩種用法在該函數(shù)拋出異常時執(zhí)行。在該函數(shù)返回前執(zhí)行。這里的放入來自系統(tǒng)啟動時利用反射所做的一個行為。因此并不會影響使用時的性能。 本文首發(fā)于泊浮目的專欄:https://segmentfault.com/blog... 在Go語言中,有一個關鍵字叫做defer——其作用是在函數(shù)return前執(zhí)行。在ZStac...
摘要:本文首發(fā)于泊浮目的專欄在語言中,有一個關鍵字叫做其作用是在函數(shù)前執(zhí)行。一般有兩種用法在該函數(shù)拋出異常時執(zhí)行。在該函數(shù)返回前執(zhí)行。這里的放入來自系統(tǒng)啟動時利用反射所做的一個行為。因此并不會影響使用時的性能。 本文首發(fā)于泊浮目的專欄:https://segmentfault.com/blog... 在Go語言中,有一個關鍵字叫做defer——其作用是在函數(shù)return前執(zhí)行。在ZStac...
摘要:因為這個狀態(tài)下,是交給一個線程在執(zhí)行的,見源碼剖析之核心庫鑒賞中的分析。并且允許等行為。上面提到過,允許運行暫停取消等行為。維護和相應的之間的關系。則停止執(zhí)行并觸發(fā)之前的所有。 本文首發(fā)于泊浮目的專欄:https://segmentfault.com/blog... 前言 在ZStack中,當用戶在UI上發(fā)起操作時,前端會調(diào)用后端的API對實際的資源發(fā)起操作請求。但在一個分布式系統(tǒng)中...
摘要:但在實際的二次開發(fā)中,這些做法未必能夠完全滿足需求。在源碼剖析之核心庫鑒賞一文中,我們了解到是的基礎設施之一,同時也允許通過顯示聲明的方式來聲明。同理,一些也可以使用繼承進行擴展。 本文首發(fā)于泊浮目的專欄:https://segmentfault.com/blog... 前言 在ZStack博文-5.通用插件系統(tǒng)中,官方提出了幾個較為經(jīng)典的擴展方式。但在實際的二次開發(fā)中,這些做法未必...
摘要:下面將開始分析它的源碼。僅僅定義了一個最小應有的行為。更好的選擇由于該庫是為定制而生,故此有一些防御性判斷,源碼顯得略為。 本文首發(fā)于泊浮目的專欄:https://segmentfault.com/blog... 前言 在ZStack(或者說產(chǎn)品化的IaaS軟件)中的任務通常有很長的執(zhí)行路徑,錯誤可能發(fā)生在路徑的任意一處。為了保證系統(tǒng)的正確性,需提供一種較為完善的回滾機制——在ZSt...
閱讀 1439·2019-08-29 17:14
閱讀 1646·2019-08-29 12:12
閱讀 727·2019-08-29 11:33
閱讀 3261·2019-08-28 18:27
閱讀 1442·2019-08-26 10:19
閱讀 904·2019-08-23 18:18
閱讀 3525·2019-08-23 16:15
閱讀 2539·2019-08-23 14:14