摘要:僅值班時(shí)間及前后半個(gè)小時(shí)內(nèi)打卡有效。上班下班均須打卡,缺打卡則視為未值班。分析表格我的指紋考勤機(jī)可以一次導(dǎo)出最多一個(gè)月的打卡記錄。有一個(gè)問題是,這一個(gè)月可能橫跨兩個(gè)月,也可能橫跨一年。分析當(dāng)月當(dāng)年的考勤記錄同理,不過可能稍微復(fù)雜一些。
前面的話
今天公司突然有個(gè)緊急任務(wù)是讀取excel表格,然后清洗并展示里面的數(shù)據(jù)。
分配給我的任務(wù)是!!!
寫網(wǎng)頁前端表單=。=
媽蛋,可是我很想分析一下數(shù)據(jù)啊!!!
然后突然想起來協(xié)會(huì)(大學(xué)的社團(tuán))的指紋考勤機(jī)一直沒怎么用好,要不就把打卡數(shù)據(jù)拷出來分析吧!!做成每天、每周、每月、每年的考勤記錄分析!!!
恰好前幾天上級(jí)讓我學(xué)習(xí)可視化,順帶練練手。
喲西,開干!
所用拓展模塊
xlrd:
Python語言中,讀取Excel的擴(kuò)展工具。可以實(shí)現(xiàn)指定表單、指定單元格的讀取。 使用前須安裝。 下載地址:https://pypi.python.org/pypi/xlrd 解壓后cd到解壓目錄,執(zhí)行 python setup.py install 即可
datetime:
Python內(nèi)置用于操作日期時(shí)間的模塊擬實(shí)現(xiàn)功能模塊
讀xls文件并錄入數(shù)據(jù)庫(kù)
根據(jù)年、月、日三個(gè)參數(shù)獲取當(dāng)天的值班情況
餅狀圖(當(dāng)天完成值班任務(wù)人數(shù)/當(dāng)天未完成值班任務(wù)人數(shù))
瀑布圖(當(dāng)天所有值班人員的值班情況)
根據(jù)年、月兩個(gè)參數(shù)獲取當(dāng)月的值班情況
根據(jù)年參數(shù)獲取當(dāng)年的值班情況
值班制度每天一共有6班:
8:00 - 9:45
9:45 - 11:20
13:30 - 15:10
15:10 - 17:00
17:00 - 18:35
19:00 - 22:00
每個(gè)人每天最多值一班。
僅值班時(shí)間及前后半個(gè)小時(shí)內(nèi)打卡有效。
上班、下班均須打卡,缺打卡則視為未值班。
分析Excel表格我的指紋考勤機(jī)可以一次導(dǎo)出最多一個(gè)月的打卡記錄。有一個(gè)問題是,這一個(gè)月可能橫跨兩個(gè)月,也可能橫跨一年。比如:2015年03月21日-2015年04月20日、2014年12月15日-2015年01月05日。所以寫處理方法的時(shí)候一定要注意這個(gè)坑。
導(dǎo)出的表格如圖所示:
=。=看起來好像基本沒人值班,對(duì),就是這樣。
大家都好懶T。T
Sign...
簡(jiǎn)單分析一下,
考勤記錄表是文件的第三個(gè)sheet
第三行有起止時(shí)間
第四行是所有日期的數(shù)字
接下來每?jī)尚校旱谝恍袨?b>用戶信息;第二行為考勤記錄
思路決定用3個(gè)collection分別儲(chǔ)存相關(guān)信息:
user:用戶信息,包含id、name、dept
record:考勤記錄,包含id(用戶id)、y(年)、m(月)、d(日)、check(打卡記錄)
duty:值班安排,包含id(星期數(shù),例:1表示星期一)、list(值班人員id列表)、user_id:["start_time","end_time"](用戶值班開始時(shí)間和結(jié)束時(shí)間)
讀取xls文件,將新的考勤記錄和新的用戶存入數(shù)據(jù)庫(kù)。
根據(jù)年月日參數(shù)查詢對(duì)應(yīng)record,查詢當(dāng)天的值班安排,匹配獲得當(dāng)天值班同學(xué)的考勤記錄。將值班同學(xué)的打卡時(shí)間和值班時(shí)間比對(duì),判斷是否正常打卡,計(jì)算實(shí)際值班時(shí)長(zhǎng)、實(shí)際值班百分比。
之后輸出json格式數(shù)據(jù),用echarts生成圖表。
分析當(dāng)月、當(dāng)年的考勤記錄同理,不過可能稍微復(fù)雜一些。
源碼所有的講解和具體思路都放在源碼注釋里,請(qǐng)繼續(xù)往下看源碼吧~
main.py
#!/usr/bin/env python # -*- coding: utf-8 -*- import os.path import tornado.auth import tornado.escape import tornado.httpserver import tornado.ioloop import tornado.options import tornado.web from tornado.options import define, options import pymongo import time import datetime import xlrd define("port", default=8007, help="run on the given port", type=int) class Application(tornado.web.Application): def __init__(self): handlers = [ (r"/", MainHandler), (r"/read", ReadHandler), (r"/day", DayHandler), ] settings = dict( template_path=os.path.join(os.path.dirname(__file__), "templates"), static_path=os.path.join(os.path.dirname(__file__), "static"), debug=True, ) conn = pymongo.Connection("localhost", 27017) self.db = conn["kaoqin"] tornado.web.Application.__init__(self, handlers, **settings) class MainHandler(tornado.web.RequestHandler): def get(self): pass class ReadHandler(tornado.web.RequestHandler): def get(self): #獲取collection coll_record = self.application.db.record coll_user = self.application.db.user #讀取excel表格 table = xlrd.open_workbook("/Users/ant/Webdev/python/excel/data.xls") #讀取打卡記錄sheet sheet=table.sheet_by_index(2) #讀取打卡月份范圍 row3 = sheet.row_values(2) m1 = int(row3[2][5:7]) m2 = int(row3[2][18:20]) #設(shè)置當(dāng)前年份 y = int(row3[2][0:4]) #設(shè)置當(dāng)前月份為第一個(gè)月份 m = m1 #讀取打卡日期范圍 row4 = sheet.row_values(3) #初始化上一天 lastday = row4[0] #遍歷第四行中的日期 for d in row4: #如果日期小于上一個(gè)日期 #說明月份增大,則修改當(dāng)前月份為第二個(gè)月份 if d < lastday: m = m2 #如果當(dāng)前兩個(gè)月份分別為12月和1月 #說明跨年了,所以年份 +1 if m1 == 12 and m2 == 1: y = y + 1 #用n計(jì)數(shù),范圍為 3 到(總行數(shù)/2+1) #(總行數(shù)/2+1)- 3 = 總用戶數(shù) #即遍歷所有用戶 for n in range(3, sheet.nrows/2+1): #取該用戶的第一行,即用戶信息行 row_1 = sheet.row_values(n*2-2) #獲取用戶id u_id = row_1[2] #獲取用戶姓名 u_name = row_1[10] #獲取用戶部門 u_dept = row_1[20] #查詢?cè)撚脩? user = coll_user.find_one({"id":u_id}) #如果數(shù)據(jù)庫(kù)中不存在該用戶則創(chuàng)建新用戶 if not user: user = dict() user["id"] = u_id user["name"] = u_name user["dept"] = u_dept coll_user.insert(user) #取該用戶的第二行,即考勤記錄行 row_2 = sheet.row_values(n*2-1) #獲取改當(dāng)前日期的下標(biāo) idx = row4.index(d) #獲取當(dāng)前用戶當(dāng)前日期的考勤記錄 check_data = row_2[idx] #初始化空考勤記錄列表 check = list() #5個(gè)字符一組,遍歷考勤記錄并存入考勤記錄列表 for i in range(0,len(check_data)/5): check.append(check_data[i*5:i*5+5]) #查詢當(dāng)前用戶當(dāng)天記錄 record = coll_record.find_one({"y":y, "m":m, "d":d, "id":user["id"]}) #如果記錄存在則更新記錄 if record: for item in check: #將新的考勤記錄添加進(jìn)之前的記錄 if item not in record["check"]: record["check"].append(item) coll_record.save(record) #如果記錄不存在則插入新紀(jì)錄 else: record = {"y":y, "m":m, "d":d, "id":user["id"], "check":check} coll_record.insert(record) class DayHandler(tornado.web.RequestHandler): def get(self): #獲取年月日參數(shù) y = self.get_argument("y",None) m = self.get_argument("m",None) d = self.get_argument("d",None) #判斷參數(shù)是否設(shè)置齊全 if y and m and d: #將參數(shù)轉(zhuǎn)換為整型數(shù),方便使用 y = int(y) m = int(m) d = int(d) #獲取當(dāng)天所有記錄 coll_record = self.application.db.record record = coll_record.find({"y":y, "m":m, "d":d}) #獲取當(dāng)天為星期幾 weekday = datetime.datetime(y,m,d).strftime("%w") #獲取當(dāng)天值班表 coll_duty = self.application.db.duty duty = coll_duty.find_one({"id":int(weekday)}) #初始化空目標(biāo)記錄(當(dāng)天值班人員記錄) target = list() #遍歷當(dāng)天所有記錄 for item in record: #當(dāng)該記錄的用戶當(dāng)天有值班任務(wù)時(shí),計(jì)算并存入target數(shù)組 if int(item["id"]) in duty["list"]: #通過用戶id獲取該用戶值班起止時(shí)間 start = duty[item["id"]][0] end = duty[item["id"]][1] #計(jì)算值班時(shí)長(zhǎng)/秒 date1 = datetime.datetime(y,m,d,int(start[:2]),int(start[-2:])) date2 = datetime.datetime(y,m,d,int(end[:2]),int(end[-2:])) item["length"] = (date2 - date1).seconds #初始化實(shí)際值班百分比 item["per"] = 0 #初始化上下班打卡時(shí)間 item["start"] = 0 item["end"] = 0 #遍歷該用戶打卡記錄 for t in item["check"]: #當(dāng)比值班時(shí)間來得早 if t < start: #計(jì)算時(shí)間差 date1 = datetime.datetime(y,m,d,int(start[:2]),int(start[-2:])) date2 = datetime.datetime(y,m,d,int(t[:2]),int(t[-2:])) dif = (date1 - date2).seconds #當(dāng)打卡時(shí)間在值班時(shí)間前半小時(shí)內(nèi) if dif <= 1800: #上班打卡成功 item["start"] = start elif t < end: #如果還沒上班打卡 if not item["start"]: #則記錄當(dāng)前時(shí)間為上班打卡時(shí)間 item["start"] = t else: #否則記錄當(dāng)前時(shí)間為下班打卡時(shí)間 item["end"] = t else: #如果已經(jīng)上班打卡 if item["start"]: #計(jì)算時(shí)間差 date1 = datetime.datetime(y,m,d,int(end[:2]),int(end[-2:])) date2 = datetime.datetime(y,m,d,int(t[:2]),int(t[-2:])) dif = (date1 - date2).seconds #當(dāng)打卡時(shí)間在值班時(shí)間后半小時(shí)內(nèi) if dif <= 1800: #下班打卡成功 item["end"] = end #當(dāng)上班下班均打卡 if item["start"] and item["end"]: #計(jì)算實(shí)際值班時(shí)長(zhǎng) date1 = datetime.datetime(y,m,d,int(item["start"][:2]),int(item["start"][-2:])) date2 = datetime.datetime(y,m,d,int(item["end"][:2]),int(item["end"][-2:])) dif = (date2 - date1).seconds #計(jì)算(實(shí)際值班時(shí)長(zhǎng)/值班時(shí)長(zhǎng))百分比 item["per"] = int(dif/float(item["length"]) * 100) else: #未正常上下班則視為未值班 item["start"] = 0 item["end"] = 0 #將記錄添加到target數(shù)組中 target.append(item) #輸出數(shù)據(jù) self.render("index.html", target = target ) def main(): tornado.options.parse_command_line() http_server = tornado.httpserver.HTTPServer(Application()) http_server.listen(options.port) tornado.ioloop.IOLoop.instance().start() if __name__ == "__main__": main()
index.html
{ {% for item in target %} { "id":{{ item["id"] }}, "start":{{ item["start"] }}, "end":{{ item["end"] }}, "length":{{ item["length"] }}, "per":{{ item["per"] }} } {% end %} }最后
暫時(shí)只寫到讀文件和查詢某天值班情況,之后會(huì)繼續(xù)按照之前的計(jì)劃把這個(gè)小應(yīng)用寫完的。
因?yàn)樯婕暗揭欢研』锇榈碾[私,所以沒有把測(cè)試文件發(fā)上來。不過如果有想實(shí)際運(yùn)行看看的同學(xué)可以跟我說,我把文件發(fā)給你。
可能用到的一條數(shù)據(jù)庫(kù)插入語句:db.duty.insert({"id":5,"list":[1,2],1:["19:00","22:00"],2:["19:00","22:00"]})
希望對(duì)像我一樣的beginner們有幫助!
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/37507.html
摘要:項(xiàng)目簡(jiǎn)介本文將介紹一個(gè)筆者自己的項(xiàng)目自制簡(jiǎn)單的詩(shī)歌搜索系統(tǒng)。該項(xiàng)目使用的模塊為其中,模塊和模塊用來制作爬蟲,爬取網(wǎng)上的詩(shī)歌。 項(xiàng)目簡(jiǎn)介 ??本文將介紹一個(gè)筆者自己的項(xiàng)目:自制簡(jiǎn)單的詩(shī)歌搜索系統(tǒng)。該系統(tǒng)主要的實(shí)現(xiàn)功能如下:指定一個(gè)關(guān)鍵詞,檢索出包含這個(gè)關(guān)鍵詞的詩(shī)歌,比如關(guān)鍵詞為白云,則檢索出的詩(shī)歌可以為王維的《送別》,內(nèi)容為下馬飲君酒,問君何所之?君言不得意,歸臥南山陲。但去莫復(fù)問,白云...
摘要:上一篇文章開篇下一篇文章第一章異步及協(xié)程基礎(chǔ)第二節(jié)關(guān)鍵字協(xié)程是種推薦的編程方式,使用協(xié)程可以開發(fā)出簡(jiǎn)捷高效的異步處理代碼。同步操作,導(dǎo)致進(jìn)程阻塞,直到操作完成異步操作,不會(huì)導(dǎo)致請(qǐng)求進(jìn)程阻塞。 上一篇文章:Python:Tornado 開篇下一篇文章:Python:Tornado 第一章:異步及協(xié)程基礎(chǔ):第二節(jié):Python關(guān)鍵字yield 協(xié)程是Tornado種推薦的編程方式,使用協(xié)...
摘要:學(xué)習(xí)筆記七數(shù)學(xué)形態(tài)學(xué)關(guān)注的是圖像中的形狀,它提供了一些方法用于檢測(cè)形狀和改變形狀。學(xué)習(xí)筆記十一尺度不變特征變換,簡(jiǎn)稱是圖像局部特征提取的現(xiàn)代方法基于區(qū)域圖像塊的分析。本文的目的是簡(jiǎn)明扼要地說明的編碼機(jī)制,并給出一些建議。 showImg(https://segmentfault.com/img/bVRJbz?w=900&h=385); 前言 開始之前,我們先來看這樣一個(gè)提問: pyth...
摘要:主要是為了實(shí)現(xiàn)系統(tǒng)之間的雙向解耦而實(shí)現(xiàn)的。問題及優(yōu)化隊(duì)列過長(zhǎng)問題使用上述方案的異步非阻塞可能會(huì)依賴于的任務(wù)隊(duì)列長(zhǎng)度,若隊(duì)列中的任務(wù)過多,則可能導(dǎo)致長(zhǎng)時(shí)間等待,降低效率。 Tornado和Celery介紹 1.Tornado Tornado是一個(gè)用python編寫的一個(gè)強(qiáng)大的、可擴(kuò)展的異步HTTP服務(wù)器,同時(shí)也是一個(gè)web開發(fā)框架。tornado是一個(gè)非阻塞式web服務(wù)器,其速度相當(dāng)快。...
閱讀 2492·2021-09-28 09:36
閱讀 1486·2021-09-22 15:33
閱讀 3636·2019-08-30 15:44
閱讀 1743·2019-08-29 13:14
閱讀 3132·2019-08-29 11:17
閱讀 1441·2019-08-29 11:03
閱讀 2905·2019-08-26 17:10
閱讀 681·2019-08-26 12:13