Tornado數(shù)據(jù)分析及數(shù)據(jù)可視化（一）

Simon 發(fā)布于2019-07-24 17:56 / 3563人閱讀

摘要：僅值班時(shí)間及前后半個(gè)小時(shí)內(nèi)打卡有效。上班下班均須打卡，缺打卡則視為未值班。分析表格我的指紋考勤機(jī)可以一次導(dǎo)出最多一個(gè)月的打卡記錄。有一個(gè)問題是，這一個(gè)月可能橫跨兩個(gè)月，也可能橫跨一年。分析當(dāng)月當(dāng)年的考勤記錄同理，不過可能稍微復(fù)雜一些。

前面的話

今天公司突然有個(gè)緊急任務(wù)是讀取excel表格，然后清洗并展示里面的數(shù)據(jù)。
分配給我的任務(wù)是！！！

寫網(wǎng)頁前端表單=。=

媽蛋，可是我很想分析一下數(shù)據(jù)啊！！！

然后突然想起來協(xié)會(huì)（大學(xué)的社團(tuán)）的指紋考勤機(jī)一直沒怎么用好，要不就把打卡數(shù)據(jù)拷出來分析吧！！做成每天、每周、每月、每年的考勤記錄分析！！！
恰好前幾天上級(jí)讓我學(xué)習(xí)可視化，順帶練練手。

喲西，開干！

所用拓展模塊

xlrd:

Python語言中，讀取Excel的擴(kuò)展工具。可以實(shí)現(xiàn)指定表單、指定單元格的讀取。
使用前須安裝。
下載地址：https://pypi.python.org/pypi/xlrd
解壓后cd到解壓目錄，執(zhí)行 python setup.py install 即可

datetime:

Python內(nèi)置用于操作日期時(shí)間的模塊

擬實(shí)現(xiàn)功能模塊

讀xls文件并錄入數(shù)據(jù)庫(kù)

根據(jù)年、月、日三個(gè)參數(shù)獲取當(dāng)天的值班情況

餅狀圖（當(dāng)天完成值班任務(wù)人數(shù)/當(dāng)天未完成值班任務(wù)人數(shù)）

瀑布圖（當(dāng)天所有值班人員的值班情況）

根據(jù)年、月兩個(gè)參數(shù)獲取當(dāng)月的值班情況

根據(jù)年參數(shù)獲取當(dāng)年的值班情況

值班制度

每天一共有6班：

8：00 - 9：45

9：45 - 11：20

13：30 - 15：10

15：10 - 17：00

17：00 - 18：35

19：00 - 22：00

每個(gè)人每天最多值一班。

僅值班時(shí)間及前后半個(gè)小時(shí)內(nèi)打卡有效。

上班、下班均須打卡，缺打卡則視為未值班。

分析Excel表格

我的指紋考勤機(jī)可以一次導(dǎo)出最多一個(gè)月的打卡記錄。有一個(gè)問題是，這一個(gè)月可能橫跨兩個(gè)月，也可能橫跨一年。比如：2015年03月21日-2015年04月20日、2014年12月15日-2015年01月05日。所以寫處理方法的時(shí)候一定要注意這個(gè)坑。

導(dǎo)出的表格如圖所示：

  =。=看起來好像基本沒人值班，對(duì)，就是這樣。

  大家都好懶T。T

  Sign...

簡(jiǎn)單分析一下，

考勤記錄表是文件的第三個(gè)sheet

第三行有起止時(shí)間

第四行是所有日期的數(shù)字

接下來每?jī)尚校旱谝恍袨?b>用戶信息；第二行為考勤記錄

思路

決定用3個(gè)collection分別儲(chǔ)存相關(guān)信息：

user：用戶信息，包含id、name、dept

record：考勤記錄，包含id（用戶id）、y（年）、m（月）、d（日）、check（打卡記錄）

duty：值班安排，包含id（星期數(shù)，例：1表示星期一）、list（值班人員id列表）、user_id：["start_time","end_time"]（用戶值班開始時(shí)間和結(jié)束時(shí)間）

讀取xls文件，將新的考勤記錄和新的用戶存入數(shù)據(jù)庫(kù)。

根據(jù)年月日參數(shù)查詢對(duì)應(yīng)record，查詢當(dāng)天的值班安排，匹配獲得當(dāng)天值班同學(xué)的考勤記錄。將值班同學(xué)的打卡時(shí)間和值班時(shí)間比對(duì)，判斷是否正常打卡，計(jì)算實(shí)際值班時(shí)長(zhǎng)、實(shí)際值班百分比。

之后輸出json格式數(shù)據(jù)，用echarts生成圖表。

分析當(dāng)月、當(dāng)年的考勤記錄同理，不過可能稍微復(fù)雜一些。

  所有的講解和具體思路都放在源碼注釋里，請(qǐng)繼續(xù)往下看源碼吧~

源碼

main.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import os.path

import tornado.auth
import tornado.escape
import tornado.httpserver
import tornado.ioloop
import tornado.options
import tornado.web
from tornado.options import define, options

import pymongo
import time
import datetime
import xlrd

define("port", default=8007, help="run on the given port", type=int)

class Application(tornado.web.Application):
    def __init__(self):
        handlers = [
            (r"/", MainHandler),
            (r"/read", ReadHandler),
            (r"/day", DayHandler),
        ]
        settings = dict(
            template_path=os.path.join(os.path.dirname(__file__), "templates"),
            static_path=os.path.join(os.path.dirname(__file__), "static"),
            debug=True,
            )
        conn = pymongo.Connection("localhost", 27017)
        self.db = conn["kaoqin"]
        tornado.web.Application.__init__(self, handlers, **settings)


class MainHandler(tornado.web.RequestHandler):
    def get(self):
        pass

class ReadHandler(tornado.web.RequestHandler):
    def get(self):
        #獲取collection
        coll_record = self.application.db.record
        coll_user = self.application.db.user
        #讀取excel表格
        table = xlrd.open_workbook("/Users/ant/Webdev/python/excel/data.xls")
        #讀取打卡記錄sheet
        sheet=table.sheet_by_index(2)
        #讀取打卡月份范圍
        row3 = sheet.row_values(2)
        m1 = int(row3[2][5:7])
        m2 = int(row3[2][18:20])
        #設(shè)置當(dāng)前年份
        y = int(row3[2][0:4])
        #設(shè)置當(dāng)前月份為第一個(gè)月份
        m = m1
        #讀取打卡日期范圍
        row4 = sheet.row_values(3)
        #初始化上一天
        lastday = row4[0]
        #遍歷第四行中的日期
        for d in row4:
            #如果日期小于上一個(gè)日期
            #說明月份增大，則修改當(dāng)前月份為第二個(gè)月份
            if d < lastday:
                m = m2
                #如果當(dāng)前兩個(gè)月份分別為12月和1月
                #說明跨年了，所以年份 +1
                if m1 == 12 and m2 == 1:
                    y = y + 1
            #用n計(jì)數(shù)，范圍為 3 到（總行數(shù)/2+1）
            #（總行數(shù)/2+1）- 3 = 總用戶數(shù)
            #即遍歷所有用戶
            for n in range(3, sheet.nrows/2+1):
                #取該用戶的第一行，即用戶信息行
                row_1 = sheet.row_values(n*2-2)
                #獲取用戶id
                u_id = row_1[2]
                #獲取用戶姓名
                u_name = row_1[10]
                #獲取用戶部門
                u_dept = row_1[20]
                #查詢?cè)撚脩?                user = coll_user.find_one({"id":u_id})
                #如果數(shù)據(jù)庫(kù)中不存在該用戶則創(chuàng)建新用戶
                if not user:
                    user = dict()
                    user["id"] = u_id
                    user["name"] = u_name
                    user["dept"] = u_dept
                    coll_user.insert(user)
                #取該用戶的第二行，即考勤記錄行
                row_2 = sheet.row_values(n*2-1)
                #獲取改當(dāng)前日期的下標(biāo)
                idx = row4.index(d)
                #獲取當(dāng)前用戶當(dāng)前日期的考勤記錄
                check_data = row_2[idx]
                #初始化空考勤記錄列表
                check = list()
                #5個(gè)字符一組，遍歷考勤記錄并存入考勤記錄列表
                for i in range(0,len(check_data)/5):
                    check.append(check_data[i*5:i*5+5])
                #查詢當(dāng)前用戶當(dāng)天記錄
                record = coll_record.find_one({"y":y, "m":m, "d":d, "id":user["id"]})
                #如果記錄存在則更新記錄
                if record:
                    for item in check:
                        #將新的考勤記錄添加進(jìn)之前的記錄
                        if item not in record["check"]:
                            record["check"].append(item)
                            coll_record.save(record)
                #如果記錄不存在則插入新紀(jì)錄
                else:
                    record = {"y":y, "m":m, "d":d, "id":user["id"], "check":check}
                    coll_record.insert(record)





class DayHandler(tornado.web.RequestHandler):
    def get(self):
        #獲取年月日參數(shù)
        y = self.get_argument("y",None)
        m = self.get_argument("m",None)
        d = self.get_argument("d",None)
        #判斷參數(shù)是否設(shè)置齊全
        if y and m and d:
            #將參數(shù)轉(zhuǎn)換為整型數(shù)，方便使用
            y = int(y)
            m = int(m)
            d = int(d)
            #獲取當(dāng)天所有記錄
            coll_record = self.application.db.record
            record = coll_record.find({"y":y, "m":m, "d":d})
            #獲取當(dāng)天為星期幾
            weekday = datetime.datetime(y,m,d).strftime("%w")
            #獲取當(dāng)天值班表
            coll_duty = self.application.db.duty
            duty = coll_duty.find_one({"id":int(weekday)})
            #初始化空目標(biāo)記錄（當(dāng)天值班人員記錄）
            target = list()
            #遍歷當(dāng)天所有記錄
            for item in record:
                #當(dāng)該記錄的用戶當(dāng)天有值班任務(wù)時(shí)，計(jì)算并存入target數(shù)組
                if int(item["id"]) in duty["list"]:
                    #通過用戶id獲取該用戶值班起止時(shí)間
                    start = duty[item["id"]][0]
                    end = duty[item["id"]][1]
                    #計(jì)算值班時(shí)長(zhǎng)/秒
                    date1 = datetime.datetime(y,m,d,int(start[:2]),int(start[-2:]))
                    date2 = datetime.datetime(y,m,d,int(end[:2]),int(end[-2:]))
                    item["length"] = (date2 - date1).seconds
                    #初始化實(shí)際值班百分比
                    item["per"] = 0
                    #初始化上下班打卡時(shí)間
                    item["start"] = 0
                    item["end"] = 0
                    #遍歷該用戶打卡記錄
                    for t in item["check"]:
                        #當(dāng)比值班時(shí)間來得早
                        if t < start:
                            #計(jì)算時(shí)間差
                            date1 = datetime.datetime(y,m,d,int(start[:2]),int(start[-2:]))
                            date2 = datetime.datetime(y,m,d,int(t[:2]),int(t[-2:]))
                            dif = (date1 - date2).seconds
                            #當(dāng)打卡時(shí)間在值班時(shí)間前半小時(shí)內(nèi)
                            if dif <= 1800:
                                #上班打卡成功
                                item["start"] = start
                        elif t < end:
                            #如果還沒上班打卡
                            if not item["start"]:
                                #則記錄當(dāng)前時(shí)間為上班打卡時(shí)間
                                item["start"] = t
                            else:
                                #否則記錄當(dāng)前時(shí)間為下班打卡時(shí)間
                                item["end"] = t
                        else:
                            #如果已經(jīng)上班打卡
                            if item["start"]:
                                #計(jì)算時(shí)間差
                                date1 = datetime.datetime(y,m,d,int(end[:2]),int(end[-2:]))
                                date2 = datetime.datetime(y,m,d,int(t[:2]),int(t[-2:]))
                                dif = (date1 - date2).seconds
                                #當(dāng)打卡時(shí)間在值班時(shí)間后半小時(shí)內(nèi)
                                if dif <= 1800:
                                    #下班打卡成功
                                    item["end"] = end
                    #當(dāng)上班下班均打卡
                    if item["start"] and item["end"]:
                        #計(jì)算實(shí)際值班時(shí)長(zhǎng)
                        date1 = datetime.datetime(y,m,d,int(item["start"][:2]),int(item["start"][-2:]))
                        date2 = datetime.datetime(y,m,d,int(item["end"][:2]),int(item["end"][-2:]))
                        dif = (date2 - date1).seconds
                        #計(jì)算（實(shí)際值班時(shí)長(zhǎng)/值班時(shí)長(zhǎng)）百分比
                        item["per"] = int(dif/float(item["length"]) * 100)
                    else:
                        #未正常上下班則視為未值班
                        item["start"] = 0
                        item["end"] = 0
                    #將記錄添加到target數(shù)組中
                    target.append(item)
            #輸出數(shù)據(jù)
            self.render("index.html",
                target = target
                )


def main():
    tornado.options.parse_command_line()
    http_server = tornado.httpserver.HTTPServer(Application())
    http_server.listen(options.port)
    tornado.ioloop.IOLoop.instance().start()


if __name__ == "__main__":
    main()

index.html

{
{% for item in target %}
    {
     "id":{{ item["id"] }},
     "start":{{ item["start"] }},
     "end":{{ item["end"] }},
     "length":{{ item["length"] }}, 
     "per":{{ item["per"] }}
     }
{% end %}
}

最后

暫時(shí)只寫到讀文件和查詢某天值班情況，之后會(huì)繼續(xù)按照之前的計(jì)劃把這個(gè)小應(yīng)用寫完的。

因?yàn)樯婕暗揭欢研』锇榈碾[私，所以沒有把測(cè)試文件發(fā)上來。不過如果有想實(shí)際運(yùn)行看看的同學(xué)可以跟我說，我把文件發(fā)給你。

可能用到的一條數(shù)據(jù)庫(kù)插入語句：db.duty.insert({"id":5,"list":[1,2],1:["19:00","22:00"],2:["19:00","22:00"]})

希望對(duì)像我一樣的beginner們有幫助！

云服務(wù)器 GPU云服務(wù)器數(shù)據(jù)分析及可視化 tornado異步數(shù)據(jù)庫(kù) 大數(shù)據(jù)及分析變量及數(shù)據(jù)

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://specialneedsforspecialkids.com/yun/37507.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

Simon

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

【文末送書】知識(shí)體系目錄【2萬字，刪減成1999】

閱讀 2492·2021-09-28 09:36
向領(lǐng)導(dǎo)申請(qǐng)領(lǐng)用主機(jī)一臺(tái)怎么寫-向上級(jí)申請(qǐng)一臺(tái)電腦的申請(qǐng)書該怎么寫？

閱讀 1486·2021-09-22 15:33
模仿webpack實(shí)現(xiàn)簡(jiǎn)單的打包工具

閱讀 3636·2019-08-30 15:44
深入理解ES6之《ES6中較小的改動(dòng)》

閱讀 1743·2019-08-29 13:14
切圖崽的自我修養(yǎng)—[HTTP] 常見B/S架構(gòu)簡(jiǎn)單梳理

閱讀 3132·2019-08-29 11:17
解決 css 浮動(dòng)后父元素高度失效問題

閱讀 1441·2019-08-29 11:03
亮瞎你狗眼的寫代碼體驗(yàn)狂拽酷炫效果 activate-power-mode

閱讀 2905·2019-08-26 17:10
vue 實(shí)踐技巧合集

閱讀 681·2019-08-26 12:13

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

Tornado數(shù)據(jù)分析及數(shù)據(jù)可視化（一）

相關(guān)文章

自制簡(jiǎn)單的詩(shī)歌搜索系統(tǒng)

**Python：Tornado 第一章：異步及協(xié)程基礎(chǔ)：第一節(jié)：同步與異步I/O**

SegmentFault 技術(shù)周刊 Vol.30 - 學(xué)習(xí) Python 來做一些神奇好玩的事情吧

tornado配合celery及rabbitmq實(shí)現(xiàn)web request異步非阻塞

發(fā)表評(píng)論

0條評(píng)論

Simon

男|高級(jí)講師

TA的文章

【文末送書】知識(shí)體系目錄【2萬字，刪減成1999】

向領(lǐng)導(dǎo)申請(qǐng)領(lǐng)用主機(jī)一臺(tái)怎么寫-向上級(jí)申請(qǐng)一臺(tái)電腦的申請(qǐng)書該怎么寫？

模仿webpack實(shí)現(xiàn)簡(jiǎn)單的打包工具

深入理解ES6之《ES6中較小的改動(dòng)》

切圖崽的自我修養(yǎng)—[HTTP] 常見B/S架構(gòu)簡(jiǎn)單梳理

解決 css 浮動(dòng)后父元素高度失效問題

亮瞎你狗眼的寫代碼體驗(yàn)狂拽酷炫效果 activate-power-mode

vue 實(shí)踐技巧合集

最新活動(dòng)