国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

使用Python將HTML文檔轉(zhuǎn)換為Markdown文檔

syoya / 1241人閱讀

摘要:前言我的個(gè)人博客是搭建的,風(fēng)格我很喜歡,也不打算更換。今天發(fā)現(xiàn)個(gè)有趣的庫(kù),可以將轉(zhuǎn)換回試驗(yàn)了一下效果還不錯(cuò)。的作用在這里使用號(hào)來(lái)分割文章的核心內(nèi)容,舍棄博客的和。

前言

我的個(gè)人博客是Hexo+Next搭建的,風(fēng)格我很喜歡,也不打算更換。最近可能電腦不好使了,兩次重裝系統(tǒng),每次都要重新搭建博客,搭建速度也很快,但是依然有個(gè)困擾我的問(wèn)題,那就是電腦卡死的時(shí)候有些博客沒(méi)有備份,只有上傳到Github生成的html文檔。今天發(fā)現(xiàn)個(gè)有趣的python庫(kù),可以將html轉(zhuǎn)換回markdown,試驗(yàn)了一下效果還不錯(cuò)。

代碼

下面先上代碼:

#Author:Sun Yan
#Function: convert html to md

import html2text as ht  # pip install html2text
import os 
text_maker = ht.HTML2Text()
#text_maker.ignore_links = True
text_maker.bypass_tables = False
path ="C:Users14050Desktopcode1.html"
htmlfile = open(path,"r",encoding="UTF-8")
htmlpage = htmlfile.read()
text = text_maker.handle(htmlpage)
md = text.split("#")  # split post content
open("1.md","w").write(md[1])  # write file as a md file
說(shuō)明 安裝庫(kù)

在我的電腦上直接pip安裝沒(méi)有成功,我是在pypi上下載之后安裝的 html2text

使用

使用也比較簡(jiǎn)單,注意兩個(gè)地方即可:

忽略鏈接和表格

我這里是按照官方文檔中寫(xiě)的,實(shí)際測(cè)試鏈接可以不忽略,表格沒(méi)有測(cè)試。

2.#的作用

在這里使用#號(hào)來(lái)分割文章的核心內(nèi)容,舍棄博客的header和footer。

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/41388.html

相關(guān)文章

  • 使用Python Markdown 生成 html

    摘要:越來(lái)越喜歡使用編寫(xiě)文檔,相對(duì)更簡(jiǎn)單方便,而且可以渲染輸出自己喜歡的樣式。開(kāi)發(fā)過(guò)程中編寫(xiě)的文檔方便等版本控制工具管理。完整代碼將上的代碼保存為然后執(zhí)行 越來(lái)越喜歡使用markdown編寫(xiě)文檔,相對(duì)doc更簡(jiǎn)單方便,而且可以渲染輸出自己喜歡的樣式。開(kāi)發(fā)過(guò)程中編寫(xiě)的文檔markdown方便svn、git等版本控制工具管理。 安裝 Python-Markdown ,做markdown to h...

    levy9527 評(píng)論0 收藏0
  • Django 博客開(kāi)發(fā)教程 9 - 支持 Markdown 語(yǔ)法和代碼高亮

    摘要:注意如果你按照教程中的方法做完后發(fā)現(xiàn)代碼依然沒(méi)有高亮,請(qǐng)依次檢查以下步驟確保在渲染文本時(shí)添加了拓展,詳情見(jiàn)上文。有些樣式文件可能對(duì)代碼高亮沒(méi)有作用,首先嘗試用樣式文件做測(cè)試。在支持語(yǔ)法和代碼高亮追夢(mèng)人物的博客的評(píng)論區(qū)留言。 為了讓博客文章具有良好的排版,顯示更加豐富的格式,我們使用 Markdown 語(yǔ)法來(lái)書(shū)寫(xiě)我們的博文。Markdown 是一種 HTML 文本標(biāo)記語(yǔ)言,只要遵循它約定...

    zr_hebo 評(píng)論0 收藏0
  • Python-Django

    摘要:使用的形式捕獲值給中得參數(shù),比如,當(dāng)訪問(wèn)時(shí),將會(huì)將捕獲給這個(gè)值會(huì)傳到。表示刪除某個(gè)分類后該分類下所有的的外鍵設(shè)為空,所以我們同時(shí)設(shè)置了。多對(duì)多就不同,兩邊都要進(jìn)行配置。增加基本的用戶認(rèn)證功能。 準(zhǔn)備工作 新建一個(gè)Django項(xiàng)目 # 新建一個(gè)django項(xiàng)目 $ django-admin startproject mysite # 新建一個(gè)app $ django-admin star...

    geekidentity 評(píng)論0 收藏0
  • Django搭建個(gè)人博客:使用Markdown語(yǔ)法書(shū)寫(xiě)文章

    摘要:重新打開(kāi)一個(gè)命令行窗口,進(jìn)入虛擬環(huán)境,安裝是一種通用語(yǔ)法高亮顯示器,可以幫助我們自動(dòng)生成美化代碼塊的樣式文件。 上一章我們實(shí)現(xiàn)了文章詳情頁(yè)面。為了讓文章正文能夠進(jìn)行標(biāo)題、加粗、引用、代碼塊等不同的排版(像在Office中那樣!),我們將使用Markdown語(yǔ)法。 安裝Markdown Markdown是一種輕量級(jí)的標(biāo)記語(yǔ)言,它允許人們使用易讀易寫(xiě)的純文本格式編寫(xiě)文檔,然后轉(zhuǎn)換成有效的或...

    沈建明 評(píng)論0 收藏0
  • [原]文檔定義應(yīng)用:數(shù)據(jù)科學(xué)的文檔革命

    摘要:對(duì)于數(shù)據(jù)科學(xué)的研究可以說(shuō)已經(jīng)是本文我將介紹如何以文檔定義應(yīng)用的方式成為數(shù)據(jù)科學(xué)中的標(biāo)準(zhǔn)交付。參考前文解密的數(shù)據(jù)科學(xué)部門如果構(gòu)建知識(shí)倉(cāng)庫(kù),作為一個(gè)謝大大的死忠,我很自然選擇了作為我文檔輸出的首選工具。 showImg(https://segmentfault.com/img/remote/1460000006760433?w=423&h=426); 概述 隨著近年來(lái),Rstudio 通過(guò)...

    wh469012917 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<