国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

java 中文繁簡體轉(zhuǎn)換工具 opencc4j

nodejh / 3152人閱讀

摘要:創(chuàng)作緣由對于中文的繁簡體轉(zhuǎn)換是一種很常見的需求。存在一個(gè)嚴(yán)重的問題特殊詞組的轉(zhuǎn)換可能存在問題。是一款非常優(yōu)秀的轉(zhuǎn)換工具。使用方式引入轉(zhuǎn)為簡體生命不息,奮鬥不止結(jié)果為生命不息,奮斗不止轉(zhuǎn)為繁體生命不息,奮斗不止結(jié)果為生命不息,奮鬥不止

創(chuàng)作緣由

對于中文的繁簡體轉(zhuǎn)換是一種很常見的需求。

但是很多工具類都是簡單的做個(gè)映射。(使用map,集合,properties)等。

存在一個(gè)嚴(yán)重的問題:特殊詞組 的轉(zhuǎn)換可能存在問題。

OpenCC

OpenCC 是一款非常優(yōu)秀的轉(zhuǎn)換工具。但是沒有直接提供 Java 便于使用的 jar。

opencc4j

opencc4j 就是在上面的工具基礎(chǔ)上提供的 java 使用版本。

opencc4j 使用方式 maven 引入

    com.github.houbb
    opencc4j
    1.0.2
轉(zhuǎn)為簡體
String original = "生命不息,奮鬥不止";
String result = ZhConverterUtil.convertToSimple(original);

結(jié)果為

生命不息,奮斗不止
轉(zhuǎn)為繁體
String original = "生命不息,奮斗不止";
String result = ZhConverterUtil.convertToTraditional(original);

結(jié)果為

生命不息,奮鬥不止

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/76447.html

相關(guān)文章

  • NLP 開源形近字算法補(bǔ)完計(jì)劃(完結(jié)篇)

    摘要:本文將作為漢字相似度的完結(jié)篇,為該系列畫上一個(gè)句號(hào)。起中文形近字相似度計(jì)算思路承中文形近字相似度算法實(shí)現(xiàn),為漢字盡一點(diǎn)綿薄之力轉(zhuǎn)當(dāng)代中國最貴的漢字是什么不足之處之所以有本篇,是因?yàn)樯弦淮蔚乃惴▽?shí)現(xiàn)存在一些不足。 前言所有的故事都有開始,也終將結(jié)束。本文將作為 NLP 漢字相似度的完結(jié)篇,為該系列畫上一個(gè)句號(hào)。起...

    番茄西紅柿 評(píng)論0 收藏2637
  • Python中文簡體轉(zhuǎn)換工具

    Openccpy ___ _____ __ ___ ___ ___ _____ __ __ / __`/ __` /__`/ _ ` /___ /___/ __`/ / / L L / __// / / \__// \__/ L \_ \____/ ,__/ \____ \_ \_ \____ \____ ,__//`__...

    SimonMa 評(píng)論0 收藏0
  • 中文維基百科文本數(shù)據(jù)獲取與預(yù)處理

    摘要:下載數(shù)據(jù)方法使用官方的數(shù)據(jù)最新打包的中文文檔下載地址是。中文維基數(shù)據(jù)繁簡混雜大家都說存在這個(gè)問題,但的網(wǎng)站是將繁體中文和簡體中文分開處理的,所以一直覺得從數(shù)據(jù)庫到結(jié)構(gòu)都應(yīng)有方法將兩者區(qū)分開,暫罷,待有空研究其數(shù)據(jù)時(shí)再議。 照例,先講下環(huán)境,Mac OSX 10.11.2 ,Python 3.4.3。 下載數(shù)據(jù) 方法1:使用官方dump的xml數(shù)據(jù) 最新打包的中文文檔下載地址是:http...

    loostudy 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<