摘要:創(chuàng)作緣由對于中文的繁簡體轉(zhuǎn)換是一種很常見的需求。存在一個(gè)嚴(yán)重的問題特殊詞組的轉(zhuǎn)換可能存在問題。是一款非常優(yōu)秀的轉(zhuǎn)換工具。使用方式引入轉(zhuǎn)為簡體生命不息,奮鬥不止結(jié)果為生命不息,奮斗不止轉(zhuǎn)為繁體生命不息,奮斗不止結(jié)果為生命不息,奮鬥不止
創(chuàng)作緣由
對于中文的繁簡體轉(zhuǎn)換是一種很常見的需求。
但是很多工具類都是簡單的做個(gè)映射。(使用map,集合,properties)等。
存在一個(gè)嚴(yán)重的問題:特殊詞組 的轉(zhuǎn)換可能存在問題。
OpenCCOpenCC 是一款非常優(yōu)秀的轉(zhuǎn)換工具。但是沒有直接提供 Java 便于使用的 jar。
opencc4jopencc4j 就是在上面的工具基礎(chǔ)上提供的 java 使用版本。
opencc4j 使用方式 maven 引入轉(zhuǎn)為簡體com.github.houbb opencc4j 1.0.2
String original = "生命不息,奮鬥不止"; String result = ZhConverterUtil.convertToSimple(original);
結(jié)果為
生命不息,奮斗不止轉(zhuǎn)為繁體
String original = "生命不息,奮斗不止"; String result = ZhConverterUtil.convertToTraditional(original);
結(jié)果為
生命不息,奮鬥不止
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/76447.html
摘要:本文將作為漢字相似度的完結(jié)篇,為該系列畫上一個(gè)句號(hào)。起中文形近字相似度計(jì)算思路承中文形近字相似度算法實(shí)現(xiàn),為漢字盡一點(diǎn)綿薄之力轉(zhuǎn)當(dāng)代中國最貴的漢字是什么不足之處之所以有本篇,是因?yàn)樯弦淮蔚乃惴▽?shí)現(xiàn)存在一些不足。 前言所有的故事都有開始,也終將結(jié)束。本文將作為 NLP 漢字相似度的完結(jié)篇,為該系列畫上一個(gè)句號(hào)。起...
Openccpy ___ _____ __ ___ ___ ___ _____ __ __ / __`/ __` /__`/ _ ` /___ /___/ __`/ / / L L / __// / / \__// \__/ L \_ \____/ ,__/ \____ \_ \_ \____ \____ ,__//`__...
摘要:下載數(shù)據(jù)方法使用官方的數(shù)據(jù)最新打包的中文文檔下載地址是。中文維基數(shù)據(jù)繁簡混雜大家都說存在這個(gè)問題,但的網(wǎng)站是將繁體中文和簡體中文分開處理的,所以一直覺得從數(shù)據(jù)庫到結(jié)構(gòu)都應(yīng)有方法將兩者區(qū)分開,暫罷,待有空研究其數(shù)據(jù)時(shí)再議。 照例,先講下環(huán)境,Mac OSX 10.11.2 ,Python 3.4.3。 下載數(shù)據(jù) 方法1:使用官方dump的xml數(shù)據(jù) 最新打包的中文文檔下載地址是:http...
閱讀 2636·2021-11-11 16:55
閱讀 1279·2021-09-22 15:25
閱讀 1793·2019-08-29 16:26
閱讀 925·2019-08-29 13:21
閱讀 2306·2019-08-23 16:19
閱讀 2795·2019-08-23 15:10
閱讀 761·2019-08-23 14:24
閱讀 1850·2019-08-23 13:48