日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

敏感词过滤算法实现

發布時間:2023/12/20 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 敏感词过滤算法实现 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

敏感詞庫下載
FilterHelper類

#region 非法關鍵字過濾 bate 1.1/// <summary>/// 非法關鍵詞過濾(自動忽略漢字數字字母間的其他字符)/// </summary>public class FilterHelper{public FilterHelper() { }public FilterHelper(string dictionaryPath){this.dictionaryPath = dictionaryPath;}private string dictionaryPath = string.Empty;/// <summary>/// 詞庫路徑/// </summary>public string DictionaryPath{get { return dictionaryPath; }set { dictionaryPath = value; }}/// <summary>/// 內存詞典/// </summary>private WordGroup[] MEMORYLEXICON = new WordGroup[(int)char.MaxValue];private string sourctText = string.Empty;/// <summary>/// 檢測源/// </summary>public string SourctText{get { return sourctText; }set { sourctText = value; }}/// <summary>/// 檢測源游標/// </summary>int cursor = 0;/// <summary>/// 匹配成功后偏移量/// </summary>int wordlenght = 0;/// <summary>/// 檢測詞游標/// </summary>int nextCursor = 0;private List<string> illegalWords = new List<string>();/// <summary>/// 檢測到的非法詞集/// </summary>public List<string> IllegalWords{get { return illegalWords; }}/// <summary>/// 判斷是否是中文/// </summary>/// <param name="character"></param>/// <returns></returns>private bool isCHS(char character){// 中文表意字符的范圍 4E00-9FA5int charVal = (int)character;return (charVal >= 0x4e00 && charVal <= 0x9fa5);}/// <summary>/// 判斷是否是數字/// </summary>/// <param name="character"></param>/// <returns></returns>private bool isNum(char character){int charVal = (int)character;return (charVal >= 48 && charVal <= 57);}/// <summary>/// 判斷是否是字母/// </summary>/// <param name="character"></param>/// <returns></returns>private bool isAlphabet(char character){int charVal = (int)character;return ((charVal >= 97 && charVal <= 122) || (charVal >= 65 && charVal <= 90));}/// <summary>/// 轉半角小寫的函數(DBC case)/// </summary>/// <param name="input">任意字符串</param>/// <returns>半角字符串</returns>///<remarks>///全角空格為12288,半角空格為32///其他字符半角(33-126)與全角(65281-65374)的對應關系是:均相差65248///</remarks>private string ToDBC(string input){char[] c = input.ToCharArray();for (int i = 0; i < c.Length; i++){if (c[i] == 12288){c[i] = (char)32;continue;}if (c[i] > 65280 && c[i] < 65375)c[i] = (char)(c[i] - 65248);}return new string(c).ToLower();}/// <summary>/// 加載內存詞庫/// </summary>private void LoadDictionary(){if (DictionaryPath != string.Empty){List<string> wordList = new List<string>();Array.Clear(MEMORYLEXICON, 0, MEMORYLEXICON.Length);string[] words = System.IO.File.ReadAllLines(DictionaryPath, System.Text.Encoding.Default);foreach (string word in words){string key = this.ToDBC(word);wordList.Add(key);// wordList.Add(Strings.StrConv(key, VbStrConv.SimplifiedChinese, 0)); //這個是將字符轉成簡體中文,需要引入Microsoft.VisualBasic,同時,有些系統不支持。}Comparison<string> cmp = delegate (string key1, string key2){return key1.CompareTo(key2);};wordList.Sort(cmp);for (int i = wordList.Count - 1; i > 0; i--){if (wordList[i].ToString() == wordList[i - 1].ToString()){wordList.RemoveAt(i);}}foreach (var word in wordList){if (word.Length > 0){WordGroup group = MEMORYLEXICON[(int)word[0]];if (group == null){group = new WordGroup();MEMORYLEXICON[(int)word[0]] = group;}group.Add(word.Substring(1));}}}}/// <summary>/// 檢測/// </summary>/// <param name="blackWord"></param>/// <returns></returns>private bool Check(string blackWord){wordlenght = 0;//檢測源下一位游標nextCursor = cursor + 1;bool found = false;//遍歷詞的每一位做匹配for (int i = 0; i < blackWord.Length; i++){//特殊字符偏移游標int offset = 0;if (nextCursor >= sourctText.Length){break;}else{//檢測下位字符如果不是漢字 數字 字符 偏移量加1for (int y = nextCursor; y < sourctText.Length; y++){if (!isCHS(sourctText[y]) && !isNum(sourctText[y]) && !isAlphabet(sourctText[y])){offset++;//避讓特殊字符,下位游標如果>=字符串長度 跳出if (nextCursor + offset >= sourctText.Length) break;wordlenght++;}else break;}if ((int)blackWord[i] == (int)sourctText[nextCursor + offset]){found = true;}else{found = false;break;}}nextCursor = nextCursor + 1 + offset;wordlenght++;}return found;}/// <summary>/// 查找并替換/// </summary>/// <param name="replaceChar"></param>public string Filter(char replaceChar){LoadDictionary();if (sourctText != string.Empty){char[] tempString = sourctText.ToCharArray();for (int i = 0; i < SourctText.Length; i++){//查詢以該字為首字符的詞組WordGroup group = MEMORYLEXICON[(int)ToDBC(SourctText)[i]];if (group != null){for (int z = 0; z < group.Count(); z++){string word = group.GetWord(z);if (word.Length == 0 || Check(word)){string blackword = string.Empty;for (int pos = 0; pos < wordlenght + 1; pos++){blackword += tempString[pos + cursor].ToString();tempString[pos + cursor] = replaceChar;}illegalWords.Add(blackword);cursor = cursor + wordlenght;i = i + wordlenght;}}}cursor++;}return new string(tempString);}else{return string.Empty;}}}/// <summary>/// 具有相同首字符的詞組集合/// </summary>class WordGroup{/// <summary>/// 集合/// </summary>private List<string> groupList;public WordGroup(){groupList = new List<string>();}/// <summary>/// 添加詞/// </summary>/// <param name="word"></param>public void Add(string word){groupList.Add(word);}/// <summary>/// 獲取總數/// </summary>/// <returns></returns>public int Count(){return groupList.Count;}/// <summary>/// 根據下標獲取詞/// </summary>/// <param name="index"></param>/// <returns></returns>public string GetWord(int index){return groupList[index];}}#endregion

調用

//該代碼為Net Core下的控制臺demostring path = Directory.GetCurrentDirectory().Replace("\\bin\\Debug\\netcoreapp3.1","");FilterHelper filter = new FilterHelper(path+"/暴恐詞庫.txt"); //存放敏感詞的文檔filter.SourctText = "你個大推背";string resultStr = filter.Filter('*'); //用*號代替敏感詞var list=filter.IllegalWords; //這個可以獲取所有敏感詞集合foreach(string s in list){Console.WriteLine(s);}Console.WriteLine(resultStr);

總結

以上是生活随笔為你收集整理的敏感词过滤算法实现的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 制服丝袜av在线 | 国产情侣av自拍 | 影音先锋亚洲精品 | 少妇无内裤下蹲露大唇视频 | 嫩草大剧院 | 亚洲综合影院 | 久久精品国产免费看久久精品 | 99在线免费视频 | 欧美乱码视频 | 尤物视频免费在线观看 | 亚洲30p | 国产精品啊啊啊 | 永久在线免费观看 | 久久性生活视频 | 欧美性大战久久久久久久蜜桃 | 成人3d动漫一区二区三区 | mdyd—856冲田杏梨在线 | 青青草原综合久久大伊人精品 | 久99久视频 | 黄色a一级片 | 蜜臀精品一区二区三区 | 蜜桃在线一区二区 | 中文字幕色站 | 人妻偷人精品一区二区三区 | 电车痴汉在线观看 | 风流少妇按摩来高潮 | 日韩av在线高清 | 欧美三级欧美成人高清 | 色婷婷综合视频 | 视频免费在线观看 | 成人激情站 | 女厕厕露p撒尿八个少妇 | 日韩精品成人免费观看视频 | 亚洲欧美激情在线观看 | 久久久噜噜噜久久久 | 五月天激情视频在线观看 | 国产欧美一区二区三区鸳鸯浴 | 三级黄色在线视频 | 日本少妇吞精囗交视频 | 人人妻人人玩人人澡人人爽 | 一本色道久久综合亚洲精品酒店 | 国产aⅴ精品一区二区三区久久 | 日本免费不卡一区二区 | 天天爽天天爽天天爽 | 激情综合久久 | 国产毛片毛片毛片毛片毛片毛片 | 大陆一级黄色片 | 亚洲美女视频在线观看 | 国产精品xxxxx | 国产午夜精品一区 | av资源网在线观看 | 精品人妻aV中文字幕乱码色欲 | 国产精品传媒在线观看 | aaa午夜| jul023被夫上司连续侵犯 | 探花视频在线观看 | 精品人妻无码专区在线 | 在线观看av大片 | 麻豆影视网站 | 久久99热人妻偷产国产 | 国产在线视频你懂得 | 国产精品无码久久久久高潮 | 在线免费黄色网址 | www.久久精品视频 | 日韩精品一区二区亚洲av观看 | 日韩色资源| 色视频在线免费观看 | av地址在线观看 | 欧美大尺度做爰啪啪床戏明星 | 男女视频免费看 | 日本不卡一区在线观看 | 免费观看毛片视频 | 欧美成人免费网站 | 国产精品永久免费 | 亚洲精品视频在线 | 一区二区小说 | 日本少妇久久 | av网站免费观看 | 久久综合九九 | 国产乱码精品一区二区三区忘忧草 | jiz亚洲| 国产人人看 | 少妇特黄a一区二区三区88av | 毛片福利 | 人人爽人人草 | 国产学生美女无遮拦高潮视频 | 成年人免费大片 | av在线二区| 国产另类视频 | jizz俄罗斯| 男人的天堂视频在线观看 | 欧洲影院 | 97超级碰碰人妻中文字幕 | 婷婷色站| 黄色激情小说视频 | 午夜影院免费观看 | aaa黄色| 一级黄色短片 | 特级黄色大片 |