您如何实现良好的亵渎过滤器?

您如何实现良好的亵渎过滤器?,第1张

您如何实现良好的亵渎过滤器?

底线:最终,对于您实施的任何系统,绝对没有替代人为检查的(无论是同行还是其他方式)。可以随意实施一个基本工具来摆脱偷渡行为,但是对于确定的巨魔,您绝对必须使用基于非算法的方法。

一个消除匿名性并引入问责制(Stack Overflow做得很好的系统)的系统也很有用,特别是为了帮助对抗John
Gabriel的GIFT

您还询问了在哪里可以找到亵渎列表,从这里开始-
一个要检查的开源项目是Dansguardian-检查其默认亵渎列表的源代码。您还可以为代理下载其他第三方短语列表,这可能对您有所帮助。

编辑问题以进行编辑:
感谢您对要执行的 *** 作的说明。在这种情况下,如果您只是尝试做一个简单的单词过滤器,则有两种方法可以实现。一种方法是使用您要检查的所有禁止短语创建一个长的正则表达式,而只用它进行正则表达式查找/替换。正则表达式如:

$filterRegex = "(boogers|snot|poop|shucks|argh)"

然后使用preg_match()在您的输入字符串上运行它,以全面测试匹配项,

或preg_replace()将其清空。

您也可以使用数组而不是单个长的正则表达式来加载这些函数,对于长单词列表,它可能更易于管理。

您还添加了:“首先 获取单词列表是真正的问题。
”-除了以前的Dansgaurdian链接以外,您可能会发现这个方便的458个单词的.zip很有帮助。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5018441.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-15
下一篇 2022-11-14

发表评论

登录后才能评论

评论列表(0条)

保存