c# – 文本中的异常

c# – 文本中的异常,第1张

概述让我举个例子来解释一下. 我们有以下文字: “Comme Il Faut成立于1927年.烟草公司以其为全球合作伙伴生产定制自有品牌的声誉而闻名.” 这是正常的文字.但是以下文字: “CommeIlFaut于1927年成立.这家烟草公司最为人所知的是为全球范围内的合作伙伴生产定制的私人品牌 这是文本异常:拼写错误,没有空格的单词,也许是别的东西. 如何搜索这样的异常? 有什么算法(统计)? 期望结 让我举个例子来解释一下.
我们有以下文字:

“Comme Il Faut成立于1927年.烟草公司以其为全球合作伙伴生产定制自有品牌的声誉而闻名.”

这是正常的文字.但是以下文字:

“CommeIlFaut于1927年成立.这家烟草公司最为人所知的是为全球范围内的合作伙伴生产定制的私人品牌

这是文本异常:拼写错误,没有空格的单词,也许是别的东西.

如何搜索这样的异常?
有什么算法(统计)?

期望结果是百分比:例如,80%的异常.

谢谢.

解决方法 使用字典中的所有已知单词构造一个 Trie树. 记下文本中的每个单词并尝试在TrIE树中找到它.如果你没有找到它,那么尝试匹配length-k的前缀.如果找到匹配项,则对其余的k字符应用相同的过程.它是递归的,它可以捕获超过两个连接的单词 总结

以上是内存溢出为你收集整理的c# – 文本中的异常全部内容,希望文章能够帮你解决c# – 文本中的异常所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/1233466.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-06-06
下一篇2022-06-06

发表评论

登录后才能评论

评论列表(0条)

    保存