[返回哲学世界首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

教你一个办法识别马甲

送交者: shoppersVIP[★★悠悠★★] 于 2022-09-23 18:07 已读 3400 次  

shoppersVIP的个人频道

+关注

回答: 兔子兔子老虎 给 ywhan 点“赞”支持3银元奖励!! 由 兔子兔子老虎 于 2022-09-22 17:48

既然你被所谓的马甲威胁很烦恼,我就教你一种识别马甲的办法.

教你一个办法识别马甲

现有的马甲账号识别方法中,主要是基于IP鉴定、基于临时邮箱或基于用户账号行为分析来识别马甲账号。
但是在这些方法中,可利用的用户信息仅限于账号曾使用的IP地址、账号的注册信息或账号的操作行为等,因此识别范围小且识别准确率低。

该方法基于训练集中各用户账号及每个文本的特征向量来训练分类模型,利用训练好的分类模型确定测试集中每个文本被分类到训练集中哪个用户账号,然后基于所述分类结果来识别马甲账号。
该方法从论坛用户账号发言的文本数据中选取特征,通过挖掘账号的语言风格的相似性来判断属于同一人的多个账号间的关系,提高了识别马甲账号的概率。
通过提取用户发言文本中有效的特征进行分析,提高了马甲识别的准确率。

1.抓取论坛你感兴趣的数据帖子,归一化.
2.采用现有的分词软件工具得到的经分词和词性标注后的各个文本中
3.将所提取的出现次数不低于设定的阈值(例如,2次、3次等)的词组作为特征词
4.基于该训练集的特征词表,构建每个文本的特征向量。并关联到相关发言马甲上面
5.训练和识别:基于训练集中各用户账号以及所构建的各个文本的特征向量来训练分类模型,训练好的分类模型可用于判断文本所属的用户账号。这里的分类模型可以采用支持向量机(Support Vector Machine, SVM)模型、逻辑回归模型、决策树等典型的分类模型。
6.把已经知道的明马甲号放进去验证.不对的地方提取出来,分析后改进.然后重复2-5步骤.直到得到相对可靠的结果.
喜欢shoppersVIP朋友的这个贴子的话, 请点这里投票,“赞”助支持!

内容来自网友分享,若违规或者侵犯您的权益,请联系我们

所有跟帖:   ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名: 密码: [--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助



[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]