首页> 中国专利> 一种互联网信息过滤以及互联网用户信息和网帖结构分析方法

一种互联网信息过滤以及互联网用户信息和网帖结构分析方法

摘要

本发明公开了一种互联网信息过滤以及互联网用户信息和网帖结构分析方法,通过爬虫获取数据,并利用spark‑sql进行数据检索,接着利用关注度模型对用户信息和贴吧进行了分析,最后对帖子的文本进行相关性计算和相关词挖掘,有效的提高了对水贴和广告贴的过滤效果。

著录项

  • 公开/公告号CN108595466B

    专利类型发明专利

  • 公开/公告日2022-05-10

    原文格式PDF

  • 申请/专利权人 中山大学;

    申请/专利号CN201810132468.4

  • 发明设计人 刘宁;许伟原;陈家炜;

    申请日2018-02-09

  • 分类号G06F16/953;G06F16/955;G06F16/35;G06F40/30;

  • 代理机构

  • 代理人

  • 地址 510000 广东省广州市新港西路135号

  • 入库时间 2022-08-23 13:37:53

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号