【24h】

Spam Detection on Arabic Twitter

机译:阿拉伯语推特上的垃圾邮件检测

获取原文

摘要

Twitter has become a popular social media platform in the Arab region. Some users exploit this popularity by posting unwanted advertisements for their own interest. In this paper, we present a large manually annotated dataset of advertisement (Spam) tweets in Arabic. We analyze the characteristics of these tweets that distinguish them from other tweets and identify their targets and topics. In addition, we analyze the characteristics of Spam accounts. We utilize Support Vector Machines (SVMs) and contextual embedding based models to identify these Spam tweets with macro averaged F1 score above 98%.
机译:Twitter已成为阿拉伯地区的受欢迎的社交媒体平台。有些用户通过发布不需要的广告以获得自己的兴趣来利用这种人气。在本文中,我们在阿拉伯语中展示了一个大型手动注释的广告数据集(垃圾邮件)推文。我们分析了这些推文的特征,将它们与其他推文区分开并确定其目标和主题。此外,我们分析了垃圾邮件账户的特征。我们利用支持向量机(SVM)和基于上下文嵌入的模型,以识别这些垃圾邮件推文,宏观平均F1得分高于98%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号