您的位置:首页 ->> 焦点专题 】 【打 印
【 第1页 第2页 】 
于强:从大数据看台湾网民如何攻击谭德塞

http://www.CRNTT.com   2020-04-14 00:06:56  


台湾网民在台湾最大的网络论坛PTT讨论谭德塞的词云图(图片由作者提供)
  中评社北京4月14日电(作者 于强)我们对于台湾最大的网络论坛PTT的主版块Gossiping进行了全文数据抓取,然后按照谭德塞、世卫组织(WHO)、总干事(秘书长、干事长)的关键词对数据进行了清洗提取,最终发现,台湾网络上对于谭德塞的谈论是从1月27日开始的,截止4月12日,谭德塞的总声量是79120。

  我们对于所有的网友的讨论的整体文本(共111万5092字)进行了词频分析,除去语气助词(真的、就是、这样、还是、应该)和一些表达基本含义的词语(中国、WHO、谭德塞、世卫、世界、组织、全世界、病毒、疫情、新闻、台湾、表示、看到),得到了词云图。

  从词频当中看,排名第一的词是“尼哥”(英语Negro的音译)声量达到了4031,与总声量的比例竟然达到1:20,意味着平均每20次发言中就会辱骂谭德塞一次“尼哥”,比例已经惊人的高。除此之外,“垃圾”、“黑人”、“黑鬼”、“恶心”、“智障”、“废物”等对谭德赛进行辱骂的词语也排在了词频的前50名。另外,值得注意的是,台湾网友还对于谭德塞的名字进行了恶意的改写,把“谭”写成“痰”,声量频次是560。

  另外,台湾网民定居于谭德塞进行攻击的同时,也对大陆进行了恶劣的攻击和抹黑,辱骂大陆是“支那”的声量达到了2028,与总声量的比例竟然达到1:39。

  谭德塞说台湾网民对他进行人身攻击、辱骂和种族歧视是完全成立的,大数据分析的结果完全支持谭德塞的判断。
 


【 第1页 第2页 】