您的位置:首页 ->> 评论文章 】 【打 印
【 第1页 第2页 第3页 第4页 第5页 第6页 】 
“伤不起”成年度十大热词 “吊丝”落选

http://www.CRNTT.com   2012-07-06 13:42:37  


 
“额的神啊”、“吊丝”为啥没选上?

  2011年度语言生活报告公布后,有人对那些热词、热语有意见:“跟我们的感觉不一样啊?”“有些用得很多的网言网语怎么没入选,‘额的神啊’在哪儿?” “今年2月,我们就2011年度的热词、热语向网友征求意见时,就听到了各种建议。”侯敏教授说,网友们举出了不少新鲜的网络用词,问报告中怎么不见踪影?我跟他们解释:网络媒体语料库在采集语料时以网站的新闻栏目为主,BBS论坛、网友留言与发帖不在其列,“‘额的神啊’仅仅在论坛里热度很高,所以‘落选’了。” 今年,“吊丝”一词的去留成了争论最激烈的一个议题。经过一应前道工序,它也进入了候选集,但专家们犯难:不选吧?确是新词,征求意见时网友呼声极高;选吧?这个词品位不高,想准确释义更难。“我们选词有标准,得是新词,得有一定使用频率,得能反映当今社会生活,还得‘乾净’,要有一定品位。” 侯敏教授举例说,几年前“铁娘子”吴仪说出“裸退”一词,这个词的使用频率其实很低,但经专家讨论,还是入选了年度新词语,“‘裸退’展现了一种胸怀,指明了官员退休的新方向,值得称道。”再比如,对“蒜你狠”、“姜你军”能不能入选,反对的声音不小,说这些新词不伦不类、不够规范;但讨论再三,专家们最终倾向于认为“老百姓在涨价压力下,以苦中作乐的心态和充满智慧的调侃创出新词语,反映了社会生活和个人境遇,该收!”

少数民族语言也新词迭出但暂难筛选

  国家语言资源监测语料库,除了汉语的,还有少数民族语言的,藏语、维语、蒙语……少数民族语言分中心副主任、中央民族大学教授赵小兵向记者介绍,他们每年度采集的不同语种的语料达2亿字,也来源于各大网站、报纸等。

  少数民族语言每年也在不断冒出热词、热语,然而受技术手段制约,一时还选不出来。“软件不够水平啊!”赵小兵解释,少数民族语言文字有特殊性,目前分词软件的准确率在92%上下,而按照大规模语料处理的要求,准确率至少要达到95%才行。

  他说:“虽然暂时还没选热词、热语,但我们对少数民族语料的分析一直在做,你想象不出工作量有多大——采用人机辅助处理,需要大量人工干预。目前我们已经完成了藏语、维语中小学教材和网络词语的统计分析。”
 
  2012-07-06 08:51 文章来源: 文汇报 


 【 第1页 第2页 第3页 第4页 第5页 第6页 】