您的位置:首页 ->> 观察与思考 】 【打 印
【 第1页 第2页 第3页 第4页 第5页 】 
大数据时代的总统选举

http://www.CRNTT.com   2012-11-10 09:09:49  


 
  秘密进行

  不过,这个几十人数据分析团队具体做了些什么,被严格保密。“他们是我们的核编码。”当被问及都做了哪些工作时,竞选发言人Ben LaBolt如此说道。

  在办公室里,该团队会给各个数据挖掘实验进行神秘代码命名,比如独角鲸、追梦人。该团队甚至在远离其他竞选工作人员的地方工作,在总部巨大办公室的北边尽头,专设了一个没有窗户的房间。“科学家”们会为在白宫罗斯福厅的总统及他的高级幕僚发送常规工作报告,而更多的公开细节是不会透露的,竞选团队保护着他们自认为相对于罗姆尼团队有制度优势的地方:即数据。

  11月4日,一个高级竞选顾问同意匿名向《时代》杂志讲讲他们的前沿工作,也同时要让我们保证,除非竞选结束,否则不能披露信息。他们披露了他们如何利用海量数据分析挖掘,帮助奥巴马筹集到10亿美金,如何重新制订了电视广告投放,如何做出“摇摆州”选民的详细模型(该模型可用于提升利用电话、上门投递邮件、社会化媒体等手段的效率)

  如何筹集10亿美金

  奥巴马团队在2008年对高科技的运用赢得了无数赞美,但其成功也表明了一个巨大缺陷:数据库太多了。那时,通过奥巴马网站打电话的志愿者用的名单是一份赋闲在家者名单,这名单与在竞选办公室打电话人所用的名单是不一样的。而动员投票名单也永远不会与资金筹集名单重合。就像911之前的FBI和CIA:这两支团队绝不会共享数据。“我们早期意识到,民主党的问题就在于数据库太多了,”一个工作人员说,“数据库之间不彼此碰头。”所以在头18个月里,竞选团队就创建了一个单一的巨大系统,可以将从民调专家、筹款人、选战一线员工、消费者数据库、以及“摇摆州”民主党主要选民档案的社会化媒体联系人与手机联系人那里得到的所有数据都聚合到一块。

  这个组合起来的巨大数据并不仅仅让竞选团队能够发现选民并获取他们的注意,还能让数据处理团队去做一些测试,看哪些类型的人有可能被某种特定的事情所打动或说服。比如,在办公室里的电话名单上,不只是列出对方的名字与号码,还用他们可能被说服的内容、以及竞选团队最重要的优先诉求来排序。决定排序的因素中有四分之三是基本信息,比如年龄、姓别、种族、邻居以及投票记录。选民的消费者数据帮助完成这个图谱。“我们可以预测哪些人会在网上捐钱,也可做出模型来看哪些人会用邮件捐。我们可以为志愿者建模。”一个用数据来创建预测文档的高级顾问说,“最后,建模对我们来说变得是一种更重要的方式,相较于2008年而言,它让我们工作得更有效率。” 


 【 第1页 第2页 第3页 第4页 第5页 】