2011年,本杰明和同事组建了社会科学遗传协会联盟(SSGACC),改写了遗传学家单打独斗的历史。他们汇集上千个研究项目,建立了一个全球共享的基因数据池。
许多数据来源于医学、生物学研究问卷——志愿者参与的可能是有关“高血压”的医学研究,但他们往往会被“捎带”询问一些个人信息,受教育程度便是其中非常普遍的一项。这些研究数据过去用于一项特定研究后经常被浪费,本杰明重新挖出了它们的价值。
数据池的进一步开拓来自两个大型DNA研究数据库——英国生物银行将采集来的442183个样本纳入库中,23andMe研究团队贡献了365538个志愿者的基因数据,一个超百万样本的庞大数据库最终形成。
在郑志利所属的实验室里,几百T(1T等于1024G)的存储器汇集了多国机构的研究数据,集群化的高性能计算机正飞速运转——这几乎已成基因数据研究的“常态”,将来会有更多的“百万级”样本研究被发布。
本杰明计划最终将样本量扩大到200万人。这样,他能找出更多与教育关联的基因突变,制作出更具预测度的基因评分。按此前一位学者的计算,所有基因突变与教育水平的关联度可能会达到20%。
这个关联性并不那么强。扫描了上百万人的基因组,做了庞大的计算,与消耗的经费相比,本杰明团队的研究显得“亏本”:他们没找到能直接提升智慧的基因,没找到天才基因里拥有的独特之处,没做出预测度高的量表,反而正将问题复杂化。
但或许,这正是这项研究本身最大的价值。谜题答案可能藏在基因与环境的互动中,即便爱因斯坦的大脑,与普通人相比也无甚特别。
尽管许多科幻小说中都有改造人类智慧的情节,随着越来越多可能与智能相关的基因突变被发现,这一构想或因工程量巨大沦为幻影。
来源:《中国青年报》
|