第二个挑战来自数据隐私保护。
戴文渊指出,即便是有数据科学家,或者通过AutoML降低了AI的门槛,但缺少数据隐私保护技术,AI应用也会面临严重问题。在大数据当中如何保护用户的隐私,这是AI的第二个挑战。
目前,可用的高质量数据依然稀缺,这就需要通过迁移学习把数据中的知识从一个领域迁移另一个新领域,保证AI在新领域的应用及效果。第四范式在迁移学习领域积累了很多优秀的算法,但我们一直坚持系统本身需要解决好隐私的问题,AI基于数据得出的一些结论被应用是可以被大家接受的方式,前提是这些结论并没有记录个人具体的数据。“最近几年我们在迁移学习隐私保护领域取得了比较大的突破,能够把知识从一个领域迁移到另外一个领域,同时也不会导致隐私暴露。今年年初,第四范式先知率先通过了欧盟GDPR认证,成为国内第一款通过该认证的AI平台产品。”
第三个挑战是AI算力成本。
戴文渊在演讲中指出,顶尖的互联网公司每年要花费上千亿在搜索引擎、推荐引擎上,这是由于AI发展所带来的算力成本激增,然而很少有传统企业能接受如此高的成本。
目前,AI体系中硬件成本居高不下,但AI不仅是硬件体系,而是硬件+软件融合发展的体系,软件的设计必须要基于硬件的特点,硬件的设计也必须基于软件的算法。“我们发现如果采用软硬件深度融合优化的方式,不止性能会提高十倍,成本也会大幅降低。”戴文渊说。
以第四范式服务的某零售企业推荐场景为例,过去需要采用88台传统服务器才能支撑AI业务,采用软硬一体的方式后降为8台,TCO(总拥有成本)降低了90%。 |