近年来,中国数字经济纵深发展,促使数据规模指数级增长,同时数据围绕场景孤岛化的情况也较为突出。井贤栋认为,AGI(通用人工智能)时代的到来,需要对数据孤岛化下的大规模数据流通进行破题。数据要素可信流转,需要创新技术支撑,包括物联网、区块链、隐私计算和人工智能等。
目前,数据要素技术已落地产业,并创造了新价值。他举例称,动力电池产业链条长,面临梯次回收难、估值定价难、行业协作难问题。利用区块链与IOT技术,让动力电池植入可信上链模组,“通电即上链”,实现全生命周期的运行数据透明可信,结合隐私计算技术,保障数据在上下游企业间和融资、保险等机构间安全流转,形成可信的产业协作网络。
数据要素的流通和利用已有点状的应用,正在进入快速发展阶段。井贤栋以供水网络建设举例,数据要素流通的第一阶段即数据孤岛,就像自家水井,企业拥有数据自研能力,自产自销;第二阶段,实现数据要素点对点流通,就像桶装水,缺乏基础设施的支撑;第三阶段,数据要素在行业和区域进行可信流转,就像城市自来水网;最后一个阶段是数据广域可信流转,好比综合水利工程,实现跨行业、跨地域和跨云可信流转和互联互通,真正普惠千行百业。
他认为,目前数据要素流通正在迈向第三阶段,即实现行业和区域间的可信流转,然而安全、成本和计算复杂度制约了数据要素价值的进一步发挥。
比如,数据交易市场,明文流通带来的风险高,数据泄露和滥用导致非法交易猖獗,卖方“不愿流通”“不敢流通”;在买方市场,密文数据交换效率低下,流通成本可能超过数据价值本身,买方“不愿付费”。此外,人工智能技术迅猛发展,也给隐私计算提出了更高要求,由于成本限制,隐私计算在高阶人工智能比如大模型应用上,还停留在实验室阶段。
井贤栋表示,蚂蚁正在致力于探索下一代隐私计算技术,力求像明文计算一样高效易用。其中一个探索是推出可信密态计算(TECC, Trusted-Environment-based Cryptographic Computing),实现低成本、高安全、高性能和高可靠等维度的提升。
在成本上,在同等高安全等级下,可信密态计算将成本控制在明文分布式计算成本10倍以内,力求让隐私计算的性能、成本逼近明文计算;在安全性上,由于密码学+可信硬件双重安全保障,可达到攻防检验级高安全等级;在性能上,百万级参数CNN模型预测可以在亚秒级完成,亿条数据SQL分析10分钟完成。
“我们希望让隐私计算服务普惠化,成为企业数据要素可信流通的催化剂。”井贤栋提出,推进更先进的隐私计算技术落地产业,要建立数据技术开发和应用生态:技术型数商持续技术探索与创新,降低技术门槛;应用型数商像购买云服务一样购买密态天空计算服务;小微企业通过密态SaaS服务参与数据流通。
“我们的愿景是,让数据价值的流动像自来水一样即开即用,实现安全、便捷和低成本,把握令人激动的数据要素时代。”井贤栋说。