记者联系电话

一诺媒体邀约公司,电视新闻媒体求助热线电话,优质的记者大V资源,网络新闻火速发布。全民关注,热点打造。
本站是国内知名记者邀约平台:一诺媒体邀约公司。常年从事网红明星、品牌公司等网络推广业务。微信:

客户可以获得有效的信息,厂商可以随时随地获得有价值的用户满意度信息。一诺媒体邀约公司打造知名品牌,典型的网上宣传包括搜索引擎广告,其他包括新闻发布会、百科词典、问答写作、来自媒体的新浪微博微信发帖等。这种方式可以获得记者联系电话,增强商品和企业的信誉,增强客户对企业的信任,尤其是对一个新企业。在运营初期,可以根据各种在线推广方式,将信息快速传递给目标消费者,从而开拓市场。
莱智RealAI总设计师:探索人工智能与隐私计算的关系
  • 2022-01-05 07:11

莱智Realai首席架构师博士认为,AI与隐私计算密切相关。首先,隐私计算是AI能力的重要补充。从技术角度来看,一个好的模型只有通过足够规模和多样性的数据才能训练出来。隐私计算可以解决数据连接问题,为算法的持续进化提供数据补充。

第二,徐世珍博士认为,AI是隐私计算的核心要求。从场景来看,隐私计算通常与AI密切相关,可以看作是隐私计算的上层应用和核心需求。基于密码学的MPC/ Federation学习需要针对特定应用进行程序重写,且大多属于AI应用,如DNN、logistic回归或树模型等。从这个角度出发,发现AI和隐私计算有一定的相似性,两者都没有解决所有问题的通用技术方案。同时,理想情况下,我们希望隐私计算技术与上层应用程序脱钩,但实际情况并非如此。每个应用都与底层技术息息相关,底层技术复制了整个应用,所以AI是底层技术的牵引。

第三,隐私计算是AI平台的2.0版本。从产品来看,用户实际需要的是一个具有隐私计算功能的机器学习平台。各家公司都声称提供隐私计算平台。其实大部分都提供AI建模能力,但底层通过密码学和MPC技术具有隐私保护功能。

总的来说,徐世珍博士认为,人工智能和隐私计算相辅相成,是彼此的核心需求。但是目前我们也知道隐私计算面临很多问题。

第一,生态壁垒。隐私计算解决了数据孤岛的问题,但解决后会导致技术孤岛的问题。隐私计算的技术之间没有联系,也无法联系,这基本上意味着需要重构上层代码。

第二,计算性能。慢,因为引入了大量的密码运算,要么是MPC带来的通信问题,要么是同态加密带来的计算性能问题,这使得它很难支持大规模的数据训练。如果是几十亿或者几十亿的培训,仅靠联邦学习或者MPC是很难实现的。

第三,安全。从知识产权的角度来看,各公司不太可能披露其底层协议(部分开源项目除外),导致协议不透明的问题,难以审计。如果安全性不能被审计,就会包含巨大的漏洞。

第四,可用性。对于数据生态和解决方案生态,客户不可能自己连接数据。因此,作为隐私计算技术的服务商,需要提供开箱即用的数据甚至开箱即用的解决方案,让用户在不改变原有集中式非隐私计算体验的情况下使用隐私计算平台。

刚才讲了AI和隐私计算的关系。看吧,AI相当于早年的隐私计算。事实上,AI的发展趋势可以用来预测隐私计算未来的发展趋势。

AI如何解决兼容性和互操作性的问题?

编辑AI的框架有很多,比如Tensorflow、PyTorch等。,这也很难互相沟通。后来,ONNX应运而生,每个家族的协议在数据流层聚集在一起,然后转换成另一个框架可以执行的东西。数据流图层面的兼容性是AI为解决框架间互联问题而提出的解决方案,可作为隐私计算互联的参考。

第二是性能优化,要知道AI也是计算密集型的。AI的性能优化基本遵循两条路线,一条是硬件升级,第一条是CPU,第二条是GPU,现在是专用的AI芯片,无论是训练芯片还是预测芯片。二是算法升级,包括模型压缩、蒸馏、剪枝,将大模型变成小模型,这些也适用于隐私计算的发展。

第三,是AI的安全问题。公司做的一个研究,左边是雪山的图片。加入抗噪后,AI可以识别错误,并将其识别为狗的图片。事实上,隐私计算也面临着类似的问题,如横向联盟中的数据中毒和模型污染,因此AI和隐私计算在安全性提升上也有相似之处。

第四是场景落地。这几年一直说AI赋能一切,AI赋能所有行业。现在,我们发现行业结合了AI,场景结合了AI。目前,隐私计算也处于这两种思想的交汇期。到底是以隐私计算为基础赋能所有行业,还是根据具体场景选择隐私计算技术?这是两条路线之间的争议。当然,我相信AI结合场景更有价值,隐私计算结合场景更实用、更易接近、更有价值。

从AI的发展经验来演绎隐私计算的发展,徐世珍博士认为有以下思路。

首先是编译器路线。兼容性和互通性应该在底层操作员层完成,而不仅仅是在软件层或集成层。底层数据流图也是一个安全、可追踪、可验证的工具,可以表达计算逻辑。

第二,性能优化。短期内可以通过优化底部的密码库来实现,未来需要新的硬件来提高速度。第三,隐私计算的安全性包括防御密码协议层和应用层的恶意攻击。随着AI的发展,一些防御样本攻击的问题开始出现,隐私计算的发展未来也将面临一些新的安全问题,这些问题应该在当前发展的时候考虑,而不是先发展后管理。

在产业路径上,隐私计算需要逐场景实施,针对不同场景选择不同的技术路线。结合隐私计算的三条技术路线,每条路线的优缺点包括多方安全计算、联邦学习和可信执行环境。

(1)从应用场景来看,MPC更适合数值类的简单计算和查询、交集类的具体计算;联邦学习主要针对机器学习的场景,计算逻辑复杂,不是简单的计算。TEE更适合一般的计算场景,比如有时候你要运行一个完整的Tensorflow或者数据库应用,很难用到前两个,所以这个更合适。

(2)从技术优势来看。在简单的分布式统计/查询交集场景中,MPC相对成熟,但在计算复杂的情况下,由于通信情况,仍然不成熟。联邦学习保证了复杂的机器学习和建模可以在不离开仓库的情况下进行,在大多数情况下具有可接受的计算性能,但在一些数据量特别大的情况下,密码计算仍然是主要限制;TEE是集中式数据处理,易于开发,其算法/框架生态最好。

(3)劣势角度。MPC流量大,支持简单的计算逻辑是可以的,但是一旦计算逻辑复杂,比如一个Resnet,2方,一张图片的推断可能需要10分钟以上,这在实际落地中是完全不能接受的;联邦学习主要针对AI建模场景,但有些场景只是想简单的求和,最大化。此时,联合学习并不是一个理想的解决方案。TEE的主要缺点是依赖硬件厂商的硬件可信度和用户是否接受集中数据处理。

虽然隐私计算可以解决一些问题,但我们也应该看到,还有很多问题没有解决。隐私计算解决了数据流通的安全问题,将数据的所有权和使用权分离,可以避免流通过程中资产的损失,但不能解决端到端的安全问题。很多企业更喜欢端到端的安全性,比如如何存储和收集数据,数据流转前后如何确定所有权。隐私计算在解决此类全链路安全问题时仍面临一系列挑战。因此,隐私计算只是企业合规建设中的一个技术环节,仍需要在法律法规的整体指导下进行。

此外,隐私计算尚未解决意愿问题。数据虽然可以流通,为什么人们愿意拿出数据流通?用户是否只是将隐私计算作为企业合规建设的成本项目?这是一个巨大的挑战。包括我们现在看到的数据交易机构,我们发现交易数据的意愿并没有那么强,所以这个问题不仅仅是技术层面的,只有深度结合AI让业务方从隐私计算中受益,才能将隐私计算从成本项变为收益项,保证企业的可持续开放和数据价值的闭环运行。

为此,开发了隐私保护计算平台RealSecure。

这个平台的一个核心特性是联合AI编译器。发现大多数隐私计算框架,在做(垂直)联邦学习时,会先分析整个数据流图或计算公式,然后手动重写,在X端写一个程序,在Y端写另一个程序,这是常见的手动重写方法。编译器技术,通过分析底层数据流图,将X端和Y端应该执行的内容自动分离,从而实现机器学习生态和联邦机器学习生态的统一。机器学习框架已经从弱数据流图时代发展到强数据流图时代,未来隐私计算的发展也将遵循这一路径。因此,会按照原来的界面编写一套程序,转换成数据流图,进行分布式分割和调度,并增加一些操作生成模型流,而不是像以前那样在X、Y两侧编写一套程序,让从业者即使不懂隐私计算,也可以自行操作、灵活调度隐私计算平台。

其次,发现联邦学习90%以上的程序时间都花在了加解密上。因此创新性地引入了全同态加密技术,而不是一对一加密。基于SIMD技术,一个密文环对应可能有8000甚至16000个明文需要操作。发现这特别适合机器学习中Tensor是最小数据单元的场景,它用批量数据而不是单个数据进行计算。在简单的机器学习算法中,它实现了很好的速度提升,与开源框架相比,端到端的性能提升可以超过40倍。同态的加解密运算,虽然单次运算的性能不好,但如果批量进行,会提高几十倍甚至上百倍,所以同态的引入是一个重要的环节。然而,在使用同态时,调整参数很麻烦,这需要对底层原理有深刻的理解。

徐世珍博士认为,这套自动化工具可以实时简单,并实现算法兼容。对于静态的机器学习模型来说,它的用户界面非常好,你会觉得好像在写NumPy程序,但实际上它是被垂直调度到两侧执行学习操作的。底层使用数据流图,上层用户可以看到底层的操作符,不能再只有Python或者C++代码了。有了数据流图,安全性就不容否认了。知道双方正在进行什么样的程序,数据流图的统一可以说是未来各种技术路线统一的中间工具。同时提供协议模型、安全假设、运行计算日志审核、数据捕获监控,看是否与本次隐私计算的数据流图完全一致。

还建立了“平台+数据+服务+场景”的一体化解决方案。基于该解决方案,制作了许多场景案例。

这是一个总行的资产过渡分析案例,包括总行、保险子公司、证券子公司。需要对交叉客户的总资产进行分析,定位交叉客户的资产转移。这是加法、最大值和平均值的应用案例。主要分析银行600-800万资产的客户、800-1000万客户及其保险、证券购买行为,提供数据决策支持,基于跨区域MPC计算。

其次,通过横向联合的技术(纵向联合的业务场景较多),由中原银行牵头,中小银行各成员单位通过部署的平台节点横向连接本行的用户标签和特征信息,帮助数据量较小的银行机构提升反欺诈模型效果。

(结束)

亲爱的数据,产生了


最新动态


相关资讯

  • 《江苏现代消费服务业创新与标准化
  • 中美高层战略对话就在眼前,崔天凯
  • 真巧!警察上门宣传反诈骗,女子在
  • 太阳又落山了!赛后,记者当着保罗
  • 客货运输可期,济南郑州未来更近联
  • 为什么奥运会“Q 记者”滑板比赛有那
  • 卖家太浩繁了!安光电跌停后,两大
  • 毕业后取消支付宝学籍不影响正常贷
  • 珠江“深度游”,信息时代的小记者
  • 重庆市第二批“知识产权综合保护联

    微信号:tuisho
    全年无休,早9点至晚9点

    复制号码

    跳转微信

    ×


    靓号
    此号仅服务老客户
    新客户请联系微信

    ×