互联网服务的良好体验取决于云和端的协作,当人们的目光被“云AI”大模型吸引之时,在另一侧“端AI”亦有长足的发展,甚至在日常当中发挥更直接作用。2023年9月,在人工智能顶级会议ICCV2023举办的两项深度学习挑战赛上,支付宝终端技术部xNN团队分别拿下2项赛事的3个冠亚军。目前相关技术已经被广泛应用于支付宝的日常服务,高效提升了手机APP的本地计算处理能力。
在ICCV 2023围绕“计算机视觉高效深度学习”而展开的“推理”与“训练”两大领域的挑战赛上,支付宝xNN团队都获得了绝对优势。其中“推理挑战赛”上,支付宝shanwei_zsw和zhaoyu_x两支小组分别获得冠亚军,比分大幅领先第三名45%以上。在“训练挑战赛”上,支付宝shanwei_zsw则以0.04的些微差值位居亚军。
(图为在2023ICCV计算机视觉高效深度学习“训练挑战赛”上,支付宝终端技术部xNN团队shanwei_zsw位居亚军)
(图为在2023ICCV计算机视觉高效深度学习“推理挑战赛”上,支付宝终端技术部xNN团队shanwei_zsw和zhaoyu_x分获冠亚军)
“计算机视觉高效深度学习”旨在解决有限计算资源下的最优化方案。这有别于“云AI”上几乎无限计算资源场景,更加符合比如依赖于手机性能的移动端APP内的实际场景。可以说,“云AI”在能力上大开大合大发展,“端AI”则更聚焦于用好手上的每一分算力。换句话说,人们日常使用APP的体验更大程度上取决于该能力。
据了解,支付宝xNN端智能团队亦即瞄准提升APP本地AI能力,在历年的改进当中,已经形成每天百亿级的调用计算。xNN作为行业首批将端智能技术实现规模化业务落地的团队,自2016年成立初期便围绕核心技术持续深耕,先后沉淀了行业领先的模型压缩算法库及端侧高性能计算引擎技术。
近些年伴随着端侧AI芯片发展,不同设备的计算资源差异越来越大,算力碎片化的问题不断加深。因此,xNN团队进一步提出了新一代、自动化、智能化的研发效能解决方案——“可伸缩建模”:通过软硬件协同优化提升设备计算效率,以AI优化AI为思路提升建模效率,实现为不同设备研发不同的模型以最大化设备整体的算力利用率,进而为每一位支付宝用户带来更优的使用体验。
以日常使用为例。使用支付宝APP扫五福时,即调用该能力,用户手机摄像头捕捉到五福画面后,就在APP内完成计算识别处理,无需上传云端,因此除了识别上的“跟手感”之外,还具备更好的数据隐私安全性,耗费更少的移动联网流量。