1月16日,微众银行一项名为“大模型数据保护方法、系统、设备、存储介质及程序产品”的专利公布。其申请于2023年8月31日,涉及模型数据处理技术领域。
摘要显示,方法包括:将对大模型进行特征提取得到的第一适配器和第二适配器发送至第二节点,大模型包括第一适配器、主模型和第二适配器;将接收第二节点发送的第一表征数据,输入至大模型进行模型训练,输出得到第二表征数据,将第二表征数据发送至第二节点,第一表征数据为第二节点依据第二适配器和样本业务数据特征进行处理获得;接收第二节点发送的目标梯度值,依据目标梯度值对大模型进行调整,直至大模型调整完成,目标梯度值为第二节点依据第一适配器、第二表征数据和业务标签确定。
该发明实现了在不损害大模型拥有方的模型知识产权的同时又能保障模型需求方的数据隐私。
说明书提到该发明的背景为,大型基础模型的诞生,带来了技术的变革,也给各行各业带来了机遇。然而,训练大模型成本高昂,绝大多数企业都无法承担训练一个完整的大模型的成本。
目前是大模型拥有方提供通用大模型给到对大模型有需求的企业,这些企业利用各自领域的隐私数据对大模型进行微调,从而降低企业使用大模型的成本。但是由于大模型通常需要巨大的算力和数据,训练成本高,因此训练后的大模型一般是专有和不开源的。若大模型拥有方将大模型提供给对大模型有需求的企业进行微调,容易损害大模型拥有方的模型知识产权。若对大模型有需求的企业将领域的隐私数据发送给大模型拥有方进行微调,又容易造成隐私数据泄露。
因此,如何在不损害大模型拥有方的模型知识产权的同时又能保障模型需求方的数据隐私成为目前急需解决的技术问题。
该发明中,通过在第一节点上部署大模型,第二节点拥有样本业务数据特征和业务标签时,第一节点将对大模型进行特征提取的第一适配器和第二适配器发送至第二节点,由于大模型包括主模型、第一适配器和第二适配器。大模型的主要部分即主模型保留在第一节点中,并未发送至第二节点,因此保护了第一节点中大模型拥有方对大模型的模型知识产权,避免了第二节点在知晓大模型的整体架构参数后,存在损害大模型的模型知识产权的现象发生。
在进行大模型调整时,第二节点会依据第二适配器对样本业务数据特征进行格式变换处理,得到第一表征数据,并发送至第一节点,第一节点会依据大模型对第一表征数据进行处理,得到第二表征数据,再将第二表征数据发送至第二节点,接收第二节点依据第一适配器、第二表征数据和业务标签确定的目标梯度值,并依据目标梯度值对大模型进行调整,直至大模型调整完成。从而可以避免处于第一节点中的大模型拥有方直接获取到第二节点中模型需求方的训练样本数据,造成训练样本数据泄露的风险。并且由于第二节点是将训练样本数据的样本业务数据特征通过第二适配器进行处理,得到第二表征数据,第一节点中的大模型仅仅只是对第一表征数据进行处理,并不清楚第二节点中具体的训练样本数据,因此也保障了第二节点中的数据隐私,降低了数据泄露的风险。
展开全文
- 移动支付网 | 2023/12/21 14:34:52
- 移动支付网 | 2023/9/21 11:48:12
- 移动支付网 | 2023/4/20 9:23:42
- 移动支付网 | 2022/8/1 14:32:57
- 移动支付网 | 2021/9/26 20:04:54
- 移动支付网 | 2021/7/22 15:47:23
- 移动支付网 | 2021/4/25 10:26:49
- 新浪金融研究院 | 2021/3/10 10:00:55
- 移动支付网 | 2021/1/4 11:39:10
- 移动支付网 | 2020/12/24 18:22:58
- 移动支付网 | 2024/1/4 14:56:37
- 移动支付网 | 2023/12/26 14:07:40
- 移动支付网 | 2023/12/20 10:19:25
- 移动支付网 | 2023/11/20 10:08:58
- 移动支付网 | 2023/11/15 15:21:18