简单来说:看不到“数据本身”,但能看到并操作数据的“加密外壳”,而这个外壳的数学结构,恰好保留了原始数据之间的运算关系。

让我用一个极度简化但能体现核心思想的类比和具体数学例子来解释。

核心思想:把运算从“数据域”转移到“结构域”

想象我们不说同一种语言,但想合作算算术。

  1. 传统计算(明文):我们都说中文。我给你数字“3”和“5”,你直接告诉我“8”。

  2. 同态加密计算:你只懂英文,我不懂英文但想让你帮我算。我发明了一个规则一致的翻译机

    • 我的“3” → 翻译成英文是 “Three”

    • 我的“5” → 翻译成英文是 “Five”

    • 我给你的任务:把这两个英文词用某种英文规则“结合”起来。

    • 你完全不懂中文,但按英文规则把 “Three” 和 “Five” 结合,得到了 “Eight”。

    • 我把 “Eight” 丢回翻译机(解密),它吐出了中文的 “8”。

关键点:你从头到尾只看到了英文词,不知道它们对应3和5,更不知道结果是8。但你执行的“英文结合规则”,正好对应了我的“中文加法法则”。翻译机(加密方案)在设计时,就确保了这种规则映射。


一个具体的数学模型:教科书式RSA(乘法同态)

这是理解“结构保留”最清晰的例子。

1. 密钥生成

  • 选两个大质数 p=3, q=5,则 N = p*q = 15

  • 计算一个公开指数 e(比如 e=3),和一个私密指数 dd=3,这里仅为示例,实际复杂得多)。

  • 公钥(N=15, e=3)

  • 私钥(d=3)

2. 加密规则

  • 明文 m 是一个数字(小于N)。加密就是计算:密文 c = m^e mod N

  • 加密 m1=2c1 = 2^3 mod 15 = 8 mod 15 = 8

  • 加密 m2=3c2 = 3^3 mod 15 = 27 mod 15 = 12

  • 现在,服务器只看到了密文 8 和 12,它不知道这对应2和3。

3. 同态运算(在服务器上,看不到数据)

  • 我们定义密文上的运算  为 乘法

  • 服务器计算:c_result = c1 * c2 = 8 * 12 = 96

  • 服务器看到的只是96这个数字。

4. 解密规则

  • 解密公式:明文 m = c_result^d mod N

  • 客户端拿到 c_result=96,用私钥 d=3 解密:m = 96^3 mod 15

  • 计算过程:96 mod 15 = 6(因为96=15*6+6),所以相当于 6^3 mod 15 = 216 mod 15 = 6

5. 奇迹验证

  • 原始明文是 2 和 3

  • 如果我们直接在明文上计算乘法:2 * 3 = 6

  • 解密结果 6 正好等于明文乘积 6 !


发生了什么?数学的“魔法”

关键在于 幂运算的代数结构 和 模运算的性质

  1. 加密c1 = m1^e mod Nc2 = m2^e mod N

  2. 密文相乘c1 * c2 = (m1^e) * (m2^e) mod N = (m1 * m2)^e mod N

    • 这里用到了指数运算法则:(x^a)*(y^a) = (x*y)^a

  3. 解密(c1 * c2)^d mod N = [(m1 * m2)^e]^d mod N = (m1 * m2)^{e*d} mod N

  4. 密钥设计的核心:在RSA中,我们精心选择了 e 和 d,使得 e*d ≡ 1 mod φ(N)(φ是欧拉函数)。根据欧拉定理,这保证了 (m^{e*d}) mod N = m

  5. 最终(m1 * m2)^{e*d} mod N = (m1 * m2) mod N

所以,服务器对密文的乘法操作 (m1^e) * (m2^e),在解密后,自然、必然地映射为了明文的乘法 (m1 * m2) 服务器像操作一个“提线木偶”一样操作着密文,木偶的动作(密文运算)由藏在里面的真实小人(明文数据)的关系所决定。


推广到加法和全同态

RSA展示了乘法同态。现代全同态加密(如BFV, CKKS)更为复杂,但原理相通:

  1. 将数据编码为多项式或向量:明文不再是整数 m,而是被编码到一个多项式环上的元素。

  2. 加密是“包裹噪声”:密文 = (编码后的明文 + 结构化的随机噪声)。这个噪声就像一层“雾”,保证了安全性,但它也是结构化的。

  3. 加法和乘法定义在环上:在密文空间(多项式向量)中,有精心定义的加法和乘法运算规则。

  4. 结构保持:这些运算规则被设计成:

    • 密文加法 解密后 ≈ 明文加法

    • 密文乘法 解密后 ≈ 明文乘法

    • 代价是运算会放大“噪声”。

  5. 噪声管理:当噪声过大时,用“自举”技术(用加密的私钥同态地执行解密电路)来刷新密文、降低噪声,从而支持更多次运算。

总结回答你的问题

“看不到数据是怎么计算的?”

答案是:我们计算的是数据的“加密替身”(密文),但这个替身被赋予了一种特殊的“骨骼结构”或“基因”。当我们按照预先定义好的规则(密文运算)来操纵这些替身时,它们内部结构的变化,恰好对应了原始数据(明文)之间我们想要的实际运算结果。解密过程,就是读取这个最终“结构状态”,并将其翻译回数据域的过程。

服务器就像一个在黑暗房间里的机器人,它不知道手里拿的积木(密文)原本是什么形状(明文),但它有一本动作手册(同态运算算法),手册上写着:“当你听到‘加法’指令,就把两块积木用A方式拼接;听到‘乘法’,就用B方式拼接。” 它照做了。房间外有光的人(拥有密钥的客户端)把拼接后的结果拿出去一看,发现正好是自己想要的形状。

这种“动作手册”与“最终形状”的确定性对应关系,就是同态加密的数学核心。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐