近似的同态比较:简单多项式的迭代计算
参考文献:
- [Gold64] Goldschmidt R E. Applications of division by convergence[D]. Massachusetts Institute of Technology, 1964.
- [CKKLL19] Cheon J H, Kim D, Kim D, et al. Numerical method for comparison on homomorphically encrypted numbers[C]//International Conference on the Theory and Application of Cryptology and Information Security. Cham: Springer International Publishing, 2019: 415-445.
- [CKK20] Cheon J H, Kim D, Kim D. Efficient homomorphic comparison methods with optimal complexity[C]//Advances in Cryptology–ASIACRYPT 2020: 26th International Conference on the Theory and Application of Cryptology and Information Security, Daejeon, South Korea, December 7–11, 2020, Proceedings, Part II 26. Springer International Publishing, 2020: 221-256.
- [LLNK21] Lee E, Lee J W, No J S, et al. Minimax approximation of sign function by composite polynomial for homomorphic comparison[J]. IEEE Transactions on Dependable and Secure Computing, 2021, 19(6): 3711-3727.
- [LLKN22] Lee E, Lee J W, Kim Y S, et al. Optimization of homomorphic comparison algorithm on rns-ckks scheme[J]. IEEE Access, 2022, 10: 26163-26176.
CKKS 方案只能计算多项式,但是符号函数是阶跃的,难以表示为简单多项式。如果采取完全的插值,随着精度提高,多项式的度数将会是指数级。[CKK20] 提出可以通过迭代一个或两个简单多项式,来快速逼近符号函数,它达到了渐进最优。[LLNK21] 使用若干个 minimax approximate polynomials 的组合来逼近符号函数,用动态规划算法确定它们,实际效率更好。[LLKN22] 继续改进,但提升并不算大。
New Comparison Algorithm
Idea
待计算的两个函数,关系为
c
o
m
p
(
a
,
b
)
=
(
s
g
n
(
a
?
b
)
+
1
)
/
2
comp(a,b)=(sgn(a-b)+1)/2
comp(a,b)=(sgn(a?b)+1)/2
s
g
n
(
x
)
=
{
1
,
x
>
0
0
,
x
=
0
?
1
,
x
<
0
c
o
m
p
(
a
,
b
)
=
{
1
,
a
>
b
1
/
2
,
a
=
b
0
,
a
<
b
\begin{aligned} sgn(x) &= \left\{\begin{aligned} 1, && x>0\\ 0, && x=0\\ -1, && x<0 \end{aligned}\right.\\ comp(a,b) &= \left\{\begin{aligned} 1, && a>b\\ 1/2, && a=b\\ 0, && a<b \end{aligned}\right.\\ \end{aligned}
sgn(x)comp(a,b)?=?
?
??1,0,?1,??x>0x=0x<0?=?
?
??1,1/2,0,??a>ba=ba<b??
在 [CKKLL19] 中指出如下的公式,
c
o
m
p
(
a
,
b
)
=
lim
?
k
→
∞
a
k
a
k
+
b
k
comp(a,b) = \lim_{k \to \infty} \frac{a^k}{a^k + b^k}
comp(a,b)=k→∞lim?ak+bkak?
可以使用迭代算法,
- 初始化 a 0 = a , b 0 = b a_0=a,b_0=b a0?=a,b0?=b
- 迭代计算 a k + 1 ← a k 2 / ( a k 2 + b k 2 ) a_{k+1} \gets a_k^2/(a_k^2+b_k^2) ak+1?←ak2?/(ak2?+bk2?) 和 b k + 1 ← a k 2 / ( a k 2 + b k 2 ) b_{k+1} \gets a_k^2/(a_k^2+b_k^2) bk+1?←ak2?/(ak2?+bk2?)
- 输出 a d = a 2 d / ( a 2 d + b 2 d ) ≈ c o m p ( a , b ) a_d=a^{2^d}/(a^{2^d}+b^{2^d}) \approx comp(a,b) ad?=a2d/(a2d+b2d)≈comp(a,b)
然而这种方法需要计算同态除法,同态方案并不自然支持。[CKKLL19] 使用了 Goldschmidt’s division 算法,但效率很低。
[CKK20] 的目标是找到一个好的简单多项式,并且它的迭代过程中不需要计算除法。首先将 [CKKLL19] 的迭代函数修改为 f ( x ) = x 2 / ( x 2 + ( 1 ? x 2 ) ) , x ∈ [ 0 , 1 ] f(x)=x^2/(x^2+(1-x^2)), x \in [0,1] f(x)=x2/(x2+(1?x2)),x∈[0,1],容易验证
- 它穿过了 ( 0 , 0 ) , ( 0.5 , 0.5 ) , ( 1 , 1 ) (0,0), (0.5, 0.5), (1,1) (0,0),(0.5,0.5),(1,1) 三个点
- 它在区间 [ 0 , 0.5 ] [0,0.5] [0,0.5] 上是凸的,在区间 [ 0.5 , 1 ] [0.5,1] [0.5,1] 上是凹的
- 随着函数迭代 f ( d ) f^{(d)} f(d),它将逼近区间 [ 0 , 1 ] [0,1] [0,1] 上的阶跃函数
事实上,我们只需要找出类似形状的多项式(不需要多项式分式),依旧可以通过迭代过程逼近这个阶跃函数。迭代过程如图所示:
Core Properties
任意区间 [ c 1 , c 2 ] [c_1,c_2] [c1?,c2?] 总是可以缩放平移到 [ ? 1 , 1 ] [-1,1] [?1,1] 上,因此我们只考虑符号函数 s g n ( x ) , x ∈ [ ? 1 , 1 ] sgn(x), x \in [-1,1] sgn(x),x∈[?1,1]
现在,我们确定形状近似 f ( x ) = x 2 / ( x 2 + ( 1 ? x 2 ) ) , x ∈ [ 0 , 1 ] f(x)=x^2/(x^2+(1-x^2)), x \in [0,1] f(x)=x2/(x2+(1?x2)),x∈[0,1] 的,用于迭代计算 s g n ( x ) , x ∈ [ ? 1 , 1 ] sgn(x), x \in [-1,1] sgn(x),x∈[?1,1] 的多项式应当具备的性质:
- 它应当是奇函数,假设它的度数为 2 n + 1 2n+1 2n+1,记为 f n f_n fn?
- 它应当穿过两个端点 f ( ? 1 ) = ? 1 , f ( 1 ) = 1 f(-1)=-1, f(1)=1 f(?1)=?1,f(1)=1,由于原点附近它是阶跃的,因此难以用多项式正确逼近,我们排除对区间 [ ? ? , ? ] [-\epsilon,\epsilon] [??,?] 的逼近
- 它应当在区间 [ ? 1 , 0 ] [-1,0] [?1,0] 上是凸的,在区间 [ 0 , 1 ] [0,1] [0,1] 上是凹的,并且凹凸性越强烈越好,我们设置多项式导数在两个端点上最大化重根
使用数学语言描述,
事实上,对于固定的参数
n
n
n,多项式
f
n
f_n
fn? 和常数
c
n
c_n
cn? 都是固定的,
f
n
(
x
)
=
∑
i
=
0
n
(
2
i
i
)
?
x
(
1
?
x
2
)
i
4
i
c
n
=
2
n
+
1
4
n
?
(
2
n
n
)
=
Θ
(
n
)
\begin{aligned} f_n(x) &= \sum_{i=0}^n {2i \choose i} \cdot \frac{x(1-x^2)^i}{4^i}\\ c_n &= \frac{2n+1}{4^n} \cdot {2n \choose n} = \Theta(\sqrt n) \end{aligned}
fn?(x)cn??=i=0∑n?(i2i?)?4ix(1?x2)i?=4n2n+1??(n2n?)=Θ(n?)?
可以计算出某些多项式,
它们的形状如图所示:
我们称多项式
p
(
x
)
p(x)
p(x) 在区间
[
?
1
,
1
]
[-1,1]
[?1,1] 上满足
(
α
,
?
)
(\alpha,\epsilon)
(α,?)-close to 函数
f
(
x
)
f(x)
f(x),假如
∥
p
(
x
)
?
f
(
x
)
∥
∞
,
??
[
?
1
,
?
?
]
∪
[
?
,
1
]
≤
2
?
α
\big\| p(x) -f(x) \big\|_{\infty,\,\, [-1,-\epsilon]\cup[\epsilon,1] } \le 2^{-\alpha}
?p(x)?f(x)
?∞,[?1,??]∪[?,1]?≤2?α
可以证明上述多项式
f
n
f_n
fn? 的迭代收敛性质:
NewComp
根据等式 c o m p ( a , b ) = ( s g n ( a ? b ) + 1 ) / 2 comp(a,b)=(sgn(a-b)+1)/2 comp(a,b)=(sgn(a?b)+1)/2 和近似式 f n ( d ) ≈ s g n ( n ) f_n^{(d)} \approx sgn(n) fn(d)?≈sgn(n),可以给出如下的近似比较算法,
实数多项式
f
n
f_n
fn? 可以转化为整系数多项式,
h
n
(
x
)
=
f
n
(
2
x
?
1
)
+
1
2
=
∑
i
=
0
n
(
2
i
i
)
?
(
2
x
?
1
)
(
x
?
x
2
)
i
h_n(x) = \frac{f_n(2x-1)+1}{2} = \sum_{i=0}^n {2i \choose i} \cdot (2x-1)(x-x^2)^i
hn?(x)=2fn?(2x?1)+1?=i=0∑n?(i2i?)?(2x?1)(x?x2)i
并且它满足迭代公式
h
n
(
d
)
(
x
)
=
(
f
n
(
d
)
(
2
x
?
1
)
+
1
)
/
2
h_n^{(d)}(x) = (f_n^{(d)}(2x-1)+1)/2
hn(d)?(x)=(fn(d)?(2x?1)+1)/2,于是
c
o
m
p
(
a
,
b
)
≈
g
n
(
d
)
(
(
a
?
b
+
1
)
/
2
)
comp(a,b) \approx g_n^{(d)}((a-b+1)/2)
comp(a,b)≈gn(d)?((a?b+1)/2)
采取 Paterson-Stockmeyer 算法,每轮迭代中计算
f
n
(
x
)
f_n(x)
fn?(x) 需要
C
n
:
=
Θ
(
n
)
C_n:=\Theta(\sqrt n)
Cn?:=Θ(n?) 次同态乘法,
D
n
:
=
log
?
n
+
O
(
1
)
D_n:=\log n + O(1)
Dn?:=logn+O(1) 乘法深度。迭代次数的下界为
d
n
:
=
1
log
?
c
n
log
?
(
1
/
?
)
+
1
log
?
(
n
+
1
)
log
?
(
α
?
1
)
+
O
(
1
)
d_n := \frac{1}{\log c_n}\log(1/\epsilon) + \frac{1}{\log(n+1)}\log(\alpha-1) + O(1)
dn?:=logcn?1?log(1/?)+log(n+1)1?log(α?1)+O(1)
我们简记复杂度类
L
(
a
,
b
)
:
=
a
log
?
(
1
/
?
)
+
b
log
?
(
α
?
1
)
+
O
(
1
)
L(a,b) := a\log(1/\epsilon) + b\log(\alpha-1) + O(1)
L(a,b):=alog(1/?)+blog(α?1)+O(1),那么 total computation 和 total depth 分别为:
T
C
n
=
d
n
?
C
n
=
L
(
Θ
(
n
)
log
?
c
n
,
Θ
(
n
)
log
?
(
n
+
1
)
)
T
D
n
=
d
n
?
D
n
=
L
(
log
?
n
+
O
(
1
)
log
?
c
n
,
log
?
n
+
O
(
1
)
log
?
(
n
+
1
)
)
\begin{aligned} TC_n &= d_n \cdot C_n = L\left( \frac{\Theta(\sqrt n)}{\log c_n}, \frac{\Theta(\sqrt n)}{\log(n+1)} \right)\\ TD_n &= d_n \cdot D_n = L\left( \frac{\log n + O(1)}{\log c_n}, \frac{\log n + O(1)}{\log(n+1)} \right)\\ \end{aligned}
TCn?TDn??=dn??Cn?=L(logcn?Θ(n?)?,log(n+1)Θ(n?)?)=dn??Dn?=L(logcn?logn+O(1)?,log(n+1)logn+O(1)?)?
由于
c
n
=
Θ
(
n
)
c_n = \Theta(\sqrt n)
cn?=Θ(n?),因此前者发散到无穷大,后者会接近
L
(
2
,
1
)
L(2,1)
L(2,1)(但并不收敛)。计算表明
n
=
4
n=4
n=4 的时候
T
C
4
TC_4
TC4? 是最优的,此时有
T
C
4
=
Θ
(
1
)
?
log
?
(
1
/
?
)
+
Θ
(
1
)
)
?
log
?
(
α
?
1
)
+
O
(
1
)
TC_4 = \Theta(1)\cdot\log(1/\epsilon) + \Theta(1)) \cdot \log(\alpha-1) + O(1)
TC4?=Θ(1)?log(1/?)+Θ(1))?log(α?1)+O(1),假如
?
=
2
?
α
\epsilon=2^{-\alpha}
?=2?α 那么就是
T
C
4
=
Θ
(
α
)
TC_4 = \Theta(\alpha)
TC4?=Θ(α),随近似精度的提升线性增长。
Acceleration
在迭代计算 f n ( d ) f_n^{(d)} fn(d)? 的过程中,实际上分为两步。对于 x ≥ ? x \ge \epsilon x≥?,
- 首先计算 f n ( d ? ) f_n^{(d_\epsilon)} fn(d??)?,将区间 [ ? , 1 ] [\epsilon,1] [?,1] 映射到区间 [ 1 ? τ , 1 ] [1-\tau,1] [1?τ,1],其中 0 < τ < 1 0<\tau<1 0<τ<1 是某个常数
- 继续计算 f n ( d α ) f_n^{(d_\alpha)} fn(dα?)?,将区间 [ 1 ? τ , 1 ] [1-\tau,1] [1?τ,1] 映射到区间 [ 1 ? 2 ? α , 1 ] [1-2^{-\alpha},1] [1?2?α,1],它逼近 s g n ( x ) = 1 sgn(x)=1 sgn(x)=1
在第一阶段的迭代过程中,其实不需要 f n f_n fn? 的全部性质。[CKK20] 提出可以用另一个斜率更大的函数 g g g 来代替,从而更少的迭代次数 d ? d_\epsilon d?? 就可以达到区间。现在我们确定 g g g 应当具有的性质,
- 依旧应当是奇函数
- 存在常数 0 < δ < 1 0<\delta<1 0<δ<1,在区间 ( 0 , δ ] (0,\delta] (0,δ] 内严格递增
- 在区间 [ δ , 1 ] [\delta,1] [δ,1] 中总保持映射到区间 [ 1 ? τ , 1 ] [1-\tau,1] [1?τ,1]
使用数学语言描述,
对于固定的常数 τ \tau τ,为了使得 ( 0 , δ ] (0,\delta] (0,δ] 内的导数更大(从而迭代次数更少),我们确定多项式 g g g 使得最小化常数 δ 0 \delta_0 δ0?,采用迭代算法寻找:
可以证明这个过程收敛到某个多项式 g n , τ g_{n,\tau} gn,τ?,它是导数最大意义下最优的。
[CKK20] 固定 τ = 1 / 4 \tau=1/4 τ=1/4,虽然上述获得的 g n g_n gn? 并没有关于 n n n 的简单表达式,但是以精度 2 ? 10 2^{-10} 2?10 近似为
它们的形状和迭代,如图所示:
修改后的算法为
根据 g n g_n gn? 的某些启发式性质,可以确定 g n ′ ( 0 ) g_n'(0) gn′?(0) 的大小和 g n ( x ) g_n(x) gn?(x) 逼近 ± 1 \pm1 ±1 的速率(详见 [CKK20]),最后计算出各自的迭代次数 d ? d_\epsilon d?? 和 d α d_\alpha dα? 的下界。虽然不同的输入值 x x x 需要的迭代次数也不同,但它是密文状态的,难以用它来动态地确定迭代次数。
通过和 NewComp 的复杂度做比较,算法 NewCompG 在第一阶段的迭代深度降低了基本一半,因此乘法深度 T D n TD_n TDn? 和乘法复杂度 T C n TC_n TCn? 都显著降低。
Application to Min/Max
最大值/最小值可以用绝对值来构造,
min
?
(
a
,
b
)
=
(
a
+
b
)
?
∣
a
?
b
∣
2
max
?
(
a
,
b
)
=
(
a
+
b
)
+
∣
a
?
b
∣
2
\begin{aligned} \min(a,b) &= \frac{(a+b) - |a-b|}{2}\\ \max(a,b) &= \frac{(a+b) + |a-b|}{2}\\ \end{aligned}
min(a,b)max(a,b)?=2(a+b)?∣a?b∣?=2(a+b)+∣a?b∣??
而绝对值可以用符号函数来构造,
∣
x
∣
=
x
?
s
g
n
(
x
)
≈
x
?
(
f
n
(
d
α
)
°
g
n
(
d
?
)
)
(
x
)
|x| = x \cdot sgn(x) \approx x \cdot (f_n^{(d_\alpha)}\circ g_n^{(d_\epsilon)})(x)
∣x∣=x?sgn(x)≈x?(fn(dα?)?°gn(d??)?)(x)
对应的收敛性:
Result
[CKK20] 选用了 HEAAN
同态加密库,设置参数
N
=
2
17
N=2^{17}
N=217 和
q
L
≈
2
2250
q_L \approx 2^{2250}
qL?≈22250。由于 CKKS 是 Level FHE,不同层的复杂度不一样,因此它使用
T
D
n
?
T
C
n
TD_n \cdot TC_n
TDn??TCn? 作为计算复杂度的描述。在设置
?
=
2
?
α
\epsilon = 2^{-\alpha}
?=2?α 时,依旧是
n
=
4
n=4
n=4 最优化,因此选用
f
4
,
g
4
f_4,g_4
f4?,g4?
计算复杂度、乘法深度、性能测试:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!