# SNE 算法
在基本的 SNE 算法中,采用一个条件概率pj∣i 衡量xi, xj 两数据点的相似性,其表达式为
pj∣i=∑k=iexp(−∥xi−xk∥2/2σi2)exp(−∥xi−xj∥2/2σi2)
其中,σi 是以xi 为中心的高斯分布的方差。在此基础上,补充定义pi∣i=0.
数据点xi,xj 映射到yi,yj,采用条件概率qj∣i 衡量两映射点的相似性,其表达式为
qj∣i=∑k=iexp(−∥yi−yk∥2)exp(−∥yi−yj∥2)
该式是与pj∣i 类似的定义,为计算方便,假设其方差σi′=1/2,∀i. 同样,也补充定义qi∣i=0.
为衡量映射的相似性,我们采用 KL 散度衡量两分布的相似性。代价函数为
C=i∑KL(Pi∥Qi)=i∑j∑pj∣ilogqj∣ipj∣i
在该式中,超参数为各pj∣i 中的高斯分布方差σi.
定义困惑度Perp(Pi)=2H(Pi),其中H(Pi)=−∑jpj∣ilog2pj∣i 是Pi 的熵,其具体含义是i 的有效邻居的度量。