他人答的曾经很漂亮了,我就简略复述一下。
1、从新布局间断特色边界:就是将间断值缩放到 [-1,1], 留神既能够缩也能够放大。
2、标准化间断特色:这个就套公式就行,计算平均值和方差,然而如果方差小还是不大行。
3、是针对离散变量而言,更像是 skearn 外面的哑变量解决,所有离散变量不管多大全副改为 01。
另外:
我本人补充,如果是机器特色学习上述就行。深度学习能够不改哑变量,当初万物皆可 embedding,用嵌入层将离散变量压缩变得浓密,将连续变量 rescale bound 就行。