原文链接:http://tecdat.cn/?p=24002

T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入,是一种非线性降维技术,用于在二维或三维空间中可视化数据。

Python API 提供  T-SNE 办法可视化数据。在本教程中,咱们将简要理解如何在 Python 中应用 TSNE 拟合和可视化数据。教程涵盖:

  1. 鸢尾花数据集TSNE拟合与可视化
  2. MNIST 数据集 TSNE 拟合和可视化

咱们将从加载所需的库和函数开始。

import seaborn as snsimport pandas as pd

鸢尾花数据集TSNE拟合与可视化

加载 Iris 数据集后,咱们将获取数据集的数据和标签局部。 

x = iris.datay = iris.target

而后,咱们将应用 TSNE 类定义模型,这里的 n_components 参数定义了指标维度的数量。'verbose=1' 显示日志数据,因而咱们能够查看它。

TSNE( verbose=1)

接下来,咱们将在图中可视化后果。咱们将在数据框中收集输入组件数据,而后应用“seaborn”库的 scatterplot() 绘制数据。在散点图的调色板中,咱们设置 3,因为标签数据中有 3 种类型的类别。

df = p.Dtame()df\["\] = ydf\["cm"\] =z\[:,0\]df\[cop"\] = z\[,\]plot(hue=dfytlst()                patte=ns.cor_ptt("hls", 3),                dat=df)

MNIST 数据集 TSNE 拟合和可视化

接下来,咱们将把同样的办法利用于更大的数据集。MNIST手写数字数据集十分适合,咱们能够应用Keras API的MNIST数据。咱们只提取数据集的训练局部,因为这里用TSNE来测试数据就足够了。TSNE须要太多的工夫来解决,因而,我将只应用3000行。

x_train= xtrin\[:3000\]y_rin = ytrin\[:3000\]print(x_train.shape)

MNIST 是一个三维数据,咱们将其变形为二维数据。 

print(xtishpe)x\_nit = rshap(\_rin, \[xran.shap\[0\],xtrn.shap\[1\]*xrin.shap\[2\])print(x_mit.shape)

在这里,咱们有 784 个特色数据。当初,咱们将应用 TSNE 将其投影到二维中,并在图中将其可视化。

z = tsne.fit(x_mnist)df\["comp1"\] = z\[:,0\]df\["comp2"\] = z\[:,1\]plot(huedf.tit(),                ata=f)

该图显示了 MNIST 数据的二维可视化。色彩定义了指标数字及其在 2D 空间中的特色数据地位。

在本教程中,咱们简要地学习了如何在 Python 中应用 TSNE 拟合和可视化数据。


 

最受欢迎的见解

1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)和主成分回归(PCR)")

2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化剖析

3.主成分剖析(PCA)基本原理及剖析实例基本原理及剖析实例")

4.基于R语言实现LASSO回归剖析

5.应用LASSO回归预测股票收益数据分析

6.r语言中对lasso回归,ridge岭回归和elastic-net模型

7.r语言中的偏最小二乘回归pls-da数据分析

8.r语言中的偏最小二乘pls回归算法

9.R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)