共计 1550 个字符,预计需要花费 4 分钟才能阅读完成。
原文链接:http://tecdat.cn/?p=24002
T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入,是一种非线性降维技术,用于在二维或三维空间中可视化数据。
Python API 提供 T-SNE 办法可视化数据。在本教程中,咱们将简要理解如何在 Python 中应用 TSNE 拟合和可视化数据。教程涵盖:
- 鸢尾花数据集 TSNE 拟合与可视化
- MNIST 数据集 TSNE 拟合和可视化
咱们将从加载所需的库和函数开始。
import seaborn as sns
import pandas as pd
鸢尾花数据集 TSNE 拟合与可视化
加载 Iris 数据集后,咱们将获取数据集的数据和标签局部。
x = iris.data
y = iris.target
而后,咱们将应用 TSNE 类定义模型,这里的 n_components 参数定义了指标维度的数量。’verbose=1′ 显示日志数据,因而咱们能够查看它。
TSNE(verbose=1)
接下来,咱们将在图中可视化后果。咱们将在数据框中收集输入组件数据,而后应用“seaborn”库的 scatterplot() 绘制数据。在散点图的调色板中,咱们设置 3,因为标签数据中有 3 种类型的类别。
df = p.Dtame()
df\["\] = y
df\["cm"\] =z\[:,0\]
df\[cop"\] = z\[,\]
plot(hue=dfytlst()
patte=ns.cor_ptt("hls", 3),
dat=df)
MNIST 数据集 TSNE 拟合和可视化
接下来,咱们将把同样的办法利用于更大的数据集。MNIST 手写数字数据集十分适合,咱们能够应用 Keras API 的 MNIST 数据。咱们只提取数据集的训练局部,因为这里用 TSNE 来测试数据就足够了。TSNE 须要太多的工夫来解决,因而,我将只应用 3000 行。
x_train= xtrin\[:3000\]
y_rin = ytrin\[:3000\]
print(x_train.shape)
MNIST 是一个三维数据,咱们将其变形为二维数据。
print(xtishpe)
x\_nit = rshap(\_rin, \[xran.shap\[0\],xtrn.shap\[1\]*xrin.shap\[2\])
print(x_mit.shape)
在这里,咱们有 784 个特色数据。当初,咱们将应用 TSNE 将其投影到二维中,并在图中将其可视化。
z = tsne.fit(x_mnist)
df\["comp1"\] = z\[:,0\]
df\["comp2"\] = z\[:,1\]
plot(huedf.tit(),
ata=f)
该图显示了 MNIST 数据的二维可视化。色彩定义了指标数字及其在 2D 空间中的特色数据地位。
在本教程中,咱们简要地学习了如何在 Python 中应用 TSNE 拟合和可视化数据。
最受欢迎的见解
1.matlab 偏最小二乘回归 (PLSR) 和主成分回归 (PCR) 和主成分回归(PCR)”)
2.R 语言高维数据的主成分 pca、t-SNE 算法降维与可视化剖析
3. 主成分剖析 (PCA) 基本原理及剖析实例基本原理及剖析实例 ”)
4. 基于 R 语言实现 LASSO 回归剖析
5. 应用 LASSO 回归预测股票收益数据分析
6.r 语言中对 lasso 回归,ridge 岭回归和 elastic-net 模型
7.r 语言中的偏最小二乘回归 pls-da 数据分析
8.r 语言中的偏最小二乘 pls 回归算法
9. R 语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)