关于算法:Python用TSNE非线性降维技术拟合和可视化高维数据iris鸢尾花MNIST-数据

27次阅读

共计 1550 个字符,预计需要花费 4 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=24002

T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入,是一种非线性降维技术,用于在二维或三维空间中可视化数据。

Python API 提供  T-SNE 办法可视化数据。在本教程中,咱们将简要理解如何在 Python 中应用 TSNE 拟合和可视化数据。教程涵盖:

  1. 鸢尾花数据集 TSNE 拟合与可视化
  2. MNIST 数据集 TSNE 拟合和可视化

咱们将从加载所需的库和函数开始。

import seaborn as sns
import pandas as pd

鸢尾花数据集 TSNE 拟合与可视化

加载 Iris 数据集后,咱们将获取数据集的数据和标签局部。

x = iris.data
y = iris.target

而后,咱们将应用 TSNE 类定义模型,这里的 n_components 参数定义了指标维度的数量。’verbose=1′ 显示日志数据,因而咱们能够查看它。

TSNE(verbose=1)

接下来,咱们将在图中可视化后果。咱们将在数据框中收集输入组件数据,而后应用“seaborn”库的 scatterplot() 绘制数据。在散点图的调色板中,咱们设置 3,因为标签数据中有 3 种类型的类别。

df = p.Dtame()
df\["\] = y
df\["cm"\] =z\[:,0\]
df\[cop"\] = z\[,\]

plot(hue=dfytlst()
                patte=ns.cor_ptt("hls", 3),
                dat=df)

MNIST 数据集 TSNE 拟合和可视化

接下来,咱们将把同样的办法利用于更大的数据集。MNIST 手写数字数据集十分适合,咱们能够应用 Keras API 的 MNIST 数据。咱们只提取数据集的训练局部,因为这里用 TSNE 来测试数据就足够了。TSNE 须要太多的工夫来解决,因而,我将只应用 3000 行。

x_train= xtrin\[:3000\]
y_rin = ytrin\[:3000\]
print(x_train.shape)

MNIST 是一个三维数据,咱们将其变形为二维数据。

print(xtishpe)
x\_nit = rshap(\_rin, \[xran.shap\[0\],xtrn.shap\[1\]*xrin.shap\[2\])
print(x_mit.shape)

在这里,咱们有 784 个特色数据。当初,咱们将应用 TSNE 将其投影到二维中,并在图中将其可视化。

z = tsne.fit(x_mnist)
df\["comp1"\] = z\[:,0\]
df\["comp2"\] = z\[:,1\]

plot(huedf.tit(),
                ata=f)

该图显示了 MNIST 数据的二维可视化。色彩定义了指标数字及其在 2D 空间中的特色数据地位。

在本教程中,咱们简要地学习了如何在 Python 中应用 TSNE 拟合和可视化数据。


 

最受欢迎的见解

1.matlab 偏最小二乘回归 (PLSR) 和主成分回归 (PCR) 和主成分回归(PCR)”)

2.R 语言高维数据的主成分 pca、t-SNE 算法降维与可视化剖析

3. 主成分剖析 (PCA) 基本原理及剖析实例基本原理及剖析实例 ”)

4. 基于 R 语言实现 LASSO 回归剖析

5. 应用 LASSO 回归预测股票收益数据分析

6.r 语言中对 lasso 回归,ridge 岭回归和 elastic-net 模型

7.r 语言中的偏最小二乘回归 pls-da 数据分析

8.r 语言中的偏最小二乘 pls 回归算法

9. R 语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)

正文完
 0