关于数据挖掘:Python用TSNE非线性降维技术拟合和可视化高维数据iris鸢尾花MNIST-数据附代码数据

原文链接：http://tecdat.cn/?p=24002

最近咱们被客户要求撰写对于非线性降维技术的钻研报告，包含一些图形和统计输入。

T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入，是一种非线性降维技术，用于在二维或三维空间中可视化数据

Python API 提供 T-SNE 办法可视化数据。在本教程中，咱们将简要理解如何在 Python 中应用 TSNE 拟合和可视化数据。教程涵盖：

鸢尾花数据集TSNE拟合与可视化
MNIST 数据集 TSNE 拟合和可视化

咱们将从加载所需的库和函数开始。

import seaborn as sns
import pandas as pd

鸢尾花数据集TSNE拟合与可视化

加载 Iris 数据集后，咱们将获取数据集的数据和标签局部。

x = iris.data
y = iris.target

而后，咱们将应用 TSNE 类定义模型，这里的 n_components 参数定义了指标维度的数量。’verbose=1′ 显示日志数据，因而咱们能够查看它。

TSNE( verbose=1)

接下来，咱们将在图中可视化后果。咱们将在数据框中收集输入组件数据，而后应用“seaborn”库的 scatterplot() 绘制数据。在散点图的调色板中，咱们设置 3，因为标签数据中有 3 种类型的类别。

df = p.Dtame()
df["] = y
df["cm"] =z[:,0]
df[cop"] = z[,]

plot(hue=dfytlst()
                patte=ns.cor_ptt("hls", 3),
                dat=df)

MNIST 数据集 TSNE 拟合和可视化

接下来，咱们将把同样的办法利用于更大的数据集。MNIST手写数字数据集十分适合，咱们能够应用Keras API的MNIST数据。咱们只提取数据集的训练局部，因为这里用TSNE来测试数据就足够了。TSNE须要太多的工夫来解决，因而，我将只应用3000行。

点击题目查阅往期内容

R语言高维数据的主成分pca、 t-SNE算法降维与可视化剖析案例报告

左右滑动查看更多

x_train= xtrin[:3000]
y_rin = ytrin[:3000]
print(x_train.shape)

MNIST 是一个三维数据，咱们将其变形为二维数据。

print(xtishpe)
x_nit = rshap(_rin, [xran.shap[0],xtrn.shap[1]*xrin.shap[2])
print(x_mit.shape)

在这里，咱们有 784 个特色数据。当初，咱们将应用 TSNE 将其投影到二维中，并在图中将其可视化。

z = tsne.fit(x_mnist)
df["comp1"] = z[:,0]
df["comp2"] = z[:,1]

plot(huedf.tit(),
                ata=f)

该图显示了 MNIST 数据的二维可视化。色彩定义了指标数字及其在 2D 空间中的特色数据地位。

在本教程中，咱们简要地学习了如何在 Python 中应用 TSNE 拟合和可视化数据。

点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据》。

点击题目查阅往期内容

Python用稠密、高斯随机投影和主成分剖析PCA对MNIST手写数字数据进行降维可视化
R语言k-means聚类、档次聚类、主成分（PCA）降维及可视化剖析鸢尾花iris数据集R语言 PCA(主成分剖析)，CA(对应剖析)夫妻职业差别和马赛克图可视化
R语言主成分剖析（PCA）葡萄酒可视化：主成分得分散点图和载荷图
R语言用主成分PCA、逻辑回归、决策树、随机森林剖析心脏病数据并高维可视化
R语言用温度对城市档次聚类、kmean聚类、主成分剖析和Voronoi图可视化
主成分剖析(PCA)原理及R语言实现及剖析实例
R语言法国足球联赛球员因子分析、主成分剖析（FA，PCA）
偏最小二乘回归（PLSR）和主成分回归（PCR）
R语言高维数据的主成分pca、t-SNE算法降维与可视化剖析案例报告
R语言有RStan的多维验证性因子分析（CFA）
R语言对混合散布中的不可观测与可观测异质性因子分析
R语言法国足球联赛球员多重对应剖析（MCA）

关于数据挖掘:Python用TSNE非线性降维技术拟合和可视化高维数据iris鸢尾花MNIST-数据附代码数据

原文链接：http://tecdat.cn/?p=24002

鸢尾花数据集TSNE拟合与可视化

MNIST 数据集 TSNE 拟合和可视化

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据挖掘:Python用TSNE非线性降维技术拟合和可视化高维数据iris鸢尾花MNIST-数据附代码数据

原文链接：http://tecdat.cn/?p=24002

鸢尾花数据集TSNE拟合与可视化

MNIST 数据集 TSNE 拟合和可视化

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复