关于数据挖掘:R语言分析蛋白质组学数据飞行时间质谱MALDITOF法峰值检测多光谱比较

5次阅读

共计 1204 个字符,预计需要花费 4 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=30051

蛋白质组学

•钻研生物体产生的全副蛋白质。

• Foci:鉴定、构造测定、生物标志物、通路、表白。

基质辅助激光解吸航行工夫质谱 (MALDI-TOF) 法示例频谱

钻研动机

只有绝对较少的开源软件解决方案可用,而 R 平台则很少。

• 解决技术和生物复制的必要性。

• 绝对强度的定量令人不称心

• 钻研光谱校准对临床预后的影响。

• 模块化且易于定制的分析程序

示例数据

血清肽多姆剖析显示血小板因子 4 是与胰腺癌相干的潜在甄别肽

G.M. Fiedler,A.B. Leichtle,J. Kase et al Clin Cancer Res June 1,2009 15:3812-3819

“两个显著峰(m/z 3884;5959)对辨别患者和衰弱对照的敏感性为 86.3%,特异性为 97.6%。”

“基于 MALDI-TOOF MS 的血清肽球剖析容许发现和验证血小板因子 4 [m / z 3884,7767;S.G.]作为胰腺癌的新甄别标志物。

入手操作:文件导入

> spectra[[1]]

 

入手操作:画图

> abline(v=3884, col="blue")

入手操作:画图 m /z 3884

> plot(spectra[[1]]

 

入手操作:方差稳固和平滑 

> spea <- lapply(sptra, transfensty, fun=moAvg)

入手实际:基线校正

> plot(spea[[1]]
> lines(b, col="red");

入手操作:基线校正 – SNIP 

> bl <- estiline(specta[[1]]

 

入手操作:基线校正 – SNIP 

> speca <- lapply(spe, remoeline)
> lines(specra[[1]])

实际:峰值检测

 

> peas[[1]]

 

> top <- intnsity(p) %in% sort(int
> labePeak

 

单光谱工作流程

> peaks <- lapply(spetra, detecPeaks)

多光谱比拟


最受欢迎的见解

1.R 语言分布式滞后非线性模型(DLNM)空气污染钻研温度对死亡率影响建模

2.R 语言散布滞后线性和非线性模型(DLNM)剖析空气污染(臭氧)、温度对死亡率工夫序列数据

3.R 语言群组变量抉择、组惩办 GROUP LASSO 套索模型预测剖析新生儿出世体重危险因素数据和穿插验证、可视化

4.R 语言逻辑回归、随机森林、SVM 反对向量机预测 FRAMINGHAM 心脏病危险和模型诊断可视化

5.R 语言非线性混合效应 NLME 模型 (固定效应 & 随机效应) 反抗哮喘药物茶碱动力学钻研反抗哮喘药物茶碱动力学钻研 ”)

6.R 语言应用限度均匀生存工夫 RMST 比拟两条生存曲线剖析肝硬化患者

7. 分类回归决策树交互式修剪和更好看地可视化剖析细胞图像宰割数据集

8.PYTHON 深度学习实现自编码器 AUTOENCODER 神经网络异样检测心电图 ECG 工夫序列

9.R 语言如何在生存剖析与 Cox 回归中计算 IDI,NRI 指标

正文完
 0