为了
✦
KSM画家
欢迎关注KSMPainter; 这是一个终生学习的人,他在坚持自己热爱的事情,和这个人一起快乐地增肥~不定期分享源码和示例文件,在线交流和答疑。
文末有源码获取途径,还有惊喜福利)
由于微信改版推送乱序,不少朋友反映收不到公众号的推文。 将KSMPainter公众号设为星标,不错过每一个精彩内容! ! !
前言
本期将介绍如何使用R检验实验数据的正态分布
编者经常看到一些期刊文章的作者将Spearman相关性和Pearson相关性混淆,或许是为了让研究数据更有说服力,但我们还是要进行正态性检验,以便在分析前得到可靠的解释和分析结果。
概念介绍
皮尔逊相关性要求 X 和 Y 都是连续变量,并且都来自正态分布的受试者; T-test等方法通常用于进一步检验Pearson相关系数k-s检验正态分布结果怎么看,T-test是基于数据是正态的假设。
斯皮尔曼相关不需要变量,可以使用连续变量或秩变量。
研究数据时如何选择相关的统计方法?
对于连续数据、正态分布和线性相关,Pearson 系数最合适。 当然,使用斯皮尔曼系数没有错,但统计效率没有皮尔逊相关高;
只要不满足以上三个条件中的任何一个,就必须使用 Spearman 相关系数,而不能使用 Pearson 系数。
# 调用R包
library(tidyverse) # 管理数据表
library(ggpubr) # 快速绘图
library(rstatix) # 统计分析
#数据读取
options(stringsAsFactors=F)# R中环境变量设置,防止字符型变量转换为因子
# 读入环境因子数据表
ENV=read.csv("varechem.csv",header = T,row.names = 1)
head(ENV) # 查看数据前几行
密度图测试(Density plot)
#可视化正态分布检验
# 环境因子数据
p1 <- ggdensity(ENV$TN, fill = "lightgray")#以TN为例
pdf("环境因子TN-密度图.pdf",height =4,width = 4)
p1
dev.off()
QQ图(如果数据呈正态分布,则点应在置信区间内形成一条直线。)
# 环境因子数据
p2 <- ggqqplot(ENV$TN) #以TN为例
pdf("环境因子TN-QQ图.pdf",height =4,width = 4)
p2
dev.off()
正态分布的显着性检验
可视化数据的方法。 因为它不能给出一个确定的结果。 用肉眼观察分布形状来检查数据是否服从正态分布通常是不可靠的。
# 单变量正态性检验(以单一变量TN说明)
ENV %>% shapiro_test(TN)
# 多变量正态性检验
assign("M",names(ENV[,1:16])) # 将环境因子名称,赋于M
M
ENV %>% shapiro_test(M) # 对名称包括在M中的的环境因子进行shapiro test
如需示例数据,可直接打赏本文,并在后台留言回复小编。 当然k-s检验正态分布结果怎么看,如果你还想免费嫖,文章的代码已经写的很清楚了,不过还是希望你在走之前能喜欢!
【20220409期】《判断你的SCI论文是否混淆Spearman和Pearson并检验数据正态分布+建议》
以前的文章
【20230403期】《》
【20230404期】《》
【20230405期】《》
【20230406期】《》
【20230409期】《判断你的SCI论文是否混淆Spearman和Pearson并检验数据正态分布+建议》
如果您看到这里,请点个赞,关注和支持,您的“关注”是我创作的动力。
编辑| 灵正堂
投稿 | 不想工作的Peggy Tong
评论|KSMPainter