⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 ranksum.m

📁 秩和检验的Matlab源码程序
💻 M
字号:
%==========================================================================
%
% 文件名称:Ranksum.m
% 摘要:Wilcoxon秩和检验。选出p_value<alfa(显著性水平)的基因。被选出的基因为特征基因。
% 作者:李晓明
% 完成日期:2007年1月19日
%
% 第一次修改
% 修改内容:改善文件的结构、完善注释增加文件的可读性。
% 修改日期:2007年5月17日。
%
% 第二次修改
% 修改内容:修改了choose函数。输出的是特征基因的原始表达量,而不再是归一化表达量。
%          修改目的是使程序更加规范。便于其他程序调用本程序的输出数据。

% 修改时间:2007年6月1日。
%==========================================================================
%
% 主函数介绍:函数名:Ranksum
%            函数实现了Wilcoxon秩和检验。
%            此检验方法的目的在于检验两个总体是否具有相同的中位数。
%            可输出在某一显著性水平下的特征基因组。
% 输入参数:data是基因表达谱数据,行是基因。列是样本。data的第一行是样本类别标记。0表示正常样本;1表示肿瘤样本。
           %===============================================================
           %===============================================================
           % 07年的胃癌数据。
           %data = importdata('gastric_58.xls');%58*(7+4)  0.005
           %===============================================================
           % 07年的胃癌数据。
           %data = importdata('gastric_138.xls');%138*(7+4) 0.01
           %===============================================================
% 输入参数格式要求:行是基因。列是样本。特别注意:数据的第一行是样本类别标记。0表示正常样本;1表示肿瘤样本。
%
% 输出参数:p_value是单边检验的值。基因i的p值<alfa说明基因i是差异表达基因。
%          feature_gene是特征基因的原始表达量。
%          feature_order是特征基因的顺序号。
% 函数中的阈值:显著性水平alfa由键盘输入。alfa在0和1之间,且不能太大。
%==========================================================================
%主函数:

function [ p_value, feature_gene, feature_order ] = Ranksum ( data )

%==========================================================================

% 第一步:将基因表达谱数据标准化。方法:(x-基因最小值)/(基因最大值-基因最小值)。同时计算两类样本的样本个数。

[stand_data, sort_1, sort_2 ] = standardization ( data );

%==========================================================================

% 第二步:检验每一个基因“是差异表达基因,却没有被选出”的概率。

[ p_value, gene_number ] = test ( stand_data, sort_1, sort_2);

%==========================================================================

%第三步:绘制 “基因顺序号_p_value” 的散点图。

[ max_p ] = dot_p ( p_value, gene_number );

%==========================================================================

% 第四步:根据设定的显著性水平,选出特征基因。

[ feature_gene, feature_order ] = choose ( data, p_value );

%==========================================================================
%end
        




 

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -