存储空间分割阈值_想问你的阈值分割是怎么做的

⑴ matlab中图像怎么找到阈值

给你提供2种方法，一种是直方图阈值法；一种是最大类间方差
1、直方图阈值法
用 MATLAB实现直方图阈值法：
I=imread(' c4.jpg ');
I1=rgb2gray(I);
figure;
subplot(2,2,1);
imshow(I1);
title(' 灰度图像')
axis([50,250,50,200]);
grid on; %显示网格线
axis on; %显示坐标系
[m,n]=size(I1); %测量图像尺寸参数
GP=zeros(1,256); %预创建存放灰度出现概率的向量
for k=0:255
GP(k+1)=length(find(I1==k))/(m*n); %计算每级灰度出现的概率，将其存入GP中相应位置
end
subplot(2,2,2),bar(0:255,GP,'g') %绘制直方图
title('灰度直方图')
xlabel('灰度值')
ylabel(' 出现概率')
I2=im2bw(I,150/255);
subplot(2,2,3),imshow(I2);
title('阈值150的分割图像')
axis([50,250,50,200]);
grid on; %显示网格线
axis on; %显示坐标系
I3=im2bw(I,200/255); %
subplot(2,2,4),imshow(I3);
title('阈值200的分割图像')
axis([50,250,50,200]);
grid on; %显示网格线
axis on; %显示坐标系

2、自动阈值法：Otsu法
用MATLAB实现Otsu算法：
clc
clear all
I=imread(' c4.jpg ');
subplot(1,2,1),imshow(I);
title('原始图像')
axis([50,250,50,200]);
grid on; %显示网格线
axis on; %显示坐标系
level=graythresh(I); %确定灰度阈值
BW=im2bw(I,level);
subplot(1,2,2),imshow(BW);
title('Otsu 法阈值分割图像')
axis([50,250,50,200]);
grid on; %显示网格线
axis on; %显示坐标系

⑵ 想问你的阈值分割是怎么做的

简要说一下：图像分割基本原理：根据图像的组成结构和应用需求将图像划分为若干个互不相交的子区域的过程。这些子区域四某种意义下具有共同属性的像素的连通集合。常用方法有： 1）以区域为对象进行分割，以相似性原则作为分割的依据，即可根据图像的灰度、色彩、变换关系等方面的特征相似来划分图像的子区域，并将各像素划归到相应物体或区域的像素聚类方法，即区域法； 2）以物体边界为对象进行分割，通过直接确定区域间的边界来实现分割； 3）先检测边缘像素，再将边缘像素连接起来构成边界形成分割。具体的阈值分割：阈值分割方法分为以下3类: 1) 全局阈值:T=T[p(x,y)〕，即仅根据f(x,y)来选取阈值，阈值仅与各个图像像素的本身性质有关。 2) 局部阈值:T=T[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。 3) 动态阈值:T=T[x,y,f(x,y),p(x,y)],阈值与像素坐标，图像像素的本身性质和局部区域性质相关。全局阈值对整幅图像仅设置一个分割阈值，通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像，并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果，但存在几个缺点: 1) 每幅子图像的尺寸不能太小，否则统计出的结果无意义。 2) 每幅图像的分割是任意的，如果有一幅子图像正好落在目标区域或背景区域，而根据统计结果对其进行分割，也许会产生更差的结果。 3) 局部阈值法对每一幅子图像都要进行统计，速度慢，难以适应实时性的要求。全局阈值分割方法在图像处理中应用比较多，它在整幅图像内采用固定的阈值分割图像。考虑到全局阈值分割方法应用的广泛性，本文所着重讨论的就是全局阈值分割方法中的直方图双峰法和基于遗传算法的最大类间方差法。在本节中，将重点讨论灰度直方图双峰法，最大类间方差法以及基于遗传算法的最大类间方差法留待下章做继续深入地讨论。参详书目当然是《数字图像处理》，及网上的一些有用文档；工具：MATLAB或VC++ ~

⑶ 一幅图像通过阈值分割算法得到最佳阈值，怎么通过阈值得到分割后的两幅图像比如说：分割舌苔舌质

根据灰度、梯度、形态等来设定自适应阈值。
设定过程：设置→参数→选择（灰度、梯度、形态）→输入数值→计算阈值→搞定。

阈值又叫临界值，是指一个效应能够产生的最低值或最高值。
阈值又称阈强度，是指释放一个行为反应所需要的最小刺激强度。低于阈值的刺激不能导致行为释放。在反射活动中，阈值的大小是固定不变的，在复杂行为中，阈值则受各种环境条件和动物生理状况的影响。当一种行为更难于释放时，就是阈值提高了;当一种行为更容易释放时，就是阈值下降了。一般说来，刚刚完成某一行为后，动物对这一行为的要求就会大大下降。例如刚交过尾的动物，对于性刺激或是没有反应或是反应很弱，这就意味着释放性行为的阈值增加了。类似情况在觅食行为和其他行为中也很常见。另一方面，长时间未发生的行为非常容易被释放，释放这种行为的刺激强度会变得非常小。在极端情况下，阈值的降低可以导致行为的自发产生，这就是空放行为(vacuum behavior)。空放行为是一种无刺激行为释放，是达不到该种行为目的的一种行为。最令人信服的实例是织巢鸟的筑巢行为。饲养在鸟笼中的织巢鸟，在得不到任何筑巢材料和代用物的情况下，也完全可以表现出筑巢动作，虽然这种动作达不到它本来的目的。
阈值又叫临界值，是指一个效应能够产生的最低值或最高值。

⑷ 阈值法分割后怎么还原为原来的矩阵

程序如下，先将下面函数保存，然后给出X与d，再运行函数，注意函数名是保存的m文件名（如果嫌麻烦，可直接截取函数主体内容运行）：
%------------------------------------------------
function Y=F(X,d) %X为目标矩阵，需给定； d为小于的某值

N=numel(X); %矩阵X的元素个数
a=find(X<d); %找出X中小于d的元素的序号（具体可help find）
%下面插值，采用最简单的移动平均，即需要插值的点的值改为其前面两个与后面两个（共4个）元素的平均值；
%但是最前面与最后面两个如果小于d，无法按上面方法插值，简单期间，采用原值；
b=a(find(a>2a<(N-1)));
X(b)=(X(b-1)+X(b-2)+X(b+1)+X(b+2))/4; %插值，将需要替换的位置按上述方式插值。

Y=X;
%------------------------------------------------

不过这样有个问题是插值时，由于移动平均是按元素排序一个个替换的，所以有的需要替换的元素的后面的两个元素有可能都小于阈值，所以导致替换后的值仍可能小于阈值。但这种情况相对可能性较小，如果出现了，将所得的矩阵再用上面的函数做一次变换，应该就能排除这种情况。当然，楼主如果自己有更好的插值想法，也可以以此为基础自行设定了。

⑸ hbase分布式数据库region大小自动分割阀值设置为2G，并重启了hadoop集群，但是region却不自动分割

教育厅的信号突然担心

⑹ outs阈值分割法和全局阈值分割法一样嘛

它是一种基于区域的、
简单的通过灰度值信息提取形状的技术，因其实现简单、计算量小、性能稳定而成为图像分割中最基本和应用最广泛的分割技术。往往阈值分割后的输出图像只有两种灰度值：255和0，所以阈值分割处理又常称为图像的二值化处理。阈值分割处理主要是根据灰度值信息提取前景，所以对前景物体与背景有较强对比度的图像的分割特别有用。对对比度很弱的图像进行阈值分割，需要先进行图像的对比度增强，然后再进行阈值处理。全局阈值分割:灰度图像全局阈值分割指的是将灰度值大于thresh（阈值）的像素设为白色，小于或者等于thresh的像素设为黑色，或者反过来。阈值分割的核心就是如何选取阈值。
局部阈值分割局部阈值又称自适应阈值.即不再像全局阈值一样,对整个矩阵只有一个阈值,而是针对输入矩阵的每一个位置的值都有相应的阈值,这些阈值构成了和输入矩阵同等尺寸的矩阵thresh。局部分割的核心思想也是计算阈值矩阵，比较常用的是后面提到的自适应阈值算法（又称移动平均值算法），其核心思想是把每一个像素的邻域的”平均值“作为该位置的阈值

⑺ 用VC处理图像，阈值分割后只显示一半的效果，另外一半为原图不变

问题应该出在统计对每个像素进行二值化的for循环中；
针对你问题可能出错的地方有两个:
1.宽或者高取错了
2.注意BMP格式的图片一行的存储宽度必须为4的倍数;比如图片宽为11像素;则实际存储的时候每行为12像素;相应的取某个像素的时候其位置应该是i*12+j；i为该像素的行号j为列号。

⑻ 在遥感中阈值是什么意思

图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要的领域之一，它是对图像进行视觉分析和模式识别的基本前提．阈值法是一种传统的图像分割方法，因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术．已被应用于很多的领域。本文是在阅读大量国内外相关文献的基础上，对阈值分割技术稍做总结，分三个大类综述阈值选取方法，然后对阈值化算法的评估做简要介绍。
关键词
图像分割阈值选取全局阈值局部阈值直方图二值化

1．引言
所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域，使得这些特征在同一区域内，表现出一致性或相似性，而在不同区域间表现出明显的不同[37]．简单的讲，就是在一幅图像中，把目标从背景中分离出来，以便于进一步处理。图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要的领域之一，它是对图像进行视觉分析和模式识别的基本前提．同时它也是一个经典难题，到目前为止既不存在一种通用的图像分割方法，也不存在一种判断是否分割成功的客观标准。
阈值法是一种传统的图像分割方法，因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术．已被应用于很多的领域，例如，在红外技术应用中，红外无损检测中红外热图像的分割，红外成像跟踪系统中目标的分割；在遥感应用中，合成孔径雷达图像中目标的分割等；在医学应用中，血液细胞图像的分割，磁共振图像的分割；在农业工程应用中，水果品质无损检测过程中水果图像与背景的分割。在工业生产中，机器视觉运用于产品质量检测等等。在这些应用中，分割是对图像进一步分析、识别的前提，分割的准确性将直接影响后续任务的有效性，其中阈值的选取是图像阈值分割方法中的关键技术。

2．阈值分割的基本概念
图像阈值化分割是一种最常用，同时也是最简单的图像分割方法，它特别适用于目标和背景占据不同灰度级范围的图像[1]。它不仅可以极大的压缩数据量，而且也大大简化了分析和处理步骤，因此在很多情况下，是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按照灰度级，对像素集合进行一个划分，得到的每个子集形成一个与现实景物相对应的区域，各个区域内部具有一致的属性，而相邻区域布局有这种一致属性。这样的划分可以通过从灰度级出发选取一个或多个阈值来实现。
阈值分割法是一种基于区域的图像分割技术，其基本原理是：通过设定不同的特征阈值，把图像像素点分为若干类．常用的特征包括：直接来自原始图像的灰度或彩色特征；由原始灰度或彩色值变换得到的特征．设原始图像为f(x，y)，按照一定的准则在f(x，y)中找到特征值T，将图像分割为两个部分，分割后的图像为

若取：b0=0（黑）,b1=1（白），即为我们通常所说的图像二值化。

（原始图像）（阈值分割后的二值化图像）

一般意义下，阈值运算可以看作是对图像中某点的灰度、该点的某种局部特性以及该点在图像中的位置的一种函数，这种阈值函数可记作
T(x，y，N(x，y)，f(x，y))
式中，f(x，y)是点(x，y)的灰度值；N(x，y)是点(x，y)的局部邻域特性．根据对T的不同约束，可以得到3种不同类型的阈值[37]，即
点相关的全局阈值T＝T(f(x，y))
(只与点的灰度值有关)
区域相关的全局阈值T＝T(N(x，y)，f(x，y))
(与点的灰度值和该点的局部邻域特征有关)
局部阈值或动态阈值T＝T(x，y，N(x，y)，f(x，y))
(与点的位置、该点的灰度值和该点邻域特征有关)

图像阈值化这个看似简单的问题，在过去的四十年里受到国内外学者的广泛关注，产生了数以百计的阈值选取方法[2-9]，但是遗憾的是，如同其他图像分割算法一样，没有一个现有方法对各种各样的图像都能得到令人满意的结果，甚至也没有一个理论指导我们选择特定方法处理特定图像。
所有这些阈值化方法，根据使用的是图像的局部信息还是整体信息，可以分为上下文无关(non-contextual)方法(也叫做基于点(point-dependent)的方法)和上下文相关(contextual)方法(也叫做基于区域(region-dependent)的方法)；根据对全图使用统一阈值还是对不同区域使用不同阈值，可以分为全局阈值方法(global thresholding)和局部阈值方法(local thresholding，也叫做自适应阈值方法adaptive thresholding)；另外，还可以分为双阈值方法(bilever thresholding)和多阈值方法(multithresholding)
本文分三大类对阈值选取技术进行综述：
1) 基于点的全局阈值方法；
2) 基于区域的全局阈值方法
3) 局部阈值方法和多阈值方法

3．基于点的全局阈值选取方法
3.1 p-分位数法
1962年Doyle[10]提出的p-分位数法(也称p-tile法)可以说是最古老的一种阈值选取方法。该方法使目标或背景的像素比例等于其先验概率来设定阈值，简单高效，但是对于先验概率难于估计的图像却无能为力。
例如，根据先验知识，知道图像目标与背景象素的比例为PO/PB,则可根据此条件直接在图像直方图上找到合适的阈值T，使得f(x,y)>=T的象素为目标，f(x,y)<T的象素为背景。

3.2 迭代方法选取阈值[11]
初始阈值选取为图像的平均灰度T0，然后用T0将图像的象素点分作两部分，计算两部分各自的平均灰度，小于T0的部分为TA，大于T0的部分为TB
计算 ,将T1 作为新的全局阈值代替T0，重复以上过程，如此迭代，直至TK 收敛，即TK＋1 ＝TK
经试验比较，对于直方图双峰明显，谷底较深的图像，迭代方法可以较快地获得满意结果。但是对于直方图双峰不明显，或图像目标和背景比例差异悬殊，迭代法所选取的阈值不如最大类间方差法。

3.3 直方图凹面分析法
从直观上说，图像直方图双峰之间的谷底，应该是比较合理的图像分割阈值，但是实际的直方图是离散的，往往十分粗糙、参差不齐，特别是当有噪声干扰时，有可能形成多个谷底。从而难以用既定的算法，实现对不同类型图像直方图谷底的搜索。
Rosenfeld和Torre[12]提出可以构造一个包含直方图的最小凸多边形，由集差确定的凹面。若和分别表示与在灰度级之处的高度，则取局部极大值时所对应的灰度级可以作为阈值。也有人使用低通滤波的方法平滑直方图，但是滤波尺度的选择并不容易[13]。
但此方法仍然容易受到噪声干扰，对不同类型的图像，表现出不同的分割效果。往往容易得到假的谷底。但此方法对某些只有单峰直方图的图像，也可以作出分割。如：

3.4 最大类间方差法
由Otsu[14]于1978年提出的最大类间方差法以其计算简单、稳定有效，一直广为使用。从模式识别的角度看，最佳阈值应当产生最佳的目标类与北京类的分离性能，此性能我们用类别方差来表征，为此引入类内方差、类间方差和总体方差，并定义三个等效的准则测量：
，， . (3)
鉴于计算量的考量，人们一般通过优化第三个准则获取阈值。此方法也有其缺陷，kittler和Illingworth[15]的实验揭示：当图像中目标与背景的大小之比很小时方法失效。
在实际运用中，往往使用以下简化计算公式：
（T）＝ WA(μa-μ)2 + Wb(μb-μ)2
其中，为两类间最大方差，WA 为A类概率，μa为A类平均灰度，Wb 为B类概率，μb为B类平均灰度，μ为图像总体平均灰度。
即阈值T将图像分成A,B两部分，使得两类总方差（T）取最大值的T，即为最佳分割阈值。

3.5 熵方法
八十年代以来，许多学者将Shannon信息熵的概念应用于图像阈值化，其基本思想都是利用图像的灰度分布密度函数定义图像的信息熵，根据假设的不同或视角的不同提出不同的熵准则，最后通过优化该准则得到阈值。Pun[16]通过使后验熵的上限最大来确定阈值。Kapur等人[17]的方法假定目标和背景服从两个不同的概率分布和定义
(4)
使得熵
(5)
达到最大求得最佳阈值。
此方法又称为KSW熵方法。

3.6 最小误差阈值
此方法来源于Bayes最小误差分类方法。

Eb(T)是目标类错分到背景类的概率，Eo(T)是背景类错分到目标类的概率
总的误差概率 E(T) ＝ Eb(T) ＋ Eo(T)
使E(T)取最小值，即为最优分类方法。

在Kittler和Illingworth[18]于1986年提出的最小误差法中，直方图被视为目标与背景混合集概率密度函数的估计
(9)
其中，为先验概率，，求解下列方程可得到Bayes最小误差阈值
(10)
遗憾的是上式中，和通常是未知的，Nakagawa和Rosenfeld[19]提倡用拟合方法从直方图中估计这些参数，但是算法相当复杂，不易实现。

3.7 矩量保持法
矩量保持(moment-preserving)法[20] ，即矩守恒阈值法，是1985年提出的，其基本思想是最佳的阈值应该使分割前后图像的矩量保持不变，由此可以得到一组矩量保持方程，求解该方程组就可以得到最佳阈值。

3.8 模糊集方法
模糊集理论较好的描述了人类视觉中的模糊性和随机性，因此在图像阈值化领域受到了广泛的关注。模糊集阈值化方法的基本思想是，选择一种S状的隶属度函数定义模糊集，隶属度为0.5的灰度级对应了阈值，当然在上述隶属度函数的表达式中阈值是一个未知的参数；然后在此模糊集上定义某种准则函数（例如整个图像的总体模糊度），通过优化准则函数来确定最佳阈值。
Pal等[21]首先，他们把一幅具有个灰度级的图像看作一个模糊集，其中隶属函数定义如下：
(11)
参数称之为交叉点（即）。由此从图像的空间平面得到模糊特性平面。然后，基于此模糊集定义了图像的线性模糊度、二次模糊度和模糊熵，使这三个量取最小值时的交叉点即为最佳阈值。
文献[21]指出模糊隶属度函数在该算法中的作用仅在于将图像由灰度数据空间转换为模糊空间 ,其函数的形式对增强结果几乎没有影响。这就使我们有理由使用一些形式简单的函数形式。例如国内学者发表的一种模糊阈值方法[22]：

隶属度μ(x)表示灰度x具有明亮特性的程度，c为隶属函数窗宽，q对应隶属度为0.5的灰度级。设灰度级的模糊率为：
= min{μ(l),1-μ(l)}
则得到整幅图像的模糊率[44]

其中，MN为图像尺寸，L为图像总灰度级，图像中灰度为的象素个数。
对应于不同的q值，就可以计算出相应的图像模糊率，选取使得最小的q值，作为图像分割的最佳阈值即可。

3.9 小结
对于基于点的全局阈值选取方法，除上述主要几种之外还许多，但大多都是以上述基本方法为基础，做出的改进方法或者对算法的优化，如使用递推方法以降低算法复杂性。
例如在文献[42]中，提出一种使目标和背景差距最大的阈值求取方法，类似于最大类间方差阈值法。是它的一种简化算法。
又如1984年Dunn等人[23]提出了均匀化误差阈值选取方法，这种方法实质上是要使将背景点误分为目标点的概率等于将目标点误分为背景点的概率。类似于最小误差阈值法。
近年来有一些新的研究手段被引入到阈值选取中。比如人工智能，在文献[24] 中，描述了如何用人工智能的方法，寻找直方图的谷底点，作为全局阈值分割。其它如神经网络，数学形态学[39][46]，小波分析与变换[40]等等。
总的来说，基于点的全局阈值算法，与其它几大类方法相比，算法时间复杂度较低，易于实现，适合应用于在线实时图像处理系统。由于我的研究方向为机器视觉，所作的项目要求算法具有良好的实时性，因此针对基于点的全局阈值方法，阅读了较多的文献，在综述里叙述也相对比较详细。

4 基于区域的全局阈值选取方法
对一幅图像而言，不同的区域，比如说目标区域或背景区域，同一区域内的象素，在位置和灰度级上同时具有较强的一致性和相关性。
而在上述基于点的全局阈值选取方法中，有一个共同的弊病，那就是它们实际上只考虑了直方图提供的灰度级信息，而忽略了图像的空间位置细节，其结果就是它们对于最佳阈值并不是反映在直方图的谷点的情况会束手无策，不幸我们通常遇到的很多图像恰恰是这种情况。另一方面，完全不同的两幅图片却可以有相同的直方图，所以即使对于峰谷明显的情况，这些方法也不能保证你得到合理的阈值。于是，人们又提出了很多基于空间信息的阈值化方法。
可以说，局域区域的全局阈值选取方法，是基于点的方法，再加上考虑点领域内象素相关性质组合而成，所以某些方法常称为“二维xxx方法”。由于考虑了象素领域的相关性质，因此对噪声有一定抑止作用[41]。
4.1 二维熵阈值分割方法[25]
使用灰度级-局域平均灰度级形成的二维灰度直方图[43]进行阈值选取，这样就得到二维熵阈值化方法。

（二维灰度直方图：灰度－领域平均灰度）
如图，在0区和1区，象素的灰度值与领域平均灰度值接近，说明一致性和相关性较强，应该大致属于目标或背景区域；2区和3区一致性和相关性较弱，可以理解为噪声或边界部分。二维熵阈值分割，就是选择（S,T）对，使得目标类和背景类的后验熵最大。（具体方法是一维熵阈值分割的推广，可参见上一节）
Abutaleb[26]，和Pal]结合Kapur]和Kirby的方法，分别提出了各自的二维熵阈值化方法，其准则函数都是使目标熵和背景熵之和最大化。Brink[27]的方法则是使这两者中的较小者最大化，该方法的计算复杂度为，后来有人改进为递推快速算法将时间复杂度降为 (其中为最大灰度级数)。

4.2 简单统计法
Kittler等人[28],[29]提出一种基于简单的图像统计的阈值选取方法。使用这种方法，阈值可以直接计算得到，从而避免了分析灰度直方图，也不涉及准则函数的优化。该方法的计算公式为
(19)
其中，

因为e(x,y)表征了点（x,y）领域的性质，因此本方法也属于基于区域的全局阈值法。

4.3 直方图变化法
从理论上说，直方图的谷底是非常理想的分割阈值，然后在实际应用中，图像常常受到噪声等的影响而使其直方图上原本分离的峰之间的谷底被填充，或者目标和背景的峰相距很近或者大小差不多，要检测他们的谷底就很难了。
在上一节基于点的全局阈值方法中，我们知道直方图凹面分析法的弊病是容易受到噪声干扰，对不同类型的图像，表现出不同的分割效果。往往容易得到假的谷底。这是由于原始的直方图是离散的，而且含噪声，没有考虑利用象素领域性质。
而直方图变化法，就是利用一些象素领域的局部性质变换原始的直方图为一个新的直方图。这个新的直方图与原始直方图相比，或者峰之间的谷底更深，或者谷转变成峰从而更易于检测。这里的象素领域局部性质，在很多方法中经常用的是象素的梯度值。
例如，由于目标区的象素具有一定的一致性和相关性，因此梯度值应该较小，背景区也类似。而边界区域或者噪声，就具有较大的梯度值。最简单的直方图变换方法，就是根据梯度值加权，梯度值小的象素权加大，梯度值大的象素权减小。这样，就可以使直方图的双峰更加突起，谷底更加凹陷。

4.4 其它基于区域的全局阈值法
松弛法利用邻域约束条件迭代改进线性方程系统的收敛特性，当用于图像阈值化时其思想是：首先根据灰度级按概率将像素分为“亮”和“暗”两类，然后按照领域像素的概率调整每个像素的概率，调整过程迭代进行，使得属于亮（暗）区域的像素“亮（暗）”的概率变得更大。
其它还有许多方法利用灰度值和梯度值散射图，或者利用灰度值和平均灰度值散射图。

5 局部阈值法和多阈值法

5.1 局部阈值（动态阈值）
当图像中有如下一些情况：有阴影，照度不均匀，各处的对比度不同，突发噪声，背景灰度变化等，如果只用一个固定的全局阈值对整幅图像进行分割，则由于不能兼顾图像各处的情况而使分割效果受到影响。有一种解决办法就是用与象素位置相关的一组阈值（即阈值使坐标的函数）来对图像各部分分别进行分割。这种与坐标相关的阈值也叫动态阈值，此方法也叫变化阈值法，或自适应阈值法。这类算法的时间复杂性可空间复杂性比较大，但是抗噪能力强，对一些用全局阈值不易分割的图像有较好的效果。
例如，一幅照度不均（左边亮右边暗）的原始图像为：

如果只选择一个全局阈值进行分割，那么将出现下面两种情况，都不能得到满意的效果。

（阈值低，对亮区效果好，则暗区差）（阈值高，对暗区效果好，则亮区差）

若使用局部阈值，则可分别在亮区和暗区选择不同的阈值，使得整体分割效果较为理性。

（按两个区域取局部阈值的分割结果）
进一步，若每个数字都用不同的局部阈值，则可达到更理想的分割效果。

5.1.1 阈值插值法
首先将图像分解成系列子图，由于子图相对原图很小，因此受阴影或对比度空间变化等带来的问题的影响会比较小。然后对每个子图计算一个局部阈值（此时的阈值可用任何一种固定阈值选取方法）。通过对这些子图所得到的阈值进行插值，就可以得到对原图中每个象素进行分割所需要的合理阈值。这里对应每个象素的阈值合起来构成的一个曲面，叫做阈值曲面。

5.1.2 水线阈值算法
水线（也称分水岭或流域，watershed）阈值算法可以看成是一种特殊的自适应迭代阈值方法，它的基本思想是：初始时，使用一个较大的阈值将两个目标分开，但目标间的间隙很大；在减小阈值的过程中，两个目标的边界会相向扩张，它们接触前所保留的最后像素集合就给出了目标间的最终边界，此时也就得到了阈值。

5.1.3 其它的局部阈值法
文献[30]提出了一种基于阈值曲面的二维遗传算法。遗传算法是基于进化论中自然选择机理的、并行的、统计的随机化搜索方法，所以在图像处理中常用来确定分割阈值。
文献[31] [32]中提出一种基于局部梯度最大值的插值方法。首先平滑图像，并求得具有局部梯度最大值的像素点，然后利用这些像素点的位置和灰度在图像上内插，得到灰度级阈值表面。
除此之外，典型的局部阈值方法还有White和Rohrer[33]的加权移动平均阈值方法，Perez和Gonzalez[34]的适用于非均匀照射下图像的局部阈值方法以及Shio[35]的与照射无关的对比度度量阈值方法等。总的来说，这类算法的时间和空间复杂度都较大，但是抗噪能力强，对一些使用全局阈值法不宜分割的图像具有较好的效果。

5.2 多阈值法
很显然，如果图像中含有占据不同灰度级区域的几个目标，则需要使用多个阈值才能将它们分开。其实多域值分割，可以看作单阈值分割的推广，前面讨论的大部分阈值化技术，诸如Otsu的最大类间方差法， Kapur的最大熵方法、矩量保持法和最小误差法等等都可以推广到多阈值的情形。以下介绍另外几种多阈值方法。
5.2.1 基于小波的多域值方法。
小波变换的多分辨率分析能力也可以用于直方图分析[36]，一种基于直方图分析的多阈值选取方法思路如下：首先在粗分辨率下，根据直方图中独立峰的个数确定分割区域的类数，这里要求独立峰应该满足三个条件：（1）具有一定的灰度范围；（2）具有一定的峰下面积；（3）具有一定的峰谷差。然后，在相邻峰之间确定最佳阈值，这一步可以利用多分辨的层次结构进行。首先在最低分辨率一层进行，然后逐渐向高层推进，直到最高分辨率。可以基于最小距离判据对在最低层选取的所有阈值逐层跟踪，最后以最高分辨率层的阈值为最佳阈值。
5.2.2 基于边界点的递归多域值方法。
这是一种递归的多阈值方法。首先，将象素点分为边界点和非边界点两类，边界点再根据它们的邻域的亮度分为较亮的边界点和较暗的边界点两类，然后用这两类边界点分别作直方图，取两个直方图中的最高峰多对应的灰度级作为阈值。接下去，再分别对灰度级高于和低于此阈值的像素点递归的使用这一方法，直至得到预定的阈值数。

5.2.3 均衡对比度递归多域值方法。
首先，对每一个可能阈值计算它对应于它的平均对比度

其中，是阈值为时图像总的对比度，是阈值检测到的边界点的数目。然后，选择的直方图上的峰值所对应的灰度级为最佳阈值。对于多阈值情形，首先用这种方法确定一个初始阈值，接着，去掉初始阈值检测到的边界点的贡献再做一次的直方图，并依据新的直方图选择下一个阈值。这一过程可以这样一直进行下去，直到任何阈值的最大平均对比度小于某个给定的限制为止。

6 阈值化算法评价简介
尽管人们在图像分割方面做了许多研究工作，但由于尚无通用的分割理论，现已提出的分割算法大都是针对具体问题的，并没有一种适合于所有图像的通用的分割算法。另一方面，给定一个实际图像分割问题要选择合用的分割算法也还没有标准的方法。为解决这些问题需要研究对图像分割的评价问题。分割评价是改进和提高现有算法性能、改善分割质量和指导新算法研究的重要手段。
然而，如同所有的图像分割方法一样，阈值化结果的评价是一个比较困难的问题。事实上对图像分割本身还缺乏比较系统的精确的研究，因此对其评价则更差一些。人们先后已经提出了几十个评价准则。这些准则中又有定性的，也有定量的；有分析算法的，也有检测实验结果的，文献[37]将它们大致分为13类。
文献[4] 中选择摄影师、建筑物和模特三幅图像作为标准图像，并采用趋于一致性度量和形状参数对几种常用的全局阈值方法的分割结果进行了评价。结果表明对于这三幅图像，如果希望得到的二值图像比较均匀且目标的形状较好，推荐使用最大熵方法、矩量保持方法和最大类间方差法。
文献[38] 中以磁盘及鹤模型作标准图像，在噪声条件下用错分概率、形状和均匀性度量作为标准评估了五种常见的整体阈值选取方法的性能。这五种方法是四元树方法、矩量保持法、最大类间方差法、最大熵方法和简单统计法。结果表明各种方法的性能不仅与所处理的图像有关，而且也和所选用的准则有关。该文献也指出，对于一般实时应用来说，可以选择最大类间方差方法和简单统计法。
最后，评价的目的是为了能指导、改进和提高分割，如何把评价和分割应用联系起来尚有许多工作要做。一个可能的方法是结合人工智能技术，建立分割专家系统[45]，以有效的利用评价结果进行归纳推理，从而把对图像的分割由目前比较盲目的试验阶段推进到系统地实现的阶段。

⑼ 寻找灰度图象分割阈值的matlab程序，结果不对，不知道问题在哪

a=imread('YuChu.bmp');
如果读入的是彩色图，需要用a=rgb2gray(a);转换为灰度图
加了这句我运行了下，程序没出现错误也能出图
另外matlab图像处理工具箱中用level
=
graythresh(I)函数去阈值，其方法与你的方法一致，都是Otsu方法
补充：
你看看a读入时数据的大小，要是3维的话就是RGB图像了，需要转一下
另外是程序错误还是结果不对？

⑽ 如何看待微软新开源的LightGBM

作者：柯国霖
链接：https://www.hu.com/question/51644470/answer/130946285
来源：知乎
着作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

10/19/2017 更新：

完整的更新列表可以参考： Microsoft/LightGBM/Key-Events.md

下面列出一些比较大的更新

R-package 已完成
缺失值（missing value）的自动处理
类别特征(Categorical Feature) 的进一步优化，不再使用类似one-hot coding的分割方式。对于类别数量很多的类别特征，使用one-vs-other的切分方式会长出很不平衡的树，不能实现较好的精度。这是树模型在支持类别特征的一个痛点。 LightGBM可以找出类别特征的最优切割，即many-vs-many的切分方式。并且最优分割的查找的时间复杂度可以在线性时间完成，和原来的one-vs-other的复杂度几乎一致。

cf: NIPS 2017 有什么值得关注的亮点？

12/17/2016 更新：

完成了python-package，欢迎使用。
直接支持类别特征(Categorical Feature)，不需要进行0/1展开。相对0/1展开的解决方案，速度快非常多，且精度一致。

大多数机器学习工具都无法直接支持类别特征作为输入，一般需要转换成多维0/1特征，带来计算和内存上的额外消耗。LightGBM增加了针对于类别特征的决策规则，这在决策树上也很好实现。主要的思想是，在对类别特征计算分割增益的时候，不是按照数值特征那样由一个阈值进行切分，而是直接把其中一个类别当成一类，其他的类别当成另一类。这实际上与0/1展开的效果是一样的。

---------------------------------------

正好开源了一个月，强答一下。

GBDT 虽然是个强力的模型，但却有着一个致命的缺陷，不能用类似 mini batch 的方式来训练，需要对数据进行无数次的遍历。如果想要速度，就需要把数据都预加载在内存中，但这样数据就会受限于内存的大小；如果想要训练更多的数据，就要使用外存版本的决策树算法。虽然外存算法也有较多优化，SSD 也在普及，但在频繁的 IO 下，速度还是比较慢的。

为了能让 GBDT 高效地用上更多的数据，我们把思路转向了分布式 GBDT，然后就有了 LightGBM。设计的思路主要是两点，1. 单个机器在不牺牲速度的情况下，尽可能多地用上更多的数据；2.
多机并行的时候，通信的代价尽可能地低，并且在计算上可以做到线性加速。

基于这两个需求，LightGBM 选择了基于 histogram 的决策树算法。相比于另一个主流的算法 pre-sorted（如 xgboost 中的 exact 算法），histogram 在内存消耗和计算代价上都有不少优势。

Pre-sorted 算法需要的内存约是训练数据的两倍(2 * #data * #features
* 4Bytes)，它需要用32位浮点来保存 feature value，并且对每一列特征，都需要一个额外的排好序的索引，这也需要32位的存储空间。对于 histogram 算法，则只需要(#data
* #features * 1Bytes)的内存消耗，仅为 pre-sorted算法的1/8。因为 histogram 算法仅需要存储 feature
bin value (离散化后的数值)，不需要原始的 feature value，也不用排序，而 bin
value 用 uint8_t (256
bins) 的类型一般也就足够了。
在计算上的优势则主要体现在“数据分割”。决策树算法有两个主要操作组成，一个是“寻找分割点”，另一个是“数据分割”。从算法时间复杂度来看，Histogram 算法和 pre-sorted 算法在“寻找分割点”的代价是一样的，都是O(#feature*#data)。而在“数据分割”时，pre-sorted 算法需要O(#feature*#data)，而 histogram 算法是O(#data)。因为 pre-sorted 算法的每一列特征的顺序都不一样，分割的时候需要对每个特征单独进行一次分割。Histogram算法不需要排序，所有特征共享同一个索引表，分割的时候仅需对这个索引表操作一次就可以。（更新: 这一点不完全正确，pre-sorted 与 level-wise 结合的时候，其实可以共用一个索引表(row_idx_to_tree_node_idx)。然后在寻找分割点的时候，同时操作同一层的节点，省去分割的步骤。但这样做的问题是会有非常多随机访问，有很大的chche miss，速度依然很慢。）。
另一个计算上的优势则是大幅减少了计算分割点增益的次数。对于一个特征，pre-sorted 需要对每一个不同特征值都计算一次分割增益，而 histogram 只需要计算 #bin (histogram 的横轴的数量) 次。
最后，在数据并行的时候，用 histgoram 可以大幅降低通信代价。用 pre-sorted 算法的话，通信代价是非常大的（几乎是没办法用的）。所以 xgoobst 在并行的时候也使用 histogram 进行通信。

当然， histogram 算法也有缺点，它不能找到很精确的分割点，训练误差没有 pre-sorted 好。但从实验结果来看， histogram 算法在测试集的误差和 pre-sorted 算法差异并不是很大，甚至有时候效果更好。实际上可能决策树对于分割点的精确程度并不太敏感，而且较“粗”的分割点也自带正则化的效果。

在 histogram 算法之上， LightGBM 进行进一步的优化。首先它抛弃了大多数 GBDT 工具使用的按层生长
(level-wise) 的决策树生长策略，而使用了带有深度限制的按叶子生长 (leaf-wise) 算法。 level-wise 过一次数据可以同时分裂同一层的叶子，容易进行多线程优化，不容易过拟合。但实际上level-wise是一种低效的算法，因为它不加区分的对待同一层的叶子，带来了很多没必要的开销。因为实际上很多叶子的分裂增益较低，没必要进行搜索和分裂。leaf-wise则是一种更为高效的策略，每次从当前所有叶子中，找到分裂增益最大(一般也是数据量最大)的一个叶子，然后分裂，如此循环。因此同 level-wise 相比，在分裂次数相同的情况下，leaf-wise 可以降低更多的误差，得到更好的精度。leaf-wise 的缺点是可能会长出比较深的决策树，产生过拟合。因此 LightGBM 在leaf-wise 之上增加了一个最大深度的限制，在保证高效率的同时防止过拟合。

另一个比较巧妙的优化是 histogram 做差加速。一个容易观察到的现象：一个叶子的直方图可以由它的父亲节点的直方图与它兄弟的直方图做差得到。通常构造直方图，需要遍历该叶子上的所有数据，但直方图做差仅需遍历直方图的 k 个桶。利用这个方法，LightGBM 可以在构造一个叶子的直方图后，可以用非常微小的代价得到它兄弟叶子的直方图，在速度上可以提升一倍。

如需要更多的细节，可以参考github上的文档：https://github.com/Microsoft/LightGBM/wiki/Features

存储空间分割阈值

与存储空间分割阈值相关的内容