数字图像基础
视觉感知要素
人眼视觉基础
感光器 锥状体:主要集中在中央凹,对颜色高度敏感(白昼视觉/亮视觉)杆状体:主要分布在视网膜表面,给出总体图像(暗视觉/微光视觉)光强度与主观亮度的关系曲线
长实现是代表视觉系统能够适应的光强范围
在0.001-0.1mL范围中由暗视觉逐步过渡到亮视觉
BaB_aBa交叉线为眼睛能够适应这一强度级别时人眼所能感知的主观亮度范围
低于==BbB_bBb交叉线==则被感知为不可辨别的黑色
马赫带现象&同时对比感知亮度并不是简单的强度的函数注:范围过于大或者过于小都被认为没有意义
针对于一个恒定的条带强度,靠经边界处我们实际感知到了带有毛边的亮度模式
同时对比
光和电磁波谱概念汇总
能量大小之分:无线电波(低能量光子)>微波>红外波>可见光>紫外线>X射线>伽马射线
强度和灰度级概念
灰度级:从黑到白的单色光的度量值范围通常称为灰度级(也通常用来表示单色光的强度)灰度图像:单色图像用于描述彩色光源的质量的三个基本量:发光强度、光通量、亮度
1. 要想在某一波段上对感兴趣的物体进行检测,那么需要开发一个传感器来检测对电磁波谱发射的能量;2. 值得注意的是,一个物体的电磁波波长必须小于物体的尺寸;
传感器获取图像
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ht9k0wEy-1666168115170)(/gh/cr7tywzrjw/images/img/10191027751.png)]
单个传感器获取图像 条带传感器获取图像
传感器阵列获取图像
一般用于数字摄像机和光敏设备
每个传感器的响应正比于投射到传感器表面的光能总量优点:通过将能量聚集到阵列表面,以得到完整的图像
图像形成模型
形成过程
利用函数来表示,函数范围是非负且有限的
f(x,y)∣入射分量:i(x,y)∣反射分量:r(x,y)f(x, y)|入射分量:i(x, y) |反射分量:r(x, y) f(x,y)∣入射分量:i(x,y)∣反射分量:r(x,y)
入射分量的范围在非负且有限的反射分量的范围在(0, 1)区间中体现 其中0代表的是全吸收,1代表的是全反射 图像取样和量化
图形重要概念
**取样:**对坐标值数字化量化:对幅值数字化称为量化
以f(x,y)f(x, y)f(x,y)一直到f(M−1,N−1)f(M-1, N-1)f(M−1,N−1)为代表的矩阵图像表示方法
矩阵中的每一个元素称为:图像单元、图像元素、像素
数字限制
灰度值:L=2k∣0<M<∞∣0<N<∞灰度值:L = 2^k | 0 < M < \infin | 0 < N < \infin 灰度值:L=2k∣0<M<∞∣0<N<∞
饱和度&灰度
动态范围由系统能够表示的最低和最高灰度级来确定对比度:一副图像中最高和最低灰度级间的灰度差 当一幅图像中像素可感知的数值有高的动态范围时,那么我们认为该图像具有高的对比度 存储图像需要的比特数b=M×N×kb=M \times N \times kb=M×N×kk比特图像定义:当一副图像具有2k2^k2k个灰度级时,该图像称为一副k比特图像等偏爱曲线 通过改变N和K生成了图像,观察者主动按图像的质量对图像排序,最终以Nk平面中的等偏爱曲线形式汇总细节增加时,等偏爱曲线会变得更加垂直表明当需要大量细节的图像时只需要较少的灰度级
图像内插
最近邻内插法
这种方法把原图像中最近邻的灰度赋给每个新位置直边缘的严重失真
双线性内插
令(x,y)为坐标,将灰度值设为v(x,y),则有v(x,y)=ax+by+d为双线性内插的实现公式令(x, y)为坐标,将灰度值设为v(x, y),则有v(x, y)=ax+by+d为双线性内插的实现公式令(x,y)为坐标,将灰度值设为v(x,y),则有v(x,y)=ax+by+d为双线性内插的实现公式
双三次内插
赋予点(x, y)灰度值是使用公式:
v(x,y)=∑i=03∑j=03aijxiyiv(x, y)=\sum_{i = 0}^3 \sum_{j = 0}^3 a_{ij}x^iy^i v(x,y)=i=0∑3j=0∑3aijxiyi
像素基本关系
相邻像素
4邻域
(x+1,y),(x−1,y),(x,y+1),(x,y−1)(x+1, y),(x-1,y),(x,y+1),(x,y-1) (x+1,y),(x−1,y),(x,y+1),(x,y−1)
8邻域(包含4邻域)
(x+1,y),(x−1,y),(x,y+1),(x,y−1),(x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1)(x+1, y),(x-1,y),(x,y+1),(x,y-1),(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1) (x+1,y),(x−1,y),(x,y+1),(x,y−1),(x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1)
邻接性、连通性、区域、边界
4邻接。如果qqq在集合N4(p)N_4(p)N4(p)中,则具有VVV中数值的两个像素p,qp,qp,q是4邻接的8邻接。如果qqq在集合N8(p)N_8(p)N8(p)中,则具有VVV中数值的两个像素p,qp,qp,q是8邻接的m邻接(混合邻接)。如果i.qi.qi.q在集合N4(p)N_4(p)N4(p)中,ii.qii.qii.q在集合ND(p)N_D(p)ND(p)中,且集合N4(p)∩N4(p)N_4(p) \cap N_4(p)N4(p)∩N4(p)中没有来自V中数值的像素,则称为m邻接
连通分量&连通集为使我们的定义有意义,必须指定邻接类型(4/8)
对于SSS中的任何像素ppp,SSS中连通到该像素的像素集称为S的连通分量如果SSS仅有一个连通分量,则集合S称为连通集
内边界 / 外边界
距离度量
欧式距离
Dc(p,q)=[(x−s)2+(y−t)2]1/2D_c(p,q) = [(x-s)^2+(y-t)^2]^{1/2} Dc(p,q)=[(x−s)2+(y−t)2]1/2
城市街区距离D4D_4D4
D4(p,q)=∣x−s∣+∣y−t∣D_4(p,q) = |x-s|+|y-t| D4(p,q)=∣x−s∣+∣y−t∣
棋盘距离D8D_8D8
D8(p,q)=max(∣x−s∣,∣y−t∣)D_8(p,q) = max(|x-s|, |y-t|) D8(p,q)=max(∣x−s∣,∣y−t∣)
矩阵基本操作
矩阵相乘 &阵列相乘
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uIY8oxGX-1666168115171)(/gh/cr7tywzrjw/images/img/10191027703.png)]
线性操作与非线性操作
算术操作
针对带噪声图像的的相加 / 平均相加是连续积分的离散形式
图像相减经常用于增强图像之间的差
使用图像相乘和相除来校正阴影
集合和逻辑操作
模糊集合:模糊集合理论使用隶属度函数来实现这种概念 该函数使得数值可以在1-0之间进行一个逐步过渡
空间操作
单像素操作
邻域操作
计算大小为m×nm \times nm×n,中心在(x,y)(x,y)(x,y)的矩形邻域中的像素的平均值
这个区域中像素的位置组成集合SxyS_{xy}Sxy
g(x,y)=1mn∑(r,c)∈Snf(r,c)g(x, y) = \frac{1}{mn} \sum_{(r,c) \in S_n} f(r, c) g(x,y)=mn1(r,c)∈Sn∑f(r,c)
几何变换和图像配准
仿射变换公式
[x,y,1]=[v,w,1]T=[v,w,1]{t11t120t21t220t31t321}[x, y, 1] = [v, w, 1]T = [v, w, 1] \left\{ \begin{matrix} t_{11} & t_{12} & 0 \\ t_{21} & t_{22} & 0 \\ t_{31} & t_{32} & 1 \end{matrix} \right\} [x,y,1]=[v,w,1]T=[v,w,1]⎩⎨⎧t11t21t31t12t22t32001⎭⎬⎫
前向映射以及反向映射
前向映射:在每个位置(v,w)(v, w)(v,w)直接计算输出图像中相应像素的空间位置(x,y)(x, y)(x,y)反向映射:扫描输出像素的位置,并在每一个位置(x,y)(x, y)(x,y)使用(v,w)=T−1(x,y)(v,w) = T^{-1}(x, y)(v,w)=T−1(x,y)计算输入图像的相应位置前向映射是指通过源图像计算得到目标图像的像素点,常用在图像的平移和镜像操作。后向映射是指在目标图像中反着对应源图像。
图像配准
图像变换
线性变换域
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mupNBaMa-1666168115171)(/gh/cr7tywzrjw/images/img/10191141060.png)]
概率方法
出现概率:$p(z_k) = \frac{n_k}{MN} $
平均灰度:
m=∑k=0L−1zkp(zk)m = \sum_{k=0}^{L-1}z_kp(z_k) m=k=0∑L−1zkp(zk)
方差的单位是灰度值的平方,在比较对比度值的时候,我们通常替代使用标准差,因为其维数直接取决于灰度值