第3章脉冲噪声信道码字构造 作为一类性能优越的纠错编码,LDPC码在高斯噪声条件下已经被广泛研究,且最好的LDPC码距离香农极限只差0.0045dB。然而,在加性白噪声对称α稳定噪声(Additive White Symmetric α Stable Noise,AWSαSN)信道中LDPC码的编译码研究相对较少,特别是缺少关于AWSαSN信道的码字优化的研究。众所周知,通过密度进化(Density Evolution,DE)、外信息转移(EXtrinsic Information Transfer,EXIT)图等方法,我们可以对LDPC码的渐进性能进行分析。其中,EXIT图不仅可以直观观察LDPC码的渐进性能,而且能够通过调节变量节点和校验节点的度分布,观察变量节点和校验节点的EXIT图是否相交,并对其度分布进行优化。EXIT图分析是一种基于互信息量的迭代方法,而互信息量的求解需要用到迭代过程中传递信息的概率密度函数。对称α稳定分布的概率密度函数没有数学闭式表达式,因此如何得到迭代过程中软信息的概率密度函数,如何利用EXIT图对SαS噪声分布条件下的LDPC码度分布进行优化设计,是本章所要研究的问题。 3.1引言 由第1章的介绍可知,实际生活中的大量通信场景存在脉冲噪声,相比于高斯噪声,脉冲噪声具有短时、大幅值、分布重尾的特点。α稳定分布可以有效地描述脉冲噪声的统计特性,其中SαS分布是一种特殊的稳定分布,在各类非高斯通信系统中得到了广泛研究。 虽然LDPC码在高斯信道下的研究非常成熟,但是,在AWSαSN信道下的研究却不是很多,尤其是针对SαS分布噪声特性的LDPC码码字优化研究。在高斯噪声信道中,一般采用DE或EXIT图优化方法分析LDPC码的渐进性能。相比DE方法,EXIT图分析不仅非常直观,还能够用来优化LDPC码的度分布设计。由于SαS分布大多数情况下没有概率密度函数的数学闭式表达式,很难给出AWSαSN信道下的EXIT图的理论分析。 本章介绍了一种AWSαSN信道下基于EXIT图分析的LDPC码度分布优化设计方法。首先对EXIT图进行研究,EXIT图可以通过计算输入符号和节点更新过程中传递信息的互信息量,知道节点更新过程中传递信息的概率密度函数。在AWSαSN信道下,很难理论求解其概率密度函数,因此考虑利用离散密度进化得到节点更新过程中传递信息的概率质量函数,并将互信息量求解公式中的积分运算改为求和运算。基于EXIT图分析,采用不断搜索的方法得到AWSαSN信道的LDPC码最优度分布。 3.2信道模型介绍 3.2.1α稳定分布模型 α稳定分布是基于广义中心极限定理,可以对包括电力线通信、水声通信、极低频/甚低频通信等场景存在的脉冲噪声进行有效的描述。α稳定分布非常灵活,被用来描述具有尖峰脉冲波形和重尾分布的脉冲噪声,可以看成高斯分布的一般化,包含了脉冲特性。α稳定分布(S(α,β,δ,γ))可以通过特征函数来表征: (t)=exp{jδt-|γt|α(1-jβsign(t)ω(t,α))}(3.2.1) 其中ω(t,α)可以定义为 ω(t,α)=tan(πα/2),α≠1 -2/πlog|t|,α=1(3.2.2) 通信系统中的α稳定分布模型,相较于其他模型,更具有灵活性,常被用来描述具有尖峰脉冲波形和重尾分布的非高斯噪声。α稳定分布模型S(α,β,δ,γ)的4个参数α、β、δ、γ,决定了服从该分布的变量x的概率密度函数fα(β; δ; γ; x),其中: (1) α是脉冲指数参数(0<α≤2),该参数控制了α稳定分布的概率密度函数的拖尾的厚度,也表示了噪声信道的脉冲强度,α越小,说明噪声信道脉冲强度越大,当α接近于2时,噪声信道越接近高斯噪声信道。 (2) β表示α稳定分布的概率密度函数的歪斜程度,当β=0时,α稳定分布是一个对称分布,且关于δ参数对称。 (3) δ是位置参数,表示α稳定分布的概率密度函数的中间值或者均值,当α>1时,表示概率密度函数的均值,反之,则表示为概率密度函数的中间值。 (4) γ是尺度参数,用来衡量样本偏离中心值的程度。 类似于高斯分布,当δ=0,γ=1时,α稳定分布是一个标准的稳定分布。因此,一个随机变量X满足X~S(α,β,δ,γ),则(X-δ)/γ1/α是标准稳定分布。通过计算特征函数(式(3.2.1))的傅里叶反变换,可以得到稳定分布的概率密度函数。不同于高斯分布的概率密度函数具有指数拖尾,稳定分布的概率密度函数是代数拖尾,因此稳定分布的拖尾更厚。 为了进一步描述α稳定分布中的4个参数对其概率密度函数的影响,图3.2.1 图3.2.1不同参数分别发生变化时α稳定分布的概率密度函数 图3.2.1(续) 中绘制了不同参数分别发生变化时的概率密度函数。在图3.2.1(a)中,改变参数α,固定参数β=0.5,δ=0,γ=0.5,可以看出α参数越小,其拖尾程度越厚。在图3.2.1(b)中,改变参数β,固定参数α=1.5,δ=0,γ=0.5,可以看出只有当β=0时,概率密度函数曲线是关于纵轴对称的。在图3.2.1(c)中,改变参数δ,固定参数α=1.5,β=0.5,γ=0.5,可以看出δ参数值的改变只导致概率密度函数的横移。在图3.2.1(d)中,改变参数γ,固定参数α=1.5,β=0.5,δ=0,可以看出γ参数越大,越有可能偏离中心值。 α稳定分布服从以下一些性质: 性质1当一个随机变量X的分布服从稳定性,则具有如下的充分必要条件: a1X1+a2X2aX+b(3.2.3) 其中,a1,a2,a和b是常数。X1和X2与X具有相同脉冲指数的稳定分布。AB表示随机变量A和随机变量B服从同样的分布。当b=0时,随机变量X则是严格稳定分布。显而易见,当n个独立变量X1,X2,…,Xn服从相同脉冲指数的稳定分布,则所有变量的加权和∑ni=1aiXi同样满足相同脉冲指数的稳定分布。 性质2广义中心极限定理指出,大量服从α稳定分布的随机变量的和趋于一个稳定的分布。 性质3假设一个随机变量X满足稳定分布S(α,0,0,γ),c为常数,则cX~S(α,0,0,|c|γ)。 3.2.2对称α稳定分布模型 本节主要研究SαS分布噪声系统下的LDPC码,在信道传输过程中采用二进制相移键控(BPSK)调制模式。经过BPSK调制后的输入符号表示为Z∈{+1,-1},将已调符号发送到无记忆AWSαSN系统中,信道输出符号表示为Y=Z+N,式中N是服从对称α稳定分布的噪声随机变量。 在3.2.1节中,我们通过图3.2.1形象地描述了不同参数分别发生变化时,对于α稳定分布的概率密度函数产生的影响,在图3.2.1(b)中可以看出只有当β=0时,概率密度函数曲线是关于纵轴对称的,此时我们便得到了具有对称性质的对称α稳定(Symmetric α Stable,SαS)分布。 我们将式(3.2.1)中的β设置为0,可以推导出SαS分布的特征函数,表示为 (t)=exp(jδt-|γt|α)(3.2.4) SαS分布的概率密度函数可以通过将特征函数的傅里叶反变换求得,因此可以将SαS分布的概率密度函数fα(δ; γ; x)表示为 fα(δ; γ; x)=12π∫∞-∞exp(jδt-|γt|α)e-jtxdt(3.2.5) 通常情况下(不包括α=2和α=1的情况),SαS分布的概率密度函数没有闭式表达式。当α=2时,对称α稳定分布就是高斯分布,其概率密度函数表示为 f2(δ; γ; x)=12πγexp-(x-δ)24γ2(3.2.6) 需要注意的是,当α=2时,方差是有限的,且高斯分布的方差σ2是表示散度程度的尺度参数γ的平方的2倍: σ2=2γ2。 当α=1时,SαS分布就是柯西分布,其概率密度函数可以表示为 f1(δ; γ; x)=1πγγ2+(x-δ)2(3.2.7) 为了方便描述可以将fα(δ; γ; x)表示为fα(γ; x-δ)。 因此,对称α稳定分布是一种特殊的稳定分布,该分布主要有两个参数,其中α是脉冲指数参数,表示概率密度分布的拖尾特性,取值范围为(0,2]。γ是尺度参数,取值范围为(0,+∞),用来衡量样本偏离中心值的程度。由上可知,对称α稳定分布包含了高斯分布(α=2)和柯西分布(α=1),且只在这两种情况下才有概率密度函数的闭式表达式,而除了这两种情况,对称α稳定分布的特征函数通常表示为 (t)=e-|γt|α(3.2.8) 通过求解式(3.2.8)的傅里叶反变换,可以得到对称α稳定分布的概率密度函数,计算表达式为 fα(γ; x)=12π∫+∞-∞exp(-|γt|α)e-jtxdt(3.2.9) 其中,α代表SαS分布的特征指数(characteristic exponent),其大小决定了分布函数拖尾的厚度,即脉冲的强度,取值范围是α∈0,2。当α=2以及α=1时,SαS分布分别退化为高斯分布和柯西分布,在实际通信场景下描述脉冲噪声的SαS分布中α取值通常大于等于1。当α<2时SαS分布概率密度函数的拖尾部分渐进等同于帕累托分布(Pareto distribution),即服从幂律关系。γ表示SαS分布的尺度参数(scale parameter),取值范围是γ∈0,+∞,γ值的大小用来衡量满足分布的样本偏离其中心值的程度。 服从对称α稳定分布的脉冲噪声产生过程的伪代码如下: 算法3.2.1: 对称α稳定分布的脉冲噪声生成过程 1: 输入α和γ值 2: 随机产生两个服从均匀分布U[0,1]的随机变量u1和u2 3: θ=π(u1-0.5) 4: W1=-log(u2) 5: if α=1 6: noise=γtanθ 7: else 8: noise=γsinαθcosθ1α(cos(α-1)θ/W1)1-αα 9: end 综上所述,SαS分布服从以下一些性质: 性质1当一个随机变量X的分布为稳定性分布,则具有式(3.2.3)所示的充分必要条件。 性质2广义中心极限定理指出,大量服从SαS分布的随机变量和趋于一个稳定的分布。 性质3对于一个满足SαS分布的随机变量,变量值无穷大时的概率如下: limx→∞P(v>x)=γαCαxα(3.2.10) 其中Cα=1πΓ(α)sinπα2。 性质4假设随机变量X满足S(α,0,0,γ),并且c是一个常量,则cX~S(α,0,0,|c|γ)。 3.2.3分数低阶统计量 在高斯分布中,一般采用二阶统计理论作为信号处理的理论基础。其中噪声功率被定义为二阶统计量,用于信号强度的测量。对称α稳定分布的二阶统计量是无限的,传统定义噪声功率的方法并不适用,因此,基于最小离差准则的分数低阶统计量(fractional lower order statistics)被提出来处理服从对称α稳定分布的随机信号。基于分数低阶统计量,稳定分布在很多通信系统中获得了优于高斯信号处理的性能。 在对称α稳定分布中,存在所有低于α的分数矩,但不存在高于α的整数阶矩。因此,当0<α<2时,对称α稳定分布的随机变量的二阶矩不存在,但是所有低于α的分数矩是存在的,定义为 E{|X|p}<∞,若0≤p<α(3.2.11) 式(3.2.11)中,X是满足对称α稳定分布的随机变量。E{·}表示随机变量的数学期望。该分数低阶矩可以通过脉冲指数参数α和尺度参数γ表示为 E{|X|p}=D(p,α)γp,若0≤p<α(3.2.12) 其中,D(p,α)可以表示为 D(p,α)=2p+1Γp+12Γ-pααπΓ-p2(3.2.13) 其中,Γ(·)是伽马函数。 在服从对称α稳定分布的噪声系统中,可以用零阶统计量(zero order statistics)理论来处理对称α稳定分布,由于E{log|X|}<∞,采用对数阶矩E{log|X|}来定义噪声的强度。因此X的几何功率可以定义为 S0(X)=eE{log|X|}(3.2.14) 经过推导,几何功率的闭式表达式可以表示为 S0(X)=(Cg)1/αγCg(3.2.15) 其中,Cg≈1.78是欧拉常数的指数。 对于任意一个常数c,都有S0(cX)=|c|S0(X),且服从尺度参数为1的对称α稳定分布的随机变量的对数阶矩可以表示为 E{log|X|}=1α-1Ce(3.2.16) 其中Ce≈0.5772是欧拉常数。因此式(3.2.15)可以表示为 S0(X)|γ=1=eE{log|X|}=(eCe)1α-1=C1/αgCg(3.2.17) 其中Cg=eCe≈1.78。如果尺度参数不为1,由α稳定分布性质3可知,若X′~S(α,0,0,1),则γX′~S(α,0,0,γ),因此几何功率的闭式表达式可以表示为 S0(X)|γ≠1=S0(γX′)=γS0(X′)|γ=1=(Cg)1/αγCg(3.2.18) 在对称α稳定分布噪声通信系统中,由于不存在二阶矩,传统高斯噪声信道中用来度量通信质量的信噪比在对称α稳定分布噪声系统无法计算,因此引入几何功率的概念来描述几何信噪比(Geometric SignaltoNoise Ratio,GSNR),定义为 GSNR=12CgAS02(3.2.19) 其中,A是信号幅度,12Cg是一个归一化的常量,用来保证当噪声服从高斯分布(α=2)时GSNR也能适用。在数字通信系统中,涉及编码调制技术领域时,往往要考虑信息传输速率,在评估通信系统的误码率(Symbol Error Rat,SER)或者误帧率(Frame Error Rat,FER)时,更多基于相同的归一化信噪比Eb/N0,表示为每比特的信号能量与噪声谱密度的比值。对于一个编码系统(信息传输速率R),考虑BPSK调制,其Eb/N0可以定义为 EbN0=GSNR2R=14RCgAS02(3.2.20) 对于M进制调制系统来说,Eb/N0可以进一步表示为 EbN0=14log2(M)RCgAS02(3.2.21) 3.3基于EXIT图分析的LDPC码度分布优化方法 3.3.1LDPC码的基本原理 我们通过第2章可知,LDPC码是通过求解一个m×n的校验矩阵H的零空间得到,其中校验矩阵拥有非常低密度的“1”。LDPC码通过加入冗余的校验信息来实现纠错功能,其中n是码字的长度,包含了k=n-m个信息比特以及m个校验比特。在校验矩阵中,每行中具有“1”的数目称为行重,每列中具有“1”的数目称为列重。在LDPC码中,根据行重或者列重是否一致,可以分为规则码或者非规则码。假设一个规则LDPC码的行重为r,列重为g,则行重、列重跟码长和信息位长度存在如下的关系: rg=nm(3.3.1) 如果一个LDPC码的行重、列重不是唯一的值,则该LDPC码是非规则的。通常情况下,非规则LDPC码能够获得比规则LDPC码更好的性能。因此,很多研究集中在非规则LDPC码的码字构造上。而所有的LDPC 码码字构造都需要满足行列约束条件: 没有两行(以及两列)在同一个位置上的元素都是非零元素,即不能存在四短环。LDPC码的构造一般是校验矩阵的设计,需要注意的是校验矩阵不一定是满秩的。在非满秩情况下,一个规则LDPC码的码率可以表示为 R≥1-mn=1-gr(3.3.2) 图3.3.1(10,5)LDPC码二分图 只有当校验矩阵满秩时,上述等号才成立。类似于卷积码中的网格表示,LDPC码可以用校验矩阵或者二分图的方式进行表示,其中LDPC码二分图如图3.3.1所示,相应的校验矩阵可以表示为 H=1111000000 1000111000 0100100110 0010010101 0001001011(3.3.3) LDPC码的二分图一般包括两种节点以及节点之间的连线。其中变量节点跟校验节点相连表示校验矩阵相应的位置值为“1”,否则,相应位置值为“0”。而与节点相连的边的个数称为节点的度,对应于校验矩阵中的行重或者列重。根据这个规则可以发现,在规则LDPC码中,每个变量节点总会跟g个校验节点存在连线,同理,每个校验节点都会跟r个变量节点存在连线。 3.3.2LDPC码节点的度分布 在非规则LDPC码中,由于行重或者列重的不同,其节点的度(节点连接的边数)可以有不同的变换,进而产生不同的效果。一个LDPC码的度分布对可以用(λ,ρ)表示,其中λ(X)表示变量节点的度分布,定义为多项式 λ(X)=∑dvi=2λiXi-1(3.3.4) 其中,dv是变量节点的最大列重,λi是度为i的变量节点连接的边的数目在总边数中的比重。而校验节点度分布表示为ρ(X),定义为多项式 ρ(X)=∑dcj=2ρjXj-1(3.3.5) 其中,dc是校验节点的最大行重,而ρj是度为j的校验节点连接的边的数目在总边数中的比重。在规则LDPC码中,不管是变量节点,还是校验节点都只有一个度,比如图3.3.1中规则LDPC码的度分布可以表示为(X1,X3)。而在非规则码中,其度分布是不均匀的,相比于规则码,非规则码有更好的误码性能。 一个二分图的总边数可以表示为