가산 백색 가우스 잡음 (Additive white Gaussian noise, AWGN )은 정보 이론 에서 자연에서 발생하는 많은 무작위 과정의 효과를 모방하는 데 사용되는 기본 잡음 모델이다. 수정자는 특정 특성을 나타낸다.
가산 은 정보 시스템에 내재될 수 있는 모든 잡음에 더해지기 때문이다.
백색 은 정보 시스템의 주파수 대역 전체에 걸쳐 균일한 전력 스펙트럼 밀도 를 갖는다는 개념을 의미한다. 이는 흰색 빛 에 대한 비유로, 가시광선 스펙트럼의 모든 주파수에서 균일한 방출을 통해 구현될 수 있다.
가우스 는 시간 영역에서 평균 시간 영역 값이 0인 정규 분포 를 갖기 때문이다(가우시안 과정 ).
광대역 잡음은 도체 내 원자의 열 진동(열 잡음 또는 열잡음 이라고 함), 푸아송 잡음 , 지구 및 기타 따뜻한 물체에서 발생하는 흑체 방사 , 태양과 같은 천체 소스 등 많은 자연 잡음 소스에서 발생한다. 확률론 의 중심 극한 정리 는 많은 무작위 과정의 합이 가우스 또는 정규 분포를 갖는 경향이 있음을 나타낸다.
AWGN은 통신에 대한 유일한 장애가 일정한 스펙트럼 밀도 (대역폭 의 헤르츠 당 와트 로 표현됨)와 정규 분포 의 진폭을 갖는 광대역 또는 백색 잡음 의 선형 추가인 채널 모델 로 자주 사용된다. 이 모델은 페이딩 , 진동수 선택성, 간섭 , 비선형성 또는 분산 을 고려하지 않는다. 그러나 이러한 다른 현상들을 고려하기 전에 시스템의 기본 동작에 대한 통찰력을 얻는 데 유용한 간단하고 다루기 쉬운 수학적 모델을 생성한다.
AWGN 채널은 많은 인공위성 및 심우주 통신 링크에 대한 좋은 모델이다. 이는 다중 경로, 지형 차단, 간섭 등으로 인해 대부분의 지상 링크에 대한 좋은 모델은 아니다. 그러나 지상 경로 모델링의 경우, AWGN은 다중 경로, 지형 차단, 간섭, 지상 클러터 및 현대 무선 시스템이 지상 운용에서 겪는 자체 간섭 외에도 연구 중인 채널의 배경 잡음을 시뮬레이션하는 데 일반적으로 사용된다.
AWGN 채널은 이산 시간 이벤트 인덱스
i
{\displaystyle i}
에서 일련의 출력
Y
i
{\displaystyle Y_{i}}
로 표현된다.
Y
i
{\displaystyle Y_{i}}
는 입력
X
i
{\displaystyle X_{i}}
와 잡음
Z
i
{\displaystyle Z_{i}}
의 합이며, 여기서
Z
i
{\displaystyle Z_{i}}
는 독립적이고 동일하게 분포 하며 분산
N
{\displaystyle N}
(잡음)과 평균이 0인 정규 분포 에서 추출된다.
Z
i
{\displaystyle Z_{i}}
는
X
i
{\displaystyle X_{i}}
와 상관관계가 없는 것으로 추가로 가정된다.
Z
i
∼
N
(
0
,
N
)
{\displaystyle Z_{i}\sim {\mathcal {N}}(0,N)\,\!}
Y
i
=
X
i
+
Z
i
.
{\displaystyle Y_{i}=X_{i}+Z_{i}.\,\!}
잡음
N
{\displaystyle N}
이 0이 아니고
X
i
{\displaystyle X_{i}}
가 충분히 제한되지 않는 한 채널 용량은 무한하다. 입력에 대한 가장 일반적인 제약은 소위 "전력" 제약으로, 채널을 통해 전송되는 코드워드
(
x
1
,
x
2
,
…
,
x
k
)
{\displaystyle (x_{1},x_{2},\dots ,x_{k})}
에 대해 다음을 요구한다.
1
k
∑
i
=
1
k
x
i
2
≤
P
,
{\displaystyle {\frac {1}{k}}\sum _{i=1}^{k}x_{i}^{2}\leq P,}
여기서
P
{\displaystyle P}
는 최대 채널 전력을 나타낸다.
따라서 전력 제약이 있는 채널의 채널 용량 은 다음과 같다.
C
=
max
{
I
(
X
;
Y
)
:
f
s.t.
E
(
X
2
)
≤
P
}
{\displaystyle C=\max \left\{I(X;Y):f{\text{ s.t. }}E\left(X^{2}\right)\leq P\right\}\,\!}
여기서
f
{\displaystyle f}
는
X
{\displaystyle X}
의 분포이다.
I
(
X
;
Y
)
{\displaystyle I(X;Y)}
를 차분 엔트로피 로 표현하면:
I
(
X
;
Y
)
=
h
(
Y
)
−
h
(
Y
∣
X
)
=
h
(
Y
)
−
h
(
X
+
Z
∣
X
)
=
h
(
Y
)
−
h
(
Z
∣
X
)
{\displaystyle {\begin{aligned}&I(X;Y)=h(Y)-h(Y\mid X)\\[5pt]={}&h(Y)-h(X+Z\mid X)\\[5pt]={}&h(Y)-h(Z\mid X)\end{aligned}}\,\!}
그러나
X
{\displaystyle X}
와
Z
{\displaystyle Z}
는 독립적이므로:
I
(
X
;
Y
)
=
h
(
Y
)
−
h
(
Z
)
{\displaystyle I(X;Y)=h(Y)-h(Z)\,\!}
가우스 분포의 차분 엔트로피 를 평가하면:
h
(
Z
)
=
1
2
log
(
2
π
e
N
)
{\displaystyle h(Z)={\frac {1}{2}}\log(2\pi eN)\,\!}
X
{\displaystyle X}
와
Z
{\displaystyle Z}
가 독립적이고 그 합이
Y
{\displaystyle Y}
를 주므로:
E
(
Y
2
)
=
E
(
(
X
+
Z
)
2
)
=
E
(
X
2
)
+
2
E
(
X
)
E
(
Z
)
+
E
(
Z
2
)
≤
P
+
N
{\displaystyle E(Y^{2})=E((X+Z)^{2})=E(X^{2})+2E(X)E(Z)+E(Z^{2})\leq P+N\,\!}
이 경계에서 우리는 차분 엔트로피의 속성으로부터 다음을 추론한다.
h
(
Y
)
≤
1
2
log
(
2
π
e
(
P
+
N
)
)
{\displaystyle h(Y)\leq {\frac {1}{2}}\log(2\pi e(P+N))\,\!}
따라서 채널 용량은 상호정보 에 대해 달성 가능한 가장 높은 경계로 주어진다.
I
(
X
;
Y
)
≤
1
2
log
(
2
π
e
(
P
+
N
)
)
−
1
2
log
(
2
π
e
N
)
{\displaystyle I(X;Y)\leq {\frac {1}{2}}\log(2\pi e(P+N))-{\frac {1}{2}}\log(2\pi eN)\,\!}
여기서
I
(
X
;
Y
)
{\displaystyle I(X;Y)}
는 다음일 때 최대화된다.
X
∼
N
(
0
,
P
)
{\displaystyle X\sim {\mathcal {N}}(0,P)\,\!}
따라서 AWGN 채널에 대한 채널 용량
C
{\displaystyle C}
는 다음과 같다.
C
=
1
2
log
(
1
+
P
N
)
{\displaystyle C={\frac {1}{2}}\log \left(1+{\frac {P}{N}}\right)\,\!}
메시지를
1
{\displaystyle 1}
에서
M
{\displaystyle M}
까지의 인덱스로 채널을 통해 전송한다고 가정하면,
M
{\displaystyle M}
은 구별 가능한 가능한 메시지의 수이다.
M
{\displaystyle M}
개의 메시지를
n
{\displaystyle n}
비트로 인코딩하면, 속도
R
{\displaystyle R}
을 다음과 같이 정의한다.
R
=
log
M
n
{\displaystyle R={\frac {\log M}{n}}\,\!}
오류의 최대 확률이
n
{\displaystyle n}
이 무한대로 접근할 때 0으로 수렴하는 코드 시퀀스가 있다면 그 속도는 달성 가능하다고 한다. 용량
C
{\displaystyle C}
는 가장 높은 달성 가능 속도이다.
잡음 레벨
N
{\displaystyle N}
을 가진 AWGN 채널을 통해 전송되는 길이
n
{\displaystyle n}
의 코드워드를 고려해 보자. 수신될 때, 코드워드 벡터 분산은 이제
N
{\displaystyle N}
이 되고, 그 평균은 전송된 코드워드이다. 이 벡터는 전송된 코드워드 주위에 반경
n
(
N
+
ε
)
{\textstyle {\sqrt {n(N+\varepsilon )}}}
의 구에 포함될 가능성이 매우 높다. 이 구의 중심에 있는 코드워드로 수신된 모든 메시지를 매핑하여 디코딩하면, 수신된 벡터가 이 구 밖에 있을 때만 오류가 발생하며, 이는 매우 드문 일이다.
각 코드워드 벡터에는 그에 따라 디코딩되는 수신 코드워드 벡터의 구가 연결되어 있으며, 이러한 각 구는 코드워드에 고유하게 매핑되어야 한다. 따라서 이 구들은 교차하지 않아야 하므로, 구체 패킹 문제에 직면한다.
n
{\displaystyle n}
비트 코드워드 벡터에 얼마나 많은 구별 가능한 코드워드를 패킹할 수 있을까? 수신된 벡터는 최대 에너지
n
(
P
+
N
)
{\displaystyle n(P+N)}
를 가지므로 반경
n
(
P
+
N
)
{\textstyle {\sqrt {n(P+N)}}}
의 구를 차지해야 한다. 각 코드워드 구의 반경은
n
N
{\displaystyle {\sqrt {nN}}}
이다. n차원 구의 부피는
r
n
{\displaystyle r^{n}}
에 정비례하므로, 전송 전력 P를 가진 구에 패킹될 수 있는 고유하게 디코딩 가능한 구의 최대 개수는 다음과 같다.
(
n
(
P
+
N
)
)
n
/
2
(
n
N
)
n
/
2
=
2
(
n
/
2
)
log
(
1
+
P
/
N
)
{\displaystyle {\frac {(n(P+N))^{n/2}}{(nN)^{n/2}}}=2^{(n/2)\log \left(1+P/N\right)}\,\!}
이러한 논증에 따르면, 속도 R은
1
2
log
(
1
+
P
N
)
{\displaystyle {\frac {1}{2}}\log \left(1+{\frac {P}{N}}\right)}
보다 클 수 없다.
이 섹션에서는 지난 섹션에서 다룬 속도 상한의 달성 가능성을 보여준다.
인코더와 디코더 모두에게 알려진 코드북은 길이 n, i.i.d. 가우스 분포를 따르며 분산
P
−
ε
{\displaystyle P-\varepsilon }
및 평균 0을 갖는 코드워드를 선택하여 생성된다. 큰 n에 대해 코드북의 경험적 분산은 분포의 분산과 매우 가깝게 되어 전력 제약 위반을 확률적으로 피한다.
수신된 메시지는 고유하게 공동으로 전형적인 코드북의 메시지로 디코딩된다. 그러한 메시지가 없거나 전력 제약이 위반되면 디코딩 오류가 선언된다.
메시지
i
{\displaystyle i}
에 대한 코드워드를
X
n
(
i
)
{\displaystyle X^{n}(i)}
라고 하고,
Y
n
{\displaystyle Y^{n}}
은 이전과 같이 수신된 벡터라고 하자. 다음 세 가지 사건을 정의한다.
사건
U
{\displaystyle U}
: 수신된 메시지의 전력이
P
{\displaystyle P}
보다 크다.
사건
V
{\displaystyle V}
: 전송된 코드워드와 수신된 코드워드가 공동으로 전형적이지 않다.
사건
E
j
{\displaystyle E_{j}}
:
i
≠
j
{\displaystyle i\neq j}
인 전형 집합
A
ε
(
n
)
{\displaystyle A_{\varepsilon }^{(n)}}
에
(
X
n
(
j
)
,
Y
n
)
{\displaystyle (X^{n}(j),Y^{n})}
이 속한다. 즉, 잘못된 코드워드가 수신된 벡터와 공동으로 전형적이다.
따라서
U
{\displaystyle U}
,
V
{\displaystyle V}
또는
E
i
{\displaystyle E_{i}}
중 하나라도 발생하면 오류가 발생한다. 큰 수의 법칙에 따라 n이 무한대로 접근함에 따라
P
(
U
)
{\displaystyle P(U)}
는 0으로 수렴하며, 공동 점근적 등분포 특성 에 따라
P
(
V
)
{\displaystyle P(V)}
에도 동일하게 적용된다. 따라서 충분히 큰
n
{\displaystyle n}
에 대해
P
(
U
)
{\displaystyle P(U)}
와
P
(
V
)
{\displaystyle P(V)}
는 각각
ε
{\displaystyle \varepsilon }
보다 작다.
i
≠
j
{\displaystyle i\neq j}
에 대해
X
n
(
i
)
{\displaystyle X^{n}(i)}
와
X
n
(
j
)
{\displaystyle X^{n}(j)}
는 독립적이므로,
X
n
(
i
)
{\displaystyle X^{n}(i)}
와
Y
n
{\displaystyle Y^{n}}
도 독립적이다. 따라서 공동 AEP에 의해
P
(
E
j
)
=
2
−
n
(
I
(
X
;
Y
)
−
3
ε
)
{\displaystyle P(E_{j})=2^{-n(I(X;Y)-3\varepsilon )}}
이다. 이를 통해 오류 확률
P
e
(
n
)
{\displaystyle P_{e}^{(n)}}
를 다음과 같이 계산할 수 있다.
P
e
(
n
)
≤
P
(
U
)
+
P
(
V
)
+
∑
j
≠
i
P
(
E
j
)
≤
ε
+
ε
+
∑
j
≠
i
2
−
n
(
I
(
X
;
Y
)
−
3
ε
)
≤
2
ε
+
(
2
n
R
−
1
)
2
−
n
(
I
(
X
;
Y
)
−
3
ε
)
≤
2
ε
+
(
2
3
n
ε
)
2
−
n
(
I
(
X
;
Y
)
−
R
)
≤
3
ε
{\displaystyle {\begin{aligned}P_{e}^{(n)}&\leq P(U)+P(V)+\sum _{j\neq i}P(E_{j})\\&\leq \varepsilon +\varepsilon +\sum _{j\neq i}2^{-n(I(X;Y)-3\varepsilon )}\\&\leq 2\varepsilon +(2^{nR}-1)2^{-n(I(X;Y)-3\varepsilon )}\\&\leq 2\varepsilon +(2^{3n\varepsilon })2^{-n(I(X;Y)-R)}\\&\leq 3\varepsilon \end{aligned}}}
따라서 n이 무한대로 접근함에 따라
P
e
(
n
)
{\displaystyle P_{e}^{(n)}}
는 0으로 수렴하고
R
<
I
(
X
;
Y
)
−
3
ε
{\displaystyle R<I(X;Y)-3\varepsilon }
이다. 그러므로 이전에 유도된 용량에 임의로 가까운 속도 R을 가진 코드가 존재한다.
여기서는 용량
C
=
1
2
log
(
1
+
P
N
)
{\displaystyle C={\frac {1}{2}}\log \left(1+{\frac {P}{N}}\right)}
를 초과하는 속도는 달성 불가능함을 보여준다.
코드북에 대해 전력 제약이 충족되고, 메시지가 균일 분포를 따른다고 가정하자.
W
{\displaystyle W}
를 입력 메시지라고 하고
W
^
{\displaystyle {\hat {W}}}
를 출력 메시지라고 하자. 따라서 정보는 다음과 같이 흐른다.
W
⟶
X
(
n
)
(
W
)
⟶
Y
(
n
)
⟶
W
^
{\displaystyle W\longrightarrow X^{(n)}(W)\longrightarrow Y^{(n)}\longrightarrow {\hat {W}}}
파노의 부등식 을 사용하면 다음을 얻는다.
H
(
W
∣
W
^
)
≤
1
+
n
R
P
e
(
n
)
=
n
ε
n
{\displaystyle H(W\mid {\hat {W}})\leq 1+nRP_{e}^{(n)}=n\varepsilon _{n}}
(여기서
P
e
(
n
)
→
0
{\displaystyle P_{e}^{(n)}\rightarrow 0}
일 때
ε
n
→
0
{\displaystyle \varepsilon _{n}\rightarrow 0}
)
X
i
{\displaystyle X_{i}}
를 코드워드 인덱스 i의 인코딩된 메시지라고 하자. 그러면 다음과 같다.
n
R
=
H
(
W
)
=
I
(
W
;
W
^
)
+
H
(
W
∣
W
^
)
≤
I
(
W
;
W
^
)
+
n
ε
n
≤
I
(
X
(
n
)
;
Y
(
n
)
)
+
n
ε
n
=
h
(
Y
(
n
)
)
−
h
(
Y
(
n
)
∣
X
(
n
)
)
+
n
ε
n
=
h
(
Y
(
n
)
)
−
h
(
Z
(
n
)
)
+
n
ε
n
≤
∑
i
=
1
n
h
(
Y
i
)
−
h
(
Z
(
n
)
)
+
n
ε
n
≤
∑
i
=
1
n
I
(
X
i
;
Y
i
)
+
n
ε
n
{\displaystyle {\begin{aligned}nR&=H(W)\\&=I(W;{\hat {W}})+H(W\mid {\hat {W}})\\&\leq I(W;{\hat {W}})+n\varepsilon _{n}\\&\leq I(X^{(n)};Y^{(n)})+n\varepsilon _{n}\\&=h(Y^{(n)})-h(Y^{(n)}\mid X^{(n)})+n\varepsilon _{n}\\&=h(Y^{(n)})-h(Z^{(n)})+n\varepsilon _{n}\\&\leq \sum _{i=1}^{n}h(Y_{i})-h(Z^{(n)})+n\varepsilon _{n}\\&\leq \sum _{i=1}^{n}I(X_{i};Y_{i})+n\varepsilon _{n}\end{aligned}}}
P
i
{\displaystyle P_{i}}
를 인덱스 i의 코드워드의 평균 전력이라고 하자.
P
i
=
1
2
n
R
∑
w
x
i
2
(
w
)
{\displaystyle P_{i}={\frac {1}{2^{nR}}}\sum _{w}x_{i}^{2}(w)\,\!}
여기서 합은 모든 입력 메시지
w
{\displaystyle w}
에 대한 것이다.
X
i
{\displaystyle X_{i}}
와
Z
i
{\displaystyle Z_{i}}
는 독립적이므로, 잡음 레벨
N
{\displaystyle N}
에 대한
Y
i
{\displaystyle Y_{i}}
의 전력의 기댓값은 다음과 같다.
E
(
Y
i
2
)
=
P
i
+
N
{\displaystyle E(Y_{i}^{2})=P_{i}+N\,\!}
그리고,
Y
i
{\displaystyle Y_{i}}
가 정규 분포를 따른다면 다음을 얻는다.
h
(
Y
i
)
≤
1
2
log
2
π
e
(
P
i
+
N
)
{\displaystyle h(Y_{i})\leq {\frac {1}{2}}\log {2\pi e}(P_{i}+N)\,\!}
그러므로,
n
R
≤
∑
(
h
(
Y
i
)
−
h
(
Z
i
)
)
+
n
ε
n
≤
∑
(
1
2
log
(
2
π
e
(
P
i
+
N
)
)
−
1
2
log
(
2
π
e
N
)
)
+
n
ε
n
=
∑
1
2
log
(
1
+
P
i
N
)
+
n
ε
n
{\displaystyle {\begin{aligned}nR&\leq \sum (h(Y_{i})-h(Z_{i}))+n\varepsilon _{n}\\&\leq \sum \left({\frac {1}{2}}\log(2\pi e(P_{i}+N))-{\frac {1}{2}}\log(2\pi eN)\right)+n\varepsilon _{n}\\&=\sum {\frac {1}{2}}\log \left(1+{\frac {P_{i}}{N}}\right)+n\varepsilon _{n}\end{aligned}}}
x에 대한 오목(아래로 볼록) 함수인
log
(
1
+
x
)
{\displaystyle \log(1+x)}
에 옌센 부등식을 적용할 수 있다.
1
n
∑
i
=
1
n
1
2
log
(
1
+
P
i
N
)
≤
1
2
log
(
1
+
1
n
∑
i
=
1
n
P
i
N
)
{\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}{\frac {1}{2}}\log \left(1+{\frac {P_{i}}{N}}\right)\leq {\frac {1}{2}}\log \left(1+{\frac {1}{n}}\sum _{i=1}^{n}{\frac {P_{i}}{N}}\right)\,\!}
각 코드워드는 개별적으로 전력 제약을 만족하므로, 평균 또한 전력 제약을 만족한다. 그러므로,
1
n
∑
i
=
1
n
P
i
N
,
{\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}{\frac {P_{i}}{N}},\,\!}
이것을 위 부등식을 단순화하는 데 적용하면 다음과 같다.
1
2
log
(
1
+
1
n
∑
i
=
1
n
P
i
N
)
≤
1
2
log
(
1
+
P
N
)
.
{\displaystyle {\frac {1}{2}}\log \left(1+{\frac {1}{n}}\sum _{i=1}^{n}{\frac {P_{i}}{N}}\right)\leq {\frac {1}{2}}\log \left(1+{\frac {P}{N}}\right).\,\!}
따라서
R
≤
1
2
log
(
1
+
P
N
)
+
ε
n
{\displaystyle R\leq {\frac {1}{2}}\log \left(1+{\frac {P}{N}}\right)+\varepsilon _{n}}
이어야 한다. 따라서
ε
n
→
0
{\displaystyle \varepsilon _{n}\rightarrow 0}
일 때 R은 이전에 유도된 용량에 임의로 가까운 값보다 작아야 한다.
잡음이 있는 코사인 파의 영점 교차
직렬 데이터 통신에서 AWGN 수학 모델은 무작위 지터 (RJ)로 인한 타이밍 오차를 모델링하는 데 사용된다.
오른쪽 그래프는 AWGN과 관련된 타이밍 오차의 예시를 보여준다. 변수 Δt는 영점 교차에서의 불확실성을 나타낸다. AWGN의 진폭이 증가하면 신호 대 잡음비 가 감소한다. 이는 Δt의 불확실성을 증가시킨다.[ 1]
AWGN의 영향을 받을 때, 입력이 사인파일 때 협대역 통과 필터 출력에서 초당 양수 또는 음수 영점 교차의 평균 수는 다음과 같다.
positive zero crossings
second
=
negative zero crossings
second
=
f
0
SNR
+
1
+
B
2
12
f
0
2
SNR
+
1
,
{\displaystyle {\begin{aligned}&{\frac {\text{positive zero crossings}}{\text{second}}}={\frac {\text{negative zero crossings}}{\text{second}}}\\[8pt]={}&f_{0}{\sqrt {\frac {{\text{SNR}}+1+{\frac {B^{2}}{12f_{0}^{2}}}}{{\text{SNR}}+1}}},\end{aligned}}}
여기서
ƒ0 = 필터의 중심 주파수,
B = 필터 대역폭,
SNR = 선형 항으로 표시된 신호 대 잡음 전력비.
페이저 영역의 AWGN 기여
현대 통신 시스템에서 대역 제한 AWGN은 무시할 수 없다. 페이저 (전자) 영역에서 대역 제한 AWGN을 모델링할 때 통계 분석에 따르면 실제 및 허수 기여의 진폭은 정규 분포 모델을 따르는 독립 변수임이 밝혀졌다. 결합될 때, 결과 페이저의 크기는 레일리 분포 를 따르는 무작위 변수이며, 위상은 0에서 2π까지 균일하게 분포한다.
오른쪽 그래프는 대역 제한 AWGN이 코히어런트 반송파 신호에 어떻게 영향을 미칠 수 있는지에 대한 예시를 보여준다. 잡음 벡터의 순간 응답은 정확하게 예측할 수 없지만, 시간 평균 응답은 통계적으로 예측할 수 있다. 그래프에 표시된 바와 같이, 우리는 잡음 페이저가 1σ 원 안에 약 38%의 시간 동안, 2σ 원 안에 약 86%의 시간 동안, 그리고 3σ 원 안에 약 98%의 시간 동안 존재할 것이라고 확신 있게 예측한다.[ 1]
↑ 가 나 McClaning, Kevin, 《Radio Receiver Design》, Noble Publishing Corporation