촘스키 위계
위키백과, 우리 모두의 백과사전.
촘스키 위계(Chomsky hierarchy)는 형식 언어를 생성하는 형식 문법의 부류들 사이의 위계를 말한다. 노엄 촘스키가 1956년에 제시하였다.
목차 |
언어 [편집]
언어는 형식적으로 문장들의 집합으로 정의될 수 있고, 문장은 형식적으로 기호들의 연쇄로 정의될 수 있다.
예를 들어,
{ㄱ, ㄴ, ㄷ, ㄹ, ..., ㅎ, ㅏ, ㅑ, ㅓ, ㅕ, ..., ㅡ, ㅣ}라고 했을 때 다음과 같은 언어들이 있을 수 있다.
{ㄱㅏ, ㄴㅏ, ㄷㅏ, ㄹㅏ, ..., ㅎㅏ}
{ㄱㅏㄷㅏ, ㅅㅏㄷㅏ, ㅈㅏㄷㅏ, ㅊㅏㄷㅏ, ㅌㅏㄷㅏ, ㅍㅏㄷㅏ, ㅎㅏㄷㅏ}
{ㄱㄱㅏㄷㅏ, ㄷㄷㅏㄷㅏ, ㅅㅅㅏㄷㅏ, ㅈㅈㅏㄷㅏ}
문법 [편집]
문법은 형식적으로 기호들의 집합에 그 기호들로부터 문장을 만드는 규칙이 부여된 것으로 정의될 수 있다.

: 비말단 기호의 유한 집합
: 말단 기호의 유한 집합
: 생성규칙의 유한 집합
:
에 속하는 기호로 시작 기호 또는 문장 기호
형식문법을 기술하는 데 있어서 몇가지 기호 사용의 관례가 있다.
의 윈소인 비말단 기호는
등의 영문자 대문자로 표기한다.
의 원소인 말단 기호는
등의 영문자 소문자로 표기한다.
의 원소는
등 그리스문자로 표기한다. 즉, 비말단과 말단을 구별하지 않을 때이다.- 빈 문자열은
로 표기한다.
위계 [편집]
이렇게 정의된 형식문법은 생성규칙에 어떠한 제약이 있는가에 따라서 다음과 같이 나눌 수 있다.
제0유형 문법 [편집]
제약없는 문법(UG, unrestricted grammar). 생성규칙(production rule)에 제약을 두지 않는다. 단,
에서 
제1유형 문법 [편집]
문맥 의존 문법(CSG, context-sensitive grammar). 모든 생성 규칙은
에서
이다.
제2유형 문법 [편집]
문맥 자유 문법(CFG, context-free grammar). 모든 생성 규칙은
형태를 갖는다. (
는 하나의 비말단(nonterminal)이고,
는
에 속하는 문자열이다.
제3유형 문법 [편집]
정규 문법(RG, regular grammar). 모든 생성규칙은 다음 2가지 중 하나로 표현된다:
- (1)
또는
, 여기서
이고,
이다. - (2)
또는
, 여기서
이고,
이다.
형식문법의 촘스키 위계 [편집]
| 유형 | 문법 | 언어 | 오토마타 | 생성규칙 | 언어의 예 |
|---|---|---|---|---|---|
| 제0유형 | 제약없는 문법 | 귀납적 가산 언어 | 튜링 기계 | 제약 없음 | - |
| 제1유형 | 문맥의존문법 | 문맥의존언어 | 선형 구속형 비결정성 튜링 기계 | αAβ → αγβ | ![]() |
| 제2유형 | 문맥자유문법 | 문맥자유언어 | 비결정성 푸시다운 오토마타 | A → γ | ![]() |
| 제3유형 | 정규문법 | 정규언어 | 유한 상태 기계 | A → aB A → a |
![]() |
참고문헌 [편집]
- Noam Chomsky: Three models for the description of language, IRE Transactions on Information Theory, 2 (1956), pages 113-124
- Noam Chomsky: On certain formal properties of grammars, Information and Control, 1 (1959), pages 91-112
|
오토마타 이론: 형식 언어 및 형식 문법 |
|---|
|
각 언어 및 문법은 바로 윗줄의 진부분집합이다. 또한 각 기계와 문법은 바로 윗줄의 기계와 문법으로 동등하게 기술될 수 있다.
|
는 기호들의
은
의
: 비말단 기호의 유한 집합
: 말단 기호의 유한 집합
: 생성규칙의 유한 집합
:
등의 영문자 대문자로 표기한다.
등의 영문자 소문자로 표기한다.
의 원소는
등 그리스문자로 표기한다. 즉, 비말단과 말단을 구별하지 않을 때이다.
로 표기한다.
또는
, 여기서
이고,
이다.
또는 

