cut (유닉스)

위키백과, 우리 모두의 백과사전.

cut
개발자AT&T 벨 연구소
발표일1985년 2월
운영 체제유닉스, 유닉스 계열
종류명령어
라이선스coreutils: GNU GPL v3

cut유닉스 계열에 있는 프로그램으로, 텍스트 파일의 각 줄에서 특정 부분을 자르는 데에 사용한다.

예제[편집]

다음과 같은 텍스트 파일이 있을 때:

foo:bar:baz:qux:quux
one:two:three:four:five:six:seven
alpha:beta:gamma:delta:epsilon:zeta:eta:teta:iota:kappa:lambda:mu

각 문장의 4번째부터 10번째 글자만 얻고 싶다면 다음과 같이 실행하면 된다.

 $ cut -c 4-10 file

이때 출력은 다음과 같다.

:bar:ba
:two:th
ha:beta

문장 일부분의 발췌는 일반적으로 구획문자(-d — 디폴트에 의한 탭 문자)에 의해서 구분된 바이트들 (-b), 단어들(-c)이나 파일들(-f)로 된다. 범위는 N, N-M, N- (N에서 문장 끝까지)나 -M (문장 시작에서 M까지) 중 하나로 구성된 각각의 경우에 따라서 정해진다.

필드 구획문자로서 콜론 문자를 사용하면서 5번째 필드부터 각 문장의 마지막까지 출력하기 위해서는:

 $ cut -d ":" -f 5- file

이는 다음과 같이 출력된다:

quux
five:six:seven
epsilon:zeta:eta:teta:iota:kappa:lambda:mu

구문[편집]

 cut [-b] [-c] [-f list] [-n] [-d delim] [-s] [file]

사용될지도 모르는 플래그들은 다음과 같다

-b
Bytes; -b를 따르는 리스트는 리턴될 바이트들에 의한 범위를 지정한다. 예를 들어 cut -b1-66은 문장의 최초 66 바이트들을 리턴한다. 만약 -n과 함께 사용될 경우, 어떠한 멀티-바이트 문자들도 쪼개질 수 없음을 주의하라. -bsms 1023 바이트보다 더 적은 입력어에서만 사용 가능하다는 것도 주의하라.
-c
Characters; -c를 따르는 리스트는 리턴될 문자들의 범위를 지정한다. 예를 들어서 cut -c1-66은 문장의 최초 66 문자들의 리턴한다.
-f
구획 문자에 의해 구분된 필드 리스트를 지정한다.
list
정수로 표시된 필드들의 콤마로 구분된 혹은 공백으로 구분된 리스트, 점진적으로 명령된다. - 표시는 필드들의 범위 포괄을 허용하기 위한 약기로서 제공된다. 예를 들어서 4-6은 범위 4-6를, 5-는 필드 5부터 끝까지를 나타내기 위한 약기로 사용된다.
-n
멀티-바이트 문자들의 구분을 진압하기 위해서 -b와 함께 사용된다.
-d
Delimiter; -d 옵션을 즉시 따르는 문자는 -f 옵션과 함께 사용되기 위한 필드 구획문자이다; 그 디폴트 구획문자는 이다. 사용되고 있는 스페이스와 의 문맥 안에서 특별한 의미들을 지닌 다른 문자들은 반드시 인용부호를 달거나 필요에 따라 에스케이프 되어야 한다.
-s
-f가 지정되었을 때 어떠한 필드 구획 문자도 포함하지 않은 문장들은 명시되어 있지 않는한 우회한다.
file
파일을 (그리고 필요하다면 동반되는 경로) 입력어로서 처리한다. 만약 어떠한 파일도 지정되지 않았다면 표준 입력어가 사용된다.

같이 보기[편집]

외부 링크[편집]