텍스트 파일

위키백과, 우리 모두의 백과사전.

CSV 형식의 텍스트 파일을 나타낸 그림 아이콘

텍스트 파일(영어: text file, 문화어: 본문파일)은 컴퓨터 파일 시스템에서 컴퓨터 파일의 일종이다.

일반 문자열이 들어가는 파일이지만 저장 정보의 해석 방식, 운영 체제와 연결되는 프로그램의 방식에 따라 이진 파일과 구분한다.[1] 텍스트 파일은 사람이 인지할 수 있는 문자열 집합으로부터 문자열로만 이루어진다. 잘 알려진 문자열 집합으로는 ASCII 문자열 집합과 유니코드 문자열 집합이 있다.

인코딩[편집]

ASCII 문자 집합이 영어 텍스트 파일의 가장 보편적인 포맷이며, 수많은 상황에서 일반적으로 기본 파일 포맷으로 간주할 수 있다. 강세가 있는 문자와 기타 비 ASCII 문자의 경우 문자 인코딩을 선택할 필요가 있다. 수많은 시스템에서는 컴퓨터에서 읽기 위해 쓰이는 기본 로캘 설정에 기초하여 선택된다. 수많은 유럽 언어에서 보편적인 문자 인코딩은 ISO 8859-1을 포함한다.

수많은 인코딩들이 제한된 문자열들만을 보유하고 있기 때문에 제한된 하위 집합의 인간 언어로 텍스트를 표현할 때에만 종종 유용하다. 유니코드는 알려진 모든 언어를 대표하기 위한 공통 표준을 만드는 시도로 볼 수 있으며, 알려진 대부분의 문자 집합들이 매우 큰 유니코드 문자 집합의 하위 집합에 속해있다. 유니코드를 위한 복수의 문자 인코딩이 있지만, 가장 흔한 것은 UTF-8이며, ASCII와 하위 호환된다는 장점이 있다. 즉, 비슷한 의미로 모든 ASCII 텍스트 파일은 UTF-8 텍스트 파일이기도 하다.

포맷[편집]

수많은 운영 체제에서 텍스트 파일은 서식(굵게 또는 기울임 등과 같은)이 없는 플레인 텍스트 내용만 허용하는 파일 포맷을 가리킨다. 이러한 파일들은 텍스트 터미널이나 단순 문서 편집기를 통해 확인, 편집이 가능하다. 텍스트 파일들은 보통 MIME 텍스트/플레인을 가지며, 인코딩을 가리키는 추가적인 정보가 포함되는 것이 보통이다.

윈도우 텍스트 파일[편집]

MS-DOS와 윈도우는 동일한 텍스트 파일 포맷을 사용하며, 각 텍스트 줄은 2개의 문자 조합으로 구분된다: 캐리지 리턴(CR), 라인 피드(LF)

유닉스 텍스트 파일[편집]

유닉스 계열 운영 체제에서 텍스트 파일 포맷은 정확하게 기술되어 있다: POSIX는 텍스트 파일을 0개 이상의 줄로 조직된 문자들을 포함하는 파일로 정의하고 있으며[2] 여기에서 줄들은 0개 이상의 새줄이 아닌 문자들 및 보통 LF를 가리키는 종단 새줄 문자로 이루어진다.[3]

같이 보기[편집]

각주[편집]

  1. Lewis, John (2006). 《Computer Science Illuminated》. Jones and Bartlett. ISBN 0-7637-4149-3. 
  2. “3.397 Text File”. 《IEEE Std 1003.1, 2013 Edition》. IEEE Computer Society. 2015년 12월 15일에 확인함. 
  3. “3.206 Line”. 《IEEE Std 1003.1, 2013 Edition》. IEEE Computer Society. 2015년 12월 15일에 확인함. 

외부 링크[편집]