연관 불평형

위키백과, 우리 모두의 백과사전.

집단 유전학에서 연관 불평형(linkage disequilibrium)이란 특정 개체군에서 서로 다른 유전자자리에 있는 대립유전자의 비무작위적인 관계(association)이다. 여러 유전자자리에 있는 서로 다른 대립유전자가 관계되는 빈도가, 서로 다른 대립유전자가 독립적·무작위적으로 유전될 때 관계되는 빈도의 기댓값보다 크거나 작을 때, 그 유전자자리들은 서로 연관 불평형에 있다고 한다.[1]

연관 불평형은 선택, 유전자 재조합의 비율, 돌연변이율, 유전자 표류, 교배 방식, 개체군 계층화, 유전자 연관 등 여러 요인에 영향을 받는다. 결과적으로 한 유전체 안에서 나타나는 연관 불평형의 패턴은 개체군 유전을 조직화하는 개체군 유전 과정의 강력한 신호이다.

연관 불평형은 전혀 연관되어 있지 않는 대립유전자 사이에서도 존재할 수 있고, 대립유전자 빈도가 평형인(시간에 따라 변하지 않는) 것과 상관없이 독립적으로 존재할 수도 있다.[1] 또한, 연관 불평형은 생식자 위상 불평형이라고 불리기도 하지만,[2] 연관 불평등의 본 개념은 무성생식을 하는 생명체에도 적용될 수 있다. 따라서 연관 불평형은 생식자의 존재와는 상관없이 정의된다.

수학적 정의[편집]

유성 생식을 하는 개체군에서 만들어진 생식자에서, 한 유전자자리에 있는 대립유전자 A의 빈도를 라고 하고(즉, 는 그 유전자자리에 A를 가지는 생식자 비율이다), 다른 유전자자리에 있는 대립유전자 B의 빈도를 라고 하자. 마찬가지로, 같은 생식자에 AB가 둘 다 함께 존재하는 빈도를 라고 하자(즉, AB 하플로타입의 빈도이다).

대립유전자 AB가 나타날 확률이 서로 영향을 미치지 않는다면, 이 두 대립유전자의 관계는 완전히 독립이라고 할 수 있다. 이때의 확률은 곱의 법칙을 사용하여 로 나타낼 수 있다. 가 어떻게든 와 달라진다면, 두 대립유전자 사이에 연관 불평형이 있다고 한다.

AB 사이에 나타나는 연관 불평형의 정도는 '연관 불평형 계수' 로 정량화할 수 있다. 둘 다 0보다 클 때,

으로 정의된다. 연관 불평형에서는 이다. 만약 이면서 이라면, 대립유전자 AB연관 평형에 있다고 한다. 에서 아래첨자 'AB'는 연관 불평형이 대립유전자 {A, B} 쌍의 특성이란 사실을 강조하는 것이지, 각 유전자자리를 따로 강조하는 것이 아니다. 같은 두 유전자자리에 존재할 수 있는 다른 대립유전자 쌍은 연관 불평형 계수도 서로 달라진다.

대립유전자가 2개 있는 두 유전자자리의 경우, 즉 각 유전자자리의 다른 대립유전자가 ab인 경우, 이 대립유전자들 사이의 모든 연관 불평형 관계를 나타내는 것은 하나의 D값으로 한정된다. 이때, 이다. 여기서 연관 불평형 관계는 다음과 같다.[3]

여기서 부호 D는 임의적으로 고른 것이다. D의 크기는 연관 불평형의 정도를 나타내기 때문에 D라는 부호보다 더 중요하다.[4] 이때 양의 D값은 특정 두 대립유전자 조합이 기댓값보다 빈도가 더 크다는 의미이고, 음의 D값은 특정 두 대립유전자 조합이 기댓값보다 빈도가 더 작다는 의미이다.

무성 생식을 하는 개체군에서의 연관 불평형은 개체군 대립유전자 빈도에서 정의하는 것과 비슷하게 정의된다. 또한, 연관 불평형은 3개 이상의 대립유전자 사이에서도 정의할 수 있으나 실제로 자주 사용되지는 않는다.[1]

D에서 파생된 척도[편집]

연관 불평형 계수의 양의 값 범위는 이것이 나타내는 대립유전자의 빈도에 따라 달라지기 때문에 연관 불평형 계수 는 연관 불평형을 나타내는 항상 편리한 척도가 아니다. 그래서 를 사용하면 서로 다른 대립유전자 쌍 사이의 연관 불평형 정도를 비교하기 어렵다.

르원틴(Lewontin)[5]D를 하플로타입의 측정값과 기댓값 차이의 이론적 최댓값으로 나누어 다음과 같이 D를 표준화하는 방법을 제안했다.

일 때

를 다르게 표현하는 방법은 유전자자리 여러 쌍 사이의 상관관계 계수를 이용하는 방법으로, 주로 로 표현한다.[6]

연관 불평형 계산 범위의 한계[편집]

척도는 범위에 한계가 있으며, 0부터 모든 유전자자리 쌍의 값을 다 포함하지 못한다. 의 최댓값은 비교할 두 유전자자리의 대립유전자 빈도에 따라 달라지며, 그 범위는 0부터 두 유전자자리의 대립유전자 빈도가 같을 때의 값까지, 즉 일 때 인 값까지 아우를 수 거나, 또는 대립유전자 빈도가 일 때 의 관계를 만족하는 경우에만 전체적인 범위를 아우를 수 있다.[7] 는 항상 최댓값 1을 가질 수 있는데, 두 유전자자리에서 의 최댓값은 그 두 유전자자리에서의 과 일치한다.[8]

예시: 두 유전자자리와 두 대립유전자[편집]

재조합의 역할[편집]

예시: 사람 백혈구 항원(HLA) 대립유전자[편집]

리소스[편집]

분석 소프트웨어[편집]

  • PLINK – 다른 것들 사이에서 LD를 측정할 수 있는 전체유전체 연관 분석 도구 모음.
  • LDHat Archived 2016년 5월 13일 - 웨이백 머신
  • Haploview
  • LdCompare[9]— LD를 계산할 수 있는 오픈소스 소프트웨어.
  • SNP and Variation Suite – 상호적인 LD 그래프를 그릴 수 있는 상업적 소프트웨어.
  • GOLD – 연관 불평형의 그래프 개요.
  • TASSEL – 연관 불평형, 특성 관계, 진화 패턴을 계산하는 소프트웨어.
  • rAggr – finds proxy markers (SNPs and indels) that are in linkage disequilibrium with a set of queried markers, using the 1000 Genomes Project and HapMap genotype databases.
  • SNeP – Fast computation of LD and Ne for large genotype datasets in PLINK format.
  • LDlink – A suite of web-based applications to easily and efficiently explore linkage disequilibrium in population subgroups. All population genotype data originates from Phase 3 of the 1000 Genomes Project and variant RS numbers are indexed based on dbSNP build 151.
  • Bcftools – 변이 콜링(variant calling)과 VCF, BCF를 처리할 수 있는 지원 프로그램.

시뮬레이션 소프트웨어[편집]

더 보기[편집]

각주[편집]

  1. Slatkin, Montgomery (June 2008). “Linkage disequilibrium — understanding the evolutionary past and mapping the medical future”. 《Nature Reviews Genetics》 9 (6): 477–485. doi:10.1038/nrg2361. PMC 5124487. PMID 18427557. 
  2. Falconer, DS; Mackay, TFC (1996). 《Introduction to Quantitative Genetics》 4판. Harlow, Essex, UK: Addison Wesley Longman. ISBN 978-0-582-24302-6. 
  3. Slatkin, Montgomery (June 2008). “Linkage disequilibrium — understanding the evolutionary past and mapping the medical future”. 《Nature Reviews Genetics》 (영어) 9 (6): 477–485. doi:10.1038/nrg2361. ISSN 1471-0056. PMC 5124487. PMID 18427557. 
  4. Calabrese, Barbara (2019년 1월 1일), Ranganathan, Shoba; Gribskov, Michael; Nakai, Kenta; Schönbach, Christian, 편집., “Linkage Disequilibrium”, 《Encyclopedia of Bioinformatics and Computational Biology》 (영어) (Oxford: Academic Press), 763–765쪽, doi:10.1016/b978-0-12-809633-8.20234-3, ISBN 978-0-12-811432-2, 2020년 10월 21일에 확인함 
  5. Lewontin, R. C. (1964). “The interaction of selection and linkage. I. General considerations; heterotic models”. 《Genetics》 49 (1): 49–67. PMC 1210557. PMID 17248194. 
  6. Hill, W.G. & Robertson, A. (1968). “Linkage disequilibrium in finite populations”. 《Theoretical and Applied Genetics》 38 (6): 226–231. PMID 24442307. 
  7. VanLiere, J.M. & Rosenberg, N.A. (2008). “Mathematical properties of the measure of linkage disequilibrium”. 《Theoretical Population Biology》 74 (1): 130–137. PMC 2580747. PMID 18572214.  |title=에 지움 문자가 있음(위치 32) (도움말)
  8. Smith, R.D. (2020). “The nonlinear structure of linkage disequilibrium”. 《Theoretical Population Biology》 134: 160–170. PMID 32222435. 
  9. Hao K.; Di X.; Cawley S. (2007). “LdCompare: rapid computation of single – and multiple-marker r2 and genetic coverage”. 《Bioinformatics》 23 (2): 252–254. doi:10.1093/bioinformatics/btl574. PMID 17148510. 

더 읽기[편집]

틀:집단 유전학