최근에 와서 유전자조작기술의 개발로 prokaryotic cell의 유전자는 물론 많은 eukaryotic cell의 유전자들이 동·식물을 비롯하여 곤충 및 하등인 yeast와 slime mold로부터 cloning되었다. 또한 때를 같이하여 Sanger(1978)와 Maxam과 Gilbert(1979)들에 의한 DNA sequencing 기술의 발전은 이들 cloning된 유전자들의 염기배열순서를 단시일내에 완전해독 할 수 있게 하였으며 따라서 이들 구조유전자 및 그 주위에 존재하는 유전자의 발현에 관계되는 조절DNA sequence의 존재와 그들의 기능이 밝혀져, 유전자들의 염기순서의 level에서 그 미세구조를 해부할 수 있게 되었다.
I) Prokaryotic Gene의 구조와 발현
특히 prokaryotic gene은 대부분이 단일한 single copy 유전자로 구성되어, DNA sequence가 homogeneous한 특성을 가지고 있으며 유전자의 미세구조에 있어서는 promotor region의 pribnow box, operator region과 CAP sites 등의 DNA sequences가 밝혀졌고, 이들 조절 DNA sequence들은 공통적으로 palindromic structure를 가지고 있어 조절단백질 흑은 DNA에 binding하는 효소(RNA polymerase, restriction endonucleases 등)들이 이들 구조를 인식하여 특별한 DNA site에 결합하는 것으로 해석된다. 이외에도 Shine-Dalgarno sequence와 attenuator region 등의 존재가 밝혀졌으며 유전자의 transcription에 있어서 성숙된 mRNA의 구조를 보면, leader sequence 맨 앞의 5` 끝에는 A/G ppp로 항상 시작되고, leader sequence 내에는 16S rRNA의 3` 끝에 가까운 곳의 염기와 서로 상보적인 염기배열이 있어 mRNA가 ribosome의 minor component(30S)와 결합하는 장소를 제공한다. 또한 mRNA 3` 끝에는 -UUUUUUA3`의 sequence를 공통적으로 가지고 있으며 특히 prokaryotic gene은 eukaryotes에서 발견되는 intervening sequence(IVS)가 없는 것으로 밝혀졌다.
II) Eukaryotic Gene의 구조와 발현
고등생물의 유전물질(DNA)을 구성하는 DNA sequence를 Cot(reassociation kinetics) 방법으로 분석하면 prokaryotic DNA와는 달리, 이질적인 구조를 가지고 있다. 즉 대단히 많이 반복하여 존재하는 repetitive DNA sequence로서 10^5∼10^7 정도의 반복으로 2∼10 base Pair(bp)로 구성되어 있으며 식물에서는 300bp까지 발견되었다. 또한 여러 개의 유전자 copies를 가지고 있는 DNA sequence로서 rRNAs, tRNAs 및 histones을 coding하는 유전자를 예로 들 수 있으며 100이내의 반복을 나타낸다. 진핵세포에 있어 단일 copy 유전자는 genome의 약 70%를 차지하고 있다.
유전자 cloning과 DNA sequencing의 결과는 이들 많이 반복되는 (highly repetitive) DNA sequences의 생물학적 및 진화적 의미를 논의하고 있다. 그리고 single copy 유전자의 경우에서는 immunoglobin과 globin 유전자 등 기능이 같은 단백질의 유전자를 사람을 비롯한 생쥐, 토끼와 병아리 등에서도 cloning하여 이들 유전자의 구조 및 DNA sequence의 결과를 서로 비교하여 진화 과정에서 divergence와 이들이 가지고 있는 IVS의 기능 및 진화적 의의를 설명하려고 한다. 그리고 immunoglobin 유전자의 경우는 V gene과 C gene의 germ line에서의 구조와 성숙된 lymphocyte cell에서의 이들 유전자의 구조를 비교해 볼 때 ontogeny 과정에서도 서로 결합 등을 행하는 과정을 볼 수 있다. 많은 eukaryotic 유전자는 IVS를 가지고 있다. 그러나 histone이나 human lymphocyte interferon 유전자들에서는 IVS가 발견되지 못하였다. IVS의 존재는 eukaryotic cell에 있어 transcription 과정에 있어서 원핵세포와는 다른 새로운 문제점을 제기하여준다. precursor mRNA 수준에서 splicing을 하는데 관련되는 splicing enzyme(s)이 진핵세포에는 존재함을 시사한다. Yeast tRNA 유전자의 DNA sequencing 결과에서 보면 tyrosine, tryptophan, leucine 유전자는 각자 길이의 IVS를 가지고 있으며 그 장소는 anticodon으로부터 3`end쪽으로 1base 건너서 공통적으로 존재한다. 이와 같이 공통된 위치의 의미는 앞으로의 연구결과에서 논의 될 것이다. 진핵세포에서는 pribnow box에 해당하는 sequence가 mRNA 시작으로부터 대략 30bp upstream에 존재하나, RNA polymerase가 recognition 하기 위해서 다른 DNA부분이 더 필요한 것으로 보고되고 있다.
III) Animal Virus의 유전자 구조와 발현
SV40와 polyoma virus는 동물세포에서 증식 또는 형질전환을 일으키는 oncogenic virus 이다. 이들 virus는 대략 5,300bp를 총 유전자로 하여 sequencing이 완료되었다. 이들 sequencing 결과와 gene products를 비교 분석하여 다음과 같은 결론을 얻었다.
① 작은 양의 유전정보를 최대로 이용하기 위하여 같은 DNA sequence를 reading frame을 달리하여 중복 사용하고 있음을 발견, 이를 overlapping gene 이라 하였