最初のころは、人間のゲノム、連続した遺伝子の完全な一揃いが頭からしっぽへと並んで居ると考えられていました。しかし、このもっともらしくはあるが単純なモデルが間違っていることに気づきました。推定されている全遺伝子の数(約10万種)と人間のゲノムを構成しているヌクレオチドの数(30億塩基対)とが合わないのです。いままでに分離され、その構造つまり塩基配列が決定された遺伝子の長さは数百塩基対から、大きいもので14,000塩基対(この遺伝子は「ジストロフィン」と呼ばれるタンパク質を指定しており、このタンパク質の異常がデュシェーヌ型筋ジストロフィー症と言う恐ろしい病気の原因となることが解っている)までというぐあいに、種類によって大きく違っていますが、平均すると遺伝子の長さは数千塩基対です。10万種の遺伝子が在るという推定が正しいとすると、数千塩基対の10万倍、すなわち数億塩基対が人間の全遺伝子の長さだと言うことになります。

すると人間の全DNAの中には、遺伝子ではないDNAが数多く存在すると考えなくてはなりません。事実、ゲノムには遺伝子と遺伝子の間に長く延びたDNAが在ることがわかっています。これらの明らかに機能を持たないDNA配列の中にあるものはしばしば「ジャンクDNA」と呼ばれています。したがって遺伝子はDNA分子中に散らばって存在していることになるわけですが、遺伝子間にある機能を持たないDNA領域が何のために在るのかはまだ解っていません。すべての遺伝子のすぐ前に在るDNA領域には特定の塩基配列がみられるが、この配列は、その後に続く遺伝子がその機能を現わすために必要だということが指摘されています。科学者たちはまた、長い間「エンハンサー」という遺伝子の発現を増強するDNA配列が、遺伝子の直前に在ると考えていたが、これは実は直前ではなく、遺伝子よりかなり上流に在り、ときとして下流にも在ることが解ってきました。しかし遺伝子間の配列のほとんどについては、まだミステリーのままであり、その解決のために活発な研究が行われています。

長さばかりではなく、遺伝子の配列も多様です。どのようにして遺伝子を周りのDNAから区別して決めるのだろうか?明らかに一つの遺伝子を含んでいることが解っているDNA領域の一続きの配列を読んでも、それはただ、ヌクレオチドの連鎖にしかすぎず、そのどこにも「遺伝子」と言う言棄は出てこない。私達はどのようにDNA言語を読んだらよいのだろうか?分子生物学者は、遺伝子と他の領域との境界を示したり、遺伝子中の特定の部分を示す鍵となる塩基配列を識別したりすることを学びました。これらの配列はいままで取り出された遺伝子ではほとんどすべてに共通しています。したがって、DNA配列を読んだとき、その中から遺伝子を見つけ、その位置を決めるのは比較的簡単です。