人类基因组中基因数量的最早尝试之一是在纽约科尔德斯普林港的一个酒吧和纯粹的猜测。
那是在2000年,当一个人类基因组序列草案仍在进行中时,遗传学家正在为人类拥有多少基因做赌注,赌注从几万到几十万不等。近20年后,科学家们掌握了真实的数据,仍然无法在数量上达成一致。他们说,知识差距阻碍了发现疾病相关突变的努力。最新的计数使用了更大的数据集和不同于先前的计算方法,以及更广泛的基因定义标准。研究小组留下了21,306个蛋白质编码基因和21,856个非编码基因,远远超过两个最广泛使用的人类基因数据库(由EBI维护的GENCODE基因组包括19,901个蛋白质编码基因和15,779个非编码基因以及由美国国家生物技术信息中心管理的数据库RefSeq列出的20,203个蛋白质编码基因和17,871个非编码基因)。