数据里的中国:古人怎么做统计分析?

2024-08-31 10:30:40 - 商学院

数据里的中国:古人怎么做统计分析?

从早期简陋的统计工具到后来逐渐完善的户口登记系统和人口统计制度,所得数据的准确性与可靠性在古代社会中扮演了至关重要的角色。

记得上中学的时候,我们会背一些中国历史上的统计数据。让我印象最深的数据有两个:一是汉武帝时期,中国人口超过1000万;二是道光十四年(1834年),中国人口突破4亿。当时让我尤为不解的是,在中国古代交通、信息技术落后的情况下,这些统计数据到底是如何得出的?难道是官府派人挨家挨户地敲门询问吗?

随着对历史的深入学习,我们知道中国古代统计数据的来源不仅仅是简单的调查与记录,它背后蕴含着一整套系统的管理与统计方法。从早期简陋的统计工具到后来逐渐完善的户口登记系统和人口统计制度,所得数据的准确性与可靠性在古代社会中扮演了至关重要的角色。今天我们将一起探讨那些穿越千年的统计智慧,揭开古人在资源有限条件下完成庞大数据收集与分析的秘密。

01

中国古代统计工作怎么做

在中国古代的统计汇总工作中,上计制度是主要的资料收集和汇总方法。

中国很早就形成了较为系统、科学的统计方法和数据收集制度。早在三千年前,《易·系辞上》中提到“方以类聚,物以群分”,反映了万事万物可以依类、依群进行分组的基本思想;《尚书·禹贡》则首次提出了统计复合分组的概念。书中将田地和赋税区划分为上、中、下三等,每一等级内又细分为上、中、下三级,共形成三等九级,正是复合分组思想的体现。

到了西周时期,统计分组法已被实际应用。《周礼·地官司徒》中记载了田赋征收的规则:“凡任地,国宅无征,园廛二十而一,近郊十一,远郊二十而三,甸稍县都皆无过十二,唯其漆林之征,二十而五。”这是根据土地类型来决定田赋的征收方式。同时,《周礼》还提到对人口的分类方法,不仅根据城乡进行分组,还根据身份的贵贱、年龄的老幼、身体的健康状况等进行平行分组。这些细致的分组方式,展示了中国古代统计思想的早期发展与应用。

在中国古代的统计汇总工作中,上计制度是主要的资料收集和汇总方法。早在西周时期,就已经有了全面核算的上报制度,当时的“司会”是负责计官工作的主管官员,承担着“生天下之大计”的重任。到了春秋战国时期,上计制度进一步完善,成为主要的统计报告制度。上计制度的核心在于将民户、垦地和税收等预算统计记录在木券上,并将其呈送给国君。国君会将木券一分为二,自己保留右券,而臣下则持有左券。到了年终,臣下必须根据左券的记录向国君汇报执行情况,这一过程被称为“上计”。国君则根据手中的右券对官吏进行考核,并决定他们的升贬和奖惩。上计制度在此后的历朝历代都得以沿袭和执行。

在秦代,上计时间被规定在九月和十月,因为十月是岁首。西汉时期,上计制度变得更加完善,此时的上计簿主要反映了两方面的情况:一是财政收支,二是人户统计。到了唐代,上计的范围进一步扩大,增加了科举考试方面的内容。宋代则进一步发展了统计报告的形式,包括月报、季报、半年报和年报。于是宋代皇帝主要通过阅览统计年报来掌握国家的财政状况,并据此对官吏进行奖惩,这一做法基本上改变了过去皇帝要亲临受计的传统。

明清两代沿袭了唐宋时期的上计制度,每年年终,各布政司、府、州、县等地方政府会在逐级汇总的基础上,委派计吏赴户部递交统计报告,以报告当年的钱粮、军需收支情况。这类统计报告官方称为“钱粮文簿”,因为这些报告是用于奏销的,所以也被称为“销册”。到了清代,奏销册有所发展,分为两种类型:一种是按行省编制的综合统计报告,另一种是按主管系统或部门编制的专项统计报告。

令人遗憾的是,中国古代的统计工作自宋代之后,在方法上的进步便乏善可陈。根据现存史料推测,宋代的统计工作更倾向于根据事物的内部属性进行定性分组,而不是尝试通过定量分析来揭示事物的本质、特征和差异。然而,定量分析正是现代统计学的重要方向,因此宋代之后我国的统计学也没有走上近代统计方法的发展道路。

02

中国古代三大数据

人口、土地和赋税数据构成了古代国家行政管理中最为关键的信息来源,也是统治者制定政策的基石。

在中国古代,人口、土地和赋税这三大数据是国家治理的核心要素。人口和土地数量是中国古代中央制定各地税收标准的主要依据。因此赋税数据反映了国家的财政状况,是维持国家运转和实施各项政策的重要支撑。这三类数据构成了古代国家行政管理中最为关键的信息来源,也是统治者制定政策的基石。

中国是世界上最早进行人口统计的国家之一。关于人口统计的零星记载可以追溯到远古时期,从卜辞和金文中就可以找到不少相关内容,其他文字记载也非常丰富。《国语·周语》记载,西周宣王三十九年(前789年)进行了一次户口普查,这也是最早有记录的普查活动。

人口统计与户籍制度密不可分。中国从周代起就有了较完备的户籍制度,这一制度的实行对于保证人口统计的实施起了一定的作用。西汉时期的人口调查是与课税联系在一起的,主要有“口赋”和“算赋”,并规定按年龄大小课税,这说明在西汉时期中国的人口统计就运用到了年龄分组法。西汉经过200多年的休养生息,到西汉末年(元始二年)人口得到很大发展,《汉书·地理志下》记载,当时国家户籍约为1228万户,人口约5959万人。这一人、户统计数字,是我国历史上第一次有正式记录的人口统计数字,也是世界上最早、最完整的全国和分地区的人口统计数字。

中国历史上第二个人口高峰在唐朝。唐初以来执行严格的人口调查统计和户籍管理,至唐中期天宝十四年(755年),人口大增,《通典》记云:“管户总八百九十一万四千七百九,管口总五千二百九十一万三百九,此国家极盛也。”此书作者、唐代史学家杜佑根据全国总人口中每户的平均人数,以食盐的消费量估算全国总户数,估算当时约有500万户。

明朝建立以后,于明初洪武三年(1370年)11月,在全国推行“户帖”制度。户帖制度实质上就是一种全国性的人口调查统计和户籍管理制度,户帖本身只是一种为查调户口而设立的原始文件。11年后(1381年),明太祖又令全国各州、县分里编造“黄册”,这是一种兼记徭役、赋税的户口册籍。经过明洪武十四年编制黄册普查,明朝第一次有了全国的户数和人口数统计,《明太祖实录》卷140记载,是年全国有户约1065万户,口约5987万人。经明初以来的休养生息与农村经济的复兴,至永乐元年(1403年),上升为户约1142万户,口约6659万人,是明代在籍户口鼎盛之年。

清时在户口管理方面与明代基本相同。但康熙五十一年(1712年),清廷实行“滋生人丁,永不加赋”的政策,即从原则上废除了人口税。这对人口的增长和统计都很有利。到道光十四年(1834年),人口已达约4亿人,在90多年间人口增加了2亿多人。增长如此之快,固然有人口自然增长速度加快的因素,但也与清康熙、雍正年间改革赋税制度、乾隆初年改变人口统计方法与范围不无关系。

中国古代政府税收方式屡有变迁,但基本的依据就是人口和土地数量,所以除了人口统计外,土地清丈也是历代政府的重要工作。先秦典籍《周易》中,就完整地记载了丈量土地以及给土地分等的方法。由于土地是重要的赋税单位,地方总试图向中央瞒报土地数量,以减少税赋。早在东汉光武帝建武十五年(39年),就下诏全国州郡度田,丈量土地,并附带核实人口。

历朝历代都有清丈土地查出隐田的措施。例如唐代为了增加税收,扩大徭役,于玄宗开元九年(公元721年),以宇文融为劝农使,抗民籍田,得户80余万以及大量土地;宋代初年,税户隐田逃税;王安石执政,于熙宁五年(1072年)在陕西、河北等五路丈量出大量被隐瞒的田产;天丰八年(1085年)废止共清文田亩近250万顷,占全国纳税土地的54%。

北宋时期,为了防止漏报、瞒报,有司将各户的土地、山塘一块一块核实,标明其面积、座落,绘成图样,因为图上所绘田亩挨次排列如鱼鳞,故称“鱼鳞图册”。到了明清两代,鱼鳞图册广泛应用于土地清丈工作当中。明洪武二十年,命各州县分区编造,以田地为主,分号详列面积、地形、四至、土质以及业主姓名,如此详细周密的统计工作使各地再难有大量瞒报。

在人口和土地的标准上测算出的各地赋税,之后分派地方征收,按时(通常是年)向中央汇总。因此,每年各地的税收数据在历代也存留了大量相关记录。赋税的数据结构非常复杂,而且历史上变化极大,但通常由两部分组成:人口税和地税。此外,各朝因其情况还会加征大量商业税、盐税、关税及杂税,有时杂税的数额甚至超出了正税,为人民带来极大的负担。但是在研究历史的过程中我们发现,历代因为各种原因,土地、人口统计数量偏差都很大,反而赋税是衡量经济水平和国家收入的最准确数据。

03

中国古代的数据准不准

无论是清查户口和田地的实际操作,还是赋税的收取与管理,都折射出封建社会在财政和行政管理上的复杂性。

如前所述,中国古代关于人口、地亩的统计,主要用于政府收税,因此这两种数据的统计过程,实际上反映了地方势力、地方政府和中央政府的三方博弈。在中国古代社会,户口、田地和税收的管理是通过各级官吏执行的,而不是由地方势力来负责,这就造成了统计数据工作中不同势力的对抗。

清查户口和田地虽然对中央政府有利,因为它可以增加赋税收入,但对于地方官员而言,却可能加重地方负担,这会引发地方士民的不满,甚至遭到地方势力的弹劾和驱逐,从而危及个人前程。例如,明代万历年间福建省进行土地丈量,晋江县县令彭国光对丈量工作非常认真,结果发现了溢额土地1400余顷。这就意味着当地民众要均摊更多的地税。彭国光的严格丈量引起了晋江士民的强烈反感,许多福建官吏和士民纷纷避免像晋江一样过于认真。《福建通志》记载了地方反应,指出惠安、安溪等地并未像晋江那样全面丈量,而是仅仅依靠浮粮进行统计。

在中国古代,户口和田地的统计数据常常不尽准确,但田赋的统计数字一般较为可靠。无论是中央政府还是地方政府,正式上报造册的田赋数字通常能够真实反映政府各个时期的财政赋税收入情况,但政府的财政收入与纳税户的实际负担往往存在差距。各级官吏常通过各种手段加重纳税户的负担,使实际负担远超财政收入。

因为官吏的私增和暗派在原则上属于非法行为,这些额外的私派通常不会出现在官方统计数字中。明代福建惠安县令叶春及在他的《惠安政书》中,揭示了惠安县衙门控制的田地远超官方上报的数据。尽管叶春及为政清廉,但他只能在私人著作中揭露这些情况,而不敢正式上报,因为这可能意味着增加赋税,给自己和他人带来不便。因此,尽管民间的实际户口和田地数据与官方统计存在差异,并且官吏的非法加派情况严重,地方官吏向上造册上报的田赋数字却能够保持准确。

中国古代的统计制度和数据管理经历了漫长的发展历程。虽然各种数据的统计常常受到各种因素的影响,但它们依然是了解古代中国社会经济状况的重要依据,这些历史统计数据也为我们研究古代社会提供了宝贵的素材。

无论是清查户口和田地的实际操作,还是赋税的收取与管理,都折射出封建社会在财政和行政管理上的复杂性。现代学者对这些古代数据进行修正和分析时,虽然面对众多挑战,但仍能揭示出许多有价值的历史信息。探索和解读这些古代统计数据,更好地理解和继承中国古代的统计与管理智慧,也成为学者们一直以来努力和奋斗的方向。

作者|王敬雅系中国政法大学人文学院教师,中国古代史博士,关注清代政治史、宫廷史研究

来源|《商学院》杂志9月刊

今日热搜