一、目的 学习流行病学回顾性调查分析方法
二、时间2学时
三、课题
作者等看到近二、三十年来因患肺癌而死的人数大有增加,因而对其原因进行了调查研究,他们所看到的增加并非由于一般人口增加右老年人口增加所致。卫生统计学家提出死亡率标准化以后的数据如下:1901~1920年间,每10万人口肺癌死亡率为:男1.1,女0.7;1936~1939年间,男10.6,女2.5。这种增高趋势亦见于别国的报告(如瑞士、丹麦、美国、加拿大、澳大利亚、土耳其及日本)。
有人认为这种增加不一定是真的增加,而是诊断技术或诊断标准有所改进所致。你将如何解决这一问题呢?你能完全摒除这一可能性么?
增加的可能因素
一向为人们重视的原因有二:(一)大气污染的增加,如大气为汽车尾气、柏油马路上的尘埃、煤气厂、工厂等发出烟尘所污染;(2)吸烟。近数十年以上两项均有所增加。
请考虑如何区分以上两种因素对肺癌的作用,以往积累的临床经验和记录主要是吸烟方面的。这些资料都比较零碎。
调查研究方法
调查研究的目的在于确定患肺癌的人在吸烟习惯上与其他病人有无重要不同。调查对象不仅为患肺癌的人,同时附带查胃癌、肠癌、肝癌病人(请考虑这样做的意义)。
调查方法:与20个大医院合作,请其在患以上各种癌症的人入院时即给一通知。在接受到通知后,即派一调查员(专职人员)前往访视病人,并进行调查。调查员每调查一个患癌者,同时须调查一个非肺癌的病人作为对照(请考虑此项工作有何必要性)。对照病人的条件是:年龄(上下在5岁之内)、性别与肺癌患者相同,并大约在同时入同一医院的。
肺癌诊断必须确实。
资料
在调查研究期间(1948年4月至1948年8月)共有肺癌病例通知1347起。事先决定,75岁以上的病例不做为调查对象(因恐不能得到可靠的调查资料)。这类病人有150例,另有80例诊断改正后未予调整,另有408例因故未能进行调查,未能进行调查者之总数,占的比例虽高,但不足以使研究结果发生偏差。未能调查到的主要原因为接到通知一耽搁了。实际上经过调查的肺癌病例有709名,另有等数的对照病人,这两组的可比性如实习表17-1所示:
实习表17-1
年龄(岁) | 肺癌病人 | 对照病人 | 经济状况 | 肺癌病例 | 对照例 | ||
男 | 女 | 男 | 女 | 甲等 | 77 | 87 | |
25~ | 2 | 1 | 2 | 1 | 乙等 | 388 | 396 |
30~ | 6 | 0 | 0 | 0 | 丙等 | 184 | 166 |
35~ | 18 | 3 | 18 | 3 | 合计 | 649 | 649 |
40~ | 36 | 4 | 36 | 4 | 居住地区 | ||
45~ | 87 | 10 | 87 | 10 | 市1区 | 330 | 377 |
50~ | 130 | 11 | 130 | 11 | 市2区 | 203 | 231 |
55~ | 145 | 9 | 145 | 9 | 市3区 | 23 | 16 |
60~ | 109 | 9 | 109 | 9 | 近郊区 | 95 | 54 |
65~ | 88 | 9 | 89* | 9 | 远郊区 | 43 | 27 |
70~74 | 28 | 4 | 27* | 4 | 外区 | 15 | 4 |
合计 | 649 | 60 | 649 | 60 | 合计(男+女) | 709 | 709 |
*年龄选错了
从实忌表17-1可以看到肺癌组与对照组在性别和年龄上完全相同,但在经济状况及住址上有些不同。经济状况差别不大,可能由于机会误差(x2=1.61;n=2;0.30<P<0.50)。住址之误差较大(x2=31.49;n=5;P<0.001),肺癌者住在距离市较远地区的比例较对照为高,其解释是这样的,边远地区的患肺者来市中心区大医院求治,因在本区缺乏这项医疗条件。这项区别,尚不足以破坏研究所得的结论。如果严格要求,则可只比较两组均住在市区的例子。
吸烟习惯的评定
在评定吸烟与肺癌关系时,可能因吸烟习惯有所改变而发生困难,一个人可能在早几年吸烟不多但后来多起来;一个原来吸烟多的人亦可减少烟量或完全戒掉;也有人屡戒屡吸。
怎样克服因吸烟量变动而发生的困难呢?一个方法是问吸烟史时问得仔细些。可以这样问:(1)他们在一生中曾否吸烟;(2)几岁开始吸,几岁停止;(3)在开始患病之前,吸烟是多少;(4)吸烟的习惯发生过几次重大的变动,最大量是多少;(5)吸烟斗和吸纸烟的比例如何。
什么叫做一个吸烟者,必须有个定义,著者所下的定义是:一个曾经每天吸烟一支以上吸了一年的人,不够此标准的人不当做吸烟者计,当然,吸烟史的材料是随着人的记忆和肯不肯说老实话而异。病人回答的可靠性是可以测验的,著者曾随机调查了50个病人(非癌患者),问了吸烟史两次,其间隔6个月,比较两次回答的吸烟量,即可知道答案的可靠程度,他们回答的结果是这样的(实习表17-2)。
实习表17-2
第一次访问,各种烟量吸的人数 | 第二次访问,各种烟量吸的人数 | ||||||
0 | 1支~ | 5支~ | 15支~ | 25支~ | 50支+ | 合计 | |
0 | 8 | 1 | 9 | ||||
1支~ | 4 | 1 | 5 | ||||
5支~ | 1 | 13 | 3 | 17 | |||
15支~ | 4 | 9 | 1 | 14 | |||
25支~ | 1 | 3 | 0 | 4 | |||
50支+ | 1 | 0 | 1 | ||||
合计 | 8 | 6 | 18 | 13 | 5 | 0 | 50 |
从实习表17-2的分析可以看出病人对烟量的回答的回答不是十分准确的,但可靠性已经足够说明两组吸烟者与非吸烟者的比较。
为显示吸烟与肺癌有无关系,最简捷的方法是比较肺肺癌患者和非癌者中吸烟者各占的比例,结果见实习表17-3。
实习表17-3
非吸烟者 | 吸烟者 | X2检验 | |
男:肺癌病人(649) | 2(0.3%) | 647 | P=0.0000064 |
非肺癌病人(649) | 27(4.2%) | 622 | (精确法) |
女:肺癌病人(60) | 19(31.7%) | 41 | X2=5.76 |
非肺癌病人(60) | 32(53.3%) | 28 | N=1
0.01<P<0.02 |
从机率试验结果可以看到肺癌组吸烟者人数,显著地较非肺癌患者为多。虽然妇女的吸烟习惯较不普遍,但两组的吸烟人数仍有显著差别。
吸烟量
在实习表17-3所列的比较里,所有吸烟者都归纳为一组,不论其吸烟量多少。实习表17-4的比较更深入了一步,比较两组病人在生病之前的吸烟量(如该对烟已戒掉,则问戒烟前的烟量)。
从实习表17-4的分析中可以看到,肺癌组中不仅吸烟者人数多,而吸烟量大者所占之比重亦较大,实习表17-3及17-4的结果可以合并用图表示如实习图17-1。
实习表17-4
病例分组 | 吸烟人数 | X2检验 | ||||
1支~ | 5支~ | 15支~ | 25支~ | 50支+ | ||
男: | X2=36.95 | |||||
肺癌病人(647) | 33(5.1%) | 250(38.6%) | 196(30.3%) | 136(30.3%) | 32(5.0%) | N=4 |
非肺癌病人(622) | 55(8.8%) | 293(47.1%) | 190(30.5%) | 71(11.4%) | 13(2.1%) | P<0.01 |
女: | *x2=5.72 | |||||
肺癌病人(41) | 7(17.1%) | 19(46.3%) | 9(22.0%) | 6(14.6%) | 0(0%) | n=2 |
非肺癌病人(28) | 12(42.9%) | 10(35.7%) | 6(21.4%) | 0(0%) | 0(0%) | 0.05<P<0.10 |
吸烟斗者每星期1英两折合每天4支纸烟
*为1支,5支及15支以上三组进行x2检验
有吸烟历史的定义前面已经讨论过。现在另外用两种方法分析,一种是按经常每天最高吸烟量进行二组中各种量的人数比较比较结果见实习表17-5。
第二种方法是从比较两组病人一生吸过的烟总估计量。当然估计是不会准确的,但足够区分两组不同,比较结果见实习表17-6。
实习表17-4,17-5及17-6的结果是很相似的。不论用什么方法衡量吸烟的程度,结果都是一样的,就是在吸烟与肺癌之间有个重要的、明显的关系。吸烟的概念愈明确,则二者的关系愈清楚,例如用最大吸烟量及一生吸过的总吸量为指标较用发病前的吸烟量为指标来得好。但前两项指标由于多数病人记忆模糊估计数字不易准确,故后一项指标仍属可取。
比较吸烟的年龄也是一种方法,结果见实习表17-7,肺癌病人有吸烟开始年龄较早,吸烟年龄较长和戒除较少的倾向,但两组间的区别不鲜明,只有戒烟年数的差别有统计学意义。
实习表17-5
病例分组 | X2检验 | |||||
1支~ | 5支~ | 15支~ | 25支~ | 50支+ | ||
男: | X2=24.45 | |||||
肺癌病人(647) | 24(3.7%) | 208(32.1%) | 196(30.3%) | 174(26.9%) | 45(7.0%) | N=4 |
非肺癌病人(622) | 38(6.1%) | 242(38.9%) | 201(32.3%) | 121(19.5%) | 20(3.2%) | P<0.01 |
女 | x2=7.58 | |||||
肺癌病人(41) | 6(14.5%) | 15(36.6%) | 12(29.3%) | 8(19.5%) | 0(0%) | n=2 |
非肺癌病人(28) | 12(42.9%) | 9(32.1%) | 6(21.4%) | 0(0%) | 1(3.6%) | 0.02<P<0.05 |
实习表17-6
病例分组 | 吸烟人数 | X2检验 | ||||
365支~ | 50000支~ | 150000支~ | 250000支~ | 500000支~ | ||
男: | X2=30.60 | |||||
肺癌病人(647) | 19(2.9%) | 145(22.4%) | 183(28.3%) | 225(34.8%) | 75(11.6%) | n=4 |
非肺癌病人(622) | 36(5.8%) | 190(30.5%) | 182(29.3%) | 179(28.9%) | 35(5.6%) | P<0.01 |
女: | x2=12.97 | |||||
肺癌病人(41) | 10(24.4%) | 19(46.3%) | 5(12.2%) | 7(17.1%) | 0(0%) | n=2 |
非肺癌病人(28) | 19(67.9%) | 5(17.9%) | 3(10.7%) | 1(3.6%) | 0(%) | 0.001<P<0.01 |
实习表17-7
肺癌病人 | 非肺癌病人 | X2 | ||||
例 数 | % | 例 数 | % | |||
开始吸烟年龄 | 20岁以下 | 541 | 78.6 | 488 | 75.1 | X2=2.40
n=2 0.3<P<0.05 |
20~ | 118 | 17.2 | 129 | 19.8 | ||
30~ | 17 | 4.2 | 22 | 5.1 | ||
40~ | 12 | 11 | ||||
合计 | 688 | 650 | ||||
吸烟年数 | 1~ | 14 | 18 | X2=4.65
n=2 0.05<P<0.10 | ||
10~ | 21 | 5.1 | 32 | 7.7 | ||
20~ | 351 | 51.0 | 338 | 52.0 | ||
40~ | 302 | 43.9 | 262 | 40.3 | ||
合计 | 688 | 650 | ||||
戒烟年数 | 0 | 649 | 94.3 | 590 | 90.8 | X2=8.59
n=2 0.01<P<0.02 |
1~ | 30 | 4.4 | 37 | 5.7 | ||
10~ | 4 | 1.3 | 14 | 3.5 | ||
20+ | 5 | 9 | ||||
合计 | 688 | 650 |
纸烟与烟斗
吸纸烟与吸烟斗的习惯在某些人不是截然分开的。两个习惯的均有人只好撇开不计。比较单纯吸烟斗或纸烟在两组间的差别,结果是这样的:在525个单吸纸烟的肺癌病人中5.7%是吸烟斗的,94.3%是吸纸烟的;在507个非肺癌病人中9.7%是吸烟斗的,90.3%是吸纸烟的。肺癌组吸纸烟的比重较低的机率是0.01<P<0.02,故不像出于偶然,可以推想到吸烟斗与肺癌的关系好象不甚密切。可能吸烟斗者所吸的烟草量较小。如果我们只分析吸烟斗者,将所吸的烟草量分成等级,则肺癌病人组吸大量烟草所占比重大于对照组。所以吸烟斗亦与肺癌有关,但其危险性较吸纸烟为轻,至于两者差别的程度如何尚不能定。
资料的理解
虽然从以上各表可以看出,吸烟与肺癌有直接关系似可无疑,但仍可考虑调查的资料有无其他解释。调查之肺癌病人的代表性是否不够,对照组的可比性是否不强?肺癌病人是否因病而过分的归咎于吸烟?调查员可能产生偏差否?这些问题都需要一一加以澄清。
我们没有理由怀疑说,所查的肺癌者不是一个有代表性的样本,实习表17-1里已说明肺癌组与对照组在性别、年龄及经济上完全是均衡的,只是来自距市中心较远的人在肺癌组较多。或有人认为住在偏远地区的人吸烟量较少,但这不足以认为那里的肺癌患者吸烟也少。如果我们暂将这一类的人撇开不计,只比较住在市区的人,结果仍与前一样(实习表17-8)。
实习表17-8
吸烟人数 | |||||
0 | 1支~ | 5支~ | 15支~ | 25支~ | |
肺癌病人(98) | 2 | 12 | 36 | 27 | 21 |
非肺癌病人(98) | 9 | 6 | 50 | 19 | 11 |
X2=11.68 n=4 0.01<P<0.02
也许有人认为对照组的选择方法使得吸烟较少的人被选到因而造成上面的结论,但这是不可能,因为我们没有证据说,从各科选出的病人一定是吸烟较少的,当然我们也不能说他们是吸烟较多的。
实习表17-9是五种疾病的患者不同烟量的吸烟人数与理论分布数的比较结果,并没有患那一种病的患者吸烟的比例特别低或特别高。
另一个要澄清的问题是,是否调查员有偏见,选择吸烟较少的人为对照?我们难以想象她们是如何来实现这种偏见的。我们可以间接地测验一下她们是否如此。我们把她们选择的病人和医院通知她们调查的人(非肺癌病人)的吸烟习惯比较一下(实习表17-10)。结果不能证明她们专选吸烟较少的病人为调查对象。
实习表17-9
病例分组 | 吸烟的人数 | |||||
0 | 1支~ | 5支~ | 15支~ | 25支+ | 合计 | |
肺外的癌症 | 236
(220.0) | 78
(85.3) | 247
(236.9) | 100
(122.8) | 57
(53.0) | 718
718 |
非肺癌的呼吸道病 | 42
(47.0) | 33
(29.7) | 128
(136.1) | 98
(84.1) | 34
(38.1) | 335
335 |
心血管病 | 22
(17.7) | 19
(16.7) | 64
(73.8) | 38
(39.5) | 23
(18.3) | 166
166 |
胃肠病 | 39
(55.7) | 31
(32.3) | 143
(130.2) | 81
(75.8) | 34
(34.5) | 328
328 |
其他病 | 38
(36.6) | 24
(21.1) | 91
(86.0) | 44
(84.9) | 18
(22.1) | 215
215 |
X2=20.14 n=16 0.20<P<0.80 |
实习表17-10
选择方法分组 | 吸烟人数 | |||||
0 | 1支~ | 5支~ | 15支~ | 25支+ | 合计 | |
根据医院通知而调查的 | 306
(301.8) | 114
(119.0) | 354
(345.2) | 179
(186.1) | 79
(80.0) | 1032
1032 |
调查员选择的对照 | 70
(75.2) | 71
(66.0) | 309
(317.8) | 192
(184.9) | 88
(86.0) | 730
730 |
X2=2.14 n=4 0.70<P<0.80 |
括号内数字是理论分布数
肺癌患者也许会特别强调吸烟的害处,但他们在调查时往往是不知道诊断的,如果说,他们知道毛病在呼吸道。因而可能容易归咎于吸烟。但经调查表明,患呼吸道病有人吸烟史并不与患别的病人组有何显著不同。所以我们不能说肺癌组吸烟史的特殊是由于他们主观强调所致。
调查员在调查肺癌患者时是知道疾病的诊断的,能否因此而夸大患者的吸烟习惯呢?这一点已经得到了否定,在调查时调查员所知道有些病人的诊断是肺癌,但以后诊断改变了。这些人的吸烟习惯可以和真的肺癌病人相比,又可和其他病人相比。比较的结果见实习表17-11和实习表17-12。
从实习表17-11和实习表17-12所示的比较结果可以看到,调查时被误认为肺癌的病人吸烟习惯确与真的肺癌病人不同(实习表17-11)。而与其他疾病的患者不相上下(实习表17-12)。
这样看来,肺癌组病人和对照组的吸烟习惯之不同不可能由于调查者的偏差所造成。
实习表17-11
吸烟人数 | ||||||
0 | 1支~ | 5支~ | 15支~ | 25支+ | 合计 | |
肺癌病人 | 21
(31.7 | 40
(48.0) | 269
(276.0) | 205
(201.0) | 174
(152.7) | 709
709 |
被误认为肺癌病人 | 35
(24.3) | 25
(17.0) | 83
(76.0) | 50
(54.0) | 16
(37.3) | 209
209 |
X2=29.76 n=4 P<0.01 |
括号内数字为理论分布数
实习表17-12
吸烟人数 | ||||||
0 | 1支~ | 5支~ | 15支~ | 25支+ | 合计 | |
被误认为肺癌病人 | 35
(36.8) | 25
(20.4) | 83
(82.0) | 50
(48.8) | 16
(20.8) | 209
209 |
其他疾病患者(非肺癌) | 342
(340.2) | 160
(164.6) | 580
(581.0) | 321
(322.2) | 150
(145.2) | 1553
1553 |
X2=2.58 n=4 0.50<P<0.70 |
括号内数字是理论分布数
讨论
肺癌与吸烟确有关系,但这不等于说吸烟是肺癌的成因。也许有人辩论说:“肺癌的生成可能使人吸烟,也可能说肺癌和吸烟有一共同原因,而二者都是其果”,当然这些说法都是很容易驳倒的。吸烟习惯总是在发病以前形成的,故不能说习惯是所患疾病造成的;我们也不能想象,有一个共同原因先造成吸烟后又造成肿瘤(20~50年以后)。因此,我们的结论吸烟是造成肺癌的一个因素,一个重要因素。
吸烟的作用是随着吸的量而不同。吸量愈大,危险亦愈大。
本世纪以来,在许多国家烟草的消耗量和肺癌死亡率都在增加,后者的增加趋势尤大于烟草消耗量的增加。这种现象的部分解释是诊断方法的改进。在另一方面,近年来在烟草的培育和加工中可能引进了致癌物质。
男子死于肺癌者多于女子。这自然使人想到其原因之一为吸烟。因男子吸烟者多于女子。如果这一说法成立的话,不吸烟的男女的肺癌死亡率应该相同。在本调查研究中,649名男子患者中有2名为非吸烟者;60名女病人中有19名不吸烟。如果要计算不吸烟者的发病率,就需要估计不吸烟的人口。由于没有这项统计资料,只好通过间接方法来估计,结果不吸烟的男女肺癌的发病率是相等的。
最后著者联想到,本世纪砷杀虫剂在农业上应用可能是烟草增加致癌物质的一个因素。提请读者注意并考虑。
练习题
1.试拟出你所用的调查表;
2.讨论学习本文献的心得。
资料来源:上海医科大学流行病学教研室提供