1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 基于高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗

基于高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗

时间:2019-10-06 05:23:05

相关推荐

基于高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗

基于高考数学全国卷I概率题解题思路初步分析新冠病毒疫苗

1. 高考数学全国卷I概率题2. 卡方(χ2\chi^2χ2)检验原理回顾3. 解答高考数学全国卷I概率题4. 上海疫情分析5. 总结

1. 高考数学全国卷I概率题

    一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:

(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?

(2)从该地的人群中任选一人,A表示事件“选到的人卫生惯不够良好”?B表示事件“选到的人有该疾病”,P(B∣A)P(Bˉ∣A)\frac{P(B|A)}{P(\bar{B}|A)}P(Bˉ∣A)P(B∣A)​与P(B∣Aˉ)P(Bˉ∣Aˉ)\frac{P(B|\bar{A})}{P(\bar{B}|\bar{A})}P(Bˉ∣Aˉ)P(B∣Aˉ)​的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为RRR.

(I)证明: R=P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)R=\frac{P(A|B)}{P(\bar{A}|B)}·\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}R=P(Aˉ∣B)P(A∣B)​⋅P(A∣Bˉ)P(Aˉ∣Bˉ)​;

(II)利用该调查数据,给出P(A∣B)P(A|B)P(A∣B), P(A∣Bˉ)P(A|\bar{B})P(A∣Bˉ)的估计值,并利用(I)的结果给出RRR的估计值.

附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),附:K^2=\frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}, 附:K2=(a+b)(c+d)(a+c)(b+d)n(ad−bc)2​,

2. 卡方(χ2\chi^2χ2)检验原理回顾

    通过抽样统计得到如下数据:

    现在想知道是否患肺病与是否抽烟之间是否存在必然联系。

   首先我们假设没有必然联系,即不管是患肺病的群体,还是未患肺病的群体,抽烟者的比例都是一样,为33%。

    根据该假设,理论上的数值情况应该为下表:

    统计抽样的数值为实际频数,记为Ai,jA_{i,j}Ai,j​,理论数值记为Ti,jT_{i,j}Ti,j​,统计量χ2=∑(Ai,j−Ti,j)2Ti,j\chi^2=\sum\frac{(A_{i,j}-T_{i,j})^2}{T_{i,j}}χ2=∑Ti,j​(Ai,j​−Ti,j​)2​服从自由度为DF=(card(I)−1)(card(J)−1)DF=(card(I)-1)(card(J)-1)DF=(card(I)−1)(card(J)−1)的χ2\chi^2χ2分布,χ2\chi^2χ2值的大小衡量了理论值与实际频数的差异。

注解:i∈I={行序号}i\in I=\{行序号\}i∈I={行序号},j∈J={列序号}j\in J=\{列序号\}j∈J={列序号},card(X)表示集合中元素的个数

    根据χ2\chi^2χ2分布的临界χ2\chi^2χ2值表,可知道P(χ2>k)P(\chi^2>k)P(χ2>k)的概率值。

    一般PPP的临界值取小于0.05,对应的χ2\chi^2χ2值为3.84。

    根据以上分析,本假设的χ2=60.53\chi^2=60.53χ2=60.53,远远大于3.84,其P(χ2>60.53)P(\chi^2>60.53)P(χ2>60.53)的概率值非常小,所以可以认为假设不成立,即认为是否患肺病与是否抽烟存在关系。

    特别地,当card(I)=2card(I)=2card(I)=2,card(J)=2card(J)=2card(J)=2时,χ2\chi^2χ2的自由度DF=1DF=1DF=1,χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)\chi^2=\frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}χ2=(a+b)(c+d)(a+c)(b+d)n(ad−bc)2​,其中n=a+b+c+dn=a+b+c+dn=a+b+c+d, a,b,c,da,b,c,da,b,c,d为实际采样值,见下表。

3. 解答高考数学全国卷I概率题

解:

(1)设原命题不存在显著性差异。

K2=200(40∗90−60∗10)2(40+60)(10+90)(40+10)(60+90)=24.0>10.828K^2=\frac{200(40*90 - 60*10)^2}{(40+60)(10+90)(40+10)(60+90)}=24.0>10.828K2=(40+60)(10+90)(40+10)(60+90)200(40∗90−60∗10)2​=24.0>10.828

⇒\Rightarrow⇒原命题存在显著性差异。

(2)(I)∵P(A∣B)=P(AB)P(B),PB>0\because P(A|B)=\frac{P(AB)}{P(B)}, P{B}>0∵P(A∣B)=P(B)P(AB)​,PB>0

      ∴R=P(B∣A)P(Bˉ∣A)/P(B∣Aˉ)P(Bˉ∣Aˉ)\therefore R=\frac{P(B|A)}{P(\bar{B}|A)} /\frac{P(B|\bar{A})}{P(\bar{B}|\bar{A})}∴R=P(Bˉ∣A)P(B∣A)​/P(Bˉ∣Aˉ)P(B∣Aˉ)​

          =P(AB)P(A)P(ABˉ)P(A)⋅P(AˉBˉ)P(Aˉ)P(AˉB)P(Aˉ)=\frac{\frac{P(AB)}{P(A)}}{\frac{P(A\bar{B})}{P(A)}}\cdot\frac{\frac{P(\bar{A}\bar{B})}{P(\bar{A})}}{\frac{P(\bar{A}B)}{P(\bar{A})}}=P(A)P(ABˉ)​P(A)P(AB)​​⋅P(Aˉ)P(AˉB)​P(Aˉ)P(AˉBˉ)​​

          =P(AB)P(ABˉ)⋅P(AˉBˉ)P(AˉB)=\frac{P(AB)}{P(A\bar{B})}\cdot \frac{P(\bar{A}\bar{B})}{P(\bar{A}B)}=P(ABˉ)P(AB)​⋅P(AˉB)P(AˉBˉ)​

          =P(AB)P(AˉB)⋅P(AˉBˉ)P(ABˉ)=\frac{P(AB)}{P(\bar{A}B)}\cdot \frac{P(\bar{A}\bar{B})}{P(A\bar{B})}=P(AˉB)P(AB)​⋅P(ABˉ)P(AˉBˉ)​

          =P(AB)P(B)P(AˉB)P(B)⋅P(AˉBˉ)P(Bˉ)P(ABˉ)P(Bˉ)=\frac{\frac{P(AB)}{P(B)}}{\frac{P(\bar{A}B)}{P(B)}}\cdot \frac{\frac{P(\bar{A}\bar{B})}{P(\bar{B})}}{\frac{P(A\bar{B})}{P(\bar{B})}}=P(B)P(AˉB)​P(B)P(AB)​​⋅P(Bˉ)P(ABˉ)​P(Bˉ)P(AˉBˉ)​​

          =P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)=\frac{P(A|B)}{P(\bar{A}|B)}\cdot\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}=P(Aˉ∣B)P(A∣B)​⋅P(A∣Bˉ)P(Aˉ∣Bˉ)​

(II) P(A∣B)=4040+60=0.4P(A|B)=\frac{40}{40+60}=0.4P(A∣B)=40+6040​=0.4

  P(A∣Bˉ)=1010+90=0.1P(A|\bar{B})=\frac{10}{10+90}=0.1P(A∣Bˉ)=10+9010​=0.1

  R=P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)=0.41−0.4⋅1−0.10.1=6.0R=\frac{P(A|B)}{P(\bar{A}|B)}\cdot\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}=\frac{0.4}{1-0.4}\cdot\frac{1-0.1}{0.1}=6.0R=P(Aˉ∣B)P(A∣B)​⋅P(A∣Bˉ)P(Aˉ∣Bˉ)​=1−0.40.4​⋅0.11−0.1​=6.0

4. 上海疫情分析

    数据来源于Dynamic Disease Manifestations Among Non-Severe COVID-19

Patients Without Unstable Medical Conditions: A Follow-Up

Study — Shanghai Municipality, China, March 22–May 03,

   图B中,非风险组患者未接种或未全程接种疫苗的比例为约19.4%,全程接种或接种了加强针的比例为80.6%。乐观地估计,未感染新冠病毒的非风险人群全程接种或接种了加强针的比例为87.0%。按照高考数学全国卷I概率题解题思路,可以得知,全程接种或接种了加强针的非风险全体与未接种或部分接种疫苗的非风险群体的差异性。

(1) K2=200(19.4∗87.0−80.6∗13.0)2(19.4+80.6)(13.0+87.0)(19.4+13.0)(80.6+87.0)=1.509<3.841K^2=\frac{200(19.4*87.0 - 80.6*13.0)^2}{(19.4+80.6)(13.0+87.0)(19.4+13.0)(80.6+87.0)}=1.509<3.841K2=(19.4+80.6)(13.0+87.0)(19.4+13.0)(80.6+87.0)200(19.4∗87.0−80.6∗13.0)2​=1.509<3.841,差异性不显著。

(2) 未接种或未全程接种疫苗为事件A;感染新冠病毒为事件B;

R=P(A∣B)P(Aˉ∣B)⋅P(Aˉ∣Bˉ)P(A∣Bˉ)=0.1940.806⋅0.8700.130=1.6R=\frac{P(A|B)}{P(\bar{A}|B)}\cdot\frac{P(\bar{A}|\bar{B})}{P(A|\bar{B})}=\frac{0.194}{0.806}\cdot\frac{0.870}{0.130}=1.6R=P(Aˉ∣B)P(A∣B)​⋅P(A∣Bˉ)P(Aˉ∣Bˉ)​=0.8060.194​⋅0.1300.870​=1.6

即未接种疫苗或未全程接种疫苗的人感染新冠病毒的风险指标R=1.6R=1.6R=1.6

(3) 现有疫苗抗病毒能力下,未患病的非风险群体,全程接种或接种了加强针的人数比例、K2K^2K2, P(K2)P(K^2)P(K2), RRR如下表。

(4)生成上面表格数据的程序

from scipy.stats import chi2_contingencyimport numpy as npprint('|序号|未接种或未全程接种的比率(%)|全程接种或接种加强针的比率(%)|$K^2$|$P(K^2)$|$1-P(K^2)$|$R$|')print('|--|--|--|--|--|--|--|')for i in range(1, 14):h1 = 14 - idata = [[19.4, 80.6], [h1, 100 - h1]]df = pd.DataFrame(data, index=['低风险病例组', '低风险对照组'], columns=['未接种疫苗', '接种疫苗'])kt = chi2_contingency(df, correction=False)r = np.round(0.194 / 0.806 * (100-h1) / h1, 2)print(f'|{i}|{h1}|{100-h1}|{np.round(kt[0], 3)}|{np.round(kt[1], 3)}|{np.round(1-kt[1], 3)}|{r}|')

5. 总结

    现有新冠疫苗的抗病毒能力,若感染新冠病毒群体与未感染新冠病毒群体的疫苗接种情况有显著性(p<0.05p<0.05p<0.05),疫苗接种率需达到90.5%以上。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。