参数学习——糖果问题(人工智能期末复习)

2023-12-13 23:54:31

之前看了好久都不知道这题咋写,后来看了这篇机器智能-高频问题:糖果问题,大概看明白了,其实主要围绕着这两个公式
在这里插入图片描述
光看公式也看不懂,还是要结合题目来

己知有草莓味和酸橙味两种类型的糖果,分别放入5种不同的包装之中,
h1包装中100%是草莓味
h2包装中75%是草莓味25%是酸橙味
h3包装中50%是草莓味50%是酸橙味
h4包装中25%是草莓味75%是酸橙味
h5包装中100%是酸橙味
假定h1,h2… h5的先验分布概率为<0.1,0.2,0.4,0.2,0.1>,每次拿出糖果是相互独立的且不影响袋子里面糖果的比例,试回答下列问题:
(1)假定拿出的2个糖果都是草莓味,请分别计算每拿出一个糖果后h1到h5的概率值;
(2)在(1)的基础上计算下个糖果为草莓味,酸橙味的概率。

解:
(1)

  • 拿出的第一个是草莓味
    分别计算拿出的第一个是草莓味(d)的前提下从hi包装拿出的概率
    P(h1|d) = 0.1×1×a=0.1a
    P(h2|d) = 0.2×0.75×a=0.15a
    P(h3|d) = 0.4×0.5×a=0.2a
    P(h4|d) = 0.2×0.25×a=0.05a
    P(h5|d) = 0.1×0×a=0
    进行归一化:0.1a+0.15a+0.2a+0.05a+0=1 → a=2
    因此
    P(h1|d) = 0.1×1×a=0.2
    P(h2|d) = 0.2×0.75×a=0.3
    P(h3|d) = 0.4×0.5×a=0.4
    P(h4|d) = 0.2×0.25×a=0.1
    P(h5|d) = 0.1×0×a=0
  • 拿出的第二个还是草莓味
    P(h1|d) = 0.1×1×1×a=0.1a
    P(h2|d) = 0.2×0.75×0.75×a=0.1125a
    P(h3|d) = 0.4×0.5×0.5×a=0.1a
    P(h4|d) = 0.2×0.25×0.25×a=0.0125a
    P(h5|d) = 0.1×0×0×a=0
    进行归一化:0.1a+0.1125a+0.1a+0.0125a+0=1 → a=40/13
    所以
    P(h1|d) = 0.1×1×1×a=0.3
    P(h2|d) = 0.2×0.75×0.75×a=0.346
    P(h3|d) = 0.4×0.5×0.5×a=0.3
    P(h4|d) = 0.2×0.25×0.25×a=0.038
    P(h5|d) = 0.1×0×0×a=0

(2)在第一题的基础上我们已经计算出了拿的包装是hi的概率,这一问就利用P(hi|d)来预测下一个糖的概率
在已知拿出了前两个都是草莓味(d)的前提下,预测下一个糖是草莓味(X)的概率
P(X|d) = ∑P(X|hi)P(hi|d) = 1×0.3+0.75×0.346+0.5×0.3+0.25×0.038+0 = 0.719

在已知拿出了前两个都是草莓味(d)的前提下,预测下一个糖是酸橙味(Y)的概率
P(Y|d) = ∑P(Y|hi)P(hi|d) = 0+0.25×0.346+0.5×0.3+0.75×0.038+0 = 0.265


再换一题试试看

已知有5种包含的糖果:
h1:草莓味100%
h2:草莓味80%、酸橙味20%
h3:草莓味50%、酸橙味50%
h4:草莓味20%、酸橙80%
h5:酸橙味100%
5种包装的先验概率分别是10%、20%、30%、10%、30%
假定依次从袋子里拿出3个糖果分别是草莓味、酸橙味、酸橙味包装内的糖果数量是无穷多的,回答下列问题
1)分别计算该袋子为h1到h5的概率;
2)下一个糖果是草莓味和酸橙味的概率

(1)

  • 拿出的第一个是草莓味
    P(h1|d) = 0.1×1×a=0.1a
    P(h2|d) = 0.2×0.8×a=0.16a
    P(h3|d) = 0.3×0.5×a=0.15a
    P(h4|d) = 0.1×0.2×a=0.02a
    P(h5|d) = 0.3×0×a=0
    进行归一化:0.1a+0.16a+0.15a+0.02a+0=1 → a=100/43
    因此
    P(h1|d) = 0.1×1×a=0.23
    P(h2|d) = 0.2×0.8×a=0.37
    P(h3|d) = 0.3×0.5×a=0.35
    P(h4|d) = 0.1×0.2×a=0.05
    P(h5|d) = 0.3×0×a=0
  • 拿出的第二个是酸橙味
    P(h1|d) = 0.1×1×0×a=0
    P(h2|d) = 0.2×0.8×0.2×a=0.032a
    P(h3|d) = 0.3×0.5×0.5×a=0.075a
    P(h4|d) = 0.1×0.2×0.8×a=0.016a
    P(h5|d) = 0.3×0×1×a=0
    进行归一化:0+0.032a+0.075a+0.016a+0=1 → a=1000/123
    所以
    P(h1|d) = 0.1×1×0×a=0
    P(h2|d) = 0.2×0.8×0.2×a=0.26
    P(h3|d) = 0.3×0.5×0.5×a=0.61
    P(h4|d) = 0.1×0.2×0.8×a=0.13
    P(h5|d) = 0.3×0×1×a=0
  • 拿出的第三个还是酸橙味
    P(h1|d) = 0.1×1×0×0×a=0
    P(h2|d) = 0.2×0.8×0.2×0.2×a=0.0064a
    P(h3|d) = 0.3×0.5×0.5×0.5×a=0.0375a
    P(h4|d) = 0.1×0.2×0.8×0.8×a=0.0128a
    P(h5|d) = 0.3×0×1×1×a=0
    进行归一化:0+0.0064a+0.0375a+0.0128a+0=1 → a=10000/567
    所以
    P(h1|d) = 0.1×1×0×0×a=0
    P(h2|d) = 0.2×0.8×0.2×0.2×a=0.11
    P(h3|d) = 0.3×0.5×0.5×0.5×a=0.66
    P(h4|d) = 0.1×0.2×0.8×0.8×a=0.23
    P(h5|d) = 0.3×0×1×1×a=0

(2)

下一个糖是草莓味(X)的概率
P(X|d) = ∑P(X|hi)P(hi|d) = 0.8×0.11+0.5×0.66+0.2×0.23 = 0.464

下一个糖是酸橙味(Y)的概率
P(Y|d) = ∑P(Y|hi)P(hi|d) = 0.2×0.11+0.5×0.66+0.8×0.23 = 0.536

文章来源:https://blog.csdn.net/m0_69782322/article/details/134982906
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。