博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数学之美笔记(十四)
阅读量:7197 次
发布时间:2019-06-29

本文共 625 字,大约阅读时间需要 2 分钟。

  hot3.png


  1. 最大熵模型:

    在对一个随机事件的概率分布进行预测时,我们的预测应当满足所有已知条件,而对未知情况不作任何主观假设。在这种情况下,概率分布最均匀,预测的风险最小,信息熵最大的模型。

  2. 匈牙利著名数学家、信息论最高奖香农奖得主希萨证明,对任何一组不自相矛盾的信息,这个最大熵模型不仅存在,而且是唯一的。此外,它们都有同一个非常简单的形式——指数函数。

  3. 最大熵模型的训练

    假定我们搜索的排序需要考虑n种特征,{x1,x2,...,xn,},需要排序的网页是d,即使这些特征互相独立,对应的最大熵模型也应该是很长的:

    P(d | x1,x2,...xn)=(1 / Z(x1,x2,...,xn))eλ1(x1,d)+λ2(x2,d)+. . .+λn(xn,d)

    其中Z=Σeλ1(x1,d)+λ2(x2,d)+. . .+λn(xn,d

    这个模型里有许多参数需要通过模型的训练来获得。

    最原始的最大熵模型训练方法是通用迭代算法GIS(Generalized Iterative Scaling):

    1. 假定第0次迭代的初始模型为等概率的均匀分布。

    2. 用第N次迭代的模型来估算每种信息特征在训练数据中的分布。如果超过了实际的,就把相应的模型参数变小。否则,将它们变大。

    3. 重复步骤b直至收敛。


本文涉及到的人物及其著作:

达诺奇、拉特克里夫、达拉皮垂孪生兄弟

转载于:https://my.oschina.net/shou1156226/blog/384748

你可能感兴趣的文章
蓝屏死机”再见?Win10 正测试“绿屏”死机
查看>>
外媒称 Android 7.0 当中加入了指纹手势
查看>>
在 GitHub 上,女性提交的代码更可能被接受
查看>>
如何配置struts+hibernate,基本使用方法
查看>>
学JAVA必读!你没学好JAVA是因为?
查看>>
《OpenStack云计算实战手册(第2版)》一2.7 租户间共享镜像
查看>>
《数据驱动安全:数据安全分析、可视化和仪表盘》一1.3 以问题为中心
查看>>
《相关性准则——大数据时代的高效能之道》一一2.5 演变
查看>>
德软件开发者否认蓄意植入“心血”安全漏洞
查看>>
《Adobe After Effects CS6中文版经典教程》——导读
查看>>
熬夜并不值得程序员炫耀
查看>>
《思科数据中心I/O整合》一2.8 基于优先级的流量控制(PFC)
查看>>
Hadoop 这样业界顶级的大规模数据处理平台,均发现满足不了类似双十一这样全世界的剁手党蜂拥而至的热情...
查看>>
Kilim实现浅析(一)
查看>>
Maven入门指南(二)
查看>>
《万物互联》——2.9 从物联网中盈利
查看>>
《C语言接口与实现:创建可重用软件的技术》一导读
查看>>
Gartner最新发布:2017年十大战略技术趋势
查看>>
《21天学通C语言(第7版)》一2.4 小 结
查看>>
《实用软件架构:从系统环境到软件部署 》——1.2 小结
查看>>