资讯安全论坛下载读书程序开发数据库系统网络电子书微信学院站长学院 QQ 考试

频道栏目

其他综合| 安全资讯| 安全公告| 病毒预警| 人物| 企业招聘| 其他综合|

首页 > 资讯 > 其他综合 > 正文

NLP之词复杂度

16-11-29 来源：[db:作者]

收藏我要投稿

在信息论中，perplexity（复杂度）是用来评价一个语言模型预测一个样本是否很好的标准。它可以用来对比语言模型的性能。复杂度越低，代表模型的预测性能越好。

概率分布的复杂度
x为随机变量，p(x)为x的分布，x的复杂度定义为：

概率模型的复杂度
给定一个概率模型q, 用它来预测独立的样本x1,x2,…, xN。如果模型很好，那么它会给样本分配较高的概率q(xi)。模型的复杂度定义为：

单词的复杂度
在自然语言处理中，复杂度用来评估语言模型。根据句子的复杂度的定义，比如，平均一个句子xi 在测试样本中可以使用190个比特数来编码，呢么总共有

个不停的句子。然而，更普遍的是将句子的长度归一化，只考虑每个单词的比特数。因此，如果一个测试样本的句子里包含1000个单词，并且可以使用7.95个比特数的单词量表示，也就是说这个墨子那个的复杂度是

=247。
复杂度最低的模型已经发表在，每个单词的复杂度为247，或者说每个字母的比特数为1.75比特。

点击复制链接与好友分享!回本站首页

相关TAG标签

上一篇：使用hadoop读写mysql

下一篇：Storm读取Mysql数据库不能加大bolt并行数写入hdfs解决方法

相关文章

热门专题推荐 vmware win7激活工具 win10激活工具 excel word office激活小马激活工具重装系统数据恢复 u盘启动工具

图文推荐

文章

推荐

· 不掉线的路由器！路由特殊技术分析！

· 如何通过路由器来控制上网

· 宽带路由器故障巧排除

· 关于忘记Cisco交换机路由器口令后如何

· 远程管理路由器注意“安全”

· 路由器端口映射的原理及设置方法介绍

· 教你用路由器日志快速定位及排除故障

· 教你设置无线路由提高无线网BT下载速

· win7激活工具

· win10激活工具

· win7激活工具旗舰版

· office2010激活密钥

· windows7激活密钥

· office2010激活工具

· 小马激活工具

· win10激活工具

热门新闻

· 锤子坚果Pro发布后，罗永浩哭了

· 想实习的大学党看过来!这些科技巨头最

· 罗永浩锤子发布会抢先消息：锤子科技新

· Google新一代系统Fuchsia OS界面曝光

· 中国唯一连续运营20余年的网络游戏，还

· iPhone都便宜了为何国产手机越来越贵

· 丢人！谷歌和Facebook竟被虚假企业电邮

· 中国移动支付震惊日本网友为什么美国

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站