香农熵计算器
计算任意文本字符串的香农熵和信息内容。
如何使用香农熵计算器
- 在输入字段中键入或粘贴任何文本。
- 单击计算 — 显示每个符号的熵(以位为单位)、总信息(以位为单位)、最大熵和冗余。
- 查看字符频率表,查看每个符号的概率和个体信息内容。
- 比较不同文本的熵值以了解它们的相对随机性和可压缩性。
快速参考
| 从 | 到 |
|---|---|
| aaaaaaa(7 个相同的字符) | 0.000 位/符号 |
| ababababab(2 个字符) | 1.000 位/符号 |
| abcdefgh(8 个唯一字符) | 3.000 位/符号 |
| 英文文本(典型) | ~4.0–4.5 位/符号 |
| 随机 ASCII(95 个字符) | ~6.57 位/符号 |
| 随机字节(256 个值) | 8.000 位/符号 |
使用场景
- •在应用无损压缩算法之前估计文本的可压缩性。
- •分析密码、密钥或加密数据的随机性。
- •学习计算机科学和通信课程中的信息论概念。
- •比较不同语言或写作风格的信息密度。
公式
香农熵 H 的计算公式为 H = −Σ p(x) · log2(p(x)),其中 p(x) 是字符串中每个唯一符号 x 的概率。
常见问题
什么是香农熵?
香农熵,由克劳德香农于 1948 年提出,测量数据源中的平均信息量(或不确定性)。
每个符号位数的熵是什么意思?
每个符号位数的熵告诉您如果对字符串进行最佳编码,平均需要多少位来表示每个字符。
熵背景下的冗余是什么?
冗余衡量原始编码与理论最小值相比多使用了多少空间。