跳转至

这是本人在知乎的回答

通过简体汉字随机组合产生我国现有的某一本书的全部内容的概率大约是多少,怎么去计算?#

【回答】

有趣的问题。我尝试用我25年前的高中数学知识来研究一下。请各位指正。

你说的“简体字”是没有固定范围/数字的,没法算. 现在有更确切的概念叫“通用规范汉字”,共8105字,这个可以算. 暂时不考虑标点符号,阿拉伯数字,外文字母,表情符号,分段符号,空格,如此等等.

如果这本书只有1个字,而且确实是“通用规范汉字”(实际上现在很多书用字超出这个范围)。使用“通用规范汉字”随机生成一本“一字书”,正好跟这本书相同的几率是:1/8105. 如果这本书是2个字。那么几率是8105^2分之一(每个字的位置上都有8105种可能),计算器告诉我,这是65,691,025分之一. 如果这本书是10万字(这还算比较薄),那么几率是8,105^100,000分之一,这是多少呢???再次打开计算器——

计算器无法计算.gif

超过了win10计算器的预设能力。用Python来算——

python计算.gif

注意后面那三个省略号,说明超出了编辑行打印预设能力。实际上,如果打印到文件中,是一个390876位的大数——

打印到文件.png

文字作品的复杂性,抄袭而用“巧合”来强辩无法服众,道理就在这里。

我数学一般般,不知道算得对不对。