随机数
随机数
随机数在不同的范畴有着不同的定义, 其分为密码学范畴的随机数和密码学外的随机数.
密码学范畴的随机数
根据密码学原理, 随机数的随机性检验分为三个标准
- 统计学伪随机性. 统计学伪随机性指的是在给定的随机比特流样本中, 1的数量大致等于0的数量, 同理, “10” “01” “00” “11” 四者数量大致相等. 类似的标准被称为统计学随机性. 满足这类要求的数字在人类 “一眼看上去” 是随机的.
密码学安全伪随机性. 其定义为, 给定随机样本的一部分和随机算法, 不能有效的演算出随机样本的剩余部分.
真随机性. 其定义为随机样本不可重现. 实际上衹要给定边界条件, 真随机数并不存在, 可是如果产生一个真随机数样本的边界条件十分复杂且难以捕捉(比如计算机当地的本底辐射波动值), 可以认为用这个方法演算出来了真随机数. 但实际上, 这也只是非常接近真随机数的伪随机数, 一般认为, 无论是本地辐射、物理噪音、抛硬币……等都是可被观察了解的, 任何基于经典力学产生的随机数, 都只是伪随机数.
相应的, 随机数也分为三类
- 伪随机数: 满足第一个条件的随机数.
- 密码学安全的伪随机数: 同时满足前两个条件的随机数. 可以通过密码学安全伪随机数生成器计算得出.
- 真随机数: 同时满足三个条件的随机数.
密码学外的随机数
随机数是专门的随机试验的结果.
在统计学的不同技术中需要使用随机数, 比如在从统计总体中抽取有代表性的样本的时候, 或者在将实验动物分配到不同的试验组的过程中, 或者在进行蒙特卡罗模拟法计算的时候等等.
产生随机数有多种不同的方法. 这些方法被称为随机数生成器. 随机数最重要的特性是它在产生时后面的那个数与前面的那个数毫无关系.
真正的随机数是使用物理现象产生的: 比如掷钱币、骰子、转轮、使用电子组件的噪音、核裂变等等. 这样的随机数生成器叫做物理性随机数生成器, 它们的缺点是技术要求比较高.
在实际应用中往往使用伪随机数就足够了. 这些数列是“似乎”随机的数, 实际上它们是通过一个固定的、可以重复的计算方法产生的. 它们不真正地随机, 因为它们实际上是可以计算出来的, 但是它们具有类似于随机数的统计特征. 这样的生成器叫做伪随机数生成器.
Python中的(伪)随机数
python中常用的随机数的包有 random
, np.random
, 其生成随机数的原理均为梅森旋转算法(Mersenne twister). 梅森旋转算法(Mersenne twister)是一个伪随机数发生算法. 由松本真和西村拓士[1]在1997年开发, 基于有限二进制字段上的矩阵线性递归$F_2$, 可以快速产生高质量的伪随机数.
在调用random包生成随机数时, 都会默认产生一个随机数种子seed, 如果指定该seed, 那么每次生成的随机数将一致.
1 | import random |
在进行一些复杂的需要产生随机数的试验时, 初始化一个特定的种子, 那么每次运行程序得到的结果是一致的.
[1]Makoto Matsumoto, Takuji Nishimura. Mersenne twister: a 623-dimensionally equidistributed uniform pseudo-random number generator. ACM Transactions on Modeling and Computer Simulation (TOMACS). 1998-01-01, 8 (1): 3–30