python生成随机数总结_pyhton 根据均值和标准差生成一定范围的随机数

生成随机数和随机数操作

Python有自己专门处理随机数的功能，但大家最常用的还是numpy库里的生成随机数功能，因为Python 的 random 没有考虑数组类型的高效数据结构，所以在 array 类型的数据结构时，大家更喜欢直接用 Numpy 来生成，且它的功能更丰富，有各种随机数的生成方式，随机化当前数列，加速等。
Python自带random

import random
print(random.random()) # 随机生成一个0-1之间的随机数，例如0.7679099295136553
print(random.randint(1, 10)) # 随机生成一个1-10之间的整数，如3
numpy库的random
 
import numpy as np
1. np.random.random_integers
 
numpy.random.random_integers(low, high=None, size=None)
返回随机整数，范围区间为[low,high]，包含low和high
参数：low为最小值，high为最大值，size为数组维度大小
high没有填写时，默认生成随机数的范围是[1，low]
 该函数在最新的numpy版本中已被替代，建议使用randint函数 
>>> np.random.random_integers(1,size=5)
array([1, 1, 1, 1, 1])
2. np.random.rand() 或 np.random.random()
 
# 功能一样，写法有点区别
np.random.rand(d0,d1,…,dn)
np.random.random([d0,d1,…,dn])
rand函数根据给定维度，生成[0,1)之间的数据，包含0，不包含1
dn：生成维度
返回值为指定维度的array 
>>> np.random.rand(4,2)
array([[ 0.02173903,  0.44376568],
       [ 0.25309942,  0.85259262],
       [ 0.56465709,  0.95135013],
       [ 0.14145746,  0.55389458]])
>>> np.random.rand(4,3,2) # shape: 4*3*2
array([[[ 0.08256277,  0.11408276],
        [ 0.11182496,  0.51452019],
        [ 0.09731856,  0.18279204]],
       [[ 0.74637005,  0.76065562],
        [ 0.32060311,  0.69410458],
        [ 0.28890543,  0.68532579]],
       [[ 0.72110169,  0.52517524],
        [ 0.32876607,  0.66632414],
        [ 0.45762399,  0.49176764]],
       [[ 0.73886671,  0.81877121],
        [ 0.03984658,  0.99454548],
        [ 0.18205926,  0.99637823]]])
3. np.random.randn()
 
numpy.random.randn(d0,d1,…,dn)
randn函数返回一个或一组样本，具有标准正态分布
 （u分布，0为均值、1为标准差的正态分布，记为N（0，1））。
dn：维度
返回值为指定维度的array 
>>> np.random.randn() # 当没有参数时，返回单个数据
-1.1241580894939212
>>> np.random.randn(2,4)
array([[ 0.27795239, -2.57882503,  0.3817649 ,  1.42367345],
       [-1.16724625, -0.22408299,  0.63006614, -0.41714538]])
>>> np.random.randn(4,3,2)
array([[[ 1.27820764,  0.92479163],
        [-0.15151257,  1.3428253 ],
        [-1.30948998,  0.15493686]],
       [[-1.49645411, -0.27724089],
        [ 0.71590275,  0.81377671],
        [-0.71833341,  1.61637676]],
       [[ 0.52486563, -1.7345101 ],
        [ 1.24456943, -0.10902915],
        [ 1.27292735, -0.00926068]],
       [[ 0.88303   ,  0.46116413],
        [ 0.13305507,  2.44968809],
        [-0.73132153, -0.88586716]]])
上面生成的都是小数，下面生成整数 
4. np.random.randint()
 
numpy.random.randint(low, high=None, size=None, dtype='l')
函数作用：返回一个随机整型数或随机数数组，范围从低（闭）到高（开），即[low, high)。
 如果没有写参数high的值，则返回[0,low)的值。 
参数如下： 
low: int
 生成的数值最低要大于等于low。
 （hign = None时，生成的数值要在[0, low)区间内）
high: int (可选)
 如果使用这个值，则生成的数值在[low, high)区间。
size: int or tuple of ints(可选)
 输出随机数的尺寸，比如size = (m * n* k)则输出同规模即m * n* k个随机数。默认是None的，仅仅返回满足要求的单一随机数。
dtype: dtype(可选)：
 想要输出的格式。如int64、int等等 
注：范围不对有可能报错 ValueError: low >= high 
>>>




    
 np.random.randint(2, size=10)
array([1, 0, 0, 0, 1, 1, 0, 0, 1, 0])
>>>np.random.randint(2, high=10, size=(2,3))
array([[6, 8, 7],
       [2, 5, 2]])
5. np.random.choice()
 
numpy.random.choice(a, size=None, replace=True, p=None)
从给定的一维数组中生成随机数
参数： a为一维数组类似数据或整数；size为数组维度；p为数组中的数据出现的概率|权重
a为整数时，对应的一维数组为np.arange(a) 
>>> np.random.choice(5,3)
array([4, 1, 4])
>>> np.random.choice(5, 3, replace=False)
# 当replace为False时，生成的随机数不能有重复的数值（放不放回）
array([0, 3, 1])
>>> np.random.choice(5,size=(3,2))
array([[1, 0],
       [4, 2],
       [3, 3]])
>>> demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
>>> np.random.choice(demo_list,size=(3,3))
array([['moto', 'iphone', 'xiaomi'],
       ['lenovo', 'xiaomi', 'xiaomi'],
       ['xiaomi', 'lenovo', 'iphone']],
      dtype='<U7')
参数p的长度与参数a的长度需要一致；
参数p为概率，p里的数据之和应为1. 
>>> demo_list = ['lenovo', 'sansumg','moto','xiaomi', 'iphone']
>>> np.random.choice(demo_list,size=(3,3), p=[0.1,0.6,0.1,0.1,0.1])
array([['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'sansumg', 'sansumg'],
       ['sansumg', 'xiaomi', 'iphone']],
      dtype='<U7')
6. np.random.seed()
 
np.random.seed()的作用：使得随机数据可预测。
当我们设置相同的seed，每次生成的随机数相同。如果不设置seed，则每次会生成不同的随机数
当我们把种子seed固定的时候（用一个数字），同一个种子（数字）产生的随机序列就会一样。 
>>> np.random.seed(0)
>>> np.random.rand(5)
array([ 0.5488135 ,  0.71518937,  0.60276338,  0.54488318,  0.4236548 ])
>>> np.random.seed(1676)
>>> np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])
>>> np.random.seed(1676)
>>> np.random.rand(5)
array([ 0.39983389,  0.29426895,  0.89541728,  0.71807369,  0.3531823 ])    
7. 随机分布
 
我们在生成数据的时候，有时需要按照特定的统计学分布来生成，比如一个正态分布的抽样数据，或者均匀分布的数据抽样结果，又或者泊松分布等等，都可以用 Numpy 来实现。机器学习中比较常用的 正态分布 和 均匀分布。 
# (均值，方差，size)
print("正态分布：", np.random.normal(1, 0.2, 10))
# (最低，最高，size)
print("均匀分布：", np.random.uniform(-1, 1, 10))
8. 打乱功能
 
np.random.permutation(), 它实现的是 np.random.shuffle() 的一种特殊形式。可以说是一种简单处理特殊情况的功能。 它有两个方便之处，1. 直接生成乱序的序列号，2. 对数据乱序。
 相比 np.random.shuffle()，permutation 有一个好处，就是可以返回一个新数据，对原本的数据没有影响。而且还可以处理多维数据。 
np.random.permutation(10)) # 直接出10个乱序数
data = np.arange(12).reshape([6,2])
np.random.permutation(data)) # 将数据在第一维度上打乱
                    利用numpy模块的随机函数import numpy as np1. numpy.random.randint()numpy.random.randint(low, high=None, size=None, dtype='l')函数作用：返回一个随机整型数或随机数数组，范围从低（闭）到高（开），即[low, high)。如果没有写参数high的值，则返回[0,low)的值。参数如下：low: int生成的数值最低要大于等于low。（hign = None时，生成的数值要在[0, l
				使用python基础库random生成具备正态分布特征的随机数，并对生成的随机数的统计性质进行了计算。
经过多次实验，生成的随机数序列统计特征随着样本数量的增加逐渐逼近均值，在百万数量级的数据测试中，均值和方差都向下接近于设定参数。
import random
def randomTestCase(mu, sigma, loop=5000000):
    data = []
    for _ in range(loop):
        data.append(...
				在Python中，我们可以使用不同的方法来生成随机数。以下是几种常用的方法：
1. 使用random包生成随机数：Python的random包提供了生成随机数的功能。你可以使用random.random()函数来生成0到1之间的浮点数，或者使用random.randint(a, b)函数来生成a到b之间的整数。 例如，你可以使用random.random()来生成一个0到1之间的随机浮点数。
2. 使用numpy包生成随机数：numpy包是一个广泛使用的科学计算库，它提供了强大的随机数生成功能。你可以使用numpy.random模块中的不同函数来生成不同类型的随机数，包括均匀分布的随机数、正态分布的随机数等。 例如，你可以使用numpy.random.rand()函数来生成一个0到1之间的均匀分布的随机数。
3. 使用scipy包生成随机数：scipy包是一个用于科学计算和数据分析的Python库，它也提供了生成随机数的功能。你可以使用scipy.stats模块中的不同函数来生成不同分布的随机数，包括正态分布、指数分布、泊松分布等。 例如，你可以使用scipy.stats.norm.rvs()函数来生成一个符合正态分布的随机数。
总结起来，Python提供了多种生成随机数的方法，包括使用random包、numpy包和scipy包。你可以根据自己的需求选择合适的方法来生成随机数。