Rumah  >  Soal Jawab  >  teks badan

numpy - python如何随机且有放回地从训练集中的抽取N个训练样本

训练集数据类型为DataFrame,请问在numpy或者pandas中是否有现成的方法?即使用bootstrap抽样方法

df = pd.read_csv('D:\\waveform-+noise.csv', index_col = 0)
data = pd.DataFrame()
for i in range(0,5000):
    j = random.randint(1,5000)
    data = data.append(df.iloc[j-1:j,:],ignore_index=True)
x = data.iloc[0:5000, 0:39]
y = data.iloc[0:5000, 39:40]

自己写了一个,大概需要5秒,是否又更好的办法?训练集行数为5000

黄舟黄舟2742 hari yang lalu962

membalas semua(1)saya akan balas

  • 黄舟

    黄舟2017-04-18 09:31:00

    用 panda.DataFrame.sample

    df.sample(n=5000, replace=True)

    balas
    0
  • Batalbalas