自助法 (bootstrapping):以自助采样法为基础,对含有m个样本的数据集D, 每次随机从D中挑选一个样本,放入D’中,然后将样本放回D中,重复m次之后,得到了包含m个样本的数据集D’,将D’作为训练集,用数据集D中没有出现在训练集D’中的样本作为测试集。

代码如下:

from sklearn.datasets import load_iris
from sklearn.utils import resample 

iris = load_iris()
x = iris.data 
y = iris.target 

n_iterations = 1000

train_sizes = []
test_sizes = []

for _ in range(n_iterations):
    x_bootstrap, y_bootstrap = resample(x, y, replace=True)

    split_index = len(x_bootstrap) // 3
    x_test = x_bootstrap[:split_index]
    x_train = x_bootstrap[split_index:]

print(len(x_test))
print(len(x_train))

结果如下:

50
100

创作不易,点个赞支持一下咯~

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐