深度学习分类类别不平衡_Keras中类不平衡多类分类器的损失函数

weixin_39586915

620人浏览 · 2020-12-22 11:15:19

weixin_39586915 · 2020-12-22 11:15:19 发布

我试图将深度学习应用到一个目标班(10万、500万、90万、30万)之间的高班级不平衡的多班级分类问题上。我想写一个自定义丢失函数。

这是我目前的型号:

model = Sequential()

model.add(LSTM(

units=10, # number of units returned by LSTM

return_sequences=True,

input_shape=(timestamps,nb_features),

dropout=0.2,

recurrent_dropout=0.2

)

model.add(TimeDistributed(Dense(1)))

model.add(Dropout(0.2))

model.add(Flatten())

model.add(Dense(units=nb_classes,

activation='softmax'))

model.compile(loss="categorical_crossentropy",

metrics = ['accuracy'],

optimizer='adadelta')

不幸的是,所有预测都属于1类!!!!模型总是预测任何输入为1…

感谢任何关于我如何解决这个任务的建议。

更新:

输入数据的尺寸:

94981 train sequences

29494 test sequences

X_train shape: (94981, 20, 18)

X_test shape: (29494, 20, 18)

y_train shape: (94981, 4)

y_test shape: (29494, 4)

基本上在列车数据中,我有94981个样本。每个样本包含一个20个时间戳的序列。共有18个功能。

目标等级(10K、500K、90K、30K)之间的不平衡就是一个例子。我在我的真实数据集中有相似的比例。

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

具身智能策略模型：Diffusion Policy、OpenVLA 与 π0

本文对比了三种机器人动作生成模型的核心原理与差异： DiffusionPolicy：通过加噪-去噪生成连续动作块，解决多峰分布问题，适合精细操作但语言理解能力较弱。 OpenVLA：将连续动作离散化为token，利用VLM理解图像和语言指令，自回归生成动作序列，但需量化可能损失连续性。 π0：结合VLM的语义理解与FlowMatching的连续动作生成，通过预测修正方向迭代优化动作块，兼具任务理解

DAMO开发者矩阵

MiniMax M3 新手快速上手指南

在开发智能应用时，很多开发者往往卡在“如何快速让代码跑通”这一步。面对复杂的文档和繁多的配置项，容易陷入细节而忽略了核心逻辑的验证。其实，接入一个大语言模型并没有想象中那么困难，关键在于理清从密钥获取到首次成功调用的最小路径。一旦打通了这个闭环，后续的上下文管理、流式输出等高级功能自然就能顺势展开。对于正在构建客服机器人、智能助手或数据分析工具的技术人员来说，掌握标准的 API 调用流程是必备技能

DAMO开发者矩阵

一文读懂STP协议：告别网络环路，守住局域网稳定底线

用通俗类比理解：城市道路中，闭环环线道路会造成车辆无限绕圈拥堵，而STP就是交通调度系统，在互通的闭环路网中，主动封禁多余岔路口，修剪出一条无闭环的树形通行路线，既保留道路冗余备用能力，又杜绝车辆无限循环绕行，从根源规避网络环路。MSTP多生成树协议，可联动VLAN协同工作，能分组管控不同网段环路，兼顾防环+网段隔离，大型园区、政企大楼组网必用。早期单线路组网结构简单、无环路风险，可一旦网线老化、