学生抑郁与生活方式数据集(10 万条数据)

📋 数据集概述

心理健康是学术领域日益关注的问题。本数据集模拟了一项针对 10 万名大学生的大规模调查,重点关注他们的生活习惯、学业表现和心理健康状况。

该数据集旨在为探索性数据分析(EDA)、分类和回归任务提供丰富的资源。它使研究人员和数据科学爱好者能够调查睡眠模式、学习习惯和社交媒体使用如何与学业成功(CGPA)和心理健康问题(抑郁和压力)相关联。

📊 数据规模

  • • 样本数量: 100,000 条记录
  • • 特征数量: 11 个字段
  • • 数据完整性: 无缺失值
  • • 数据类型: 结构化表格数据
  • • 适用领域: 心理健康、教育研究、数据科学

🔍 数据字段说明

本数据集包含以下字段:

基本信息字段

字段名 数据类型 说明
Student_ID 整数 学生唯一标识符
Age 整数 学生年龄(18-24 岁)
Gender 分类变量 性别(Male/Female)
Department 分类变量 所属学院/专业领域

学业表现字段

字段名 数据类型 说明
CGPA 浮点数 累积平均绩点(范围通常为 0-4.0)
Study_Hours 浮点数 每日学习时间(小时)

生活方式字段

字段名 数据类型 说明
Sleep_Duration 浮点数 每日睡眠时长(小时)
Social_Media_Hours 浮点数 每日社交媒体使用时长(小时)

心理健康字段

字段名 数据类型 说明
Physical_Activity 整数 每周身体活动时长(分钟)
Stress_Level 整数 自我报告的压力水平(0-10 分量表)
Depression 布尔值 心理健康状态(True = 可能抑郁,False = 健康)

专业类别(Department)

数据集中可能包含的专业方向:

  • • Science - 科学类
  • • Engineering - 工程类
  • • Medical - 医学类
  • • Arts - 艺术类
  • • Business - 商科

💡 潜在应用场景

本数据集用途广泛,可用于各种机器学习项目:

🔹 二元分类

预测学生是否可能患有抑郁症(Depression 列),基于其生活方式和压力水平。

🔹 回归分析

根据学习时间和睡眠习惯预测学生的 CGPA。

🔹 聚类分析

根据学生的习惯将他们分为不同的群体(例如"高成就者"、"高风险学生")。

🔹 数据可视化

分析社交媒体使用与压力水平之间的相关性。

🔹 其他应用

  • • 探索睡眠质量与学业表现的关系
  • • 研究身体活动对心理健康的影响
  • • 识别需要心理干预的高风险学生群体
  • • 为高校心理健康服务提供数据驱动的决策依据

⚙️ 数据生成方法

这是一个通过编程生成的合成数据集,旨在反映学术研究中发现的真实世界趋势和相关性。

相关性逻辑

数据生成过程包含加权逻辑,其中低睡眠时长和高社交媒体使用等因素会增加高压力和低 CGPA 的概率。

数据规模优势

拥有 100,000 条记录,本数据集适合测试性能密集型算法(例如深度学习/神经网络)。

🔧 使用建议

数据加载示例(Python)

import pandas as pd

# 读取数据集
df = pd.read_csv('student_depression_lifestyle.csv')

# 查看基本信息
print(df.info())
print(df.describe())

# 检查缺失值
print(df.isnull().sum())

注意事项

  1. 1. 数据隐私: 使用本数据时请遵守相关隐私保护法规
  2. 2. 研究伦理: 涉及心理健康数据的研究报告需遵循学术伦理规范
  3. 3. 引用说明: 在研究成果中应适当引用本数据集来源
  4. 4. 数据局限性: 注意数据的采样方法和潜在偏差

📚 相关研究领域的关键词

  • • 大学生心理健康
  • • 抑郁症筛查
  • • 生活方式医学
  • • 健康行为学
  • • 心理社会因素
  • • 压力管理
  • • 心理健康干预

csv实例截图:

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐