学生抑郁与生活方式数据集(10 万条数据)
·
学生抑郁与生活方式数据集(10 万条数据)
📋 数据集概述
心理健康是学术领域日益关注的问题。本数据集模拟了一项针对 10 万名大学生的大规模调查,重点关注他们的生活习惯、学业表现和心理健康状况。
该数据集旨在为探索性数据分析(EDA)、分类和回归任务提供丰富的资源。它使研究人员和数据科学爱好者能够调查睡眠模式、学习习惯和社交媒体使用如何与学业成功(CGPA)和心理健康问题(抑郁和压力)相关联。
📊 数据规模
- • 样本数量: 100,000 条记录
- • 特征数量: 11 个字段
- • 数据完整性: 无缺失值
- • 数据类型: 结构化表格数据
- • 适用领域: 心理健康、教育研究、数据科学
🔍 数据字段说明
本数据集包含以下字段:
基本信息字段
| 字段名 | 数据类型 | 说明 |
Student_ID |
整数 | 学生唯一标识符 |
Age |
整数 | 学生年龄(18-24 岁) |
Gender |
分类变量 | 性别(Male/Female) |
Department |
分类变量 | 所属学院/专业领域 |
学业表现字段
| 字段名 | 数据类型 | 说明 |
CGPA |
浮点数 | 累积平均绩点(范围通常为 0-4.0) |
Study_Hours |
浮点数 | 每日学习时间(小时) |
生活方式字段
| 字段名 | 数据类型 | 说明 |
Sleep_Duration |
浮点数 | 每日睡眠时长(小时) |
Social_Media_Hours |
浮点数 | 每日社交媒体使用时长(小时) |
心理健康字段
| 字段名 | 数据类型 | 说明 |
Physical_Activity |
整数 | 每周身体活动时长(分钟) |
Stress_Level |
整数 | 自我报告的压力水平(0-10 分量表) |
Depression |
布尔值 | 心理健康状态(True = 可能抑郁,False = 健康) |
专业类别(Department)
数据集中可能包含的专业方向:
- • Science - 科学类
- • Engineering - 工程类
- • Medical - 医学类
- • Arts - 艺术类
- • Business - 商科
💡 潜在应用场景
本数据集用途广泛,可用于各种机器学习项目:
🔹 二元分类
预测学生是否可能患有抑郁症(Depression 列),基于其生活方式和压力水平。
🔹 回归分析
根据学习时间和睡眠习惯预测学生的 CGPA。
🔹 聚类分析
根据学生的习惯将他们分为不同的群体(例如"高成就者"、"高风险学生")。
🔹 数据可视化
分析社交媒体使用与压力水平之间的相关性。
🔹 其他应用
- • 探索睡眠质量与学业表现的关系
- • 研究身体活动对心理健康的影响
- • 识别需要心理干预的高风险学生群体
- • 为高校心理健康服务提供数据驱动的决策依据
⚙️ 数据生成方法
这是一个通过编程生成的合成数据集,旨在反映学术研究中发现的真实世界趋势和相关性。
相关性逻辑
数据生成过程包含加权逻辑,其中低睡眠时长和高社交媒体使用等因素会增加高压力和低 CGPA 的概率。
数据规模优势
拥有 100,000 条记录,本数据集适合测试性能密集型算法(例如深度学习/神经网络)。
🔧 使用建议
数据加载示例(Python)
import pandas as pd
# 读取数据集
df = pd.read_csv('student_depression_lifestyle.csv')
# 查看基本信息
print(df.info())
print(df.describe())
# 检查缺失值
print(df.isnull().sum())
注意事项
- 1. 数据隐私: 使用本数据时请遵守相关隐私保护法规
- 2. 研究伦理: 涉及心理健康数据的研究报告需遵循学术伦理规范
- 3. 引用说明: 在研究成果中应适当引用本数据集来源
- 4. 数据局限性: 注意数据的采样方法和潜在偏差
📚 相关研究领域的关键词
- • 大学生心理健康
- • 抑郁症筛查
- • 生活方式医学
- • 健康行为学
- • 心理社会因素
- • 压力管理
- • 心理健康干预
csv实例截图:

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)