【数据集】全国上市公司财经新闻数据集(1994-2024年)
采用人工智能算法来采集、整理和分析上市公司财经新闻的大数据平台。数据来源涵盖近500家网络媒体和400多家报纸刊物,提供上市公司财经新闻基本信息、量化统计信息以及新闻相似度分析等。
一、上市公司财经新闻库数据的介绍
1.数据内容及年份
(1)网络财经新闻基本信息:2001-2023年
(2)网络新闻量化统计(按自然日):2001-2023年
(3)网络新闻量化统计(按交易时间):2008-2023年
(4)网络财经新闻相似度:按新闻事件区分,无时间区间
(5)报刊财经新闻基本信息:1994-2024年
(6)报刊财经新闻量化统计:1994-2024年
(7)报刊财经新闻相似度:按新闻事件区分,无时间区间
2.数据更新时间:2025年2月12日
3.数据范围:上市公司
4.数据格式:xlsx
二、数据指标
|
字段 |
字段名称 |
描述 |
|
Scode |
股票代码 |
上市公司股票代码 |
|
Coname |
公司简称 |
上市公司的简称 |
|
Industry |
行业名称 |
上市公司所属2012年证监会行业分类名称 |
|
Indcode |
行业代码 |
上市公司所属2012年证监会行业分类代码 |
|
Newsid |
新闻ID |
标识新闻报道的唯一ID |
|
Reptime |
报道时间 |
新闻报道的时间 |
|
Repmedia |
报道媒体 |
新闻报道的媒体名称 |
|
Mediarea |
报道媒体所在地区 |
报道媒体所在省份和城市 |
|
Sourcemed |
来源媒体 |
新闻转载自的媒体名称 |
|
Newsemot |
新闻情感 |
新闻的语气,1代表正面,0代表中性,-1代表负面 |
|
Orirep_Dum |
是否原创 |
新闻是否属于原创性新闻 |
|
URL |
采集网址 |
新闻来自的网址 |
|
senten_Num |
正文句子数 |
新闻正文中的全部句子数 |
|
titlementioned |
标题是否提及 |
在标题中是否提及了该上市公司 |
|
codesentNum |
正文提及句子数 |
正文提到该上市公司的句子数 |
|
codecontentNum |
正文提及次数 |
正文提到该上市公司的次数 |
|
companyNum |
提及全部公司数 |
该新闻提及的全部上市公司数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则提及全部公司数为2 |
|
allcodesentNum |
提及全部公司句子数 |
该新闻提及的全部上市公司的句子数 |
|
allcodecontentNum |
全部公司提及次数 |
该新闻提及的全部上市公司的次数,例如,一篇财经新闻中,A公司出现4次,B公司出现3次,则全部公司提及次数为7 |
三、包含内容
上市公司报刊财经新闻数据概览



上市公司网络财经新闻数据概览:

报刊财经新闻相似度数据概览

四、下载链接:
上市公司报刊财经新闻数据: https://download.csdn.net/download/T0620514/90490590
上市公司网络财经新闻数据:https://download.csdn.net/download/T0620514/90490593
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)