建筑数据是我们在各项研究中经常使用到的数据。之前我们分享过我国2022年的建筑体块矢量数据;这个数据没有建筑高度,但是建筑高度又是我们经常需要的属性,后面我们又分享了我国2020年的含建筑高度的建筑物矢量数据。除了建筑高度以外,我们有时候还需要使用到其他建筑属性,比如建筑建造年份、建筑功能、建筑质量等。

本次我们带来一个新的建筑数据集——2024年我国多属性建筑矢量数据。该数据集包含建筑体块、建筑高度、建筑功能、建造年份、建筑质量等单体建筑的属性!该数据集源自2025年3月12号发表于《Scientific Data》的论文成果,数据集覆盖3,100万栋建筑。发布该数据的论文为” CMAB: A Multi-Attribute Building Dataset of China”。论文作者为张业成,赵慧敏,龙瀛。该数据集是基于0.3-1米分辨率的Google Earth影像与街景图像、POI数据融合提取,结合OCRNet、XGBoost等AI模型生成的。屋顶提取F1-score达89.93%,高度预测RMSE低于7.9米,精度领先国际同类产品!对于数据年份,该数据集识别建筑所主要采用的Google Earth影像数据,有70%集中在2022年至2024年之间。论文中也列出了生成建筑属性数据所利用到的其他数据源,见下图:

原始数据集分享在Figshare网站,共分享了31个省份的建筑数据(港澳台的数据缺失),其中每个省份的建筑数据都分散储存为多个Shp文件,为方便大家使用,我们将每个省份建筑数据进行合并,以省份为名称得到各省完整的建筑数据集!原始数据和合并处理后的数据我们一并分享给大家!另外需要说明的是,该数据集只提供了城市建成区区域的建筑信息,并不涉及乡镇及农村地区的建筑信息

以下为数据的详细介绍:

01

数据预览

我们以上海市这一发达地区为例来预览一下数据:

上海市建筑分布

我们放大来看一下细节:

上海市局部建筑分布

我们再以湖北省这一中西部地区为例来预览一下数据:

湖北省建筑分布

我们放大来看一下细节:

湖北省局部建筑分布

02

建筑属性

该建筑数据的字段包括:merged_id(建筑id)、Height(建筑高度)、Function(建筑功能)、Age(建造年份)和Quality(建筑质量)

湖北省建筑数据属性表

我们依次来介绍一下:

1.Height(建筑高度) 建筑高度的单位为米(m)。2.Age(建造年份)结合长期不透水面数据可以确定每个建筑物的建成年份,因为本研究的建造年份是基于1985年-2018年的Gaia Data数据进行判定的,因此age字段中AF2018(after 2018)表示建筑建成于2018年之后。

3.Function(建筑功能)

分享该数据的论文提供了对于建筑功能字段的补充解释:

一共包括六类建筑功能,六类建筑功能的具体划分如下:

  • Residence(住宅区):Residential areas, dormitories(住宅区、宿舍 );
  • Business(商业区):Shopping centers, markets, supermarkets(购物中心、市场、超市);
  • Public service(公共服务区):Education, medical care, venues and stations(教育、医疗、文体场馆和车站);
  • Industry(工业区):Factory(工厂);
  • Office(办公区):Office building, government(办公楼、政府机构);
  • Other(其他):Parks, transportation facilities, scenic spots, etc.(公园、交通设施、景点等 )

4.Quality(建筑质量)

论文中介绍了建筑质量的计算公式,通过计算建筑周围100m 缓冲区内所有街道观测点的建筑无序状况的总分来衡量建筑质量。quality字段中有三种数值表示:①N:该地点在该年度没有街景图像;②M:缓冲区内没有观测点;③0-1:1 表示该区域存在无序类型,0 表示不存在。在一个观测点可能存在多个街景图像,这些图像共同贡献一个0-1之间的数值。具体计算公式如下:

03

数据其它信息

数据官方网站:中国多属性建筑数据集(CMAB)开放于Figshare平台

数据年份:识别建筑所采用的Google Earth影像数据的年份为2022-2024年

数据格式:Shp

坐标系:地理坐标系WGS1984

空间分辨率:0.3-1米(核心区域0.5米)

参考论文:Zhang, Y., Zhao, H. & Long, Y. CMAB: A Multi-Attribute Building Dataset of China. Sci Data 12, 430 (2025).

DOI: 10.1038/s41597-025-04730-5

引用格式:Zhang, Y., Zhao, H. & Long, Y. CMAB: A Multi-Attribute Building Dataset of China. Sci Data 12, 430 (2025). https://doi.org/10.1038/s41597-025-04730-5

如有数据使用需求请按照官方平台的要求进行引用,更多数据详情可以查看官网获悉

【下载→

方式一(推荐):主页 *个人* 简介

城数派-CSDN博客

方式二:数据下载方式汇总-CSDN博客

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐