背景描述

  • • 👓 可视化主要使用 Plotly

  • • 🔎 数据处理主要使用 pandas

  • • 👉 本文是我自己在和鲸社区的原创

今天这篇文章将给大家介绍【关于2025春节档电影票房数据的探索】 案例。

Step 1. 导入模块

import pandas as pd   
import plotly.express as px

Step 2. 数据概览

df = pd.read_excel('/home/mw/input/chun7681/影片票房_250211_1739256248.xlsx', sheet_name='Sheet1')         # 清理关键字段并转换数据类型   df['累计票房(万)'] = df['累计票房(万)'].astype(float)  
 df['当前票房(万)'] = df['当前票房(万)'].astype(float)   
 df['上映日期'] = pd.to_datetime(df['上映日期'])

Step 3. 数据分析及其可视化

# 计算累计票房占比   total_box_office = df['累计票房(万)'].sum()  
df['票房占比'] = (df['累计票房(万)'] / total_box_office) * 100      # 取票房占比前10的电影   
 top_10 = df.groupby('电影名称')['累计票房(万)'].max().nlargest(10).index   
 df_top10 = df[df['电影名称'].isin(top_10)]      # 计算每个电影的累计票房总和   
 top_10_box_office = df_top10.groupby('电影名称')['累计票房(万)'].sum().reset_index()      # 绘制票房占比饼图   
 fig = px.pie(       top_10_box_office,       names='电影名称',       values='累计票房(万)',       title='春节档累计票房占比(Top 10)',       labels={'累计票房(万)': '票房(万)'},       hole=0.3  # 如果想做环形饼图,可以加上 hole=0.3   )      
 # 显示图表   
 fig.show()

项目所用数据集&源码

关注【布鲁的Python之旅】公众号,回复关键词【20240211】即可免费获取

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐