网站首页 > 资源文章 正文
工作任务:
有多个表格
把里面的月流量数据都合并到一张表中:
在chatgpt中输入提示词:
你是一个Python编程专家,要完成一个Python脚本编写任务,具体步骤如下:
打开文件夹:F:\AI自媒体内容\AI行业数据分析\toolify月榜
逐个读取文件夹里面的xlsx表格文件;
读取xlsx表格文件的主文件名,设为变量{biaoge},提取主文件名中”toolify”和”排行榜”之间的内容,设为变量{date};
读取"F:\AI自媒体内容\AI行业数据分析\toolify月榜\新建文件夹\toolify2023年-2024年月排行榜汇总数据.xlsx"
将{date}写入"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格文件的C列表头;
将{biaoge}这个表格中D列“name”里面单元格的内容和"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格的B列“name”进行对比,如果一致,就将{biaoge}这个表格中E列“month_visited_count”里面单元格的内容复制到"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格的C列;
数据比对完成后,继续下一个表格(比对数据写入"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格的D列),直到文件夹中19个表格都比对完成;
注意:每一步都要输出信息到屏幕
源代码:
import pandas as pd
import os
import re
# 定义文件夹路径
folder_path = r'F:\AI自媒体内容\AI行业数据分析\toolify月榜'
summary_file_path = os.path.join(folder_path, '新建文件夹', 'toolify2023年-2024年月排行榜汇总数据.xlsx')
# 读取汇总文件
summary_df = pd.read_excel(summary_file_path)
# 逐个读取文件夹中的xlsx文件
files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# 处理每个xlsx文件
for file in files:
file_path = os.path.join(folder_path, file)
# 提取日期
match = re.search(r'toolify(.*?)排行榜', file)
if match:
date = match.group(1)
print(f'Processing file: {file}, Extracted date: {date}')
else:
print(f'No valid date found in filename: {file}')
continue
# 读取当前文件
df = pd.read_excel(file_path)
# 将date添加到summary_df中
if date not in summary_df.columns:
summary_df[date] = None
# 比对并复制数据
for index, row in summary_df.iterrows():
name = row['name']
match_row = df[df['name'] == name]
if not match_row.empty:
summary_df.at[index, date] = match_row.iloc[0]['month_visited_count']
print(f'Updated summary for {name} with {match_row.iloc[0]["month_visited_count"]}')
# 保存结果
summary_df.to_excel(summary_file_path, index=False)
print(f'Summary file updated at: {summary_file_path}')
猜你喜欢
- 2024-10-24 2 万字长文详解 10 大多线程面试题|原力计划
- 2024-10-24 选择合适的 MySQL 日期时间类型来存储你的时间
- 2024-10-24 随笔:MySQL又死锁了,看我一顿分析
- 2024-10-24 一个诡异的MySQL查询超时问题,差点导致一个P0事故
- 2024-10-24 关于接口规范(关于接口的使用,说法错误的是)
- 2024-10-24 PUT 与 PATCH & PUT 与 POST(put与post区别)
- 2024-10-24 TiDB 查询优化及调优系列(五)调优案例实践
- 2024-10-24 一文读懂Go结构体标签(go结构体默认值)
- 2024-10-24 Git同步原始仓库到Fork仓库中(git 同步)
- 2024-10-24 了不起的 Webpack HMR 学习指南(上)「含源码讲解」
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- 电脑显示器花屏 (79)
- 403 forbidden (65)
- linux怎么查看系统版本 (54)
- 补码运算 (63)
- 缓存服务器 (61)
- 定时重启 (59)
- plsql developer (73)
- 对话框打开时命令无法执行 (61)
- excel数据透视表 (72)
- oracle认证 (56)
- 网页不能复制 (84)
- photoshop外挂滤镜 (58)
- 网页无法复制粘贴 (55)
- vmware workstation 7 1 3 (78)
- jdk 64位下载 (65)
- phpstudy 2013 (66)
- 卡通形象生成 (55)
- psd模板免费下载 (67)
- shift (58)
- localhost打不开 (58)
- 检测代理服务器设置 (55)
- frequency (66)
- indesign教程 (55)
- 运行命令大全 (61)
- ping exe (64)
本文暂时没有评论,来添加一个吧(●'◡'●)