如何用 GPT 去分析Excel数据

2024-01-02 12:10:13

背景

需要尝试分析 Excel 的内容,每月都需要进行相关的分析,固定化流程,因此尝试制作固化的脚本,方便后续的分析。

执行步骤

帮我写一段 python 代码,我需要区分一个.xlsx的数据。格式示例如下:
”这块自行复制 Excel 里面的文本内容”

帮我筛选出
Description列的值为Subscription creation 和对应不同价格的数据,
Description列的值为Subscription update 和对应不同价格的数据,
Description列的值不属于Subscription creation也不属于Subscription update 按照不同的价格进行区分,
最后分别给我返回不同情况对应的不同数据的数组。

结果如下

当您需要处理 Excel 文件并根据特定列的值进行筛选时,可以使用 Python 的 pandas 库来处理和分析数据。在处理 Excel 文件时,pandas 是一个非常有用的工具。首先,确保您已经安装了 pandas 库,如果没有安装可以通过以下命令来安装:

bash
Copy code
pip install pandas
接下来,以下是一个示例代码,用于读取 Excel 文件并根据不同条件筛选数据:

python
Copy code
import pandas as pd

读取 Excel 文件

file_path = ‘your_excel_file.xlsx’
data = pd.read_excel(file_path)

根据条件筛选数据

subscription_creation = data[data[‘Description’] == ‘Subscription creation’]
subscription_update = data[data[‘Description’] == ‘Subscription update’]
other_descriptions = data[~data[‘Description’].isin([‘Subscription creation’, ‘Subscription update’])]

输出不同情况对应的数据数组

print(“Subscription creation data:”)
print(subscription_creation)

print(“\nSubscription update data:”)
print(subscription_update)

print(“\nOther descriptions data:”)
print(other_descriptions)
在上述代码中,假设您的 Excel 文件路径为 your_excel_file.xlsx。代码将根据不同的描述(Subscription creation、Subscription update、其他描述)创建三个不同的数据集,并将它们输出到控制台。

您可以根据需要对这些数据进行进一步处理或保存到新的 Excel 文件中。如果您需要将数据存储到数组中,您可以使用 to_numpy() 方法将 pandas DataFrame 转换为 NumPy 数组。

结果不满足需求,尝试做了调整

三种不同的情况需要对应不同的价格区分
ChatGPT
要根据不同的描述和价格区分数据,可以使用 pandas 进行多条件筛选。以下是一个例子,假设您需要对不同描述的不同价格进行筛选:

python
Copy code
import pandas as pd

读取 Excel 文件

file_path = ‘your_excel_file.xlsx’
data = pd.read_excel(file_path)

根据描述和价格筛选数据

subscription_creation = data[(data[‘Description’] == ‘Subscription creation’) & (data[‘Amount’] == 9)]
subscription_update = data[(data[‘Description’] == ‘Subscription update’) & (data[‘Amount’] == 15)]
other_data = data[~((data[‘Description’] == ‘Subscription creation’) | (data[‘Description’] == ‘Subscription update’))]

输出不同情况对应的数据数组

print(“Subscription creation with amount 9 data:”)
print(subscription_creation)

print(“\nSubscription update with amount 15 data:”)
print(subscription_update)

print(“\nOther descriptions data:”)
print(other_data)
在这个示例中,假设您想要找出Subscription creation中金额为9,Subscription update中金额为15的数据,并将其与其他数据进行分离。您可以根据实际情况修改金额和描述的条件来满足您的需求。

到现在为止已经基本满足我的需求了,代码再基本改吧改吧,很快最终的代码就输出出来了。

文章来源:https://blog.csdn.net/weixin_42152604/article/details/135334848
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。