基于pytorch的房价预测

2024-01-09 18:13:00

简介

本文主要介绍的基于pytorch和房价预测深度学习网络构建。

该系统使用的是网络上的开源数据:

实现了对房价数据的处理,包括词频统计、情感分析等,并将分析结果以图表形式进行展示。通过这个系统,用户可以便捷地进行分析和可视化。

完整代码在最下方,想要先看源码的同学可以移步本文最下方进行下载。

博主也参考过文本分类相关模型的文章,但大多是理论大于方法。很多同学肯定对原理不需要过多了解,只需要搭建出一个可视化系统即可。

也正是因为我发现网上大多的帖子只是针对原理进行介绍,功能实现的相对很少。

如果您有以上想法,那就找对地方了!


不多废话,直接进入正题!

数据简介

数据不多,主要包括了几十年内的房价数据
在这里插入图片描述

首先对数据进行读取和预处理。

在这里插入图片描述

读取数据后,对x数据进行标准化处理,以便于后续训练的稳定性,并转换为tensor格式

在这里插入图片描述

数据分析

  • 绘制图像

由于数据量较少,所以将整个训练集作为测试集,观察生成的图像

在这里插入图片描述

构建神经网络训练

import torch
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch.optim as optim
import warnings
warnings.filterwarnings("ignore")
 
 
# In[4]:
 
 
features = pd.read_csv('房价预测.csv')
 
features
 
 
# In[26]:
 
 
year = []
price = []
for i in range(0,12):
    year.append([features['Year'][i]])
    price.append([features['Price'][i]])
    
 
 
# In[27]:
 
 
year = np.array(year)
price = np.array(price)
year,price
 
 
# In[53]:
 
 
from sklearn import preprocessing
 
# 特征标准化处理
year = preprocessing.StandardScaler().fit_transform(year)
year[0]
 
 
# In[54]:
 
 
x = torch.tensor(year,dtype=float)
y = torch.tensor(price,dtype=float)
x,y
 
 
# In[62]:
 
 
learning_rate = 0.0001
weights1 = torch.randn((1,1),dtype=float,requires_grad=True)
bias1 = torch.randn(1,dtype=float,requires_grad=True)
 
 
losses = []
 
 
for i in range(0, 5000):
    ans = x.mm(weights1) + bias1
    #计算损失
    criterion = torch.nn.MSELoss()  # 使用适当的损失函数
    loss = criterion(ans, y)
    
    losses.append(loss)
    
    if i%100==0:
        
        print(f'loss={loss},epoch={i},w={weights1}')
        
    #反向传播
    loss.backward()
    #更新参数
    weights1.data.add_(-learning_rate*weights1.grad.data)
    bias1.data.add_(-learning_rate*bias1.grad.data)
    #清空
    weights1.grad.data.zero_()
    bias1.grad.data.zero_()
# 使用 features['Year'] 和 features['Price'] 创建日期和价格的列表
year = features['Year']
price = features['Price']
# 将 ans 转换为 Python 列表
ans_list = ans.tolist()
 
# 提取列表中的每个元素(确保是单个的标量值)
predictions = [item[0] for item in ans_list]
 
# 创建一个表格来存日期和其对应的标签数值
true_data = pd.DataFrame(data={'date': year, 'actual': price})
predictions_data = pd.DataFrame(data={'date': year, 'prediction': predictions})
# 真实值
plt.plot(true_data['date'], true_data['actual'], 'b-', label='actual')
 
# 预测值
plt.plot(predictions_data['date'], predictions_data['prediction'], 'ro', label='prediction')
plt.xticks(rotation='60')
plt.legend()
 
# 图名
plt.xlabel('Date')
plt.ylabel('Price')  # 注意修改为你的标签
plt.title('Actual and Predicted Values')
plt.show()

文章来源:https://blog.csdn.net/weixin_43486940/article/details/135483407
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。