node实现简单的数据爬虫
2023-12-21 17:32:13
    		前言
我使用的是墨迹天气的页面,因为这个使用的链接简单 页面结构简单并且大都是文字形式
第一步
打开墨迹天气网址 随便点开一个页面
 
 点击F12或者鼠标右键点击检查 查看页面的信息
分析页面内容

使用文字所在的class和标签来定位

编写代码
配置express环境
引入包
const axios = require(‘axios’);
 const cheerio = require(‘cheerio’);
获取html信息
定义url
const weatherURL = https://tianqi.moji.com/weather/china/shanghai/shanghai;
访问相应的网页
try {
 let weather = await getWeatherTips(weatherURL);
 // let str = $${weather};
 // console.log(weather)
 res.json(weather);
 } catch (error) {
 res.status(500).json({ error: ‘Internal Server Error’ });
 }
 });
将url传入相应的方法中 方法进行处理
function getWeatherTips(url) {
  return new Promise(async (resolve, reject) => {//使用异步请求
    try {
      const response = await axios.get(url);//获取url并访问 得到页面
      const html = response.data || "";//获取页面内容
      const $ = cheerio.load(html);//解析成html
      
      const temp2 = $('.wea_alert  em').text().trim();/
      const temp = $('.wea_weather em').text().trim() + '℃'; //这就是刚刚看到的class和标签名 获取里面的text
      const desc = $('.wea_weather b').text().trim();
      const water = $('.wea_about span').text().trim();
      const win = $('.wea_about em').text().trim();
      const tips = $('.wea_tips em').text().trim();
      const words = `今日天气\n${desc}\n温度:${temp}\n湿度:${water}\n风力:${win}\n${tips}\n空气质量${temp2}`;
      // resolve.json({
      //   success: true
      // });
      const word = {
        temp: temp,
        desc: desc,
        water: water,
        win: win,
        tips: tips,
        area: temp2
      }
      // resolve.json({
      //   words: words
      // });
      resolve(word);//输出返回的内容
      
      // res.json({ success: true, data: 123 });
      // resolve.json({ success: true, data: `${words}` });
      // res.json({
      //   success: true, data: {
      //     words:words
      // temp: temp,
      // desc: desc,
      // water: water,
      // win: win,
      // tips: tips,
      // }
      // });
    } catch (error) {
      reject(error);
    }
  });
}
全部代码
这个是我加了传入参数的版本 你可以自己把你定义的天气相应的url设置好
const axios = require('axios');
const cheerio = require('cheerio');
app.post('/words', async function (req, res) {
  const arr = req.body.address;
  console.log(arr)
  const weatherURL = `https://tianqi.moji.com/weather/china` + `${arr}`;
  console.log(weatherURL)
  try {
    let weather = await getWeatherTips(weatherURL);
    // let str = `$${weather}`;
    // console.log(weather)
    res.json(weather);
  } catch (error) {
    res.status(500).json({ error: 'Internal Server Error' });
  }
});
// 获取墨迹天气提示信息
function getWeatherTips(url) {
  return new Promise(async (resolve, reject) => {
    try {
      const response = await axios.get(url);
      const html = response.data || "";
      const $ = cheerio.load(html);
      const temp2 = $('.wea_alert  em').text().trim();
      const temp = $('.wea_weather em').text().trim() + '℃';
      const desc = $('.wea_weather b').text().trim();
      const water = $('.wea_about span').text().trim();
      const win = $('.wea_about em').text().trim();
      const tips = $('.wea_tips em').text().trim();
      const words = `今日天气\n${desc}\n温度:${temp}\n湿度:${water}\n风力:${win}\n${tips}\n空气质量${temp2}`;
      // resolve.json({
      //   success: true
      // });
      const word = {
        temp: temp,
        desc: desc,
        water: water,
        win: win,
        tips: tips,
        area: temp2
      }
      // resolve.json({
      //   words: words
      // });
      resolve(word);
      // res.json({ success: true, data: 123 });
      // resolve.json({ success: true, data: `${words}` });
      // res.json({
      //   success: true, data: {
      //     words:words
      // temp: temp,
      // desc: desc,
      // water: water,
      // win: win,
      // tips: tips,
      // }
      // });
    } catch (error) {
      reject(error);
    }
  });
}
接口测试

    			文章来源:https://blog.csdn.net/m0_56666791/article/details/135134217
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
    	本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!