深度学习(Deep Learning) 简介

2023-12-22 16:57:13

深度学习(Deep Learning)

深度学习在海量数据情况下的效果要比机器学习更为出色。

多层神经网络模型

神经网络

有监督机器学习模型

  • 输入层
  • 隐藏层 (黑盒)
  • 输出层

概念:

  • 神经元 Neuron A^(n+1)
  • 网络权重 Weights W^n
  • 偏移 bias b^n

激活函数:

  • ReLU
  • tanh
  • Sigmoid

点击查看激活函数详情: https://blog.csdn.net/galoiszhou/article/details/135154697

监督类机器学习模型的目标就是在给定一个任务的情况下,找到最优化的参数,使得 Loss 损失值最小,其中 Loss 损失值就是预测结果和真实结果之间的误差。

神经网络的目标就是在给定一个任务的情况下,找到最优的Weights 和 bias,使得 Loss 最低。

CNN

图像识别这项技术已经发展得很成熟,卷积神经网络(Convolutional Neural Networks,CNN)又是其中的主流技术

  • 神经网络
    • 输入层
    • 隐藏层
      • 特征提取层
        • 卷积层
        • 激活函数
        • 池化层
      • 全连接层
    • 输出层
  • CNN

任意一张彩色图片都可以表示成一个三阶张量,即三维数组。所有彩色图像都是由红、绿、蓝(RGB)叠加而成的.

CNN 网络模型的数据输入就是将彩色图像分解为 R、G、B 这 3 个通道,其中每个通道的值都在 0 到 255 之间。

过滤掉干扰信息,并且识别图像中的主体信息, 做法就是不断模糊化一张图片. 通过 CNN 的卷积和池化来实现

在完成各层的卷积运算后,深度学习模型还需要进行非线性的变换,非线性的变换是通过增加激活函数来实现的,通过激活函数将“线性回归”拟合的直线编程曲线.

池化的目的也是提取特征,减少向下一阶段传递的数据量,池化过程的本质是“丢弃”,即只保留图像主体特征,过滤掉无关信息的数据特征。

CNN 的所有卷积和池化操作都是在提取特征,直到全连接层才进入真正的训练学习阶段,做最后的分类计算。

在 CNN 中,全连接层一般是用的是 Softmax 函数来进行分类.

深度学习的优点:

  • 可以拟合任意复杂的数据分布
  • 性能好

深度学习的缺点:

  • 可解释性非常的差
  • 非常消耗资源
  • 对数据依赖很强
  • 模型复杂

深度学习适用的样本数据:

  • 图像数据
    深度学习在图像处理领域取得了巨大成功。它可以用于图像分类、目标检测、图像生成等任务。图像数据通常表示为像素的数值矩阵。
  • 语音和音频数据
    深度学习在语音识别、语音生成和音频处理等方面取得了显著的成果。声波信号的时域或频域表示可作为输入进行处理。
  • 文本和自然语言数据
    深度学习在自然语言处理领域广泛应用,包括文本分类、命名实体识别、机器翻译等任务。文本数据通常以词向量或嵌入表示。
  • 时间序列数据
    深度学习在处理时间序列数据(如股票价格、气象数据、生物传感器数据)方面非常有效。循环神经网络(RNN)和长短时记忆网络(LSTM)等模型常用于处理时间序列。
  • 视频数据
    视频数据是一系列帧的集合,深度学习可用于视频分类、动作识别、目标跟踪等任务。卷积神经网络(CNN)和时空卷积网络(3D CNN)是处理视频数据的常见模型。
  • 医学图像数据
    在医学领域,深度学习被广泛应用于医学图像的分析,如病理学图像、医学影像(CT、MRI等)的分割和识别。
  • 传感器数据
    传感器产生的数据,例如加速度计、陀螺仪、GPS 数据等,可以通过深度学习进行分析。这在物联网(IoT)和智能设备领域有广泛应用。
  • 社交媒体数据
    深度学习可用于处理社交媒体上的文本、图像和视频数据,用于情感分析、用户推荐、图像标注等任务。
  • 游戏数据
    在游戏领域,深度学习可以用于强化学习,训练智能体玩游戏,并在复杂的游戏环境中做出智能决策。
  • 生物信息学数据
    深度学习在处理生物信息学数据,如基因组数据、蛋白质序列等方面也有应用,例如基因表达模式的分析。

深度学习的场景:

  • 计算机视觉
    • 图像分类 通过深度学习,可以训练模型对图像进行准确的分类,应用于物体识别、图像检索等。
    • 目标检测 深度学习模型可以检测图像中的多个对象,并标识它们的位置,用于自动驾驶、视频监控等。
    • 图像分割 用于将图像分割成具有语义意义的区域,例如医学图像分割、自然场景分割等。
  • 自然语言处理(NLP)
    • 文本分类 用于情感分析、垃圾邮件过滤、新闻分类等。
    • 机器翻译 利用深度学习模型实现更准确和流畅的翻译。
    • 文本生成 生成自然语言文本,如文章摘要、对话生成等。
  • 语音处理
    • 语音识别 将语音信号转换为文本,应用于语音助手、语音搜索等。
    • 语音生成 通过深度学习生成自然流畅的语音,用于语音合成系统。
  • 推荐系统
    • 个性化推荐 利用深度学习分析用户行为,实现更准确的个性化推荐,如音乐、电影、商品推荐等。
  • 医学图像分析
    • 病理图像分析 用于癌症检测、肿瘤分析等。
    • 医学影像识别 在CT、MRI等医学影像中识别疾病和异常。
  • 自动驾驶
    • 图像处理 通过深度学习对车辆周围环境进行实时识别和分析,实现自动驾驶决策。
  • 金融欺诈检测
    • 交易分析 通过深度学习分析金融交易数据,识别潜在的欺诈行为。
  • 游戏开发
    • 游戏智能体 利用深度学习实现游戏中的智能体,例如对弈游戏中的人工智能对手。
    • 物联网(IoT)
    • 传感器数据分析 利用深度学习对传感器数据进行实时分析,如智能家居、工业物联网等。
  • 人脸识别和生物特征识别
    • 人脸解锁: 通过深度学习模型进行人脸识别,用于手机解锁、门禁系统等。
    • 生物特征识别: 例如指纹识别、虹膜识别等。

文章来源:https://blog.csdn.net/galoiszhou/article/details/135154659
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。