Skip to content

人工智能与深度学习

人工智能与深度学习

  • 人工智能
    • 我们所谈论的人工智能,究竟是什么?
    • 我们正处于人工智能的时代
    • 人工智能从何处而来?
    • 人工智能为何高速发展?
  • 深度学习
    • 深度学习与人工智能是什么关系?
    • 深度学习相比传统方法有什么优势?
    • 深度学习的三大应用领域
    • 深度学习有哪些基础的流程?

我们所谈论的人工智能,究竟是什么?

  • 人工智能(Artificial Intelligence, AI)是研究、开发用于模拟、延伸和扩展人的智能的一门新的技术科学。
  • 人工智能是计算机科学的一个分支,企图了解智能的实质,并生产出智能机器。
  • 人工智能是一门极富挑战性的科学,包括十分广泛,它由不同的领域组成。

我们所谈论的人工智能,究竟是什么?

  • 技术是指能“让机器模拟人的基础能力”的技术。
  • 应用是指各行各业可应用的广泛场景。

我们正处于人工智能的时代

  • 无人驾驶汽车
  • 人脸识别
  • 机器翻译

我们正处于人工智能的时代——无人驾驶汽车

  • 无人驾驶汽车是智能汽车的一种,主要依靠车内以计算机系统为主的智能驾驶控制器来实现无人驾驶。
  • 无人驾驶中涉及的技术包含多个方面,例如计算机视觉、自动控制技术等。
  • Google Driverless Car
  • 百度无人驾驶汽车

我们正处于人工智能的时代——人脸识别

  • 人脸识别也称人像识别、面部识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。
  • 人脸识别涉及的技术主要包括计算机视觉、图像处理等。

我们正处于人工智能的时代——机器翻译

  • 机器翻译是计算语言学的一个分支,是利用计算机将一种自然语言转换为另一种自然语言的过程。
  • 机器翻译用到的技术主要是神经机器翻译技术。

人工智能从何处而来?

  • 1950——艾伦·图灵在论文《计算机器与智能》中提出了一个根本性的问题——“机器能思考吗?”
  • 1956——达特茅斯学院研究人员发起了一系列的研究项目,“人工智能”一词诞生。
  • 1968——科幻电影《2001:太空漫游》中的智能电脑HAL9000。
  • 1997,深蓝国际象棋程序击败了世界冠军Garry Kasparov,人工智能迎来了一个新的时代。
  • 2006,Geoffrey Hinton提出对人工神经网络进行修改,并将其研究成果称为深度学习。
  • 2012,Andrew Ng建造了一个简陋的利用图形处理单元(GPU)实现深度神经网络的模型,大规模并行架构同时处理多个任务。

人工智能从何处而来?

人工智能为何高速发展?

  • 更丰富的数据。人工智能需要大量的数据来学习,社交的数字化为其进步提供了可利用的原材料。
  • 更便宜的计算成本。由于硬件和新的计算模型取得新的突破,尤其是GPU,加速了人工智能的发展过程。
  • 更复杂的算法。更高效的性能和更便宜的计算花费使得科研人员能够开发和训练更高级的算法,这是因为他们不再受限于硬件约束。
  • 更广泛的投资。人工智能投资在许多领域都在进行发展——政府、风险资本支持的初创公司、互联网巨头和各行业的大型企业等。

深度学习

深度学习、机器学习与人工智能

  • 机器学习。
    • 机器学习就是用算法解析数据,不断学习,模拟、延伸和扩展人的智能
    • 用大量数据和算法“训练”机器,让机器学会如何执行任务。
    • 决策树、随机森林、逻辑回归、SVM、朴素贝叶斯
  • 深度学习
    • 深度学习是模仿人脑的机制来解释数据
    • 试图模仿大脑的神经元之间传递,处理信息的模式(NLP)
    • 分为卷积神经网络和深度置信网
    • GPU的出现造就了深度学习的蓬勃发展

深度学习与人工智能是什么关系?

  • 机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集。
  • 机器学习与深度学习都是需要大量数据提供支撑
  • 深度学习还需要更高的运算能力支撑

深度学习相比传统方法有什么优势?

  • 图像识别实际目标:让计算机将语义概念相似的图像划分为同一类别
  • 图像识别面临的挑战:图像的底层视觉特性和高层语义概念之间的鸿沟
  • 传统方法:用全局的视觉底层特性统计量表示图像,丢失图像细节

深度学习相比传统方法有什么优势?

  • 远远超越传统机器学习方法的表现
  • 数据量的增大对于准确率的提升效果明显
  • 不再需要繁琐的特征工程
  • 可重新迁移训练,且易于转换

深度学习的三大应用领域——计算机视觉

  • 计算机视觉——具有“智力”的计算机根据要求针对输给出一定的分析结果。
    • 目标分类——基于分类任务的目标识别问题,计算机根据给定的数据,找出数据中所需的目标。
    • 目标检测——分类和回归问题的统一,不仅要判断当前图像的所属类别,还要标出目标的具体位置。
    • 目标分割——将一张图像中的特定目标的区域分割出来,包含语义分割和实例分割。

深度学习的三大应用领域——自然语言处理

  • 自然语言处理——用计算机来处理、理解以及运用人类语言,是计算机科学与语言学的交叉学科。

    • 词法分析——以词为单位对数据进行分析
    • 句子分析——以句子为单位的分析任务
    • 语义分析——生成对应文本数据的语义信息的形式化表示
    • 顶层任务——直接面向用户的任务,如机器翻译或文本摘要

深度学习的三大应用领域——语音识别

  • 语音识别——将一段自然语言通过声学信号的形式传给计算机,由计算机理解并且做出回应。
    • 特征提取——根据特征提取将声音信号从时域转换到频域,从而为声学模型提供合适的特征向量;
    • 声学模型——根据特征向量来判断其属于哪个声学符号;
    • 语言模型——判断声学符号可能属于哪个词组序列;
    • 字典与解码——得到最后的文本表示。

深度学习有哪些基础的流程?

  • 深度学习模型的开发过程包括数据的读取、网络的设计、优化方法与损失函数的选择以及一些辅助的工具等。