Skip to content

霍格沃兹测试开发学社-教程网站

大模型与 AIGC 应用体系
大模型与 AIGC 应用体系
- L1. 国内外大模型应用
  L1. 国内外大模型应用
人工智能产品测试
人工智能产品测试
- L1.人工智能概念基础
  L1.人工智能概念基础
视觉与图像识别自动化测试
视觉与图像识别自动化测试
- L1.人工智能在音频、视觉、多模态领域的应用
  L1.人工智能在音频、视觉、多模态领域的应用
  - 人工智能在音频、视觉、多模态领域的应用人工智能在音频、视觉、多模态领域的应用
    Table of contents
    
    人工智能在音频、视觉、多模态领域的应用
    
    什么是多模态
    
    为什么要学习人工智能在音频、视觉、多模态领域的应用
    
    学习体系
    
    学习成果
  - 音频转文字
  - 文字转语音
  - 图像识别
  - 文生图
  - 文生视频
深度学习应用
深度学习应用
- L1.PyTorch 简介
  L1.PyTorch 简介

人工智能在音频、视觉、多模态领域的应用

人工智能在音频、视觉、多模态领域的应用

什么是多模态

随着 ChatGPT 问世之后掀起的人工智能热潮，渐渐一些科幻电影里面的情节，现实都在一步步发生。

Neuralink 的脑机接口帮助瘫痪人群重获行动能力。
全球各大汽车厂商的智能驾驶。
智能机器人。

为什么要学习人工智能在音频、视觉、多模态领域的应用

在针对人工智能产品测试过程中需要模拟大量的测试数据，这个过程，也可以通过人工智能结合多模态完成。
在短视频爆炸的时代，可以使用人工智能相关的技术完成视频、音频、文本的处理与剪辑，完成副业。

学习体系

在人工智能与多模态的应用学习中，主要也分为多个阶段。循序渐进进行学习：

uml diagram

学习成果

音频转文字
文字转语音
图像识别
文生图
文生视频