跳转到内容

人工智能学习网

床长

4RSS订阅

床长 的帖子

公告

请从前言看起! 本篇文章会员可见。只有认认真真学习的同学才能入会! 入会的入口链接在前几篇文章中,通… 继续阅读 公告

  • 发表于: 2018年11月19日 2020年10月25日
  • 作者: 床长

1.2.2 神经网络是如何进行预测的

上一篇文章中我们已经知道了如何将数据输入到神经网络中。那么神经网络是如何根据这些数据进行预测的呢?我… 继续阅读 1.2.2 神经网络是如何进行预测的

  • 发表于: 2018年11月18日 2026年5月6日
  • 作者: 床长

1.2.1 如何将数据输入到神经网络中

通过对前面文章的学习,我们已经知道神经网络可以实现真正的人工智能。本小节我会进行详细地讲解,让大家彻… 继续阅读 1.2.1 如何将数据输入到神经网络中

  • 发表于: 2018年11月18日 2023年3月30日
  • 作者: 床长

1.1.1 什么是神经网络

什么是人工智能?通俗来讲,就是让机器能像人一样思考。这个无需解释太多,因为通过各种科幻电影我们已经对… 继续阅读 1.1.1 什么是神经网络

  • 发表于: 2018年11月18日 2023年6月4日
  • 作者: 床长

目录

  • 前言
  • 人工智能基础
    • 1 科普
      • 什么是神经网络
    • 2 基础知识
      • 如何将数据输入到神经网络中
      • 神经网络是如何进行预测的
      • 预测得准确吗
      • 网络是如何进行学习的
      • 计算图
      • 如何计算逻辑回归的偏导数
      • 向量化
      • 如何开始使用python
      • 如何向量化人工智能算法
      • 一些基础概念
      • 特征工程
      • 哪些特征是有价值的
      • 数据清理
      • 逻辑回归与分类阈值
      • 静态训练与动态训练
      • Python基础语法
      • Python流程控制
      • Python容器数据结构
      • Python函数
      • Python库快速入门
      • 【实战编程】教你编写第一个人工智能程序
    • 3 神经网络
      • 浅层神经网络
      • 如何计算浅层神经网络的前向传播
      • 如何计算浅层神经网络的反向传播
      • 1.3.4 为什么需要激活函数
      • 常见的激活函数
      • 激活函数的偏导数
      • 随机初始化参数
      • 非线性与激活函数
      • 【实战编程】教你编写浅层神经网络
      • 为什么需要深度神经网络
      • 如何计算深度神经网络
      • 核对矩阵的维度
      • 参数和超参数
      • 监督学习型神经网络
      • 什么使深度学习火起来了
      • 【实战编程】构建深度神经网络
    • 4 额外知识
      • 标量、向量、矩阵和张量
      • 深入了解矩阵
      • 范数
      • 什么是微积分
      • 古典微积分
      • 极限微积分
      • 偏导数
      • 方向导数
      • 什么是概率论
      • 条件概率
      • 什么是信息论
      • 条件熵
      • 互信息
      • 相对熵(KL散度)
      • 交叉熵
      • 试题
  • 实战优化
    • 1 实战基础
      • 如何配置数据集
      • 欠拟合和过拟合
      • 如何解决欠拟合与过拟合
      • 正则化
      • dropout
      • 数据增强
      • 对输入特征进行规范化
      • 梯度消失和梯度爆炸
      • 如何判断网络是否有bug
      • H5文件
      • 【实战编程】参数初始化
      • 【实战编程】正则化
      • 【实战编程】梯度检验
    • 2 优化算法
      • mini-batch
      • 如何为mini-batch选择合理的大小
      • 指数加权平均
      • 深入理解指数加权平均
      • 动量梯度下降
      • RMSprop
      • Adam优化算法
      • 学习率衰减
      • 局部最优
      • 【实战编程】mini-batch梯度下降
      • 【实战编程】动量梯度下降
      • 【实战编程】Adam
      • 【实战编程】对比不同的优化算法
    • 3 调试神经网络
      • 调参
      • 为调参选择采样标尺
      • 各种调参经验
      • 调参模式和工具
      • 规范化隐藏层的输入
      • BN的好处
      • 使用模型时的BN
      • softmax
      • 深入理解softmax
      • 如何选择深度学习框架
      • 手把手教你安装tensorflow
      • 【实战编程】手把手带你学习Tensorflow v1.x
      • 【实战编程】手把手教你用tensorflow1.x构建一个完整的人工智能程序
      • 【实战编程】手把手带你学习Tensorflow v2.x
      • 试题
  • 实战经验
    • 1 实战经验一
      • 决策很重要
      • 正交化
      • 如何判断哪个网络更好?——F1分数
      • 如何做选择
      • 验证集与测试集的数据来源要一致
      • 数据集的获取与划分
      • 判定标准是可以变的
      • AI能力与人类能力的关系
      • 利用贝叶斯误差来判断拟合度
      • 人类误差是多少呢?
      • AI超越人类
      • 提升AI系统的一般流程
      • 数据集的偏见
    • 2 实战经验二
      • 手工分析错误
      • 同时手工分析多个错误类别
      • 标签打错了
      • 如何修正错误标签
      • 快速地构建一个简单的系统
      • 验证集要反应出真实目的
      • 异源时的训练验证集
      • 不常用的误差分析
      • 如何解决异源问题
      • 迁移学习
      • 如何实现迁移学习
      • 什么时候才应该使用迁移学习?
      • 多任务学习
      • 深度理解多任务学习
      • 一步到位——端到端学习
      • 何时用端到端
      • 如何制作数据集
      • 试题
  • 智能视觉
    • 1 卷积神经网络
      • 智能视觉
      • 卷积运算
      • 边缘检测
      • 深入理解边缘检测
      • padding
      • 卷积步长
      • 3D卷积
      • 多过滤器
      • 卷积层
      • 池化层
      • 池化层(二)
      • 一个较完整的卷积网络
      • 卷积的好处
      • 【实战编程】手把手教你构建卷积神经网络(一)
      • 【实战编程】手把手教你构建卷积神经网络(二)
      • 【实战编程】使用TensorFlow构建卷积神经网络
    • 2 深度卷积网络
      • 学习一些牛逼的例子
      • LeNet-5
      • AlexNet
      • VGG
      • 残差网络
      • 为什么残差网络能防止梯度问题
      • 1×1卷积
      • Inception网络
      • inception网络与1×1卷积
      • 完整的inception网络
      • 学会利用开源项目
      • 学会使用迁移学习
      • 学会使用数据增强
      • 智能视觉领域的现状
      • 【实战编程】构建残差网络
    • 3 目标检测
      • 目标定位
      • 关键点探测
      • 滑动窗口探测法
      • 全连接层转卷积层
      • 卷积化滑动窗口
      • YOLO探测法
      • 如何判断定位是否精准
      • 如何避免一个物体被重复探测到?
      • 非极大值抑制的实现细节
      • 两个物体的中心在同一个格子怎么办?
      • 【实战编程】自动驾驶之车辆探测
    • 4 风格转换
      • 差异性验证
      • 如何实现差异性验证
      • 如何训练差异性验证网络
      • 差异性验证网络的训练技巧
      • 差异性验证网络的另一种训练方法
      • 神经网络每层到底都学会了什么?
      • 神经风格迁移网络
      • 内容损失函数
      • 【实战编程】风格转换
      • 【实战编程】人脸识别
      • 试题
  • 智能语音
    • 1 循环序列模型
      • 序列模型
      • 序列模型的数据集
      • 普通模型不适合处理序列数据
      • 循环神经网络RNN
      • RNN的计算过程
      • RNN的反向传播
      • 各种结构的RNN
      • 人工智能写作
      • 普通RNN的记性不好
      • 使用LSTM来增强RNN的记忆力
      • 使用GRU来增强RNN的记忆力
      • 双向循环神经网络BRNN
      • 深度RNN
      • 【实战编程】纯pyhon构建RNN
      • 【实战编程】智能写作
      • 【实战编程】智能音乐
      • 【实战编程】智能作曲
    • 2 自然语言处理与词嵌入
      • 什么是词嵌入
      • 如何使用词嵌入技术
      • 词嵌入与类比推理
      • 如何得到词嵌入矩阵表
      • word2vector模型
      • 负采样
      • Glove模型
      • 情感分类
      • AI的偏见
      • 【实战编程】类比推理
      • 【实战编程】智能表情
      • 【实战编程】智能表情-升级版
    • 3 序列模型和注意力机制
      • seq2seq简介
      • 最佳翻译
      • Beam搜索
      • Beam搜索升级版
      • 问题是否出在Beam搜索上
      • 如何判断翻译得是否精准
      • 注意力模型
      • 注意力模型详述
      • 如何设置注意力权重?
      • 语音识别
      • 唤醒词检测
      • 【实战编程】机器翻译
      • 【实战编程】唤醒词检测
  • 大模型
    • 1 大模型前世今生
      • 大模型横空出世
      • 为什么是“大”模型?
      • 趣味溯源
    • 2 内部构造
      • Transformer
      • 自注意力机制
      • 预训练+微调
      • Tokenizer
    • 3 预训练
      • 无监督学习
      • 掩码语言模型(MLM)
      • 自回归生成
      • 算力玄学
    • 4 微调与对齐
      • 指令微调
      • RLHF
      • 对齐的坑
      • 实操小实验
    • 5 核心技能
      • 文本生成
      • 理解与推理
      • 工具使用
    • 6 翻车现场
      • 幻觉生成
      • 逻辑混乱
      • 偏见与歧视
      • 避坑指南
    • 7 实操乐园
      • 本地部署
      • 提示词(Prompt)工程
      • 模型压缩与量化
      • 趣味项目
    • 8 进化方向
      • 轻量化革命
      • 定制时代
      • 多智能体
      • 新模型架构
  • 智能体Agent
    • 1 什么是Agent
      • 应用领域
      • 智能体的进化
      • 核心特质
      • 生活中的Agent
      • 技术边界
    • 2 发展与应用
      • 发展脉络
      • 应用领域
      • 框架与平台
    • 3 组成模块
      • 感知模块
      • 决策模块
      • 执行模块
      • 记忆模块
      • 工具调用模块
      • 协作模块
    • 4 技术底座
      • 编程语言基础
      • 接口与网络
      • 数据处理基础
      • 脚本化编程
    • 5 大模型LLM
      • Agent的大脑
      • 基础使用
      • Prompt工程
      • 局限性
    • 6 向量数据库
      • 为什么被需要
      • 通俗理解
      • 主流向量库速览
      • 使用chroma
      • 记忆的落地思路
    • 7 开发第一个Agent
      • 开发准备
      • 需求定义
      • 代码实现
    • 8 工具调用
      • 选择与执行
      • 常用工具封装
      • 集成多工具
    • 9 多Agent协作
      • 核心模式
      • 通用协作框架
      • 协作优化
    • 10 性能优化
      • 决策优化
      • 执行优化
      • 资源优化
      • 容错优化
    • 11 部署与上线
      • 部署方式选择
      • Docker容器
      • 接口封装
      • 监控与日志
    • 12 与现有系统集成
      • 与后端集成
      • 与自动化工具集成
      • 与前端集成
    • 13 开发框架
      • LangChain
      • AutoGPT
      • 国产框架
      • 框架选择
  • RAG
    • 1 RAG前世今生
      • 大模型的致命短板
      • 极简定义
      • 微调与Prompt工程
    • 2 核心逻辑
      • 通俗类比
      • 标准RAG工作流
      • 重看RAG
      • 整体架构
    • 3 向量数据库
      • 向量是什么
      • 为什么要向量化
      • 主流向量库速览
      • 向量检索原理
    • 4 文档处理
      • 文本清洗
      • 分块(Chunk)
      • 元数据加持
      • 进阶分块
    • 5 检索模块
      • 稀疏检索VS稠密检索
      • 混合检索
      • 重排序(Rerank)
      • 检索效果评估
    • 6 生成模块
      • 上下文窗口
      • 给LLM喂资料
      • 优化LLM生成
      • 避免幻觉
    • 7 极简起步
      • 环境准备
      • 最小可行RAG
      • 本地知识库问答
    • 8 数据工程
      • 多格式文档处理
      • 非结构化数据清洗
      • 知识库构建流程
      • 增量更新
    • 9 进阶调优
      • 检索优化
      • 分块调优
      • 向量模型选型
      • 提示词工程
      • 深度学习微调思路
    • 10 评估与迭代
      • 自动评估指标
      • 人工评估方案
      • 错误分析
      • 持续迭代
    • 11 进阶RAG架构
      • Advanced RAG
      • Modular RAG
      • 自适应RAG
      • 多跳检索
    • 12 RAG+
      • RAG+微调
      • RAG+注意力机制
      • RAG+多模态
      • 长文本RAG
    • 13 多模态RAG
      • 多模态Embedding
      • 多模态检索与生成
    • 14 RAG性能与工程化
      • 速度优化
      • 分布式部署
      • 成本控制
      • 监控与运维
    • 15 行业实战案例
      • 企业内部知识库问答
      • 客服智能问答系统
      • 学术文献检索与总结
      • 法律/医疗专业领域RAG
    • 16 RAG踩坑大全
      • 检索不准
      • 生成幻觉
      • 性能拉胯
      • 数据安全
    • 17 RAG未来趋势
      • RAG+Agent
      • 端侧RAG
      • 无向量库RAG
  • 多模态AI编程
    • 1 多模态AI是什么
      • 模态是什么
      • 多模态AI简史
      • 环境搭建
    • 2 核心逻辑
      • 单模态回顾
      • 跨模态对齐
      • 特征融合
      • 交互范式
      • 通俗比喻
    • 3 经典模型拆解
      • CLIP
      • 代码实战
      • BLIP系列
      • FLAVA
      • 避坑指南
    • 4 图文多模态编程
      • 图文生成
      • 视觉问答VQA
      • 图文标注与数据集
      • 趣味案例
    • 5 进阶多模态
      • 文生音/音转文
      • 视频多模态
      • 3D多模态
      • 多模态融合实战
    • 6 大模型时代的多模态
      • 大模型+多模态
      • 开源多模态大模型部署
      • 指令微调
      • LoRA
      • 实战
    • 7 训练核心技巧
      • 数据处理
      • 损失函数
      • 训练策略
      • 评估指标
      • 常见Bug排查
    • 8 工业级部署
      • 模型压缩
      • API服务搭建
      • 前端对接
      • 移动端/边缘端部署
    • 9 未来与避坑
      • 下一代多模态
      • 合规与版权
      • 面试高频考点
  • AI工程化
    • 1 AI工程化是什么
      • 深度学习≠AI工程化
      • 从“炼丹师”到“工程师”
      • 工业级AI的核心标准
    • 2 必备基础
      • 工程后遗症
      • 工程化四大金刚
      • 工程化差异
      • 工程化黑话
    • 3 数据治理
      • 上线三大杀手
      • 工业级数据 pipeline
      • 数据漂移
      • 数据治理方案
    • 4 数据pipeline工具化
      • 数据版本管理
      • 数据流水线
      • 工程化trick
    • 5 模型瘦身
      • 模型推理慢
      • 四大瘦身术
      • 优化优先级
      • 瘦身不瘦效果
      • 避坑
    • 6 编译与加速
      • 框架选择
      • 加速选择
      • 一键加速流程
      • 实测对比
      • 多模型并发
    • 7 部署入门
      • 部署到底在干嘛
      • 快速搭服务
      • 模型封装
      • 三步测试不翻车
      • 部署模板
    • 8 容器与编排
      • 为什么要容器化
      • Docker容器
      • Kubernetes
      • 一键打包部署
    • 9 云端部署与边缘部署
      • 公有云AI部署
      • 边缘部署
      • 多环境部署兼容
    • 10 监控
      • 三大隐形杀手
      • 必须监控什么
      • 需要“体检”和“吃药”
      • 低成本监控方案
    • 11 运维
      • AI服务三件套
      • 如何扛住压力
      • 模型热更新
      • 回滚机制
    • 12 持续迭代
      • MLOps不是玄学
      • 全自动闭环
      • 极简MLOps
  • AI金融量化
    • 1 金融量化
      • 量化交易的本质
      • AI量化
      • 金融圈的黑话
    • 2 核心逻辑
      • 金融数据
      • AI在量化里能做什么
      • AI在量化里不能做什么
      • AI量化流程
    • 3 数据
      • 金融数据分类
      • 开源数据去哪找
      • 数据清洗
      • 特征工程
    • 4 数据预处理
      • 标准化/归一化
      • 时序数据处理
      • 数据集划分
      • 数据增强
    • 5 基础款
      • MLP
      • CNN
      • 模型评估
    • 6 主力款
      • 搞定金融时序
      • 门控机制
      • 优化技巧
    • 7 进阶款
      • Transformer入门
      • 自注意力机制
      • 多因子选股
      • 优势与短板
    • 8 网红款
      • GNN
      • 联动选股策略
      • 适用场景与局限性
    • 9 策略设计
      • AI适配哪种策略
      • 信号生成
      • 仓位管理
      • 止盈止损
    • 10 回测
      • 回测框架选择
      • 回测核心参数
      • 幸存者偏差
    • 11 多模型融合
      • 单一模型不够用
      • 模型融合
      • 融合选股策略
    • 12 风控
      • 金融风控核心
      • 风控模型
      • 仓位风控
    • 13 从模拟到实盘
      • 模拟盘测试
      • 实盘接口对接
      • 实盘监控
      • 实盘优化
    • 14 新手必踩大坑
      • 过度拟合
      • 数据泄露
      • 盲目追新模型
      • 忽略交易成本
  • 类脑SNN
    • 1 为什么需要SNN
      • 深度学习与大脑
      • 三大痛点
      • 脉冲神经网络
    • 2 看懂大脑
      • 神经元不是计算器
      • 突触、脉冲、阈值
      • 不必学生物
    • 3 核心单元
      • 神经元放电
      • 膜电位、阈值、不应期
      • 时间维度
      • 脉冲是怎么产生的
    • 4 编码与表示
      • 速率编码
      • 时间编码
      • 编码怎么选?
      • 与传统网络的区别
    • 5 网络结构
      • FC-SNN
      • SCNN
      • 归一化SNN
      • 对比RNN/Transformer
    • 6 不玩BP
      • 为什么反向传播失效
      • STDP
      • 近似梯度
      • SNN的天然优势
    • 7 ANN转SNN
      • 转换训练
      • 权重转换
      • CNN一键变SNN
    • 8 第一个SNN
      • 工具与环境
      • 手写数字识别SNN
      • SNN专属技巧
    • 9 类脑硬件与落地
      • 类脑芯片
      • 事件相机+SNN
      • 低功耗边缘AI
      • 工业界真实现状
  • 强化学习
    • 1 什么是强化学习
      • RL到底在干嘛
      • RL四大件
    • 2 RL底层逻辑
      • MDP
      • 贝尔曼方程
      • RL世界观
      • 从表格到神经网络
    • 3 从Q表到DQN
      • Q表太笨
      • DQN两大神技
      • 手撕极简DQN
      • 训练崩溃怎么救
    • 4 DQN全家桶
      • Double/Dueling/Noisy DQN
      • 为什么这么改
      • 奖励设计
      • 让你的AI不再原地发呆
    • 5 策略梯度
      • 价值-based vs 策略-based
      • 策略梯度定理
      • REINFORCE
      • 梯度怎么回传
    • 6 Actor-Critic
      • AC架构
      • A2C
      • 深度学习视角搭建AC
      • 通往PPO的必经之路
    • 7 PPO
      • OpenAI为什么最爱PPO
      • 别更新太猛
      • 截断PPO
    • 8 连续动作空间
      • 连续动作是什么
      • DDPG
      • TD3
      • SAC
      • 三选一怎么选
    • 9 RL的灵魂
      • 奖励要写好
      • 稀疏奖励
      • 辅助奖励
      • 训练技巧
    • 10 前沿与未来
      • ChatGPT背后的RLHF
      • 大模型对齐极
      • DPO

© 2026 人工智能学习网 沪ICP备15025210号