人工智能
Chapter 1 概论
什么是人工智能?
- 人工:人造的
- 智能:待解释(思考和理解的能力)
- 人工智能
- 数据→经过约定→信息
- 认识
- 知识 认识的关系或联系
什么是机器学习?
大量数据训练的模型去做未来的预测
模型 约等于 函数
函数好不好取决于参数
机器学习就是调参
深度学习可以拟合任意函数
学派
三个学派
- 符号主义
- 连接主义
- 行为主义
机器学习概论
实现人工智能的手段
- 识别和预测式机器学习的主要内容
- 要解决的问题中存在某种模式
- 这种模式不容易直接定义
- 有足够的数据可以帮助我们找出此模式
发展历史
- 起源 1956 达特茅斯会议
- 一起 感知机
- 一落 感知机机理问题
- 二起 专家系统
- 二落 路线问题和计算能力
- 三起 大数据和互联网
- 知识是人们在改造客观世界中积累的认识和经验
- 知识表示是对知识的描述,用一组符号把知识编码成计算机理解的结构(对知识建模)
Chapter 2 知识表示和知识图谱
状态空间法
- 组成
- 状态(state) 表示问题解法中每一步问题状况的数据结构
- 算符(operator) 把问题从一种状态转为另一种状态的手段
- 状态空间方法 一个表示问题全部可能状态及其关系的图
- 状态空间可计为三元状态(S,F,G)
- S 初始状态集合
- F 操作符合集
- G 目标状态集合
- 定义问题状态的描述形式
- 定义操作符
- 穷举做题
- 代价小
- 步骤少
问题归约法
- 组成
- 一个初始问题描述
- 一套把问题变换为子问题的操作符
- 一台本原问题描述
- 本质:把问题描述变换为子问题描述
- 与或树表示
- 与树:两个与节点有小段圆弧
- 或树
- 端节点:没有子节点的节点
- 终止节点:本原问题对应的节点
- 终止节点一定是端节点,端节点不一定是终止节点
- 不可解节点
- 没有后裔的非终止节点
- 有后裔但全部后裔是不可解的的非终止节点(与)
- 有后裔但有一个后裔是不可解的的非终止节点(或)
- 不可解节点用小圆圈表示 。
- 解树:由可解节点组成,一定有可解的初始状态
谓语逻辑法
- 语法语义 谓词符号、变量符号、函数符号和常量函数
- 连词量词 原子公式、连词($\wedge \vee \neg \Rightarrow$(蕴含) )、量词(全称量词$\forall x$ 存在量词$\exists x$)
- 置换合一
- 定义谓词和个体
- 把个体代入谓词
- 使用连接词连接
题目
例1:李明是个学生,他住的房间是白色的。
Isa(Liming, Student)∧Lives(Liming,House1)∧Color(House1, White)
例2:李明在学校的话,Wang也在学校。
At(Liming,School) => At(Wang, School)
例3:所有机器人都是灰色的
($\forall x$)[ROBOT(x)=>COLOR(x, GRAY)]
例4:条条大路通罗马
($\forall x$)[ Road(x)=> Lead(x, Roma) ]
例5:Mary给每个人一本书
($\forall x$)($\exists y$)[ Person(x)∧Book(y)∧Give(Mary,x,y) ]
例6:人人爱运动
例7:自然数都是大于等于零的整数
N(x):x是自然数
I(x):x是整数
GZ(x):x大于等于零
语义网络法
- 组成
- 词法部分 词汇表符号(节点和弧线)
- 结构部分 约束条件(节点对)
- 过程部分 访问过程
- 语义部分 与描述相关的方法(确定节点的排列及其占有物和对应弧线)
- 分类
- 二元语义网络
- 多元语义网络
- 确定问题中的所有对象以及各对象的属性
- 确定对象间的关系
- 下层节点会继承上层节点的属性,整理共同属性写入上层节点,避免冗余
- 将各对象作为语义网络的一个节点,而各对象间的关系作为各节点之间的弧
知识图谱
- 知识抽取
- 知识表示
- 知识融合
- 知识推理
知识图谱以结构化的形式描述客观世界中概念、实体及其关系
归纳演绎
- 先定义谓词
- 将已知事实和目标用谓词公式表示出来
- 降上述已知事实和目标的否定化成子句集(取反)
- 应用归结过程
例子
如果x是y的父亲,y是z的父亲,则x是z的祖父
每个人都有一个父亲
证明:对于某人u,一定存在一个人v,v是u的祖父
Chapter 3 搜索和推理
复杂问题的搜索,就是推理
搜索是问题到问题解决的路径
图搜索策略
盲目搜索🔍
- 宽度优先 一定可以找到最优解
- 深度优先
- 等代价搜索
启发式搜索🔍
- 估价函数
- 排序时估算节点“希望”的量度
- $f(n)=g(n)+h(n)$
- $g(n)$ 当前节点n的代价
- $h(n)$ 节点n到目标节点的估计代价
- 贪婪最佳优先搜索GBFS
- 优先搜索算法离目标最近的节点
- 只用启发式信息
- 即$f(n)=h(n)$
- A*搜索
- $f(n)=g(n)+h(n)$
- 可采纳性 $0≤h(N)≤h*(N)$ 估计代价小于等于真实代价
- 一致性
- 当启发式函数满足一致性时,A*算法是最优的
Dijkstra算法
不能有负权边
推理
精确推理
精确推理指的是根据已知信息或数据,严格按照逻辑规则或数学模型进行推理,以得出一个确切的结果或结论。这种方法通常用于概率图模型(如贝叶斯网络)、逻辑推理系统等。
不精确推理
不精确推理是指在无法通过精确方法获得答案或者精确方法计算成本过高的情况下,使用近似的方法来获取接近真实值的答案。这包括但不限于采样方法、变分推理等技术
精确和不精确区别就是结果或者说结论不一样
假言推理和假言三段论
Chapter 4 遗传算法
迭代式自适应概论性搜索算法
题外
- 选模型就是选函数样子
- 线性模型 $f(x)=wx+b$
- SVM 超平面 $\dfrac{1}{\left| w\right|}$ 离最近的点距离都是1
引入
- 遗传
- 选择
- 变异
- 遗传算法是通过保持在解空间不同区域中各个点的搜索
- 染色体:多个基因的集合
- 基因 遗传因子
- 基因型 表现型
- 个体 群体
- 适应度函数:各个个体自适应环境的程度函数
- 选择:从群体中选择某个个体的方法
- 交叉(杂交)
- 变异
- 编码:表现型→基因型
- 解码:基因型→表现型
介绍
- 编码
- 二进制
- 适应度函数
- 由目标函数变换成
- 适应度定标
- 未成熟收敛
- 特有现象
- 达到局部最优解或未有解但是无法继续选择
选择
- 适应度函数数值比例法
- 随机变量值决定哪个个体被选中☑️
- 随机竞争选择
- 选择一对个体,让这对个体进行竞争,适应度高被选中,反复直到选满为止🈵
- 排位次法
- 按照适应度函数值依次排序,给每一个次序一个固定概率
- 也就是说适应度函数值与概率线性正相关
- 最优保存法
- 排位次法➕最优解保留
交叉
选择后进入交配池交叉
- 一点交叉
- 允许染色体的切断点只有一个
- 产生与原配对个体完全不同的自带个体
- 不会改变原配对个体中相同位置上的值
- 交叉方法:随机产生交叉位置,交叉位置后(尾部)互换
- 多点交叉
- 允许染色体的切断点有多个
- 有屏蔽位 0不交叉 1交叉
- 按照屏蔽位进行交叉❌
变异
以极小的概率进行码位翻转(01翻转)
停止准则
- 最优个数的适应度