这近一年来,我在国科大修了:人工智能导论、机器学习与模式识别、语义网络与知识图谱、深度学习、强化学习……这几门专业课,由于发现了它们彼此之间有重复的知识点,真想把他们融会贯通一下,至少写个提纲挈领的东西给自己和后人看。
课上最令人沮丧的是缺少专业名词的翻译和解释,导致后来就听的云里雾里浪费时间和精力。
一、纲要
首先是导论课程的老师给分的几大类:
1-问题求解与搜索
2-知识表示与推理(知识图谱)
3-神经网络与学习(深度学习、强化学习)
然后是工程数学和信息论中的比较重要的东西
矩阵论
梯度下降与反向传播
马尔可夫性
信息与不确定性(概率)
信息熵,交叉熵
再然后是共用的东西(一些频繁出现的词)
蒙特卡洛算法(Monte Carlo)
支持向量机(SVM)
贝叶斯网
最后是特种的处理方法与架构
Transformer(自我注意力)
softmax(归一化指数函数)
聚类(K-means……)
全连接(FC)
卷积(CNN)
循环神经网络(RNN)
二、几款课程的侧重点和简介
模式识别
侧重于特征的提取
深度学习
侧重于对数据集的训练
强化学习
侧重于智能体和环境的交互
知识图谱
侧重于推理(实体-关系-事件)
三、那些数学公式都是什么意思?
这里仅列举最常见到的一些公式套路,就像中学解物理题时的“设时间为t”这种约定俗成的东西。
对于梯度反向传播
正向累计,反向求导,更新权重
对于带有概率与信息熵
loss曲线
四、关于几个我没学习时的问题的解答
1,什么是调参?为什么要去“炼丹”?
深度学习中,超参数需要根据不同数据集调整
2,拟合这种东西,是怎么AI绘图把像素还原回去实现的?
回归和极大似然估计
3,“监督式学习”“无监督式学习”……那些分类是什么东西啊
其实按这种分类有很多呢……
个性化推荐、聚类分簇(数据挖掘)、搜索和排名、特征提取
结语
不知道是不是冥冥之中自有天意,我的志向是生物,但本科学计算机知道体系结构是如何组成,了解了计算机底层是如何运行的后,再来学人工智能去实现人的智能——但这恰恰是最为通顺的路!
为实现和改进而产生的方法有很多很多,不再详细介绍。