写在前面: 开启新的学习模块——“神经网络与深度学习”。参考书目:《神经网络与深度学习》,版本。纯小白级别的入门选择,将会在此记录一点读书的思考和感悟,如果有志同道合的小伙伴感兴趣可以一起。今天读的是第一章绪论的内容,从一个大局观的角度带领读者领略了机器学习(ML)的基础知识。我读完之后觉得建立起来了对于机器学习的大致印象,没有难以理解的鸿沟,但是需要通过这种自我梳理的方式使得我对这部分的知
# 如何使用 FastNLP 实现自然语言处理模型 ## 一、背景介绍 FastNLP 是一个高效且易用的自然语言处理框架,由教授开发。它广泛用于文本分类、命名实体识别、文本生成等任务。本文将详细介绍如何使用 FastNLP 来实现一个简单的文本分类任务。 ## 二、流程概述 首先,我们需要了解实现 FastNLP 的大致流程。以下是一个简单的步骤表格: | 步骤
原创 2024-09-04 04:42:43
69阅读
自然语言处理中的预训练模型1、自然语言表示学习1.1 什么是自然语言处理(NLP)自然语言≈人类语言,不同于人工语言(如程序语言);1.2 NLP的基础:语言表示如何在计算机中表示语言的语义?知识库规则分布式表示句子嵌入1.3 自然语言处理任务序列到类别-情感分类/文本蕴含同步的序列到序列-中文分词异步的序列到序列-机器翻译1.4 NLP的语义组合语言的性质:层次性/递归性/序列性语义组合:句子的
大纲:(1)概述:机器学习概述、感知器、应用(2)基础模型:前馈神经网络、卷积神经网络、循环神经网络、网络正则化与优化、应用(3)进阶模型:注意力机制与外部记忆、无监督学习、概率图模型、深度生成模型、深度强化学习、模型独立的学习方式 整理的知识点:1. 机器学习历史:1950~1965(规则+知识)、1970~1985(专家系统)、1985~2005(统计浅层学习)、2005~至今(统计
本报告主要回顾词法、句法领域的最新研究进展。关于报告人:,复旦大学计算机科学技术学院副教授,博士生导师。于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,在 ACL、EMNLP、IJCAI 等计算机学会 A/B 类期刊、会议上发表 50 余篇学术论文,引用 1600 余次。开源中文自然语言处理工具 FudanNLP 作者。2015 年入选首届中国科协
  复旦自然语言处理(简称FNLP),是上海复旦大学计算机学院教授(微博:@)带领的团队研发出的一套基于机器学习的中文自然语言文本处理的开发工具包,该工具包包含了为实现这些任务的机器学习算法和数据集。  目前,教授是复旦大学计算机学院媒体计算研究所成员,主要研究方向是自然语言处理、自动问答系统以及统计机器学习。教授所在团队也是国内最早从事自然语言处理的课题组之一,学术带头人
卷积神经网络(CNN)是一种具有局部连接、权重共享等特性的深层前馈神经网络。卷积神经网络最早主要是用来处理图像信息。在用全连接前馈网络来处理图像时,会存在以下两个问题:(1)参数太多:随着隐藏层神经元数量的增多,参数的规模也会急剧增加。这会导致整个神经网络的训练效率非常低,也很容易出现过拟合。(2)局部不变形特征:自然图像中的物体都具有局部不变性特征,比如尺度缩放、平移、旋转等操作不影响其语义信息
转载 2020-02-20 22:05:00
233阅读
复旦组最新综述:A Survey of TransformersA Survey of Transformers Transformers已经在人工智能诸多领域,如NLP.CV,声音处理等方面取得进展,也受到学术界和工业界的广泛关注。目前也已经提出了一系列Transformer的变体,称之为X-Formers,但是却没有对这些X-formers进行系统、全面的综述文章。因此本文对这方面的工作
人工神经网络是指一系列受生物学和神经科学启发的数学模型。在本章中,主要关注采用误差反向传播来进行学习的神经网络,即作为一种机器学习模型的神经网络。从机器学习的角度来看,神经网络一般可以看作是一个非线性模型,其基本组成单元为具有非线性激活函数的神经元,通过大量神经元之间的连接,使得神经网络成为一种高度非线性的模型。神经元之间的连接权重就是需要学习的参数,可以在机器学习的框架下通过梯度下降方法来进行学
入门深度学习的最大阻碍是啥,课程资料太少、难度太大?可能对于大部分中国AIer来说,语言门槛高过了一座大山。网红课虽好,但是英语听不懂啊。现在,一套口碑巨佳的中文版深度学习书更新了,这套书名叫《神经网络与深度学习》,复旦大学老师出品,从语言上先把不必要的门槛降低了。它面向深度学习小白,从人工智能的基本概念开启,可以说超级友好了。此外,可以附加的全部资料一站式配齐,从教材、讲解PPT、示例代码
# 如何实现“ 神经网络” ## 简介 在这篇文章中,我将向你介绍如何实现“ 神经网络”。作为一名经验丰富的开发者,我将引导你完成这个任务,并为你提供每个步骤中所需的代码。 ## 整体流程 下面是实现“ 神经网络”的整体流程,我们将按照这个步骤来进行实现。 ```mermaid sequenceDiagram participant 小白 participant
原创 2023-10-02 09:06:55
65阅读
第二章习题2-1 分析为什么平方损失函数不适用于分类问题解答:在使用One-Hot编码表示分类问题的真实标签的情况下,我们使用平方损失函数计算模型的预测损失时会计算预测标签中每一个类别的可能性与真实标签之间的差距。 若我们想要得到更小的损失则需要模型预测得到的预测标签整体与One-Hot编码的真实标签相近,这对于模型来说计算精度要求过高,在分类我们上我们往往只关注模型对数据的真实类别的预测概率而不
# 如何实现“的深度学习” ## 简介 深度学习是一种机器学习的方法,它模仿人脑神经网络的工作原理,通过构建多层的神经网络来实现对数据的学习和预测。是深度学习领域的专家,他的研究成果为深度学习的发展做出了重要贡献。本文将教会你如何实现“的深度学习”。 ## 整体流程 首先,我们来看一下实现“的深度学习”的整体流程。可以用以下表格展示: | 步骤 | 动作 | |
原创 2023-12-19 12:53:06
71阅读
关于封面插图第1章 大数据世界中的数据科学1.1 数据科学和大数据的好处和用途1.2 数据种类1.2.1 结构化数据1.2.2 非结构化数据1.2.3 自然语言数据1.2.4 计算机数据1.2.5 图类数据1.2.6 音频、视频和图像数据1.2.7 流数据1.3 数据科学过程1.3.1 设置研究目标1.3.2 检索数据1.3.3 数据准备1.3.4 数据探索1.3.5 数据建模1.3.6 展示与自
实验1:线性回归的参数优化-最小二乘法 1 最小二乘法原理基于均方误差最小化进行模型求解。线性回归中,试图找到一条直线,使所有样本到直线的欧氏距离之和最小。(西瓜书P54)图源:NNDL P34 2 最小二乘法优化公式(参考书中第二章 2.3中的公式),在main()中利用训练集训练模型的参数w,并且返回模型。NNDL P34 3 最小二乘法实现在numpy中可以使用numpy.lina
整理:zenRRan:大家在知乎做了讨论,原链接如下:https://www.zhihu.com/question/495487596晴天的芝麻饭团我在这个领域中只能算是个萌新,所以对这些的看法还可能不是很成熟,请见谅。依我看,“Visually Grounded Reasoning across Languages and Cultures“ 作为best long paper完美的突出了
1.分析为什么平方损失函数不适用于分类问题        分类问题中的标签,是没有连续的概念的。每个标签之间的距离也是没有实际意义的,所以预测值和标签两个向量之间的平方差这个值不能反应分类这个问题的优化程度。假设分类问题的类别是1,2,3。那么对于一个真实类别为2的样本X,模型的分类结果是 1 或 3,平方损失函数得到的结果都一样。2.在线性回归中,如果我们
转载 2023-09-20 21:20:02
110阅读
摘要Transformers 在自然语言处理、计算机视觉和音频处理等许多人工智能领域都取得了巨大的成功。因此,自然会引起学术界和工业界研究人员的极大兴趣。到目前为止,各种各样的Transformer变种(即X-formers)已经被提出,但是,关于这些Transformer器变种的系统和全面的文献综述仍然缺乏。在这项综述中,我们提供了一个全面的Transformer综述。我们首先简单介绍了普通的T
神经网络与机器学习笔记【1】1.机器学习2.表示学习3.深度学习4.端到端学习5.神经网络 最近在读老师推荐读的 《神经网络与机器学习》 一书,这本书是 教授所著,内容所讲的基于神经网络的深度学习方法是近年来经过大量实践并取得很好成果的一种很通用的方法,也是近年来人工智能领域中最活跃的分支之一。 由于我目前的研究方向主要为语音识别方向,所以就希望能够在教授所著的这本书中求得一些科学
# 深度学习项目报告的实现流程 本文将指导你如何撰写“深度学习项目报告”。作为一名新手,掌握整个流程和基本代码示例将是实现这个项目的关键。我们将会分步进行,确保你理解每一步的意义。 ## 项目流程 首先,了解整个项目的步骤是很重要的。以下是实现“深度学习项目报告”的流程表: | 步骤 | 描述 | |------|------| | 1 | 确定项目主题和目标 | | 2
原创 2024-10-20 07:46:32
100阅读
  • 1
  • 2
  • 3
  • 4
  • 5