CV方向:(object detection, semantic segmentation, 人脸,姿态,视觉重建,图像恢复生成(gan),识别分类等)  面试经验总结:对自己项目的每个细节都了解清楚,多总结面试 对基本知识点的掌握要清晰,不能模棱两可 对算法公式的掌握要细致,防止推公式。  需要准备的:论文,实习经历,项目(硬            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-05 20:16:43
                            
                                53阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            ## 科普文章:算法在NLP和CV中的应用
### 导言
在当今数字化时代,人工智能技术已经成为各行各业的热门话题。而在人工智能领域中,自然语言处理(NLP)和计算机视觉(CV)是两个重要的分支,而算法则是这两个领域的核心。本文将介绍算法在NLP和CV中的应用,并通过代码示例展示其功能。
### 算法在NLP中的应用
自然语言处理是人工智能领域的一个重要分支,旨在实现计算机与人类自然语言之            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-04-25 06:38:40
                            
                                41阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            kaiming的MAE和年初的CLIP可能是今年CV领域唯二的重磅文章,有预感MAE会成为CV领域和BERT地位相当的一篇文章。从BERT和MAE的形态上来说,都引入了mask机制来做无监督预训练,但是又因为vision和language两种模态上本质的不同,导致mask的设计上和整体框架上有所区别。从NLP的Transformer到BERT,然后到CV的ViT、BEiT,CV领域的无监督预训练经            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-08 13:35:22
                            
                                45阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            CV和NLP领域的Transformer原理和实践在2017年,Transformer模型由论文《Attention is all you need》提出,最开始被应用于机器翻译任务上并取得了很好的效果。它摒弃了传统LSTM的串行结构,使用了基于Self Attention的模型结构,具有更好的并行计算能力,这使得它在大规模数据模型训练方面更有优势。后来基于Transformer结构的模型大放异彩            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-18 21:52:02
                            
                                89阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            0、旅行商问题背景此文是面向的任意出发点,走封闭路线的最优寻找(其实如果封闭了,一旦收敛,就是轨迹确定,其实就无所谓从哪里出发,走得什么方向了)并把从出发点到终点再到出发点的每两个城市间的距离之和来作为个体的适应度1、bug总结基本上都是一些低端错误,看着图一乐就好(1)最大错误:以i为循环变量进行,每一generation的迭代,在循环体里面的小循环中不小心也用i做了循环变量,导致总循环次数出错            
                
         
            
            
            
            【关于 BatchNorm vs LayerNorm】那些你不知道的事一、动机篇1.1 独立同分布(independent and identically distributed)与白化独立同分布 
  为什么? 
    独立同分布的数据可以简化常规机器学习模型的训练、提升机器学习模型的预测能力相关性: 
    强相关:Naive Bayes 模型就建立在特征彼此独立的基础之弱相关:Logis            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-11 20:04:20
                            
                                159阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            论文题目:Forward and Backward Information Retention for Accurate Binary Neural Networks文献地址:https://arxiv.org/abs/1909.10788源码地址: https://github.com/htqin/IR-NetIR-Net应用中的效果  作者使用了两个基准数据集:CIFAR-10和ImageNe            
                
         
            
            
            
            在机器学习和深度学习的快速发展时代,计算机视觉(CV)算法和自然语言处理(NLP)算法的模型指标测试显得尤为重要。随着模型架构的不断演进和应用场景的复杂化,我们需要一种系统的方式来评估这些算法的性能。这篇博文将详细记录处理“CV算法NLP算法等模型指标测试”问题的过程。
让我们从时间轴上的几个重要节点开始回顾模型指标测试的演变历程:
1. **2010年**:深度学习的广泛应用开始。
2. *            
                
         
            
            
            
            有些人可能会问,“推荐算法是nlp还是增长算法?”这个问题其实不仅仅是理论上的讨论,而是涵盖了如何从技术层面理解推荐系统的设计与应用。在这篇博文中,我们将通过不同维度来解析这个问题。
### 背景描述
在我们进入技术细节之前,让我们首先了解推荐算法的背景。
 
1. **推荐算法的起源**:
   - 最初的推荐系统是基于传统的过滤方法。
   - 随着深度学习和NLP的发展,推荐算法也开始逐            
                
         
            
            
            
            CV是让机器睁开眼睛看世界,而NLP更多的是让机器听懂人类的话。因为本人文科不是那么好,理解能力比较一般,再加上CV是那么的形象直观,所以我一直以来都对NLP敬而远之。不过,在参加了百度的《手把手教深度学习》课程之后,突然感觉NLP似乎也没有那么难,至少入门使用什么的还是很轻松的。自然语言处理(NLP)自然语言处理(Natural Language Processing,简称NLP)主要研究人与计            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-21 21:26:04
                            
                                0阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            # GAN 是 CV 还是 NLP?
生成对抗网络(GANs,Generative Adversarial Networks)是一种深度学习框架,最早由 Ian Goodfellow 等人在 2014 年提出。它在计算机视觉(CV,Computer Vision)和自然语言处理(NLP,Natural Language Processing)领域都有广泛的应用。那么,GAN到底是更偏向于 CV            
                
         
            
            
            
            推荐算法通常被分为四大类(1-4):协同过滤推荐算法基于内容的推荐算法混合推荐算法流行度推荐算法 除了这些种类以外,还有一些高级非传统的推荐算法(5)。推荐算法综述是分文五个部分的系列文章,本文作为第一篇,将会简要介绍推荐系统算法的主要种类。其中包括算法的简要描述、典型的输入、不同的细分类型以及其优点和缺点。在第二和第三篇中,我们将会详细介绍这些算法的区别,让你能够深入理解他们的工作原理。系列文章            
                
         
            
            
            
            思维导图:https://www.processon.com/diagraming/5c6e214ee4b056ae2a10eb9c本文争取以最短的文字,最简单的语言来描述NLP流程与w2v,详细原理会提供相应的链接.写到一半发现还是有很多地方省略过去= =写的不够详细1.NLP流程详解1.1数据清洗不感兴趣的、视为噪音的内容清洗删除,包括对于原始文本提取标题、摘要、正文等信息,对于爬取的网页内容            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-14 12:26:23
                            
                                52阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            自然语言处理一直是人工智能领域的重要话题,更是18年的热度话题,为了在海量文本中及时准确地获得有效信息,文本分类技术获得广泛,也给大家带来了更多应用和想象的空间。本文根据AI科技大本营、学院联合达观数据分享的内容《NLP概述及文本自动分类算法详解》整理而成。 一、 NLP概述1.文本挖掘任务类型的划分 文本挖掘任务大致分为四个类型:类别到序列、序列到类            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-22 20:41:13
                            
                                9阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.分词针对语料库中,所存在的单词的概率进行不同方法的概率计算,来选择分词概率最大的一种分词方法。 计算公式(Unigram-algorithm)为:P(‘你好中国’) = P(‘你’)*P(‘好’)*P(‘中’)*P(‘国’) P(‘你好中国’) =P(‘你好’)*P(‘中’)*P(‘国’) P(‘你好中国’) = P(‘你好’)*P(‘中国’) …但上述计算公式,可能会导致概率过小而溢出,所以            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-10 07:10:18
                            
                                220阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(Deep Learning)总的来说,在sklearn中机器学习算法大概的分类如下:1. 纯算法类(1).回归算法(2).分类算法(3).聚类算法(4)降维算法(5)概率图模型算法(6)文本挖掘算法(7)优化算法(8)深度学习算法2.建模方面(1).模型优化(2).数据预处理二、详细算法1            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2019-06-20 14:26:00
                            
                                180阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一,TF-IDF介绍1,TF-IDF简介   TF-IDF是NLP中一种常用的统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度,通常用于提取文本的特征,即关键词。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。2,TF-IDF的计算公式在NLP中,TF-IDF的计算公式如下:tfidf = tf*idf.其中,tf是词频(            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-19 10:08:31
                            
                                17阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            感谢的分享,补充整理了一些内容,今后会更新内容和知识点一、人工智能学习算法分类1. 纯算法类2.建模方面二、详细算法1.分类算法2.回归算法3.聚类算法4.降维算法5.概率图模型算法6.文本挖掘算法7.正则化8.深度学习算法三、建模方面1.模型优化·2.数据预处理一、人工智能学习算法分类人工智能算法大体上来说可以分类两类:基于统计的机器学习算法(Machine Learning)和深度学习算法(D            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-17 09:04:18
                            
                                99阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一 序  本文属于贪心NLP训练营学习笔记系列。从隐变量到EM算法。二 数据表示传统的数据表示,如图片、文本等是人能直观理解。但是不一定是好的表示,可能有冗余的特征,有噪音等。是不是转换为低维的空间会更好?很多算法包括机器学习都是为了寻找一个更好的表示方法。三  隐变量模型隐变量生成的例子:   Complete Case and Incomple            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-20 22:33:36
                            
                                33阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、文本处理流程文本清洗:html标签与转义字符、多余空格、根据需要清除邮箱、账号、网址、手机号、作者信息等信息预处理:去除停用词、加载自定义词库(实体词库、垂直领域词库)、分词特征提取:关键词、实体词建模:文本分类、文本聚类、情感分析、标签提取优化:停用词库与自定义词库清洗与丰富、文本标签清洗、模型调整效果评估:满足线上使用要求,准确率、速度上线部署:部署api接口二、NLP算法深度学习在自然语            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-23 23:28:21
                            
                                108阅读
                            
                                                                             
                 
                
                                
                    