数据列表MSR-VTTTRECVID AVS 2016-2018VATEXMPII Movie Description Dataset (MPII-MD)MS-COCOFlickr30kMSVDTGIFActivityNet CaptionsLSMDC MSR-VTT论文名称 : MSR-VTT: A Large Video Description Dataset for Bridging V
1.已训练好词向量//自己训练词向量需要对应领域非常大文本库,收集处理过程是很费时,所以使用已有的资源即可。1.1生物方面:http://bio.nlplab.org/ 这里词向量是使用word2vec工具在PubMed和PMC上文本生成。下载链接:http://evexdb.org/pmresources/vec-space-models/引用论文:Distributional Sem
:在yolov3中可以使用focal loss,这是什么东西呢,这个loss主要是解决正负样本不均衡问题,该损失函数降低了大量简单负样本在训练中所占权重,也可理解为一种困难样本挖掘。原来交叉熵函数:  可见普通交叉熵对于正样本而言,输出概率越大损失越小。对于负样本而言,输出概率越小则损失越小。此时损失函数在大量简单样本迭代过程中比较缓慢且可能无法优化至最优。那么F
异步复位信号一般会持续相对较长时间,保证寄存器能复位完成。但是由于复位信号是异步,我们不知道它会在什么时刻被释放。如果异步复位信号撤销时,不满足recovery time和removal time时,可能会造成亚稳态。recovery time 恢复时间:异步复位撤销时,与下一时钟有效沿最小时间间隔。removal time  去除时间:异步复位撤销时,与上一时钟有效沿最小时间间
过去一些优秀模型例如seq2seq架构已经能够实现80%以上匹配精确度在SQL查询上,但是这些工作实际上是在做语义匹配而非语义解析。现有的语义解析数据存在两个问题,一个是数据规模太小,无法训练一个更加现代化模型,同时单一数据库同时用于训练和测试当中,那任务难度肯定简单很多;二是逻辑形式SQL标签规模很小,并且每个program中都多多少少存在一些在数
转载 2024-04-22 15:59:23
164阅读
数据记录了2014年AAAI会议接受论文数据
原创 2022-10-17 13:04:58
70阅读
数据记录了2013年AAAI会议接受论文数据
原创 2022-10-17 13:05:15
72阅读
1. Introduction1.1 区别航空图像区别于传统数据,有其自己特点,面临很大数据偏差问题,例如导致数据泛化能力差:尺度变化性更大(很好理解,如车辆和机场;而且很可能一张大图就一个目标,一个小区域反而有很多密集目标) 密集小物体检测(如港湾、停车场) * 检测目标的不确定性:方向随机性和尺度随机性(如桥梁这样极端长宽比,会使anchor先验检测效果打折扣)1.2 数据简介DOTA数据包含2806张航空图像,尺寸大约为4kx4k,包含15个类别共计18828
原创 2021-08-13 09:29:45
1112阅读
折腾了4days,把foil it find mismathes论文差不多了吧,很自大自己竟然只花一天时间就给老师讲这篇论文去,然后被老师批回来重新读,哈哈哈哈想想就搞笑这篇论文目的,就是利用自己扩大数据(MS-COCO)形成数据,用数据来测试视觉-语言模型(给模型一张图片,输出对这篇图片描述) 期间利用3个task来检测这些模型。一、数据准备1.Generation of
Ndss16 数据Google Play:492534个中国Android应用程序商店:422505个。91应用市场、安智市场、应用汇、木蚂蚁 整个数据由600,000多个应用程序组成。Google Play有一个专门API,用于从商店搜索和下载应用程序,它还需要谷歌帐户凭据来完成这些任务。我们使用了PlayDrone,这是一个开源项目来抓取Google Play [14]。 Google根
1. 写在前面: 本篇属于实战部分,更注重于算法在实际项目中应用。如需对感知机算法本身有进一步了解,可参考以下链接,在本人学习过程中,起到了很大帮助:【1】统计学习方法 李航【2】Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techiniques to Build
原创 2021-09-07 11:50:20
1571阅读
  数据分析是一个对数据进行检查、清理、转换和建模过程,其目的是发现有用信息,提供结论,支持决策。在数据分析工作中,经常会遇到拿到数据分析问题,不知道从哪里开始着手,这就需要先明确数字化分析目标。  一、提供准确、可靠、及时基础数据支持。  数据分析基础在于数据,清晰完整数据对于做好数据分析来说十分重要。数据埋点严谨性、完整度;数据定义清晰度;数据清洗和数据过滤适当性等等都是进
Cora数据(引文网络)由机器学习论文组成,是近年来图深度学习很喜欢使用数据。该数据共2708个样本点,每个样本点都是一篇科学论文,所有样本点被分为8个类别,类别分别是: 1)基于案例;2)遗传算法;3)神经网络;4)概率方法;5)强化学习;6)规则学习;7)理论每篇论文都由一个1433维词向量表示,所以,每个样本点具有1433个特征。词向量每个元素都对应一个词,且该元素只有0或1两个
# 使用Python下载鸢尾花数据 鸢尾花数据(Iris Dataset)是机器学习领域中一个经典且广泛使用示例数据,用于分类和数据可视化。该数据包含150个鸢尾花样本,特征包括花萼长度、花萼宽度、花瓣长度和花瓣宽度,同时标签为三种不同鸢尾花类型:山鸢尾(Setosa)、变色鸢尾(Versicolor)和维吉尼亚鸢尾(Virginica)。本篇文章将介绍如何使用Python库下载和使
原创 2024-10-12 06:05:04
1434阅读
在非结构环境中,可靠和鲁棒水果检测算法对于有效利用收获机器人至关重要。水果姿态\
原创 2022-10-23 01:06:06
501阅读
在上计算机视觉这门课时候,老师曾经留过一个作业:识别一张 A4 纸上手写数字。按照传统做法,这种手写体或者验证码识别的项目,都是按照定位+分割+识别的套路。但凡上网搜一下,就能找到一堆识别的教程,分割文章次之,而定位文章就少之又少了。这其中缘由也很简单:识别目前来说已经不是什么难事了,所以容易写,但分割和定位却仍然是一个头疼不已问题,不同场景方法不同,甚至同一场景也要结
检测小物体和现场较远处物体是监视应用中一个主要挑战。这些物体由图像中少量像素表\
今天刚知道原来参考文献可以自动生成……真丢脸!分享给为论文奋斗同学   毕业论文不同于一般论文,特别是硕士毕业论文或者博士毕业论文。一般论文就四五页,而硕士论文动辄五六十页,有的甚至七八十页。所以有些东西如果要人工去修改,将是一件非常痛苦事情。痛苦事情至少有两个:目录自动生成和编号、参考文献引用的上标。本文将从这两个方面说说小技巧,自动生成,非常方便。&nb
文章目录2019ONLINE PCB DEFECT DETECTOR ON A NEW PCB DEFECT DATASET2020PCB De
原创 2022-06-27 17:14:13
752阅读
  • 1
  • 2
  • 3
  • 4
  • 5