好久木有在知乎冒泡了,不知道还能不能出现在大家的timeline上哇QAQ

正文开始之前还是先习惯性的碎碎念一下。前段时间换了研究方向,重新pick了问答和检索,为了追上相关问题的最新进展,就顾不上写文的刷了一堆paper,加上几件事情的从0到1确实费了一些精力,因此停更了好几个月。

这几个月的时间里,大部分为数不多的业余精力都放在了运小伙伴们努力维持一些有趣有料的原创输出,小屋也更好看啦。另一些精力就是放在本文要讲的事情上啦!几个算法工程师强行上阵web前后端甚至UI,做了一个帮助大家高效率刷paper的学术小站。一顿踩坑之后,终于近期把小站收拾的“看起来像个样子了”(´Д` )


卖萌屋学术站的诞生

顾名思义,学术站就是为学术信息而生嗒!

虽然AI行业变得越来越卷,但CV、NLP等热点方向依然在持续高速的发(灌)展(水)中,经常涌现出一些有趣的paper,可能哪天就被借鉴用于解决手上的问题了。所以入门后,养成追前沿、刷paper的习惯是非常非常必要的,无论你是在学术界还是工业界。

不过由于众所周知的某墙,以及某些不是很好用的国外服务,导致新手刷paper的效率很低,又经常分不清哪些paper(可能)含金量更高一些,哪些疑似不可靠的灌水,很容易出现费力不讨好的情况,受挫之后又开始选择咀嚼各大小媒体的论文解读了。以卖萌屋为例,虽然每周能为大家递上两三篇原创已经看起来很高产了,但是实话讲,那些我们发现的有趣的paper里,最终能呈现到粉丝面前的可能只有2~3成。毕竟,理解容易生成难哇。。。

所以本着授人以鱼不如授人以渔的想法,就跟小伙伴们把自己平时刷paper的服务努力优化了一下,开放出来啦~希望能帮到各位爱追AI前沿的小伙伴们。

小站的目标

就是为了方便大家更加高效便捷的获取CV、NLP、IR等领域的学术信息啦(后面悄咪咪观察一下,用的人多的话再考虑加研究方向)。这里的高效便捷体现在几方面吧

  1. 不用跟那个什么墙斗智斗勇了,访问速度很快的
  2. 抽出来了一些paper质量相对比较高的机构名和学术会议/期刊名,如果精力有限,可以优先刷刷这些,如下图所示,一篇paper录用的会议名会在标题上放用橙色的tag标出,机构名会用蓝色的tag标出。比如图里这篇《TeaForN:Teacher-Forcing with N-grams》的paper就是今天刚放出来的Google发表于EMNLP20的论文(快夸夸我们



跟小伙伴们做了个高效刷论文的小站_机器学习


不过,这种抽取会议名和机构名置顶的做法也会导致一些公平性问题。有的好paper确实没投顶会也不是来自大厂或名校,就容易被淹没掉。对于这个为求便捷导致的公平性问题,我们也在努力优化中,后续会同时通过NLP和排序算法优化,以及人的力量来努力不让金子埋没(认真脸