本人生物技术专业,本科二年级(至少我写这篇文章的时候是),没有计算机基础,平时也不了解,数学还行。周围没人会,只有一位远在北京的博士后师兄做一些指导和建议。写这篇文章来记录一下自己的经历,与自学的同志们共勉。

先说我花了多长时间,一个月,除了上课时间全在学,一个月勉勉强强学会。

基础和我差不多的推荐按照两个路线同时学习

R语言路线:R的基础知识(推荐学习基因学苑课程前三十节)→手敲GEO数据挖掘代码(推荐B站上生信技能树的,代码在CSDN里有),必须一行行的弄明白,不会的来CSDN搜→ggplot2等作图包,数据分析包的学习。

基础知识路线:分子生物学(非生物专业)→生物信息学的中的基本概念(太多了列不过来,找本书看或者看北大生物信息学网课)→做转录组的重点掌握二代测序流程,上游分析流程和下游分析流程

注意随用随学哈,某些憨憨光学R语言基础就两个月,没必要。

————————————————————分割线————————————————————

简述一下本人的学习过程

R语言通过学习B站基因学苑王通老师的课(前三十节)掌握了最基础的R语言知识。花了大概一周。同时通过知乎和借阅的生物信息学书完成了基本的测序流程,测序分析流程,下游数据可视化流程的学习。到这里能勉强听懂网上GEO数据挖掘的教程

关于用R画图,这其实是很多人学R的主要目的,但作图能力不是一下子就能完成的,需要首先掌握R的基础知识,数据对象的处理这两部分。R的作图主要依赖于扩展包,其中最为出名的要数ggplot2。它作图的原理和PS差不多,通过叠加图层做出符合需要的图表。学习的过程一言难尽,首先看了R语言实战上对ggplot2包原理的介绍(也就是上文提到 的),然后随着书上的示例进行作图,由简单到复杂。

学作图的同时其实也在学GEO数据挖掘,听的是生信技能树的那门课程,在B站就有。CSDN上有学员提供的课程代码,一些论坛也有一些小问题的答案。学的方法很简单,把一百多行代码手敲一遍,然后运行。在这个过程中,R语言的基础真的只是理解代码基本结构的基础,但代码中用到的函数,参数都属于基础之外的东西,需要一行行的琢磨。在这里点名CSDN(虽然R本身带有函数的帮助功能,但反馈结果是英文的,看不懂……),CSDN上有全部函数的解析。花了接近两周的时间在CSDN与RStudio之间反复横跳,才勉强掌握一百多行代码。

到这里,GEO数据挖掘算是学完了,在生信中常说的调包侠大概可以这样练成(PS.调包侠是如何练成的.jpg)。独自学GEO数据挖掘的过程可以说是一言难尽,最令人崩溃的大概就是不知道如何去学习,连教程都看不懂的时候可能是最绝望的。至于写出来BUG这种事情,报错报习惯就好了……。

最后给独自学数据分析的人一点建议

  1. 如果能找到和你目标一样的人共同学习,那是人生一大幸事。(这时候才理解为什么古人认为朋友很重要)
  2. 如果周围有人了解你所学的内容,即便与他不熟,也要厚着脸皮请教。这会让你少走很多弯路,并且减少很多心理上的压力。
  3. 如果没有同伴,没有师长,那就寻求网络的帮助吧,知乎,B站,CSDN等等各种网站总会有你需要的,只要你耐心去找。自学虽然艰难,但却十分考验人的意志,坚持下来,就是胜利。
  4. 有一句话,忘了在哪看过,送给所有人。学习技能或知识最好的时机是你第一次听说它的时候,其次是现在。

第一次听说生信是21年1月,当时准备先学R,然后就没有然后了(没错学R语言学了两个月的憨憨就是我自己)。。。。。。  真正开始学还是21年9月,血泪教训啊家人们。

现在在学单细胞的下游分析,向调包侠的方向一路狂奔。有机合再写学习想法,希望能帮到看这篇文章的你。

没了~~~~~