下载和整理参考基因组

1.苹果参考基因组下载地址:​​​ GitHub - moold/Genome-data-of-Hanfu-apple: FASTA files of chromosomes and genes, gff files for gene models.​

git clone https://github.com/moold/Genome-data-of-Hanfu-apple.git

2.解压fa文件

gunzip *.gz

3.合并成一个文件

cat *.fa > genome.fa #基因组序列文件

4.gff文件转换成gtf文件

gffread -T -o genome.gtf HFTH1.gene.gff3 #基因注释文件

5.处理pep.fa文件 修改分隔符后保存

awk -F '-' '{print $1}' HFTH1.gene.pep.fa > proteins.fasta #蛋白序列文件

6.genome.fa每行显示70个

conda search fastx_toolkit 
conda install fastx_toolkit
fasta_formatter -i genome.fasta -o genome_format.fa -w 70

--