字符串匹配算法之 kmp算法 (python版)1.什么是KMP算法 KMP是三位大牛:D.E.Knuth、J.H.MorriT和V.R.Pratt同时发现的。其中第一位就是《计算机程序设计艺术》的作者!!字符串(也叫主串)中的模式(pattern)定位问题。说简单点就是我们平时常说的关键字搜索。 KMP算法是用来求一个较长字符串是否包含另一个较短字符串的算法。模式串就是关键字(接下来
转载
2023-11-24 17:58:18
48阅读
聚类分析介绍关键词:没有先验知识、亲密程度、相似性个体、自动分类;K-Means聚类 K均值聚类是一种动态聚类法,为了改进之前的算法在样品个数很大时内存和时间都消耗极大的缺点;即一种动态聚类法,先粗略分一下类,然后按照某种最优原则进行修正,直到分类比较合理为止;思想: 先假定样本可分为C类,选定C个初始聚类中心,然后根据最小距离原则将每个样本分配到某一类中,之后不断迭代计算各类的聚类中心,并
转载
2024-01-03 08:38:42
72阅读
欢迎关注"生信修炼手册"!jellyfish可以统计DNA序列中Kmer的分布,它运行速度快,内存消耗低,支
原创
2022-06-21 09:04:08
395阅读
写在前面数据说第一季梳理交流了“数据分析与数据增长逻辑”“数据对比分析以及异常分析”“数据指标以及数据监控体系”“数据分析方法论”等,对数据分析的方法、思维及经验进行了分享。数据第二季将主要以数据驱动业务增长的案例来梳理交流数据方面的底层逻辑和经验。那么,作为第二季的第一期,首先来讨论交流一下怎么才算真正的理解“数据”呢?来这片自留地,一起探索交流运营与数据的魅力所在。我的勇气和你的勇气加起来,对
BioPython简介Biopython工程是一个使用Python来开发计算分子生物学工具的国际团体。(http://www.python.org) Python是一种面向对象的、解释型的、灵活的语言,在计算机科学中日益流行。Python易学,语法明晰,并且能很容易的使用以C,C++或 者FORTRAN编写的模块实现扩展。Biopython官网(http://www.biopython.org)为
转载
2023-12-07 14:28:01
104阅读
论文学习:2018-TIFS-sequence covering for efficient host based intrusion detection•引入:想要根据系统调用序列进行异常检测,最直接的想法就是使用正常序列与未知序列进行比对;若未知序列与正常序列相似,则可认为是正常序列;若未知序列与正常序列相差较大,则可认为它是异常序列。•序列比对:欧式距离是最容易理解的相似度比对算法,它根据欧
强烈安利这款分析功能强大的蛋白质结构预测软件,用它!确定一种蛋白质的结构和功能是现代生物学许多研究的基础。在过去的几十年里,人们开发了许多用于结构预测的计算工具,其中 Phyre2 因其强大的分析能力与简单的操作被生物科研人员广泛使用,据统计每天都有约 1000 个任务提交到 Phyre2 服务器上。 Phyre2 分析能力强大,结果界面丰富直观,可以预测和分析蛋白质的结构、功能和突变。相比之前的
sudo apt-get install python-biopythonsudo apt-get install python-biopython-docsudo apt-get install python-biopython-sqlsudo apt-get build-dep python-biopython
转载
2010-10-23 22:41:00
101阅读
2评论
NCBI官网:https://www.ncbi.nlm.nih.gov/ BioPython官方文档:https://biopython-cn.readthedocs.io/zh_CN/latest/bioPython是生物信息领域用于基因序列比对的一个工具,在搭建本地化blast的时候很实用。 以下笔记内容是在开发过程中参考官方文档 第七章:BLAST 后的相关问题及解决记录。首先,使用NCBI
转载
2023-12-18 20:46:25
124阅读
Python认识 Python最新的版本为3.X的版本,也会是以后的方向,没有Python基础的建议在这个版本上进行学习,及时大量的公司使用Python2.X而且支持Python2.X的库很多,但是以后随着Python的更新,也会有越来越多Python3支持库。话不多说 1.Python3安装 官网就可以直接下载Python3的安装包,选择对应的操作系统即可,无脑安装next,但是切记要
转载
2024-02-22 12:21:52
28阅读
第2章 快速开始 —— 你能用Biopython做什么?¶此部分旨在能让你快速开始Biopython,并给你一个大概的了解什么可用以及如何使用它。此部分的所有例子都会假设你有Python的基础知识,并且前提是你已经在你系统上安装了Biopython。如果你认为你需要认真复习Python,主流的Python网站提供了相当多的免费文档,你可以从以下网站开始(http://www.python.org/
转载
2023-12-14 12:26:07
72阅读
教 程 目 录在本章中,我们将讨论Biopython提供的一些高级序列特征.补体和反向补体核苷酸序列可以是反向补充以获得新的序列.此外,补充序列可以反向补充以获得原始序列. Biopython提供了两种方法来实现这一功能 : 补充和反向补充.这个代码在下面和下面给出;>>> from Bio.Alphabet import IU
转载
2024-01-26 12:26:49
66阅读
Biopython入门1. 什么是Biopython?Biopython工程是一个使用Python来开发计算分子生物学工具的国际团体。 Biopython官网(http://www.biopython.org)为使用和研究生物信息学的开发者提供了一个在线资源库,包括模块、脚本以及一些基于Python的软件的网站链接。Biopython致力于通过创造高质量的和可重复利用的模块及类,从而使得Pytho
转载
2023-11-20 21:31:19
318阅读
1.有关蛋白质结构的计算规律(1)假设氨基酸的平均相对分子质量为a,由n个氨基酸分别形成1条链状多肽或m条链状多肽:肽键数=脱去水分子数=氨基酸数-肽链数蛋白质相对分子质量的计算按照反应前后质量守恒定律计算形成肽链数形成肽键数脱去水分子数蛋白质相对分子质量1n-1n-1na-18(n-1)mn-mn-mna-18(n-m)[特别提醒]①计算多肽的相对分子质量时,除了考虑水的减少外,还要考虑其他化学
转载
2024-10-04 11:22:12
81阅读
文章目录公共模块下载和安装模块导入模块自定义模块 公共模块Python之所以强大,是因为极其活跃的Python开发社区无时无刻不有大神在开发和分享自己的大作,也就是所谓的模块,而我们只需要通过导入和使用这些模块即可。下载和安装模块第三方模块,一般需要通过Python的包/模块管理工具pip进行下载和安装,Python 2.7.9 + 或 Python 3.4+ 以上版本都自带 pip 工具,以安
转载
2023-12-14 10:42:44
143阅读
# 使用Biopython处理Fasta文件的流程
## 介绍
在生物信息学中,Fasta是一种常见的格式,用于存储生物序列数据,如DNA、RNA和蛋白质序列。Biopython是一个广泛使用的Python库,提供了处理生物信息学数据的工具和算法。本文将教会你如何使用Biopython来处理Fasta文件。
## 步骤概览
下表展示了使用Biopython处理Fasta文件的基本步骤:
原创
2024-01-29 08:33:15
418阅读
# 安装Biopython
Biopython是一个用于生物信息学的强大库,它提供了丰富的数据处理和分析功能,可以处理序列、结构以及生物学相关的各种数据。是否想过如何在你的Python环境中安装Biopython?本文将为你提供一个详细的安装指南以及一些基本的代码示例,帮助你快速上手Biopython。
## 安装Biopython
在安装Biopython之前,确保你的计算机上已安装了Py
Biopython教程 参考: https://biopython-cn.readthedocs.io/zh_CN/latest/index.html蛋白质文件获取Entrez方法from Bio import Entrez
Entrez.email='邮箱名' #如'123456789@qq.com'
handle=Entrez.esearch(db='protein',term='2rbg'
21.7 贡献源码¶除了使用Python语言开发生物学相关的程序外,任何人都可以没有限制地加入Biopython源码的开发。任何人若对某方面的编程感兴趣,Biopython邮件列表是讨论此事最合适的地方——只需告知我们你的兴趣所在或工作内容。通常来讲,在开发某个模块之前,我们会在邮件列表里讨论此事,因为这样做会有助于产生好的想法,讨论完成之后,就剩下编程了!主要的Biopython发布版本会尽量做
转载
2024-08-29 17:30:50
41阅读
这次使用的是 biopython 中解析 blast 结果的功能,随着 blast 版本的不断更新, blast的输出结果的格式也在不断改变,所以这对于 biopython 解析 blast 的结果造成了很大影响,所以 biopython 中一般倾向于处理 xml 格式的 blast 输出结果,因为这种结果的格式一般不随 blast 版本的改变而改变。在进行 blast 的时候需要选择参数 -ou
转载
2023-07-07 23:10:27
66阅读