kento_blog

nice to meet you

pixy软件是比较群体基因组差异的一款软件

在使用时发现只能固定窗口,不能滑动步长,这在联合比较其他算法计算的选择信号时需要用到。

所以记录一下怎么弄吧

Read more »

使用PopLDdecay进行ld分析

PopLDdecay是华大开发一款快速进行连锁不平衡衰减分析的工具,只需输入vcf文件就可完成所有分析,计算速度非常快。

连锁不平衡(LD):当两个或多个位点的等位基因频率组合偏离随机组合时,这些位点之间被称为连锁不平衡。LD 的度量通常使用 r² 或 D’ 值。r² 值介于 0 和 1 之间,表示连锁不平衡的强度;D’ 值也介于 0 和 1 之间,表示连锁不平衡的比例。

Read more »

群体遗传选择信号分析之ln-πratio

在群体基因组学研究中,ln-piratio 是一个常用的统计量,用于评估群体间的遗传分化程度。ln-piratio 统计量结合了两个关键的概念:π(pi)和θ(theta)。其中 π 表示群体内的平均遗传多样性,而 θ 则是从群体内随机抽取两个个体并计算其遗传差异的一种估计。ln-piratio 通常用于比较不同群体或不同地理区域之间的遗传分化。

Read more »

在做nlp和参加预测siRNA药效竞赛时遇到的一些调参经验

Read more »

Lazy Predict 是一个用于快速评估多种机器学习模型性能的Python库。它可以帮助你在非常短的时间内测试多种机器学习模型并选择最佳模型,而无需手动编写大量的代码。Lazy Predict 主要用于数据科学和机器学习的初步模型选择阶段。

Read more »

我们有时候在处理多个vcf文件时,他们的参考基因组可能各不相同,这时候就需要把vcf 文件中的变异位置从一个参考基因组映射到另一个参考基因组。

Read more »

使用SnpEff对得到的标记进行注释

VCF(Variant Call Format)文件变异注释是一种生物信息学分析过程,用于为VCF文件中记录的基因变异提供详细的功能和临床信息。这些变异可能包括单核苷酸多态性(SNP)、插入和缺失(indels)等。变异注释的目的是理解这些变异的生物学意义及其潜在的影响。

Read more »

2024年曹晓风院士讲座学习

植物表观遗传调控机理与育种应用

表观遗传研究通常不不受基因序列snp改变调控,分为DNA甲基化、组蛋白翻译修饰、小分子RNA

Read more »

泛基因组(Pan-genome)即某一物种全部基因的总称,这里这个全部基因是有别于个体基因组的基因的。一个个体的基因组是这个物种基因组的代表。因此,以一个基因组为模板的分析不能全面的反应物种基因水平的全部遗传信息,尤其是在研究同一物种中差异巨大的不同亚种或者变种,此类特有片段的差异往往要比共有片段中的差异更为重要。分析核心基因和非核心基因的基本情况,并从特有基因序列的角度来研究物种内的差异。

Read more »

文献题目:A Library for Nucleotide Sequence Alignment

doi:https://doi.org/10.1093/gpbjnl/qzae025

背景:中国农业科学院深圳农业基因组研究所(岭南现代农业科学与技术广东省实验室深圳分中心)阮珏团队和邵浩靖团队开发了一种DNA比对新技术“BSAlign”,相比较同类并行算法,该算法可更快生成最优比对结果,且准确性更高。相关研究成果以题为“BSAlign: A Library for Nucleotide Sequence Alignment”发表在 基因组蛋白质组与生物信息学报(Genomics, Proteomics & Bioinformatics(GPB))

Read more »
0%