SNP数据计算距离矩阵
用到的工具是 VCF2Dis
VCF2Dis:一种新的简单高效的软件,用于计算 p 距离矩阵和基于树的变体调用格式
工具对应的github主页 https://github.com/BGI-shenzhen/VCF2Dis
按照软件主页的帮助文档 下载安装,没有遇到问题
R语言绘制组合图
在用R语言做完图之后要想放在论文里,就需要把不同的图组合起来,尝试过用PPT,以及在Word里,效果都不太好,因此试着在R里组图(它的优势在于调图片清晰度比较方便)
jupyter notebook 安装字体解决可视化时字体不显示
jupyter notebook 安装中文字体解决可视化时部分字体不显示或者错位
wdl学习心得
wsl配置jupyter
jupyter安装教程
win11配置wsl2
写在前面:
- window的分发很方便,适合做一些简单分析,简单的炼丹
- 一定要确保是wsl2下面按照linux子系统,wsl2较wsl提升巨大,具体可以百度。
- win10和win11都可以使用wsl安装子系统,个人感觉win11的powershell更好用
- 安装后修改默认mem,swap,修改安装路径(迁移子系统),创建交换目录文件夹
- 后续配置bashrc、安装conda、安装docker
linux锁定后台进程
在 Linux 中,锁定后台进程可以确保该进程在后台运行,即使当前用户退出登录或终端会话结束。这样可以保持进程的持续运行,而不受登录状态或终端连接的影响。
non-zero-exit报错R
在 R 安装需要软件包时,”non-zero-exit” 错误通常指示程序在执行过程中出现了非零的退出代码。这通常表示程序在某个步骤中遇到了错误或异常情况。回溯安装过程,可以发现non-zero exit status 的问题不止一种,或者说所有的安装失败,都会给出 non-zero exit status 的warning。以下列出几种可能的问题类型,或许可以按照这些办法解决掉安装失败的问题。
one-hot编码
One-hot 编码是一种将分类变量转换为二进制向量表示的编码方法。它常用于机器学习和数据分析中,特别是在处理分类特征时。在 One-hot 编码中,每个分类变量的每个可能取值都被表示为一个二进制向量的形式。这个二进制向量的长度等于分类变量的取值个数,其中只有一个元素为 1,其余元素都为 0。被编码为 1 的元素对应了分类变量的实际取值,而其他元素表示该分类变量的其他取值。