conda 报错 Solving environment: failed

现在说说我的解决思路:
1.根据错误内容,安装失败的原因应该是这个网址 https://repo.anaconda.com/pkgs/main/noarch/repodata.json.bz2 请求失败。
2.所以我尝试用

wget https://repo.anaconda.com/pkgs/main/noarch/repodata.json.bz2
1
手动下载这个包,结果出现以下错误。

-2018-12-12 18:29:18– https://repo.anaconda.com/pkgs/main/noarch/repodata.json.bz2
Connecting to 127.0.0.1:33473… failed: Connection refused.

1
2
3
那么应该寻找失败的原因,127.0.0.1表示的是本机,应该不会有什么问题,那么会不会是因为端口33473被占用的原因。
3.用netstat -ntpl查看本地端口的使用情况

netstat -ntpl
(Not all processes could be identified, non-owned process info
will not be shown, you would have to be root to see it all.)[……]

Read more

DBS model training

phenotype gproNOG.annotations bitscores

This is the complete workflow used to generate a random forest model using output data from an hmmsearch of your protein coding genes against eggNOG gamma proteobacterial protein HMMs. Before running this notebook, run the parse_hmmsearch.pl script to get a tab-delimited file containing bitscores for all isolates.

“`{r, read in data}
# library(gplots)
library(caret)
library(randomForest)
set.seed(1)
# set the directory you are working from
directory <- “/home/shenzy/UNISED/CII_ECOR_update_final_164genes”
# Reading in the eggNOG model sco[……]

Read more

微生物多样研究—差异分析

1. 随机森林模型

随机森林是一种基于决策树(Decisiontree)的高效的机器学习算法,可以用于对样本进行分类(Classification),也可以用于回归分析(Regression)。

它属于非线性分类器,因此可以挖掘变量之间复杂的非线性的相互依赖关系。通过随机森林分析,可以找出能够区分两组样本间差异关键OTU。

Feature Importance Scores表格-来源于随机森林结果

记录了各OTU对组间差异的贡献值大小。

18585978-a855cbdb5a069bb1

注:一般地,选取Mean_decrease_in_accuracy值大于0.05的OTU,作进一步分析;对于组间差异较小的样本,该值可能会降至0.03。

2. 交叉验证分析

交叉验证(Crossvalidation),是一种统计学上将数据样本切割成较小子集的实用方法。先在一个子集上做分析,而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。

其中最常见的为k-foldercross-validation,它指的是将所有数据分成k个子集,每个子集均做一次测试集,其余的作为训练集。交叉验证重复k次,每次选择一个子集作为测试集,并将k次的平均交叉验证识别正确率作为结果。

所有的样本都被作为了训练集和测试集,每个样本都被验[……]

Read more

ANOSIM,PERMANOVA/Adonis,MRPP (转贴)

6634703-6fde5e9bfb6489c7

1. ANOSIM 组间相似性分析

  • 相似性分析(ANOSIM)是一种非参数检验,用来检验组间(两组或多组)的差异是否显著大于组内差异,从而判断分组是否有意义。首先利用 Bray-Curtis 算法计算两两样品间的距离,然后将所有距离从小到大进行排序, 按以下公式计算 R 值,之后将样品进行置换,重新计算 R值,R大于 R 的概率即为 P 值。

6634703-ec94fa34c56b542a6634703-01bd752421e6028e

注:图上总共有 N+1 个盒子,N 为分组数量。“Between”的盒子指代的是分组之间的差异,其他分别代表各自组 内差异。R 值范围为-1 到+1,实际中 R 值一般从 0 到 1。R 值接近 1 表示组间差异越大于组内差异,R 值接近 0 则表示组间和组内没有明显差异;此次统计分析的可信度用 P-value 表示,P< 0.05 表示统计具有显著性。

2. PERMANOVA/Adonis 置换多元方差分析

PERMANOVA (Permutational multivariate analysis of variance,置换多元方差分析),又称 Adonis 分析,可利用半度量(如 Bray-Curtis)或度量距离矩阵(如 Euclidean)对总方差进行分解,通过线性模型分析不同分组因素 或环境因子(如临床表型数据、土壤理化指标等)对样品差异的解释度,并使用置换检验进行显著性[……]

Read more

Adonis与ANOSIM检验究竟是什么?(转贴)

做微生物16S测序的时候,公司的报告里经常会给到两种检验Adonis和ANOSIM,听过t.test、wilicox、anova各种检验,那么Adonis和ANOSIM检验是什么呢

Adonis 多元方差分析

Adonis,多元方差分析,亦可称为非参数多元方差分析。其原理是利用距离矩阵(比如基于Bray-Curtis距离、Euclidean距离)对总方差进行分解,分析不同分组因素对样品差异的解释度,并使用置换检验对其统计学意义进行显著性分析

Adonis分析结果通常如下:

Index
Df
SumsOfSqs
MeanSqs
F.Model
R2
Pr(>F)

GroupFactor
4
1.0899
0.27248
1.4862
0.14883
0.011

Residuals
34
6.2335
0.18334
0.85117

Total
38
7.3234
1.00000

其中,GroupFactor表示实验中的分组方法
Df表示自由度
SumsOfSqs表示总方差即离差平方和
MeanSqs表示均方差(SumsOfSeqs/Df)
F.Model表示检验值F
R2表示该分组方式对样品间差异的解释度,R2越大说明该分组方[……]

Read more

Docker + Trojan + Caddy 部署 ( 转贴)

SourceURL:https://muguang.me/it/2757.html

Docker + Trojan + Caddy 部署

关于 Trojan,不要多问,问就是代理工具。它先进的地方在于,数据传输使用 TLS 协议,伪装成 HTTPS 请求。Trojan 服务端监听 443 端口,对于普通来路的请求,会交由 Web 服务器处理,返回 Web 网站;而对于 Trojan 客户端来的请求,则由 Trojan 服务端进行代理。这跟 某2ray + Websocket + TLS 原理是一样的,都是通过伪装流量,避免被提取特征或是被检测。

这篇文章里,我将使用 Ubuntu 18.04 操作系统,使用 Caddy 作为 Web 服务器,将 Trojan 服务端和 Caddy 部署到 Docker 中。

0、准备

  • 域名 x1
  • 国外服务器 x1

部署前先给域名设置一条 A 记录,并指向你的服务器 IP。

1、安装 Docker & Docker-Compose

  • 添加 Docker 软件源
    sudo apt-get update
    sudo apt-get install apt-transport-https ca-certificates  curl software-properties-common
    curl[......]

Read more

ssh, scp and rsync

[Admin.DESKTOP-7JT504C] ➤ rsync -P –rsh=ssh /drives/d/Kraken_12.tar.gz cityu_jhli_1@172.16.22.11:/BIGDATA1/cityu_jhli_1/mhyleung/database/findfungi Warning: Permanently added ‘172.16.22.11’ (RSA) to the list of known hosts.

rsync -P -avz -e “ssh -p5566 -i /drives/C/Users/Admin/Desktop/cityu_jhli_1.id” /drives/d/Kraken_12.tar.gz cityu_jhli_1@172.16.22.11:/BIGDATA1/cityu_jhli_1/mhyleung/database/findfungi

[Admin.DESKTOP-7JT504C] ➤ scp -P 5566 -i /drives/C/Users/Admin/Desktop/cityu_jhli_1.id -r /drives/d/Kraken_12.tar.gz cityu_jhli_1@172.16.22.11:/BIGDATA1/cityu_jhli_1/mhyleung/database/fi[……]

Read more

v2ray

https://github.com/Jrohy/multi-v2ray

 

Docker运行

默认创建mkcp + 随机一种伪装头配置文件:

docker run -d --name v2ray --privileged --restart always --network host jrohy/v2ray

自定义v2ray配置文件:

docker run -d --name v2ray --privileged -v /path/config.json:/etc/v2ray/config.json --restart always --network host jrohy/v2ray

查看v2ray配置:

docker exec v2ray bash -c "v2ray info"

warning: 如果用centos,需要先关闭防火墙

systemctl stop firewalld.service
systemctl disable firewalld.service

heatmap R

 

> library(gplots)

Attaching package: ‘gplots’

The following object is masked from ‘package:stats’:

lowess

>
> setwd(“/home/zyshen/work/QM_nanjing”)
> data2<-read.csv(“combined_example.level_5.csv”, header=T, sep=”,”)
> data2plot<-data.matrix(data2[2:3])
> row.names(data2plot)<-data2[,1]
> heatmap.2(data2plot,trace=”none”,cexCol  = 2,col=greenred(50), margins = c(5, 40), sepwidth=c(0.05,0.05))Rplot

 

 

 

if (!require(“gplots”)) {
install.packages(“gplots”, dependencies = TRUE)
library(gplots)
}
if (!require(“RCol[……]

Read more

alpha多样性

扩增子数据分析之多样性指数: alpha多样性

多样性指数(Diversity index)和计算公式可以见: wikipedia

Alpha多样性(Alpha Diversity)是对某个样品中物种多样性的分析,包含样品中的物种类别的多样性——丰富度(Richness)和物种组成多少的整体分布——均匀度(Evenness)两个因素,通常用Richness,Chao1,Shannon,Simpson,Dominance和Equitability等指数来评估样本的物种多样性。

丰富度指数

Richness, Chao1,Shannon三个指数是常用的评估丰富度的指标,数值越高表明样品包含的物种丰富度就越高。

Richness指数: 指样本中被检测到的OTU量;
Chao1指数   : 通过低丰度OTUs来进一步预测样品中的OTUs数量;
Shannon指数 : 计算考虑到样品中的OTUs及其相对丰度信息,
             通过对数(如以2为底的shannon_2,以自然对数为底的shannon_e
             以10为底的shannon_10)转换来预测样品中的分类多样性。

均匀度指数

Simpson,Dominance和Equitability三个指数是常用的评估均匀度的指标。

Simpson指数[......]

Read more