change the font size of leaf nodes when generating phylogenetic trees using Bio.Phylo.draw()

axes : matplotlib/pylab axes If a valid matplotlib.axes.Axes instance, the phylogram is plotted in that Axes. By default (None), a new figure is created.

This means that you can load your own axes with your size of choice. For example

import matplotlib import matplotlib.pyplot as plt from Bio import Phylo from cStringIO import StringIO def […]

y叔的ChIP-seq数据分析大礼包(转贴)

熟悉我们生信技能树团队的应该都知道大名鼎鼎的y叔啦,作为我们论坛的荣誉顾问,y叔一直勤勤恳恳的指出我们的错误,特意在此谢谢y叔!并奉上y叔的ChIP-seq数据分析大礼包,已经征得y叔同意啦!

关注Y叔微信公众账号biobabble

CS0: ChIPseq从入门到放弃

接下来要出一个ChIPseq系列,讲一讲ChIPseq和我的ChIPseeker包,从入门到放弃是我自己的个人写照。我做ChIPseq总共也就3个月的时间,做的事情并不多,在一知半解的情况下写下了ChIPseeker包。

正如我在《话题投票》里说的,我当时被要求做ChIPseq分析是为他人做嫁衣,而且是完全白干那种,但做为学生,白干也得干。

当时一开始使用ChIPpeakAnno做注释,但用UCSC genome browser检验结果的时候,发现对不上。在对ChIPpeakAnno包不满意的情况下,开始着手写ChIPseeker,其实在使用ChIPpeakAnno的时候,我就有写代码对结果做一些可视化,所以未有ChIPseeker先有ChIPseeker的部分可视化功能。当时写了篇博客文说ChIPpeakAnno的问题,一个月后就在Bioconductor上发表了ChIPseeker,这包完全是我半夜在宿舍里写出来的。

当时还在生物系,被我炒掉的前老板每天要求必须起码在实验室待够12小时,我每天都待到10点半左右才回宿舍,日常在实验室里啥都干不了,白天各种瞎折腾,晚上还要陪他聊天,但说来说去,每天几乎都差不多,无非是他很牛逼,我们这帮人读他phd实在太幸运,日复一日传销式洗脑。而我因为结婚了,家又离得近,周末回家,白天经常多一段单独对我的洗脑,做为一个PhD学生,在发表文章之前是不能够有周末的。每天10半从实验室里出来,回到宿舍11点,跟老婆打电话再洗澡,12点。然后从12点开始写代码到2点睡觉,才有了这个包。

虽然是一知半解的时候开发的,但还是受到大家的欢迎,半年前Matt邀请我去人大做报告时,也专门提到了ChIPseeker。

也有美国的助理教授,跟我要paper,说是上课的时候,要给学生读的,这广告效果我给满分。

文章发表了一年,已经被33篇文章引用,其中不乏有影响因子比较高的杂志:

下面是其中一些引用文章的图:

虽然ChIPseeker是我写给自己做ChIPseq注释的,但Ming Tang (https://github.com/crazyhottommy/ChIP-seq-analysis)用它去做DNA breakdown注释,当然像lincRNA注释也是有人做并且完全是支持的。有一些我以前从没在文档里提到的东西,也应该会在这个系列里写出来。

这个系列基本上是围绕着ChIPseeker的功能而来,名副其实从入门到放弃,因为我自己也是入了门然后放弃,如果想看从入门到精通的,这显然不适合你。

然而今天只是个剧透,敬请期待。

CS1: ChIPseq简介

ChIP是指染色质免疫沉淀,它通特异结合抗体将DNA结合蛋白免疫沉淀,可以用于捕获蛋白质(如转录因子,组蛋白修饰)的DNA靶点。这技术存在非常久了,在二代测序之前,结合microarray,它的名字叫ChIP-on-chip,二代测序出来之后,显而易见的,免疫沉淀拉下来的DNA拿去NGS测序,这必然是下一代的ChIP技术,优点也是显而易见的,不再需要设计探针(往往存在着一定的偏向性)。所以NGS出来以后,不差钱的牛逼实验室显然占据上风,谁先做出来,谁就定义了新技术。这是有钱人的竞赛,没钱的只能等着技术烂大街的时候跟风做。 这是显而易见的下一代技术,外加技术上完全是可行的,所以这是一场单纯的时间竞赛,于是几乎同时出来CNS文章,基本上谁也不比谁差地同时扔出来。

Johnson DS, Mortazavi A et al. (2007) Genome-wide mapping of in vivo protein–DNA interactions. Science 316: 1497–1502 Robertson G et al.(2007) Genome-wide profiles of […]

英文写作检查软件汇总:人工智能帮你写论文,语法检查(转贴)

熬夜写paper的学渣小公举

如果能有一款人工智能

帮我改论文

就好了

……

没有paper,就没有伤害

我的心愿是

放飞计几,没有paper

3小时前

想太多,呵呵,别做梦了快醒醒

被paper逼疯的三更半夜,你是不是也会发出这样的感叹呢?

别着急,贴心的留学君这就来为大家介绍一些写作(检查、修改)软件:

1.StyleWriter(润色首推)

http://www.editorsoftware.com/downloads/DWSWT.html

此软件可嵌入word使用,主要功能是检查拼写、语法等错误,润色文章。会有关于同义词选择的提示,让文章的表达更加地道。Style进行文章润色的三个主要指标分别为:bog index,ave sentence, passive index。

其中,Bog index代表文章的“可读性”,其定义为 Bog Index = Sentence Bog + Word Bog – Pep

Sentencebog是句子长度决定的,等于平均句长的平方除以最大句长(long sentence limit,软件似乎设定为35个字,有点儿小气)。

而Wordbog则关乎用词,如难词、大词、专词等,也包括被动语态,这些“毛病”的总和乘以250,除以文章的总字数,最后得出的指标就是wordbog。

Peg则是一个很有趣的概念,如很好的论据和问题,有趣的表达形式等。

Bog指数包括了决定一篇文章的主要元素:单词、句子和表达形式。根据Stylewriter的标准,好文章应该是句子短小精悍,用词干净利落,而且尽量少用被动语态。反过来,句子长,词语偏,被动语态多,Bog指数就越大,文章也就越烂。好文章的bog应该在20以下。

说到这里就不能不提及,国内外有些刊物明确要求为保持文章的客观性,均不提倡在科研论文里用第一人称。但现在几乎所有讲英文写作的书,都强调多用主动语态,Stylewriter甚至说,尽可能地删除你的被动语态——虽然主动语态不等于就说we do,但很多情形是免不了的。其实,大量国际刊物都在流行we do,随便找一家刊物,在短短的几行摘要里,就能找到好几个we。因为它们本来就是“我们”做的,而不是“客观地”被做的。从这个角度来看,使用“我们”句型,不但陈述了事实,活泼了文字,也增添了科学的人文气息。

2.Triivi(检查首选)

http://www.triivi.com/

Triivi是一款功能强大的英文输入软件,基于对大量英文语料进行学习所获得的数据,Trivi具备单词、词组自动完成,拼写改错,智能学习等功能。Triivi基本词库包括接近500,000个的单词和短语,并且另外还有大量的专业词库支持,它能够帮助你提高英文输入的速度与准确度,使基于英文文本的工作更加轻松。

3.Intellicomplete(推荐)

http://www.download.com/IntelliComplete/3000-2079_4-10062169.html

Intellicomplete 是一款独特的、全功能的工具软件,使文本的处理更自动化、更高效。含有以下功能模块:自动学习并自动补足任何MS Windows应用软件中处理的单词和句子;自动扩展任何MS Windows应用软件中处理的速记以及医学缩略语;支持多个剪贴板的管理等功能。虽没有triivi专业词汇丰富,但定义性较强,且自定义语库方便,只需要一个快捷键Ctrl+Alt+J。

4.As-U-Type

http://www.asutype.com/files/asutype-setup.exe

[…]

BACTERIAL GENOMICS TUTORIAL (repost)

[Originally posted by Kat on her BacPathGenomics blog, April 2013]

This is a shameless plug for an article and accompanying tutorial I’ve just published together with David Edwards, my excellent MSc Bioinformatics student from the University of Melbourne. It’s currently available as a PDF pre-pub from BMC Microbial Informatics and Experimentation, but the web version […]

POPULATION GENOMICS OF KLEBSIELLA (Repost)

https://holtlab.net/2015/06/23/population-genomics-of-klebsiella/

Well, after almost 6 years, our Klebsiella pneumoniae genomics paper is finally out!

It’s a beast of a thing and there are still a million and one questions to address just from this one data set. For those interested in looking at the data for themselves, the raw reads are available under accessionERP000165, the […]

Size Matters: Metabolic Rate and Longevity (Regression analysis sample)

Size Matters: Metabolic Rate and Longevity

John Tukey once said, “The best thing about being a statistician is that you get to play in everyone’s backyard.” I enthusiastically agree!

I frequently enjoy reading and watching science-related material. This invariably raises questions, involving other “backyards,” that I can better understand using statistics. For instance, see my […]

How to Post Web Clips to a WordPress Blog Directly With a “Press This” Button | eHow

How to Post Web Clips to a WordPress Blog Directly With a “Press This” Button | eHow.

Excel表格文本格式的数字和数字格式如何批量转换

第一步,在工作表选中任一空白单元格,然后在该单元格上单击鼠标右键,选择“复制”。 第二步,选中所有要转换的单元格范围,单击鼠标右键,在右键快捷菜单中选择“选择性粘贴”,在弹出的“选择性粘贴”对话框中“运算”区域选择“加”,单击“确定”按钮结束,即可一次性将所有单元格转换为数字格式。

更多 Excel表格文本格式的数字和数字格式如何批量转换 河北省秦皇岛市卢龙县石门镇西安小学 李东生

在使用Excel表格对数据求和时,只能对单元格内常规格式的数据进行计算,而不能对单元格中的文本格式的数据进行计算,特点就是在单元格的左上角有一个绿色的小三角,(如图:)(上边1234是常规格式数据、6789就是文本格式数据、下边的1234是数据求和时得到的结果。)

 

 

怎样才能讲这些文本格式的数据批量转换成常规的数字格式以便进行计算呢?

 

问题的解决:

 

把文本格式的转换成常规格式不就可以了吗,当然可以了,但是在把所有填写文本格式的数据单元格选中,然后右击选项中“设置单元格格式”设成常规(如下图)后,左上角并仍有绿色小三角,怎么办,不要急,按下面的步骤去做就行。

 

 

经过试验发现经过刚才的设置后还必须在每个单元格里双击一下,再回车就可以,但是这样做比较麻烦,只适合修改少量孤立单元格格式。如果文本格式的单元格较多批量的修改一个个双击就不合适了。那怎么办呢?接着往下看。

 

先选中所有要修改的文本数字单元格→选择Excel 菜单中“数据”菜单→“分列”(如下图)

 

 

接着出现下面的对话框:

 

 

一直选下一步→下一步→列数据格式选“常规”即可。(如下图)

 

 

以上方法,同样如果需要把数字格式转化成文本格式数字,操作中最后一步列数据格式选“文本”就可以了。

 

另外,我们在使用Excel时是否发现单击文本格式的单元格的时候,单元格的左上方都有一个感叹号,(如下图)

 

 

它也可以帮助我们将文本格式的数字转换为常规格式的数字啊?怎么应用它呢?接着看吧!

 

1.鼠标指向那个小框时,后出现一个向下的小三角,它是一个下拉菜单。

 

 

2.单击小三角,在下拉菜单里选择“转换了数字”就可以啦。

 

 

是不是很方便上面的方法更方便啊,注意也可以全部选中文本数字单元格后批量转化。快去试一试吧!

[…]

9 amazing ways to learn online

There is no need to buy a massive set of encyclopedias anymore, as you can learn most things online these days. The trouble is that the internet is filled with terrible amounts of misinformation. So, if you are learning online, you are going to have to find a way of avoiding the 99% of lies […]

linux 屏幕录像软件 Kazam 1.4.2 发布

屏幕录像软件对于制作计算机视频教程的人是必不可少的。Linux下的屏幕录像软件有Recordmydesktop、Recorditnow等。这些个软件个人感觉不太好用。

Kazam既可以录制视频,也可以截屏,而且都支持全屏、窗口、指定区域操作,非常方便。

Kazam是一款功能强大的屏幕录制工具,提供了一个直观的,非常之简单而可靠的体验。Kazam具有局部记录的能力。

http://www.linuxidc.com/upload/2013_04/130401093744651.png

Kazam已更新至1.4.2版。

Ubuntu用户安装PPA: (支持 Precise, Quantal, Raring)

sudo add-apt-repository ppa:kazam-team/stable-series

sudo apt-get update

sudo apt-get install kazam