Effect of the glycosyltransferases [糖基转移酶] on the CPS [荚膜多糖] synthesis of S.suis 2

  1. The incom­plete CPS result­ing from dele­tion of the cps genes in S.suis 2 SC19;
  2. Inter­play between S.suis 2 SC19 and dif­fer­ent cell lines in vit­ro changed by the­se
    genes dele­tion
    cps2E, cps2G, cps2J and cps2L
  3. More depo­si­tion on the mutant strains of com­ple­ment C3 in porcine serum
    than on WT
  4. Essen­tial role of the cps genes in via­bil­i­ty of SC19 in a murine mod­el

Zhang, Y., Ding, D., Liu, M., Yang, X., Zong, B., Wang, X., Chen, H., Bei, W., and Tan, C. (2016). Effect of the gly­co­syl­trans­feras­es on the cap­su­lar poly­sac­cha­ride syn­the­sis of Strep­to­coc­cus suis serotype 2. Micro­bi­o­log­i­cal research.

LaTeX 随笔

  1. LaTeX在windows下认识的文件路径是“/”,而使用Perl的File::Spec包得到的路径使用的是“\”;
  2. 生成d­vi: latex filename.tex;
  3. 生成pdf: dvipdfm filename.dvi;

KEGG 使用注意事项

  1. bta里的pathway个数在不断增加,过去抓取的和现在的混着用就会出错;
  2. 批量下载KEGG Mapper生成的图像时,由于网络状况可能导致下载不完全,请一定仔细核实数目是否对应,图像是否完整;

KEGG ORTHOLOGY (KO) Database

在KEGG中,分子水平上的功能保存在KO(KEGG Orthology)数据库中。这些功能与直系同源组联系在一起,以此来使得一个特殊物种的实验数据可以被扩展到其他物种。KEGG中的基因组注释是直系同源注释,其方式为,为GENES数据库中的每个基因制定KO iden­ti­fiers (K num­bers) 。对于原始数据,像由RefSeq或者GenBank给出的基因名和描述,即使他们和KO的分配不一致,KEGG也不会做任何修改。

将KO的条目与功能表征的序列数据的实验证据联系在一起的工作,已经开始了,并且现在已经展示在REFERENCE下的SEQUENCE子域中。而且,基因组层面的“KEGG GENES”(http://www.genome.jp/kegg/genes.html)集合已经被扩展,使其可以将蛋白数据也包含在附录中。最终KO数据库将覆盖所有的功能表征蛋白序列信息(另见“KEGG Enzyme”(http://www.genome.jp/kegg/annotation/enzyme.html))。

In KEGG, mol­e­c­u­lar-lev­el func­tions are stored in the KO (KEGG Orthol­o­gy) data­base and asso­ci­at­ed with ortholog groups in order to enable exten­sion of exper­i­men­tal evi­dence in a speci­fic organ­ism to oth­er organ­isms. Genome anno­ta­tion in KEGG is ortholog anno­taion, assign­ing KO iden­ti­fiers (K num­bers) to indi­vid­u­al genes in the GENES data­base. No updates are made to orig­i­nal data, such as gene names and descrip­tions given by Ref­Seq or Gen­Bank, even if they are incon­sis­tent with the KO assign­ment.

Major efforts have been ini­tat­ed to asso­ciate each KO entry with exper­i­men­tal evi­dence of func­tion­al­ly char­ac­ter­ized sequence data, now shown in the SEQUENCE sub­field of the REFERENCE field. Fur­ther­more, the genome-based col­lec­tion of KEGG GENES has been expand­ed to allow indi­vid­u­al pro­tein data to be includ­ed in the adden­dum cat­e­go­ry. Even­tu­al­ly the KO data­base will cov­er all knowl­edge on func­tion­al­ly char­ac­ter­ized pro­tein sequences (see also KEGG Enzyme).

一般来说,KO对功能直系同源的划分是定义在KEGG分子网络的语境中(KEGG path­way maps, BRITE hier­ar­chies and KEGG modules)。KEGG分子网络实际上是由K numbers标识的网络节点表示的。KOs和相应的分子网络的关系呗存储在下面这个系统中。

KEGG Orthol­o­gy (KO

将功能信息和直系同源组关联在一起这个功能是KEGG资源的一个独特的功能。基于有限总量的实验数据生成的对序列相似性的预测被预先定义好在KEGG中。如同在BlastKOALA和其他工具中实现的那样,对KEGG GENES的序列相似性搜索是针对K numbers的。一旦一个K numbers被指定给基因组中的基因,KEGG path­ways maps, Brite hierarchies,和KEGG modules都会自动重建。如此一来,就能对较高水平的功能有一个生物学上的科学的诠释。

In gen­er­al KO group­ing of func­tion­al orthologs is defined in the con­text of KEGG mol­e­c­u­lar net­works (KEGG path­way maps, BRITE hier­ar­chies and KEGG mod­ules), which are in fact rep­re­sent­ed as net­works of nodes iden­ti­fied by K num­bers. The rela­tion­ships between KOs and cor­re­spond­ing mol­e­c­u­lar net­works are rep­re­sent­ed in the fol­low­ing KO sys­tem.

KEGG Orthol­o­gy (KO)The fact that func­tion­al infor­ma­tion is asso­ci­at­ed with ortholog groups is a unique aspect of the KEGG resource. The sequence sim­i­lar­i­ty based infer­ence as a gen­er­al­iza­tion of lim­it­ed amount of exper­i­men­tal evi­dence is pre­de­fined in KEGG. As imple­ment­ed in BlastKOALA and oth­er tools, the sequence sim­i­lar­i­ty search again­st KEGG GENES is a search for most appro­pri­ate K num­bers. Once K num­bers are assigned to genes in the genome, the KEGG path­ways maps, Brite hier­ar­chies, and KEGG mod­ules are auto­mat­i­cal­ly recon­struct­ed, enabling bio­log­i­cal inter­pre­ta­tion of high-lev­el func­tions.

DAVID/DAVID-WS使用技巧

DAVID-WS(网络服务)被开发出来,使用户完成任务无需进行人工交互,而是编程接入DAVID,经由状态网络服务实现自动化。

DAVID-WS (web ser­vice) has been devel­oped to auto­mate user tasks by pro­vid­ing state­ful web ser­vices to access DAVID pro­gram­mat­i­cal­ly with­out the need for human inter­ac­tions. [1]

DAVID-WS通过保留一个用户在一次查询会话中的状态相关的操作输入,使这些输入能在用户该次会话接下来的操作中被获取,从而达到状态化。用户可以增添基因列表,改变分析背景总体,选择物种和种类,重置数据分析的功能参数,在一次会话中调用所有工具以及按照希望规范输出。

DAVID-WS is made state­ful by keep­ing the state-relat­ed input of a user oper­a­tion in a ses­sion con­text that can be accessed by sub­se­quent user oper­a­tions with­in the same ses­sion. Users can add lists, change back­ground pop­u­la­tions, select species and cat­e­gories and reset func­tion­al para­me­ters for data analy­sis, as well as query all tools with­in the same ses­sion and for­mat out­put as desired. [1]

[1] Jiao, X., Sher­man, B.T., Huang da, W., Stephens, R., Basel­er, M.W., Lane, H.C., and Lem­picki, R.A. (2012). DAVID-WS: a state­ful web ser­vice to facil­i­tate gene/protein list analy­sis. Bioin­for­mat­ics 28, 1805–1806.

Perl使用注意及技巧

  1. 位置信息
    1. (子)脚本所在的位置:/home/wangyu/
    File::Spec
    my $path_curf = File::Spec->rel2abs(__FILE__);
    my ($vol, $dirs, $file) = File::Spec->splitpath($path_curf);
    2. 从哪里调用的(主)脚本:/home/wangyu/code
    $ENV{'PWD'}
    3. 程序目前切换(chdir)到哪里了:/lustre/Work
    `pwd`
    解释:
    1. 我用a.pl调用b.pl,主脚本为a.pl,子脚本为b.pl;
    2. a.pl在/home/wangyu/code/perl, b.pl在/home/wangyu;
    3. 使用chdir切换了到/lustre/Work以后,调用b.pl,在b.pl里面,使用三种方式判断路径。
  2. perl –d: 打开调试功能
  3. windows下,html中指定路径:“file:\/\/\/path_to_the_file”;
  4. 对读入的数据进行split前,注意,要用chomp处理;
    因为,读入的数据的末尾的换行符会被分配到最后一串字符里。
    其实际影响案例有:1. 如果一个变量$var包含了换行符,我把这个变量放在system “gzip –d –c $var > filename”,这条命令$var后面的就无法生效,因为在$var已经敲了回车了。
  5. Instal­la­tion:
    perl -MCPAN -e shell
    install SOAP::Lite
  6. Your Perl is con­fig­ured to link again­st libgdbm,but libgdbm.so was not found.:aptitude install libgdbm-dev
  7. Please tell me where I can find your apache src:
  8. Func­tion Round: int($number+0.5)
  9. Unquot­ed string “..” may clash with future reserved word
    I meet this warn­ing because my file­han­dle is low­er­case with the “warn­ing” on. It’s bet­ter to use upper­case as devel­op­ers wish.
  10. $$: 该脚本的进程号;
  11. 微型Perl: 修改文件内容
     perl -p -i -e 's/from/to/' *.file

    –p:输出本行内容(-n: 不输出本行内容)
    –i:指定备份文件后缀名,如果给出-i选项并且没有指定后缀名,则覆盖原文件 (-i.bak)
    –e:需要运行的perl代码,分号分割,可写多条语句。计数变量可用。
    *.file: 需要修改的文件

  12. 已安装模块备份及重装
    #所有安装的模块信息存储在:
    #/home/nott/.cpan/Bundle/Snapshot_2017_03_10_00.pm
    perl -MCPAN -eautobundle 
    
    #重装
    perl -MCPAN -e 'install Bundle::Snapshot_2017_03_10_00'
    
    
  13. foo­bar

从孙子兵法理解围棋大龙攻杀的要诀;攻守双方口诀

从孙子兵法理解围棋大龙攻杀的要诀;攻守双方口诀;

守方口诀;“拆张出头抓紧渡,以攻为守大转换,四面楚歌快做眼,走逃无路打打劫”;
攻方口诀:“逼住断开然后镇,攻击以前先补强,封锁取势破眼位,小心对手想打劫”;

对于攻方而言,如果打算攻击对方某处大块棋,要记住,不要先走出剪尾巴之类的贪小便宜。这类小便宜就算是白送的,也不妨等到官子时再吃,在此以前,如果不能攻杀大棋的话,干脆不要碰它。大概是围棋战术中的“不要打草惊蛇,攻击勿靠”。否则对方可以借弃子腾挪,做眼,消了劫材,还得了先手。

所谓“攻杀大棋”不是“必杀大棋”。如同动物世界中狮子杀食,十次攻击中有九次失败,如果每次都要“必杀”,90%的死者就是狮子自已,动物世界的胜负规则就要颠倒过来了。围棋中的野猪流之所以不利于棋艺的长进,原因也正在于此。“攻杀大棋”需要预先做起准备,保证90%不能必杀的情况下,也仍然能得到相应的利益;以免“攻杀不成反输棋”,而能达成“攻杀不成也赢棋”,胜率自然就提高了。此即孙子兵法中,所谓“百战百胜,非善之善之者,不战(必最终混战攻杀)而能屈人之兵,善之善者也”的围棋解意。

由此笔者就得到了攻杀大棋,处于攻方时的战术步骤。第一步是“逼,断,镇”,削弱对方的根基,断开与对方活棋的连接,才谈得上攻杀。如果能把对方一块大棋断成两块弱棋,需要分别耗费先手求活,好是再好没有;第二步“补强,封锁”,只有当对方大棋不能逃出时,才讲得上“攻杀”,封锁的前提是自已周边先补强,以免被对方“以攻为守”;第三步是“压缩,点眼”,攻击点是对方的眼位;死活到此基本上已经开始定形。此时双方一般已经转移战场,这里变成了带若干劫材的大块残子,当劫材也消清光后,就是死子了。

进攻的步骤,归纳起来就是“先逼再封然后点”。防守的步骤就相反地,“拆张出头抓紧渡,以攻为守大转换,四面楚歌快做眼,走逃无路打打劫”。拆是拆开边角,如果同时能逼对方,再好没有;如果被对方镇,就要出头;出头不成的话,先看对方棋形的弱点,那里没有补的,或借攻击之而补强,或者借攻击之而转换,放弃自已被封锁的弱棋;实在逃不掉了,才赶快做眼。一攻一防,要诀就是笔者常说的“守为正着攻为奇”。如果说“攻击是最好的防守”让人痛快,围棋的要点则是“安定自已,就是有力的进攻”。
ps:攻方口诀是“逼住断开然后镇,攻击以前先补强,封锁取势破眼位,小心对手想打劫”;

最后我们回到主题,明确了开发商通过影子银行推高房价是被动后,意味着不做“上兵伐谋,其次伐交”的准备工作,就作“强攻高房价”的“宏观调控”,命中注定的是无效的,而无论主攻方向是开发商,炒房客,还是影子银行。原因就在于,它们是被动的,治“被动”不是治本,甚至能否治标,也存疑问。上兵伐谋,如笔者解释了任志强董藩及反户籍制度等等的民粹,如“高房价拉动经济”这类的谎言,用真相去恶化他们的生存环境,则随后的政策雷霆就会事半功倍。这道是思考题:“伐交”,在针对高房价时,是什么动作呢?

克隆中的常见陷阱和解决方案

摘要:

对于已克隆基因的需求在过去32年间不断增多,但是一些需要他们的人却很难自己做出来。尽管传统的基于连接的克隆在做的时候会遇到一些陷阱,而且这些陷阱如果没有意识到而进去了,会带来较为严重的后果。但其实只要足够注意,大多数的陷阱都是可以避免的。在这里,我们回顾了将基因克隆到质粒的实验过程中所需的酶和试剂的化学性质,并且去关注那些与此最相关的细节。值得指出的是,我们探索了,琼脂糖凝胶电泳检测的优点,DNA和二氧化硅之间相互作用的原理,以及热稳定DNA聚合酶、限制性内切酶、和T4 DNA连接酶的使用过程中存在的问题。同时,我们也叙述了大肠杆菌转化和DNA修饰酶使用过程中的常见陷阱。全面认识已经建立的方法,对于解决在调整技术时产生的问题,根据需求执行替代方案,以及创造新方案而言,是必需的。

介绍:

将DNA整合到载体中以及接下来对重组载体的使用,将其转化到微生物中(分子克隆),给人的第一感是这是容易的。将DNA片段克隆进细菌质粒这种方法,在1973年第一次被报道,然而克隆PCR产物却直到1986年才被首次报道。持续改善的技术,不断发展的替代方案,商业化克隆试剂盒以及出现的特殊的合作研究机构(项目外包)给那些想要做克隆实验的研究者提供了非常大的选择空间。在某种程度上,对于那些不自己做克隆实验的研究人员而言,质粒构建本身是一种可以购买商品。

分子克隆中的技术障碍有些非常关键,但人们却忽略了要去研究解决这些障碍的理论基础,或者要为了解决他们而做出努力。新手常常并不太了解情况也不能绕开陷阱,我们可以看到许多新手很羞愧自己做不出来结果,又或者费了极大力气克隆基因和建立文库。如果一种方法不能产生想要的构建产物,研究人员常常采取的方法是,重复试验。而这样做的话,要么是同样不幸的没有做出结果,要么就是使用能起到很小帮助的试错法。前面提到的不断涌生的克隆方法和试剂盒至少在某种程度来说是由跟可靠性相关的问题驱动的。产生了过多的备选方案也是一个麻烦,因为它会令科学家们感到困惑。为什么会困惑呢?因为每个开发者都会争论,而且是毫无理由的争论说,他们的方法更快,更方便,更有效(至少在最优条件下是这样),还有比其他方法便宜。做研究的成本,尤其是高收入国家里的劳动力的成本,是远远比分子克隆实验中消耗的试剂所产生的边际可变成本高的。所以,实验老是失败和重复,将会令实验成本大大提高。因此,最有效改进克隆效率的方法就是使用那些,易于理解、监控以及查错的技术,这样一来,重复的次数就会最小化。

克隆实验是由那些,并不会为了分子生物学而进化的酶,所介导的。他们在体内的活动,借由经典生物化学的框架是非常容易理解的。在这里,我回顾了,用于克隆DNA片段、PCR产物的酶、基质和试剂的催化性质和生物物理性质。然后将这些性质跟常见的分子生物学技术,像DNA纯化和分离,联系起来。最近的综述都偏向于更新的克隆技术,所以这很容易使学生荒谬的认为,已经建立的技术已经不能很好的工作了。每个反应,包括想要的和令人担心的,在某种程度上说,是特殊的浓度和微观上的常数的函数。他们会照着这种关系来发生演变。因为如此,对这些反应的机制的理解是非常关键的。无论是对于现存方法的优化或者开发新技术都离不开它。

1

Awesome” agarose — 了不起的琼脂糖

PCR产物传统方法是,使用引物与独特的酶切位点合作实现。内切酶被用来在PCR产物和受体质粒上产生黏性末端。酶切产物通过琼脂糖凝胶电泳分离;目的切割片段接着从胶上回收。两个DNA片段用T4DNA连接酶催化连接。然后连接产物被转化到大肠杆菌中,最后,转化子通过质粒上的抗生素抗性标记筛选得到。这种传统方法属于劳动密集型,几乎每一步的陷阱都被很好的认识到了,除了DNA的纯化以及PCR产物末端的结构异质性,通过琼脂糖凝胶电泳可以很好的监控这一切(Figure 1)。由此我们认为,质粒以及PCR产物应当在传化之前和之后、酶切后、胶纯化后以及连接后进行验证,这样在进行下一步前,对每一步都进行确认。微量紫外光谱仪近些年变得十分流行,但是这些设备并不是设计来区分基质和DNA修饰产物的。琼脂糖凝胶电泳使得我们可以在问题出现时立刻发现他们;有经验的基因工程人员能够通过解决这些问题节约大量时间而不是不断地修补以及重新开始。

琼脂糖凝胶电泳的替代物已经被设计出来了,但是还没十分普及。在我的实验室里,“mini-gels”使我们用来分辨小片段(<5 kb)的方法,因为这非常方便,快速,并且(相比于大胶来说)更加敏感,试剂费用更低(琼脂糖,染料,以及电泳的缓冲液,详见附件)。倒在75x52的玻璃板上的Mini-gels能够大量生产然后保存(Figure 2)。更短和更薄的胶能够更快地被电泳,相比于那些更厚的来说,也不用进行过度加热。(小的胶盒中只需5v / cm,就像Owl C2-S)。分辨率(条带的物理分离)效果不如大胶好(Figure 3),但是对于日常克隆实验中的小片段来说,足够了。我们使用地摩尔浓度的电泳介质(10mM 硼酸锂,pH 8.2)进行小条带(<2 kb)的快速分辨;我们使用更高导电性的TAE缓冲液(40mM Tris, 20mM 的乙酸,1mM的EDTA)对更大的条带进行电泳,因为使用低摩尔浓度(5 mM 硼酸锂,pH 7.2)的mini-gels无法胜任。任何使得克隆人员能够跑更多胶的创新都是对质量控制标准的持续促进。

4

5

[我的补充:Owl™ C2-S:http://www.thermoscientific.com/content/tfs/en/product/owl-c2-s-micro-electrophoresis-system.html

Owl™ C2-S Micro Elec­trophore­sis Sys­tem

Screen up to sev­en sam­ples on one gel in less than five min­utes with this pro­duct!

2

3

]

Stick-less” silica — 不怎么黏的二氧化硅

DNA纯化(将质粒从核酸、细菌细胞提取物污染物中分离出来;将PCR产物从引物、模板和聚合酶中分离出来;将酶切片段从其他片段和琼脂糖中分离出来)能够使得一个克隆项目因此而成功或者失败。接下来的任何酶催化反应都能从DNA基底的浓度和抑制物上预测到结果,也包括不想要的DNA。大多数分子生物学家现在依赖于基于二氧化硅的DNA纯化试剂盒,或者是稍微低效些的离子交换树脂,而不是过去常用的苯酚\氯仿抽提,酒精沉淀然后进行氯化铯梯度离心。阴离子交换层析很耗时,所以现在只在那些对于从细胞提取物分离质粒纯度要求很高的实验中用到,比如哺乳细胞转染。硅胶模离心吸附柱相对来说不贵、方便(用完即仍)并且通用,因为他们能够被用于质粒的准备、PCR产物纯化或者从硅胶中分离回收酶切片段。

从琼脂糖凝胶中纯化DNA是一个值得在此处进行探讨的问题,因为,分离得到目的酶切片段能够防止生成不想要的连接产物。然而,将条带从胶上切下来在技术上是不可回避的操作,因此无法实现自动化。此外,将DNA暴露在紫外线下,会急剧地减少转化活性,尽管向缓冲液中加入鸟苷可以提供有效地保护。目前的胶纯化技术的纯化产量不太高,所以大多数克隆人员消化微克级DNA(亿万的双链DNA分子)来生成一个最终的重组分子。胶纯化的好处(包括提高克隆效率、减少非预期的连接产物)比之前提到的缺点和陷阱更加重要,所以每个克隆专家至少掌握了一种琼脂糖凝胶提取技术。

并非所有研究人员都使用同一种胶纯化技术,由此说明没有一种是绝对可靠的。在我们实验室,我们使用硅胶模离心吸附柱来从琼脂糖凝胶中纯化酶切的DNA但跟商品化方法(下面会提到)不同,一次来最大化产量和纯度。其他普遍使用的胶纯化方法包括电洗脱技术(从胶块上或者将条带跑进第二个孔),使用阴离子交换纸来吸附和洗脱(Whatman DE81 or Schle­icher and Schuell NA-45),苯酚/氯仿法从低熔点琼脂糖中提取,冷冻挤压和琼脂水解酶消化法。大多数研究人员会使用硅胶模离心吸附柱来做胶提取并不是因为这种方法能够有最好的回收率或者纯度而是因为这种方法更容易。琼脂残留物或者各种在胶回收过程中引入的溶剂和盐可能会抑制T4 DNA连接酶活性,然后进一步影响克隆效率。这些物质很难检测,所以他们一般被忽略了,知道后来琼脂糖凝胶电泳使得连接效率提升了以后才使人们开始关注这个问题。

(待续)

参考文献:

Mat­sumu­ra I 2015. Why John­ny can’t clone: Com­mon pit­falls and not so com­mon solu­tions. Biotech­niques 59, IV-XIII.