2015/06/10

忘備録など

四月から大学院生として研究をしているが、去年に引き続き研究の時にググってもなかなかヒットしない情報というものに悩まされてきた
研究に関する内容でコアな部分ではなく、例えば「◯◯をしたいけどそれをやってくれるソフトがあるか」、「◯◯というソフトの使い方/もっと便利な使い方はないだろうか」というような事について、調べた時には使えるのだが時間が経ってもう一度やりたい時にノートから発掘しても文字が恐ろしいほど汚く解読が困難な事もある
そういった、ググればわかるはずなのになかなかヒットしない、汎用性の高く便利な情報について手書きのノートではなくPCのメモにまとめる事にした
研究についてコアな、考えるまでもなく外に漏らしてはならぬだろう事柄については研究室からの持ち出しは研究室から持ち出すデバイスに保存しないようにはしている

そんな事柄について、当たり障りのない程度にツールのマニュアルやそれを組み合わせたスクリプトについて今後こちらを使ってまとめていく事を考えている
たとえば「あるソフトの出力結果(標準出力)をファイルとして保存せずにそのまま次のソフトの入力に使うなら"|"と"-"を用いる事が出来る」といった内容である。
バイオインフォマティクスの世界でよく使われるソフトの一つに"samtools"という物がある
これを例にすると
"samtools view -bS hoge.sam | samtools sort -Obam -T tmp - sorted"
と書くだけでsam形式のファイルをbam形式(バイナリファイル)にしてかつソートしてファイルの容量を小さくしてくれるのだ
実際にsamtoolsのsortがどういった挙動をしているかは別として、その後の流れではソート済みのファイルでないと食べてくれない事が多いため、sortを行う事が多く、viewでバイナリ化して更にソートしてと無駄なファイルを作成してストレージを圧迫せずにすむ
最近見つけてちょっと嬉しくなったノウハウの一つを書き残してみる
この様にちょっと見つけて嬉しくなったやり方があったら忘備録として書き残す事を考えている

最近は忙しく、月に一度も記事を投稿できていないので、もうちょっと頻繁に投稿するためにもこんな内容を増やして見ようかなと思う次第にございます

0 件のコメント:

コメントを投稿