R言語

dplyr filter関数で行の絞り込み | r tidyverse 使い方

dplyrパッケージのfilter関数をつかえば、データフレームの行の絞り込みができます。指定した条件を満たす行を絞り込みます。複数の条件を指定した場合、全ての条件を満たす行に絞りこまれます。 条件式では、論理演算&(AND)や、|...
R言語

r tidyverse 使い方 | 列 filter 絞り込み select関数 – dplyrパッケージ

tidyverseで1つのデータフレームの列の絞り込みは、dplyrパッケージのselect関数を使います。selectは条件を満たす列を絞り込む関数です。様々な指定方法で絞り込みができます。列名と文字列条件のマッチや正規表現を利用した絞...
AWS

AWS ディスク容量不足 新しいボリュームを追加する

バイオインフォマティクスでは大きなファイルを扱うことがあるので、ディスク不足に陥ることがあります。最近、よく使われる AWS EC2 でディスクが不足した場合は、新しくボリュームを作成して、インスタンスにアタッチすることができます。ディス...
R言語

tidyverse csv・tsvのファイルの読み方・データ型の指定方法 readrパッケージ

tidyverseを使う場合、ファイルの読み書きにはreadrパッケージの専用関数(read_tsv関数・read_csv関数)を使うのが便利です。これらの専用関数ではデータ・フレーム構造より使いやすいtibble型でデータを読み込みま...
R言語

tidyverse インストールとロード tidyverseの主なパッケージ

tidyverseはRのパッケージの1つで、データ操作(抽出・連結など)を統合的に扱うためのツール群です。Rを起動後に、tidyverseのインストールを行います。インストール完了後は、使うときにパッケージをロードして使います。 ...
linuxに関すること

解析トラブル Linuxマシンの動作のもたつき 原因調査と解決策

バイオインフォマティクス解析で使用するツールは、計算が長く続いたり、メモリを大量に必要とするもの、たくさんのファイルを出力するものなど、大きな負荷がかかるものが多いです。このようなツールを使う場合、コンピュータのパフォーマンス管理がしっか...
AWS

はじめてのcrontab実行 AWS S3へ自動バックアップ

バイオインフォマティクスでは、重要なデータを使うことが多いのでバックアップ作業などは定期的に実行したいものです。確実に、そして簡単に、データバックアップのような単純な処理を、定期的に実行してくれるcrontabを試してみましょう! ...
linuxに関すること

不要なファイルを探す ファイル名・ファイルサイズ・ファイル更新日時

バイオインフォマティクスの解析では大きなファイルを扱うことが多いので、ストレージの管理には気を使います。ストレージの容量を確保するために、不要なファイルはこまめに削除(または他の場所へ移動・圧縮など)することが、もっとも簡単で確実な方法だ...
linuxに関すること

Zstandard 可逆圧縮アルゴリズムを使ってみる

バイオインフォマティクスの解析では、とても大きなファイルを取り扱うことがあります。解析後もデータを安全に長期間保存しておく必要があって、データ保存に対する悩みは尽きません。 より速く、より高い圧縮率でファイルを小さく圧縮できれば、そ...
FastQC

fastqc memory error – java実行時により大きなメモリを割り当てる方法

bamファイルに対してfastqcを実行したら、メモリが足りないというエラーが発生しました。実行環境は十分にメモリーを積んでいたので、fastqc実行時のjavaのメモリーオプションを強制的に書き換えて実行したら、正常終了しました。 ...
タイトルとURLをコピーしました