R言語 dplyr filter関数で行の絞り込み | r tidyverse 使い方 dplyrパッケージのfilter関数をつかえば、データフレームの行の絞り込みができます。指定した条件を満たす行を絞り込みます。複数の条件を指定した場合、全ての条件を満たす行に絞りこまれます。 条件式では、論理演算&(AND)や、|... R言語tidyverseメインコンテンツ
R言語 r tidyverse 使い方 | 列 filter 絞り込み select関数 – dplyrパッケージ tidyverseで1つのデータフレームの列の絞り込みは、dplyrパッケージのselect関数を使います。selectは条件を満たす列を絞り込む関数です。様々な指定方法で絞り込みができます。列名と文字列条件のマッチや正規表現を利用した絞... R言語tidyverseメインコンテンツ
AWS AWS ディスク容量不足 新しいボリュームを追加する バイオインフォマティクスでは大きなファイルを扱うことがあるので、ディスク不足に陥ることがあります。最近、よく使われる AWS EC2 でディスクが不足した場合は、新しくボリュームを作成して、インスタンスにアタッチすることができます。ディス... AWSメインコンテンツ
R言語 tidyverse csv・tsvのファイルの読み方・データ型の指定方法 readrパッケージ tidyverseを使う場合、ファイルの読み書きにはreadrパッケージの専用関数(read_tsv関数・read_csv関数)を使うのが便利です。これらの専用関数ではデータ・フレーム構造より使いやすいtibble型でデータを読み込みま... R言語tidyverseメインコンテンツ
R言語 tidyverse インストールとロード tidyverseの主なパッケージ tidyverseはRのパッケージの1つで、データ操作(抽出・連結など)を統合的に扱うためのツール群です。Rを起動後に、tidyverseのインストールを行います。インストール完了後は、使うときにパッケージをロードして使います。 ... R言語tidyverseメインコンテンツ
linuxに関すること 解析トラブル Linuxマシンの動作のもたつき 原因調査と解決策 バイオインフォマティクス解析で使用するツールは、計算が長く続いたり、メモリを大量に必要とするもの、たくさんのファイルを出力するものなど、大きな負荷がかかるものが多いです。このようなツールを使う場合、コンピュータのパフォーマンス管理がしっか... linuxに関することメインコンテンツ
AWS はじめてのcrontab実行 AWS S3へ自動バックアップ バイオインフォマティクスでは、重要なデータを使うことが多いのでバックアップ作業などは定期的に実行したいものです。確実に、そして簡単に、データバックアップのような単純な処理を、定期的に実行してくれるcrontabを試してみましょう! ... AWSlinuxに関することメインコンテンツ
linuxに関すること 不要なファイルを探す ファイル名・ファイルサイズ・ファイル更新日時 バイオインフォマティクスの解析では大きなファイルを扱うことが多いので、ストレージの管理には気を使います。ストレージの容量を確保するために、不要なファイルはこまめに削除(または他の場所へ移動・圧縮など)することが、もっとも簡単で確実な方法だ... linuxに関することメインコンテンツ
linuxに関すること Zstandard 可逆圧縮アルゴリズムを使ってみる バイオインフォマティクスの解析では、とても大きなファイルを取り扱うことがあります。解析後もデータを安全に長期間保存しておく必要があって、データ保存に対する悩みは尽きません。 より速く、より高い圧縮率でファイルを小さく圧縮できれば、そ... linuxに関することメインコンテンツ
FastQC fastqc memory error – java実行時により大きなメモリを割り当てる方法 bamファイルに対してfastqcを実行したら、メモリが足りないというエラーが発生しました。実行環境は十分にメモリーを積んでいたので、fastqc実行時のjavaのメモリーオプションを強制的に書き換えて実行したら、正常終了しました。 ... FastQCメインコンテンツ解析ツール