メインコンテンツ

スポンサーリンク
AWS

AWS ディスク容量不足 新しいボリュームを追加する

バイオインフォマティクスでは大きなファイルを扱うことがあるので、ディスク不足に陥ることがあります。最近、よく使われる AWS EC2 でディスクが不足した場合は、新しくボリュームを作成して、インスタンスにアタッチすることができます。ディスク...
R言語

tidyverse csv・tsvのファイルの読み方・データ型の指定方法 readrパッケージ

tidyverseを使う場合、ファイルの読み書きにはreadrパッケージの専用関数(read_tsv関数・read_csv関数)を使うのが便利です。これらの専用関数ではデータ・フレーム構造より使いやすいtibble型でデータを読み込みますが...
R言語

tidyverse インストールとロード tidyverseの主なパッケージ

tidyverseはRのパッケージの1つで、データ操作(抽出・連結など)を統合的に扱うためのツール群です。Rを起動後に、tidyverseのインストールを行います。インストール完了後は、使うときにパッケージをロードして使います。 とにかく早...
linuxに関すること

解析トラブル Linuxマシンの動作のもたつき 原因調査と解決策

バイオインフォマティクス解析で使用するツールは、計算が長く続いたり、メモリを大量に必要とするもの、たくさんのファイルを出力するものなど、大きな負荷がかかるものが多いです。このようなツールを使う場合、コンピュータのパフォーマンス管理がしっかり...
AWS

はじめてのcrontab実行 AWS S3へ自動バックアップ

バイオインフォマティクスでは、重要なデータを使うことが多いのでバックアップ作業などは定期的に実行したいものです。確実に、そして簡単に、データバックアップのような単純な処理を、定期的に実行してくれるcrontabを試してみましょう!cront...
linuxに関すること

不要なファイルを探す ファイル名・ファイルサイズ・ファイル更新日時

バイオインフォマティクスの解析では大きなファイルを扱うことが多いので、ストレージの管理には気を使います。ストレージの容量を確保するために、不要なファイルはこまめに削除(または他の場所へ移動・圧縮など)することが、もっとも簡単で確実な方法だと...
linuxに関すること

Zstandard 可逆圧縮アルゴリズムを使ってみる

バイオインフォマティクスの解析では、とても大きなファイルを取り扱うことがあります。解析後もデータを安全に長期間保存しておく必要があって、データ保存に対する悩みは尽きません。より速く、より高い圧縮率でファイルを小さく圧縮できれば、それだけで取...
FastQC

fastqc memory error – java実行時により大きなメモリを割り当てる方法

bamファイルに対してfastqcを実行したら、メモリが足りないというエラーが発生しました。実行環境は十分にメモリーを積んでいたので、fastqc実行時のjavaのメモリーオプションを強制的に書き換えて実行したら、正常終了しました。とにかく...
linuxに関すること

Docker install ubuntu 20.04

無償版 docker ceをインストールして、hello worldの動作確認まで行います。Docker とは?「コンテナ」型の仮想化技術で、アプリケーションやサーバーを動かす技術です。Dockerでは、サーバーの設定や状態をソフトウェアの...
bowtie

bowtie メモリー関連のエラー Warning: Exhausted best-first chunk memory for read

bowtieを--bestモードで実行したところ、メモリーに関するワーニング(警告)が大量に表示されました。エラーではないので処理は進んでいくのですが、「マッピング結果に影響を与えないか?」という点がとても気になりました。そこで、--chu...
スポンサーリンク