linux コマンド プロセス置換 無駄な一時ファイルを作らない

バイオインフォ道場、くまぞうです。

bashでは、複数のコマンドをパイプでつなぐことができます。しかし、入力をファイルからしか受け取らない一部のコマンドでは、わざわざ一時ファイルを準備する必要があって意外と面倒です。そんなときは、プロセス置換を活用しましょう。無駄な中間ファイルを作らずに処理を進めることができます。

スポンサーリンク



プロセス置換とは

プロセス置換を使うと、コマンドの出力結果をファイルとして扱うことができます。例えば、diffコマンドはファイルを入力として要求するので、通常はパイプ処理された結果を直接放り込むことはできません。しかし、プロセス置換を使えば、中間ファイルを作らずにコマンドの結果を直接入力とすることができます。例えば、先頭列だけ切り出してソートしたデータA・データBを中間ファイルなしに直接比較する、というようなことが出来るようになります。意味のない中間ファイルほど気持ち悪いものはないので、極力少なくできるのは非常に有難いです。

プロセス置換の書き方

パイプで繋ぐなどしたコマンドのリストを<(...)で囲みます。<()の間に、スペースを入れないにようします。

command <(command-list) | other command ...  # プロセス置換(余計なスペースを入れない)

$ cat aaa.txt
1 aaa
2 bbb
3 ccc

$ cat bbb.txt
1 aaa
3 ddd
2 bbb
# 1列目だけをソートして比較
diff <(cut -f1 aaa.txt | sort) <(cut -f1 bbb.txt | sort)

スクリプトを書く際の注意点

bashの機能なので、シェバンの書き方を/bin/bashとして明示的に指定する必要があります。

my_diff.sh

#! /bin/bash

file1=$1
file2=$2

DIFF="diff <(cut -f1 $1 | sort) <(cut -f1 $2 | sort)"
CNT=`wc -l < <(eval $"$DIFF")`

if [ $CNT -eq '0' ]; then
    echo "same"
else
    echo "different"
fi
$ bash my_diff.sh aaa.txt bbb.txt

[amazonjs asin=”4873112540″ locale=”JP” title=”入門bash 第3版”]

スポンサーリンク





ピックアップ記事

  1. awk split サンプルでわかる列の分割とセパレータ(文字・正規表現)の指定方法

    awkのsplit関数は、セパレータを指定して文字列を分割することができます。セパレータには文字や…
  2. R plot 重ねる方法3パターン サンプルでわかるRの使い方

    Rでグラフ (plot) を重ねる方法は、「単純な追加」「図に重ねて描画」「濃淡で重なり表現」の3…
  3. R 使い方 グラフの色 自作のカラーパレットとデフォルトのカラーパレット

    グラフを描画する際、色の組み合わせを1つ1つ考えるのは面倒ですよね。Rには、あらかじめ色の組み合わ…

人気記事

  1. Excel, その他, 統計

    z-score 計算方法 エクセル(Excel) 編
    統計処理で、大きく変化しているなどの判断基準にも使われる値…
  2. R データ型 - 文字列・ベクター・データフレーム・マトリックス など-, R言語, スクリプト

    R subset関数 データフレームやmatrixからの条件指定による行・列の抽出
    R の subset関数は、データフレームやマトリックスか…
  3. IGV, 解析ツール

    IGV 使い方 インストール〜便利な使い方まで | リファレンス・マッピングデータ・アノテーションを読み込んで表示しよう
    IGV(Integrative Genomics View…

おすすめ記事

  1. R言語, グラフ

    R 使い方 軸・ラベルの調整(向き・サイズ・色など) グラフの描き方
    Rによるplot(グラフ)の描画は、手軽で大変便利です。た…
  2. bash 応用, シェルスクリプト

    シェル スクリプト ファイル存在チェック・空のファイルチェック
    bashでスクリプトを作成するときに、よく使うのがファイル…
  3. awk, bash 文字列操作, シェルスクリプト

    bash 部分文字列・置換・長さ・連結・分割の文字列処理
    bashのよく使う文字列処理、部分文字列・置換・連結・長さ…