linux コマンド プロセス置換 無駄な一時ファイルを作らない

バイオインフォ道場、くまぞうです。

bashでは、複数のコマンドをパイプでつなぐことができます。しかし、入力をファイルからしか受け取らない一部のコマンドでは、わざわざ一時ファイルを準備する必要があって意外と面倒です。そんなときは、プロセス置換を活用しましょう。無駄な中間ファイルを作らずに処理を進めることができます。

スポンサーリンク



プロセス置換とは

プロセス置換を使うと、コマンドの出力結果をファイルとして扱うことができます。例えば、diffコマンドはファイルを入力として要求するので、通常はパイプ処理された結果を直接放り込むことはできません。しかし、プロセス置換を使えば、中間ファイルを作らずにコマンドの結果を直接入力とすることができます。例えば、先頭列だけ切り出してソートしたデータA・データBを中間ファイルなしに直接比較する、というようなことが出来るようになります。意味のない中間ファイルほど気持ち悪いものはないので、極力少なくできるのは非常に有難いです。

プロセス置換の書き方

パイプで繋ぐなどしたコマンドのリストを<(...)で囲みます。<()の間に、スペースを入れないにようします。

command <(command-list) | other command ...  # プロセス置換(余計なスペースを入れない)

$ cat aaa.txt
1 aaa
2 bbb
3 ccc

$ cat bbb.txt
1 aaa
3 ddd
2 bbb
# 1列目だけをソートして比較
diff <(cut -f1 aaa.txt | sort) <(cut -f1 bbb.txt | sort)

スクリプトを書く際の注意点

bashの機能なので、シェバンの書き方を/bin/bashとして明示的に指定する必要があります。

my_diff.sh

#! /bin/bash

file1=$1
file2=$2

DIFF="diff <(cut -f1 $1 | sort) <(cut -f1 $2 | sort)"
CNT=`wc -l < <(eval $"$DIFF")`

if [ $CNT -eq '0' ]; then
    echo "same"
else
    echo "different"
fi
$ bash my_diff.sh aaa.txt bbb.txt
スポンサーリンク