awkは、テキスト処理に欠かせません。よく使う「行を指定した処理」に使える定型スクリプトをまとめました。簡単に書けるように、省略できる部分は極力省きました。
awk と 行
awkで行を指定して「何かの処理」を実行するときは、「いま何行目?」をあらわす変数NRを利用します。例えば、awk 'NR==1'とすれば、1行目に対して処理を行います。一方、最終行では、わざわざ行番号を指定しなくても、「最後に」を意味するENDを使います。
awk と 行指定の処理
awkで行を指定した表示を行います。よく使う「先頭行・1行目」「最終行・最後の行」「行指定」について例(サンプル)を実行します。
サンプルデータ
$ cat aaa.txt aaa bbb ccc AAA BBB CCC 111 222 333
awk 先頭行・1行目の表示
NRを指定して、awkで先頭行を表示します。
簡潔に書いた場合
$ cat aaa.txt | awk 'NR==1' aaa bbb ccc
省略せずに書いた場合
$ cat aaa.txt | awk 'NR==1 {print $0}'
aaa bbb ccc
awkでは、{}内に実行する処理を書きます。省略した場合はprintが実行され、1行全体を表示します。$0は、行全体をあらわします。$1は区切り文字でわけられた1列目の意味になります。
awk 最終行・最後の行の表示
ENDを指定して、awkで最終行を表示します。
$ cat aaa.txt | awk 'END{print}'
111 222 333
{}内に実行する処理を書きます。'END{print}'で、「(awk処理の)最後に行を表示」の意味になります。$0は省略しています。
awk 指定行の表示
NR==行番号を指定して、awkで指定行を表示します。
$ cat aaa.txt | awk 'NR==2' AAA BBB CCC
{}内の処理は省略したので、print $0が実行されます。
awk と 行の表示 まとめ
awkで行を指定する場合は、NRを使います。最終行は、「何行目か?」がわからないことが多いので、END{}を使います。行に対して処理を省略するとprint $0が実行され、行全体を表示します。簡単に書きたい場合は、省略を活用すると短く書けます。


関連記事

awk 置換や部分文字列などの文字列処理 gsub sub match index split 等
awkの文字列関数について、置換や部分文字列処理など、よく使う代表的なものを簡単なサンプルを使って紹介します。awk 置換文字列置換 gsub subgsub・subは、対象となる文字列tについて正規表現rにマッチした部分を置換文字列sで置...

awk 複数行の処理
ファイルには様々な形式があります。1行単位で記述されたCSV(カンマ区切り)ファイルやTSV(タブ区切り)ファイルは、awkやsed、その他のbashコマンドなどを使っても比較的処理がしやすい。しかし、複数行でレコードが構成される場合(1行...

awk split | サンプルでわかる列の分割とセパレータ指定方法
awkのsplit関数は、セパレータを指定して文字列を分割することができます。セパレータには文字や正規表現で指定できて、指定しない場合はフィールドセパレータがデリミタとして使われます。分割後の単語は、配列に格納されて1〜分割数nまでのインデ...

awk while・do 繰り返し処理
awkの繰り返し処理(for・while・do)についてまとめます。今回は、while・doについて。とにかく早く問題解決したい人はこちら>>直接、データ解析相談awk while 繰り返し処理条件を満たせば「ずっと」繰り返しを行います。繰...

awk 配列 使い方
awkでは、他のプログラミング言語のように配列を使うことができます。配列の簡単な使い方のまとめです。とにかく早く問題解決したい人はこちら>>直接、データ解析相談awk 連想配列awkの配列では、インデックスには文字列でも数字でも使うことがで...

awk よく使うシステム変数と使い方
awkのスクリプトでは、参照や設定が可能な「特殊な変数(システム変数)」を使うことができます。とにかく早く問題解決したい人はこちら>>直接、データ解析相談よく使うシステム変数awkのスクリプトでシステム変数を使うと、より簡潔にスクリプトを表...

awk パターンとアクション
awkは、入力行に対してフィルタリングなどの処理を行う際によく用いられます。入力行に対して「どの行に処理を行うか」を指定するのがパターン、「どんな処理を行うか」を指定するのが「アクション」です。とにかく早く問題解決したい人はこちら>>直接、...

awk 区切り文字とフィールド
awkは、入力の各行を区切り文字でフィールドに分割して、それぞれを個別に取り出すことができます。とにかく早く問題解決したい人はこちら>>直接、データ解析相談awk 区切り文字の変更入力行をフィールドに分割するのは区切り文字です。デフォルトは...

awk コマンドラインでの実行とスクリプトファイルでの実行
awkを実行する場合、コマンドラインで指定する方法と、スクリプトファイルを指定する方法があります。とにかく早く問題解決したい人はこちら>>直接、データ解析相談awk コマンドラインで指定するpatternとactionは、シングルクォートで...

awk 使い方 フィールド取り出し スクリプトの書き方
awkで簡単なフィールドデータの取り出しを行います。awk は入力された行について、空白やタブで区切られたデータをフィールドと解釈します。・…を指定することで、各行のフィールドを取り出すことができます。尚、https://bioinfo-dojo.net/2016/02/18/awk_easy_field_filter/は入力行全体です。se...

awk 使い方 フィールド取り出し スクリプトの書き方
awkで簡単なフィールドデータの取り出しを行います。awk は入力された行について、空白やタブで区切られたデータをフィールドと解釈します。・…を指定することで、各行のフィールドを取り出すことができます。尚、https://bioinfo-dojo.net/2016/02/18/awk_easy_field_filter/は入力行全体です。se...

正規表現 メタキャラクタ 検索・置換 後編
sed や awk、grep、その他のプログラム処理で文字列を扱うときに、よく用いられる「正規表現」についてまとめます。とにかく早く問題解決したい人はこちら>>直接、データ解析相談正規表現とは正規表現とは、文字列集合を特殊文字(メタキャラク...
![バイオインフォ 道場 [bioinfo-Dojo]](https://bioinfo-dojo.net/wp-content/uploads/2016/03/some_object_luca-bravo-alS7ewQ41M8-unsplash.jpg)
