linux コマンド uniq ファイル内の重複行チェック

linuxに関すること

2016.01.202021.12.22

バイオインフォ道場、くまぞうです。

ソート済みのファイルから重複しない行を抽出します。ソートしていないファイルでは「uniq」処理できません。「sort」実行後に「uniq」処理するのを習慣化した方が良いと思います。

スポンサーリンク

構文

uniq [オプション] [ファイル…]

主なオプション

-d
重複した行のみを表示します。
-u
重複していない行のみを表示します。

実行例

ファイル１：data/uniq_test.txt
```
aaa 123
aaa 123
bbb 123
ccc 123
```

uniq（重複なしのみ表示）

$ uniq uniq_test.txt
aaa 123
bbb 123
ccc 123

uniq（重複ありのみ表示）

$ uniq -D uniq_test.txt
aaa 123
aaa 123

ファイルがソートされていない場合：data/uniq_test2.txt
```
aaa 123
bbb 123
ccc 123
aaa 123
```
uniq（ソートされてないファイルでは、計算がうまく出来ません）
```
$ uniq uniq_test2.txt
aaa 123
bbb 123
ccc 123
aaa 123
```

uniq実行前にソートする

$ sort uniq_test2.txt | uniq
aaa 123
bbb 123
ccc 123

[amazonjs asin=”4797382384″ locale=”JP” title=”Linuxコマンドブックビギナーズ第4版 (コマンドブックシリーズ)”]

スポンサーリンク

免責事項

当ブログで掲載している画像の著作権・肖像権等は各権利所有者に帰属致します。権利を侵害する目的ではございません。記事の内容や掲載画像等に問題がございましたら、各権利所有者様本人が直接メールでご連絡下さい。確認後、対応させて頂きます。当ブログのコンテンツ・情報につきまして、可能な限り正確な情報を掲載するよう努めておりますが、誤情報が入り込んだり、情報が古くなっていることもございます。当ブログからリンクやバナーなどによって他のサイトに移動された場合、移動先サイトで提供される情報、サービス等について一切の責任を負いません。また、閲覧者が当ブログの情報を直接または間接に利用したことで被ったいかなる損害についても当サイト運営者は一切の責任を負いません。