wgetのオプション

それゆけBioinformatics で知ったwgetの便利な引数をメモ。

[使い方例]
ftp://ftp.ncbi.nih.gov/genomes/Arabidopsis_thaliana/
にある各データを全部ダウンロードしたい
---
以下のようにシェル (bash: $)で一行コマンドを打ちます。


$ wget -r -np --wait=10 --no-host-directories ftp://ftp.ncbi.nih.gov/genomes/Arabidopsis_thaliana/


このコマンドオプションの意味を軽く説明しますと、、、「リトライ時間を10秒間にして (ネットワークに負荷がかかっている場合は大きめに設定)、ftp://ftp.ncbi.nih.gov/genomes/Arabidopsis_thaliana/ 以下 (-np: --no-parent, 親ディレクトリを再帰的に回収しない) を再帰的に (-r) 回収します (ドメイン名のディレクトリは作りません)」となります。

こうすることでカレントディレクトリ以下に指定したftpサイトのデータがそのまま保存されます。p>

へぇへぇ、恥ずかしながら白状しますがwgetの引数を全然知りませんでした。複数のファイルをまとめてゲットしたい時にはsh組んじゃってたし。でもこれでディレクトリが複雑でも再帰的にゲットできますね。便利だ。