Aritalab:Lecture/Programming/Unix
From Metabolomics.JP
				
								
				< Aritalab:Lecture | Programming(Difference between revisions)
				
																
				
				
								
				m  | 
			|||
| Line 1: | Line 1: | ||
{{Lecture/Header}}  | {{Lecture/Header}}  | ||
| − | ==  | + | ==Windows・MacでUnix環境を使う==  | 
| − | [  | + | Mac は Unix ライクなコンソールを備えていますが、Windowsは Ubuntu (LinuxOSの一種)をインストールする必要があります。  | 
| + | まず以下のサイトのとおりに、Windows 上に WSL をインストールします。これで Ubuntu のコンソールを使えるようになります。  | ||
| + | |||
| + | - [https://docs.microsoft.com/ja-jp/windows/wsl/install]  | ||
| + | |||
| + | 次に miniconda というパッケージマネジャーをインストールします。Minicondaは様々なソフトウェアを Linux 上に導入する conda パッケージの最小版になります。  | ||
| + | |||
| + | - [https://docs.conda.io/en/latest/miniconda.html]  | ||
| + | |||
| + | Windows用の .exe ファイルをインストールすると windows powershell 用に環境が整ってしまいます。WSLで導入した Ubuntu から実行するには以下のようにします。  | ||
| + | <pre>  | ||
| + | > curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh  | ||
| + | ...  | ||
| + | > bash Miniconda3-latest-Linux-x86_64.sh  | ||
| + | ...  | ||
| + | </pre>  | ||
| + | これで miniconda が入ります。  | ||
==Unixコマンドの基本==  | ==Unixコマンドの基本==  | ||
コマンドのオプションや詳細は、"<tt>man コマンド名</tt>"や"<tt>コマンド名 --help</tt>"と打って調べましょう。  | コマンドのオプションや詳細は、"<tt>man コマンド名</tt>"や"<tt>コマンド名 --help</tt>"と打って調べましょう。  | ||
| + | <table>  | ||
| + | <tr valign="top"><td>  | ||
;ファイルシステム  | ;ファイルシステム  | ||
; ls : 指定されたディレクトリのファイル名を表示  | ; ls : 指定されたディレクトリのファイル名を表示  | ||
| Line 16: | Line 34: | ||
; rmdir : ディレクトリを削除 (rmでも削除できる)  | ; rmdir : ディレクトリを削除 (rmでも削除できる)  | ||
; touch : 空のファイルを作成  | ; touch : 空のファイルを作成  | ||
| − | + | </td><td>  | |
; テキストファイル操作  | ; テキストファイル操作  | ||
; cat : 指定されたファイルを連結して標準出力に出す  | ; cat : 指定されたファイルを連結して標準出力に出す  | ||
| Line 30: | Line 48: | ||
; head : ファイルの先頭10行を出力  | ; head : ファイルの先頭10行を出力  | ||
; tail : ファイルの末尾10行を出力  | ; tail : ファイルの末尾10行を出力  | ||
| − | + | </td><td>  | |
;ファイル圧縮  | ;ファイル圧縮  | ||
; gzip : ファイルを.gz拡張子のついた形に圧縮  | ; gzip : ファイルを.gz拡張子のついた形に圧縮  | ||
| Line 43: | Line 61: | ||
; | : パイプ。左側のコマンドの標準出力を、右側のコマンドの標準入力につなぐ  | ; | : パイプ。左側のコマンドの標準出力を、右側のコマンドの標準入力につなぐ  | ||
; > : リダイレクト。左側のコマンドの標準出力をファイルに書き出す  | ; > : リダイレクト。左側のコマンドの標準出力をファイルに書き出す  | ||
| + | </td></tr>  | ||
| + | </table>  | ||
| + | == ゲノム解析に必要なツールとデータ==  | ||
| + | conda を使って以下のように準備しておきます。  | ||
| + | <pre>  | ||
| + | (base) $ conda install -y -c bioconda fastqc fastp megahit seqkit  | ||
| + | ...  | ||
| + | (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218  | ||
| + | 6/DRR024501_1.fastq.bz2  | ||
| + | (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218  | ||
| + | 6/DRR024501_2.fastq.bz2  | ||
| + | ...  | ||
| + | (base) $ bunzip2 *.bz2  | ||
| + | ...  | ||
| + | >seqkit stats *.fastq  | ||
| + | (base) $ seqkit stats *.fastq  | ||
| + | file               format  type   num_seqs      sum_len  min_len  avg_len  max_len  | ||
| + | DRR024501_1.fastq  FASTQ   DNA   2,971,310  745,798,810      251      251      251  | ||
| + | DRR024501_2.fastq  FASTQ   DNA   2,971,310  745,798,810      251      251      251  | ||
| + | </pre>  | ||
Revision as of 15:54, 31 May 2022
| Wiki Top | Up one level | レポートの書き方 | Arita Laboratory | 
 
  | 
Windows・MacでUnix環境を使う
Mac は Unix ライクなコンソールを備えていますが、Windowsは Ubuntu (LinuxOSの一種)をインストールする必要があります。 まず以下のサイトのとおりに、Windows 上に WSL をインストールします。これで Ubuntu のコンソールを使えるようになります。
- [1]
次に miniconda というパッケージマネジャーをインストールします。Minicondaは様々なソフトウェアを Linux 上に導入する conda パッケージの最小版になります。
- [2]
Windows用の .exe ファイルをインストールすると windows powershell 用に環境が整ってしまいます。WSLで導入した Ubuntu から実行するには以下のようにします。
> curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh ... > bash Miniconda3-latest-Linux-x86_64.sh ...
これで miniconda が入ります。
Unixコマンドの基本
コマンドのオプションや詳細は、"man コマンド名"や"コマンド名 --help"と打って調べましょう。
  | 
 
  | 
 
 
  | 
ゲノム解析に必要なツールとデータ
conda を使って以下のように準備しておきます。
(base) $ conda install -y -c bioconda fastqc fastp megahit seqkit ... (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 6/DRR024501_1.fastq.bz2 (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 6/DRR024501_2.fastq.bz2 ... (base) $ bunzip2 *.bz2 ... >seqkit stats *.fastq (base) $ seqkit stats *.fastq file format type num_seqs sum_len min_len avg_len max_len DRR024501_1.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251 DRR024501_2.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251