使用したマシンの仕様 モデル SGI Altix 350
CPU Intel Itanium2 プロセッサ 1.4GHz - 8 CPU
キャッシュ L1 Cache 32KB, L2 Cache 256KB, L3 Cache 3MB
メモリ PC3200 40GB (6.4GB/s)
HDD SCSI 80GB * 2
OS SGI Advanced Linux Environment with SGI ProPack 3.0

・メモリ構成
. 1 次データ・キャッシュ(L1-D)
. 1 次命令キャッシュ(L1-I)
. 2 次ユニファイド・キャッシュ(L2)
. 3 次ユニファイド・キャッシュ(L3)
. 1 次データ・トランスレーション・ルックアサイド・バッファ
(L1-DTLB)
. 2 次データ・トランスレーション・ルックアサイド・バッファ
(L2-DTLB)
. 命令トランスレーション・キャッシュ(ITLB)
. メイン・メモリ( フロントサイド) バス

・L1 データ・キャッシュ
16KB
64B cache line
4-way set associative
Write throught
非ライト・アロケート
L1 キャッシュは、1 クロック当たり2 つのロード、2 つのスト
ア、または1 つのロードと1 つのストアを連続に実行できる。L1 にヒッ
トする整数ロードは、データを参照する側のほどんどの操作に対して2
サイクルのレイテンシを持つ。浮動小数点ロードは、常にL1 データ・
キャッシュを使用しない。
すぐ後にロードされる値を書き込むストア( ストアからロードへのフォ
ワーディングと呼ばれる) には、余分なサイクルがかかることがある。( ア
ライメントされた64 ビット領域の任意の部分の中で) 最近3 サイクル以内
にストアが行われたアドレスからロードする場合、ロードはL1 を使用せ
ず、L2 からデータを読み出す。

・L1 命令キャッシュ
16KB
64B cache line
4-way set associative

・L2 ユニファイド・キャッシュ
256KB
128B cache line
8-way set associative
Write back
ライト・アロケート

・L3 ユニファイド・キャッシュ
3MB
128B cache line
6-way set associative
Write back

・L1 DTLB
32 entry
ページサイズ 4KB
full associative

・L2 DTLB
128 entry
ページサイズ 4KB〜4GB
full associative