« A Day in the Life of the Internet | メイン | 10 Papers on Network Models »

MLs for Flow Classification

"A Preliminary Performance Comparison of Five Machine Learning Algorithms for Practical IP Traffic Flow Classification," ACM SIGCOMM CCR Vol. 36, Number 5 (October 2006). port number & payload ベースのフロー識別ではない、payload-independent なパケット長や到着時間間隔分布など(features)をベースにしたフロー統計によるフロー識別方法の性能比較。The same set of features (この論文では 22 の flow features) をフロー群に適用し、フローごとに異なる feature values によってフローを識別。Instances (unknown flows) を classes (known flows) にマッピングする(基本的に MLs は supervised algorithms = 事前にマッピング情報を持っている)。

研究背景は、port-agile, using non-default ports, using network address port translation なアプリケーションの増加。比較した ML 群は、Bayesian Network, C4.5 Decision Tree, Naive Bayes, Naive Bayes Tree (実装がシンプルで、パラメータ調整が必要ないものを選択). ML 群の分類の正確さはほぼ同じ、build time (required to train a classifier) や分類スピードなどの計算性能が ML ごとに大きく異なる。評価結果は、C4.5 の分類スピードが最も早い。

トラックバック

このエントリーのトラックバックURL:
http://www.ht.sfc.keio.ac.jp/~masato/mt/mt-tb.cgi/3775

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)