1
自己紹介
法政大学 応用情報工学科 知的情報処理研究室
(彌冨研)
Cpaw 代表
ICTSC 運営
さくらインターネット 技術本部 アプリケーション
アルバイト
2
本日のLT内容
自然言語処理とセキュリティ
Character Level Convolutional Neural Network
(以下CLCNN)について
CLCNNによる悪性文字列の検知
3
自然言語処理とセキュリティ
自然言語処理は昔からセキュリティ技術に
用いられている
4
自然言語処理とセキュリティ
迷惑メールフィルタ
文章→形態素解析→ナイーブベイズによるフィルタ
スパムアカウントフィルタ
文章→形態素解析→ワードベクトル化
→SVMによる分類
マルウェア検知
APIコールパターン→n-gram→決定木による検知
5
CLCNNについて
文字単位でCNNを行う
特徴抽出をConvolutional層にて行い識別を行う
ため、特徴抽出を別途行う必要がない
6
CLCNNについて
研究例
文字画像によるCharacter-level Embeddingと文書分類
7
CLCNNによる悪性文字列の検知
A Character-Level Convolutional Neural Network with
Embeddings For Detecting Malicious URLs, File Paths
and Registry Keys
CLCNNを用いて悪性URL、ファイルパス、
登録キーを検知する研究論文
8
CLCNNによる悪性文字列の検知
9
CLCNNによる悪性文字列の検知
10
1. 文字列のベクトル化
CLCNNによる悪性文字列の検知
11
1. 文字列のベクトル化
2. ベクトルからConv層による
特徴抽出
CLCNNによる悪性文字列の検知
12
1. 文字列のベクトル化
2. ベクトルからConv層による
特徴抽出
3. 抽出した特徴をFC層で分類
CLCNNによる悪性文字列の検知
精度:
13
ここからオフレコ
14
15
16
17
CLCNNの応用
データが欲しい
僕の作ったアーキテクチャで試していいデータをお
持ちの方はいただけると…:pray:
18
参考文献
 https://www.goto.info.waseda.ac.jp/forB4/pdf-th/2013/aoki.pdf
 http://iyatomi-lab.info/sites/default/files/user/yans2016_poster.pdf
 https://arxiv.org/pdf/1702.08568.pdf
19

Character Level Convolutional Neural Networkによる悪性文字列検知手法