Jan 5, 2004

Markovで作文やら要約やら

Passion For The Future経由で知ったページ. SPAMフィルタ対策に使われる事で有名な(?)Markov状態遷移を用いた自動作文ツールの日本語版です. サンプルボタンを押すと止まってしまったかのように重くなるので注意かも.単純な仕組みですが日本語でも「それっぽい」文を生成できるのですね. サンプルだとちゃんと「夏目漱石っぽい」文をだしてくれます.

Passion For The Futureではそれを使って要約を行っています. Markovで学習させる文法として, 筆者とか文章のカテゴリではなく「同じ質問に対する回答」を入れるというのは面白いです. 学習データが68文程度というのは少ない気もしますが「それっぽい」回答がでてきてます. 主語が2つあったりとか妙なとこも多いですが…とんちんかんな文ができてるのも「識者」のコメントっぽく感じるのが不思議です. 構文解析までして学習して自動生成させたらもっとちゃんとした文ができるのかな…

No comments:

Post a Comment