2012 / 2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23 24 25 26 27 28 29

2007

August

31

日記:: 文脈を考慮した解析にはまだ時間がかかるでしょう。
コメント 0 / 0

例えば「で」にはいくつかの種類がありそれぞれ文法的な働きが異なると本には書いてありますが、実際に出てきた「で」がどの種類の「で」なのかは、入力されたテキストにはマークしてありません。

 

当時──┐                          当時─┐

私は──┤                          私は─┤

学校で─┤                            学生で─┐

講演を─┤                            講演を─┤

楽しみにしていた。                    楽しみにしていた。

 

持っている知識をすべて動員して前後関係から分けようとするのですが、なかなか思うようにはいきません。最近はコンピューターの性能が上がってきたので、以前はあきらめていたような全数検査が簡単に出来るようになりました。辞書の静的な情報は、簡単にとりだせるようにはなりました。しかし、どちらの「で」なのかというような問題は、逐一、人が見て考えないと決められません。

 自然言語処理はこれからの検索やテキストマイニングではなくてはならない技術だと思いますが、勝ち目のない巨大な敵に老骨に鞭打って立ち向かっているような気がしてなりません。




コメント
コメントはありません。
トラックバック
トラックバックはありません。
コメントを書く
フォームに入力してプレビューを押して下さい。