next up previous
Next: 研究の内容 Up: 一般化 LR 法を用いた 頑健な並列構文解析に関する研究 Previous: 一般化 LR 法を用いた頑健な並列構文 解析に関する研究

研究の背景と目的

自然言語処理研究の目的の一つは,人間のように柔軟でかつ効率的に言語を解 析したり生成したりするシステムの実現であるが,また,これと同時に,自然 言語処理研究から得られた技術を利用して多様なアプリケーションが開発され ている.しかし,これまでの自然言語解析ツールは,システムの文法に適合す る文のみを受理するものが主であった.システムが現実に処理するテキストや 対話文には,様々な非文法的表現や誤りがしばしば現れるため,入力文が文法 的に正しいと仮定する従来の解析ツールは,適用範囲が広く柔軟な処理を要求 する実用的なシステムには必ずしも適していない.ここで,非文法的表現や誤 りを含む文を「不適格文」とよび,不適格文を処理する能力をもつシステムを 「頑健な」自然言語処理システムとよぶ.近年研究が活発な対話を処理する場 合には,文法から逸脱した文は日常的であると考えられ,文法に適合しない文 をも受理できる頑健な自然言語解析ツールの需要は高まっていると考えられる.

しかし,頑健な自然言語解析を行なう際には,計算量が膨大になるという問題 がある.これは,不適格文を受理するために,通常の制約(文法など)を緩和す るため,探索空間が大きくなるからである.長さが同じ適格文の解析よりも数 万倍の解析時間が不適格文の場合には必要になることがある.このように,頑 健な自然言語解析システムを実現するには,膨大な計算量の問題を克服しなけ ればならない.これに対する有望な解決法としては,処理の並列化が考えられ る.

上記で述べたような背景を踏まえ,本研究では,PIM 上および汎用計算機上で 並列に動作する頑健な構文解析ツールを開発・整備する.多くの自然言語処理 システムにとって構文解析器は中核をなす重要な部分である.そこで,本研究 では,頑健な自然言語処理システムに必要不可欠と考えられる,頑健な構文解 析ツールを開発・整備する.



www-admin@icot.or.jp