自然言語処理研究の目的の一つは,人間のように柔軟でかつ効率的に言語を解 析したり生成したりするシステムの実現であるが,また,これと同時に,自然 言語処理研究から得られた技術を利用して多様なアプリケーションが開発され ている.しかし,これまでの自然言語解析ツールは,システムの文法に適合す る文のみを受理するものが主であった.システムが現実に処理するテキストや 対話文には,様々な非文法的表現や誤りがしばしば現れるため,入力文が文法 的に正しいと仮定する従来の解析ツールは,適用範囲が広く柔軟な処理を要求 する実用的なシステムには必ずしも適していない.ここで,非文法的表現や誤 りを含む文を「不適格文」とよび,不適格文を処理する能力をもつシステムを 「頑健な」自然言語処理システムとよぶ.近年研究が活発な対話を処理する場 合には,文法から逸脱した文は日常的であると考えられ,文法に適合しない文 をも受理できる頑健な自然言語解析ツールの需要は高まっていると考えられる.
しかし,頑健な自然言語解析を行なう際には,計算量が膨大になるという問題 がある.これは,不適格文を受理するために,通常の制約(文法など)を緩和す るため,探索空間が大きくなるからである.長さが同じ適格文の解析よりも数 万倍の解析時間が不適格文の場合には必要になることがある.このように,頑 健な自然言語解析システムを実現するには,膨大な計算量の問題を克服しなけ ればならない.これに対する有望な解決法としては,処理の並列化が考えられ る.
上記で述べたような背景を踏まえ,本研究では,PIM 上および汎用計算機上で 並列に動作する頑健な構文解析ツールを開発・整備する.多くの自然言語処理 システムにとって構文解析器は中核をなす重要な部分である.そこで,本研究 では,頑健な自然言語処理システムに必要不可欠と考えられる,頑健な構文解 析ツールを開発・整備する.