自然言語処理研究の目的の一つは、人間のように柔軟でかつ効率的に言語を解 析したり生成したりするシステムの実現であるが、また、これと同時に、自然 言語処理研究から得られた技術を利用して多様なアプリケーションが開発され ている。しかし、これまでの自然言語解析ツールは、システムの文法に適合す る文のみを受理するものが主であった。システムが現実に処理するテキストや 対話文には、様々な非文法的表現や誤りがしばしば現れるため、入力文が文法 的に正しいと仮定する従来の解析ツールは、適用範囲が広く柔軟な処理を要求 する実用的なシステムには必ずしも適していない。ここで、非文法的表現や誤 りを含む文を「不適格文」とよび、不適格文を処理する能力をもつシステムを 「頑健な」自然言語処理システムとよぶ。近年研究が実際の対話を処理する場 合には、文法から逸脱した文は日常的であると考えられ、文法に適合しない文 をも受理できる頑健な自然言語解析ツールの需要は高まっていると考えられる。
しかし、頑健な自然言語解析を行なう際には、計算量が膨大になるという問題 がある。これは、不適格文を受理するために、通常の制約(文法など)を緩和す るため、探索空間が大きくなるからである。長さが同じ適格文の解析よりも数 万倍の解析時間が不適格文の場合には必要になることがある。このように、頑 健な自然言語解析システムを実現するには、膨大な計算量の問題を克服しなけ ればならない。これに対する有望な解決法としては、処理の並列化が考えられ る。
上記で述べたような背景を踏まえ、本研究では、PIM 上および汎用計算機上で 並列に動作する頑健な構文解析ツールを開発・整備する。多くの自然言語処理 システムにとって構文解析器は中核をなす重要な部分である。そこで、本研究 では、頑健な自然言語処理システムに必要不可欠と考えられる、頑健な構文解 析ツールを開発・整備する。