はじめに

Next: 研究内容 Up: 「一般化LR法を用いた頑健な並列構文解析に関する研究」に関する成果概要 Previous: 「一般化LR法を用いた頑健な並列構文解析に関する研究」に関する成果概要

はじめに

自然言語処理研究の目的の一つは、人間のように柔軟でかつ効率的に言語を解析したり生成したりするシステムの実現であるが、また、これと同時に、自然言語処理研究から得られた技術を利用して多様なアプリケーションが開発されている。しかし、これまでの自然言語解析ツールは、システムの文法に適合する文のみを受理するものが主であった。システムが現実に処理するテキストや対話文には、様々な非文法的表現や誤りがしばしば現れるため、入力文が文法的に正しいと仮定する従来の解析ツールは、適用範囲が広く柔軟な処理を要求する実用的なシステムには必ずしも適していない。ここで、非文法的表現や誤りを含む文を「不適格文」とよび、不適格文を処理する能力をもつシステムを「頑健な」自然言語処理システムとよぶ。近年研究が実際の対話を処理する場合には、文法から逸脱した文は日常的であると考えられ、文法に適合しない文をも受理できる頑健な自然言語解析ツールの需要は高まっていると考えられる。

しかし、頑健な自然言語解析を行なう際には、計算量が膨大になるという問題がある。これは、不適格文を受理するために、通常の制約(文法など)を緩和するため、探索空間が大きくなるからである。長さが同じ適格文の解析よりも数万倍の解析時間が不適格文の場合には必要になることがある。このように、頑健な自然言語解析システムを実現するには、膨大な計算量の問題を克服しなければならない。これに対する有望な解決法としては、処理の並列化が考えられる。

上記で述べたような背景を踏まえ、本研究では、PIM 上および汎用計算機上で並列に動作する頑健な構文解析ツールを開発・整備する。多くの自然言語処理システムにとって構文解析器は中核をなす重要な部分である。そこで、本研究では、頑健な自然言語処理システムに必要不可欠と考えられる、頑健な構文解析ツールを開発・整備する。

www-admin@icot.or.jp