next up previous
Next: 研究の内容 Up: 「単一化に基づく日英文法の開発および言語知識評価支援システム」に関する成果概要 Previous: 「単一化に基づく日英文法の開発および言語知識評価支援システム」に関する成果概要

研究の背景と目的

自然言語処理のための様々な解析方法や文法、辞書に関する記述および 解析の手法が提案されているが、それぞれの研究者および研究機関が様々 な文法体系に従って文法の開発を行なっており、研究者が共有して蓄積 的に利用し発展させることができるような具体的な文法は多くは存在し ない。また、開発された文法を動作させるための解析システムあるいは 解析環境を共有することも実現することが難しい。

一方、近年大量の電子化された言語データの入手が可能になったこと、 また、ある程度の手間を介して形態素解析や統語解析が行なわれたデー タの蓄積が始まり、文法や辞書に関する知識をそれらから自動もしくは 半自動的に抽出する研究が盛んになっている。しかし、抽出された知識 を評価するための客観的な基準を設けることは難しい。特に抽出された 知識を既存の他の知識と統合することによって、総合的な枠組の中で評 価するための基盤作りはこれからの問題である。

本研究の目的は、自然言語処理のための基本的な言語資源(文法、辞書) および解析環境の開発と共有化を実現することにある。そのために、理 論的文法体系として洗練されているHPSG(Head-driven Phrase Structure Grammar)をベースにし、適用範囲の広さと拡張性を考慮した 日本語および英語の基本文法の開発を行なう。ただし、HPSGによって言 語解析のあらゆる側面を記述することは極めて困難である。 本研究の目的は、ある程度の広い適用範囲をもつ文法をこのよう な宣言的な体系の上で記述するための環境を整備すること、および、現 実の言語解析をこの枠組で行なうための適切なインタフェースを提供す ることである。

また、自然言語解析システムの性能に影響を与えるのは主に語の使われ 方に依存した優先性に関する知識である。このような知識は言語の語彙 の量が膨大であること、また、分野によって語の使われ方や意味が異な ることから、短期間に完全なものを構築することは不可能である。これ に対応するために、解析済みの言語コーパスから語の優先性に関する知 識を自動抽出し、ある程度確率の低い解析の可能性を排除することによっ て、HPSGのような宣言的な処理の負担を軽くするための環境の構築も本 研究の目的とする。



next up previous
Next: 研究の内容 Up: 「単一化に基づく日英文法の開発および言語知識評価支援システム」に関する成果概要 Previous: 「単一化に基づく日英文法の開発および言語知識評価支援システム」に関する成果概要



www-admin@icot.or.jp