next up previous
Next: 今後の課題 Up: 「一般化LR法を用いた頑健な並列構文解析に関する研究」に関する成果概要 Previous: プログラムのサイズおよびドキュメント

成果の自己評価

本研究が提案しているシステムはこれまでのシステムと違って、文法的な適 格文だけではなく、不適格文をも解析することができる。また、不適格性とし て終端記号に関するものだけではなく、非終端記号の誤りも考慮する。それら の点に対して、本研究ははじめての試みである。

本システムは UNIX および PIMOS 上で実装した。これに対してプロポーザル 通りに実現することができた。また、予備実験として、Prolog 版のシステム を用いて、用意した規則数260の英語の文法の元で、ATRの英語対話コーパスか ら取り出した300文(平均文長 7.5)を対象として実験を行なった。その結果、 文法のみによって解析できる文は 140 文(46.7 %)であり、本システムの不適 格文解析によって解析できる文は 272 文(90.7 %)であった。このうち、得ら れた結果に正解を含んでいる文は、前者では 134 文(95 %)であり、後者では、 251文(88.6 %)であった。これは、提案している誤りの種類および誤り推 定のヒューリスティックの有用性を証明している。

また、ソフトウェアの実行時間に対して、Prolog 版のシステムでは 10 数単 語程度の適格文に対して平均 1-2 秒で解析でき、10 数単語程度の不適格文に 対して 1-10 分で解析できる。不適格文解析では比較的に計算量が高いことが わかる。一方、KL1 版のシステムでは小さい文法(10 規則程度)において適格 文および不適格文の解析は数秒かかる。しかし、大きい文法に対しては以下の 問題点が残っている。本システムのプログラムは文法から自動生成するため、 文法が大きいとプログラムは大きくなるので、PIM 上でのプログラムのコンパ イル時間はかなり長くなり、メモリが足りない可能性がある。現段階でこの問 題に対して調査中である。



next up previous
Next: 今後の課題 Up: 「一般化LR法を用いた頑健な並列構文解析に関する研究」に関する成果概要 Previous: プログラムのサイズおよびドキュメント



www-admin@icot.or.jp