平成10年度 委託研究ソフトウェアの提案

1.IFS日本語(形態素)解析パッケージ・配布プロジェクト

研究代表者: 佐野 洋 助教授
東京外国語大学外国語学部



[目次]

  1. 研究テーマ
  2. 研究体制/研究方法
  3. ソフトウェア成果

[研究テーマ]

1)研究テーマ名:

IFS日本語(形態素)解析パッケージ・配布プロジェクト

2)研究の背景

平成8年度先端技術研究所研究委託事業の支援により、IFS日本語文法規則を開発し、文法規則マニュアルおよび利用者マニュアルを作成した。当初、UNIX系OSでの利用を予定した。世界80%のOSシェアを持つ Windows に対応させることで利用拡大を目指し、Windows95/NT-OSで動作する形態素解析エンジン(富士通研究所で開発した形態素解析エンジンBreakfast)に添付される形態のソフトウェアリリースを採用し利用拡大を行った。

1997年1月17日、(株)富士通のホームページのフリーソフトの欄にBreakfast がアップされると同時に、添付データとして同サイトからのIFS日本語文法規則のダウンロードサービスが始まっている。IFS規則に関し、ダウンロード数は、2桁(後半)件数/月程度である。とりわけ、言語処理学会が開催された3月には、佐野の自然言語処理ツールのチュートリアル講演なども影響し、Breakfast を中心に、富士通全体のアクセスログのベスト100 に入るほどのアクセスがあった(正確な数字は企業内データのため伏せている)。
IFS日本語文法規則は、ターゲットの市場を拡大した結果、研究分野における利用だけでなく、より広い分野で潜在的な利用度が向上している。
(URL → http://www.fujistu.co.jp/hypertext/free/breakfast)

今後、戦略的に当ソフトウェアの利用の拡大を行うめには、(1)Windows 95/NT 用GUIインタフェースを開発する、(2)アプリケーション指向の利用者ガイドを充実させることが必須である。

3) 研究の目的

前項の課題で挙げた(1)については、昨年度、委託研究外の試みとして、パイロットモデル的な Windows95/NT 用インタフェースを作成した。(2)については、開発者指向のマニュアルを整えて研究期間を終えた。
本研究の目的は、(1)の Windows 用インタフェースを拡充すること、(2)のマニュアルを再検討し、利用者指向のマニュアルを作成することにある。さらに多言語に対応した文章化を実施する。

一般に、ソフトウェアの利用を促進するためには、そのソフトウェアが提供する機能を、利用者に読みやすく、且つ理解しやすく、しかも、使い易く解説する積極的な努力が必要である。いわゆるマニュアルの品質が、そのソフトウェアの使用感や利用の容易さに影響し、プログラム自身の能力さえも評価することになる。添付資料であるマニュアル自身も、重要なソフトウェアプロダクトであると考えられる。

例えば、ビジネス用アプリケーションソフトウェアでは、80%ほどの利用者は、そのソフトウェアの20%程度を理解すれば、業務に十分に利用してゆくことができるといわれている。開発者は一般に(開発者指向によって)すべての機能説明を説明書に盛り込もうとするが、利用者はそのすべての理解はできない(あるいはする必要がない)。アプリケーション指向の観点に立って、機能の選択を行い、動作説明を限定することが利用者サイドにたった説明書(マニュアル)といえる。利用者に役に立つマニュアルとは、その使う目的や利用対象者等に応じて書き分けられている必要がある。マニュアルにも記述の体系が必要となる。

研究利用が主な目的であるソフトウェアでは、上記と違いはあるものの、しかしながら多数の利用者が100%のソフトウェア理解を求めているとは考えられない。応用するに足る最小限度の理解が容易であるほど、ユーザーサイドの負担が減り、ソフトウェアの利用度は向上する。

本研究では、利用者指向の視点に立って既存のソフトウェア(IFS日本語文法規則)を見直し、その結果を基に、(1)パイロットモデル版インタフェースを拡充し、IFS日本語(形態素)解析パッケージ用インタフェースを作成する、(2)マニュアルの体系化と構造設計を行い、日本語マニュアルの再構成を実施する。当該マニュアルの英語版と中国語版(簡略化した試用版文章に限定)を作成する。

日本国内においても、技術開発や先端研究のために、外国語の論文の参照が日常的に行われている。日本語形態素解析システムもそのソフトウェアの直接的な利用だけでなく、多様な利用と参照に対応するリリース形態を目指すことが必要である。簡略版ながら中国語版マニュアルの作成は、ワードスペースを持たない中国語解析研究の際の参照ソフトウェアとしての役割を積極的に担うことを意図する。

4) 研究の内容

IFS日本語(形態素)解析パッケージ・配布プロジェクト
(1) IFS日本語(形態素)解析パッケージ・Windows95/NT用インタフェースの開発

パイロットモデル版 Windows95/NT 用インタフェースを改良し拡充することで、IFS日本語(形態素)解析パッケージ用のGUIインタフェースを開発する。インタフェースの利用効果を高める試みとして、利用者対象者の絞り込み(文科系・社会科学系研究者)を行い、当該対象者のユーザーモデルを検討する。これは Windows 市場への対応を目指したもので、専門研究者でない利用者をターゲットとする。
パイロットモデル版のインタフェースは、Visual Basic で記述されている。基本コードを再利用することで効率的なソフトウェア開発を目指す。但し、インタフェースメッセージの多言語化は検討事項とする。インタフェースソフトウェアの開発後、本学の留学生を対象にインタフェースの機能とデザインの関係を調査するが、具体的なメッセージ変更は考えない。

(2) IFS日本語(形態素)解析パッケージ・利用者指向マニュアルの開発

マニュアルの品質を向上させ、ソフトウェアの利用度を向上させる。マニュアルも開発対象のソフトウェアであるから、ソフトウェアエンジニアリングの手法を用いて、開発計画を立て、最終の成果物を得る手続きを研究するとともに、戦略的に作成したマニュアルをソフトウェアプロダクトに添付することで、一層の利用拡大を目指す。

一般に、ソフトウェアマニュアルは、初心者から専門家までに及ぶ広い範囲の読者対象を持つ。各階層において適切な対応が求められている。本研究では、利用対象を絞り込み(文科系・社会科学系研究者)、対象読者の要望に答えるマニュアルの作成を目指す。ユーザーモデルの検討と、マニュアルの開発工程、および各工程での利用対象者の視点に立つ技術検討を実施する。

この結果を基に、IFS日本語(形態素)解析パッケージ用マニュアルを再編成し、マニュアル構成を変更する。IFS日本語(形態素)解析規則と、形態素解析エンジンをまとめて一つのシステムと考え、それぞれのソフトウェアのマニュアルを合わせたものではなく、複合システムとしてのマニュアル開発計画を立てパッケージマニュアルを作成する。
多言語化対応として、当該パッケージマニュアルを基に、英語マニュアルを作成する。簡略版として中国語版マニュアルの作成を行う。

マニュアルの開発プロセスを以下に挙げる。
(1)マニュアル開発計画書の作成
(1-1)システム(IFS日本語文法規則+形態素解析エンジン)コンセプトの明確化
システムの機能調査とユーザータスクの再調査
対象読者の絞り込み(文科系・社会科学系研究者)
(1-2)マニュアルの構造設計
アプリケーション指向の説明を中心とした構成の再編成
記述内容と文書量(記述粒度)の検討
Windows 95/NT 関連技術の調査
(1-3)マニュアル文章の構造設計
執筆方針の検討(文章表現仕様、図表表現仕様等)
(1-4)文書化の分担(割り当て)
多言語化対応
(2)マニュアル記述
日本語マニュアルの再編成
翻訳作業による英語版マニュアル作成
簡略版マニュアルの作成と翻訳作業による中国語版マニュアル作成
(3)品質チェック
内容チェック(文章チェック、体裁チェック)

[研究体制/研究方法]

1) 研究体制

 氏名 所属
研究代表者佐野 洋東京外国語大学外国語学部
研究協力者高橋 作太郎東京外国語大学外国語学部

・他研究協力者
研究室ゼミ学生(2名) (マニュアル翻訳作業、電子化作業に投入予定)
東京外国語大学 外国語学部 中国語科教官(若干名)

・翻訳依頼者(予定者)
保屋野アキコ(本学 英米科4年生)
井上勝義(本学 中国語科3年生)

・翻訳品質チェック
高橋作太郎 東京外国語大学 外国語学部教授(英米科)

2) 研究の方法

(1) Windows 版インタフェースの改善
・Visual Basic 版の改良
Visual Basic 版は、動作不全を引続き改良する
・C++版の作成
動作の安定の点から一般的な Windows アプリケーション開発言語であるC++ によるインタフェースの開発を行う。インタフェースの基本ロジックはすでに Visual Basic 版で作成されているので、コードのインポートと Window インタフェース等の機能置き換えが主な作業となる。作業効率を上げるために、IDE(Integrated Development Environment) 製品を購入し、できるだけインタフェース部分のコーディング作業を自動化することで、短時間での開発を目指す。

(2) ドキュメントの多言語化
・翻訳依頼
英語化 本学 英語科の学生による翻訳
中国語化 本学 中国語科の学生による翻訳
・翻訳依頼者への予備指導
翻訳内容、期間など依頼者との十分な話合いを行い、作業時間を確認の上で確保する。
・技術用語の指導とマニュアル文章のスタイル指導
幾つかの技術マニュアル(英文)を参考に技術用語を集積する。翻訳依頼者には予め、こうした文章に慣れてもらい、翻訳の準備を十分に行うことで品質確保を行う。
・マニュアル品質と評価
品質チェックを専攻語教官の協力を得て実施する。

[ソフトウェア成果]

1) ソフトウェア名称

IFS日本語(形態素)解析パッケージ
(1) Windows95/NT用インタフェース(改良版)
(2) パッケージ利用の手引き(改良版)

2) そのソフトウェアの機能/役割/特徴

(1)IFS日本語(形態素)解析パッケージ
 IFS日本語文法規則とWindows95/NT用形態素解析エンジン(Breakfast/ANIMA)を組み合わせたパッケージソフトウェア。いわゆる日本語形態素解析システム。

(2) Windows95/NT用インタフェース(改良版)
 上記パッケージを利用者が容易に利用するためのGUIインタフェース。

(3) 利用説明書の多言語対応
 (2)で提供されるマニュアルの英語版、および簡易バージョンの中国語版を作成することによって利用対象者を一層拡大させる。また海外からの当該ソフトウェアに対する参照(レファレンス)度を向上させる。

3) ソフトウェアの構成/構造

(1) Windows95/NT 用インタフェース(改良版)
 IFS日本語(形態素)解析パッケージを利用するための Visual Basic ならびに C++で記述されたインタフェース用ソフトウェア。

(2) マニュアル
 マニュアル開発計画書に従って作成した日本語版、英語版、中国語版の利用説明書

4)ブラッシュアップの内容

[○]ソフトウェアの操作性の向上
[○]操作説明書や例題集の拡充

5) もしIFSとの関連があれば、それはどのソフトウェアか?

(1) LTB文法規則
(2) IFS日本語文法規則

6) 使用予定言語および動作環境/必要とされるソフトウェア・パッケージ/ポータビリティなど

(1) Windows95/NT 用インタフェース
(2) IFS日本語(形態素)解析パッケージ・マニュアル

7) ソフトウェアの予想サイズ(新規作成分の行数)

ソフトウェア量 Visual Basic(4.0)コードで300ライン程度(改良部分)
マニュアル文章量 総計でA4250ページ程度
C++コードで600ライン程度(新規)

8)ソフトウェアの利用形態

(1)Windows95/NT 用インタフェース

(2)IFS日本語(形態素)解析パッケージ

9) 添付予定資料

・ソフトウェア仕様書、ユーザマニュアル等

(1) Windows95/NT 用インタフェースソフトウェア
 (Visual Basic 版改良、C++ 版新規)

(2) IFS日本語(形態素)解析パッケージ・マニュアル 上記マニュアルは、ネットワーク上での配布を考慮して Adobi Acrobat 形式および HTML 形式で電子化を行う予定。


www-admin@icot.or.jp