データベースの情報検索とリスク分析のためのAIツール: ANLAP
ANLAPとは
- ANLAP (Automatic Natural Language Abstracting and Processing)は、計算言語学のための人工知能(AI)を用い、開発した自動自然言語要約処理ツールです。
- これは、自然言語入力のセマンティック分析の考えに基礎を置き、またSchank等の概念依存(CD)による手法を改良し開発されたものです。
- このANLAPを用いることにより、着目するデータベースから必要情報を抽出し、リスク分析を実行することが出来ます。
計算言語学のための人工知能ツールの歴史とANLAPの開発背景
- 1969年初め、Schank, Schank Tesler, Codd等は、普段我々が使っている自然言語をコンピュータに理解させるため、人工知能(AI)を利用することを提唱し、計算言語学の基礎を創りました。
- この計算言語学のなかでSchankの概念依存(Conceptual Dependency; CD)による表現とは、自然言語に依存しない概念依存構造と呼ばれる概念レベルの表現をいい、文の意味表現としてこれを使用しています。
- 1970年代のコンピュータを使用する環境は、まだSchank等の開発を手助けするには十分ではありませんでした。しかし、最近のこの30年の間にコンピュータの処理速度、メモリー容量は指数関数的に向上し、Schank等によるCD理論に有効となるデータベースに関連する2つのソフトウェア言語SQLとPythonが開発されました。また、2002年にはLoper等により開発された自然言語ツールキットNLTKは、ANLAPの開発を容易にしました。
ANLAPの実行手順
1.検索すべき対象のドキュメンテーションを設定します。
2.ANLAPを実行し、表示される画面にユーザが検索したい対象出力のヘッダー
を入力します。
3.ANLAP内部で上記1.2.の概念的関係付け作業(CD Parsing)を行います。
4.表示画面より出力したい検索項目を入力し、指定します。
5.継続してANLAPを実行し、最終的に抽出したかった必要情報を出力します。
6.リンクしたリスク分析プログラムを実行し、リスク分析結果を出力します。
ANLAPの適用例
- 内容
米国エネルギー省原子力施設安全室の週間報告書を対象とし、指定した期間「1998年10月2日~8日」における事故発生件数を整理するとともに、リスク分析を実施します。 - 報告書の内容
下図に報告書内容の一部を示します。 - 抽出した情報とリスク分析
上記で示した報告書から出力したい検索項目
、本例では[year metal temperature hardness] を入力し、ANLAPを実行します。
そして、最終的に抽出したい情報が得られます。
次に、このデータも用いリスク分析を実行します。
下図は、リスク分析に得られた結果です。