R〈日本複 写 権 セ ンター 委託 出版 物 〉 本 書 の 全部 ま た は一 部 を無 断 で 複 写複 製(コ ピー)す る こ とは,著 作 権 法 上 で の例 外 を除 き,禁 じられ て い ます 。 本 書 か らの複 写 を希 望 さ れ る場 合 は,日 本複 写 セ ン ター(03-3401-2382)に ご連 絡 くだ さい。
まえがき 現 在 わが 国 にお い て,ビ
ジ ネ ス マ ンや エ ンジ ニ ア,研
生 か ら主 婦 に い た る多 くの 人 々 が,パ 繁 にや り取 り し,WWWの る 整 備 と と も に,イ
究 者 は も と よ り,中 高 校
ソ コ ンや携 帯 電 話 を使 っ て電 子 メ ー ル を 頻
ペ ー ジ を 閲覧 して い る.今 後 も通 信 イ ン フ ラ の さ らな
ン タ ー ネ ッ トの 普 及 は ます ま す 進 ん で い く もの と考 え られ,
もは や イ ン ター ネ ッ トな しの生 活 な ど考 え られ な い とい う状 況 に至 る か も しれ な い.こ
の よ う に普 及 しつ つ あ り,今 後 もさ らに 普 及 す る で あ ろ うイ ン タ ー ネ ッ ト
で あ るが,そ
の 利 用 形 態 が 一 般 ユ ー ザ に と っ て 十 分使 い や す い も の に な っ て い る
か ど う か は,大 い に疑 問 が 残 る と こ ろで あ る. 例 えば,WWWの
サ ーチ エ ン ジ ン に よ るWebペ
ー ジの 検 索 を考 え て み よ う.優
秀 と言 わ れ る サ ー チ エ ン ジ ンを 実 際 に使 っ て み る と よ くわ か る こ とだ が,さ
まざ
ま な検 索 目標 に対 して サ ー チ エ ン ジ ンが 返 して くる ヒ ッ トリス トの 上 位 に,欲 いWebペ
し
ー ジ を 1回 の 検 索 で 見 つ か る よ うに す る こ と は必 ず し も容 易 な こ とで
は ない.な ぜ な ら,そ の よ うな こ と を実 現 す る に は,ユ ー ザ は 自 分 の 欲 しいWeb ペ ー ジ を 的確 に表 す キ ー ワ ー ドを考 え る必 要 が あ り,さ らに はサ ー チ エ ンジ ンの 検 索 メ カ ニ ズ ム を あ る程 度 理 解 して い る必 要 が あ る か ら で あ る.こ の よ う な問 題 に対 応 す る に は,対 話 的 にユ ー ザ の 検 索 要 求 を 引 き出 した り検 索 要 求 を学 習 す る メ カニ ズ ム,ま た ユ ー ザ の 嗜 好 に よ って ク エ リ を補 完 す る メ カニ ズ ム な どが 必 要 に な っ て くる.こ
の よ う な メ カ ニ ズ ム は,人 工 知 能 を は じめ とす る 知 的 情 報 処 理
の 得 意 分 野 で あ り,そ の 応 用 が 大 き く期 待 で きる. また,別 の例 と して,主 に携 帯 電 話 に対 して,商 品 案 内 や さ ま ざ ま な勧 誘 の電 子 メー ル を大 量 に送 りつ け る迷 惑 メー ル が あ げ られ る.こ
れ らの 迷 惑 メ ー ル は,本
来 は人 間が そ の 内 容 を見 れ ば 簡 単 に そ れ で あ る と判 断 して削 除 で きる メ ー ル で あ る に も関 わ らず,そ
れ ら を迷 惑 メ ー ル と判 断 して 取 り除 くフ ィル タ リ ン グ技 術 が
確 立 して い な い.し
た が っ て,現 在 の 迷 惑 メ ー ル 対 策 は,簡 単 に は推 定 で きな い
よ う な メ ー ル ア ドレス に 変 更 す る とい う対 症 療 法 的 な対 応 に と ど ま っ て い る.
こ れ らの 問 題 は,巷 に溢 れ て い る イ ン ター ネ ッ トの技 術,例 え ば,HTML,XML な どのWebペ
ー ジ 記 述 言 語,通 信 プ ロ トコ ル,サ ーバ の構 築 な どの 技 術 とは 本 質
的 に 別 の 問 題 で あ り,通 信 され る情 報 の コ ンテ ン ツ に関 す る 問題 で あ る.そ
して,
こ れ ら を処 理 す る に は,人 工 知 能 を は じめ とす る知 識 処 理 の 技 術 が 必 要 な こ と は 明 らか で あ る. 本 書 「情 報 検 索 とエ ー ジ ェ ン ト」 は,こ
の よ う な背 景 か ら 「イ ン ター ネ ッ トの
知 的 情 報 技 術 」 シ リー ズ の 要 素 技 術 編 と して,わ が 国 にお け る知 識 処 理 の 第 一 線 の研 究 者 に よ り,イ ン ター ネ ッ ト時代 に生 じ る さ ま ざ ま な課 題 とそ れ ら に対 す る 知識 処 理 の 適 用 につ い て 書 か れ た もの で あ る.一 般 の ビ ジ ネ ス マ ンや 文 系 の 大 学 生 な どの イ ン タ ー ネ ッ ト初 学 者 に もで きる だ け 直 観 的 に理 解 で きる よ う に,具 体 的 な 方 法 を 豊 富 な応 用 例 を基 に して,わ あ る.よ
か りや す く書 くよ う に心 が け たつ も りで
っ て,読 者 は イ ン タ ー ネ ッ トに 関 す る ご く基 本 的 な知 識 さえ あ れ ば,本
書 を読 む こ と に よ り,現 在 にお け る 本 質 的 な 課 題,そ め とす る知 的 処 理 の取 り組 み,そ
れ に対 す る 人 工 知 能 をは じ
して 今 後 イ ン タ ー ネ ッ トが 進 ん で い く方 向 を把
握 す る こ とが で きる だ ろ う. 河 野 浩 之(京 都 大 学)に よ る第 1章 「Web時 代 の情 報検 索〕 は,イ ン ター ネ ッ ト 上 の 情 報 検 索 の 核 とな って い るサ ー チ エ ンジ ンの 技 術 解 説 で あ る.従 来 の デ ー タ ベ ー ス や情 報 検 索 技 術 との 関 連,サ
ー チ エ ン ジ ン の構造 や 性 能 比 較,そ
して デ ー
タマ イ ニ ン グ技 術 の利 用 法 と と もに,河 野 氏 自身 が 開発 したサ ー チ エ ン ジ ン 『問 答 』 に 関 す る解 説 が 行 わ れ て い る. 山 田 誠 二(東 京工 業 大 学)に よ る第 2章 「情 報 収 集 工 一 ジ ェ ン ト」 は,イ ン タ ー ネ ッ ト上 か ら利 用 者 の代 わ りに情 報 収 集 や抽 出 を行 うエ ー ジ ェ ン ト技 術 に 関 す る 解 説 で あ る.現 在 の サ ー チ エ ン ジ ン は利 用 者 の キ ー ワー ド入 力 に対 して,そ 該 当 す るWebペ
ー ジ の リス トを返 して くれ る だ け で あ る.情 報 収 集 工 一 ジ ェ ン ト
は得 られ た リス トか らWebペ
ー ジ を収 集 し,さ らに利 用 者 が 必 要 とす る情 報 や 知
識 をそ の 中 か ら抽 出 す る こ と を(半)自 北 村 泰 彦(大
れに
阪市 立 大 学)に
動 的 に行 っ て くれ る.
よ る 第 3章 「WWW情
報 統 合 〕 は,イ
ン ター ネ ッ
ト上 に分 散 して い る複 数 の 情 報 源 か らの 異 種 情報 や デ ー タ を統 合 して,利 用 者 に
提供 す る シ ス テ ム に 関 す る解 説 で あ る.こ こ で はWebペ 報 抽 出 す る プ ロ グ ラ ミ ング言 語,メ 統 合 す る デ ー タベ ー ス 技 術,情
ー ジ の 構 造 に着 目 して 情
デ ィエ ー タや オ ン トロ ジ を用 い て異 種 情 報 を
報 統 合 を プ ラ ンニ ング す るマ ル チ エ ー ジ ェ ン トシ
ス テ ム に 関 す る解 説 が 行 わ れ て い る. 高橋 克 巳(NTT)に
よ る 第 4章 「モ バ イ ル情 報 検 索 」 は,利 用 者 が 動 き まわ る
こ と を前 提 と した情 報 検 索 技 術 に 関 す る解 説 で あ る.携 帯 電 話,携
帯 端 末,カ
ー
ナ ビゲ ー シ ョン シ ス テ ム な どが 普 及 す る につ れ,そ の 上 で の イ ン タ ー ネ ッ ト情 報 検 索 に対 す る 要 求 も急 速 に増 加 して い る.本 章 で は モ バ イ ル 情 報 検 索 の 歴 史 を振 り返 った 後,モ
バ イ ル情 報 検 索 を支 え る技 術 を,モ バ イ ル イ ン ター ネ ッ トア ク セ
ス技 術 と位 置 情 報 処 理 技 術 の 両 面 か ら解 説 を行 っ て い る.さ
ら に著 者 らが 行 っ て
い る実 験 プ ロ ジ ェ ク トに つ い て も紹 介 して い る. さ て,本
シ リー ズ は 関 西 文 化 学 術 研 究都 市 け い は ん な プ ラザ にお け る 学術 交 流
の 一 環 と して 行 わ れ た 知 的 情 報 統 合 研 究 会 の 活 動 を 通 して 生 まれ た もの で あ る . この 研 究 会 を積 極 的 に支 援 して い た だ い た株 式 会 社 け い は ん な の 皆 様 に この 場 を 借 りて お礼 申 し上 げ ます.最
後 に,本 書 に お い て,図 や 表 の 引 用 に快 く応 じて 頂
い た 多 くの研 究 者 の 方 々 に お礼 を 申 し上 げ ます.
2002年
2月 著 者 ら しる す
目
次
第 1章Web時 1.1デ
代 の情報検索
ー 夕 べ ー ス 技 術 と 情 報 検 索
1.1.1デ
ー タ ベ ー ス 技 術 の 基 礎
1.1.2情
報 検 索 の 基 礎
1.2Webサ
1 2
4
ー チ エ ン ジ ン
7
1.2.1Webサ
ー チ エ ン ジ ン と検 索 技 術
1.2.2Webサ
ー チ エ ン ジ ン の 性 能
1.3デ
1
ー タ マ イ ニ ン グ とWebサ
7 11
ー バ
13
1.3.1デ
ー タ マ イ ニ ン グ と テ キ ス ト処 理 技 術
1.3.2テ
キ ス トマ イ ニ ン グ に よ る 全 文 検 索 シ ス テ ム の 高 度 化
1.3.3Webサ 1.4『
ー バ とWebマ
問 答 』Web情
1.4.1『
イ ニ ン グ
13
15
報 検 索 シ ス テ ム
17
問 答 』 に よ る 検 索 関 連 キ ー ワ ー ドの 提 示
1.4.2異
種 デ ー タ ベ ー ス に 対 す る 相 関 ル ー ル の 比 較
1.4.3ル
ー ル 導 出 の 高 速 化
1.4.4情
報 可 視 化 技 術
参 考 文 献
14
18 20
21 21
26
第 2章
情 報 収 集 エ ー ジ ェ ン ト
27
2.1エ
ー ジ ェ ン ト に よ る イ ン タ ー ネ ッ トに お け る 情 報 収 集
2.2情
報 抽 出 を 学 習 す る エ ー ジ ェ ン ト28
2.2.1WWWか 2.2.2ShopBot:学
ら の 知 識 獲 得 を学 習 す る エ ー ジ ェ ン ト 習 す る 買 い 物 エ ー ジ ェ ン ト
32
27
28
2.3情
報 収 集 を 計 画 す る エ ー ジ ェ ン ト
2.3.1SoftBot:情
報 収 集 の プ ラ ン ニ ン グ エ ー ジ ェ ン ト
2.3.2NaviPlan:ナ 2.4残
37 37
ビ ゲ ー シ ョ ン プ ラ ン ニ ン グ エ ー ジ ェ ン ト
さ れ た 課 題 と 今 後 の 展 望
参 考 文 献
44 51
52
第 3章WWW情
報統合
53
3.1WWW情
報 統 合 と は
53
3.2WWW情
報 統 合 の た め の プ ロ グ ラ ミ ン グ 言 語
57
3.2.1WebSQL:ペ 3.2.2WebL:ペ
ー ジ 間 構 造 を 利 用 し た 情 報 統 合 ー ジ 内 構 造 を 利 用 し た 情 報 統 合
3.3WWW情
デ ィ エ ー タ に 基 づ く情 報 統 合
3.3.2ARIADNE:オ
ン トロ ジ に 基 づ く情 報 統 合
3.4WWW情
報 収 集 ・統 合 エ ー ジ ェ ン ト
3.4.2RETSINA:マ
第 4章 4.1モ 4.1.1モ
63
63 66
報 統 合 の た め の エ ー ジ ェ ン トア プ ロ ー チ
3.4.1BIG:情
参 考 文 献
59
報 統 合 の た め の デ ー タ ベ ー ス 的 ア プ ロ ー チ
3.3.1TSIMMIS:メ
3.5ま
57
71
72
ル チ エ ー ジ ェ ン ト型 情 報 統 合
76
と め と 展 望
81
82
モパイル情 報検索
85
バ イ ル 情 報 検 索 と は バ イ ル 情 報 検 索 の 歴 史
85 86
4.2モ
バ イ ル 情 報 検 索 の タ ス ク
88
4.3モ
バ イ ル 情 報 検 索 を 支 え る 技 術
90
4.3.1モ
バ イ ル イ ン タ ー ネ ッ トア ク セ ス
91
4.3.2モ
バ イ ル 用 ア プ リ ケ ー シ ョ ン プ ロ トコ ル
4.3.3コ
ン テ ン ツ 記 述 形 式 の 標 準 化
94
93
4.4位
置 情 報 の 処 理 技 術
96
4.4.1測
位 技 術
4.4.2位
置 情 報 の 記 述 形 式
4.4.3位
置 情 報 交 換 の プ ラ ッ トフ ォ ー ム
4.5位
96 97
置 に 基 づ く 情 報 検 索
4.5.1位
置 依 存 型 情 報 検 索 の モ デ ル
4.5.2モ
バ イ ル イ ン フ ォサ ー チ
4.6お
わ り に
参 考 文 献
用 語 集 索 引
99
112
113 129
101 101 103 111
第1 章 Web時
代 の情 報 検 索
イ ン タ ー ネ ッ ト上 に あ る大 量 の デ ー タか ら,必 要 な情 報 を効 果 的 に検 索 す る技 術 が必 要 と され て い る.ま た,従 来 の情 報 検 索 技 術 を発 展 させ つ つ,テ イ ニ ン グ やWebマ
イ ニ ング と呼 ば れ る研 究 が 活 発 に な っ て い る.そ
キ ス トマ
こで 本 章 で
は,デ ー タベ ー ス や情 報 検 索 に関 わ る技 術 に簡 単 に触 れ,Web時
代 の 代 表 的 な検
索 シ ス テ ム で あ るWebサ
ー タマ イニ ン グ
ー チ エ ン ジ ンの構 造,性 能 比 較 方法,デ
技 術 の 利 用 法 な ど を紹 介 す る.さ
らに,Webサ
ーチ エ ン ジ ン 『問 答 』 を 題 材 に,
今 後 必 要 な検 索 支援 技 術 につ い て も考 え る.
1.1デ
ー タベー ス技 術 と情 報 検 索
イ ン ター ネ ッ トの 普 及 は,デ ー タベ ー ス の 利 用 状 況 を劇 的 に変 化 させ つ つ あ る. 例 え ば オ ン ラ イ ン シ ョ ッ ピ ング で は,問 合 せ 言 語 を意 識 す る こ とな く商 品 イ メ ー ジ を ク リ ッ ク して在 庫 の 有 無,発
注 ・発 送 状 況 な どを検 索 す る こ とが で き る.つ
ま り,デ ー タの 一貫 性 を保 証 した 追 加 ・更 新 ・削 除 を 高 速 に実 行 す る 高 度 な トラ ンザ ク シ ョン処 理 技 術 が,電 子 商 取 引 に お い て 日常 的 に利 用 さ れ て い る. また,膨
大 な量 の デ ー タや 情 報 に 無 料 も し くは 比 較 的安 価 に ア ク セ ス で き る 環
境 が 整 備 され た こ とに よ って,情 報 検 索 を行 う機 会 が 急 増 した.す
な わ ち,情 報
図1.1コ
検索 システムの ら う 図1.1の
マ ン ド入 力 を用 いた 情 報検 索 シス テム 利用 例
「プ ロ 」 で あ る サ ー チ ャ ー に 必 要 な デ ー タ や 情 報 を探 し 出 し て も
よ う な コ マ ン ド検 索 か ら,複
組 み 合 わ せ てWebブ
数 の キ ー ワ ー ド と属 性 を 自 分 で う ま く
ラ ウ ザ で 探 す よ う に 変 わ っ て き た.加
え て,検
イ トル や キ ー ワ ー ドな ど の メ タ デ ー タ を付 与 す る 能 力 も,Webペ
索 に役 立 つ タ
ー ジ の公 開 に と
も な っ て 誰 も が 必 要 と して き て い る.
1.1.1デ-タ
ベ-ス
技 術 の 基 礎
関 係 デ ー タ ベ ー ス[5,11]は,図1.2に
示 す よ う に行 と列 か ら な る テ ー ブ ル を用
い て 属 性 と 属 性 値 を 格 納 す る 構 造 デ ー タ(structured ら の テ ー ブ ル に 対 して,結 基 本 演 算 を 備 え たSQL言 切 な順 序 の 実 行,コ せ 最 適 化 技 術,イ
合(join),射
data)で
影(projection),選
語 で 操 作 す る.な
お,問
あ る.そ
し て,こ
択(selection)か
れ
らな る
合 せ に含 まれ る 射 影 や選 択 の 適
ス トの 大 き い 操 作 で あ る 結 合 演 算 の 効 率 的 な 処 理 を 行 う 問 合 ン デ ッ ク ス や 物 理 的 格 納 方 法 な ど が,デ
ー タベ ー ス の シ ス テ ム
性 能 に 大 き な 影 響 を 与 え る. ま た,テ
ー ブ ル 形 式 で 格 納 で き な い 非 構 造 デ ー タ(unstructured
テ キ ス ト に 対 す る 検 索 処 理 も 必 要 で あ る.そ
こ で,関
data)と
して の
係 デ ー タベ ー ス シス テ ム に
図1.2関
係 デ ー タベ ー ス にお け る基 本 的処 理
文 書 を 格 納 す る デ ー タ 型 や,BLOB(Binary
Large OBject)な
どの バ イ ナ リ型 を実
装 す る こ と が あ る. な お,テ
キ ス ト検 索 機 能 を 重 視 し た シ ス テ ム と し て,全
文 検 索 シ ス テ ム が あ る.
「AND,OR,NOT」
を 用 い た ブ ー ル 検 索 式 に よ る 問 合 せ 以 外 に,単
に 着 目 し た 検 索,単
語 の 登 場 位 置 を 考 慮 し た 重 み 付 け な ど,テ
語の近接 関係
キ ス ト検 索 に 特 化
した 機 能 が 追 加 さ れ て い る. と こ ろ で,テ
キ ス ト検 索 を効 率 良 く行 う に は,テ
が 必 要 で あ る.そ は 図1.3に
こ で,転
置 フ ァ イ ル(inverted
示 し た よ う に,格
file)な ど を 用 い る.転
置 フ ァイル
納 され る文 書 フ ァイ ル に含 ま れ る単 語 の フ ァイ ル か ら
格 納 さ れ る 文 書 フ ァ イ ル へ の 転 置 リ ス トで あ る.し る と き,す
キ ス ト検 索 に 適 し た デ ー タ構 造
た が っ て,あ
る単語で検索 す
べ て の 文 書 フ ァ イ ル 中 の 単 語 を調 べ る こ と な く転 置 フ ァ イ ル を 用 い て
効 率 的 に ア ク セ ス で き る.そ Signatureフ さ ら に,よ
の 他,N-グ
ラ ム デ ー タ 構 造(N-Gram
ァ イ ル, PAT木(PAtricia Trees)な
data structure),
ど の デ ー タ構 造 も用 い ら れ て い る.
り正 確 な 文 書 構 造 を 考 慮 し た 検 索,つ
ま り タ イ トル や 段 落 な ど を 指 定
し た 検 索 を行 う に は,表 現 力 の 豊 か な 構 造 化 文 書 に 対 応 す る 必 要 が あ る.そ
こ で,多
図1.3転
置 フ ァイル の構 造
くの 商 用 の 全 文 検 索 シ ス テ ム は,Webペ IVIarkup Language)は XML(eXtensible
も ち ろ ん,SGML(Standard
Markup
な お,XMLはWeb上
ー ジ 記 述 に 用 い ら れ るHTML(HyperText
Language)な
の 構 造 化 文 書 フ ォ ー マ ッ ト以 外 に,構 data)で
ブ ル 定 義 が で き る と い う こ と で もあ る.そ
1.1.2情
造 デ ー タの 表 現 に
の 結 果,XMLを
ま
係 デ ー タベ ー ス の テ ー 扱 う こ との で き るデ ー
応 の ア プ リ ケ ー シ ョ ンが 多 数 登 場 し て い る.
報 検 索 の 基 礎
前 項 で 述 べ た 関 係 デ ー タ ベ ー ス シ ス テ ム や 全 文 検 索 シ ス テ ム は,大 蓄 積 と検 索 処 理 を 可 能 に し て き た.そ 散 し たWebサ
Language),
も あ る こ と に 注 意 した い.つ
ー ジ に テ ー ブ ル 表 現 が で き る と い う こ と は,関
タ ベ ー ス シ ス テ ム な ど,XML対
Markup
ど に 対 応 し て い る.
利 用 で き る 半 構 造 デ ー タ(semi-structured り,Webペ
Generalized
して こ れ ら の 技 術 は,ネ
ー バ の デ ー タ を 収 集 し検 索 す るWebサ
割 を 果 た して い る.そ
し て 今 後 も,ネ
量 デ ー タの
ッ トワー ク上 に分
ー チ エ ンジ ンで も大 き な役
ッ ト ワ ー ク 化 さ れ た 多 数 の 情 報 資 源 か ら必
要 な デ ー タ や 情 報 を す ば や く探 し 出 す 能 力,す
な わ ち 的 確 な 検 索 式 記 述 と検 索 結
果 を 読 み 取 る 能 力 が 一 層 必 要 に な る だ ろ う.そ
こ で 本 節 で は,こ
知 っ て お くべ き情 報 検 索(IR:
Information Retrieval)[3,10]に
の よ う な状 況 で
つ い て 簡 単 に取 り
上 げ る. 例 え ば 図1.1の
検 索 シ ス テ ム で は,ブ
せ た 検 索 を 行 う.ま
た 図1.4の
ー ル 検 索 式 に よ りキ ー ワー ドを組 み 合 わ
シ ス テ ム で は,単
語 の 出現 順 序 を考 慮 した 検 索 を
行 う. しか し,情
報 検 索 で 一 番 問 題 と な る 点 は,高
の 能 力 よ り も,検
度 な検 索 式 が 記 述 で きる シ ス テ ム
索 対 象 とな る デ ー タ に対 して適 切 な検 索 キ ー ワ ー ドを選 択 で き
図1.4全
文 検 索 シス テ ムに よる検索 例
る か ど うか で あ る.実 際,予 想 外 の キ ー ワ ー ドが 索 引 付 け ら れ て い た り,意 味 が ま った く異 な る 同 じ単 語 や略 語 な ど,検 索 を 難 し くす る状 況 に しば しば 出会 うは ず だ. そ こ で,よ
り適 切 な検 索 を支 援 す るた め,キ
ー ワ ー ド間 の 関 係 を記 述 した辞 書
や シ ソ-ラ ス(thesaurus)の 利 用,意 味 的 な距 離(semantic 索 が 行 わ れ て い る.さ
distance)を 考 慮 した検
ら に,自 然 言 語 で 問 合 せ を 記 述 し,自 然 言 語 処 理 技 術 に よ
り解 析 され た 意 味 に 基 づ い た検 索 を行 う技 術 も研 究 され て い る. 一 方 ,キ ー ワ ー ドを付 与 す る側 で も,テ キ ス トや マ ル チ メ デ ィ ア デ ー タが 大 量 に あ る た め,適
切 な索 引付 け が 難 し くな って い る.そ の た め,蓄 積 した デ ー タ に
対 して 自動 的 に 適 切 な キ ー ワー ドを与 え る 技 術 が 提 案 され て い る.例 え ば,文 書 中 の単 語 の 出現 頻 度 や分 布 に基 づ い て 重 要 語 を抽 出 した り,検 索 精 度 を低 下 させ る頻 出 語 を無 意 味 語(不 とこ ろ がWebペ
要 語,stop
word)と
して 処 理 す る手 法 で あ る.
ー ジ の検 索 で は,辞 書 の 利 用 や キ ー ワー ド抽 出す ら難 しい.な
ぜ な ら,異 な る組 織 に よ って 作 成 され るWebペ
ー ジで は,異 な る概 念 を 表現 す る
に も関 わ らず 同 一 の 単 語 を用 い る場 合 が あ る か らで あ る.ま
た,さ
まざまな分野
を扱 う た め,単 語 の 出 現 頻 度 や分 布 が複 雑 に 重 な っ て い るか らで もあ る.つ ま り, 用 語 を統 制 せ ず に作 成 さ れ た文 章 の 混 在 に よ り単 語 の 多 義 性 が 高 くな り,重 要語 と無 意 味 語 の 判 別 まで も難 し く して い る. そ こで,こ 書利 用,さ
の よ うな 問 題 を解 決 す る ため,文
書作 成 組 織 ご との 検 索,複
らに,観 点 を与 え るオ ン トロ ジ ー(ontology)に
れ て い るが,実
数 の辞
よ る検 索 な ど も提 案 さ
用 的 シス テ ム と して用 い る に は 少 々 困 難 な こ とが 多 い.
また,そ の 他 の検 索 シス テ ム に 関 わ る 問題 と して,検 索 式 と完 全 に一 致 す る デ ー タを 表 示 す る 完 全 照 合 方 式 と,主 要 な キ ー ワー ドを 含 む デ ー タ を表 示 す る部 分 照 合 方 式 の ど ち らの 実 行 方 式 を採 用 す る か が あ る. まず,目 的 と な る デ ー タが 明確 な 場 合 には 完 全 照 合 方 式 が有 効 で あ る.し か し, 検 索 結 果 の 件 数 が 多 い 場 合,表
示 件 数 を絞 り込 む に は新 た な キ ー ワ ー ドを追 加 し
た検 索 式 の 修 正 が 必 要 とな る.も 合,良
し,適 切 に キ ー ワ ー ド選 択 を行 う知 識 が な い場
い検 索 結 果 は 得 られ な い.そ の ため,検
索 式 を適 切 に修 正 す る方 法 が 必 要
で あ り,適 合 性 フ ィ ー ドバ ッ ク(relevance feedback)な
どの 技 術 が 必 要 と さ れ る.
次 に 部 分 照 合 方 式 は,検 索 対 象 とな る デ ー タ と検 索 式 に含 まれ る キ ー ワ ー ドの 重 み に 基 づ い た適 合 順 に検 索 結 果 が 出 力 され る た め,有 用 な検 索 結 果 が 除外 され る可 能 性 は 低 い.な お 適 合 度 の 評 価 手 法 と して,検 索 式 と文 書 に含 まれ る単 語 に 基 づ くベ ク トル を作 成 し,検 索 式 ベ ク トル と文 書 ベ ク トル(document vector)の 内 積 の値 を求 め る 方 法 な どが 用 い られ る. さ ら に上 述 した 以 外 に も,実 用 的 な情 報 検 索 シ ス テ ム を実 装 す る に は 多 くの 注 意 を払 う必 要 が あ る,例 技 術,全
え ば,文 字 コー ドや 漢 字 コ ー ドな ど の基 本 的 な文 字 処 理
角 ・半 角 ・大 文 字 ・小 文 字 な どの 処 理 や正 規 表 現 な どで あ る.他
らが な ・カ タ カ ナ な ど の文 字 種 別 を考 慮 した 異 表 記 展 開 な ど もあ る.加
に,ひ
えてイ ン
ター ネ ッ ト上 で は,複 数 言 語 で 記 述 され た 情 報 資 源 を検 索 す る必 要 性 が 高 い.そ こ で,多 言 語 情 報 検 索 技 術 も注 目 を集 め て お り,機 械 翻訳 技 術 を援 用 した 情 報 検 索 に力 が注 が れ て い る.
1.2Webサ
ー チ エ
ン ジ ン
イ ン タ ー ネ ッ トに 関 す る統 計 量 の サ ー ベ イ を 提 供 す るNetwork www.nw.com)やSearch る と,イ
Engine
ン タ ー ネ ッ ト上 のWebサ
チ エ ン ジ ン で 検 索 で き るURL数
Wizards(http://
Watch(http://www.searchenginewatch.com)に ー バ 数 は 図1.5の も 急 増 し て い る.そ
や 情 報 検 索 に 注 意 を 払 い な が ら,Webサ
よ
よ う に 増 加 し て お り,Webサ こ で 本 節 で は,デ
ー
ー タベ ー ス
ー チ エ ン ジ ン の 基 本 的 構 造 を 紹 介 し,シ
ス テ ム 性 能 の 向 上 に つ い て 考 え る.
1.2.1Webサ
Webブ
ー チ エ ン ジ ン と検 索 技 術 ラ ウ ザ か ら 入 力 さ れ た 問 合 せ を 処 理 す る デ ー タ ベ ー ス は,Webサ
エ ン ジ ン の 中 心 と な る シ ス テ ム で あ る.そ タ の 特 徴 に よ っ て,Webサ れ る.
し て,デ
ー チ
ー タベ ー ス に登 録 さ れ る デ ー
ー チ エ ン ジ ン は デ ィ レ ク ト リ 型 と ロ ボ ッ ト型 に 二 分 さ
図1.5Webサ
ー バ ー 数 の 増 加(http://www.netcraft.com/survey/の
図1.6デ
ィ レ ク トリ 型Webサ
ー チエ ン ジ ン
前 者 の デ ィ レ ク ト リ 型 サ ー チ エ ン ジ ン で は,図1.6に イ トル,キ
ー ワ ー ド,分 類,作 成 日,作 成 組 織
ジ 製 作 者 に よ っ て 作 成 さ れ 登 録 依 頼 さ れ る.そ の 基 準 に 基 づ い て 取 捨 選 択 し,デ
統 計 デ 一 タ)
示 し た よ う な[URL,タ
連 絡 先]な
ど の デ ー タが,Webペ
し て,Webサ
ー チ エ ンジ ン運 営 者
ー タ ベ ー ス へ と格 納 す る.な
タ の キ ー ワ ー ドや 分 類 な ど を適 切 に 与 え ら れ な いWebペ
ー
お,登
録依頼 デー
ー ジ 製 作 者 が 多 い ため ,
キ ー ワ ー ドや 分 類 を 改 め て 付 与 す る と い う 高 コ ス トな 編 集 作 業 が 必 要 で あ る .加 え て,ネ
ッ トワ ー ク 上 の 全Webペ
ー ジ が 登 録 依 頼 さ れ る わ け で は な い た め,デ
レ ク ト リ型 サ ー チ エ ン ジ ン で は 網 羅 的 なWebペ 他 方,後
ー ジ検 索 が で きな い 問 題 もあ る .
者 の ロ ボ ッ ト型 サ ー チ エ ン ジ ン は,図1.7に
ロ ー ラ ー と 呼 ば れ る プ ロ グ ラ ム(http://www
ィ
示 す よ う に ロ ボ ッ トや ク
.robotstxt.org/wc/robots.html)に
よ
り,Webペ
ー ジ 中 の リ ン ク情 報 や ヘ ッダ情 報 を解 析 し,自 然 言 語 処 理 技 術 な ど を
用 い な が ら デ ー タベ ー ス を構 築 す る.Webペ 的 に行 う た め,網 羅 的 なWebペ
図1.7ロ
た だ し,収 集 し たWebペ 点 は,デ
ー ジ収 集 か ら蓄 積 ま で,す べ て 自動
ー ジ検 索 が 実 現 で きる.
ボ ッ ト型Webサ
ー チエ ン ジ ン
ー ジ に含 ま れ る デ 一 タそ の もの に基 づ い た検 索 を行 う
ィ レ ク ト リ 型 サ ー チ エ ン ジ ン と大 き く 異 な る.つ
ジ ン 運 用 者 に よ る 編 集 が な い た め,[URL,タ の デ ー タ の 正 当 性,Webぺ
ま り,Webサ
イ トル,キ
ー ワ ー ド,作 成 日]な
一 ジ の 信 頼 性 な ど は ,す べ てWebペ
の 結 果,故
に よ り,検
索 結 果 の 質 が 大 き く揺 ら い で し ま う 問 題 も 生 じ る .
こ と も 問 題 で あ る.例
え ば,図1.8に
ク リ プ ト を 使 用 し な が ら,利 せ な が らWebペ ま た,Webサ
SPAMと
ボ ッ トプ ロ グ ラ ム に よ っ て 収 集 で き な いWebペ
ど
ー ジ製 作 者 の 責任
と な る.そ
ま た,ロ
意 に 不 適 切 な 記 述 を行 うWeb
ーチエ ン
呼 ば れ るペ ー ジ作 成
ー ジ が 増 加 して い る
示 し た よ う に,ク
ッ キ ー や サ ー バ サ イ ドス
用 者 の 過 去 の 入 力 やWebブ
ラ ウザ の 状 態 を 反 映 さ
ー ジ を 生 成 す る シ ス テ ム か ら は,適
切 な デ ー タが 収 集 で き ない .
ー バ に 登 録 し た プ ロ フ ァ イ ル を 用 い て,Webペ
す る サ ー ビ ス で も 同 様 で あ る.そ
の た め,多
ー ジ を カ ス タマ イ ズ
く の 商 用Webサ
ー チ エ ン ジ ン で は,
デ ィ レ ク ト リ 型 と ロ ボ ッ ト型 を 併 用 し た サ ー ビ ス 提 供 を 試 み て い る . そ の 他 のWebサ
ー チ エ ン ジ ン の シ ス テ ム 構 成 と し て,複
数 のWebサ
ジ ン の 検 索 結 果 を 統 合 出 力 す る メ タ サ ー チ エ ン ジ ン が あ る .メ
ーチエ ン
タサ ー チ エ ン ジ ン
図1.8対
図1.9メ
話 的Webペ
は,図1.9に
示 す よ うに各Webサ
ー ジ生 成
タサ ー チエ ン ジ ン
ー チ エ ン ジ ンに 問合 せ を送信 し,各Webサ
エ ン ジ ンか ら返 送 され る検 索 結 果 を整 理 し出力 す る,こ の と き,複 数 のWebサ チ エ ン ジ ンの 応 答 性 能 や 検 索 結 果 の 出 力 順 序 な どが 異 な る の で,メ
ーチ ー
タサ ー チ エ ン
ジ ン側 で どの よ うに 統 合 す るか が課 題 と な る. とこ ろで,も
し共 通 の 問 合 せ 言 語 を用 い て す べ て のWebサ
ーバ を検 索 で き る
図1.10分
と す る な ら ば,ロ
ボ ッ ト プ ロ グ ラ ム は 必 要 な く な る だ ろ う.つ
う な 分 散 型Webサ (P2P:peer
散 型 サ ー チエ ン ジ ン
ー チ エ ン ジ ン が 構 成 で き る.こ
to peer)環
境 下 のgnutellaの
ま り,図1.10の
の 種 の 技 術 は ,ピ
よ
アツー ピア
よ う な フ ァ イ ル 交 換 シ ス テ ム に お け る検
索 に も役 立 つ .
1.22Webサ
Webサ
ー チ エ ン ジ ンの 性 能 ー チ エ ン ジ ン は,デ
ィ レ ク ト リ型,ロ
さ ら に メ タ サ ー チ エ ン ジ ン や 分 散 型 な ど,さ で き る.し
か し,ど
ボ ッ ト型 ,両 者 の ハ イ ブ リ ッ ド型, ま ざ ま な シ ス テ ム 構 成 を と る こ とが
の よ う な シ ス テ ム構 成 が 望 ま しい か を決 め る に は
性 能 比 較 を 要 す る . そ こ で,デ
,何
らか の
ー タベ ー ス シス テ ム や 情 報 検 索 で 利 用 され るい く
つ か の 性 能 評 価 尺 度 を 元 に,Webサ ま ず デ ー タ ベ ー ス シ ス テ ム は,ト
ー チエ ン ジ ンの 評 価 につ い て 考 え る . ラ ンザ ク シ ョ ン 処 理 能 力 が 典 型 的 な 評 価 基 準
で あ る.す
な わ ち,問
時 間 や,一
定 時 間 に 処 理 可 能 な 問 合 せ 数 で あ る ス ル ー プ ッ ト な ど に よ り評 価 さ れ
る(http://www.tpc.org/).実
合 せ が 入 力 さ れ て か ら検 索 処 理 が 終 了 す る ま で の 検 索 応 答
際,こ
の 種 の 評 価 尺 度 が 重 要 で あ る た め,Webサ
チ エ ン ジ ン の 検 索 結 果 に 「検 索 に か か っ た 時 間 」 が 表 示 さ れ る こ と も あ る .な 優 れ た ト ラ ンザ ク シ ョ ン 処 理 性 能 を 実 現 す る に は,効 造,処
理 性 能 の 高 い ハ ー ド ウ ェ ア 開 発,並
次 に,情
ー お,
率 良 い処 理 を行 うデ ー タ構
列 化 に よ る 負 荷 分 散 な ど が 必 要 で あ る.
報 検 索 の 分 野 の 標 準 的 な 評 価 基 準 と し てTREC(http://trec.nist.gov/)
等 で 利 用 さ れ て い る,式(1.1)で れ る 適 合 率(precision)が
与 え ら れ る 再 現 率(recall)と,式(1.2)で
あ る.図1.11に,こ
れ ら の 尺 度 が,ど
与 え ら
の よ う な状 態 を評
価 し て い る か を 図 示 し た.
再 現 率= 適 合 率=
正解である検索結果の数 /全正解数
(1.1)
正解 で あ る検 索 結 果 の 数
(1.2)
/検索結果の数
図1.11再
現 率 ・適 合 率 の 関 係
図 か ら分 か る よ う に,再 現 率 ・適 合 率 は,検 索 式 を満 た す 検 索 結 果 の 適 合 性 (relevance)を 表 す 尺 度 で あ る.そ の た め,特
許 検 索 な ど 目的 が 明 確 な情 報 検 索 の
性 能 評 価 に は 有 効 で あ る.し か し,検 索 結 果 に 対 す る適 合 度 の 評 価 は シ ス テ ム利 用 者 ご と に異 な る こ と も多 い.特 切 性(pertinence)や た め,こ
に,個 人 の もつ 知 識 構 造 や 価値 観 に依 存 す る 適
有 用 性(usefullness)に よ っ て そ の 評 価 は 異 な りや す い.そ
の 種 の 判 定 基 準 に基 づ い た 評 価 で は,誰
の
もが 納 得 で き る評 価 を与 え る こ
と は難 しい . 特 にWebサ
ー チ エ ン ジ ン は,典 型 的 な情 報 検 索 と異 な る 条 件 下 で 利 用 され て い
る こ と に 注 意 した 上 で,再 現 率 ・適 合 率 の 評 価 を考 え る べ き で あ る.な ぜ な ら, Webサ
ー チ エ ン ジ ンの 検 索 対 象 は 様 々 な観 点 か ら記 述 さ れ て お り,多 様 な分 野 の
情 報 を含 む. つ ま り,検 索 結 果 に 含 ま れ る 「正 解 で あ る検 索 結 果 の 数 」 は,利 用 者 の 目的 に よ っ て 大 き く異 な る.加 と して も,全Webペ
え て,ロ ボ ッ ト型 サ ー チ エ ンジ ン を利 用 した
ー ジ に対 す る 「全 正 解 数 」 を 求 め る こ と は不 可 能 で あ る .
実 際 の シス テ ム で は,Webサ バ で提 供 して い るWebペ
ー チエ ン ジ ン に格 納 さ れ たWebペ
ー ジ とWebサ
ー
ー ジ の 内容 の 一貫 性 を保 つ 機 構 が ない ため ,予 期 しな い
検 索 結 果 を得 る場 合 もあ る.ま た,利 用 者 の サ イ トか ら検 索 結 果 のURLに ア クセ ス 制 限 が 存 在 す る場 合 に も同 様 の 問 題 を 生 じる.こ の よ うに,多
対する くの 要 因
に よ り適 合 し ない 場 合 が 生 じる こ と も考 え て お か ね ば な ら な い.
1.3デ
ー タ マ イ ニ ン グ とWebサ
ーバ
本 節 で は,人 工 知 能 や デ ー タマ イ ニ ング(datamining)の
研 究 を,Webサ
ーチエ
ンジ ン にお け る 検 索 支 援 とい う観 点 か ら生 か す チ ャ ンス を考 え る.あ わ せ て,テ キ ス トマ イ ニ ン グ やWebマ
1.3.1デ
イ ニ ン グ につ い て も簡 単 に触 れ る.
ー タ マ イ ニ ン グ と テ キ ス ト処 理 技 術[4]
人工 知 能 や機 械 学 習 の研 究 を デ ー タベ ー ス の 問 合 せ に用 い て高 度 な検索 ・解 析 処 理 を 目指 す 技 術 と して,デ ー タマ イ ニ ング や デ ー タベ ー ス か らの 知 識 発 見(KDD: Knowledge
Discovery in Databases)の
研 究 が 行 わ れ て い る[7].こ れ は,デ
ベ ー ス に蓄 積 され た大 量 の デ ー タに対 して,従 来 のSQL問
ータ
合 せ 言 語 で は効 率 良 く
検 索 で き ない 処 理 を行 お う とい う要 求 に基 づ く. 例 え ば,POSや
ク レ ジ ッ トカ ー ド決 済 を行 う シ ス テ ム が 普 及 し,大 量 の トラ ン
ザ ク シ ョ ン処 理 結 果 を デ ー タ ウ ェ アハ ウス に 蓄 積 で き る よ う に な った.そ
こで,
よ り正 確 に商 品 の購 買 デ ー タ を分析 し,今 後 の 戦 略 を決 定 す る こ とが 重 要 に な っ て い る.そ の た め,既 存 の 問合 せ 処 理 を高 度 化 し,大 量 デ ー タ を効 率 良 く解 析 す る処 理 が必 要 とな って きた. しか し,通 常 の デ ー タベ ー ス シス テ ム は検 索 式 を満 た す 高 速 な 検 索 機 能 を備 え て い るが,デ
ー タか ら ル ー ル を発 見 す る機 能 は 備 え て い ない.そ
こで,比 較 的 計
算 コス トの 小 さ い ア ル ゴ リズ ム で 実 現 で き る相 関 ル ー ル を求 め る 問 合 せ な ど が 活 発 に研 究 され て い る . も っ と も,高 速 な トラ ンザ ク シ ョ ン処 理 が 要 求 され る デ ー タベ ー ス シス テ ム に,
高 度 な 統 計 的 ・解 析 的 処 理,ル と は 困 難 で あ る . そ こ で,デ し て,多
ー ル発 見 や 仮 説 生 成 な どの 探 索 処 理 を実 装 す る こ ー タベ ー ス と は独 立 した デ ー タマ イ ニ ン グ ッー ル と
くの機 能 が 実 装 され て い る .
例 え ば,人 工 知 能 技 術 を 用 い た 決 定 木(decision トワ ー ク に よ る学 習 機 能 な ど で あ る,他 パ タ ー ン(sequential
patterns)の
ク ラ ス タ リ ン グ(clustering)な visualization)な
tree)[9]の生 成 や,ニ ュ ー ラ ル ネ ッ
に,時 間 的 順 序 の あ る イ ベ ン ト列 か ら の 系 列
発 見,類
似 性 の 高 い デ ー タ の 分 類(classification),
ど が あ る[1,2].加
え て,情
ど の 技 術 も積 極 的 に 取 り 入 れ つ つ,デ
報 可 視 化(information
ー タの 特 性 を把 握 す る 機 能
が提 供 され つ つ あ る . ま た,デ
ー タ マ イ ニ ン グ の 研 究 を 踏 ま え て,全
構 の 向 上 も 試 み ら れ て い る.つ で は な く,能
ま り,大
文 検 索 シス テ ム に お け る処 理 機
量 に 蓄 積 さ れ た テ キ ス トを 検 索 す る だ け
動 的 な 発 見 へ と つ な が る テ キ ス トマ イ ニ ン グ を 行 う.
こ こ で,デ
ー タ マ イ ニ ン グ の 対 象 と な る 多 くの 実 デ ー タ と 全 文 検 索 シ ス テ ム に
格 納 す る テ キ ス トデ ー タ と の 間 に は 大 き な 差 が あ る.こ
れ は,前
性 が 与 え ら れ 値 域 が 制 限 さ れ て い る 構 造 デ ー タ が 多 く,後 も制 限 の な い 非 構 造 デ ー タ で あ る 点 で あ る.し で あ る が 故 に,形
者 は 明 示 的 に属
者 は 属 性 が な く値 域 に
た が っ て,対
象 が テ キ ス トデ ー タ
態 素 解 析 や 構 文 解 析 な どの 自然 言 語 処 理 技 術 に よ って 語 句 抽 出
や 係 り 受 け 関 係 の 構 造 を 抽 出 す る こ と が 重 要 に な る. ま た,Webサ のWebペ
ー チ エ ン ジ ン に 対 し て デ ー タ マ イ ニ ン グ 技 術 を 適 用 す れ ば,大
ー ジ の 特 徴 や 傾 向 を 知 る こ と が で き る.つ
テ キ ス トや,ア
イパ ー リ ン ク を もつ
クセ ス パ タ ー ンな ど を 記 録 す る ロ グ デ ー タ を対 象 と した デ ー タマ
イ ニ ン グ で あ り,Webマ 象 と す るWebペ
ま り,ハ
量
イ ニ ン グ と 呼 ば れ る.た
ー ジ 数 が 多 い た め,自
だ し,Webサ
ー チ エ ンジ ンの 対
然 言 語 処 理 に よる構 造 抽 出 の 効 率 良 い 実 装
な ど も課 題 と な る .
1.3.2テ
キ ス トマ イ ニ ン グ に よ る 全 文 検 索 シ ス テ ム の 高 度 化
図 書 検 索 や 特 許 検 索 な ど の 典 型 的 な 検 索 は,利 む.特
に 特 許 検 索 で は,検
用 者 の 知 識 と経 験 に基 づ い て 進
索 式 記 述 戦 略 が 研 究 課 題 に な る ほ ど 重 要 で あ る.つ
ま
り,多 量 の デ ー タ や 広 範 な 領 域 の デ ー タ に 成 立 す る 性 質 や 規 則 を 把 握 し な が ら,有 用 な 情 報 を 検 索 し発 見 す る 技 術 が 必 要 と さ れ て い る. で は,全
文 検 索 シ ス テ ム に お い て テ キ ス トマ イ ニ ン グ は ど の よ う に 活 用 で き る
だ ろ う か.そ
こ で,デ
ー タ ベ ー ス に 蓄 積 さ れ た 全 テ キ ス ト集 合 の 中 か ら,共
単 語 を 含 む テ キ ス トに 成 立 す る 相 関 ル ー ル(association
rule)を
通の
求 め る方 法 か ら考
え る. ま ず,X
と Y を,共 通 の 要 素 を 含 ま な い 単 語 の 集 合 とす る.そ
し て,デ
ー タベ ー
ス 中 で X と Y を 共 に 含 む テ キ ス ト集 合 の 割 合 を 相 関 ル ー ル X ⇒ Y の 支 持 度 と す る.ま
た,デ
ー タベ ー ス 中 で X を 含 む テ キ ス ト集 合 の う ち,X
テ キ ス ト集 合 の 割 合 を 確 信 度 とす る.そ 最 小 確 信 度(minimum
confidence)と
し て,最
小 支 持 度(minimum
の と き,X
と Y の相 関ルール X ⇒ Y
語 集 合 X と単 語 集 合 Y に 共 起 関 係(cooccurrence)が
て い る.さ
support)と
呼 ば れ る ヒュ ー リス テ ィ ック に定 め た 二 種 の
閾 値 を 用 い て 相 関 ル ー ル を 生 成 す る[8].こ は,単
と Y を共 に含 む
あ る とい う性 質 を 示 し
ら に 多 くの 文 書 間 の 相 関 ル ー ル を 調 べ る こ と で,文
書 間 の 関 連 性 を発
見 す る こ と も 可 能 で あ る. ま た,単
語 は 階 層 的 な 意 味 構 造 を もつ.そ
類 木(classification
tree),分
の 一 般 化(generalization)を
こ で,概
類 階 層(taxonomy)な 行 い,よ
念 木(conceptual
tree)や 分
ど を領 域 知 識 と して用 い て 単 語
り抽 象 度 の 高 い 相 関 ル ー ル を 求 め る こ と も 可
能 で あ る. と こ ろ で,テ modification)を
キ ス ト集 合 か ら 求 め た 相 関 ル ー ル は,検
索 式 の 展 開 や 修 正(query
行 う 「知 識 」 と し て 利 用 す る こ と が で き る だ ろ う か.例
え ば,検
索 式 に 含 ま れ る 単 語 集 合 X に 対 す る 相 関 ル ー ル X⇒ Y に 含 ま れ る 単 語 集 合 Y を 検 索 支 援 に 用 い る こ と が で き な い だ ろ う か.そ 実証 実験 を
1.3.3Webサ
Webサ に,ア
『問 答 』 で 行 っ て い る の で,1.4節
ー バ とWebマ
こ で,こ
の種 のルール導出 に関す る
で 取 り 上 げ る.
イ ニ ン グ
ー バ に 格 納 さ れ る デ ー タ に は,ハ
イ パ ー リ ン ク を も つWebペ
ー ジ以外
ク セ ス して き た 時 間 や サ イ トな ど が 記 録 さ れ る ロ グ フ ァ イ ル が あ る . ア ク
セ ス ロ グ に 対 して デ ー タ マ イ ニ ン グ を 行 え ば,Webペ
ー ジ作 成 者 の 意 図 した リ ン
ク に 従 っ て ア ク セ ス さ れ た か 否 か を 確 認 す る こ と が で き る.つ
ま り,ア
グ に 記 録 さ れ た イ ベ ン ト列 に 対 す る 系 列 パ タ ー ン の 発 見 で あ る.こ ル ー ル に よ っ て ど の ペ ー ジ に 関 心 が 高 い か を 知 る こ と も で き,よ
クセ ス ロ
う して 求 め た り効 果 的 なWeb
ペ ー ジ配 置 や リ ン ク構 造 を考 え る こ とが で き る. さ ら に,Webサ 1.12の
ー チ エ ン ジ ン の よ う な 検 索 機 能 を 備 え たWebサ
よ う な 問 合 せ と 検 索 履 歴 の 利 用 状 況 が 記 録 さ れ る.例
ー バ で は,図
え ば,キ
含 む 問 合 せ と そ の 結 果 か ら 選 択 し た ア ク セ ス 先 の 参 照 頻 度 な ど か ら,検 表 示 順 序 に 関 す る ル ー ル を 発 見 で き る.も よ り選 択 傾 向 が 異 な る た め,プ 欠 か せ な い.な
お,こ
っ と も,検
ー ワ ー ドを 索結 果 の
索 シ ス テ ム利 用 者 の興 味 に
ロ フ ァ イ ル や ク ッ キ ー な ど を 用 い た デ ー タ収 集 も
の種 の デ ー タマ イ ニ ング が プ ラ イバ シー と も関 係 して くる
こ と に 注 意 し て お き た い. そ の 他,Webデ
ー タ の 特 徴 を 利 用 し な が ら,デ
シ ス テ ム が 開 発 さ れ て い る.例 Map)[6]に
え ば,自
己 組 織 化 マ ッ プ(SOM:Self-Organizing
よ る 文 書 組 織 化 の 手 法 を 用 い て,Webペ
(http://websom.hut/fi/websom/).ま
図1.12ア
ー タマ イ ニ ン グ技 術 を適 用 した
た,Webペ
ー ジ の ク ラ ス タ リ ング が で き る ー ジ中 の ハ イパ ー リ ンク の グ ラ フ
ク セス ロ グの 一例
構 造 に 着 目 し たCleverな で は,多
数 のWebペ
1.4『
問答 』Web情
関 ル ー ル を 求 め,検 (図1.13,1.14).ま
際,google(http://www.google.com)
ー ジ 内 の 参 照 関 係 を 利 用 し た 検 索 結 果 の 表 示 を 行 っ て い る.
『問 答 』 は,Webぺ
索,物
ど の 研 究 が あ り,実
報検 索 シス テ ム
ー ジ の テ キ ス トを解 析 して 得 られ た 単 語 ベ ク トル か ら相 索 式 の修 正 に利 用 す る こ と を試 み た検 索 支 援 シ ス テ ム で あ る たWebペ
ー ジ 以 外 に も,図
書 館 の 雑 誌 ・書 誌 情 報 デ ー タ の 検
理 学 ・電 子 工 学 ・コ ン ピ ュ ー タ ・制 御 な ど に 関 わ る デ ー タ ベ ー ス と し て 広
く利 用 さ れ て い るINSPEC(Information
Services
Communities)に
くつ か の 半 構 造 デ ー タ を 対 象 と した 実 験
を行 っ て い る.本
対 す る 文 献 検 索 な ど,い 節 で は,一
連の
for the Physics
『問 答 』 の 実 験 を 踏 ま え な が ら,情
け る デ ー タ マ イニ ン グ の 可 能 性 を考 え る.
図1.13『
and Engineering
問 答 』 に よ る検 索 画面
報検索 にお
図1.14『
1.4.1『
問答 』 によ る検 索結 果 表 示
問 答 』 に よ る 検 索 関 連 キ ー ワ ー ドの 提 示
『問 答 』 で は,検 と と も に 表 示 し,検
索 式 に 含 ま れ る キ ー ワ ー ドに 関 連 す る 相 関 ル ー ル を 検 索 結 果 索 式 の 修 正 支 援 を 試 み て い る.以
下,Webペ
ー ジ の 収 集 か ら,
関 連 キ ー ワ ー ド提 示 に 至 る 一 連 の 流 れ を 簡 単 に 述 べ る . Webロ
ボ ッ トは,Webペ
ー ジ 中 の ハ イ パ ー リ ン ク を 参 照 し な が らWebペ
を 収 集 す る.通
常,Webペ
ー ジ 中 に は,タ
イ トル,見
され て お り,さ
ら に タ グ 付 け さ れ た キ ー ワ ー ド な ど が あ る,ま
テ キ ス トに 対 す る 形 態 素 解 析 な ど の 処 理 に よ っ て,単 こ の と き,Webペ
出 し,ア
ドレス な どが 記 述 た,Webペ
ー ジの
語 を 切 り 出 す こ と が で き る.
ー ジ で 用 い ら れ る 使 用 頻 度 や 出 現 位 置,そ
よ る 重 み な ど を考 慮 し て デ ー タ ベ ー ス に 格 納 す る,さ
ー ジ
し てHTMLタ
ら に,Webサ
れ る 日 時 や サ イ ズ な ど の ヘ ッ ダ 情 報 も デ ー タベ ー ス 化 す る.な タ を 詳 細 に 収 集 す る こ と に よ っ て 検 索 精 度 が 高 ま る と と も に,適
グに
ー バ か ら得 ら お,こ
れ らの デ ー
切 な検 索 結 果 表
示 や 要 約 表 示 を行 う こ と も で き る . と こ ろ で,他
のWebペ
ー ジ へ と リ ン ク し た ハ イ パ ー リ ン ク 部 分 にWebペ
ージ
製 作 者 が 記 述 した テ キ ス トは,リ
ン ク先 のWebペ
や ア ノ テ ー シ ョ ン と考 え る こ とが で きる.つ ク先 のWebペ
ー ジの 内 容 に対 す る キ ー ワー ド
ま り リ ン ク元 の キ ー ワー ドは,リ
ン
ー ジ を意 味 付 け る重 要度 が 高 い キ ー ワー ドを しば しば含 ん で い る.
そ こで,リ ン ク元 のWebペ
ー ジ の キ ー ワー ドを リ ン ク先 のWebペ
ー ジの キ ー ワ ー
ドと して デ ー タベ ー ス化 す る . 以 上 の よ う な考 え に基 づ い て,URLを
キ ー とす るWebペ
ー ジ に対 して の 重 み
付 きの単 語 ベ ク トル を生 成 し,デ ー タベ ー ス を構築 す る. そ して,前 節 の テ キ ス トマ イニ ン グ の項 で 述 べ た よ う に,格 納 され たWebペ
ー
ジ全 体 の 中 か ら キ ー ワ ー ド集 合 X とキ ー ワ ー ド集 合 Y を共 に含 む テ キ ス ト集 合 を求 め,相
関 ル ー ル X⇒ Y を 求 め る,図1.14は,「
情 報 検 索 」 を検 索 キ ー ワ ー ド
(X)と して 入 力 した と き,「retrieval,書誌,レ フ ァ レ ンスサ ー ビス」な どの 関 連 キ ー ワ ー ド(Y)が 提 示 され る様 子 を示 して い る.つ ま り 『問 答 』 で は,キ
ー ワ ー ド集
合 Y を選 択 す る チ ャ ン ス を 与 え る こ とで 検 索 式 の修 正 を支 援 して い る. この よ う に相 関 ル ー ル は,キ ー ワ ー ド集 合 X を含 む検 索 式 を 入力 した と き,検 索 結 果 と して得 られ る テ キ ス ト集 合 中 の キ ー ワー ド集 合 Y と相 関 が 高 い とい う 「知 識 」 を利 用 者 に 与 え る と解 釈 で き る.そ
こ で,利 用 者 に と っ て相 関 ル ー ル X⇒Y
は,検 索 式 を修 正 す る た め に役 立 つ 「知 識 」 を与 え て い る か 否 か を 考 え る. まず,初
期 入 力 検 索 式 を修 正 す る 手 法 に は,専
門家 の用 意 した辞 書 を用 い た シ
ソ ー ラ ス展 開 な どが あ る 。 しか し,用 語 を統 制 せ ず にWebペ
ー ジが 作 成 され て い
る状 況 を考 えれ ば,高 い 質 を もつ シ ソ ー ラス を構 築 す る こ とは 非 常 に 難 しい と予 想 で きる.ま た,仮 に専 門 的 知 識 を集 積 した シ ソー ラス の 構 築 が で きた と して も, Webペ
ー ジ に存 在 しない 限 り検 索 結 果 を得 る こ とが で き な い . つ ま り,出 現 頻 度
の 低 い 「専 門的 な キ ー ワ ー ド」 を用 い たAND検 が 存 在 せ ず,妥 とこ ろが,実
索 で は 検 索 条 件 を満 足 す る結 果
当 な検 索 が 実 行 で き ない 可 能 性 が 高 い ・ 際 に存 在 す るWebペ
ー ジ か ら求 め られ た相 関 ル ー ル に よ る キ ー
ワ ー ドは,ど の よ うな 組 合 せ で も検 索 結 果 が 存 在 す る こ と を保 証 して い る.つ り,Web検 のWebサ
ま
索 に お い て よ り複 雑 な検 索 式 の 入 力 を的確 に支 援 で き る.実 際,通 常 ー チ エ ン ジ ンで は2∼3単
語程 度 か ら な る検 索 式 を利 用 し,上 位 に表 示
され る一 部 の検 索 結 果 を見 る こ とが 多 い が,『 問 答 』で は平 均 的 な検 索 キ ー ワー ド 数 が 多 少 長 く,検 索 が 繰 り返 され る傾 向が あ る.よ
っ て,検 索 支 援 に関 わ る 良 い
「知 識 」 を相 関 ル ー ルが 与 え て い る と考 え られ る.
1.4.2異
種 デ ー タベ ー ス に対 す る相 関 ルー ル の 比 較
前 節 で は相 関 ル ー ル が 検 索 支 援 に利 用 で きる こ と を述 べ た が,さ の デ ー タが 混 在 す るWebペ
ま ざ ま な分 野
ー ジの 検 索 で は,与 え られ た ル ー ル の 質 に満 足 で きる
か ど うか が 問 題 と な る.実 際,複 数 の 領 域 で 異 な る 意 味 を もつ 略 語 を用 い て 検 索 す る と,一 方 の 領域 のWebペ
ー ジか ら得 られ た ル ー ル に 他 の 領 域 のWebペ
ル ー ルが 埋 没 して しま い,よ
り適 切 な相 関 ル ー ルが 導 出 され な い こ とが あ る .例
えば,「 ロ ボ ッ ト」 とい う単 語 で検 索 を行 う と,た と えWebロ
ー ジの
ボ ッ トプ ロ グ ラ ム
に関 す る検 索 を意 図 して い て も,機 械 的 な ロボ ッ トに 関 す る検 索 結 果 の 数 が 多 い 場 合 が あ る.つ
ま り,同
じキ ー ワー ドの検 索 に 対 して,ま
っ た く意 図 しな い ル ー
ル が 提 示 され る可 能性 が あ る. そ こで,Webペ て,よ
ー ジの 単 語 ベ ク トル と 目的 の 領 域 に関 す る シ ソー ラス を比 較 し
り密 接 な 関 係 を もつWebペ
に 述べ た よ う に,さ な作 業 で あ る.そ
ー ジ を選 択 す る 方 法 が 考 え ら れ る.し
か し,先
ま ざ ま な分 野 の シ ソー ラ ス を構 築 す る こ と は非 常 に高 コ ス ト
こで,検 索 結 果 に含 まれ るWebペ
ー ジ を クラ ス タ リン グす る こ
とに よ っ て,複 数 の 領 域 に分 類 して 出力 す る こ と も考 え られ る.た だ し,ク ラ ス タ リ ング の計 算 コス トが 高 い た め,大 量 デ ー タ の処 理 が 難 しい とい う問題 を抱 え る. もっ と も,検 索 対 象 に 関 す る領 域 知 識 の 少 な い利 用 者 に とっ て,出 現 頻 度 の 低 い 「専 門 的 な キ ー ワー ド」で 検 索 式 を修 正 す る こ とが 難 しい こ とは 明 らか で あ る . 『問 答 』 で提 示 され る 「一 般 的 な キ ー ワ ー ド」 を含 む 相 関 ル ー ル か ら 「専 門 的 な キ ー ワ ー ド」 を選 択 す る方 法 は な い だ ろ うか . そ こで,『 問 答 』 に異 な る 分 野 に 関 す る複 数 の デ ー タベ ー ス を用 意 し,同
じ検 索 キ ー ワ ー ドを用 い て 多 くの ル ー ル 集
合 を生 成 し,そ れ らの ル ー ル の 比 較 を試 み た. つ ま り,一 方 で,Webサ め る.他 方,検
ー チ エ ンジ ンに 格 納 され た デ ー タ か らル ー ル集 合 を 求
索 ユ ー ザ の 興 味 に あ った デ ー タ を格 納 して い る 電 子 ニ ュー ス な ど
の デ ー タベ ー ス か らル ー ル集 合 を求 め る.そ
して,こ れ ら複 数 の デ ー タベ ー ス か
ら得 られ た 複 数 の ル ー ル 集 合 を比 較 して,よ
り検 索 者 の 興 味 に 沿 っ た ル ー ル を 選
択 して提 示 した.な お,『 問 答 』 の デ ー タベ ー ス と比 較 す る デ ー タベ ー ス と して, 興味 あ るWebサ
イ トか ら収 集 したWebペ
ー ジ,電 子 ニ ュ ース,メ
ー リ ン グ リス
ト,利 用 者 の 電 子 メ ー ル フ ォル ダ な どを 用 い た.
1.4.3ル
ー ル 導 出 の 高 速化
相 関 ル ー ル は 比 較 的 高 速 に 求 め る こ とが で き るが,そ
れ で もデ ー タ量 の 増 大 に
つれ て リア ル タ イ ム処 理 を行 う こ と は 困 難 に な る.こ の こ とが 『問 答 』 の シス テ ム負 荷 を増 大 させ,検 索 応 答 時 間 の増 加 につ なが る.一 つ の 解 決 方 法 は,並 列 コ ン ピュ ー タや ク ラ ス タ計 算 機 な ど に よ る処 理 で あ る.そ こ で 『問 答 』 で は,実 体 化(materialization)と 呼 ば れ る技 術 を応 用 し,相 関 ル ー ル の 前 処 理 を行 っ た. 相 関 ル ー ル の 前 処 理 と して,『 問 答 』 に格 納 さ れ た デ ー タか らキ ー ワ ー ドを抽 出 し,検 索 時 に必 要 とな る ル ー ル をデ ー タベ ー ス に格 納 した.こ
こ で,も
しす べ
ての キ ー ワ ー ドの組 合 せ に対 す る前 処 理 が 必 要 な ら ば,実 現 は不 可 能 で あ る.し か し,Webペ
ー ジ に 限 らず 自然 言 語 で 記 述 さ れ た テ キ ス トデ ー タに 含 ま れ る キ ー
ワー ドの 出現 頻 度 分 布 に は 大 きな偏 りが あ る.す キ ー ワ ー ドの0.01%程
なわ ち,最 頻 出 キ ー ワ ー ドは 全
度 を 占 め る の み なの で あ る.つ
ま り,最 頻 出 キ ー ワ ー ドに
対 して の み相 関 ル ー ル を 実 体 化 して 格 納 して お け ば 良 い.こ ス テ ム に対 す る負 荷 の約70%程
の こ と に よ っ て,シ
度 を削 減 で きる.
も ち ろ ん,キ ー ワ ー ド出 現 分 布 に基 づ く前 処 理 で は な く,検 索 ロ グ に残 る 履 歴 に基 づ い て,利 用 頻 度 が 高 く計 算 コス トが 高 い キ ー ワー ドに対 して 相 関 ル ー ル の 前処 理 を行 え ば,さ
らに 良 い 性 能 が 得 られ る.ま た,実 体 化 を行 っ て い な い キ ー
ワー ドを含 む 問 合 せ が 実 行 され た場 合 に,検 索 結 果 と相 関 ル ー ル を キ ャ ッシ ュ す る方 法 を併 用 す る こ と で も,よ
1,4.4情
り優 れ た 処 理 性 能 を実 現 で きる.
報可視化技術
ユ ーザ イ ン タ フ ェ ー ス の操 作 性 は,検 索 式 を修 正 した り検 索 結 果 を効 果 的 に 理
図1.15『
問 答 』 に お け る 初 期 のGUI
解 す る上 で重 要 で あ る.特 に,Webサ
ー チ エ ンジ ンは 異 な る分 野 に属 す る デ ー タ
か ら得 られ た ル ー ル や 検 索 結 果 を提 示 す る必 要 が あ る た め ,デ ー タの特 性 を一 覧 で きる 優 れ た イ ン タ フ ェー ス の 必 要性 が 高 い. そ こで 初 期 の 『問答 』 に は,図1.15に 装 した.横
示 す グ ラ フ化 を行 うJavaア
軸 に は 利 用 者 が検 索 結 果 のURLを
を,縦 軸 に は 検 索 結 果 の適 合 度 を示 す.さ
プ レ ッ トを実
表 示 す る た め に要 す る 通 信 コ ス ト
ら に,Webペ
ー ジの サ イ ズが 矩 形 の 面
積 に対 応 して お り,マ ウ ス カ ー ソル の操 作 に よ っ て詳 細 な検 索 結 果 を表 示 で き る. ま た,『 問 答 』 の特 徴 で あ る 関連 キ ー ワー ド提 示 に 関 わ る イ ン タ フ ェ ー ス を構 築 した.特
に,関 連 キ ー ワ ー ドを利 用 者 に一 次 元 的 な リス ト形 式 で 提 示 す る こ とに
よ り,複 数 の 関 連 キ ー ワー ドの 関係 把 握 が 難 し くな る点 の 改 善 を試 み た . 例 え ば 図1.16に
示 す よ う に,同
じ程 度 の 関 連 の 強 さ を も つ 関 連 キ ー ワ ー ド
「A,B,C,D,E」 が あ って も,元 の 検 索 式 を満 た す 領 域 以 外 の被 覆 状 態 は異 な る,も ち ろ ん,複
数 の分 野 に 関 す るWebペ
ー ジ が 混 在 して い る た め,一 概 に ど の キ ー
図1.16関
連 キ ー ワ ー ドの 被 覆 関 係
ワ ー ドを 選 択 す る べ き か は 決 定 で き な い.し して 絞 り込 む な ら ば,領 い.つ
ま り 図1.16で
も,キ
ー ワ ー ド 「C,B,E」
そ こ で,初
か し,元
の検 索 式 を満 た す 領 域 に 対
域 を 広 げ る こ と な く被 覆 状 態 を 考 え て 検 索 で き る 方 が 良
は,相
関 ル ー ル と し て キ ー ワ ー ド 「A,B,D」
を提 示 す る よ り
を 提 示 す る 方 が 望 ま しい だ ろ う.
期 入 力 キ ー ワ ー ド と 導 出 キ ー ワ ー ドの 関 係 の 理 解 を 促 す キ ー ワ ー ド
選 択 イ ン タ フ ェ ー ス と し て,ROC(Receiver 用 い た 表 示 方 法 を 提 案 し実 装 し た.ま
Operating た,相
め に,3 次 元 グ ラ フ の 任 意 方 向 へ の 回 転,拡
Characteristics)グ
ラ フを
関 ル ー ル の性 質 の 一 覧 性 を 高 め る た 大,部
分 拡 大,さ
ら に,fisheye
view
に よ る ズ ー ミ ン グ 表 示 な ど の 機 能 も 提 供 し た. こ こ で,ROC解 と 「負(negative):N」
析 に つ い て 簡 単 に 触 れ て お く.ま
ず,事
の 2 ク ラ ス に よ り構 成 さ れ て い る と仮 定 し,分 類 子(claSsifier)
に よ っ て あ る 事 象 を 「正:y 」 と 「負:n 」 に 分 類 す る.そ と正 し く 分 類 さ れ る 比 率TP(True 正 と分 類 さ れ る 比 率FP(False を 行 う.つ
ま り,TP,FPは,次
TP=p(y│P)〓
象 が 「正(positive):P」
Positive rate),お
よ び,負
Positive rate)を 用 い て,分 式 で 表 さ れ る.
正 と分 類 さ れ た正 の 事 象/ すべ ての正の事象
し て,正
の事 象 P が正
の 事 象 N が誤 っ て
類 子 に対 す る 性 能 評 価
正 と分類 された負 の事 象/
FP=p(y│N)〓
す べ て の 負 の事 象 相 関 ル ー ル をROCグ
ラ フ 上 に 配 置 す る.こ
満 た す 領 域 を 導 出 ル ー ル が 占 め る 割 合,す 方FPは,検 て,FP値
の と きTPは,検
索 キ ー ワ ー ドが
な わ ち 相 関 ル ー ル の 確 信 度 と な る.一
索 キ ー ワ ー ドが 支 配 し な い 領 域 で 共 起 性 を 示 す 値 と な る.し が 高 い ル ー ル は,検
索 キ ー ワ ー ド と 関 連 の 低 い キ ー ワ ー ドや 検 索 空 間
全 体 に 関 係 す る よ う な 無 意 味 語 な ど が 多 い.そ (FP,TP)=(1,0)の
たが っ
こ で,最
もパ フ ォ ー マ ン ス の 低 い
点 か ら ル ー ル が 配 置 さ れ た 位 置 ま で の 距 離 を 用 い て,無
意 味語
の 自 動 除 去 な ど も 試 み て い る. 図1.17は,INSPECデ
ー タ ベ ー ス を 検 索 対 象 と した 実 行 例 で あ り,ROCグ
ラ
フ は,∋“information” を キ ー ワ ー ドに 用 い た 検 索 結 果 の 関 連 キ ー ワ ー ド を 示 し て い る.そ
し て,グ
ラ フ 中 の い くつ か の キ ー ワ ー ド を マ ウ ス で 選 択 し,ク
図1.17
3 次 元 グ ラ フ を用 い た ル ー ル の 可 視 化
ラス タ リン
図1.18検
グを 実 行 す る と,図1.18の
索結 果の ク ラス タ リ ング
よ うな 検 索 結 果 が 得 られ る.画 面 上 の 数 字 は検 索 式 中
の キ ー ワ ー ド数 を示 し,マ ウス を フ ォ ー カ ス す る こ と でWebブ 検 索 結 果 を表 示 す る.な お,こ
ラ ウザ の 右 側 に
の よ う な検 索 結 果 の ク ラ ス タ リ ング 方 式 を実 装 す
る こ とに よ り,複 雑 な 条件 式 を繰 り返 し修 正 す る必 要 が な く な る た め,検 索 が ス ム ー ズ に 進 む. 以 上,本
章 で は,デ
触 れ な が ら,Web情
ー タベ ー ス や 情 報 検 索,さ
らに,デ
ー タマ イ ニ ン グ研 究 に
報 検 索 の 高度 化 につ い て 述 べ て きた.
今 後 と も,テ キ ス トや リ ン ク構 造,利 用 者 プ ロ フ ァイ ル や 閲 覧 パ タ ー ン,そ て ア ク セ ス ロ グ な ど に対 す る デ ー タマ イ ニ ング,さ
らに 音 声 や 画 像 な ど の マ ル チ
メデ イ ア情 報 か らの 知 識 発 見 な ど,情 報 検 索 に 絡 む 問 題 は尽 きな い.き 章 で 紹 介 した 内 容 は,P2P環
し
っ と,本
境 下 を含 む ネ ッ トワ ー ク上 にあ る広 大 な情 報 空 間 を
ナ ビゲ ー シ ョ ンす る技 術 と して,今 後 も発 展 して ゆ くこ とだ ろ う.
参考文献 [1 ]J.P.ビ
ー ガ ス(社
会 調 査 研 究 所,日
本IBMビ
ジ ネス イ ンテ リ ジ ェ ンズ事 業 部
共 訳)『 ニ ュ ー ラ ル ネ ッ トワ ー ク に よ る デ ー タ マ イ ニ ン グ 』 日経BP社,1997. [2]P.キ
ャベ ナ,P.ハ
田 剛 志 監 訳,日
ジ ニ ア ン,R.ス 本IBMラ
タ ッ ドラ ー,J.ベ
ル フ ィ ー ス(河
村 佳 洋,福
ン ゲ ー ジ ・サ ポ ー ト 訳)『 デ ー タ マ イ ニ ン グ 活 用
ガ イ ド』 エ ヌ ア イ ビ ー ・ア ク セ ス,2000. [3]D.エ
リ ス(斎
藤 泰 則,鈴
木 志 元,村
上 泰 子 共 訳)『 情 報 検 索 論:認
知 的 ア プ
ロ ー チ へ の 展 望 』 丸 善 株 式 会 社,1994. [4]人 工 知 能 学 会
「特 集:テ
キ ス トマ イ ニ ン グ 」 人 工 知 能 学 会 誌,Vo1.16,No.2,
林 弥 彦,植
村 俊 亮 『デ ー タ ベ ー ス(新
pp.191-238,2001. [5]西 尾 章 治 郎,上
世 代 工 学 シ リー ズ)』 オ ー
ム 社,2000. [6]T.コ
ホ ネ ン(徳 高 平 蔵,岸
田 悟,藤
村 郎 喜 久 郎 訳)『 自 己 組 織 化 マ ッ プ 』 シ ュ
プ リ ン ガ ― ・フ ェ ア ラ ー ク 東 京,1996. [7]R.S.ミ
カ ル ス キ ー(電
リ ー ズ(全
総 研 人 工 知 能 研 究 グ ル ー プ 訳)『 知 識 獲 得 と 学 習 シ
8 巻)』 共 立 出 版,1987.
[8]西 尾 章 治 郎,田 中 克 巳,上 原 邦 明,有 木 康 雄,加 藤 俊 一,河 野 浩 之 化 と 検 索(岩 [9]J.R.キ [10]徳
波 講 座 マ ル チ メ デ イ ア 情 報 学 8)』 岩 波 書 店,2000.
ン ラ ン(古
永 健 伸,辻
『情 報 の 構 造
川 康 一 訳)『AIに
井潤 一
よ る デ ー タ 解 析 』 ト ッ パ ン,1995.
『 情 報 検 索 と言 語 処 理(言
語 と計 算
第 5巻)』 東 京 大 学
出 版 会,1999. [11]J.D.ウ
ル マ ン(国
ピ ュ ー タ 協 会,1985.
井 利 泰 訳)『 デ ー タ ベ ー ス ・シ ス テ ム の 原 理 』 日 本 コ ン
第2 章 情 報 収 集 エ 一ジ ェン ト
2.1エ
ー ジ ェン トに よるイ ンターネ ッ トにおける情報 収 集
現 在 イ ン ター ネ ッ トやWWWに
は,さ ま ざ ま な組 織,個 人 が 発 信 して い る 非常
に豊 か な 情 報 が 存 在 してい る.今 後 イ ン ター ネ ッ トの さ らな る普 及 に と もな い,あ る こ とが らに つ い て 関 連 す る情 報 を集 め た い 場 合 に,イ ン ター ネ ッ ト,特 にWWW 上 か ら関 連 情 報 を 収 集 す る こ とが ます ます 日常 的 に行 わ れ る よ う に な る だ ろ う. しか し,そ こ に は い くつ か の 問題 点 が あ る.そ れ ら の うち,重 要 な 二 つ は 以 下 の もの で あ る. ・情 報 の 収 集 一 般 にユ ー ザ は ,イ ン ター ネ ッ ト上 の ど こ に 自分 の欲 しい 情 報 が 存 在 す るの か を知 らな い.よ 連 す るWebペ Webペ
っ て,サ
ー チ エ ン ジ ン に欲 しい情 報 の キ ー ワー ドを 入力 して,関
ー ジ を集 め る よ う とす るが,サ ー チ エ ンジ ンが欲 しい 情 報 の 載 っ た
ー ジ をい つ も適 切 に見 つ け て くれ るわ け で は な い.
・情 報 の 抽 出 欲 しい 情 報 の含 まれ るWebペ
ー ジ が収 集 で きた と して も,そ こか ら 自分 の 欲 し
い 情 報 や 知 識 を抽 出 す る こ と は,ユ ー ザ に と っ て負 担 とな る作 業 で あ る.特
に,
サ イ ズ の 大 きなWebペ らか らの 情 報,知
ー ジや た くさ ん のWebペ
ー ジが 収 集 され た 場 合 は,そ れ
識 の 抽 出 は ユ ーザ の 多 大 な コ ス トに な る.
上記 の よ うな 問題 に対 す る 一 つ の 解 決 策 は,情 報 の収 集 と抽 出 を 自動 化,あ は 半 自動 化 す る こ とで あ る.一 方 で,ユ ー ザ が 簡 単 な命 令 を与 え れ ば,あ
るい
とは 自
分 で 意 思 決 定 して 行 動 で き る エ ー ジ ェ ン ト技 術 が 最 近 活 発 に 開 発 され て い る[9]. これ らの エ ー ジ ェ ン ト技 術 とエ ー ジ ェ ン トを よ り知 的 に す る 人 工 知 能(AI)を 用 す る こ とに よっ て,情 報 の 収 集 と抽 出 の 処 理 を(半)自 て い る.本 章 で は,そ
2.2情
動 化 す る試 み が 行 わ れ
れ らの研 究 例 につ い て紹 介 して い く.
報 抽 出 を 学 習 す る エ ー ジ ェ ン ト
2.2.1WWWか
応
WWWは
らの 知識 獲得 を学 習 す るエ ー ジ ェン ト 膨 大 な情 報 源 で あ り知 識 源 で あ る と考 え られ,そ れ らか ら 自動 的 に知
識 を獲 得 で きれ ば,そ
の利 用 価 値 は計 り知 れ な い.こ の 観 点 か ら,Webペ
ー ジ,
あ る い は ハ イパ ー リ ン クか ら ル ー ル 形 式 の 知 識 を 自動 的 に抽 出 す る学 習 エ ー ジ ェ ン トの研 究[2]が行 わ れ て い る. 対 象 とな る 知識 源 は,大 学 の コ ン ピュ ー タ科 学 科(具 体 的 に はCMUのCS)の Webサ
イ トで あ る.エ ー ジ ェ ン トの入 力 は コ ン ピ ュ ー タ科 学 科 の 構 成 要 素,つ
り学 科,教 図2.1の
員,学 生,研
究 室,プ
ま
ロ ジ ェ ク トが どの よ うな構 成 に な って い る か を
よ う に階 層 構 造 を もつ グ ラ フ で 表 現 した オ ン トロ ジ と呼 ば れ る 知 識 と訓
練 例 で あ る.AIの
機械学習の 技 術 で あ る 訓 練 例 か ら一 般 的 概 念 の 記 述 を学 習 す る
帰 納 学 習[1]に よ り,さ ま ざ ま な知 識 を獲 得 す る こ とが で きる.エ
ー ジ ェ ン トの 出
力 は,あ るWebペ
ー ジが どの 種 類 に属 す るか を判 定 す る ル ー ル,そ
類 に 属 す るWebペ
ー ジ のペ ア を判 定 す る ル ー ル を学 習 す る.
して 二 つ の種
(1)ク ラ ス分 類 の 学 習 ク ラス 分 類 の学 習 で は,あ るWebペ
ー ジが どの ク ラス(種 類)に
属 す る か,つ
ま りそ の ペ ー ジが 学 科 の紹 介 ペ ー ジ な の か,学 生 個 人 の ペ ー ジ な の か,プ
ロジェ
ク トの ペ ー ジ な の か を分 類 す る ル ー ル を学 習 す る.そ の ため に い くつ か の 学 習 方
図2.1オ
法 を用 い て,そ
ン ト ロ ジ,訓
練 例,Webペ
ー ジ(参
考 文 献[2]よ
り)
れ らの 結 果 が 比 較 検 討 され て い る.
まず 最 初 に,文 書 の分 類 で従 来 行 わ れ て き た統 計 的手 法 に よ る分 類 が 行 わ れ た. 基 本 的 な考 え 方 は,ク ラ ス C に属 す るWebペ C 以 外 のWebペ
ー ジが た くさ ん含 ん で い て,ク ラス
ー ジ に は あ ま り含 ま れ て い な い 特 徴 的 な単 語 を,Webペ
ージ A
が 多 く含 ん で い る場 合 は,A が C に 属 す る度 合 い を 高 くす る と い う もの で あ る.
こ こ で注 意 して ほ しい の は,一 つ のWebペ
ー ジ に含 まれ て い る単 語 の 出 現 頻 度
に基 づ い て分 類 す る 点 で あ る.こ の 方 法 は,一 つ のWebペ い て分 類 す る もの で あ り,Webペ た く使 っ て い な い,つ
ー ジの 特 徴 の み に基 づ
ー ジ の大 きな特 徴 で あ る ハ イ パ ー リン ク は ま っ
ま り,「 ペ ー ジAに
リ ン ク され て い る ペ ー ジBは,ク
ラス
Cに 属 す る」 とい う よ う なペ ー ジ 間 の リ ン ク関 係 を用 い た分 類 ル ー ル は学 習 さ れ ない.こ の よ うな リ ンク 関係 が 文 書 の ク ラ ス分 類 に有 効 か否 か は 自明 で は な いが, 以 降 の 実 験 に よ りそ の有 効 性 が 示 され る. 次 に,帰 納 論 理 プ ロ グ ラ ミ ン グ│ILP[5]を 用 い て,同 様 の ク ラス 分 類 学 習 を行 っ て い る.帰 納 論 理 プ ロ グ ラ ミ ン グ と は,あ る 目標 概 念 に含 ま れ る 具 体 的 な訓 練 例 (正例),含 て,与
ま れ な い 訓 練 例(負
例),そ
して問 題 に依 存 した 背 景 知 識 を も と に し
え られ た 例 が 目標 概 念 に含 まれ るか 否 か を 判 別 す る た め の 一 般 的 な ル ー ル
を学 習 す る 手 法 で あ る.ILPは,対
象 間 の 関 係 を表 現 す る述 語 国 を 学 習 す る こ
とか ら,関 係 学 習 と も呼 ば れ る.よ
って,先 に示 したWebペ
ー ジ間の関係 による
ク ラス 分 類 の学 習 に適 して お り,リ ン クの 張 られ て い る 隣 接 ペ ー ジの 情 報 を用 い た 分類 ル ー ル の 学 習 が 期 待 で き る.具 体 的 に は,背 景 知 識 と して ペ ー ジ の接 続 パ ター ンや 隣 接 ペ ー ジの 単 語 頻 度 を記 述 す る述 語 を与 え て お き,そ れ ら を組 み 合 わ せ て ル ー ル の 学 習 を行 う.こ れ に よ り,例 え ば 「あ るペ ー ジ がtextbookとTAと い う単 語 を含 み,assignmentと Courseの
い う単 語 を含 ん だペ ー ジ に リ ン ク され て い る な ら
ペ ー ジ で あ る」 とい う よ うな ル ー ル が 学 習 可 能 にな る.
シ ス テ ム に与 え られ た 背 景 知 識 を以 下 に 示 す.な お,以
降 で,述
語名 中の イ タ
リ ック の 部 分 に は任 意 の 単 語 が代 入 され る. .has_word(Page):
Pageがwordと
.link_to(Pagel,Page2) そ し て,帰
Page1か
い う単 語 を 含 ん で い る.
らPage2に
リ ン ク が あ る.
納 論 理 プ ロ グ ラ ミ ン グ に よ り学 習 さ れ た ク ラ ス 分 類 ル ー ル と そ の 解
釈 を 以 下 に 示 す.な
お,以
と い う ル ー ル は,「Bか
降 で ル ー ル はProlog流
つCな
ら ば,Aで
で 記 述 さ れ て お り,「A:一B,C.」
あ る 」 と い う 意 味 で あ る.
・student(A):-not(has_data(A)),not(has_comment(A)), link_to(B,A),has_jame(B),has_paul(B),not(has 「単 語dataを
含 ま ず,単
を 含 み,mailを
_mail(B)).
語commentを
含 ま ず,リ
含 ま な い よ う な ペ ー ジ は,学
ン ク 元 の ペ ー ジ が 単 語jameとpaul
生 の ペ ー ジ で あ る.」
・faculty(A):-has_professor(A),has_ph(A),link_to(B,A),has_faculti(B). 「単 語professor,phを
含 み,リ
ン ク 元 の ペ ー ジ がfacultiを
含 む よ う な ペ ー ジ は,学
部
の ペ ー ジ で あ る.」
実 験 の 結 果,こ
の よ う なペ ー ジ間 の 関係 に よ る ク ラス 分 類 ル ー ル を学 習 す る こ
とで,先 の ペ ー ジ 単独 の 統 計 的 手 法 よ り も精 度 が 向 上 す る こ とが わ か っ た.よ て,関 係 学 習 がWebペ (2)Webペ
っ
ー ジ の 文 書 の ク ラス 分 類 に有 効 で あ る と結 論 付 け られ た.
ー ジ間 の 関係 学 習
次 に,Webペ
ー ジ 間の 関係 自身 をILPに
よ り学 習 す る実 験 が され て い る . 背 景
知 識 を以 下 に示 す. ・class(Page):Pageの
ク ラ ス は,class(research-project,person,departmentな
ど)
で あ る.
・link_to(Hyperlink,Page1,Page2):Hyperlinkに
よ りPage1とPage2が
リ ン ク さ れ て
い る.
・has_word(Hyperlink):Hyperlinkの にwordが
ア ン カ ー テ キ ス
ト(下
線 が 引 か れ た テ キ ス
ト)の
中
あ る.
・all_words_capitalized(Hyperlink):Hyperlinkの
ア ン カ ー テ キ ス ト中 の 全 単 語 が 大 文 字
で 始 ま る.
・has_alphanumeric_word(Hyperlink):Hyperlinkの
ア ン カ ー テ キ ス
トが ア ル フ ァ ベ ッ ト
と 数 字 を 含 む.
・has_neighborhood_word(Hyperlink):Webペ あ る.
ま た,実 験 の設 定 は 次 の 通 りで あ る.
ー ジ 中 でHyperlinkの
近
く にwordが
・ 学 習 す べ き 関 係 -members_of_project(Page1 のWebペ
,Page2):Page2は,Page1の
プ ロ ジ ェ ク
-department
_of_person(Page1,Page2):Page1は,Page2の
Webペ
トの メ ン バ ー
ー ジ で あ る. 学 科 に 所 属 す る 人 の
ー ジ で あ る.
そ して,学 習 され た ル ー ル とそ の解 釈 を以 下 に示 す. ・members
_of_project(A,B):-research_project(A), person(B),link_to(C,A,D),link_to(E,D,B), neighborhood_word_people(C).
「ペ ー ジA,Bは
二 つ の リ ン ク で つ な が っ て お り,一
つ 目 の リ ン ク の 近 傍 にpeopleが
あ る.」
・department_of_person(A,B):‐person(A),department(B), link_to(C,D,A),link_to(E,F,D),link_to(G,B,F), neighborhood_word_graduate(E). 「ペ ー ジA,Bは
三 つ の リ ン ク で つ な が っ て お り,二
つ 目 の リ ン ク の 近 傍 に は,graduate
と い う 単 語 が あ る.」
この 研 究 は,WWWに
お け る未 整 理 で は あ るが 豊 か な情 報 か らい か に 自動 的 に
知 識 を抽 出す る か とい う実 用 的 な 問 題 に,AIの
機 械 学 習 の 技 術 を用 い て取 り組 ん
だ もの で あ り,ル ー ル で 記 述 され た 重 要 な 関係 を実 際 に抽 出 で きる こ と を示 した 点 に 意 義 が あ る.ま
た,ハ
イパ ー リ ン ク とい う構 造 を使 っ て い る点 が,サ
ーチエ
ンジ ン にお け る リ ン ク構 造 の 利 用 と リ ン ク して お り興 味 深 い .
2.2.2ShopBot:学
習 す る 買 い物 エー ジ ェン ト
ShopBot[3]は,WWW上
に あ る 複 数 の オ ン ラ イ ン シ ョ ッ ピ ン グ サ イ トを 調 べ,
あ る 商 品 を 最 も安 く 買 え る 店 を 探 し,そ で あ る.ShopBotの
機 能,特
徴,対
の 結 果 をユ ーザ に提 示 す る エ ー ジ ェ ン ト
象 領 域 と タ ス ク は 以 下 の よ う に ま と め ら れ る.
・ 機能 − オ ンラ イ ンシ ョ ップで の 買 い もの の方 法 を学 習 −
商 品情 報 の獲 得
− 結 果 をユ ー ザ に提 示
・ 特徴 − −
自 然 言 語 処 理 な しで ,商 品 部 門 の 知 識 の み 使 用 ヒ ュー リステ ィ ックス ,パ タ ー ン マ ッ チ,帰 納 学 習
・ 領域 −
ソ フ トウ ェ ア ,音
楽CDの
買い物
・ タスク −
一 番安 い商 品 の提 示
−
お す すめ 商 品 の表 示
ShopBotは,Webペ
ー ジか ら あ る 商 品 の 価 格 を 抽 出 す る ため の手 続 き を学 習 に
よ り獲 得 す る こ とが で きる.帰 納 学 習 を行 うが,ま コス ト的 に 現 実 的 な 時 間 で学 習 で き な い の で ,Webペ
と もに帰 納 学 習 を す る と計 算 ー ジ あ るい はWebサ
イ ト
とい う対 象 に 依存 したい くつ か の ヒュ ー リス テ ィ ッ ク ス を用 い て 学 習 の 効 率 化 を 図 っ て い る. まず,情 報 抽 出 手 続 き の学 習 手 続 きの 入 力 と出 力 を以 下 に 示 す.学
習 は,Web
ペ ー ジか ら訓 練例 をエ ー ジ ェ ン ト自 身が 獲 得 しなが ら オ ン ライ ンで行 わ れ る とこ ろ が 興 味 深 い.学 習 後 は購 入 フ ェ ーズ に な り,ユ ーザ は希 望 商 品 を入 力 し,ShopBot は学 習 結 果 を用 い て 各 サ イ トに お け る希 望 商 品 の価 格 を獲 得,比 較 検 討 して ラ ン キ ン グ した 結 果 を ユ ー ザ に出 力 す る. ・ 入カ −
−
領 域 知識 *商
品 例:P1,P2,…,Pn.
*商
品 の 属 性:manufactuer(P1)=Microsoft,name(P1)=Encarta,…
ベ ン ダ のWebペ
ー ジ のURL
・ 出力 − ベ ン ダ の サ イ トに ア ク セ ス して 希 望 商 品 の 情 報 を 記 述 す る 文 字 列 を 返 す 手 続 き
ま た,先 に 述 べ た よ うに,学 習 に使 わ れ る ヒ ュー リス テ ィ ック ス(経 験 的 知 識) を以 下 に示 す.こ
れ らバ イ ア ス[1]と呼 ば れ る ヒュ ー リス テ ィ ッ クス を使 っ て,学
習 を効 率 化 で きる. ① ナ ビゲ ー シ ョ ンの 容 易 性:オ
ン ラ イ ン シ ョ ップ の サ イ トは商 品 をす ば や く見 つ
け られ る よ うに な っ てお り,サ イ ト内 の 商 品 を検 索 す る た め の ペ ー ジ が 用 意 さ
れ て い る. ② 単 ー フ ォ ー マ ッ トの 規 則 性:一
つ の 店 で は,商 品 情 報 は類 似 した フ ォ ー マ ッ ト
であ る. ③ 行 空 け の規 則 性:商 品 ご とに行 を空 け た り,新 製 品 は最 初 の行 に くる こ とが多 い. 実 際 に学 習 され る情 報 抽 出 手 続 きは,ベ
ン ダ記 述 と呼 ば れ る 下 記 の形 式 で 得 ら
れ る. ・ ベ ン ダ記 述 − 商 品検 索 ペ ー ジのURL − 商 品 の 属性 と(CGIの)フ − 検 索 結 果 のWebペ
ォー ムの 入力 フ ィー ル ドの対 応 関係
ー ジか らの情 報抽 出機 能
*失 敗 ペ ー ジの認 識 機 能 *成 功 ペ ー ジか らのヘ ッ ダや フ ッ タの削 除機 能 *残 っ た部 分 か らの個 々 の商 品 情 報 の抽 出機 能
ShopBotの
学 習 手 続 き の 概 要 は,以
下 の よ う に な っ て い る.ShopBotの
学 習 は,
失 敗 ペ ー ジ の パ タ ー ン学 習,関 係 な い ヘ ッ ダ と フ ッ タ の 削 除 の 学 習,製 品 記 述 フ ォ ー マ ッ トの 学 習 の 三 つ か ら な る. (1)ShopBotの ①
学 習 手続 き
商 品 検 索 ペ ー ジ の 候 補 のURL{F1,F2,…}を
生 成 す る.リ
の フ ォ ー ム 形 式 の ペ ー ジ を 商 品 検 索 ペ ー ジ の 候 補Fiと
ン ク を た ど り,CGI
す る.こ
の 処 理 は ,「 ナ
ビ ゲ ー シ ョ ン の 容 易 性 」 の ヒ ュ ー リ ス テ ィ ッ ク を 用 い て い る. ②
そ れ ぞ れ の F に つ い て,以
下 の 処 理 を 行 う.
(a)入 力 フ ィ ー ル ド名 と 既 与 の 商 品 属 性 の 部 分 マ ッ チ ン グ に よ り,ど
の 入力
フ ィ ー ル ド に ど の 属 性 値 を 入 力 す れ ば よ い の か を 決 定 す る. (b)失
敗 ペ-ジ
の パ タ ー ン 学 習:必
の 意 味 の な い 文 字 列)を す る.こ (c)既
ず 失 敗 す る ダ ミ ー 入 力(例:qdwfhwaな
実 行 し て,そ
の 結 果 返 っ て くる失 敗 ペ ー ジ を獲 得
れ らの 失 敗 ペ ー ジか らそ の パ ター ン を帰 納 学 習 す る .
与 の 商 品 属 性 を用 い て 正 当 な 入 力 を 行 い,返
を 得 る.こ も の,つ
ど
の う ち,先
っ て く るWebペ
ー ジ の集 合
に 学 習 し た 失 敗 ペ ー ジ の パ タ ー ン に マ ッチ ン グ す る
ま り失 敗 ペ ー ジ が 多 い と こ のURLF
のペ ー ジ は 商 品 検 索 のペ ー ジ
で は な い と 判 断 し,以 (d)得
降 の 処 理 は 行 わ ず に 終 了 す る.
ら れ た 成 功 ペ ー ジ を 正 例 と し て,以
を 学 習 す る.こ
下 の 手 続 き に よ り情 報 抽 出 パ タ ー ン
の 学 習 が う ま く い く た め に は,「 単 一 フ ォ ー マ ッ ト の 規 則
性 」 の 仮 定 が 必 要 で あ る.同
一 サ イ トでWebペ
ー ジ の フ ォ ー マ ッ トに 規 則
性 が な い と学 習 で き な い か ら で あ る. i.ヘ
ッ ダ と フ ッ タ の 削 除 の 学 習:成
功 ペ ー ジ の 単 純 な マ ッ チ ン グ に よ り,
ヘ ッ ダ と フ ッ タ の パ タ ー ン を 学 習 す る.そ ⅱ .製
品 記 述 フ ォ ー マ ッ トの 学 習:残 分 の 学 習 を 行 い,商
し て,そ
れ ら を 削 除 す る.
りの 本 体 の 部 分 を 訓 練 例 と し て 共 通 部
品 情 報 抽 出 パ タ ー ン を 学 習 す る.こ
の共通部分 構造
の 探 索 を 素 直 に や る と 計 算 が 爆 発 す る の で,「 行 空 け の 規 則 性 」 の ヒ ュ ー リ ス テ ィ ッ ク に よ り高 速 化 を 図 っ て い る.つ
ま り,
,
,
な
どの
タ グ の 直 後 に 注 目 し た 探 索 を 行 う. ヒ ュ ー リ ス テ ィ ッ ク ス を 用 い た 効 率 化 に よ り,一 ぼ5分
∼15分
つ のWebサ
イ ト に つ い て,ほ
で 学 習 が 終 了 す る.
(2)比 較 買 い も の の 実 験 学 習 され たベ ン ダ記 述 を用 い た比 較 買 い もの フ ェ ー ズ で,最
も安 い オ ン ラ イ ン
シ ョッ ピ ン グサ イ トを見 つ け る まで の 実 時 間 の 比 較 実 験 が 行 わ れ た[3].ShopBot は,ま ずGUIで
ユ ーザ に希 望 商 品 を 入力 して も ら う.次 に,各 オ ン ラ イ ン シ ョ ッ
ピ ン グサ イ ト(12のURLが
与 え られ て い る)を 巡 り,学 習 さ れ た ベ ン ダ 記 述 を
用 い て 既 与 の各 オ ン ラ イ ンサ イ トに お け る希 望 商 品 の価 格 を収 集 し,価 格 に基 づ い て サ イ トを ソー トしてユ ー ザ に提 示 す る.被 験 者 7人 を以 下 の グ ル ー プ に分 け て,グ
ル ー プ 問 の 比 較 が され た.
・G1:ShopBotを
・G2:Netscapeの
使 う(3
人).
サ ー チ エ ン ジ ン+ShopBotに
入 力 さ れ て い る12店
サ ー チ エ ン ジ ン だ け を 利 用(2
人).
(2 人). ・G3:Netscapeの
舗 のURLを
利用
表2.1ShopBotの
ま ず,最
初 の 実 験 は,と
比 較 実 験 の 結 果(参
考 文 献[3]よ
り)
に か く一 番 安 い 商 品 を 速 く探 せ と い う タ ス ク で あ る.
実 際 に 見 つ か っ た 最 も安 い 商 品 の 価 格 と 要 し た 実 時 間 を調 べ た 結 果,表2.1の う に な っ た.希 not foundは と,G2が
望 商 品 は,Netsacpe
Navigator,exceed,wbrd,Quickenで
あ り,
制 限 時 間 内 に 商 品 が 見 つ か ら な か っ た こ と を 意 味 す る.結
予 想 外 に 良 くな い.人
間 の 忍 耐 力 に は 限 界 が あ り,単
よ
果 を見 る
調 な 作 業 をや らさ
れ る と 時 間 と と も に 見 落 と しが 多 く な る こ と が 原 因 と さ れ る. ShopBotは,自
分 で 商 品 検 索 ペ ー ジ を見 つ け て く る と こ ろ が 非 常 に 興 味 深 い.さ
ら にShopBotは,そ
の 商 品 検 索 ペ ー ジで 希 望 商 品 の ペ ー ジ を提 示 させ て そ の 商 品
紹 介 ペ ー ジ の フ ォ ー マ ッ トを 学 習 す る こ と に よ り,オ
ン ラ イ ン シ ョ ッ プ のURLを
与 え る だ け で 希 望 商 品 の 価 格 な ど の 属 性 を す べ て 自 動 的 に 抽 出 して く る エ ー ジ ェ ン トに な っ て い る.こ
れ だ け の こ と を学 習 で き るエ ー ジ ェ ン トを実 現 して い る 点
が 高 く評 価 で き る だ ろ う.ま
た,機
械 学 習 と し てShopBotの
お も し ろ い と こ ろ は,
学 習 手 続 き に お い て 正 例 と負 例 の 両 方 の 訓 練 例 を 自 分 自 身 で 獲 得 して お り,能 学 習 に な っ て い る と こ ろ で あ る.ま Webサ
た,既
動
存 の 学 習 手 法 を 使 用 し て は い る も の の,
イ トに 依 存 し た ヒ ュ ー リ ス テ イ ッ ク ス を 用 い て 学 習 の 効 率 化 を 図 っ て い る
点 も 特 徴 的 で あ る. ShopBotの
不 満 な 点 は,あ
ジ ェ ン トで あ り,か
ま り に オ ン ラ イ ン シ ョ ップ に 特 化 した 処 理 を行 う エ ー
な り ア ドホ ッ ク な 処 理 が 多 い こ と で あ る.ま
た,一
般 に商 品
の 検 索 な ど の 単 純 作 業 を 嫌 う 傾 向 が 人 間 に は あ る の で,ShopBotの
比 較対象が別
の ソ フ ト ウ エ ア で は な く,人 間 で よ い の か と い う疑 問 も残 る.こ
の 点 に 関 し て は,
む し ろ 人 間 と エ ー ジ ェ ン トの う ま い 役 割 分 担 が で き れ ば さ ら に よ い だ ろ う.
2.3情
報 収 集 を
計 画 す る エ ー ジ ェ ン
2.3.1SoftBot:情
報 収 集 の プ ラ ン ニ ング エ ー ジ ェン ト
SoftBot[4]は,「
あ る 情 報 を イ ン タ ー ネ ッ ト上 か ら 収 集 し ろ 」 と い う 命 令 に 対 し,
そ の 集 め る べ き 情 報 を 目標 と し て 入 力 す る と,そ 行 可 能 な コ マ ン ド系 列(例 エ ー ジ ェ ン トで あ る.ワ れ,UNIXシ
ト
え ばUNIXの
の 情 報 収 集 を実 現 す る た め の 実
コ マ ン ド系 列)を
シ ン ト ン 大 学 のO.Etzioniら
ェ ル とWWWを
自動 生 成 して 実 行 す る
の グ ル ー プ に お い て 開発 さ
使 っ て 世 界 中 の イ ン タ ー ネ ッ ト上 の 情 報 資 源 を収 集
す る こ と が 可 能 で あ る. ソ フ ト ウ ェ ア で あ っ て も ロ ボ ッ ト と い う か ら に は,環 の 行 為 が 必 要 で あ る.SoftBotの ど のUNIXコ
場 合 は,セ
境 の セ ン シ ン グ と環 境 へ
ン シ ン グ はarchie,gopher,netfindな
マ ン ドに よ っ て イ ン タ ー ネ ッ トの 情 報 を 獲 得 す る こ と を 意 味 し,行
為 はftp,telnet,mail及 フ ァ イ ル の 獲 得,フ
び 多 くの フ ァ イ ル 操 作 コ マ ン ドに よ り実 行 さ れ る 通 信, ァ イ ル 操 作 な ど を 意 味 す る.い
わ ゆ る 実 機 の ロ ボ ッ トの よ う
に 物 理 的 な 環 境 で 環 境 の 信 号 を セ ン シ ン グ し て,ア
ー ム な どの ア クチ ュ エ ー タ で
物 理 的 な操 作 を す る わ け で は な い. SoftBotは,必
要 な 操 作 あ る い は そ の 系 列 の 動 的 な 生 成,そ
して 実 行 時 に 得 ら れ
る 情 報 に 基 づ く操 作 の バ ッ ク ト ラ ッ ク な ど の 特 徴 を も っ て い る .
(1)プ ラ ン ニ ン グ エ-ジ
ェン ト
エ ー ジ ェ ン トに詳 細 な手 続 き を与 え な くて も 目標 さ え与 え れ ば ,後 は エ ー ジ ェ ン トが そ の 目標 を達 成 す る 手 続 き を考 え て そ れ を実 行 して くれ る よ う に な れ ば, ユ ーザ の負 担 は大 き く軽 減 さ れ る.こ
の よ うな 「目標 を達 成 す る た め の 手 段 を 自
分 で 考 え る 」 と い う機 能 の実 現 に は,AIの て,こ
プ ラ ンニ ン グ[1]を利 用 で き る.そ
し
の機 能 を もつ 知 的 エ ー ジ ェ ン トを プ ラ ンニ ン グ エ ー ジ ェ ン トと呼 ぶ.ユ
ー
ザ が 手 段 まで 説 明 しな くて も,「何 が欲 しい 」「何 が したい 」 とい う 目標 を 与 え る だ け で,あ
とは エ ー ジ ェ ン トが 自律 的 に 目標 を達 成 して くれ る.プ
ラ ンニ ン グ エ ー
ジ ェ ン トは,ま ず 目標 を達 成 す る た め の手 段 を考 え(プ ラ ン ニ ン グ),そ 手 段 を 実行 す る.SoftBotは
して そ の
典 型 的 な プ ラ ンニ ン グ エ ー ジ ェ ン トで あ る.プ
ラン
ニ ン グ エ ー ジ ェ ン トは 以 下 の よ う な メ リ ッ トを 持 っ て い る . ・目標 に よ る命 令 目標 達 成 の 手 続 き は 不 要 で,目
標 の み を エ ー ジ ェ ン トに 与 え る だ け で よ い.
・適 切 な 行 動 プ ラ ン ニ ン グ で は,オ
ペ ー タ の 系 列 に よ り実 環 境 を シ ミ ュ レ ー トす る.こ
ミ ュ レ ー シ ョ ン に よ る 試 行 錯 誤 に よ っ て,実 成 す る こ と が 可 能 で あ る.そ
して,そ
の シ
際 に行 動 す る前 に 適 切 な プ ラ ン を生
の 適 切 な プ ラ ン を 実 行 す る こ と に よ り,環
境 で 適 切 な 行 動 を と れ る. ま ず,SoftBotで
応 用 さ れ て い る プ ラ ン ニ ン グ に つ い て 簡 単 に 説 明 し て お こ う.
(2)プ ラ ン ニ ン グ プ ラ ンニ ン グ で は,エ
ー ジ ェ ン トの 行 為 を実 行 す べ き対 象 で あ る環 境 が,コ
ン
ピュ ー タ上 の 記 号 表 現 で あ る環 境 モ デ ル を用 い て 記 述 さ れ る .実 際 に は,環 境 を 観 測 した エ ー ジ ェ ン トが 環 境 の 情 報 を環 境 モ デ ル で 記 述 す る(図2.2).環
図2.2環
境モデル
境モデ
ルで 記 述 され た環 境 の 状 態 を,本 章 で は単 に状 態 と呼 ぶ.な
お 環 境 モ デ ル と して
は,― 階 述 語 論 理[1]が 用 い られ る場 合 が ほ と ん どで あ る. 以 下 に プ ラ ンニ ン グの 入 出 力 と手 続 きを ま とめ て 示 す. ・ 入力 − オ ペ レ ー タ:環 境 モ デ ル を変換 す る規 則 .環 境 へ の行 為 を記 述 した もの で あ る.そ の行 為 が 実行 で きる ため の 条件 リテ ラル の リス トで あ る条 件 リス ト,行 為 を実 行 し た後 の 効 果 を表 す リテ ラル の リス トで あ る効 果 リス トに よ り記 述 され て い る.状 態 に おい て 条件 リス ト中の 述 語 が すべ て 成 り立 つ 場 合 に その オペ レー タが 適 用 可 能 に な り,適 用 され る とそ の 結 果 と して 状 態 に効 果 リス ト中の 述 語 が 追加 さ れ る.こ の よ うに して状 態 が 遷 移 してい く. − 初 期 状 態:現 在 の 状態 の環 境 モ デ ル. −
目標 状 態:目 標 で あ る状 態 の 環境 モ デ ル .
・ 出力 − プ ラ ン:初 期 状 態 を 目標 状 態 に変 換 で きる よ うな オペ レー タの 系 列
.
・ 手続 き − 与 え られ た初 期 状 態 を 目標 状 態 に変換 で きる よう な プ ラ ンを探 索 す る.よ く用 い ら れ る手 続 きは,目 標 中 の述 語 を追加 リス トに もつ オペ レー タ を探 し,次 は そ の オペ レー タの 条件 リス ト中 の述 語 を副 目標 と して,そ れ を追加 リス ト中 に もつ オ ペ レー タ を探 す とい う こ とを再 帰 的 に行 うこ とに よ り,後 ろ 向 き に プ ラ ン を生成 す る方 法 で あ る.
上 の 枠 組 に お い て プ ラ ンが 得 られ る と,後 は そ れ に従 っ て環 境 に対 し て行 為 を 実 行 して い け ば,環 境 にお い て も 目標 を実 現 で きる こ と に な る.ま
た,プ
ラ ンニ
ン グ にお い て,目 標 は 環境 モ デ ル の状 態 と して記 述 され る. 以 上 で プ ラ ンニ ン グ の概 要 に つ い て述 べ た.こ れ か らは,SoftBotの
動 きを説 明
して い こ う. (3)SoftBotの ①SoftBotの
動 き 目標
ユ ー ザ は,一
階 述 語 論 理 を 使 っ て 目 標 を 記 述 し,SoftBotに
る.SoftBotの
目 標 の 例 を 図2.3に
で,題
目 がbudgetで
あ り,draftと
示 す.こ
入 力 す る こ とが で き
の 図 で は,“ フ ァ イ ル の タ イ プ が メ モ
い う文 字 を含 ま ない よ うな す べ て の フ ァ イル
を あ る 人 に 届 け よ ” と い う 命 令 を 表 して い る.ま
た,図
中 で,“?a”
は 変 数 a を意
図2.3SoftBotの
目標(参
考 文 献[4]よ
り)
味 す る. こ こ か ら は,“ A 社 の 山 田 さ ん へ 予 算 メ モ を 送 れ ” と い う タ ス ク をSoftBotに 行 させ る と い う 例 を 使 っ て,SoftBotの を 素 直 に命 令 し て も,既 な ぜ な ら,そ
働 き を 見 て い く.ま
ず,こ
実
の タスクの実行
存 の 知 的 エ ー ジ ェ ン トの ほ と ん ど は う ま く遂 行 で き な い.
の 命 令 が 含 む 多 くの曖 昧性 に よ り以 下 の よ うな 問 題 が 生 じ るか らで
あ る. ・ A 社 に い る ど の 山 田 さ んの こ とな の か ? ・ どの メ モ を送 れ ば い い の か ? ・ そ の メ モ を ど の よ う に して(email,fax,remote ・ そ の メ モ が 機 密 書 類 の 場 合,ど ・ 山 田 さ ん が 不 在 の 場 合,ど
printing)送
ればい いのか?
う扱 え ば よ い の か ?
うす れ ば よい の か ?
②命令 の曖昧性 の解消 まずSoftBotが
最 初 に や る こ とは,曖 昧 性 の 解 消 で あ る.命 令 が 指 示 して い る
対 象 を特 定 す る必 要 が あ る.例 え ば,も
し A 社 に 山 田 さ んが 複 数 人 い る場 合,メ
モ の受 理 者 を特 定 しな い とい け ない.フ
ル ネ ー ム が 入 力 され て い ない と きは,即
座 に フ ル ネ ー ム を入 力 す る よ う にユ ー ザ に 要 求 す る とい う方 針 を と る こ と もで き るが,そ
れ は ユ ー ザ を わず らわ せ る こ とに な り好 ま し くな い.そ れ に,も
る と ラ ス トネ ー ム だ け で 相 手 が 特 定 で きる か も知 れ な い.よ
っ て,ま
しか す
ずSoftBot
は,ユ ー ザ に さ ら な る情 報 を質 問 す る前 に 与 え られ た 記 述 で特 定 で き る か 否 か を チ ェ ッ クす る.
SoftBotは,自
分 の もっ て い る知 識 ベ ー ス で何 人 の 山 田 さん が A 社 にい るの か を
知 る こ と が で き る.し
か し,知 識 ベ ー ス が 常 に 完 全 で あ る保 障 は な い の で,そ
識 ベ ー ス で 山 田 さ ん が 一 人 しか 見 つ か ら な い と い っ て,そ か は わ か ら な い.し
か し好 都 合 な こ と に,UNIXコ
れ が必 ず しも本 当 か ど う
マ ン ド “finger [email protected]”
を実 行 す る こ と に よ り す べ て の 山 田 さ ん を 調 べ る こ と が で き,さ ザ に 提 示 して 選 択 し て も ら う こ とが で き る.ま
の知
た,過
らに そ れ ら をユ ー
去 に受 け 取 っ た 電 子 メ ー ル
や 命 令 の 文 脈 を 用 い て 山 田 さ ん を 特 定 す る こ と も で き る だ ろ う.し
か し,こ
のよ
う な 推 論 機 能 を 実 装 す る こ と は そ れ ほ ど 簡 単 で は な い. よ っ て,基
本 的 にSoftBotは
イ ン タ ー ネ ッ ト上 で,与
グ で き る す べ て の 個 人 や 対 象 を 見 つ け よ う と す る.も に ア ク セ ス す れ ば い い が,複
え ば,ユ
し,情
報 源 が 一 つ な らそ れ
数 あ る 場 合 は プ ラ ン を 立 て る.し
記 述 が 適 切 に 制 約 さ れ て い な い 場 合,そ て し ま う.例
え られ た 記 述 と マ ッチ ン
か し,与
え られ た
の プ ラ ン ニ ン グ は 非 常 に コ ス トが か か っ
ー ザ が 山 田 さ ん の 所 属 を 省 略 し た 場 合,SoftBotは
イ ン ター
ネ ッ ト中 の 山 田 さ ん を 探 そ う と す る. し か し,SoftBotが
自分 自 身 で 情 報 を 探 す コ ス トと,質
る コ ス トの バ ラ ン ス を 考 え た 場 合,SoftBotは る 方 が 妥 当 と 考 え ら れ る.よ
ユ ー ザ に 山 田 さ ん の 所 属 を たず ね
っ て,SoftBotは,曖
解 消 に 要 す る コ ス トを 見 積 も り,そ
問 に よ りユ ー ザ を 煩 わ せ
昧 性 解 消 を実 行 す る前 にそ の
れ が 十 分 に 高 い と 自力 で 解 消 す る こ と を止 め,
ユ ー ザ に さ ら な る 情 報 を 質 問 す る. ③ プ ラ ンニ ン グ 山 田 さ ん が 特 定 さ れ る と,SoftBotは
実 際 に メ モ を 送 る 作 業 に 入 る.SoftBotが
電 子 メ ー ル で 送 る こ と に 決 定 し た と し て,今
度 は 山 田 さ ん の メ ー ル ア ドレス が必
要 に な る.ま
た,そ
の 書 類 の フ ォ ー マ ッ トに つ い て も推 論 に よ り 決 定 し な け れ ば
な ら な い.例
え ば そ の 書 類 に 図 が あ る 場 合 で は,LATEXの
PostScriptフ
ァ イ ル の 方 が い い だ ろ う.さ
の 書 類 が 機 密 書 類 の 場 合,セ SoftBotは,命
ソ ー ス フ ァ イル よ り も
らに 山 田 さ ん が 不 在 の 場 合 あ る い は そ
キ ュ リテ ィへ の 対 応 が必 要 とな る .
令 の 目 標 を 達 成 す る た め の 操 作 系 列 を 自 動 生 成 す る た め に,プ
ン ニ ン グ を 用 い て い る.ユ
ー ザ の 目 標 を 記 述 し た 論 理 的 表 現 を 受 け 取 り ,情
ラ
報資
源,コ
マ ン ド,ユ
ー テ ィ リ テ ィ を 記 述 し た オ ペ レ ー タ を 検 索 し て,そ
成 す る 行 為 系 列 を 自 動 生 成 す る.こ
の 目標 を 達
の 生 成 さ れ た 自 動 系 列 が プ ラ ンで あ り,そ
の 自
動 生 成 手 続 き が プ ラ ンニ ングで あ る. プ ロ グ ラ マ に よ り事 前 に 決 め ら れ 固 定 さ れ た 処 理 手 順 に 従 う だ け の 通 常 の プ ロ グ ラ ム と は 違 い,SoftBotの に よ り,シ
プ ラ ン ナ は 自 動 的 に プ ラ ン を 生 成 し て 実 行 す る.こ
ス テ ム 環 境 の す べ て の 状 況,ユ
ーザ の考 え ら れ る すべ て の 命 令 に 対 し
て 事 前 に プ ロ グ ラ ム を 用 意 して お く必 要 が な くな る.SoftBotは,ユ ま な 命 令 と シ ス テ ム 環 境 の さ ま ざ ま な 状 況 に 対 し て,そ プ ラ ン を 生 成 し,実 SoftBotの
行 で き る わ け で あ る.
プ ラ ン ナ は 目 標 を 副 目 標 に 分 割 す る こ と が で き,そ
目 標 が 相 互 作 用 を 持 つ こ と が あ る.例
で Y さ ん に 送 り,か た と す る.こ
ーザの さま ざ
の場 そ の 場 で 対 応 で きる
成 す る こ と に よ り最 終 的 な 目 標 を 達 成 す る こ と が で き る.し し て,副
れ
の 副 目標 を順 に達
か し,難
え ば,「 フ ァ イ ル F を 電 子 メ ー ル
つ フ ァ イ ル F を 削 除 す る 」 と い う 命 令 がSoftBotに
の 命 令 に 対 しSoftBotは,そ
しい 問 題 と
与 え られ
の 目 標 を 副 目 標 a 「フ ァ イ ル F を 電 子
メ ー ル で Y さ ん に 送 る 」 と副 目標 b 「フ ァ イ ル F を 削 除 す る 」 と い う 二 つ の 副 目 標 に 分 割 す る.し
か し,こ
の 二 つ の 副 目 標 は 独 立 に 達 成 で き る わ け で は な く,副
目 標 a は 副 目 標 b よ り先 に 達 成 さ れ な け れ ば な ら な い.な
ぜ な ら,す
れ た フ ァ イ ル は も は や 電 子 メ ー ル で は 送 れ な い か ら で あ る.こ の 因 果 関 係 を 副 目 標 間 の 相 互 作 用 と 呼 ぶ.こ 人 間 に と っ て は 簡 単 な 場 合 も あ る が,コ な い こ と が わ か っ て い る.SoftBotの 互 作 用 を 自 動 的 に 検 出 し,副
で に削 除 さ
の よ うな 副 目標 間
の 相 互 作 用 を う ま く 解 消 す る こ と は,
ン ピュ ー タに と って はそ れ ほ ど簡 単 で は
プ ラ ン ニ ン グ ア ル ゴ リ ズ ム は,こ
の よ う な相
目標 の 達 成 順 序 を調 整 す る こ と に よ り解 決 す る こ と
が で き る. 宣 言 的 表 現 で あ る オ ペ レ ー タ に よ り,SoftBotは 資 源 を 統 合 的 に 扱 う こ と が で き る.例 こ の 意 味 は,あ cshで
複 数 で独 立 した イ ン ター ネ ッ ト
え ば 図2.4は,netfindの
オ ペ レ ー タ で あ る.
る 人 の 情 報 を 知 る た め の オ ペ レ ー タnetfindは,「netfindシ
あ り,netfindの
サ ー バ,そ
の 人 に 名 字 と 名 前,そ
る 都 市 か 所 属 機 関 が わ か れ ば 適 用 可 能 で あ り,そ
ェ ルが
して そ の 人 物 の 住 ん で い
の 適 用 の 結 果,そ
の 人 のユ ーザ
図2.4netfindの
IDや
オ ペ レ ー タ(参
考 文 献[4]よ
マ シ ン が わ か る 」 と い う こ と を 示 し て い る.よ
り)
っ て,netfindを
使 うために
必 要 な 条 件 の 一 つ で あ る 「そ の 人 の 住 ん で い る 都 市 か 所 属 機 関 を 知 る 」 こ とが 副 目標 と な り,そ
れ を達 成 す る た め に 組 織 の構 成 員 の 住 所 デ ー タベ ー ス の 検 索 な ど
他 の コ マ ン ド に 対 応 す る オ ペ レ ー タ を探 す こ と に な る. ま た,オ
ペ レ ー タ は 個 々 に 独 立 に 記 述 で き る た め,追
イ ン タ ー ネ ッ ト資 源 に 対 す る 新 しい コ マ ン ド をSoftBotが に は,そ
加,修
正 が 容 易 に で き る.
利 用 で きる よ う にす る
の コ マ ン ドの オ ペ レ ー タ を 記 述 す る だ け でSoftBotは
そ れ を使 え る よ う
に な る わ け で あ る. 以 上 の よ う に,SoftBotで
はAIの
プ ラ ン ニ ン グ を 無 理 な く応 用 す る こ と に よ り,
少 な い 命 令 だ け で さ ま ざ ま な 情 報 収 集 を 実 行 で き る エ ー ジ ェ ン トを 実 現 し て い る. そ こ で は,プ
ラ ン ニ ン グ の 適 用 に よ っ て 情 報 収 集 工 一 ジ ェ ン トの 機 能 や 能 力 が 明
確 に な り,オ
ペ レ ー タ の 概 念 に よ り情 報 収 集 の コ マ ン ドの 具 体 的 な 記 述 形 式 を 与
え て い る.こ
の よ う に,SoftBotは
し,AI技
イ ン ター ネ ッ トに お け る情 報 収 集 の 課 題 に 対
術 が う ま く応 用 さ れ た 例 と な っ て い る.
2.3.2NaviPlan:ナ
ビゲ ー シ ョン プ ラ ン ニ ン グエ ー ジ エン ト
イ ン タ ー ネ ッ ト,特 にWWWが なWebペ
急 速 に普 及 す る につ れ て,WWWに
ある有用
ー ジ を見 る こ と に よ りあ る概 念 を理 解 す る とい う作 業 が 日常 的 に行 わ れ
る よ う に な っ て い る.つ
ま り,よ
くわ か ら な い単 語 が あ る とそ れ を説 明 したWeb
ペ ー ジ を 調 べ る こ と に よ り,そ の 単 語 の 意 味 を 理 解 す る こ とが で きる.し ユ ー ザ は そ の 有 用 なWebペ
ー ジ がWWW上
か し,
の ど こに あ る の か を知 ら な い た め,
そ れ を探 索 しな けれ ば な らな い.そ の 検 索 に は 一般 に サ ー チ エ ン ジ ン を用 い る が, 検 索 して 得 ら れ たWebペ
ー ジ 中 に さ らに ユ ー ザ が 知 ら ない 概 念 が 含 まれ て い る場
合 も あ り,そ の 場 合 そ の 新 し く現 れ た知 ら ない 単 語 を クエ リ と して 再 度 検 索 エ ン ジ ンで 検 索 す る とい う作 業 を再 帰 的 に繰 り返 して い か な けれ ば な ら な い.当 然 な が ら こ の作 業 はユ ー ザ に と っ て 大 き な負 荷 と な る の で,こ れ らの 一 連 の 作 業 を 自 動 的 に行 って くれ る エ ー ジ ェ ン トが 望 まれ る. しか し,こ の よ う な概 念 理 解 の作 業 全 体 を サ ー チ エ ン ジ ンやWebロ 動 化 す る こ とは で きな い.概 念 理 解 に有 用 なWebペ エ ンジ ンやWebロ
ー ジ を探 す 検 索 作 業 はサ ー チ
ボ ッ トで 自動 化 で きる が,検 索 され たWebペ
未 知 概 念(単 語)を 抽 出 して,さ サ ー チ エ ンジ ンやWebロ
ボ ッ トで 自
ー ジ か ら新 た な
ら に検 索 を行 い,結 果 を ま とめ る とい う作 業 は,
ボ ッ トの 能 力 を越 え て い る.
よっ て,目 標 概 念 に対 して そ れ を理 解 す る の に十 分 なWebペ
ー ジの 系 列 を 自動
生 成 す る 枠 組 で あ る ナ ビゲ ー シ ョ ン プ ラ ンニ ン グ を提 案 され,そ れ がNaviPlan[8] とい うエ ー ジ ェ ン トと して 実 装 され た.ナ
ビゲ ー シ ョ ン プ ラ ンニ ン グ で は,Web
ペ ー ジ を見 て そ の 内 容 を理 解 す る こ と を一 つ の 行 為 と して捉 え,そ れ を プ ラ ン ニ ン グの オ ペ レー タ と して 定 義 して プ ラ ンニ ン グの 枠 組 み を構城 す る.こ ペ レ ー タ の条 件 リ ス トは そ のWebペ あ り,効 果 リス トは そ のWebペ
こで,オ
ー ジ を 読 ん で 理 解 す る た め に 必 要 な知 識 で
ー ジ を読 む こ とに よ り得 られ る 知 識 で あ る.た だ
し,事 前 に必 要 な オ ペ レー タ をす べ て用 意 してお くこ とは現 実 的 に不 可 能 な の で, プ ラ ンニ ング過 程 に お い て必 要 に応 じてWebペ
ー ジか ら オペ レー タ を 自動 生 成 す
る 点 が 特 徴 で あ る. こ の研 究 で は,ナ
ビゲ ー シ ョ ン と は概 念 理 解 を誘 導 す る た め に ユ ーザ に有 用 な
Webペ
ー ジ を提 示 す る こ と を意 味 し,プ ラ ン とは ナ ビ ゲ ー シ ョ ン に有 用 なWeb
ペ ー ジの 系 列 で あ る.ま た,そ の よ うな プ ラ ン を 自動 生 成 す る こ と をナ ビゲ ー シ ョ ン プ ラ ンニ ン グ と呼 ぶ. 先 に も述 べ た よ う に,WWWで 下 の よ う に ま とめ られ る.ナ
のWebペ
ー ジ を使 っ た概 念 理 解 の 手 続 き は以
ビゲ ー シ ョ ン プ ラ ンニ ン グ で は,こ の 手 続 き を プ ラ
ンニ ング の 枠 組 み を使 っ て実 現 す る. ① サ ー チ エ ンジ ン を使 っ て,目 標 概 念 に 関 連 の あ るWebペ ② 検 索 され たWebペ ③ そ のWebペ
ー ジ の う ち,役 に 立 ち そ うな ペ ー ジ を見 て 理 解 す る.
ー ジ にお い て,未 知 の概 念 を 目標 概 念 と して,①
プ ラ ンニ ン グ は,行 為,状 態,問 る が,そ
ー ジ を検 索 す る.
に戻 る.
題 を記 述 す る初 期 状 態,目 標 状 態 で 定 義 され
れ ら は ナ ビゲ ー シ ョ ンプ ラ ンニ ング で は以 下 の よ うな意 味 に な る.
・ 行 為:Webペ ・ 状 態:ユ
ー ジ に 記 述 され て い る概 念 を理 解 す る こ と.
ー ザ の知 識状 態.既
知 の 概 念 を表 す 単 語 の 集 合 に よ り記 述 され る.
・ 初 期 状 態:ユ
ー ザ の 初 期 の 知 識 状 態.
・ 目標 状 態:ユ
ーザ が 理 解 した い 目標 概 念.目
標 概 念 を表 す 単 語 の 集 合 に よ り
記 述 さ れ る. ま た,上 記 の 行 為 に対 応 す る オペ レー タはU-オ ペ レー タ と呼 ばれ,以 下 の よ う に定 義 され る.U-オ
ペ レー タは,あ るWebペ
ー ジ を読 ん だ と きに,そ の ペ ー ジ を
理 解 す る た め に必 要 な条 件 知識 と そ の ペ ー ジ を読 ん だ結 果 学 習 さ れ る知 識 で あ る 効 果 知 識 で 記 述 され る.知 識 状 態 に お い て,条 件 知 識 が 満 た さ れ た場 合 にU-オ ペ レー タが 適 用 され,そ ・ オ ペ レ ー タ:Webペ
の結 果,知 識 状 態 に 結 果 知 識 が 追 加 され る. ー ジ を 見 て,知
識 を 獲 得 す る と い う 行 為 を 表 すU-オ
ペ レ ー タU-
Op(URL). -ラ
ベ ル:Webペ
-条
件:そ
のWebペ
ー ジ のURLで
ラベ ル付 け . ー ジ を 理 解 す る た め に 必 要 な 知 識 で あ る 条 件 知 識C={c
ci}.c は そ の 要 素 の 知 識 で 条 件 語 と 呼 ば れ る. -効 果:そ のWebペ ー ジ を 理 解 す る こ と に よ り得 ら れ る 知 識 で あ る 効 果 知 識E={e1 …,ej}.e
は そ の 要 素 で 効 果 語 と 呼 ば れ る.
1,…,
,
例 え ば,“HTML” タ は,次
に つ い て 説 明 し て い るWebペ
ー ジ か ら 得 ら れ るU-オ
ペ レー
の よ う な 条 件 知 識 と 効 果 知 識 で 構 成 さ れ る.
・ 条 件 知 識:{WWW,イ
ン タ ー ネ ッ ト,マ
ー ク ア ッ プ 言 語,ハ
イ パ ー リ ン ク,タ
グ}
● 効 果 知 識:{HTML}
ナ ビゲ ー シ ョ ンプ ラ ンニ ン グ に は,従 来 の プ ラ ン ニ ング で は 扱 わ れ て い な い 重 要 な問 題 が あ る.そ れ は必 要 なU-オ ペ レー タ を用 意 して お くこ とが 不 可 能 な こ と で あ る.従 来 の ほ とん どす べ て の プ ラ ンニ ン グ研 究 で は,プ オペ レー タの 集 合 は 入 力 と して 与 え られ て い るが,ナ
ラ ン ニ ン グ に必 要 な
ビゲ ー シ ョ ン プ ラ ンニ ン グ
で はU-オ ペ レー タ を事 前 にす べ て 用 意 す る こ とは で きな い.な ぜ な ら,そ れ は 世 界 中 に億 単 位 で存 在 す るWebペ
ー ジ す べ て につ い て U オペ レー タ を記 述 す る こ
とに ほ か な ら な い か らで あ る.よ
っ て,ナ
ビゲ ー シ ョ ンプ ラ ンニ ン グで は,必 要
に な っ た と き に逐 次 的 にU-オ ペ レー タ を 自動 生 成 す る 方 法 を と っ て い る. (1)Webペ
ー ジか ら のU-オ ペ レー タ 生 成
NaviPlanは,Webペ
ー ジ か ら 条 件 知 識 と効 果 知 識 を 自 動 抽 出 す る こ と に よ り,
U-オ ペ レ ー タ を 自 動 生 成 す る.条 仮 定 し て,Webペ
件 語 と 効 果 語 はWebペ
ー ジ に記 述 され て い る と
ー ジ か ら い か に そ れ ら を 抽 出 す る か が 問 題 に な る が,NaviPlan
は 統 合 タ グ 構 造 に よ る 抽 出 とKeyGraphに
よ る キ ー ワ ー ド抽 出 を併 用 す る.
① タ グ構 造 に よ る条 件 語/効 果 語 抽 出 条 件 語 の 抽 出 は,ま
ず 他 のWebペ
とA>の 問 の 単 語)を
そ の 候 補 と す る.し
ら れ て い る わ け で は な い.よ の 抽 出 はWebペ
KeyGraph[6
か し,必
の 単 語)を
述 の よ う にKeyGraphを
候 補 と し,こ
HREF=URL>
要 十 分 な 条件 語 に リ ンク が 張
ー ジ の タ イ トル の 単 語(<TITLE>と間
単 語(と間 ②KeyGraphに
っ て,後
ー ジ に リ ン ク さ れ て い る 単 語(
れ もKeyGraphを
併 用 す る.効 の 単 語)と
果語
見 出 しの
併 用 す る.
よ る キ ー ワ ー ド抽 出 ]と は,単
土 台 の 概 念 を 表 し,そ
語 の 共 起 度 か ら 生 成 し た グ ラ フ の ク ラ ス タ に よ り文 章 の の 土 台 を 統 合 す る 役 割 を す る 単 語 を 取 り出 し,そ
の単 語 を
そ の 文 章 の 主 張 と見 な す キ ー ワ ー ド抽 出 ア ル ゴ リズ ム で あ る. KeyGraphの
具 体 的 な処 理 の 流 れ は,ま ず 対 象 文 書 中 で 同 じ文 に 出 現 す る,つ ま
り共 起 す る こ との 多 い 単 語 の 集 ま りを文 章 の 主 張 の 基 礎 と な る 「土 台 」 の 概 念 と み な す.こ
の 土 台 は通 常 複 数 得 られ る こ とに な るが,そ
の 中 の単 語 の 集 合 を 条 件
語 の 候 補 とす る.次 に,こ
こ で得 られ た土 台 の う ち複 数 の 土 台 の 中 の 単 語 と共 起
す る度 合 の 高 い単 語 を,い
くつ か の 土 台 を足 場 に して 文 章 の 主 張 を 表 す キ ー ワー
ドと見 な す.こ
れ らの キ ー ワ ー ドを集 め て効 果 語 の候 補 とす る.こ の よ うに して
得 ら れ る 条 件 語 と効 果 語 は,KeyGraphに
よ り 「条 件 ら し さ ・効 果 ら し さ」 を表
す 実 数 値 の 重 み と共 に得 る こ とが で き る. KeyGraphは,TF/IDF[7]の ま た,KeyGraphは キ ス トのWebペ
よ う に文 書 集 合 を必 要 と しな い とい う特 徴 を もつ.
文 章 の 構 造 を必 要 と しな い た め,タ
ー ジか らで も条 件 語 と効 果 語 の 抽 出 が 可 能 に な る.
以 上 の タ グ構 造 に よ る重 み とKeyGraphに と り,そ のWebペ
よ る 重 み を加 算 して,上 位 一 定 数 を
ー ジ の条 件 語 と効 果 語 とす る.
(2)Naviplanの NaviPlanの
グ構 造 の な い プ レー ン テ
プ ラ ンニ ン グ 手 続 き プ ラ ンニ ン グ の 入 出 力,制 御 パ ラ メ ー タ を以 下 に示 す.
・ 入力 -目
標 状 態(=目
-初
期 状 態IS:ユ
標 概 念)G0:ユ
ーザ が 理 解 したい 概 念 .
ー ザの 初 期 の知 識 状態 .
・ 制御 パ ラ メ ー タ -深 -Webペ -状 ・ 出力 -プ
さ制 限 l:プ ラ ン の 最 大 長 . ー ジ の 制 限 数 ω ,ビ ー ム 探 索 の 幅 b 態 ノ ー ドの 評 価 関 数 H
ラ ン:U-オ
ペ レ ー タU-Op(URL)の
系列.
・ 停 止条 件 -副
目 標 が 空:ユ
-深
さ の 制 限 で プ ラ ン ニ ン グ を停 止 .
・ ノ-ド H=満
ー ザ の 初 期 の 知 識 状 態 を完 全 に 記 述 .
の評 価 関数 足 さ れ た 副 目標 の 重 み+副
目標 を満 足 した効 果 語 の重 み
U-オ ペ レ ー タ を 用 い た プ ラ ン ニ ン グ は,後
ろ 向 き の ビ ー ム 探 索 で 行 わ れ る(図
2.5).ま
た ノ ー ドの 展 開 は,ま
ず 副 目標 が ク エ リ と し て 検 索 エ ン ジ ン に 渡 さ れ,検
索 さ れ た 上 位 ω の ペ ー ジ か ら そ れ ぞ れU-オ れ る.そ
し て,そ
ペ レー タ が 前 述 の 手 続 き に よ り生 成 さ
の オ ペ レ ー タ を用 い て 次 の 深 さ の ノ ー ドが 生 成 さ れ る(図2.6).
図2.5ビ
図2.6ノ
ー ム探 索
ー ドの 展 開
NaviPlanはPerlで
実 装 さ れ て お り,ユ
ザ を 用 い て い る.一 用 し て い る が,そ がWebペ
度 フ ェ ッ チ し たWebペ
ラ ウ
ー ジ を残 して お きキ ャ ッ シュ と して利
れ で も 4ス テ ッ プ の プ ラ ン 生 成 に30∼60分
か か る.ほ
とん ど
ー ジ の 獲 得 の 時 間 で あ る.
図2.7NaviPlanに
図2.7に,目
よ り生成 され た プ ラ ンの例
標 概 念 “concept formation”(概
を示 す.Webペ
念 形 成 〉,深 さ が 4の 場 合 の 実 行 例
ー ジ 1は 目標 概 念 に 直 接 結 び つ く も の で あ り,概
基 に 説 明 し て い る.し ILPに
ー ザ イ ン タ フ ェ ー ス と してWebブ
つ い て は,Webペ
か し,ILP自 ー ジ2∼4の
体 に つ い て の 説 明 はWebペ
念 形 成 をILPを ー ジ 1 に は な い.
う ち 3 で 詳 し く説 明 さ れ て い る.ま
た,4
に は 関 連 す る 機 械 学 習 の 論 文 ア ブ ス トラ ク トが 紹 介 さ れ て い る.1,3,4のWeb ペ ー ジ を 読 む こ と に よ っ て “概 念 形 成 ” は も と よ り,ILP,機
械 学 習 との 基 礎 的 な
関 係 ま で を 系 統 的 に 理 解 で き る こ と が わ か る. (3)評
価実 験
次 に,NaviPlanの
性 能 を 実 験 に よ り評 価 し た.NaviPlanで
の ノ ー ドの 展 開 に
お け る 検 索 エ ン ジ ン と以 下 の 実 験 で 比 較 に 用 い る サ ー チ エ ン ジ ン と し て,現 も広 範 囲 に 検 索 可 能 な メ タ サ ー チ エ ン ジ ン の 一 つ で あ るMetaCrawlerを
在 最
用 い た.
①U-オ ペ レ ー タ 生 成 の 精 度 U-オ ペ レ ー タ の 精 度 はNaviPlanの し て,得
ら れ るU-オ
か を 評 価 し た.方
性 能 に 大 き く 影 響 す る.そ
こで予備 実験 と
ペ レ ー タ が ど の 程 度 条 件 知 識 と効 果 知 識 を 正 し く表 し て い る
法 は,NaviPlanが
生 成 した オ ペ レ ー タ の 条 件 知 識 と効 果 知 識 の
う ち 何 パ ー セ ン トが 正 し か っ た か と い う適 合 率 を 人 間 の 判 断 で 評 価 し た.そ
の結
果,条
ンダ
件 知 識 で は74%,効
果 知 識 で は68%の
結 果 が 得 ら れ た.こ
の 値 は,ラ
ム に 条 件 知 識 あ る い は 効 果 知 識 を 生 成 し た 場 合 よ り も非 常 に 高 い. ②NaviPlanの
性 能 評価
次 に,NaviPlanの
性 能 評 価 の た め に,被 験 者 に よ る 実 験 を 行 っ た.被
ピ ュ ー タ科 学 の 分 野 か ら 目 標 概 念 を い く つ か 考 え て も ら い,そ サ ー チ エ ン ジ ンMetaCrawlerの
両 方 に 入 力 して プ ラ ン を 得 る.た
の 場 合 は,ヒ
ッ ト リ ス トの 上 位 ペ ー ジ を プ ラ ン と し た.そ
ン 中 のWebペ
ー ジ を 上 か ら順 に 読 ん で も ら い,被
ンの 数 を 調 べ た.そ が わ か っ た.さ
の 結 果,NaviPlanの
NaviPlanは,多
れ ら をNaviPlanと だ し,MetaCrawler
して,被
験者 に各 プラ
験 者 が 正 しい 理 解 を 示 し た プ ラ
性 能 がMetaCrawlerを
ら に よ り難 し い 目標 概 念 で は,NaviPlanに
ジ を 複 数 読 み 進 め る こ と に よ り,目
験者 にコン
上 回っている こと よ り得 ら れ たWebペ
標 概 念 を 理 解 で き る こ と が わ か っ た.よ
く の 目 標 概 念 を 少 な い ペ ー ジ 数 で ユ ー ザ に 理 解 さ せ,し
ー っ て,
か も高 度
な 目 標 概 念 も複 数 の ペ ー ジ を 効 果 的 に 繋 い で ユ ー ザ に 深 く 理 解 さ せ るWebペ
ー ジ
の 系 列 を 収 集 で き る エ ー ジ ェ ン トで あ る と い う 結 論 に な っ た. ナ ビゲ ー シ ョ ン プ ラ ン ニ ン グ は,現
状 の サ ー チ エ ン ジ ン で は 対 応 で き な い,あ
概 念 を 理 解 す る た め の 階 層 的 で 組 織 的 な 知 識(Webペ う情 報 収 集 に 取 り組 ん だ 初 の 試 み で あ る.今
後,WWWに
ー ジ 系 列)を
収 集 す る とい
お い て サ ーチ エ ン ジ ン
を 越 え る 情 報 収 集 の 方 向 性 の 一 つ を 示 し て い る 点 で 注 目 に 値 す る.ま ニ ン グ 技 術 と し て は,オ
る
た,プ
ラン
ペ レー タ を必 要 に応 じて 自動 生 成 しな が らプ ラ ンニ ン グ
を 実 行 し て い く と い う 新 し い タ イ プ の 枠 組 み を 提 案,実
現 して い る 点 が 興 味 深 い.
2.4 残 された課題 と今後の展望 本 章 で 紹 介 して きた情 報 収 集 エ 一 ジ ェ ン トシス テ ム は,WWWに
お け る情 報 の
収 集 お よ び抽 出 をエ ー ジ ェ ン トに よ り 自動 化 す る 試 み で あ り,機 械 学 習,プ ニ ン グ な ど のAI技
ラン
術 の応 用 に よ り,そ の 自動 化 を実 現 して い る.し か し,こ の
よ うな研 究 もま だ ま だ始 ま っ た ば か りで あ り,解 決 され て い な い 課 題 も残 っ て い る.以 下 に,本 章 で 紹 介 して きた 研 究 例 を も とに,考
え ら れ る課 題,今
後の 方向
性 に つ い て あ げ て み る. ・WWWな
らで はの 新 しい方 法 論
従 来 の 手 法 を 素 直 に応 用 した研 究 が 多 い.実
問題 に 応 用 す る こ と に よ り,方 法
論 的 に も新 た な 手 法 が 開 発 され る こ とが,基 礎 研 究 と応 用 研 究 の 理 想 的 な関 係 と 考 え られ る.よ
って,WWWを
扱 う こ と に よ り,こ れ ま で のAIに
はない方法論
が 新 た に 開発 され る こ とが 望 ま しい. ・限 定 さ れ た 実 験 環 境 実 験 が,あ
るWebサ
イ ト内 な ど に限 定 さ れ た もの が 多 い.ネ
フ ィ ッ ク を増 す こ とか ら慎 重 に な るべ きで は あ るが,WWW全
ッ トワ ー ク トラ 体 での実験が 重要
で あ る. ・実 用 的 な ア プ リケ ー シ ョ ン AIの 応 用 研 究 の プ ロ グ ラ ムが 商 用 に な り,ベ ンチ ャー を起 こせ る ぐ ら い の研 究 は ま だ少 な い.今 後,わ が 国 で も十 分 に可 能 性 が あ る と考 え られ る の で,企 業,大 学 を問 わ ず そ の よ う な意 識 を持 つ こ とが 重 要 で あ る.
イ ン ター ネ ッ トやWWWに
お け る情 報 の収 集,情 報 の 抽 出 で は,こ れ ま で のAI
や エ ー ジ ェ ン ト技 術 の成 果 を効 果 的 に 応 用 で きる 部 分 も ま だ まだ 残 っ て い る だ ろ う.今 後 さ らに,企 業 や ベ ンチ ャ ー な どの ニ ー ズ と要 素 技 術 の研 究 者 の シ ー ズ が う ま くマ ッチ した 形 で 情 報 収 集 エ ー ジ ェ ン トの研 究 開 発 が 進 む こ とが 期 待 され る.
参考文献 [1]馬場 口 登,山 田誠 二 『人 工 知 能 の 基 礎 』 昭 晃 堂,1999 [2]M.Craven,D.DiPasquo,D.Freitag,A.McCallum,T.Michell,K.Nigam,and S.Slatterym,“Learning Web”,Proceedings
to extract of the
Fifteenth
symbolic National
knowledge
from
Conference
on
the
Artificial
Wrold
Wide
Intelligence,
pp.509-516,1998. [3]R.B.Doorenbos,O.Etzioni,and agent on
for the
World-Wide
Autonomous
Web”,Proceedings
scalable
comparison-shopping
of the First International
Conference
Agent,pp.39-48,1997.
[4]O.Etzioni
and
- nication
D.S.Weld,“A
D.Weld,“A
SoftBot-based
interface
to
the
Internet”,Commu
of the ACM,Vol.37,No.7,pp.72-76,1994.
[5]古
川 康 一,尾
崎 知 伸,植
[6]大
澤 幸 生,N.E.Benson,谷
合 に よ る キ ー ワー
野 研
『帰 納 論 理 プ ロ グ ラ ミ ン グ 』 共 立 出 版,2001 内 田 正 彦
「Keygraph:単
語 共 起 グ ラ フの 分 割
・統
ド 抽 出 」 電 子 通 信 学 会 誌 論 文 誌,Vol.J82-D-I,No.2,pp.
391-400,1999 [7]徳
永 健 伸
『情 報 検 索 と 言 語 処 理(言
[8]山
田 誠 二,大
澤 幸 生.「WWWに
語 と計 算
第 5 巻)』
お け る概 念 理 解 の た め の ナ ビゲ ー シ ョ ンプ ラ
ニ ン グ 」 人 工 知 能 学 会 誌 ,Vol.14,No.6,pp.1125-1133,1999 [9]山
田 誠 二
東 京 大 学 出 版 会,1999
『知 的 エ ー ジ ェ ン ト』 昭 晃 堂,2001
第3 章 WWW情
報 統合
3.1WWW情
報統 合 と は
イ ン タ ー ネ ッ ト(Internet)は 急 速 に 社 会 に浸 透 して お り,い
まや わ れわ れの
日常 生 活 を支 え る イ ン フ ラ ス トラ ク チ ャ ー の 一 つ とな りつ つ あ る.そ WWW(World
Wide
Web)は
の 中で も
最 も人 気 の 高 い 技 術 の 一 つ で あ り,ビ ジ ネ ス,報 道,
研 究 教 育,政 府 や 地方 公 共 団体,個 人 や グル ー プ な どの情 報 発 信 や 共 有 を支 援 す る 手 段 と して,多 様 で 膨 大 な 量 の 情 報 を イ ン ター ネ ッ ト上 に提 供 して い る.WWW が 銀 行 オ ン ラ イ ン シス テ ムや 鉄 道 の 座 席 予 約 シ ス テ ム な どの 従 来 の 分 散 処 理 シ ス テ ム と大 き く異 な っ て い る の は,ボ
トム ア ッ プ的 に シ ス テ ム が 構 築 され て い る点
で あ る.す な わ ち,シ ステ ム全 体 を管 理 す る組 織 や 機 構 は 存 在 せ ず,イ ン タ ー ネ ッ トに接 続 され た コ ン ピ ュー タ上 にWebサ ム に 組 み 込 まれ,全
ー バ を立 ち上 げ るだ け で た ち ま ち シ ス テ
世 界 に 向 け て 情 報 発 信 す る こ とが 可 能 に な る.し
相 互 に 関連 す る 情 報 が 複 数 の独 立 なWebサ
た が っ て,
イ トに分 散 して存 在 す る こ と も,し ば
しば 見 られ る こ とで あ る. 関 連情 報 を結 びつ け る手 段 と して は,個 人利 用 者 レベ ル で はWebブ
ラ ウザ が 提
供 す る ブ ックマ ー ク機 能 を用 い た り,ハ イパ ー リ ンク を利 用 した リ ンク集 が作 られ
た り し て い る.ま
た,ビ
ジ ネ ス レ ベ ル で はNetscape(http://www.netscape.com/)
の よ う に ブ ラ ウ ザ 立 ち 上 げ 時 に 表 示 さ れ るWebペ
ー ジ を提 供 す る ポ ー タル サ イ ト
(portal site)や,Yahoo!(http://www.yahoo.co.jp/)の を 集 め た デ ィ レ ク ト リ サ ー ビ ス(directly は,ハ
よ う に さ ま ざ ま な 関 連URL
service)が
立 ち 上 げ ら れ て い る.さ
らに
イ パ ー リ ン ク を 自 動 的 に た ど る こ と の で き る ソ フ ト ウ ェ ア ロ ボ ッ トを 利 用
し てWebペ
ー ジ を 収 集 し,そ
れ に 含 ま れ る キ ー ワ ー ドや リ ン ク 関 係 を 手 が か り
に 関 連 付 け を 行 うgoo(http://www.goo.ne.jp/)やgoogle(http://www.google.com) の よ う な サ ー チ エ ン ジ ン(search る.し
か し な が ら,こ
engine)は,さ
れ ら の サ ー ビ ス や ツ ー ル は 関 連 す るWebペ
URL)の
集 合 を 提 供 し て く れ る だ け で,そ
い る.し
た が っ て サ ー チ エ ン ジ ン が 数 百 ,時
た と し て も,そ
ら に手 の込 ん だ 手 段 で あ る とい え
に よ っ て は 数 千 の 関 連URLを
合(information WWW情 現 在,国
ン タ ー ネ ッ ト上 に 分 散 し て 存 在 す る
報 統 合 の 一 例 と し て,航
空 会 社 の 空 席 照 会 サ ー ビ ス を 取 り上 げ よ う .
内 航 空 便 の 空 席 情 報 は 航 空 会 社 ご と に 管 理 さ れ,個 え ば,東
京-大
つ の 航 空 会 社 のWebサ
数 のWebサ
別 のWebサ
イ トに 同 じ よ う な ク エ リ を 繰 り 返 し た が っ て,こ
の よ う な 同種 の
イ トか ら の 情 報 を ま と め 上 げ て 一 度 に 検
索 結 果 を 表 示 し て く れ る よ う な サ ー ビ ス が あ れ ば 有 用 で あ る(最 な 目 的 の た め に 「国 内 線.com(http://www.kokunaisen.com)」
近 で は この よ う
の サ ー ビス が 開 始 さ
ら に は 異 種 の 情 報 サ ー ビ ス も統 合 す る こ と が で き れ ば,よ
ビ ス を 生 み 出 し て く れ る だ ろ う.例 テ ル の 情 報,さ
イ トに よ
阪 間 の 全 フ ラ イ トの 空 席 状 況 を 確
行 わ な け れ ば な ら な い と い う も ど か し さ が あ る.し 情 報 サ ー ビ ス に 関 し て は,複
報統
術 が 注 目 さ れ て い る[1].
り情 報 提 供 が な さ れ て い る.例
れ た).さ
たが っ
合 し,そ の 付 加 価 値 を 高 め て 利 用 者 に 提 供 す るWWW情
integration)技
認 した い 場 合 に は,三
出力 し
の 内 容 を確 か め
き に そ れ は 大 変 骨 の 折 れ る 作 業 と な る .し
て こ の よ う な 作 業 を 代 行 す る 手 段 と して,イ 報 を 収 集,統
確 には
こ か ら先 の 処 理 は 利 用 者 に 委 ね ら れ て
の 一 つ 一 つ の ペ ー ジ を ブ ラ ウ ザ に よ り表 示 し,そ
る の は 利 用 者 の 役 割 で あ り,と
Web情
ー ジ(正
り便 利 な サ ー
え ば 航 空 便 の 情 報 だ け で な く,鉄 道 の 情 報,ホ
ら に は 観 光 地 情 報 な ど を 組 み 合 わ せ る こ と が で き る な ら ば,イ
ン
タ ー ネ ッ ト上 に あ る 最 新 の 情 報 を 利 用 し た 旅 行 プ ラ ン を 提 供 す る こ と が 可 能 に な
り,「12月30日
に 大 阪 を 出 発 し て,5 万 円 以 内 で 2泊 3 日 の ス キ ー が 楽 し め る よ
う な 旅 行 プ ラ ン を 教 え て 」 と い う よ う な ク エ リ に 答 え る こ と が で き る よ う に な る. 一 般 にWWW情
報統合 は
,以 下 の よ う な プ ロ セ ス か ら成 り立 っ て い る と い え る.
①
必 要 な 情 報 が 記 述 され て い るWebペ
②
収 集 したWebペ
③
抽 出 した 情 報 を 関 連 付 け る.
ー ジ を収 集 す る.
ー ジ か ら必 要 な情 報 を抽 出す る.
しか しな が ら,そ の そ れ ぞ れ の プ ロ セ ス の実 現 は 容 易 で は な い.① 必 要 なWebペ
に 関 して は
ー ジが ど こに 存在 す る か わ か らな い とい う問 題 が あ る.先 に も述 べ
た よ う に 自律 分 散 的 に情 報 が 管 理 さ れ て い るWWWで
は,ど
の よ うな 情 報 が ど
こ に存 在 す る の か を完 全 に示 す よ う な デ ィ レ ク トリサ ー ビ ス を構 築 す る こ とは 不 可 能 で あ る.こ の 問 題 を部 分 的 に 対 処 す る た め に サ ー チ エ ンジ ンが 開発 さ れ て い るが,現 在 の と こ ろ そ の 精 度 は十 分 で あ る とは い えな い.例
え ば,牛
肉 の料 理 法
を知 りた い と思 っ て 「牛 肉」 をサ ー チ エ ン ジ ン に入 力 して も,料 理 法 だ け で な く, 畜 産,レ ス トラ ン,シ ョ ッ ピ ン グ な ど,さ ま ざ まなWebペ た が って 現 在 の とこ ろ は,あ
らか じめ 統 合 可 能 なWebサ
ー ジが 出 力 さ れ る.し イ トを指 定 して お き,そ
の サ イ トか らの 情 報 の み を統 合 の対 象 にす る手 法 が 一 般 的 で あ る. ② に関 して は,Webペ 問題 が あ る.Webペ
ー ジか ら必 要 な情 報 を抜 き出 す こ とは容 易 で は な い とい う
ー ジ は テ キ ス ト文 書 にHTML(Hyper
Text Markup
で 定 義 さ れ る タ グ を埋 め込 ん だ もの で あ る と見 な す こ とが で きる.し HTMLで
Language) か しな が ら
定 義 され る タ グ は文 字 の 大 き さや ス タ イル,レ イ ア ウ トな ど と い っ た文
書構 造 の表 現 を 目 的 と した もの で あ り,文 字 列 が何 を表 して い るか とい う意味 的 な 情 報 の 表 現 を 目 的 と して い な い.し
た が っ てHTMLに
基 づ くWebペ
ラ ウザ を介 して 人 間 が そ の 内 容 を理 解 す る こ とは容 易 で あ っ て も,コ に よ って 機 械 的 に 処 理 す る こ と は容 易 で は な い.一 方,タ
ー ジ は,ブ ンピュー タ
グの 位 置 関係 に規 則 性
が存 在 す る な らば,そ れ を手 が か りに必 要 な デ ー タ を抜 き出す こ と も可 能 で あ り, そ れ は情 報 抽 出 ラ ッパ ー(wrapper)の HTMLに
代 わ るWebペ
主 要 な機 能 の一 つ とな っ て い る.最 近 で は,
ー ジ記 述 言 語 と して,XML(eXtensible
が導 入 され つ つ あ る.XMLで
はWebペ
Markup
Language)
ー ジの 設 計 者 が タ グ を 自由 に定 義 す る こ
と が 可 能 で あ り,意
味 的 な タ グ も 定 義 可 能 で あ る の で,ラ
易 に な る と期 待 さ れ て い る.情 ③ は,本
ッパ ー の 開 発 は よ り容
報 抽 出 の 技 術 に 関 して は3.2に
章 で 扱 う 中 心 的 話 題 で あ る.②
お い て 取 り上 げ る.
に お い て 抽 出 し た 情 報 を 関 連 付 け,そ
れ を 検 索 可 能 な よ う に 統 合 す る た め の 技 術 に つ い て 述 べ る.3.2で
は情 報 統 合 の
過 程 を 手 続 き 的 に 記 述 す る 二 つ の ブ ロ グ ラ ミ ン グ 言 語WebSQL[2]とWebL[3]を 紹 介 す る.WebSQLで 現 さ れ,目
は,WWWは
ペ ー ジ と リ ン クか ら な る有 向 グ ラ フ と して 表
的 とす る ペ ー ジ の 内容 とペ ー ジ を 結 び付 け る リ ン ク構 造 に基 づ い た ク
エ リ が 可 能 に な る.こ
の よ う な ク エ リ の 例 と し て は,「 朝 日 新 聞 のWebサ
イ トの
トップ ベ ー ジ か ら 5リ ン ク以 内 で た どれ るす べ て の 画像 フ ァイ ル を検 索 しな さ い」 と い っ た も の が あ げ ら れ る.WebSQLで の に 対 し て,WebLは
は情 報 抽 出 の 単 位 が ペ ー ジ レベ ル で あ る
ペ ー ジ 内 か ら 必 要 な 部 分 を 抽 出 す る こ と が 可 能 で あ る.例
え ば,「 朝 日 新 聞 のWebサ
イ トの ト ッ プ ペ ー ジ か らタ
抽 出 し な さ い 」 と い っ た 要 求 に 応 え る こ とが で き,情
グ で 囲 まれ た部 分 を
報 抽 出 ラ ッパ ー と し て の 要
求 を 満 た す こ と が で き る. 3.3は
ラ ッパ ー を用 い て 個 別 の 情 報 源 か ら 情 報 抽 出 を行 い,そ
タ(mediator)を
用 い て 統 合 す る こ と で,あ
れ らを メ デ ィエ ー
た か も一 つ の デ ー タベ ー ス と して利 用
可 能 に す る 二 つ の シ ス テ ムTSlMMlS[3]とARlADNE[4]を
紹 介 す る.こ
こで は情 報
統 合 の 過 程 を 手 続 き 的 に 記 述 す る の で は な く,要 求 を 宣 言 的 に 記 述 す る だ け で,そ の 具 体 的 な 統 合 処 理 は メ デ ィ エ ー タ が 代 行 し て く れ る.こ
の よ う な デー タベ ー ス ア
プ ロ ー チ の 課 題 は 情 報 の 構 造 や 意 味 の 異 な る 異 種 情 報 源 を い か に して 統 合 す る か と い う 点 で あ る.こ
の 問 題 に対 し て,TSIMMISで
と い う 共 通 デ ー タ 構 造 を,ARIADNEシ
はOEM(Object
ス テ ム で はSIMSオ
Exchange
Model)
ン トロ ジ(ontology)
を 用 い る こ と に よ り対 処 し て い る. 3,4で
は,さ
RETSlNA[6]を
ら に 高 度 な 形 態 の 情 報 統 合 を 目 指 す 二 つ の シ ス テ ム,BlG[5]と 紹 介 す る.BIGは
単 にWeb情
報 の 統 合 だ け で な く,情
択 や ア ク セ ス の 順 序 付 け と い っ た プ ラ ン ニ ン グ(planning)も ト(information 源 の 信 頼 度,利
agent)で
あ る.こ
報 源の 選
行 う情 報 エ ー ジ ェ ン
れ に よ り,情 報 源 へ の ア ク セ ス 時 間 や 経 費,情
報
用 者 が 求 め る 情 報 の 量 や 質 を考 慮 し た 情 報 収 集 を行 う こ と が 可 能 に
な る.ま
たRETSINAは,情
報 源 へ の ア ク セ ス を 行 う情 報 エ ー ジ ェ ン ト,目 的 に 応
じて 情 報 工 一 ジ ェ ン トか ら の 情 報 を 統 合 す る タ ス ク エ ー ジ ェ ン ト(task
agent),利
用 者 の 要 求 や 好 み に 応 じた 情 報 提 供 を行 う イ ン タ フ ェ ー ス エ ー ジ ェ ン ト(interface agent)か
ら な る マ ル チ エ ー ジ ェ ン トシ ス テ ム(multiagent
う な ア ー キ テ ク チ ャ を 採 用 す る こ と に よ り,よ
system)で
あ る .こ
の よ
り大 規 模 で 柔 軟 な 情 報 統 合 を 実 現
で き る と 期 待 さ れ て い る.
3.2WWW情
報統合のための プログラミング言語
本 節 で は情 報 統 合 の 過程 を手 続 き的 に記 述 す る二 つ の プ ロ グ ラ ミン グ 言語WebSQL[2]とWebL[3]を
紹 介 す る.
3.2.1WebSQL:ペ
ー ジ間 構 造 を利 用 した情 報統 合
WebSQL[2]は
トロ ン ト大 学 で 開 発 さ れ た,WWWか
ク な 言 語 で あ る.Javaに edu/∼websql/よ WebSQLで カ ー(リ
に はWebペ (type),最
よ り記 述 さ れ た ク ラ ス ラ イ ブ ラ リ はhttp://www
ン ク)に
図3.1に
.cs.toronto.
示 す よ う に,ド
キ ュ メ ン ト(ペ
ー ジ)と
ア ン
関 す る 二 つ の リ レ ー シ ョ ン か ら な る 関 係 デ ー タ ベ-ス(Relational し て モ デ ル 化 して い る.ド
ー ジ のURL(url),タ 終 更 新 日(modif)の
シ ョ ン に は 元 のURL(base),ラ さ れ て い る.こ
イ
り入 手 可 能 で あ る. はWWWを
Detabase)[11]と
ら情 報 抽 出 を 行 うSQLラ
の よ う にWeb情
キ ュ メ ン ト(Document)リ
イ トル(title),文
書(text),長
属 性 が 記 録 さ れ て お り,ア ベ ル(label),リ
レー シ ョ ン
さ(length),タ
ン カ ー(Anchor)リ
ン ク 先 のURL(href)の
報 源 を モ デ ル 化 す る こ と に よ り,キ
を 手 が か り と し て 検 索 を 行 う サ ー チ エ ン ジ ン と異 な り,Webペ
イプ レー
属性 が記述 ー ワ ー ドの み
ー ジの 位 置 関係 を
考 慮 し た検 索 が 可 能 に な る. Webペ
ー ジ が 図3.1に
の よ う なSQLク
示 す 関 係 デ ー タ ベ ー ス と し て 登 録 さ れ て い る 場 合 に,次
エ リ が 可 能 に な る.
ドキ ュ メ ン ト(Document)
ア ン カ-(Anchor)
図3.1WebSQLに
SELECT
お け るWWWの
モ デ ル化
d1.url,d2.url
FROM
Document
WHERE
d1,Document
d2
d1.title=d2.title AND NDT(d1.url=d2.ur1)
SQLは
関 係 デ ー タ ベ ー ス を 操 作 す る 言 語 と し て,最
も の で あ る.デ WHERE行
ー タ 検 索 を 行 う 最 も 基 本 的 なSQL文
か ら 構 成 さ れ,SELECT行
書d1とd2に
は,Documentリ
対 し て,タ
に は 検 索 の 条 件 を 指 定 す る.し
イ トル は 同 じで あ る が 相 異 な るURLを
索 の 対 象 と な るWebペ
も つWebペ
か し な が ら イ ン タ ー ネ ッ ト上 で のWebペ
の 場 合 に は,既
ー ジ ー
存 のサ ー チ エ ンジ ン を
利 用 し た 以 下 の よ う な ク エ リ と し て 記 述 す れ ば よ い.
FROM
た
ー ジ を あ ら か じ め 関 係 デ ー タ ベ ー ス と して
登 録 し て お く こ と が 無 理 な 場 合 も 多 い.そ
SELECT
に
レ ー シ ョ ン に 存 在 す る 任 意 の 二 つ のweb文
の 対 を 求 め る ク エ リ を 表 し て い る.し ジ 検 索 で は,検
はSELECT行,FROM行,
に は 検 索 す べ き属 性 の リ ス ト,FROM行
は 検 索 の 対 象 と な る リ レ ー シ ョ ン,WHERE行 が っ て 上 記 のSQL文
も一般 的 に利 用 さ れ て い る
d1.url,d2.url Document
d1
SUCH
THAT
d1
MENTIONS″information
integration″,
Document
d2
SUCH
THAT
d2
MENTIONS″information
integration″
WHERE
d1.title=d2.title
AMD NOT(d1.url=d2.ur1)
こ の クエ リ が 実 行 さ れ る と,"information ワ ー ドと して サ ー チ エ ン ジ ン に 与 え ら れ,そ シ ョ ンが 構 成 さ れ る.そ
の 後,条
integration"に
あたる部分が入力キー
の 検 索 結 果 に よ っ てd1とd2の
件 に あ っ たWebペ
リ レー
ー ジが クエ リ の結 果 と して 返
さ れ る. さ ら にWebSQLで
は,Webペ
ー ジ の 巡 回 を 行 う以 下 の よ う な ク エ リ を 書 く こ と
が で き る. SELECT
d.url,d.title FROM
Document
d
SUCH
THAT″http://www.osaka-cu.ac.jp″
こ れ は,http://www.osaka-cu.ac.jpか カ ル サ ー バ 内 の 全Webペ ク エ リ の 中 で,"→"は う にWebペ
→d
ら一 つ の リ ンク で た どる こ との で きる ロ ー
ー ジ の タ イ トル とURLを
取 得 す る ク エ リ で あ る.こ
「ロ ー カ ル サ ー バ 内 の 一 つ の リ ン ク 」 を 表 し て い る.こ
ー ジ を 巡 回 す る た め の 他 の オ ペ レ ー タ と し て は,"⇒"は
へ の 一 つ の リ ン ク 」,"→*"は て い る.し
「外 部 サ ー バ
「ロ ー カ ル サ ー バ 内 で 2 回 の リ ン ク を た ど っ た 後,
外 部 サ ー バ へ の 一 つ の リ ン ク を 1回 た ど る 」 こ と を 意 味 し て い る.こ
中 に あ るWebペ
の よ
「ロ ー カ ル サ ー バ 内 で 任 意 の 回 数 の リ ン ク」 を 表 し
た が っ て"->->⇒"は
現 を 用 い る と,大
の
の よ うな 表
阪 市 立 大 学 の 情 報 工 学 科 の サ イ ト(www.info.eng.osaka-cu.ac.jp) ー ジ の 中 で,タ
に エ ー ジ ェ ン ト(agent)と
イ トル に イ ン タ ー ネ ッ ト(internet)を
含 み,本
文
い う用 語 を含 む もの を求 め る ク エ リ は 以 下 の よ う に書
け る. SELECT
d.url
FROM WHERE
Document d.title
3.22WebL:ペ WebL[3]は,Compaqに
d
SUCH
THAT″http://www.info.eng.osaka-cu.ac.jp″
CONTAINS〝internet″AND
→*d,
d.textCONTAINS″agent"
ー ジ 内構 造 を利 用 した情 報 統 合 よ り開 発 さ れ たWeb操
の ソ ー ス はhttp://www.research.Compaq.com/SRC/WebL/よ
作 を 自 動 化 す る 言 語 で あ り,そ り 入 手 可 能 で あ る.
WebSQLはWebペ
ー ジ の 外 部(リ
に 対 し,WebLで
はWebペ
ン ク)構 造 に 基 づ く検 索 を 目 的 と し て い た の
ー ジ の 内 部(タ
で あ る.主
な構 成 要 素 と し て,Webペ
と,Webペ
ー ジ か ら情 報 を 抽 出 す るmarkup
るWebペ
グ)構 造 も処 理 の 対 象 に す る ク エ リ 言 語
ー ジ へ の ア ク セ ス を行 うservice algebraが
あ る.こ
combinator
れ ら に よ り,あ
ー ジ の 中 か ら特 定 の 部 分 を 抽 出 す る よ う な ク エ リ を 記 述 す る こ とが 可 能
に な る.ま
ず,service
combinatorに
つ い て 説 明 し よ う.例
え ばCGI形
式 のWeb
ペ ー ジ へ の ア ク セ ス は 以 下 の よ う に 記 述 さ れ る.
getpage(string,[.param1=val1,param2=val2,….], [.header1=val1,header2=val2.]) postpage(string,[.param1=wal1,param2=val2,….], [.header1=val1,header2=val2.])
getpage(あ GET(あ
る い はpostpage)は,stringで
る い はPOST)プ
たWebペ
ー ジ が 返 り値 と な る.第
はHTTPに
示 さ れ るURLに
対 し てHTTPの
ロ ト コ ル を 用 い て ア ク セ ス す る.関数 で あ り,指 二 引 数 はCGIで
用 い る パ ラ メ ー タ,第
お け る ヘ ッ ダ 情 報 で あ り,こ れ ら は オ プ シ ョ ン で あ る.CGI形
い 一 般 のWebペ
ー ジ の ア ク セ ス は,第
ば,AltaVistaサ
ー チ エ ン ジ ン を"java"で
定 され 三 引数 式 で な
二 引 数 と第 三 引 数 を省 略 す れ ば よ い.例 検 索 す る 場 合 は,以
え
下 の よ う に な る.
page:=getpage(″http://www.altavista.com/cgi-bin/query″, [.q=″Java″,k1=″XX″,pg=″q″,Translate=″on″.])
この 検 索 結 果 は 変 数pageに
代 入 され る.ま た,検 索 を制御 す る ため の コマ ン ド
と して は 以 下 の もの が 用 意 さ れ て い る. ●
逐 次 実 行S?T:Sの
実 行 が 失 敗 す れ ば,T
を 実 行 す る.
page:=getpage(″http://www.xxx.com″)?
● 並 列 実 行S│T:S
getpage(″http://www.yyy.com″)
と T の 実 行 を 同 時 に行 い,先
に成 功 した 方 の 結 果 が 得 ら れ る.
page:=getpage(″http://www.xxx.com″)Igetpage(〝http://www.yyy.com″) ● タ イ ム ア ウ トtimeout(t,S):Sの リ秒 で あ る.
実 行 を 時 間 tで タ イ ム ア ウ トと す る.時
間の 単位 は ミ
page:=timeout(10000,
getpage(〝http://www.xxx.com〝))
・ 繰 り 返 しrepeat(S):Sの
実 行 を 成 功 す る ま で 繰
り返 す
page:=repeat(getpage(〝http://www.xxx.com〝))
・ 無 限 実 行stall():無
限 実 行 す る.
page:=repeat(getpage(〝http://www.xxx.com〝)?timeout(10000,stall()) 成 功 す る ま で10秒
次 に,WebLで
間 隔 で ア ク セ ス す る.
はmarkup
algebraを
用 い る こ と に よ り,Webペ
報 抽 出 を 行 う こ と も 可 能 で あ る.markup の 概 念 か ら 成 り 立 っ て い る.こ pieceの
集 ま り,operatorは
べ て の ア ン カ ー(piece-set)を
ー ジか らの 情
algebraは,pieces,pieces-sets,
こ で,pieceは
operator
文 書 中 の テ キ ス ト 領 域,piece-setは
オ ペ レ ー タ で あ る.例
え ば,指
定 され たペ ー ジか らす
取 得 す る こ と は 以 下 の よ う に 記 述 さ れ る.
P:=getpage(〝http://www.xxx.com/〝); links:=
P.Elem(〝A〝)
こ こ でElem(〝A〝)は,"A"タ す る メ ソ ッ ドで あ る.テ で あ る.Patメ
グ を も つ テ キ ス ト領 域(す
キ ス ト領 域 を 抽 出 す る も う 一 つ の 方 法 は,Patメ
ソ ッ ドの 引 数 は,Perlな
こ とが で き る.例
え ば,指
語 を 抽 出 す る こ と は,以
な わ ち ア ン カ ー)を
定 し たWebペ
抽 出 ソ ッ ド
どで 用 い ら れ て い る 正 規 表 現 を利 用 す る ー ジ か ら"Agent"あ
る い は"agent"と
い う
下 の よ う に 記 述 で き る.
P:=getpage(〝http://www.xxx.com/〝); words:=
P.Pat(〝(Ala)gent〝)
抽 出 した テ キ ス ト領 域 を操 作 す る 基 本 集 合 オ ペ レ ー タ と して は 以 下 の もの が あ る. ・ 和(Union)
S+T
・ 共 通(lntersection)
S*T
・ 排 他(Exclusion)
S-T
例 え ば,〝titles:=P.Elem(〝Hl〝)+P.Elem(〝H2〝)"は 出 す る.ま
レベ ル 1 と 2の 見 出 し を 抽
た 位 置 オ ペ レ ー タ と し て は 以 下 の も の が あ る.
・ 前(before)
S
before
・ 後(after)
S
after
・直
前(directlybefore)
S
directlybefore
・直
後(directlyafter)
S
directlyafter
S
overlap
・ 重 複(overlap)
例 え ば,タ
グIMGで
T T T T T
表 さ れ る 画 像 の 後 に あ る タ グ Iで 表 さ れ る イ タ リ ッ ク の す
べ て の 語 を 抽 出 す る に は,“titles:=P.Elem(〝 れ ば よ い.最
後 に,階
I〝)after
S !in
・ 包 含(contain)
S !contain
・直 接
包 含(directlyin)
S !directlyin
・直 接
包 含(directlycontain)
S !directlycontain
こ こ で,inとcontainは
“titles:=P
T T T T
逆 の 包 含 関 係 に あ る.例
!in p.Elem(〝TABLE〝)[2 ]"は,Webペ
ま た,"UCI"と
記述 す
層 オ ペ レ ー タ と し て 以 下 の も の が 用 意 さ れ て い る.
・ 包 含(in)
ル に 含 ま れ る(〝TR〝
p.Elem(〝IMG〝)"と
え ば,“rows:=P.Elem(〝TR〝)
ー ジ P 中 の([2]で
タ グ で 表 さ れ る)す
表 さ れ る)3 番 目 の テ ー ブ
べ て の 行 を 取 得 す る こ と を 表 し て い る.
い う 語 を 含 む レ ベ ル 2ヘ ッ ダ の テ キ ス ト領 域 を 取 得 す る 場 合 は, .Elem(〝H2〝)!contain
P.Pat(〝UCI〝)” の よ う に 記 述 さ れ る.た
れ は,“titles:=p.pat(〝UCI〝)!in
p.Elem(〝H2〝)"と
ダ の テ キ ス ト領 域 全 体 が 得 ら れ る の に 対 し て,後 ら れ る だ け で あ る.“!in"と
“!directlyin"の
も対 象 と す る の に 対 し,“!directlyin”
は 等 価 で は な い.前
者 は “UCI"と
違 い は,“!in”
だ し,こ 者 はヘ ッ
い う語 の 集 合 が 得
は ネ ス トされ た 要 素
は直 下 の 階層 の 要 素 の み を対 象 とす る と こ
ろ に あ る. 以 上 の よ う に,WebLは そ の ペ ー ジ か らHTMLタ
あ るWebサ
イ トか ら 指 定 さ れ た ペ ー ジ に ア ク セ ス し,
グ の 位 置 関 係 を 手 が か り に さ ら に 必 要 な テ キ ス ト領 域 を
抽 出 す る と い う機 能 を 持 っ て お り,情 て 利 用 す る こ と も可 能 で あ る.
報 抽 出 ラ ッパ ー を記 述 す る た め の 言 語 と し
3.3WWW情
報 統 合 の た め の デ ー タ ベ ー ス 的 ア プ ロ ー チ
前 節 で はWebサ
イ トを 巡 回 し,必
要 な 情 報 を 検 索,抽
二 つ の プ ロ グ ラ ミ ン グ 言 語 を 紹 介 し た.こ 報 統 合 は,Webサ
一方
,情
の よ う な プ ロ グ ラ ミ ン グ言 語 に よる 情
イ トか ら の 情 報 の 抽 出,統
す る こ と に よ り実 現 さ れ,情
出 す る こ とを 目的 とす る
合 の 過程 を 明示 的 に プ ロ グ ラ ミ ン グ
報 統 合 の 規 模 が 小 さ い 場 合 は 有 効 な 手 段 と い え る.
報 統 合 に 関 わ る 情 報 源 の 数 や 種 類 が 多 く な っ た り,利
で あ っ た りす る 場 合 は,そ 本 節 で はWebサ
用 者 の 要 求 が 多様
の プ ロ グ ラ ム の メ ン テ ナ ン ス は 容 易 で は な い.そ
イ ト を 情 報 抽 出 ラ ッ パ ー に よ りモ ジ ュ ー ル 化 し,そ
エ ー タ に よ り統 合 す る デ ー タ ベ ー ス 的 な ア プ ロ ー チ を 紹 介 す る .こ のWebサ
こで
れ をメデ ィ れ に よ り複 数
イ トを あ た か も一 つ の デ ー タ ベ ー ス と し て 扱 う こ と が 可 能 に な り,大 規
模 な 情 報 統 合,多
様 な 利 用 者 要 求 の 課 題 に 応 え る こ と が 容 易 に な る.
3.3.1TSIMMIS:メ
デ ィエ ー 夕 に基 づ く情 報 統 合
米 国 ス タ ン フ ォ ー ド大 学 のTS│MMIS(The
Stanford-IBM
Information Sources)プ
ッ トワ ー ク 上 に 分 散 して い る さ ま ざ
ロ ジ ェ ク ト[4]は,ネ
Manager
of Multiple
ま な 異 種 情 報 源 を 柔 軟 に 統 合 す る こ と を 目 的 と し て い る.図3.2にTSIMMISア
ー
キ テ ク チ ャ の 構 成 図 を 示 す. TSIMMISア ア,Webサ
ー キ テ ク チ ャ で は,デ
ー タ ベ ー ス,ア
ー バ な ど の 異 種 情 報 源 は,そ
プ リ ケ ー シ ョ ンソ フ トウ ェ
の 異 種 性 を解 消 す る た め に情 報 抽 出 ラ ッ
パ ー に よ っ て 情 報 源 固 有 の イ ン タ フ ェ ー ス か ら共 通 情 報 モ デ ル へ と変 換 さ れ る . TSIMMISプ
ロ ジ ェ ク トで は,こ
が 用 い ら れ て い る.例
え ば,あ
こ の 例 に 示 さ れ る よ う に,オ り表 現 さ れ て い る.こ
の 共 通 情 報 モ デ ルOEM(Object る 図 書 リ ス トは 図3.3の
え ば,著
者 1 は 集 合(set)と
>の 三 つ の 組 に よ
れ ぞ れ の情 報 源 が提 供 す る デ ー タの 意 味
や 型 が 明 示 的 に な り,そ の 統 合 が 容 易 に な る.ま れ 子 が 可 能 で あ る 上 に,型
Model)
よ う に 表 現 さ れ る.
ブ ジ ェ ク ト は < ラ ベ ル,型,値
の こ と に よ り,そ
Exchange
た,OEMで
は オ ブ ジ ェ ク トの 入
の 異 な る オ ブ ジ ェ ク ト を 混 在 さ せ る こ と が で き る.例 し て 定 義 さ れ 複 数 の 要 素 を 許 す の に 対 し,著
者 2は文
図3.2TSIMMISア
字 列(str)と
し て 定 義 さ れ 単 一 の 要 素 し か 許 さ な い.ま
(浮 動 小 数)で OEMの
ー キテ クチ ャ
あ る の に 対 し,価
特 徴 は,現
在HTMLに
格 2 はint(整 代 わ るWebペ
数)と
た,価
格 1は そ の 型 がfloat
な っ て い る.以
上 の ような
ー ジ 記 述 言 語 で あ るXMLと
共通 す
る と こ ろ も 多 い. こ の よ う なOEMで
記 述 さ れ た 情 報 源 へ の ク エ リ も,OEM-QLを
に記 述 さ れ る.例
え ば,“Ullman”
め る ク ェ リ は,以
下 の よ ろ に 記 述 さ れ ろ.
SELECT図
書 リ ス ト.図 書.タ
FROM文 WHERE図
用 い てSQL的
が 著 者 の 一 人 で あ る よ う な 図 書 の タ イ トル を 求
イ トル
献集 書 リ ス ト.図 書.著
こ の ク エ リ のWHERE節
者.著
は,ラ
者 名=〝Ullman〝
ベ ルの系列 が
「図 書 リ ス ト,図 書,著
者,著
者
名 」 と な る オ ブ ジ ェ ク トの 構 造 を 検 索 し,そ の 値 が “Ullman” と な る も の を 探 し出 す.そ
して 該 当 す る 系 列 の 中 で,SELECT節
示 す る.し た が っ て,図3.3で に な る.
に よ り指 定 さ れ る 部 分 を 解 と し て 提
示 され る情 報 源 に対 す る この クエ リの 解 は次 の よ う
<解,set,{01,02}> 01:<
タ イ ト ル,str,〝Databases〝
02:<
タ イ ト ル,str,〝Algorithms〝
図3.2に 示 すTSIMMISア
> >
ー キ テ ク チ ャに お け る も う一 つ の 特 徴 は,メ デ ィ エ ー
タ(mediator)[5]の 存 在 で あ る.メ デ ィエ ー タの 第 一 の 目的 は デ ー タの 統 合 で あ る, 異 種 情 報 源 を統 合 す る際 に は,そ れ ぞ れ の 情報 源 で 管 理 さ れ て い る デ ー タの 意 味 が 異 な っ て い る場 合 が あ り,メ デ ィエ ー タが そ の調 整 を行 う必 要 が あ る.例 図3.3で
も示 した よ う に,あ る 図 書 は 円 で 価 格 が 表 記 され,別
格 が 表 記 され て い る か も しれ な い.し
えば
の 図 書 は ドル で 価
た が っ て そ の よ う な 図書 の 合 計 の価 格 を提
示 す る場 合 に は,ド ル で 表 記 され て い る もの を 円 に 変 換 した上 で 合 計 す る よ う な
図3.3OEMで
の記 述 例
処 理 が 必 要 に な る. メ デ ィ エ ー タ の 第 二 の 目 的 は デ ー タ の 抽 象 化 で あ る.ネ
ッ トワ ー ク 上 に あ る 多
数 の 情 報 源 か ら 収 集 し た デ ー タ を 提 示 す る だ け で は,利 用 者 や ア プ リ ケ ー ジ ョ ン プ ロ グ ラ ム に と っ て 十 分 で な い 場 合 が あ る.例
え ば,著
者 が"Ullman"で
ある図書が
何 冊 あ る か を 知 りた い 場 合,そ
の 図 書 の リ ス トそ の も の よ り も リ ス ト中 の 要 素 数
の 方 が 役 に 立 つ.あ
ま ざ まな 交 通 デ ー タベ ー ス か らの 情 報 を元 に旅 行
る い は,さ
の 計 画 を 立 て る 場 合 で も,詳
細 な乗 り継 ぎ経 路 よ り も全 体 的 な所 要 時 間 や 料 金 な
ど の 情 報 が 必 要 に な る 場 合 が あ る.し
た が っ て メ デ ィ エ ー タ で は,収
集 した デ ー
タ を も と に よ り抽 象 度 の 高 い デ ー タ に 変 換 す る こ と も機 能 の 一 つ と な っ て い る. 図3.2に
も 示 す よ う に,メ
デ ィエ ー タは 異 種 情 報 源 と利 用 者 や ア プ リケ ー シ ョ
ン の 間 で ミ ドル ウ ェ ア(middleware)と
して 動 作 す る .さ
ま ざ ま な機 能 や 特 徴 を も
つ メ デ ィ エ ー タ を 必 要 に 応 じ て 組 み 合 わ せ る こ と で ,よ
り柔 軟 な情 報 統 合 シス テ
ム を 構 築 す る こ と が 可 能 に な る.イ や 管 理 機 構 が な く,自
ン タ ー ネ ッ ト上 の 情 報 源 は 中 央 集 権 的 な 制 御
律 分 散 的 に 次 々 と 構 築,公
開 さ れ て ゆ く.こ
ム ア ッ プ 的 に 構 築 さ れ る シ ス テ ム の 統 合 手 段 と して,メ
の よ うな ボ ト
デ ィエ ー タ的 な ア プ ロ ー
チ は 有 効 で あ る と い え る. TSIMMISプ
ロ ジ ェ ク トの 開 発 成 果 は,ソ
stanford.edu/tsimmis/よ
3.3.2ARIADNE:オ ARIADNE[6]は WWW情
ー ス コ ー ド も含 め てhttp://www-db.
り入 手 可 能 で あ る.
ン トロ ジ に 基 づ く情 報 統 合 南 カ リ フ ォ ル ニ ア 大 学 で 開 発 さ れ たs│Msメ
報 統 合 シ ス テ ム で あ る.前
節 で 述 べ たOEMは
デ ィ エ ー タ に基 づ く
異 種 の情 報 を混在 させ る こ
と を 可 能 に す る 表 現 形 式 で あ る が,統 一 的 な 領 域 モ デ ル が 存 在 し て い る わ け で な か っ た.し
た が っ て,情 報 統 合 を行 う た め にOEM-QLに
源 の 違 い を 意 識 し た 上 で 記 述 し な け れ ば な ら な い.そ
よ り記 述 さ れ る ク エ リ は,情 報 の 一 方 で,SIMSメ
デ ィエ ー タ
の 特 徴 は,ア プ リ ケ ー シ ョ ン ご と に 統 一 的 な 領 域 モ デ ル で あ る オ ン トロ ジ(ontology) が 存 在 す る こ とで あ る.例 CIA World Factbook
え ば,図3.4は
世 界 の 国 家 情 報 を 扱 う 三 つ のWebサ
(http://www.cia.gov/cia/publications/factbook/indexgeo.
イ ト,
html),World
Governmentサ
NATOメ
イ ト(http://www.polisci.com/almanac/nations.htm),
ン バ ー ペ ー ジ(http://www.nato.int/structur/countries.htm)と
地 図 デ ー
タ ベ ー ス か ら な る 領 域 モ デ ル で あ る.
図3.4Web情
報 源 の 領域 モ デル(参 考 文献[6]よ り)
こ こ で は,Country(国),NATO
Country(NATO参
of State(元
首)の
ラ ス,Head
of StateはPersonの
Head
of Stateと
四 つ の ク ラ ス が 存 在 し, NATO
関 係 が あ る.こ
サ イ トの 関 係 が 明 確 と な り,そ ARIADNEで 定 し,要
加 国),Person(人),Head CountryはCountryの
サ ブ ク ラ ス と い う 関 係 が あ る.ま
サ ブ ク
た,Countryは
の よ う な 領 域 モ デ ル を持 つ こ と に よ り四 つ のWeb の 統 合 と 情 報 検 索 を 容 易 に し て い る.
は ク エ リ が 与 え ら れ る と,シ
ス テ ム は情 報 源 の 適 切 な組 合 せ を 決
求 さ れ る デ ー タ を効 率 よ く 出 力 す る た め の プ ラ ン を 自 動 的 に 生 成 す る た
め に ク エ リ プ ラ ン ナ(query
planner)を
領 域 モ デ ル を 参 照 し な が ら,単
用 い て い る.す
一 のHTMLペ
な 単 純 な 副 ク エ リ の 集 合 に ク エ リ を 分 解 し,そ
な わ ち,ク
エ リ プ ラ ンナ は
ー ジ に よ り答 え る こ と が で き る よ う れ ぞ れ のHTMLペ
ー ジ か ら抽 出 さ
れ た 情 報 を 組 み 合 わ せ る こ と に よ っ て 当 初 の ク エ リへ の 解 を 構 成 す る.
例 え ば,図3.4の
領 域 モ デ ル を 対 象 に,「 人 口 が1,000万
参 加 国 を 示 せ 」 と い う ク エ リ を 取 り上 げ よ う.ま はNATO
Countryク
(country
nm)だ
はNATO
ラ ス の み か ら 得 ら れ,そ
け で あ る こ と が わ か る.し
Countryの
人 以 下 の す べ て のNATO
ず,NATO参
加 国 に 関 す る情 報
の ク ラ ス が 提 供 で き る情 報 は 国 名
か し な が ら,人
ス ー パ ー ク ラ ス で あ るCountryか
口(population)の
情報
ら得 る こ と が で き る.こ
の よ う な 領 域 モ デ ル を 用 い た 推 論 を 実 行 す る こ と で,与
え られ た ク エ リに答 え る
た め に は ど の 情 報 源 が 必 要 で あ る か が 明 ら か に な る.次
の フ ェ ー ズ で は,ク
に 答 え る た め の 検 索 プ ラ ン を 生 成 す る.上 Countryク
ラ ス か ら の 国 名 情 報 とCountryク
が あ る.こ
れ に は,ま
れ にCountryク
ずNATO
Countryク
か ど う か を 確 認 す る と い う 方 法 が あ る.一 の 数 はNATO で,前
記 の ク エ リ を 処 理 す る 場 合 に,NATO ラ ス か らの 人 口情 報 を統 合 す る必 要 ラ ス か ら 国 名 情 報 を 得 て,そ
ラ ス か ら 人 口 情 報 を確 認 す る と い う 方 法 と,先
か ら す べ て の 国 の 人 口 情 報 を得 て か ら,そ
Countryク
エ リ
にCountryク
の そ れ ぞ れ の 国 に 対 し てNATO参 般 に は,Countryク
のそれぞ ラス 加国
ラ ス に含 まれ る国
ラ ス に 含 ま れ る 国 の 数 よ り は る か に 多 い と考 え ら れ る の
者 の 方 法 で 処 理 す る こ と が 望 ま し い.こ
の よ う に 情 報 統 合 の 過 程 で は ,統
合 処 理 の 順 序 は そ の 性 能 に 影 響 を 及 ぼ す こ と が あ る. 領 域 モ デ ル を用 い た 情 報 統 合 は 一 般 的 な デ ー タベ ー ス統 合 に も共 通 の 技 術 で あ る が,ARIADNEで
はWWW情
報 統 合 な ら で は の い くつ か の 情 報 抽 出 ラ ッパ ー
技 術 が 開 発 さ れ て い る.WWWで
は,ラ
ッパ ー が あ る ペ ー ジ か ら 情 報 を 抽 出 す る
前 に そ の ペ ー ジ の 位 置 決 め を し な け れ ば な ら な い 場 合 も あ る.例 口 を 求 め る よ う な 要 求 に 対 し て,ラ URLを
知 る 必 要 が あ る が,WWWで
え ば,日
本 の人
ッパ ー は まず 日本 の 情 報 が 書 か れ た ペ ー ジ の は 図3.5に
示 す よ う な 国 名 順 に 並 べ られ た
ハ イ パ ー リ ン ク か ら な る イ ンデ ック ス ペ ー ジ と して提 供 さ れ て い る 場 合 が あ る . ARIADNEで
は こ の よ う な イ ン デ ッ ク ス ペ ー ジ に 対 し て は ,図3.4に
factbook indexラ のURLを
ッ パ ー の よ う に,国
お け るCIA
名 を 入 力 す る とそ の 情 報 が 記 され た ペ ー ジ
返 す 専 用 の ラ ッパ ー を 構 成 す る こ と に よ り対 応 し て い る.
さ ら に,Webサ
イ トに 対 応 す る 情 報 抽 出 ラ ッ パ ー は デ ー タベ ー ス と 異 な り,入 出
力 の 関 係 が 明 確 に 定 義 さ れ る.例
え ば 図3.4に
示 す よ う に,CIA
factbook
country
図3.5WWW上
pageラ
ッ パ ー で は 国URL(country
緯 度(latitude),経 たCIA
の イ ンデ ックス ペ ー ジ
factbook
URL(country
度(longitude),人 indexラ url)が
エ リ に対 して は,ま CIA factbook
url)の
country
関 係 の 制 約 は,CGIな
口(population)な
ッパ ー で は,国
出 力 さ れ る.し
ずCIA
入 力 に 対 し て の み,面
名(country た が っ て,国
factbook indexラ
pageラ
積(total
area),
ど の 情 報 が 出 力 さ れ る.ま nm)の
入 力 に 対 し て の み,国
名 か ら人 口 を求 め る よ うな ク
ッパ ー でcountry
urlを 求 め,そ
ッ パ ー の 入 力 と す る 必 要 が あ る.こ
ど を用 い た フ ォ ー ム 形 式 のWebペ
れ を
の ような入出力
ー ジ を扱 う 場 合 に は 特 に
重 要 に な る. ま た,一
部 のWebサ
る よ う な 場 合 も あ る.例
イ トで は イ ン デ ッ ク ス の 構 造 が よ り複 雑 に 階 層 化 さ れ て い え ば 第 一 段 階 で は ア ル フ ァ ベ ッ トが 並 ん で い る だ け で,
そ の ア ル フ ァ ベ ッ トを ク リ ッ ク す る と そ の ア ル フ ァ ベ ッ トで は じ ま る 国 名 の リ ス トが 現 れ る と い う よ う な もの で あ る.こ
の よ う な 階 層 的 イ ン デ ッ ク ス は,図3.6に
示 す よ う な 領 域 モ デ ル に よ っ て 表 現 す る こ と が で き る.こ パ ー は 情 報 源 を 扱 う も の で は な く,国 あ る.例
え ばJapanの
を 入 力 し て,そ
情 報 を 知 りた い 場 合 に は,ま
の 頭 文 字(J)を
得 る.次
こ で,文
字列操作 ラ ッ
名 か らそ の頭 文 字 を切 り出 す プ ロ グ ラ ム で
にtop
ず 文 字 列 操 作 ラ ッパ ー に 国 名
level indexラ
ッパ ー に 頭 文 字 を 入
図3.6階
力 し,サ
層 的 イ ン デ ッ ク ス の モ デ ル(参
ブ イ ン デ ッ ク ス のur1を
subindexラ
ッ パ ー に 入 力 し,国
に 国 情 報urlを WWW情
入 力 し て,国
得 る.さ
考 文 献[6]よ
ら に サ ブ イ ン デ ッ ク ス のurlと
情 報 のurlを
得 る .最
後 にcountry
報 統 合 の 問 題 点 の 一 つ に,同
る サ イ トで はUnited
国名 を
pageラ
ッパ ー
情 報 を 得 る と い う 流 れ に な る. 一 の オ ブ ジ ェ ク トで あ る に も か か わ ら
ず サ イ トに よ っ て 異 な る 名 称 が 与 え ら れ る 場 合 が あ る.例 て,あ
り)
Kingdom,別
い る 場 合 が 考 え ら れ る .ARIADNEで
の サ イ トで はGreat
えば英 国の 国名 と し Britainを
利 用 して
は 領 域 に 応 じ て 代 表 的 な 情 報 源 を 選 択 し,
異 な る名 称 を利 用 して い る情 報 源 は代 表 的 な情 報 源 へ の マ ッ ピ ング ラ ッパ ー を提 供 す る こ と に よ り こ の 間 題 に 対 処 して い る.図3.4に ト とWorld country
Governmentsサ
factbookを
Governments
標 準 と し て そ の 違 い を 変 換 す るNATO
mapping
イ
イ トで は そ れ ぞ れ 国 名 表 記 が 異 な っ て い る の で,CIA mapping
tableとWorld
tableの 二 つ の ラ ッパ ー が 用 意 さ れ て い る .
以 上 の よ う に,ARIADNEで Web情
も示 す よ う に,NATOサ
は 領 域 モ デ ル を 表 現 す る オ ン ト ロ ジ を 中 心 と し て,
報 源 の 特 殊 性 や 異 種 性 に 対 処 す る さ ま ざ ま な ラ ッパ ー を 組 み 合 わ せ る こ と
に よ り,WWW情 ARIADNEの
報 統 合 を 実 現 して い る. デ モ ン ス ト レ ー シ ョ ン は,そ
info-agents/ariadne/index.htmlを
の ホ ー ム ペ ー ジhttp://www.isi.edu/
介 して 提 供 さ れ て い る.
3.4 WWW情
報 統 合 の ため の エー ジ ェン トア プ ロー チ
前 節 ま で に 紹 介 した情 報 統 合 技 術 は,統 合 す べ き情 報 源 にお け る 意 味 や 構 造 の 違 い を どの よ う に扱 うか と い う点 に主 眼 が 置 か れ て い た.し か しな が ら,さ
らに
高 度 な情 報 統 合 を 目指 す た め に は,以 下 の よ う な要 因 も考 慮 に 入 れ る必 要 が あ る. (1)利 用 者 の 要 求 こ れ まで の 事 例 で は,利 用 者 の 要 求 は単 純 な クエ リ と して 表 現 さ れ,そ れ を 満 たす 情 報 を分 散 して い る情 報 源 か ら収 集統 合 す る もの で あ っ た.さ 報 統 合 を実 現 す る た め に は,よ
らに 高 度 な情
り複 雑 な利 用 者 の要 求 に 対 応 す る 必 要 が あ る.例
え ば,「 4万 円 以 内 で 大 阪 か ら札 幌 まで 1泊 2 日の旅 行 プ ラ ン を示 せ 」 とい う クエ リで は,大 阪 か ら札 幌 まで の 航 空 機 の ス ケ ジ ュ ー ル と札 幌 の ホ テ ル に 関 す る情 報 をそ れ ぞ れ 検 索 して 単 に提 示 す る だ け で は 不 十 分 で あ り,そ れ らの 料 金 の 合 計 が 4万 円 以 内 に収 ま る よ う に しな けれ ば な ら な い.す
な わ ち,複 数 の 情 報 源 か ら得
られ た 部 分 解 を単 純 に組 み 合 わ せ る だ け で は な く,制 約 を満 た す よ うに 選 択 的 に 組 み 合 わ せ な け れ ば な らな い. (2)情 報 収 集 に お け る コ ス ト これ まで の事 例 で は,情 報 源 に ア クセ ス す れ ば 自 由 に情 報 が得 ら れ る こ とが仮 定 され て い た.今 後 は有 料 の 情 報 源 の よ う に,ア られ る もの も一般 的 に な る.ま
た,ネ
クセ ス に金 銭 的 な コス トが 課 せ
ッ トワ ー クの 混 雑 に よ り,ア
クセ ス に 時 間
が か か る よ うな 場 合 も考 慮 す る必 要 が あ る だ ろ う.こ の よ うな ア ク セ ス コ ス トを 考 慮 して適 切 に情 報 収 集 す る仕 組 み が 必 要 に な る. (3)情 報 収 集 の 戦 略 イ ン ター ネ ッ トの 情 報 源 は 多 様 で あ り,そ の 量 も膨 大 で あ る.ま
た,中
に は不
確 実 な情 報 が 含 ま れ て い る こ と もあ る.し た が って 限 られ た 時 間 の 中 で,精 犠 牲 に して で もで き る だ け 多 様 な情 報 を集 め よ う とす る の か,あ
度を
るい はで きるだ
け関 連 す る情 報 を多 く集 め て 情 報 の 精 度 を 高 め よ う とす る の か,そ
の戦略 が重要
に な る.例 え ば オ ンラ イ ン シ ョ ッ ピ ン グ で パ ソ コ ン部 品 に 関 す る情 報 を 集 め る場 合,そ
の仕 様 を比 較 す る の が 目的 で あ れ ば で き る だ け 関連 す る 部 品 の 情 報 を集 め
る で あ ろ う し,仕 様 が 確 定 して い て購 入 す る こ とが 目的 で あ れ ば 同 一 の 部 品 に 関 して で き る だ け 多 くの 価 格 情 報 を集 め る こ と に な る だ ろ う. 以 上 の よ う に今 後 の 情 報 統 合 の 課 題 は,情 報 を どの よ うに 組 み 合 わせ る か とい う視 点 よ りも,情 報 を どの よ う に収 集 す る か と い う視 点 が よ り重 要 に な る.そ た め に は ス ケ ジ ュ ー リン グ や プ ラ ン ニ ン グ とい っ たAI技 報 収 集 ・統 合 技 術 が 必 要 に な る.こ 事 例 と して,BIGとRETSINAを
の
法 を統 合 した知 的 な情
こ で は 知 的 エ ー ジ ェ ン トに基 づ く情 報 統 合 の
紹 介 しよ う.こ れ ら の事 例 は ま だ実 用 的 な段 階
まで は 至 っ て お らず研 究 段 階 で あ るが,次
世代 の 情 報 統 合 シ ス テ ム の 方 向性 を示
して い る と見 なす こ とが で きる.な お,知
的 エ ー ジ ェ ン トの 情 報 検 索 へ の応 用 に
関 して は 第 2章 で 詳 し く述 べ られ て い る.
3.4.1BIG:情
報 収 集 ・統 合 エ ー ジ ェ ン ト
BIG(resource-Bounded
Information Gathering)[7]は,米
国マサチ ューセ ッツ大
学 で研 究 され て い る 図3.7に 示 す ア ー キ テ ク チ ャ を もつ 情 報 収 集 エ ー ジ ェ ン トで あ り,応 用 プ ロ トタイ プ と して,コ
ン ピ ュ ー タ ソ フ トウ ェ ア に 関す る情 報 を イ ン
タ ー ネ ッ ト上 か ら収 集 して,利 用 者 の 要 求 を満 た す 製 品 を推 薦 す る シ ス テ ムが 開
図3.7
BIGア
ー キ テ ク チ ャ(参
考 文 献[7 ]よ り)
図3.8黒
発 さ れ て い る.BIGの
特 徴 は,大
板 オブ ジ ェ ク ト
き く分 け て 情 報 統 合 の た め の 黒 板 モ デ ル と,情
報 収 集 の た め の プ ラ ン ナ と ス ケ ジ ュ ー ラ の 採 用 に あ る. BIGに
よ り収 集 さ れ る情 報 は,図3.8に
トと して 黒 板(blackboard)に
示 され る よ うな 階層 を もつ黒 板 オ ブ ジ ェ ク
登 録 さ れ,変 更 が 加 え ら れ て ゆ く.ま
は 利 用 者 の 要 求(User-Goal)が
あ ら か じめ 書 か れ て い る.こ
ず,最 上 位 階 層 に
こ で は,価 格$200以
下
で マ ッ キ ン ト ッ シ ュ 用 の ワ ー プ ロ ソ フ トに 関 す る 情 報 を 要 求 して い る こ と が 記 さ れ て い る.ソ ument)の
フ トウ ェ ア に 関 す るWebペ 階 層 に 書 き 込 ま れ る.こ
か ら の 情 報 が 得 ら れ て い る.次 の 属 性 情 報 が,オ
こ で は,“http://search.outpost.com/search/…
が1.87,価
ト ッ シ ュ で あ る こ とが 抽 出 さ れ,オ
階 層 に 加 え ら れ る.こ 格 が$159.95,プ
こ で は,製
品名 が
ラ ッ トフ ォ ー ム が マ ッ キ ン
ブ ジ ェ ク ト階 層 に 書 き 加 え ら れ て い る.そ
思 決 定 の 段 階 に お け る 最 終 判 断 が 決 定(Decision)の
こ で は,0.775の
”
に そ の ペ ー ジ や 関 連 ペ ー ジ か ら情 報 抽 出 し た 製 品
ブ ジ ェ ク ト(Object)の
Corel Wordperfect3.5,質
て,意
ー ジ の 情 報 が 得 ら れ る と,そ れ は 文 書(Doc-
し
階 層 に 加 え ら れ る.こ
確 信 度 で 製 品 が 「買 い 」 で あ る と い う結 論 に 至 っ て い る.こ
う な 複 数 の 階 層 を もつ 黒 板 オ ブ ジ ェ ク トを 利 用 す る こ と に よ り,さ 源 や モ ジ ュ ー ル か ら の 情 報 を 統 合 す る こ と が 可 能 に な り,利
のよ
ま ざ まな 情 報
用 者 の複 雑 な 情 報 統
合 の 要 求 に 答 え る こ と が 可 能 に な る. ま たBIGで
は,利
用 者 の 要 求 に合 わせ た詳 細 な情 報 収 集 の た め の プ ラ ン を立 案
し,利 用 者 が 指 定 す る 時 間 的 制 約 や 情 報 の 精 度 に応 じて,実 行 可 能 な ス ケ ジ ュ ー ル を作 成 し,そ れ に応 じた 情 報 収 集 を行 う.こ れ に よ り,情 報 収 集 にお け る コス トや 戦 略 の課 題 に対 処 し よ う と して い る.そ れ で はパ ソ コ ン用 ソ フ トウ ェ ア推 薦 を例 と して,BIGの
情 報 検 索 の流 れ を具 体 的 に示 そ う.
(1)質 問 処 理 利 用 者 が 利 用 者 イ ン タ フ ェ ー ス を介 して,検 索 時 間,検 索 コ ス ト,製 品 の 属 性 (価 格,質,シ
ス テ ム仕 様)な
理 が 開 始 され る.こ $200以
どか らな る質 問 要 求 を入 力 す る こ とに よ り,質 問 処
こで は 以 下 の よ う な質 問 要 求 が 与 え ら れ た とす る.
下 の マ ッキ ン トッ シ ュ用 ワ ー ドプ ロ セ ッサ を探 せ.検 索 は10分
で,$5以
以内
内 の コス トで 行 う こ と.価 格 と質 の 重 視 率 は 6対 4 で あ る.商 品
の 被 覆 と精 度 の 重 視 率 は 2対 8 とす る. こ こ で
「商 品 の 被 覆 と精 度 の 重 視 率 」 は 情 報 収 集 の 戦 略 を指 定 す る も の で あ り,
精 度 の 割 合 が 大 き い ほ ど,狭
い 範 囲 の 情 報 を 多 く集 め て 情 報 の 信 頼 度 を 高 め よ う
と す る 戦 略 を 表 し て い る. (2)プ
ラン生成
要 求 が 与 え ら れ る と,タ
ス ク 評 価 が 利 用 者 の 質 問 要 求 を 解 析 す る.知
を 利 用 す る こ と に よ り,図3.9に を 生 成 し,タ
示 す よ うな 与 え られ た 規 準 を満 た す タ ス ク構 造
ス ク 構 造 デ ー タ ベ ー ス に 登 録 す る.ト
者 の 要 求 を 表 し,そ Make_Decision)に
識ベ ース
ッ プ レベ ル の タス クは 利 用
れ は 三 つ の サ ブ タ ス ク(Get_Information,Benchin_Review, 分 解 さ れ る.Get_Informationは
の 構 築,Benchin_Reviewは め の 製 品 評 価 で あ る.そ と め 上 げ ら れ る.seq_sum関 が 親 タ ス ク に 返 さ れ る.一
製 品 情 報 の 収 集 と製 品 モ デ ル
批 評 情 報 の 収 集,Make_Decisionは
意 思 決 定 を行 う た
れ ぞ れ の サ ブ タ ス ク の 結 果 は,seq_sum関 数 で は サ ブ タ ス ク は 順 番 に 実 行 さ れ,そ 方sum関
数 で は,任
意 の 組 合 せ,任
数 を用 い て ま の結果 の和
意の順序 でのサ ブ
タ ス ク の 実 行 を 許 す も の で あ る. Get_Informationタ formationか
ス ク は,さ ら に 二 つ の サ ブ タ ス ク に 分 解 され る.Get_Basic_In
らGet_Extra_Informationへ
の 矢 印 は タ ス ク 間 の 依 存 関 係 を 表 し,Get_
図3.9
Basic_Informationタ
タ ス ク 構 造(参
考 文 献[7]よ
ス ク はGet_Extra_Informationタ
り)
ス ク よ り前 に 実 行 し な け れ
ば な ら な い こ と を 表 し て い る. こ の タ ス ク 構 造 で は,記 必 要 は な い.例
え ば,製
述 さ れ て い る す べ て の サ ブ タ ス ク を 必 ず し も実 行 す る 品 情 報 の 選 択(Look_For_Materials)や
(Quick_Extract_Information,Get_More_Object),製 Information)な
ど の タ ス ク で は,サ
品 批 評 の 選 択(Detail_Product_
ブ タ ス ク がsum関
数 に よ り統 合 さ れ て い る の
で,一
つ 以 上 の サ ブ タ ス ク を 実 行 す れ ば よ い こ と が わ か る.
(3)ス
ケ ジ ュー ル の 生 成
タ ス ク 構 造 が 生 成 さ れ る と,そ
情 報 抽 出 法 の選 択
れ は 利 用 者 の 時 間 と コ ス トの 制 約 を 満 た す 実 行
可 能 な ス ケ ジ ュ ー ル を 生 成 す る よ う に ス ケ ジ ュ ー ラ に 渡 さ れ る.ス そ れ ぞ れ の サ ブ タ ス ク の 実 行 時 間 を 推 測 し,利 提 示 す る こ とが で き る よ う に,実
用 者 が 指 定 した検 索 時 間 内 に解 を
行 す べ き サ ブ タ ス ク と そ の 順 序 を 決 定 す る.決
定 さ れ た サ ブ タ ス ク 実 行 の 順 序 は,数 (4)情
ケ ジュ ー ラ は
字 に よ り図3.9に
示 さ れ て い る.
報検 索 と抽 出
タ ス ク ス ケ ジ ュ ー ル は 実 行 監 視 サ ブ シ ス テ ム に 送 ら れ,情 検 索 要 求 はWeb検
索 イ ン タ フ ェ ー ス を 介 し て,既
報 検 索 が 開 始 さ れ る.
知 の 情 報 源 で あ る コ ン ピュ ー
タ 小 売 サ イ トのMacZone(www.zones.com)に
送 ら れ る(Query_To_Maczone).そ
検 索 に 並 行 し て,別
Outpost(www.outpost.com)やMac-
の 小 売 サ イ トCyberian
Mall(www.macmall.com)に Macmall).こ
も検 索 要 求 が 送 られ る(Query_To_CyboutとQuery_To_
れ ら の サ イ トへ の 検 索 に 対 し て,概
リ ス トが 返 さ れ る.こ 報(Document)と
の 情 報 は,質
情 報 の 抽 出 を 行 い,黒
びWeb文
書 に 関す る 情
示 し た 黒 板 オ ブ ジ ェ ク トを 形 成 し,黒
に,Look_For_Materialsタ
オ ブ ジ ェ ク トに 対 し て,さ
要 テ キ ス トが 付 加 さ れ たURLの
問 要 求(User-Goal)及
組 み 合 わ さ れ て,図3.8で
板 に 書 き 込 ま れ る.次
ス ク に よ り得 ら れ た 多 数 の 黒 板
ま ざ ま な 情 報 抽 出 技 法(MQMD_9,
HQHD_5)を
板 オ ブ ジ ェ ク トの 更 新 と ふ る い 分 け を 行 う.最
の メ ソ ッ ドGet_More_Detail_1,Get-More_Detail_2, エ ン ジ ン に ク エ リ を 送 り,他 ク トのObjectの
の
用 い て 後 に,三
Get_More_Detail_5が
の 製 品 や 批 評 に 関 す る 情 報 を 入 手 し,黒
つ
サ ーチ 板 オブ ジェ
部 分 に 追 加 す る.
(5)意 思 決 定 意 思 決 定 器 は,ま ず 黒 板 オ ブ ジ ェ ク トか ら,比 較 す る に十 分 な情 報 を 集 め る こ との で き な か っ た もの を 除外 す る.最 終 的 に利 用 者 が 指 定 した パ ラ メ ー タ に よ り 評 価 基 準 が 重 み 付 け られ て,最 終 的 な 決 定 が 下 され る.そ の 結 果 は 図3.8で 示 さ れ る よ う な もの と な る.
3.4.2
RETSlNA:マ
BIGは
高 度 な 情 報 収 集 プ ラ ン ニ ン グが 可 能 な 情 報 エ ー ジ ェ ン トの 一 つ と 見 な す こ
と が で き る が,今
ル チ エ ー ジ ェ ン ト型 情 報 統 合
後 は こ の よ う な エ ー ジ ェ ン トが 結 合 さ れ て,さ
らに高 度 な情 報 統
合 を 実 現 す る マ ル チ エ ー ジ ェ ン トシ ス テ ム へ と発 展 し て い くで あ ろ う.そ 一 つ の事 例 と して は Task
Structure-based
の ような
,カ ー ネ ギ ー メ ロ ン大 学 で 研 究 さ れ て い るRETSINA(Reusable Intelligent Network
Agent)[8]が
あ る. RETSINAの
特徴 は
以 下 の と お りで あ る .
・エ ー ジ ェ ン トの共 有 と再 利用:利 用 者 や ア プ リケー シ ョン は,専 門的 なサ ー ビス を提 供 す るエ ー ジ ェ ン トを選択 的 に組 み合 わせ る こ とに よ り,WWW情 ム ア ップ的 に構 築 す る こ とが で きる.
報統 合 シス テム を ボ ト
・ モ ジ ュ ー ル 性:エ
ー ジ ェ ン トは,維
持 や 変 更 を容 易 に す る た め に シ ン プ ル な 構 造 に な っ
て い る. ・ 柔 軟 性:エ き る.さ
ー ジ ェ ン トの 組 合 せ を 変 え る こ と に よ り,さ
ま ざ ま な 要 求 に 応 え る こ とが で
ら に こ の よ う な エ ー ジ ェ ン トの 相 互 作 用 は,実
行 中 に 動 的 に変 化 させ る こと も
可 能 で あ る. ・ 頑 健 性:情
報 や 制 御 を 分 散 させ る こ と に よ り,エ
な 障 害 が 生 じ た と し て も,そ
RETSINAア
ー キ テ ク チ ャ を 図3.10に
情 報 エ ー ジ ェ ン ト(information フ ェ ー ス エ ー ジ ェ ン ト(interface
図3.10
ー ジ ェ ン ト,情
報 源,通
信 路 に一時 的
の 影 響 を 少 な くす る こ と が で き る.
RETSINAア
agent),タ agent)で
示 す.こ
の 中 で 主 要 な エ ー ジ ェ ン ト は,
ス ク エ ー ジ ェ ン ト(task あ る.
ー キ テ ク チ ャ(参
考 文 献[8]よ
り)
agent),イ
ン タ
情 報 エ ー ジ ェ ン トの 主 要 な機 能 は ラ ッパ ー の よ う に情 報 検 索 を行 うこ とで あ る が,さ
ら に長 期 的 に情 報 源 を監 視 し,そ の 変 化 を他 の エ ー ジ ェ ン トに通 知 す る 機
能 も あ る.例
え ば,旅 行 プ ラ ン を立 案 す る よ うな マ ル チ エ ー ジ ェ ン トシ ス テ ム に
お い て は,飛 行 機,鉄
道,ホ
テ ル,観 光 地 な どの情 報 を そ れ ぞ れ 検 索 収 集 す る情
報 エ ー ジ ェ ン トが存 在 す る.情 報 エ ー ジ ェ ン トは 単 に情 報 を収 集 す る だ け で な く, 航 空 機 の 空 席 情 報 の よ う に変 化 す る 可 能 性 の あ る情 報 は 常 に監 視 し,そ の 変 化 を 他 の エ ー ジ ェ ン トに通 知 す る. タス ク エ ー ジ ェ ン トは 問 題 解 決 の プ ラ ン を形 成 し,他 の エ ー ジ ェ ン トと情 報 交 換 し なが らそ の 実 行 を行 う.タ ス クエ ー ジ ェ ン トは,タ ス ク領 域 に関 す る 知 識 や 他 の タ ス クエ ー ジ ェ ン ト及 び情 報 エ ー ジ ェ ン トとの協 調 処 理 に 関 す る知 識 を有 し て い る.さ
らに 他 の エ ー ジ ェ ン トとの 競 合 解 消 や 情 報 統 合 の機 能 を有 して い る に
タス クエ ー ジ ェ ン トの 主 要 な機 能 は, ① イ ン タ フ ェー スエ ー ジ ェ ン トか ら タ ス ク仕 様 を受 け 取 る. ② タ ス ク仕 様 を解 釈 して 問 題 解 決 目標 を抽 出 す る. ③ 目標 を 満 た す プ ラ ン を生 成 す る. ④ プ ラ ンに 表 現 され て い る 副 目標 達 成 に必 要 な情 報 を 認識 す る. ⑤ プ ラ ン を分 解 し,プ ラ ン実 行 にお い て 他 の タス クエ ー ジ ェ ン トや情 報 エ ー ジ ェ ン トと協 調 す る. で ある プ ラ ンの 実 行 は,問 題 解 決 の 状 況 に応 じて 柔 軟 に変 更 され る.例 え ば,旅 行 プ ラ ン を立 案 す る 場 合 に は,タ ス クエ ー ジ ェ ン トは 飛 行 機,鉄
道,ホ
テ ル,観
光地
を扱 う情 報 エ ー ジ ェ ン トか らの 情 報 を も と に利 用 者 の 要 求 を 満 た す 旅 行 プ ラ ン を 立 案 す る. イ ン タ フ ェ ー ス エ ー ジ ェ ン ト は 利 用 者 と 相 互 作 用 を 行 い,タ 取 り,結
果 を 返 す.エ
獲 得 し,利
用 す る.イ
ス ク の仕 様 を受 け
ー ジ ェ ン トは タス ク実 行 の 際 に必 要 に な る 利 用 者 の 選 好 を ン タ フ ェ ー ス エ ー ジ ェ ン トの 主 要 な 機 能 は,
① タス クを実行 する ため に利 用者 か ら関連情報 を集め る ② 実行 結果 と説明 を含 む関連 情報 を提 示す る
③問題 解決 中に利用者 に対 して追加情 報 を求 める ④必 要 な場合 には利用者 に確 認 を求める で あ る.利 用 者 が イ ン タ フ ェー スエ ー ジ ェ ン トの み と相 互 作 用 す る こ とで,分 散 的 な情 報 収 集 や 問 題 解 決 の 複雑 な過 程 は 利 用 者 か ら隠 蔽 され る こ と に な る.例 ば,旅 行 プ ラ ン を立 案 す る 場 合 に は,プ
え
ラ ン を得 る た め に行 わ れ る さま ざ ま な情
報 エ ー ジ ェ ン ト,タ ス クエ ー ジ ェ ン トの 相 互 作 用 は 隠 蔽 され る.一 方,ホ
テ ルの
グ レー ドや 乗 り物 の好 み とい っ た選 好 情 報 を利 用 者 か ら獲 得 し,タ ス ク エ ー ジ ェ ン トの 問 題 解 決 に反 映 させ る.ま た必 要 に応 じて 問 題 解 決 実 行 中 に利 用 者 の 判 断 を問 い 合 わせ る こ と もあ る. さ て,相
互 作 用 可 能 な 多 数 の エ ー ジ ェ ン トが 存 在 す る よ う な 大 規 模 な マ ル チ エ ー
ジ ェ ン ト環 境 に お い て は,ど
の エ ー ジ ェ ン トが ど の よ う な サ ー ビ ス を提 供 で き る
の か を 各 エ ー ジ ェ ン トが 完 全 に 把 握 す る こ と は 困 難 に な る.そ
こ で,エ
トが 提 供 す る サ ー ビ ス の 検 索 を 支 援 す る エ ー ジ ェ ン ト と し て,ミ ト(middle
agent)が
設 け ら れ て い る.ミ
に は,ミ
ドル エ ー ジ ェ ン
ド ル エ ー ジ ェ ン トは 他 の エ ー ジ ェ ン トか
ら サ ー ビ ス 能 力 に 関 す る 広 告 メ ッ セ ー ジ を 受 け 取 り,内 る.エ
ー ジェ ン
部 デ ー タベ ー ス で 管 理 す
ー ジ ェ ン トが あ る サ ー ビ ス を 提 供 で き る 他 の エ ー ジ ェ ン ト を 知 り た い 場 合 ドル エ ー ジ ェ ン トに 要 求 を 送 る.ミ
チ す る 広 告 を デ ー タ ベ ー ス か ら 検 索 し,そ が 存 在 す れ ば 知 ら せ る.ミ
ドル エ ー ジ ェ ン トは そ の 要 求 と マ ッ の サ ー ビ ス を提 供 で き る エ ー ジ ェ ン ト
ドル エ ー ジ ェ ン トの 存 在 に よ り,各
エ ー ジ ェ ン トは 他
の エ ー ジ ェ ン トの サ ー ビ ス に 関 す る 知 識 を 常 に も っ て お く必 要 が な く な る の で, 動 的 な エ ー ジ ェ ン ト間 の 協 調 関 係 を 形 成 す る の に 役 立 つ.こ
の 機 構 は,エ
ー ジェ
ン トの 障 害 時 で も 動 的 に エ ー ジ ェ ン ト を組 み 替 え る こ と に よ り対 処 す る こ と が で き る の で,シ
ス テ ム の 頑 健 性 が 向 上 す る こ と が 期 待 さ れ る.
RETSINAを
利 用 した応 用 プ ロ トタ イ プ と して,図3.11に
示 す よ う なWarren
と呼 ば れ る投 資 管 理 シス テ ム が 開 発 され て い る[9].投 資 管 理 エ ー ジ ェ ン トは イ ン タフ ェー ス エ ー ジ ェ ン トで あ り,利 用 者 の プ ロ フ ァ イル や 目標 に関 す る情 報 を獲 得 す る.基 本 解 析 エ ー ジ ェ ン トは,株 の 基 本 価 値 の視 点 か ら株 に関 す る情 報 の 獲 得 と解 釈 を行 う タ ス クエ ー ジ ェ ン トで あ る.こ の解 析 に は,企 業 の 財 政,販
売予
図3.11
測,利
益,将
投 資 管 理 シ ス テ ムWarren(参
来 性 な ど の 情 報 を 考 慮 す る が,こ
トか ら 入 手 す る.技
考 文 献[9]よ
り)
の よ う な情 報 は 主 に イ ン ター ネ ッ
術 解 析 エ ー ジ ェ ン トは 株 取 引 市 場 の 近 未 来 を 予 測 す る タ ス ク
エ ー ジ ェ ン トで あ り,ニ
ュ ー ス 解 析 エ ー ジ ェ ン トは,ニ
ュ ー ス を解 析 す る こ と で
そ の ニ ュ ー ス が 株 価 に 影 響 を 与 え る か ど う か と い う 観 点 か ら,利 重 要 性 を 判 断 す る.ア
ナ リ ス ト解 析 エ ー ジ ェ ン トは,人
用 者 に対 して の
間 の ア ナ リ ス トが 持 っ て
い る 企 業 情 報 を 収 集 す る.タ
ス ク エ ー ジ ェ ン トが 収 集 す る 情 報 は 情 報 エ ー ジ ェ ン
トを 介 し て 収 集 さ れ る が,そ
の よ う な も の に は,イ
ン タ ー ネ ッ トか ら 株 価 レ ポ ー
トを 監 視 す る 「相 場 表 示 機 ト ラ ッ カ 」,経 済 ニ ュ ー ス を 収 集 分 類 す る 「ニ ュ ー ス 分 類 器 」,Edgarデ
ー タ ベ ー ス を 監 視 す る 「SECフ
こ の よ う な 多 数 の タ ス ク エ ー ジ ェ ン ト,情 に よ り,イ
ィ リ ン グ トラ ッ カ 」 な ど が あ る.
報 エ ー ジ ェ ン トが 互 い に 協 調 す る こ と
ン タ フ ェ ー ス エ ー ジ ェ ン トを 介 し て 利 用 者 に 投 資 に 関 す る 情 報 提 供 を
行 っ て い る.
3.5ま
WWW情
と め と展望 報 統 合 を実 現 す る た め の技 術 を,プ ロ グ ラ ミン グ言 語,デ ー タベ ー ス,
エ ー ジ ェ ン ト的 な視 点 か ら分 類 し,そ れ ぞ れ 代 表 的 な シ ス テ ム事 例 を紹 介 した. 紙 面 の 都 合 か ら,そ れ ぞ れ の シ ス テ ム の概 要 を 示 す に と ど ま って い るが,そ 細 は 参 考 文 献 や ホ ー ム ペ ー ジ を参 照 して ほ しい.ま Web情
の詳
た デ ー タベ ー ス 的 な 視 点 か ら
報 処 理 を扱 っ た優 れ た サ ーベ イ と して 文 献[10] が あ る.
イ ン タ ー ネ ッ ト上 に は 今 後 も さ ま ざ ま な情 報 や サ ー ビス が提 供 さ れ て い くで あ ろ う.ま た単 に情 報 の量 の増 加 だ け で な く,株 価 や 電 子 オ ー ク シ ョ ンの サ イ トに 見 られ る よ う に,更 新 な どに よる 変化 も さ らに ス ピー ドア ップ され る こ とが予 想 さ れ る .今 後 は,こ の よ うな分 散 動 的 情 報 源 を有 機 的 に結 合 す る技 術 と して,WWW 情 報 統 合 は さ ら に高 度 化 され て い く とい え る.
参考文献 [1]M.A.
Hearst,"Infbrmation
Integration",IEEE
Intelligent
Systems,
Vo.13,
No,5,
pp.12-24,1998
[2]G.O.
Arocena,
Query
A. O. Mendelzon,
Language",Proceedings
G. and
A. Mihaila,"Applications
of Sixth International
World
of a Web
Wide
Web
Conference,
1997
http://www.cs.toronto.edu/websgl/www-conf/wsgl/PAPER267.htm1 [3]T.Kistler,
and
Proceedings
of Seventh
[4]S.Chawathe,
International
and
J. Widom,"The
Information
Sources",
[5]G.Wiederhold,"Mediators terns",
Programming World
H. Garcia-Molina,
J.Ullman, neous
H. Marais,"WebL-A
IEEE
[6]C.A.
Knoblock,
A.G.
Philpot,
J. Hammer,
S. Minton, and
of IPSJ
J. L. Ambite,
of Fifteenth
Y. Papakonstantinou, of Heterogepp.7-18,1994
of Future
Infbrmation
Sys-
pp.38-49,1992
N. Ashish,
S. Tejada,"Modeling
tegration",Proceedings
Conference,1998
Conference,
Architecture
No.3,
for the Web",
Project:Integration
Proceedings
Vo1.25,
Web
K. Ireland,
TSIMNIIS
in the
Computer,
Wide
Language
Web
National
P. J. Modi,1.
Sources
Conference
Muslea,
for Information
on Artificial
In-
Intelligence,
pp.211-218,1998
[7]V.Lesser,
B. Horling,
"BIG:An
Agent
Making",Artificial
F. Klassner,
for Resource-bounded Intelligence,
[8]K.Sycara,"ln-Context ration
[9]K.Sycara, Intelligent [10]D.Florescu,
Information
Vo1.118,
Information
of Intelligent
Ed. Springer,
A. Raj a, T. Wagner,
Gathering
S. XQ. and
Zhang, Decision
pp.197-244,2000
Management
Agents",Intelligent
and
through
Information
Agents,
Adaptive Matthias
CollaboKlusch,
pp.78-99,1999 A. Pannu,
Agents", A. Levy,
M. Williamson, IEEE、Expert,
Vol.11,
D. Zeng, No.6,
and A. Mendelzon,"Database
and
K. Decker,"Distributed
pp.36-45,1996 Techniques
for the World一
Wide
Web:A
[11] 増 永 良 文
Survey”,SIGMOD
Record,Vol.27,No.3,pp.59-74,1998
『リ レ ー シ ョ ナ ル デ ー タ ベ ー ス 入 門 』 サ イ エ ン ス 社(1991)
第4 章 モバ イル 情 報 検 索
4.1モ
バ イル 情報 検 索 とは
は じめ て ヘ ッ ドフ ォ ンス テ レオ を使 っ て音 楽 を屋 外 で 聞 い た 日の こ と を 覚 え て い る.聞
きな じん だ音 源 が 新 鮮 な感 覚 で 聞 こ え て きて,驚 か され た 印象 が 強 く残 っ
て い る.部 屋 の 中で しか 楽 しむ こ とが で きな か っ た音 楽 観 賞 が,多 を経 て 屋 外 に持 ち出 さ れ,つ い に は文 化 と して 定 着 す る に 至 った.本 で あ る コ ン ピュ ー タ に よる情 報 検 索 は,い プ環 境 で 行 わ れ て き た もの で あ るが,そ
くの 技 術 革 新 書の テーマ
う まで も な く屋 内 す な わ ち デ ス ク トッ
れ が 携 帯 端 末 や ワ イ ヤ レ ス通 信,各
ソ フ トウ ェ ア技 術 と携 帯 電 話 の 革 新 に よ り屋 外 に持 ち 出 され,新
種の
た な 日常 生 活 の
一 コマ と して定 着 しよ う と して い る の で あ る . 2001年 現 在,モ バ イ ル情 報 検 索 とい う言 葉 は特 に技 術 用 語 と して扱 わ れ て い る わ け で は な いが,こ
こで は検 索 者 が 動 き まわ りな が ら情 報 検 索 をす る た め の 技 術
とサ ー ビス を モ バ イ ル情 報 検 索 と呼 ぶ こ と とす る.本 章 で は,モ バ イ ル情 報 検 索 に 関 して現 状 の サ ー ビス と技 術 を解 説 し,今 後 の研 究 課 題 を考 え る.ま ず は じめ に モ バ イ ル 情 報 検 索 の 歴 史 を振 り返 っ た 後,ふ
さ わ しい タス ク に つ い て 考 え る.
続 い て モ バ イ ル情 報 検 索 を支 え る 技 術 を,共 通 基 盤 で あ るモ バ イ ル イ ン ター ネ ッ
トア ク セ ス 技 術 と,モ バ イル 環 境 で 特 に重 要 で あ る位 置 情 報 処 理 技 術 の 二 つ に 分 け て解 説 す る.さ
ら に後 半 で は,筆 者 が 携 わ っ て い る 現 在 進 行 中 の 実験 プ ロ ジ ェ
ク トを題 材 にモ バ イ ル 情 報 検 索 の現 状 と課 題 につ い て 考 え る . なお,歩 行 や 運 転 中 の 情 報 検 索 は危 険 で あ るの で,立 ち 止 ま った 上 で 余 裕 を持 っ て 行 っ て い た だ きた い . そ の こ と で都 市 や 風 景 が 新 た な 姿 に見 え る こ とが あ る か も しれ な い.
4.1.1モ
バ イ ル情 報 検 索 の歴 史
モ バ イ ル情 報 検 索 に 注 目が 集 め られ て い る理 由 には,携 帯 電 話 を 中心 と した モ バ イ ル技 術 の 進 歩 が あ る .「 外 出 先 で 情 報 検 索 を したい 」 とい う需 要 は か ね て か ら 存 在 した が,そ
こ に よ うや くモ バ イル 技 術 が 追 い付 い た 状 況 に な っ た と い え る .
(1)モ バ イ ル 普 及 前 夜 モ バ イ ル 技 術 が な か っ た 時代,外 い た の だ ろ うか.そ
図4.1タ
出 先 で の 情 報 検 索 は ど の よ う に して 行 わ れ て
の 一例 と して,図4.1に
約10年
前 の タ ウ ン情 報 提 供 メ デ ィア
ウ ン情 報 提 供 メ デ ィ ア の 調 査 結 果(NTT,1989)
に関 す る調 査 結 果 を示 す. この 調 査 は1989年
に筆 者 らの グ ル ー プ が行 った もの で,代 表 的 な タ ウ ン情 報 提
供 メ デ ィア を選 定 し,実 際 に レス トラ ン等 の 店 探 しの タス ク を行 っ た上 で ユ ー ザ ビ リ テ ィ と情 報 内容 を合 議 評価 した,店 探 しな どで 利 用 され る タ ウ ン情 報 検 索 は, モ バ イ ル情 報 検 索 の代 表 的 な ター ゲ ッ トの ひ とつ で あ る. この 結 果 か らわ か る よ うに,1989年
当 時 は本 と雑 誌 が タウ ン情 報 検 索 の代 表 で,
そ れ ら を補 う よ うに,オ ペ レー タサ ー ビス や 情 報 キ オ ス ク端 末 サ ー ビス が 存 在 し て い る.ガ
イ ドブ ッ ク な どの 書 籍 は携 帯 で き る の で,モ バ イ ル情 報 検 索 の 一 例 で
あ る.た だ し,ど こ で も売 っ て い る よ うな 書 籍 を駅 前 の 書 店 で 立 ち読 み して 情 報 を収 集 す る こ と は,そ の 偏 在 性 か らユ ビキ タ ス情 報 検 索 の 一 種 と解 釈 で き興 味 深 い.な
お,当
時 の 情 報 キ オ ス ク端 末 は駅 や 公 共 機 関 の ロ ビー 等 に 設 置 され た が,
普 及 に は 至 らな か っ た.現 在 は コ ン ビニ エ ン ス ス トア な ど で,ゲ ー ム や 音 楽 の購 入,サ
ー ビ ス予 約 な ど に対 応 した 高 機 能 自動 販 売機 へ と役 割 を 変 え た もの を 目 に
す る こ とが で きる. また イ ン ター ネ ッ トに つ い て は,こ
の 時 点 で はWWWは
存 在 せ ず,調
査 時は
ネ ッ トニ ュ ー ス に投 稿 して他 の 投 稿 者 か ら解 答 を待 つ とい うか た ちで 行 わ れ た. こ の 時 点 で もモ バ イ ル情 報 検 索 の需 要 は あ っ た に もか か わ らず,普 及 は不 完 全 で あ り,身 近 で豊 富 な情 報 を持 っ た検 索 手 段 が 求 め られ て い た. (2)カ ー ナ ビゲ ー シ ョン シ ス テ ム わ が 国 で最 初 に普 及 したモ バ イ ル情 報 検 索 シ ス テ ム は,カ ー ナ ビ ゲ ー シ ョ ン シス テ ム(カ ー ナ ビ)で あ っ た . カ ー ナ ビ は コ ンテ ン ツ で あ る 地 図 をCD-ROMな
どの
形 で車 載 で 持 ち歩 き,必 要 に応 じて地 図や 経 路 を検 索 す る シ ス テ ムで あ る.そ れ が 1995年 のATIS(高
度 交 通 情 報 サ ー ビス,携
路 交 通 情 報 通 信 シ ス テ ム.ビ
ー コ ンやFM多
帯 電 話 等 で 受 信),1996年 重 波 を使 う)と,続
どの リ ア ル タ イ ム情 報 が提 供 さ れ る こ と に な り,1990年 た.ま
た,1997年
に はGPS衛
のVICS(道
け ざ ま に渋 滞 な
代 の 中 頃 に大 き く普 及 し
星 の 誤 差 を緩 和 す るD-GPSが,1998年
にはイ ン
ター ネ ッ ト接 続 が 導 入 さ れ る な ど,地 図 と経 路 案 内 に と ど ま らず タ ウ ン情 報 一 般 を対 象 に,モ バ イル 情 報 検 索 の 先 導 役 と な っ た .
(3)モ バ イ ル エ ー ジ ェ ン ト ち ょ う ど カー ナ ビ普 及 と同 時 期 で あ る1990年 代 の 中 頃,携 帯 情 報 端 末(PDA)が 普 及 しは じめ た.そ の 頃 に提 唱 さ れた 考 えが モ バ イ ルエ ー ジ ェ ン トで あ る.モ バ イ ル エ ー ジ ェ ン トとは ネ ッ トワ ー ク を移 動 して 仕事 をす る ソフ トウ ェア モ ジ ュ ー ル で あ る が,そ も そ もはモ バ イ ル環 境 の 利 用 者 が 情報 検 索 を行 う こ と を重 要 な ター ゲ ッ トと して考 え出 され た もので あ っ た.当 時General
Magic社
が 発 表 したTelescript
に そ の 考 え 方 を振 り返 っ て み よ う. モ バ イ ル環 境 で情 報 検 索 を行 う と き,①PDAで 信 回 線 の 品 質 や 料 金 が 心 配,と てTelescriptは,モ
は 複雑 な端 末 操 作 が 困 難,② 通
い う二 つ の 問 題 点 が 認 識 され て い た.こ れ に対 し
バ イ ルエ ー ジ ェ ン トに一 連 の 仕事 を代 行 させ て ネ ッ トワ ー ク に
一 旦 送 り出 し,後 で エ ー ジ ェ ン トが 報 告 す る 結 果 を受 け 取 る方 式 に よ る 解 決 を提 案 して い た . こ うす れ ば端 末操 作 は軽 減 され,検 索 中 の 通 信 回線 を切 断 す る こ と も可 能 と さ れ た.現 在 はJava言 ラー で あ り,モ
語 等 に よ るモ バ イ ルエ ー ジ ェ ン トの 存 在 は ポ ピュ
ビ リテ ィ とい うの は ソフ トウ ェ ア モ ジ ュ ー ル が 動 く とい う性 質 と
認 識 さ れ て い る.し か しモ バ イ ルエ ー ジ ェ ン ト初 期 に あ って は,動
き まわ る人 間
の 作 業 の サ ポ ー トを,ソ フ トウ ェ ア も動 き まわ っ て解 決 しよ う とい うア プ ロー チ が 提 案 され て い た こ と は興 味 深 い.な
お 現 在 は,ワ イ ヤ レス ・携 帯 通 信 で あ っ て
も帯 域 は よ り広 く安 定 した もの に改 善 され て きて お り,モ バ イ ル 情 報 検 索 の 制 約 は,端
末 の サ イ ズ等 を 除 く とデ ス ク トッ プの もの と本 質 的 に変 わ らな く な って き
て い る. この よ う に,モ バ イ ル情 報 検 索 は今 ま さ に黎 明 期 で あ り,し か も一 般 普 及 へ の 大 き な転 換 期 に あ る 非 常 に 楽 しみ な分 野 で あ る.こ の 章 を読 み 進 め,研
究 にビジ
ネ スの ア イ デ ア作 りに生 か して い た だ きた い.
4.2モ
バイル情報検 索の タスク
モ バ イル 環 境 の 進 歩 に よ り,モ バ イ ル とデ ス ク トップ の 環 境 の 差 は小 さ くな り つ つ あ る.し か し情 報検 索 は 比 較 的 「手 間 の か か る」仕 事 で あ り,モ バ イ ルで 実 行
す る の は容 易 と は限 らな い.そ の に は,そ
れ に も か か わ らず モ バ イ ル で 情 報 検 索 を行 い た い
れ な りの 理 由 が あ る は ず で あ る.ま た,モ バ イ ル に は マ ンマ シ ン イ ン
タ フ ェー ス上 の 制 約 が あ る の で,対
象 と な る タス ク を よ く分析 して ,ア プ リ ケ ー
シ ョ ンの 構 築 に役 立 て る必 要 が あ る . 図4.2に,携
帯 電 話 を利 用 した イ ン ター ネ ッ トア クセ ス に関 す る ア ンケ ー ト調 査
の結 果 を示 す . こ の結 果 か ら現 在 ∼将 来 に わ た っ て 利 用 意 向 が 高 い もの に は,ま ず 「メー ル」 が あ るが,そ
れ 以 外 はす べ て 「乗換 案 内 ・終 電 情 報 ・時 刻 表 等 」 「タ
ウ ン情 報(地 図 等)」 「グ ル メ ガ イ ド」 「ニ ュ ー ス ・天 気 予 報 」 な ど と,地 理 位 置 に (一 部 は 時 間 に も)依 存 した情 報 で 占 め られ て い る こ とが わ か る . ま た,将 来 的 な 利 用 意 向 が 高 い もの は 「チ ケ ッ ト予 約 」 「モ バ イ ルバ ンキ ン グ」 な ど,ト ラ ンザ ク シ ョ ン系 の サ ー ビ スが 目立 っ て く る. 次 に,図4.3に
モ バ イ ル コ ン テ ン ツの ニ ー ズ に つ い て の ア ン ケ ー ト結 果 を示 す.
本 ア ンケ ー ト結 果 は,2000年2月
に筆 者 らの グ ル ー プが 行 っ た ア ン ケ ー ト調 査 に
よる.利 用 してみ たい サ ー ビス を約60の
図4.2移
選 択 肢 の 中 か ら複 数 回答 して も らい,上
動 電 話 利 用 に 関 す る ア ン ケ ー ト調 査 結 果(「gooリ 2000よ
り)
サ ー チ」http://research.goo.ne.jp/,
図4.3モ
位20サ
バ イ ル コ ン テ ン ツ の ニ ー ズ(NTT,2000)
ー ビス を掲 載,回 答 者150名
をパ ソコ ンの 習 熟 度 の 高 低 で,先 行 層 と フ ォ
ロ ワ ー 層 に分 けて 分 析 を行 っ た. こ の 結 果 か ら も,さ ま ざ ま な モ バ イ ル コ ンテ ン ツの 中 か ら位 置 に 関 連 した情 報 の 利 用 意 向 が うか が わ れ る.さ
らに,パ
ソ コ ン には ま だ 習 熟 して い ない 「フ ォ ロ
ワー 層 」 は 「映 画 情 報 」 「観 光 地 情 報 」 「バ ー ゲ ン情 報 」 等 の 週 末 な どの 非 日常 的 な イベ ン トに 役 立 つ情 報 を使 い た い と して い る が,す
で にパ ソ コ ン を使 い こ な し
て い る 「先 行 層 」 は 「交 通 情 報 」 「ニ ュ ー ス,天 気 予 報 」 等 の 非 常 に現 実 的 な 日常 生 活 用 の 情 報 を欲 して い る こ とが わ か る. 以 上 か らモ バ イ ル情 報 検 索 の タス ク と して は,リ
ア ル タ イ ム性 が 高 く,地 理 位
置 に依 存 した 情 報 を探 す 作 業 が ター ゲ ッ トで あ る と考 え られ る.
4.3モ
バイル情報検索奄支える枝術
モ バ イ ル情 報 検 索 は,モ
バ イル 用 に 閉 じた シス テ ム 内 に限 定 され た情 報 源 に ア
クセ スす る だ け で は飽 き足 らず,広
く イ ン ター ネ ッ トに代 表 さ れ る オ ー プ ン ネ ッ
トワー クの 情 報 源 に ア クセ ス で き る こ とが期 待 され て い る.そ の 観 点 の 延 長 上 に, モ バ イ ル イ ン タ ー ネ ッ トア ク セ ス,す
な わ ちデ ス ク トッ プで 利 用 で きる イ ン ター
ネ ッ トサ ー ビス を モバ イル で も享 受 可 能 とす る,と
い う一般 的 な 目標 が あ る.本
節 で は,モ バ イル イ ン ター ネ ッ トア ク セ ス の技 術 につ い て解 説 を す る.
4.3.1モ
バ イ ル イ ン タ 一 ネ ッ トア ク セ ス
モ バ イル 環 境 で は一 般 に次 の よ うな技 術 的 な問 題 が 存 在 す る[1].モ バ イル 端 末 の 特徴 と して,デ ス ク トッ プ端 末 と比 べ る と, ・CPUの
処 理 能力 が 低 い
・ メモ リ量 が 少 ない ・ 消 費 電 力 の制 限 ・ デ ィス プ レイ サ イ ズが 小 さ い ・ 入 力 方 法 が 異 な る(電 話 の 数 字 ボ タ ン,音 声 入 力 等) さら に は ワ イ ヤ レス ネ ッ トワ ー クの特 徴 と して,有 線 ネ ッ トワ ー ク と比 較 す る と, ・通信 の帯域が狭 い ・遅延 の存在 ・ 低 い安 定 性 ・ 接 続 で きな い 場 合 が あ る(低 可 用 性) な どが あ げ られ る. これ ら の 問題 点 を解 決 し,モ バ イル か らイ ン ター ネ ッ トの情 報 に ア ク セ ス す る た め に,図4.4に
代 表 され る技 術 が 存 在 す る.
携 帯 電 話 会 杜 が 提 供 す る 公 衆 網 は,現 在 どこ で も利 用 可 能 な ワ イ ヤ レ ス通 信 イ ン フラ の代 表 格 で あ る.公 衆 網 に は 回線 交 換(例 えばPHSのPIAFS.最 で通 信 可 能)と パ ケ ッ ト交 換(例 え ばNTTド
コモ のDoPa.最
大64kbps
大28.8kbps)が
あ る.
また会 社 や 家 の 中,あ る い は ホ テ ル,空 港 等 の 施 設 内 で 管 理 され る 自営 網 の ワ イ ヤ レス通 信 が あ り,こ れ ら には,IEEE802.11bと が 代 表 的 で あ る.
い う規 格 の無 線LANやBluetooth
図4.4モ
バ イ ル イ ン ター ネ ッ トア ク セ ス を 支 え る技 術
ワ イ ヤ レ ス 通 信 イ ン フ ラ の 上 に は,WAPと
iモ ー ド に 代 表 さ れ る ア プ リ ケ ー
シ ョ ン用 の プ ロ ト コ ル が 定 義 さ れ て お り,こ の プ ロ トコ ル はWWWと
携帯電話 の
間 の プ ロ ト コ ル 変 換 を 行 う. こ の よ う な イ ン フ ラ 上 で 色 々 な コ ン テ ン ツ が や り取 り さ れ,さ ス が 実 現 さ れ て い る.こ Web
こ で は,WWWの
ま ざ ま なサ ー ビ
標 準 化 団 体 で あ るW3C(World
Consortium.http://www.w3.org/)を
中 心 に,コ
ン テ ン ツ を や り取 りす る た
め の 表 現 方 法 の 標 準 が 提 案 さ れ て お り,HTMLやXMLを ベ ー ス と し た さ ま ざ ま な 技 術 が 生 ま れ て い る.情 末 間 の コ ン テ ン ツ の や り取 り で あ る の で,コ
Wide
は じめ これ ら の標 準 を 報 検 索 の 基 本 要素 は サ ーバ と端
ン テ ンツ 表 現 の 標 準 化 は モ バ イ ル 情
報 検 索 を 実 現 す る た め の 重 要 な 鍵 で あ る. 現 在,広 は,大
く使 わ れ て い る モ バ イ ル イ ン タ ー ネ ッ トア ク セ ス 用 の 携 帯 情 報 端 末 に
き く分 け て 携 帯 電 話 とPDAが
あ る.Webブ
ラ ウ ザ フ ォ ン)は 近 年 驚 異 的 な 普 及 を み せ,現 い る.1999年2月 月 で2,300万
ラ ウ ザ を 搭 載 し た 携 帯 電 話(ブ
在 モ バ イ ル情 報 端 末 の 主力 とな って
に サ ー ビ ス が 開 始 さ れ たNTTド
コ モ の iモ ー ドは,2001年4
契 約 を 越 え た と公 表 さ れ,au,J-PHONE等
わ が 国 で は4,000万
の サ ー ビ ス を 含 め る と,
に 近 い 人 達 が 携 帯 電 話 か ら の イ ン タ ー ネ ッ トア ク セ ス が 可 能
な 状 況 に な っ て い る.ま
た,従
て 独 自 の 地 位 を 築 い て き たPDA類
来 か ら の 手 帳 や 小 型 のPCに も,携
代 わ り得 る も の と し
帯 電 話 等 を 用 い て イ ン タ ー ネ ッ トア ク セ
ス に 用 い ら れ て い る.さ
ら に はGPSが
組 み 込 ま れ て い るPDAも
バ イ ル 情 報 検 索 に と っ て プ ラ ス の 状 況 が で き つ つ あ る.こ
現 れ る な ど,モ
の ほ か に,車
載の カー
ナ ビ ゲ ー シ ョ ン シ ス テ ム に も イ ン タ ー ネ ッ トア ク セ ス を 可 能 と す る も の が 存 在 し て い る.
4.3.2モ
バ イ ル 用 ア プ リ ケ ー シ ョ ン プ ロ トコ ル
モ バ イ ル イ ン タ ー ネ ッ トア ク セ ス を 支 え る 技 術 の 中 で,代 ン 用 の プ ロ ト コ ル,i モ ー ド[2]とWAP[3]に 1999年
よ り,移
あ る.こ
メ ー ル やWWWな
つ い て 説 明 す る.
動 体 通 信 会 社 は 相 次 い で 携 帯 電 話 か ら の イ ン タ ー ネ ッ トア ク セ
ス サ ー ビ ス を 開 始 し た.代 プ のEZWebが
表 的なア プリケーシ ョ
表 的 な も の に,NTTド れ ら は,携
コ モ の iモ ー ドやKDDIグ
ルー
帯 電 話 に 搭 載 さ れ た ブ ラ ウ ザ か ら容 易 に 電 子
ど の イ ン タ ー ネ ッ トサ ー ビ ス の 利 用 を 可 能 に し,ど
瞬 時 に お 店 の 電 話 番 号 や 終 電 車 の 時 刻 が わ か る な ど,情
こにいて も
報 検 索 を画 期 的 に 身 近 な
も の に さ せ た. iモ ー ドはNTTド
コ モ が 開 発 し た 独 自 方 式 を,EZWebはWAPフ
規 定 して い るWAP(Wireless 4.5と 図4.6で
Application
iモ ー ド方 式 とWAPの
ケ ー シ ョ ン プ ロ ト コ ル の 役 割 は,イ
Protocol)と
ォー ラ ム が
い う 方 式 を 使 っ て い る.図
仕 組 み を 概 説 す る.一
般 に モバ イ ル ア プ リ
ン タ ー ネ ッ ト等 で 構 築/運 用 さ れ て い る サ ー ビ
ス を移 動 体 通 信 網 側 に あ る ゲ ー トウ ェ イ を 使 っ て, ① 移 動 体 通 信 網 に 適 し た プ ロ トコ ル に 変 換 ② コ ンテ ン ツ を携 帯 電 話 上 の ブ ラ ウザ に適 した表 現 形 式 に変 換 す る こ と で あ る.一 ば,携
定 の 形 式 で コ ン テ ン ツ を 作 成 し て イ ン タ ー ネ ッ トで 公 開 す れ
帯 電 話 会 社 に 設 け ら れ て い る ゲ ー ト ウ ェ イ を 介 し て,携
帯 電 話 か ら コ ンテ
ン ツ を 見 て も ら う こ と が 可 能 で あ る. WAPと
iモ ー ドの 方 式 の 差 で 特 徴 的 な こ と は,i モ ー ドは 普 及 して い る イ ン タ ー
ネ ッ トサ ー ビ ス に 沿 っ た 形 式 を,WAPは 重 要 視 し て い る 点 で あ る.例 のWeb作
ワ イ ヤ レス 通 信 の 効 率 の よ さの 追 及 を
え ば コ ン テ ン ツ 作 成 言 語 に 関 して,i モ ー ドは 一 般
成 者 も利 用 が 容 易 なHTMLの
サ ブ セ ッ トを 用 い て い る.他
方WAPは,
図4.5
図4.6
WMLと
iモ ー ドとWAPの
iモ ー ドとWAPの
い う独 自のXMLベ
ウ ンロ ー ド単 位)とCard(1
仕組 み
プ ロ トコル ス タ ッ クの違 い
ー ス の 言 語 を用 い て い る.WMLは,Deck(一
度のダ
画 面 の単 位)と い う概 念 が あ り,さ らに これ らは バ イ
ナ リ表 現 が で きる た め,通 信 の効 率 を考 え た 作 りに な って い る.今 後 は,両 者 相 互 の 利 点 を取 り入 れ る形 で の協 調 的 発 展 が 期 待 さ れ て い る.
4.3.3コ
ンテ ン ツ記述 形 式 の 標 準 化
前 項 で は,携 帯 電 話 に よ る イ ン タ ー ネ ッ トサ ー ビス に はHTMLの WMLと
サ ブ セ ッ トや
い う言 語 が コ ンテ ン ツ の 記 述 に用 い られ て い る こ と を説 明 した が,コ
テ ン ツの 記 述 形 式 を どの よ う にデ ザ イ ンす る か は,Webを 書 す べ て にか か わ る課 題 で あ る.こ
こで は,W3Cで
ン
は じめ再 利 用 さ れ る 文
行 わ れ て い る モ バ イ ル ア クセ
ス に 関 す る議 論 の紹 介 を中 心 に,モ バ イ ル 向 け コ ン テ ン ツの 記 述 形 式 に つ い て 説 明 す る. まず,モ
バ イ ル用 の端 末 は,デ
ィス プ レイ サ イ ズ が 小 さい,メ モ リ量 が 少 な い
な どの理 由 か ら,す べ て のHTMLフ
ァ イ ル を表 示 で きる とは 限 ら ない.そ
こ で,
い くつ か の 携 帯 情 報 端 末 向 け の 記 述 言 語 が 提 案 され て い る. コ ン パ ク トHTML(Compact
HTML(1998))
コ ンパ ク トHTMLはHTMLの
サ ブ セ ッ トで,HTMLの
の 中 で,Table,Frameな
簡 易 版 に あ た る.HTMLの
どが 省 略 さ れ て い る.i モ ー ド用 のHTMLは
機能
コ ン パ ク トHTML
を ベ ー ス と し て い る.http://www.w3.org/TR/1998/NOTE-compactHTML-19980209
WML(Wireless
Markup
Language2.0(2001))
XMLに
基 づ い た 記 述 言 語 をWAPで
Card(1
画 面 の 単 位)と
用 い る た め に 設 計.Deck(一
い う概 念 を 持 っ て い る.現
の 前 身 で あ るHDML(Handheld
Device
段 階 のWAP対
Markup
度 の ダ ウ ン ロ ー ド単 位)や 応 商 用 サ ー ビ ス で は,WML
Language.Phone.com社
提 案 の 規 格)と
い う言 語 が 用 い ら れ て い る こ とが 多 い.http://www.wapforum.org/what/technical.htm
上 記 の よ う にい くつ か の 言語 が実 際 の モ バ イル 情 報 サ ー ビス に使 わ れ て い る が, サ ー ビス の 提 供 者 に とっ て は,各 サ ー ビス の 利 用 者 に使 っ て も ら う た め に複 数 の フ ォー マ ッ トの コ ン テ ン ツ を用 意 しな け れ ば な らな い とい う負 担 が 生 じ る.そ こ で,現 在 考 え られ て い る 解 決 策 は, ●コ ンテ ン ツ側:ペ
ー ジ の表 示 形 式(ス タ イル)を コ ンテ ンツ と は独 立 に作 成 し,
ス タ イ ル を 変 更 す る こ とで 端 末 の バ リエ ー シ ョ ン に対 応 す る. ●端 末側:端
末 は 自分 の 表 示 能 力 を サ ー ビ ス側 に伝 え,ふ
さわ しい 形 式 の コ ンテ
ン ツ を送 っ て も ら う. とい う もの で あ る.前 者 に対 応 す る考 え 方 が ス タ イ ル シ ー ト,後 者 がCC/PPで あ る. ス タ イ ル シ ー ト(Cascading ペ ー ジ の マ ー ジ ン,フ HTML用
Style Sheet,level2(1998))
ォ ン トサ イ ズ,色
のCSS(Cascading
Style
な ど,表 示 形 式 を コ ンテ ン ツ と独 立 に 記 述 す る 方 法.
Sheet)は,HTMLの
ヘ ッ ダ 部 分 に 定 義 で き,本
文を
変 更 せ ず に 表 示 形 式 を 変 更 す る こ と が で き る.http://www.w3.org/TR/REC-CSS21
CC/PP(Composite
Capability/Preference
Profile(1999))
端 末 の 表 示 能 力 を サ ー ビ ス 提 供 者 に伝 え る 仕 組 み.表 ル デ ー タ は ネ ッ トワ ー ク に 保 存 す る.端 伝 え る.サ
示 能 力 の 属 性 を定 義 し た プ ロ フ ァ イ
末 は プ ロ フ ァ イ ル をURLで
サ ー ビス提 供 者側 に
ー ビ ス 側 は プ ロ フ ァ イ ル に 応 じた コ ン テ ン ツ を 端 末 側 に 送 る.従
で は 端 末 属 性 を 検 索 条 件 に 含 め て 送 る ケ ー ス が あ っ た が,そ え る.http://www.w3.org/TR/NOTE-CCPP
来,情
報検 索
の 部 分 を独 立 させ た もの と い
コ ン テ ン ツ の 記 述 形 式 に関 す る技 術 は検 索 とい う作 業 の 中 で 情 報 を探 し出 し, 入 手 す る と い う系 の 最 終 過 程 で 重 要 な 意 味 を持 つ もの で あ る.
4.4位
置情報の処理技術
前 節 で は,モ
バ イ ル 共 通 の基 盤 技 術 と して,モ バ イ ル イ ン ター ネ ッ トア ク セ ス
につ い て 説 明 した.本 節 は,よ
り情 報 検 索 に密 接 な 問 題 と して,位 置 情 報 の 処 理
技 術 に 関 して 説 明 す る. 情 報 検 索 が モ バ イ ル 環 境 に 持 ち 出 さ れ る と,さ
ま ざ ま な外 部 条 件 が 変 化 す る.
モ バ イ ル で 通 信 や 端 末 環境 にハ ンデ が あ る の は 必 然 的 で あ り,今 まで 紹 介 して き た技 術 は そ れ ら に一 つ ひ とつ 回 答 を与 え る もの で あ っ た.し か し外 部 条 件 の 変 化 は,必 ず し もマ イ ナ ス の面 ば か りに お い て で は ない.モ
バ イル 環 境 を魅 力 的 に し
て い る 要 素 の 一 つ に,位 置 が変 化 す る とい う性 質 が あ る.し か も位 置 情 報 はGPS な どの シ ス テ ム を使 え ば,測 定 が 可 能 な 情 報 で あ る.情 報検 索 は 位 置 情 報 を使 い こ な す こ と に よっ て よ り魅 力 の あ る ジ ャ ン ル に な り,情 報 検 索 は 生 活 に よ り密 着 した もの に な り得 るの で あ る. こ こ か らは 位 置 依 存 型 検 索(Location
Based Search)を 軸 に,モ バ イ ル 情 報 検 索
を考 え た い.
4.4.1測
位技術
モ バ イ ル端 末 の場 所 を計 測 す る測 位 方 式 に は,人 工 衛 星 を用 い るGPS方 帯 電 話 等 の通 信 基 地 局 の位 置 を利 用 す る方 式,建
式,携
物 等 に 付 け られ た微 弱 電 波 を送
受 信 す る マ ー カ を利 用 す る 方 式 な どが 知 ら れ て い る(図4.7). GPS(Global
Positioning System)方
式[4]
米 国 国 防 総省 が 管 理 す る衛 星 か ら電 波 を受 信 して,受 信 機 側 で位 置 を測 定 す る.最 低 四 つ の 衛 星 を と らえ る こ とに よ り,緯 度,経 度,高 度 お よび時 間 を知 る こ とが で きる.GPSの 測 位精 度 は 現在 水 平方 向10メ
ー トル程 度 で あ り,さ らな る精 度 向上 が計 画 され て い る.さ
らに は,携 帯 電話 等 に よる ネ ッ トワー ク支 援GPSに
よ り,省 電力,感 度 向 上 を実 現 し,モ
バ イル端 末 で の利 便 性 を向上 す る技 術 が 開発 され てい る.
携 帯 電 話 等 の通 信 基 地 局 利用 測 位 方式 携 帯 電 話 な どの 基地 局 の位 置 を利 用 して測 位 す る.最
もシ ンプル な もの で は,基 地 局の 通
信 領域(セ ル)を 使 っ た測 位方 法 が あ り,国 内で もPHSな
どでサ ー ビス され てい る.PHS
は最 大 で も数 百 メ ー トル程 度 とセ ルの 半径 を小 さ く設定 してい る の で,こ の 方 法 で の測 位 に向 い て い る.こ の セ ルID方 す る方 法(TDOA:Time
式 に加 え,複 数 の基 地 局 か ら到達 す る電 波 の 時 間差 を利 用
Difference Of Arrival),電 波 の受 信 角 度 を利 用 す る方法(AOA:
Angle Of Arrival)な どの 方式 が あ る.
図4.7測
4.4.2位
位 方 式 の 特徴
置 情 報 の記 述 形 式
モバ イ ル ユ ー ザ が 自分 の 現 在 地 周 辺 の 情 報 を検 索 す る こ と に代 表 され る位 置 依 存 型 検 索 の 基 本 は,検 索 者 が 検 索 を した い 位 置 を検 索 サ ーバ に伝 え,サ ー バ は指 定 さ れ た位 置 に ふ さ わ しい 検 索 結 果 を返 却 す る こ とで あ る.こ の た め,検 索 者 が 検 索 サ ー バ に送 信 す る検 索 条件 と,検 索 シス テ ム に 蓄 積 され て い る検 索 対 象 の 双 方 と もに位 置 情 報 の 記 述 方 法 が 定 義 され て い る必 要 が あ る. 位 置 情 報 と して 表 現 す べ き属 性 の 例 と して は 座 標 値,そ 系 名(WGS84な
ど),地 理 領 域(ポ
理 位 置 を 直 接 表 現 す る もの,あ
の 座 標 を表 現 す る 座 標
リ ゴ ン),移 動 方 向,移 動 速 度 な ど とい った 物
るい は住 所 名,郵 便 番 号,最
寄 り駅 名 等 とい った
位 置 を表 現 す る文 字 列 情 報 な どが 存 在 す る. これ らの 属 性 は,検 索 問 合 せ 時 に は デ ー タベ ー ス へ の 検 索 条 件 と な り,検 索 結 果 と して返 す 場 合 に は,フ
イル タ リ ン グ(例:距
ビゲ ー シ ョ ン な どに 用 い る こ とが で き る.
離 順 に表 示),地
図 上 に表 示,ナ
図4.8 POIXを
使 った位 置 表 現形 式 の例
端 末 か ら サ ー バ へ 検 索 条 件 と して 送 ら れ る 問 合 せ の 形 式 と し て 親 しみ や す い も の に は,URL(URI)を
利 用 し た 位 置 情 報URLが
置 を 指 定 し,NとEで
あ る.posと
い うパ ラ メ ー タで 位
そ れ ぞ れ 北 緯 と 東 経 の 度 数 を 表 現 す る.
http://www....co.jp/a.cgi?pos=N40.29.55E139.43.12 一 方
,検 索 シ ス テ ム に 蓄 積 さ れ て い る 検 索 対 象 情 報 は,XML形
と が 主 流 と な っ て い る.図4.8にPOIXと
式 で表 現 す る こ
い う 言 語 で 東 京 駅 の 位 置 を 表 現 した 例
を 示 す. 上 記 の 2 例 を 含 む さ ま ざ ま な 仕 様 が,WWW関 メ ー カ ー,携
帯 端 末 機 メ ー カ ー,通
信 会 社,地
連 団 体,カ 図 会 社 な ど,幅
ー ナ ビゲ ー シ ョ ン 広 い コ ミュ ニ テ イ
か ら提 案 さ れ て い る. モバ イル ツ ール 向 け位 置 情報URL[モ 位 置 の検 索 要 求 をURIを
バ イル オ フ イ ス推進 協 議会(MOPA)]
使 って 表 現す る仕様.位 置 の ほか に,地 図 や タウ ン情 報 をサ イズ
や カ テ ゴ リ を 指 定 して 検 索 の 要 求 を 記 述 す る こ と が 可 能.http://www.jbma.or.jp/.
ナ ビ研 フ ォ ー マ ッ ト カ ー ナ ビ ゲ ー シ ョ ン用 の 共 通 規 格(ナ
ビ研 ソ フ ト作 成 ガ イ ドブ ッ ク S 規 格(1997)).コ
テ ン ツ の フ ォ ー マ ッ トを は じ め て 統 一 し,位 類 コ ー ドな ど を 統 一 し,異
POIX(Point
な る 機 種 間 の 互 換 性 を 実 現 し た.http://www.naviken.or.jp.
Of Interest eXchange
Language
Specification)[MOSTEC]
モ バ イ ル 標 準 化 検 討 委 員 会(MOSTEC)に す る た め のXMLベ
ン
置 な どの表 現 方 法 や 地 図上 に表 示 す る建 物 分
ー ス の 言 語 仕 様.元
1 点 の 位 置 の 表 現 だ け で な く,移
よ り 提 案 さ れ た,位
置 に 関 連 した 情 報 を 交 換
々 カ ー ナ ビ ゲ ー シ ョ ン 用 に 考 え られ た 仕 様 で,
動 方 向 ・速 度 ・手 段 や ル ー トを 表 現 で き る こ と が 特 徴.
http://www.w3.org/Submission/1999/06/.
NVML(Navigation
Markup
Language)[富
士 通]
ナ ビ ゲ ー シ ョ ン 用 の 情 報 を 表 現 す る た め のXMLベ で な く,ナ
ー ス の 言 語 仕 様.位
置関連情報だけ
ビ ゲ ー シ ョ ン に 付 随 し た 移 動 経 路 中 に 表 示 す る メ ッ セ ー ジ 等 も 記 述 で き る.
http://www.w3.org/TR/NVML
G-XML[財
団 法 人 デ ー タ ベ ー ス 新 興 セ ン タ ー]
イ ン タ ー ネ ッ ト上 で 地 理 情 報 の 相 互 流 通 す る た め のXMLベ 図 上 の コ ン テ ン ツ を 共 通 の フ ォ ー マ ッ トで 記 述 で き る.JIS化
ー ス の プ ロ トコ ル.地
図 と地
され る こ とが 閣議 決 定 され
て い る.http://gisclh.dpc.or.jp/gxml
GML(Geography
Markup
こ ち ら もGISな
Language)[Open
GIS
Consortium]
ど の 位 置 情 報 を 相 互 に 流 通 す る た め のXML規
格.G-XMLと
統 一国 際 標
準 を 開 発 す る こ と で 合 意.http://www.opengis.org/.
iナ ビ リ ン ク[NTTド
コ モ]
iモ ー ド通 信 カ ー ナ ビ に よ る 位 置 依 存 型 検 索 と結 果 を カ ー ナ ビ 地 図 へ 表 示 す る た め のHTML 拡 張 ベ ー ス の 仕 様.
4.4.3位
置 情 報 交 換 の プ ラ ッ トフ ォー ム
端 末 の 位 置 情 報 を使 っ た サ ー ビス の利 用 者 ・サ ー ビ ス提 供 者 が シ ー ム レス に位 置 情 報 を取 得 で き,さ 望 まれ て い る.す
ま ざ ま な位 置 に 関 す る シ ス テ ム を相 互 に運 用 で き る こ とが
な わ ち,端 末 上 の ア プ リ ケ ー シ ョンや ネ ッ トワ ー ク上 の サ ー ビ
スが,端 末 の種 類 や 測位 方 法,移 動 通 信 の 方式 の 差 異 に と らわ れ ず,共 通 の イ ン タ フ ェ ー ス で 移 動 端 末 の位 置 情 報 を得 られ る こ と が 求 め られ る.ま
た,ア
プ リケ ー
図4.9位
置 情 報 プ ラ ッ トフ ォ ー ム の 概 念 の 例
シ ョ ン の レ ベ ル で は 位 置 情 報 表 現 の 相 互 変 換,す だ け で な く,住
所,郵
便 番 号,駅
な わ ち,緯
度 経 度 な ど の座 標 系
ラ ン ドマ ー ク な ど の 位 置 を 表 現 で き る 各 種 形 式
に 相 互 に 変 換 で き る こ と が 求 め ら れ る. 図4.9に
位 置 情 報 プ ラ ッ ト フ ォ ー ム の 概 念 を 示 す.位
シ ョ ン や サ ー ビ ス は,プ 情 報 を 取 得 す る.な
置 情 報 の 利 用 ア プ リケ ー
ラ ッ トフ ォ ー ム に 共 通 の プ ロ トコ ル で ア ク セ ス し て 位 置
お,こ
の 実 現 に は,プ
ラ イ バ シ保 護 の た め に 細 か な セ キ ュ リ
テ イ機 構 が 用 意 さ れ て い る こ と が 前 提 と な る. こ の プ ラ ッ ト フ ォ ー ム に つ い て 検 討 を 行 っ て い る 代 表 的 な 団 体 に な ど が あ る.DLP(DoCoMo
Location
Platform)は,NTTド
地 図 会 社 や コ ン テ ン ツ プ ロ バ イ ダ,GPSや ア ム で あ る.同
端 末 の ベ ン ダ な ど か らな る コ ン ソー シ
様 な 目 的 を も っ た 団 体 に,モ
心 に したLIF(Location
Interoperability
ム の 検 討 が 行 わ れ て い る.
,DLP,LIF
コモ を 中 心 に 国 内 の
ト ロ ー ラ,ノ
Forum)が
あ り,位
キ ア,エ
リクソ ンを中
置 情 報 プ ラ ッ トフ ォー
4.5 位置 に基づく情報検索 探 し もの や調 べ ご と とい った 情 報 検 索 は,そ
もそ も地 理 的 な位 置,す
分 の い る場 所 と密 接 に 関係 して い る行 為 で あ っ た.例
なわち 自
え ば,外 国 の こ と を調 べ た
け れ ば そ の 国 に 行 か ね ば な ら な い よ う に,検 索 者 が 情 報 源 に地 理 的 に 近 付 く必 要 が あ っ た.書 物 が 発 達 して 本 や 資 料 を読 む こ とに よ っ て 調 べ ご とが で き る よ う に な っ て も,一 人 の 人 間が 手 元 に置 い て お け る 図書 の 数 に は 限 界 が あ り,そ の た め 図 書 館 等 に 出 向 か ね ば な らな い とい った 位 置 に 関 す る制 限 は 残 っ た の で あ る. 各 種 の オ ン ラ イ ンサ ー ビス や イ ン ター ネ ッ トが 普 及 した 今,多 化,デ
くの情 報 が 電 子
ー タ ベ ー ス 化 さ れ,情 報 検 索 が 地 理 的 位 置 の 制 約 か ら逃 れ る こ とが 可 能 に
な っ た の は ご存 知 の 通 りで あ る.こ の こ と に よ り私 た ち は,地 球 の裏 側 の 情 報 で も検 索 す る こ とが 可 能 に な った.地 理 的 位 置 を克 服 した の が イ ン ター ネ ッ トの 功 績 で あ るが,そ
れ で も実 際 に 日常 生 活 で 必 要 な情 報 は,地 理 的 に近 い情 報 が 主 と
な る こ とが 多 い こ と に気 が つ く.こ の 観 点 か ら も位 置 依 存 型 情 報 検 索,Location Based Searchは 注 目 され て い る の で あ る.
4.5.1 位 置依 存 型 情 報 検 索 の モ デ ル 地 理 位 置 を用 い た 情 報 検 索 の モ デ ル に は,大 報 検 索 は,ユ
き く 2通 り存 在 す る(図4.10).情
ーザ が 情 報 提 供 側 に リ クエ ス トを 出 して 情 報 を受 け取 るPULLモ
ル と,情 報 提 供 側 が ユ ー ザ に 情 報 を送 りつ け るPUSHモ あ る が,位
デ
デ ル に分 類 され る こ とが
置 依 存 型 情 報 検 索 も 同様 に分 類 す る こ とが 可 能 で あ る.
位 置依存型情
報PULLモ
デ ル は,利 用 者 が 自分 の現 在 地 の 緯 度 経 度 な ど の位 置
情 報 を検 索 条件 と して検 索 サ ー バ に 送 る と,検 索 サ ーバ 側 は位 置 情 報 をキ ー に検 索 を行 い,結 化,す
果 を利 用 者 に 返 す モ デ ル で あ る.サ ー バ は,コ
ンテ ンツ を位 置 情 報
な わ ち 緯 度 経 度 な どの 位 置 情 報 を属 性 と して 付 与 して,デ
ー タ ベ ー ス に保
存 して お く必 要 が あ る.通 常 の 地 図 情 報 サ ー ビス,電 話 帳 検 索 サ ー ビス な どが こ れ に相 当 す る.こ の モ デ ル に関 して は,後 の モバ イ ル イ ンフ ォサ ー チ の 節 で 詳 し く説 明 を行 う.
図4.10 地 理 位 置 を用 い た情 報 検索 のモ デ ル
一 方,位 置 依 存 型PUSHモ
デ ル は よ り実 世 界 に近 い モ デ ル で あ る.情 報 提 供 側
は そ れ ぞ れ の 位 置 に ふ さ わ しい 情 報 を保 有 してい て,さ
ら に 自分 自 身 に 地 理 的 に
「近 い 」領 域 に情 報 を通 知 で きる 仕 組 み を持 つ.利 用 者 は情 報 源 に 「近 づ く」 こ と に よ り情 報 を取 得 で き る. こ の モ デ ル を微 弱 電 波 を使 っ て 実 現 す る例 を考 え る.実 世 界 で は,私
たちはバ
ス停 に近 づ くとバ ス停 に 書 か れ て い る時 刻 表 を読 む こ とが で き る.こ れ を微 弱 電 波 の 利 用 で 考 え て み る と,バ ス停 は 情 報 源 で,情 報 源 は微 弱 な 電 波 を 出 して い る, 利 用 者 は こ の 電 波 を受 信 で き る端 末 を持 ち歩 い て い て,利 用 者 が バ ス停 に近 づ く こ と に よ り,時 刻 表 を取 得 で き る とい う こ と に な る に この 方 法 は,室 ケ ー シ ョン に は 比 較 的 容 易 に 導 入 で き る可 能 性 が あ る.例
内の アプ リ
え ば美 術 館 で 展 示 物 ご
とに 解 説 を聞 い て も ら う た め に,微 弱 電 波 で 解 説 を放 送 して お くな ど と い っ た こ とが 可 能 で あ る. 同 じモ デ ル を,携 帯 電 話 の 基 地 局 や 電話 の 交 換 局 の位 置 を用 い て 実 現 す る こ と も可 能 で あ る.代 表 的 な もの に,電 話 に よ る天 気 予 報 の 案 内 が あ る.こ に はPUSHモ
デ ルで は な い が,特 番 の177に
府 県 の 予 報 を 聞 くこ とが 可 能 で,最
れは正確
電 話 をか け る だ け で 自分 の い る都 道
古 の位 置 依 存 型 検 索 の 一 つ とい え る.ま た,
携 帯 電 話 の 情 報 サ ー ビスで も新 しい 情 報 提供 の 仕 組 み が提 案 され て い る.例 え ば,
J-フ ォ ン が 提 供 して い るJ-ス デ ル で 配 信 で き,し ス で,大
カ イ ス テ ー シ ョ ン[5]は,基
地 局 か ら情 報 をPUSHモ
か も エ リ ア ご と に 異 な る 情 報 を 配 信 す る こ とが で き る サ ー ビ
変 魅 力 的 な 仕 組 み で あ る.
さ らに この モ デ ル を イ ン タ ー ネ ッ トの枠 組 で 考 え る こ と も研 究 され て い る.も し イ ン ター ネ ッ ト上 の ホ ス トに地 理 位 置 が 定 義 さ れ れ ば,イ け で も この モ デ ル の実 現 が 可 能 に な る.ホ ス トのIPア
ン タ ー ネ ッ トの 中 だ
ドレ ス を 管 理 す る ネ ー ム
サ ー バ の よ う に,ホ ス トの 地 理 位 置 登 録 機 構 を イ ン ター ネ ッ ト上 に構 築 す る こ と が研 究 され て い る.こ れ が 実 現 され れ ば,登 録 さ れ て い る 世 界 中 の ホ ス トの 現 在 位 置 が 得 られ た り(位 置 の 正 引 き),指 定 した 位 置 か らそ の 場 所 に存 在 す る移 動 ホ ス トの集 合 を得 る こ とが 可 能 に な る(同 逆 引 き).一 定 の 認 証 技 術 と組 み 合 わ せ れ ば,自
由 に地 理 的 近傍 にあ る ホ ス トと通 信 が 可 能 とな り,位 置 に基 づ く通 信 の モ
デ ル が実 現 さ れ る. な お,こ れ らの 例 か らで は単 純 な情 報PUSHサ て は物 足 りな く感 じ るか も しれ な い が,こ
ー ビス に しか み え ず,検 索 と し
の よ うな 自分 の コ ンテ ン ツ を地 理 的 近
傍 に 通 知 ・放 送 す る こ とが で きる 情 報 源 が 多 数 存 在 し,ち ょ う ど店 先 の 呼 び 込 み の よ う に一 斉 に ネ ッ トワ ー ク 上 や 無 線 で情 報 を発 信 す る状 況 を考 え て み よ う.そ の空 間 に利 用 者 が 入 り情 報 を取 捨 選 択 す る よ うな,よ
り実 世 界 的 な 情 報 検 索 が 今
後 出 現 す る可 能 性 は 十 分 あ り う る の で あ る.
4.5.2モ
バ イ ル イ ン フ ォサ ー チ
この 項 で は,筆 者 らが 実 験 サ ー ビス と して運 用 して い る位 置 依 存 型 の サ ー チ エ ンジ ン,「 モ バ イ ル イ ン フ ォサ ー チ 」 を題 材 に,位 置 依 存 型 情 報 検 索 に つ い て 考 え た い. (1)モ バ イ ル イ ン フ ォサ ー チ の 概 要 モ バ イ ル イ ン フ ォサ ー チ は,イ 理 す る 技 術 の 追 求 と,実
ン タ ー ネ ッ トに 存 在 す る 雑 多 な 情 報 を 位 置 で 整
践 的 なモ バ イ ル 用 ア プ リケ ー シ ョ ンの 開 発 運 用 を主 な 目
的 と し て 行 わ れ て い る 実 験 サ ー ビ ス で あ る[6](http://www.kokono.net/). モ バ イ ル イ ン フ ォ サ ー チ の 最 初 の バ ー ジ ョ ン は,1997年
に さ か の ぼ る こ とが で
きる.当 時 は イ ン ター ネ ッ トに お け る位 置 依 存 型検 索 サ ー ビ ス の 萌 芽 期 で,タ
ウ
ン情 報 と呼 ば れ る 電 話 番 号 や 地 図情 報 を表 示 す るサ ー ビ ス が ポ ピュ ラ ー に な って い た.し か しそ れ らの サ ー ビ ス に は,利 用 者 の 現在 位 置 を 自動 的 に 測 位 して 情 報 を提 供 す る仕 組 み は な く,住 所 や駅 名 等 を入 力 す る こ と に よ って 行 わ れ る検 索 で あ っ た.そ NTTパ
の 頃,現
在 位 置 が わ か るPHSが
ー ソナ ル 中央(現NTTド
市 場 に現 れ は じめ た.最 初 の も の が
コ モ)の 試 験 サ ー ビス(PHS位
用 化 試 験)で あ り,モ バ イ ル イ ン フ ォサ ー チ はNTT研
置 情 報 サ ー ビス実
究所 とNTTパ
ー ソ ナ ル社
と の共 同 実 験 の形 で 開 始 され た. モ バ イ ル イ ン フ ォ サ ー チ 利 用 画 面 の 例 を 図4.11に,シ 示 す.プ
ス テ ム 構 成 を 図4.12に
ロ トタ イ プ の モ バ イ ル イ ン フ ォ サ ー チ は 次 の よ う な 手 順 で 使 う こ と が で
き る.
① 利 用 者 が 自分 の端 末 のGPSやPHSを
利 用 して現 在 位 置 を測 位 して,緯 度 経
度 を得 る. ② 利 用 者 が イ ン タ ー ネ ッ トに あ る モ バ イ ル イ ン フ ォサ ー チ に 接 続 す る.
(a) 測 位 済 の 場 合 は,測 位 した 緯 度 経 度 を 指 定 して接 続 す る. (b) 測 位 済 で な い場 合 は,住 所 メニ ュ ー や駅 名 な どで 現 在 地 ・好 み の 場 所 を指 定 す る. ③ サ ーバ が 指 定 され た 位 置 に 関 す る イ ンデ ック ス ペ ー ジ(図4.11)を ペ ー ジ上 部 に は指 定 され た場 所 の位 置 情 報(緯 度 経 度 ,住 所,最 自動 的 に表 示 され,残
表 示 す る.
寄 り駅 な ど)が
り下 半 分 に は 各 種 サ ー ビス を呼 び出 す リ ン クボ タ ンが 表
示 され る. ④ 地 図や 電 話 帳情 報,天 気 等 のサ ー ビス を選 んで ボ タ ン を押 す だ け で,イ ン ター ネ ッ ト上 の サ ー バ か ら現 在 地 に関 す る情 報 を表 示 す る こ とが で き る. モ バ イ ル イ ン フ ォ サ ー チ で 提 供 さ れ て い る サ ー ビ ス の 中 に,「 こ こ の サ ー チ 」 と 名 づ け ら れ た 検 索 が あ る[7].こ
れ は 位 置 依 存 型 サ ー チ エ ン ジ ン で あ り,多
で 通 常 の サ ー チ エ ン ジ ン と 共 通 点 が あ る.一 トか らWebペ
ー ジ を 集 め る 機 能(ク
般 に サ ー チ エ ン ジ ン は,イ
ロ ー ラ),集
め たWebペ
くの 点
ンターネ ッ
ー ジ を 解 析 して 索 引
図4.11
図4.12
化 す る機 能(ア
モ バ イル イ ンフ ォサ ーチ の 画面 例
モバ イル イ ンフ ォサ ーチ の アー キ テ クチ ャ
ナ ラ イ ザ),な
らび に検 索 機 能(デ
ー タベ ー ス)を 持 っ て い る が,
「こ この サ ー チ」 は 各 サ ー チ エ ンジ ンの機 能 にお い て,す べ て の 情 報 を緯 度 経 度 の 位 置情 報 で 管 理,検
索 表 示 す る とい う特 徴 を持 っ て い る.
・ ク ロ ー ラ(あ か らWebペ
る い は ロ ボ ッ ト,ス パ イ ダ)と 呼 ば れ る モ ジ ュ ー ル を 持 ち,イ ー ジ を 収 集 す る.こ
る こ と に よ り,地
名 な ど の 位 置 情 報 を 含 ん だ ペ ー ジ を選 択 的 に 収 集 す る こ と が で きる.
・ 位 置 に 関 して 自 動 的 に テ キ ス ト を 構 造 化 す るALMG(Automatic Generation)パ
ン ター ネ ッ ト
の ロ ボ ッ トは リ ン ク 文 字 列 か ら リ ン ク先 の 内 容 を推 測 す
Location
ー ザ と い う ア ナ ラ イ ザ モ ジ ュ ー ル を 持 つ.ALMGは
し て 住 所 文 字 列 等 の 位 置 情 報 を 抽 出 し,そ
Metadata
ドキ ュ メ ン トを 解 析
れ を 緯 度 経 度 に 変 換 して 位 置 情 報 メ タデ ー タ
と し て ドキ ュ メ ン トに 付 与 す る.
・ 地 理 的 検 索 を 行 い,指
定 され た位 置 の
距 離 の 近 い 順 に 出 力 し た り,地
「近 く の ドキ ュ メ ン ト」 を 検 索 す る.検
索結果は
図 上 に プ ロ ッ トす る こ と が で き る.
モ バ イ ル イ ン フ ォ サ ー チ プ ロ ジ ェ ク トで は,「 こ こ の サ ー チ 」 の 他 に も,位 存 リ コ メ ン デ ー シ ョ ン を 行 う 「こ こ の お す す め 」 や,Web情
報 の簡易地理表示 を
す る 「こ こ の レ ー ダ」 な ど の 機 能 が 準 備 さ れ て い る(図4.13)[8
図4.13「
置依
].
こ こ の レ ー ダ」 の 表 示 例
(2)測 位 技 術 の 利 用 モ バ イル イ ン フ ォサ ー チ は,利 用 者 の現 在 位 置 に対 す る情 報 を提 供 す る こ と を 基 本 コ ンセ プ トに して い る.し か し現 在 は,イ
ン ター ネ ッ トに は 端 末 の 位 置 を測
位 した り通 知 す る機 能 は存 在 せ ず,端 末 自 身 の位 置 測 位 機 能 を持 っ た イ ン ター ネ ッ ト接 続 用 端 末 も普 及 して い な い.そ こ で モ バ イ ル イ ン フ ォサ ー チ で は,希 望 す る 場 所 に対 応 した ペ ー ジ を表 示 す る た め に,GPSま 用 を可 能 と して い る.ま 択,駅
名 選 択,郵
PHSの
た はPHSの
測位 システムの利
た測 位 デ バ イ ス を使 うこ とが で きな い 利 用 者 は,住 所 選
便 番 号 指 定 な どの 手 動 で の位 置指 定 が 可 能 で あ る.
測 位 シ ス テ ム に は,NTTド
コモ が提 供 して い る 「い ま ど こサ ー ビ ス」 が
あ る.こ の サ ー ビス は,PHSの
通 信 して い る 基 地 局 の位 置 を ドコモ の 位 置 情 報 セ
ン タ ー に 問 い合 わ せ る こ とに よ って,PHSの の わ か るPHSは1997年
現 在位 置 を得 る仕 組 み で あ る.位 置
に登 場 した が,通 信 機 能 と位 置 測位 機 能 方 法 を持 ち合 わ
せ て い る デ バ イス で あ り,100メ
ー トル程 度 の 測位 精 度 が 得 られ る た め,イ ン タ ー
ネ ッ ト接 続 に よ る タ ウ ン情 報 な どの 検 索 に 適 して い る.今 後 高 度 な位 置 情 報 サ ー ビス を実 現 す るた め に,可 用 性 の 高 い 測 位 シス テ ム を持 っ た モ バ イ ル 端 末 と位 置 情 報 交 換 の プ ラ ッ トフ ォー ムの 出現 が 待 た れ て い る.
(3)位 置情報 の記述形式 と自動 メタデー タ作成 技術 モ バ イ ルサ ー ビス に お け る位 置 情 報 の 表 現 形 式 は,簡 易 か つ 相 互 運 用 が 容 易 な もの が 求 め られ る.モ バ イ ル イ ン フ ォサ ー チ で は,端 末 か らサ ー バ へ の 検 索 条件 の 指 定 と して 以 下 の 形 式 を使 っ て い る.
http://www.kokono.net/index.cgi?pos=N40.29.55E139.43.12
図4.14「
こ この サー チ」 の 結 果 の地 図 表示 例(地 図 は(株)ア ル プ ス社 制作 の 「プ ロア トラス 2002首 都 圏」 を使 用 しま した)
図4.15位
置情 報 メ タデ ー タ作 成 機 能
実 際 に この 指 定 に よ り,指 定 した 場所 の イ ンデ ック スペ ー ジが 表 示 され(図4.11), そ の ペ ー ジ か ら そ の 場 所 に 関連 した 情 報 を検 索 す る こ とが で きる.ま
た この よ う
に単 純 な イ ン タ フ ェー ス を とって い るの で,好 み の 位 置 に関 す る モバ イ ル イ ン フ ォ サ ー チ の ペ ー ジ を 他 の サ ーバ か ら容 易 に呼 び 出 す こ とが 可 能 で あ る. 一 方 HTMLの
,モ バ イ ル イ ンフ ォサ ー チ の 検 索 結 果 は,通 常 の サ ー チ エ ン ジ ン と同 様 に フ ォー マ ッ トで 端 末 の ブ ラ ウザ 上 に リス ト表 示 され る.言
う まで も な く
位 置 情 報 を持 っ た コ ンテ ン ツは 地 図 上 に表 示 さ れ る とわ か りや す い の で,モ バ イ ル イ ン フ ォサ ー チ で は 地 図 表 示 の 機 能 も持 っ て い る.図4.14の
プ ロ トタ イ プ は,
(株)ア ル プ ス 社 の 地 図 「ProAtlas」 上 に 「こ この サ ー チ 」 の 検 索 結 果 を,同 社 の MPS(マ
ップ サ ー バ ス ク リプ ト)を 用 い て表 示 して い る.こ のMPSの
度 経 度 とURL付
仕 組 み は,緯
き文 字 列 か ら な る 点 情 報 を地 図 に 与 え る と,地 図 上 に ク リ ッ ク
可 能 な 文 字 列 が 指 定 緯 度 経 度 上 に表 示 で き る もの で あ る.こ の よ う に コ ン テ ン ツ と地 図 表 示 系 を独 立 させ る と,よ
りそ れ ぞ れ の利 用 者 に と って 使 い や す い地 図 表
示 シ ス テ ムが 構 築 で き,イ ン ター ネ ッ ト上 の各 種 の 位 置 情 報 サ ー ビス と の連 携 し たサ ー ビ ス を作 り出 す こ とが 期 待 で き る.し た が っ て,G-XML等
の記 述 仕様 と,
さ ら に は 自 由 に使 え る 地 図 デ ー タが 普 及 す る こ とが 期 待 され て い る.
先 に紹 介 した 「こ この サ ー チ」の 出 力 はHTMLで
あ るが,内 部 で はXMLを
て構 造 化 され た ドキ ュ メ ン トを保 存 して い る.図4.15で,「
使っ
こ こ の サ ー チ 」 の位
置 情 報 メ タ デ ー タ作 成 機 能 を説 明 す る.ク ロ ー ラ に よっ て集 め られ たWebペ な ど の ドキ ュ メ ン トに 対 して,は の 位 置 情 報 を探 す.位
ージ
じめ に 情 報 を抽 出 して 住 所 や ラ ン ドマ ー ク な ど
置 情 報 が 見 つ か っ た 場 合 は,位 置 情 報 リポ ジ トリ を参 照 し
て そ れ を緯 度 経 度 に変 換 し,メ
タデ ー タ と してXMLの
形 式 で 出 力 す る.こ の こ
とに よ り 「こ この サ ー チ 」 で は,自 動 的 に 位 置 情 報 が付 与 さ れ た コ ン テ ン ツが 得 ら れ る. なお,日
本 語 のWebペ
ー ジの20%程
い る こ とが わ か っ て お り[7],Webペ
度 に は な ん らか の 住 所 文 字 列 が 含 ま れ て
ー ジ の位 置情 報 を も と に構 造 化,流
通,さ
ら
に は解 析 を行 う こ とで,価 値 の あ る コ ンテ ン ツが 集 まる こ とが 期 待 さ れ て い る. (4)位 置 情 報 の プ ラ ッ トフ ォ ー ム モバ イル イ ン フ ォサ ー チ な どの 位 置 依 存 型 検 索 サ ー ビス で は,利 用 者 が どの よ う な端 末 を持 って い て も,端 末 の位 置 情 報 を 自由 に利 用 で きる こ とが 望 ま しい.そ の 意 味 で,端 末 の 位 置 情 報 の イ ン タ フ ェ ー ス を統 一 す る位 置 情 報 プ ラ ッ トフ ォー ム が 普 及 す る こ とが 望 ま しい.位
置 情 報 プ ラ ッ トフ ォー ム の 機 能 を ア プ リケ ー シ ョ
ン に近 い レベ ル ま で拡 げ て 考 え る と, ① 位 置 情 報 表 現 の差 異 の 解 消 ② 位 置 情 報 を使 っ た検 索 イ ン タ フ ェ ー ス の 差 異 の 解 消 な どが 課 題 と して あ げ られ る. 同 じ地理 位 置 を表 現 す る た め で あ っ て も,サ ー ビ スが 異 な る と,住 所,緯
度経
度 と い っ た 異 な っ た表 現 が 使 わ れ る場 合 が あ る.課 題 の① は 緯 度 経 度 な どの 座 標 系,住 所,郵 便 番 号,駅 ラ ン ドマ ー ク な ど の位 置 表 現 形 式 の相 互 変 換 を保 証 す る こ とで あ る.一 般 に,異
な っ た シ ス テ ム で使 わ れ る語 彙 表 現 の 差 異 を吸 収 す る 作 業
は簡 単 で は な い が,位
置 表 現 に 関 して は比 較 的 あ い ま い性 が低 く,意 図 す る 地 理
位 置 が 一意 に 特 定 で き る可 能 性 が あ る.モ バ イ ル イ ンフ ォサ ー チ で は,こ
れ らの
デ ー タ を位 置 情 報 リポ ジ ト リ とい う形 で 内 部 に保 持 し,位 置 情 報 表 現 の 相 互 変 換 を行 っ て い る(図4.16).な
お,こ
の リポ ジ トリは単 な る 語 彙 変 換 だ け で な く,文
図4.16位
置 情報 リポ ジ トリ
字 列 と平 面 上 の 点 や 領 域 間 の 相 互 変 換 を行 う点 に特 徴 が あ る. 課 題 の② は,イ
ン ター ネ ッ トに存 在 す る複 数 の位 置 利 用 検 索 サ ー ビス を呼 び 出
す こ と を考 え る 場 合,共
通 の イ ン タ フ ェー ス で の検 索 を保 証 す る こ とで あ る.モ
バ イ ル イ ン フ ォサ ー チ で は,い テ ム に 対 して行 う検 索)を
わ ゆ る メ タ検 索(一
つ の 問 合 せ を複 数 の検 索 シ ス
実 現 して い る.各 情 報 源 に対 して は ラ ッパ ー と呼 ば れ
る ソ フ トウ ェ ア が 作 成 され て い て,ラ
ッパ ー が 各 検 索 サ ー ビス へ の検 索 条件 を作
り出 す こ と に よ っ て,利 用 者 は統 一 され た イ ン タ フ ェ ー ス で 各 サ ー ビス に ア ク セ ス す る こ とが で き る. 上 記 を含 む 一 般 的 な モ バ イル 向 け の情 報 仲 介 サ ー ビ スへ の 要 求 条 件 は,次 の よ うに 整 理 す る こ とが で きる. ①
利 用 者 が 望 む コ ンテ ン ツ を持 つ 情 報 源 を探 す
②
情 報 源(デ ー タベ ー ス)へ の 検 索 を行 う
(a)対 象 デ ー タベ ー ス の 検 索 方 法 と用 語 を理 解 す る (b)対 象 デ ー タベ ー ス へ の 検 索 を代 行 す る ③
検 索 結 果 を利 用 者 に提 示 す る
(a)検 索 結 果 の 要 約,圧
縮,端 末 適 応 を行 う
(b)複 数 の デ ー タ ベ ー ス か ら結 果 の統 合 を行 う (c)検 索 結 果 の 選 択,推
薦 を行 う
課 題 ① は,情
報 源 の 持 つ コ ン テ ン ッ 内 容 を メ タ 情 報 と して 公 開,流
要 な 情 報 源 を 探 し 出 す 方 向 性 が あ る.例 た め のUDDI(Universal
Description,
通 さ せ,必
え ば イ ン タ ー ネ ッ ト上 の 企 業 を 捜 し出 す
Discovery
and
Integration)等
の 提 案 が あ る.
本 節 で 述 べ た プ ラ ッ トフ ォー ム の 議 論 は,課 題 ② に 対 応 す る.課 題 ③ は コ ンテ ン ツ記 述形 式 の 標 準 化 の 節 で 説 明 した,ス タイ ル シ ー ト,CC/PPあ ベ ー ス の シ ス テ ム を使 っ て 解 決 で きる 環 境 が 整 い は じめ て い る.し
る い は,XML か し③(c)な
ど に は決 定 的 な 方 法 は発 見 さ れ て お らず,現 在 デ ー タマ イ ニ ン グ的 ア プ ロ ー チ な どの 研 究 が 行 わ れ て い る. モバ イ ル イ ン フ ォサ ー チ の 実 験 を行 っ た結 果,同
じ場 所 に対 して,例
え ば地 図
と天 気 予 報 な ど,複 数 種 類 のサ ー ビ ス の リ クエ ス トを行 う利 用 者 が 多 い こ とが 明 ら か に な っ た.こ
の こ とか ら,複 数 のサ ー ビス を同 じ レベ ル で 並 べ て や る だ け で
も,コ ン テ ン ツ を有 効 に使 え る可 能 性 が 高 くな る こ とが 想 像 され る.す
な わ ち,
現 在 の モ バ イ ル イ ン フ ォサ ー チ の レベ ル の仲 介 ・プ ラ ッ トフ ォ ー ム機 能 で あ って も需 要 が あ り,モ バ イ ル端 末 の よ う な軽 い 処 理 を専 門 に行 う端 末 の バ ッ ク エ ン ド で,知 的 な プ ラ ッ トフ ォー ム が 活 躍 す る場 が 大 き くあ る と考 え られ る.
4.6お
わ りに
モ バ イ ル情 報 検 索 につ い て,実
際 の アプ リケ ー シ ョ ンの 解 説 を 交 え な が らモ バ
イル イ ン タ ー ネ ッ トア クセ ス 技 術 と,測 位,表 現 形 式,プ
ラ ッ トフ ォー ム を軸 と
す る位 置 情 報 処 理 技 術 に つ い て解 説 を行 っ た. 街 中や 旅 先 で モ バ イ ル情 報 検 索 を行 って,普 通 で は み つ か らな か っ た もの を発 見 で きた と き,自 分 の視 覚 や 聴 覚 が 拡 張 さ れ た よ うに感 じる こ とが あ る.モ バ イ ル と イ ン ター ネ ッ トの 組 合 せ で,ど の だ ろ うか.
こ まで 私 た ち は 知 覚 を ひ ろ げ る こ とが で きる
参考文献 [1]J.Hjelm,B.Martine
and
P.
King,“WAP
Forum-W3C
Cooperation
White
Paper"(http://www.w3.org/TR/NOTE-WAP),1998 [2]花
岡光 昭
カ ル [3]“WAP
「iモ ー ド サ ー ビ ス 特 集:ネ
・ジ ャ ー ナ ル,Vol.7, Forum
Specifications"
ッ ト ワ ー ク 方 式 」NTT
DoCoMoテ
クニ
No.2,pp.16-21,2000 ,http://www.wapforum.org/what/technical.htm,
2001
[4]北 條 晴 正
「端 末 の 測 位 方 式 とモ バ イ ル 市 場 」 情 報 処 理,Vol.42,No.04,2001
[5]太 田 洋,北
村 敏 和,鎌
滝 秀 樹,明
関賢太郎
「 位 置 情 報 と携 帯 電 話 」 情 報 処 理,
Vol.42,No.04,2001 [6]K.Takahashi,N.Miura,S.Yokoji,and formation
Integration
K.Shima,“ for
Location-Aware
Computing"
Mobile
Info
Search:In-
,情
報 処 理 学
会 論
文
Vol.41,No.4pp.1192-1201,2000
[7]横 路 誠 司,高
橋 克 巳,三
浦 信 幸,島
健 一
「位 置 指 向 の 情 報 の 収 集,構
よ び 検 索 手 法 」 情 報 処 理 学 会 論 文 誌,Vol.41No.7 [8]三 浦 信 幸,横
路 誠 司,井
上 香 織,高
橋 克 巳,高
造化 お
pp.1987-1998,2000 橋 健 司,島
健 一 「位 置 指 向 の 情
報 構 造 化 と 情 報 分 類 ∼ モ ー バ イ ル イ ン フ ォサ ー チ 3実 験 ∼ 」情 処 研 報(MBL),
Vol.99,No.97,pp.39-44,1999
【 用 語 集:第
1章 】
■インデ ックス 一 般 に
,デ
ー タ ベ ー ス に お け る デ ー タ 検 索 処 理 速 度 を 高 速 化 す る た め に,デ
タ の 特 性 を 踏 ま え た イ ン デ ッ ク ス フ ァ イ ル が 作 成 さ れ る.実 ン デ ッ ク ス 方 式 が 実 装 さ れ て お り,ハ る.し
か し,文
ッ シ ュ,B-tree,R-treeな
書 フ ァ イ ル を 検 索 対 象 と す る 場 合,文
表 れ る か が 重 要 と な る.そ
こ で,辞
方,意
どが 代 表 的 で あ
書 の どの位 置 に検 索 結 果 が
file)と
して イ ン デ ッ クス を作 成 す
味 的 な 構 造 を 考 慮 せ ず に 「n文 字 か ら な る 文 字 列 」 で あ る
N-グ ラ ム デ ー タ 構 造(N-Gram 3-Gramフ
data
structure)に
ァ イ ル を 利 用 す る こ と も あ る.ま
た,ハ
基 づ い て,2-Gramフ
ァ イ ル が あ る.そ
置 フ ァ イ ル よ り も優 れ た 文 字 列 探 索 機 能 を 備 え,Signatureフ
正 確 性 が 高 い イ ン デ ッ ク ス と し てPAT木(PAtricia
ァイルや
ッ シ ュ 等 を用 い て 文 書 を ビ ッ ト
列 の 集 合 に 変 換 す る こ と で 高 速 検 索 を 実 現 す るSignatureフ 他,転
常 に多 くの イ
書 フ ァイ ル に含 まれ る単 語 が 文 書 の ど の位 置
に 出 現 す る か も 含 め た 転 置 フ ァ イ ル(inverted る こ と が あ る.他
際,非
ー
Trees)が
の
ァイルよ りも
知 ら れ て い る.
■ シ ソ-ラ ス 展 開 シ ソー ラ ス(thesaurus)に
基 づ い た キ ー ワー ドが 付 与 され て 用 語 統 制 が な され
て い る デ ー タベ ー ス に お け る検 索 で は,入 力 され た 検 索 式 に含 ま れ る キ ー ワ ー ド に対 して シ ソー ラ ス を用 い る こ とで 下 位 概 念 へ と展 開 し,よ 果 的 な検 索 式 を生 成 す る こ とが 可 能 で あ る.そ の た め,よ
り広 い 領 域 を覆 う効
り優 れ た情 報 検 索 を実
現 す るた め に,概 念 語 辞 書 で あ る シ ソ ー ラ ス が有 効 利 用 され て い る.こ の よ う に, どの よ う な体 系 に基 づ い た メ タデ ー タ を付 与 す る か が,優
れ た 情 報 検 索 にお い て
重 要 な位 置 を占 め る.
■ 適 合 性 フ ィ ー ドバ ッ ク(relevance
feedback)
一 度 の検 索 で 検 索 者 が 必 要 とす るす べ て の文 書 集 合 を得 る こ と は い と言 っ て よ い.そ
,ほ と ん どな
の た め,検 索 者 は 入 力 検 索 式 と検 索 結 果 を評 価 す る こ とで,
さ ら な る検 索 を行 うた め に適 切 な検 索 式 を生 成 す る フ ィ ー ドバ ッ ク を行 う.し か しなが ら,検 索 対 象 に関 す る背 景 知 識 の レベ ル の異 な る検 索 者 が この 種 の適 合 性 フ ィ ー ドバ ック を効 果 的 に進 め る こ と は,必 ず し も容 易 で は な い.そ の た め,関 連 語 提 示 機 能 な ど を援 用 す る こ とで,よ
り適 切 な フ ィー ドバ ック を実 現 す る た め
の研 究 が 行 わ れ て い る.
■ デー タ ベ ー ス CODASYL(Conference
On
DAta
Systems
Language)のDBTGに
れ た ネ ッ トワ ー ク 型 デ ー タ ベ ー ス で あ るCODASYL型 要 な デ ー タ ベ ー ス で あ っ た.し
か し,現
デ ー タベ ー ス が,初
在 で はE.F.Codd博
関 係 代 数 に 基 づ く関 係 デ ー タ ベ ー ス(RDB:Relational
ス 等,よ
期 の主
士 に よ り提 案 さ れ た DataBase)が,商
タベ ー ス に お い て 高 い シ ェ ア を 占 め る に 至 っ て い る.な オ ブ ジ ェ ク ト指 向 デ ー タベ ー ス,空
よ り提 案 さ
間 デ ー タベ ー ス,マ
お,演
用 デー
繹 デ ー タ ベ ー ス,
ル チ メ デ ィ ア デ ー タベ ー
り優 れ た 性 能 を 提 供 す る 多 く の デ ー タ ベ ー ス の 研 究 開 発 が 進 め ら れ て い
る の で,今
後,デ
ー タベ ー ス の 基 本 的 機 能 や 検 索 処 理 に用 い る 問 合 せ 言 語 も大 き
く強 化 さ れ る と 考 え ら れ る.
■半構造 デー タ SGML(Standard
Generalized
な ど を 容 易 に す る た め に,文
Markup
Language)で
書 構 造 を 定 義 す る 機 能 が 実 装 さ れ た.そ
を 参 考 に し た マ ー ク ア ッ プ 言 語 で あ るHTML(Hyper イ ン タ ー ネ ッ ト上 のWebペ 在,イ Markup あ る.な
は 文 書 の 処 理 ・管 理 ・交 換
Text
ー ジ 記 述 に お い て 採 用 さ れ,広
Markup
し てSGML Language)が
く普 及 し て い る.現
ン タ ー ネ ッ ト上 に お け る 高 度 な デ ー タ 交 換 を 目 的 と し たXML(eXtensible Language)が お,こ
提 案 さ れ て お り,電 子 商 取 引 な ど の 分 野 で 急 速 に 浸 透 し つ つ
の種 の マ ー ク ア ップ 言 語 に よっ て 記 述 され た デ ー タ は デ ー タ構 造
の 記 述 能 力 を備 え て い る こ と か ら,関 係 デ ー タ ベ ー ス の ス キ ー マ の よ う な 構 造 デ ー タ(structured
data)と,テ
キ ス トの よ う な 非 構 造 デ ー タ(unstructured
の 中 間 に 位 置 す る もの と 考 え る こ と が で き る た め,半
data)と
構 造 デ ー タ(semi-structured
data)と
呼 ば れ て い る.
■ ピ ア ツ ー ピ ア(P2P,peer
to peer)
イ ン タ ー ネ ッ トの 利 用 法 に お い て,Webサ
ーバ に 蓄積 さ れ た デ ー タ に クラ イア
ン ト側 の ブ ラ ウ ザ か ら ア ク セ ス して ダ ウ ン ロ ー ドす る 形 態 が 一 般 的 で あ る が,ネ ト ワ ー ク 環 境 の 発 展 に と も な っ て,ク 接 続)を
ラ イ ア ン ト間 の 直 接 的 な 接 続(ピ
用 い た フ ァ イ ル 交 換 が 活 発 に な り,Gnutella,
ア が 登 場 し て き た.な 通 さ せ る に は,分
■ 無 意 味 語(不
お,ピ
WinMXな
ッ
ア ツー ピア
どの ソ フ トウ ェ
ア ツ ー ピ ア ネ ッ トワー ク上 に 存 在 す る フ ァイ ル を流
散 環 境 下 に 適 し た 検 索 機 能 が 必 要 と さ れ る.
要 語,stop
word)
情 報 検 索 に お い て,例 え ば冠 詞(a,an,the)や
前 置 詞(about,after,before…)
な どの 非 常 に高 頻 度 に登 場 す る語 を取 り除 くこ と で,検 索 精 度 を向 上 させ る こ と が で き る.そ こ で,こ
の よ う な無 意 味 語(不 要 語)を
索 処 理 が 行 わ れ て い る.な お,よ
集 め た リス トを利 用 した検
り優 れ た 判 定 を行 う に は,熟 語 中 の冠 詞 や 前 置
詞 な ど を取 り除 か ず に 辞 書 を用 い るべ きで あ る.日 本 語 文 章 に つ い て も 同様 の方 法 を採 用 す る こ とで,検
索 精 度 を低 下 させ る語 を取 り除 く こ とが 可 能 で あ る.な
お,文 章 の対 象 領 域 に よ っ て,無 意 味 語 が 変 化 す る可 能 性 の あ る こ と に注 意 して お き たい.
■メタデー タ 文 字 列 を 検 索 す る の で は な く,記
述 さ れ て い る 情 報 を 検 索 す る に は,「 デ ー タ
に 関 し て 記 述 し た デ ー タ 」 で あ る メ タ デ ー タ を 付 与 す る こ とが 有 効 で あ る.そ で,標 Element
準 的 な メ タ デ ー タ の 記 述 方 法 と し て,Dublin Set, http://dublincore.org/)やResource
http://www.w3.org/RDF/)な
Core(Dublin Description
ど が 提 案 さ れ て い る.な
す る に は,検 索 対 象 を 分 類 し た 分 類 木(classification さ ら に 概 念 構 造 を 示 し た 概 念 木(conceptual
tree)に
Core
こ
Metadata
Framework(RDF,
お,的 確 な メ タ デ ー タ を記 述
tree)や 分 類 階 層(taxonomy), 基 づ い た統 一 的 体 系 を用 意 す
る こ とが 必 要 で あ る.ま た,意 味 的 に 同一 で あ る概 念 語 を記 述 した 辞 書 と して の シ ソー ラ ス(thesaurus)を
利 用 す る こ と も考 え られ る.し か しな が ら,同 一 概 念
に分 類 さ れ る 概 念 語 に もそ の 問 題 領 域 に依 存 した 差 が 存 在 す る こ と を考 え る な ら ば,よ
り高 度 な 意 味 体 系 オ ン トロ ジ(ontology)が
必 要 と な る.
■WebSPAM メ ー ル サ ー バ の 不 正 利 用 を行 う な ど して,不 され る迷 惑 メ ー ルがSPAMメ
特 定 多 数 の 人 に 対 して大 量 に送 信
ー ル と呼 ば れ る.一 方,検 索 エ ン ジ ンに お い て 頻 繁
に検 索 され る 人 気 の 高 い キ ー ワー ドな ど を,そ の キ ー ワ ー ドとは 無 関 係 な 文 脈 を もつWebペ
ー ジ 中 に記 述 す る 行 為 がWeb
SPAMと
呼 ば れ る.Webペ
意 味 な記 述 の 存 在 が 直 接 迷 惑 を与 え る わ け で は ない が,Web
SPAMを
ー ジ中 の 無 行 うペ ー ジ
の 存 在 に よ っ て検 索 エ ン ジ ン の精 度 が 低 下 し,そ の 結 果,目 的 とす る情 報 の 検 索 を阻 害 す る と い う点 で 検 索 者 に迷 惑 を与 え る も の で あ る.
■Zipfの
法 則(Zipf's
Zipfの
法 則 と は,文
low) 書 中 に 登 場 す る 単 語 を そ の 出 現 頻 度 順 に 並 べ 替 え る と,そ
の 順 位 と頻 度 の 積 が 定 数 に な る と い う 経 験 則 の こ と で あ る(http://linkage.rockef eller.edu/wli/zipf/).し
た が っ て 検 索 式 に 用 い る キ ー ワ ー ドは,単
して 選 択 す る 必 要 が あ る.さ
ら に,複
数 キ ー ワ ー ドを 組 み 合 わ せ る 場 合 に は,ど
の よ う な 順 序 関 係 の 単 語 を 選 択 す る か の 注 意 も 必 要 と す る.な 常 に 低 い 場 合 に は,同 た め,出
語 の分 布 を考 慮
お,出
現 頻度 が非
順 位 の 語 が 多 く な る た め, Zipfの 法 則 は 成 立 し な い.そ
現 頻 度 の 低 い 領 域 に 対 し て 成 り立 つ 関 係 が 別 途 提 案 さ れ て い る.
の
【 用 語 集 :第 2章 】 ■機械学習 人工 知 能 に お い て,コ
ン ピュ ー タ に 学 習 機 能 を持 た せ よ う とす る試 み の こ と.
機 械 学 習 に よ り,コ ン ピ ュー タ は過 去 の 経 験 を利 用 して,よ よ うに な る.多
り上 手 に行 動 で きる
くの機 械 学 習 は,教 師 か ら正 解 付 きの 具 体 例 を与 え られ,そ れ ら
か ら学 習 を行 う 「教 師 あ り学 習 」 で あ る.教 師 を必 要 と しな い 機 械 学 習 は 「教 師 な し学 習 」 と呼 ば れ る.人 工 知 能 に お け る多 くの 機 械 学 習 で は,そ の 学 習 結 果 が 「ル ー ル」 「述 語 」 な ど,人 間 に とっ て 理 解 しや す い 表 現 で 記 述 さ れ る こ とが 特 徴 で あ る.こ
れ は,学
習 結 果 が 重 み の 分 布 で 記 述 され る ニ ュ ー ラ ル ネ ッ トワ ー ク に
よる 学 習 な ど,人 間 に と っ て理 解 し に くい学 習 と は対 照 的 で あ る.
■帰納 学習 多 くの具 体 的 な例 か ら一 般 的 な概 念 を学 習 す る方 法 の こ と.学 習 した い概 念 に 含 まれ る具 体 例 を 「正 例 」,含 ま れ な い もの を 「負例 」,そ れ らす べ て を 「訓 練 例 」 と呼 ぶ.帰
納 学 習 の 手 続 き は,た
くさ ん の 訓 練 例 を与 え ら れ,そ
の 正 例 を含 み,
負 例 を含 ま な い概 念 記 述 を概 念 記 述 の候 補 の 空 間 で 探 索 す る こ とで あ る.帰 納 学 習 の 逆 は演 繹 学 習 と呼 ば れ,一 般 的 な概 念 か ら具 体 的 な例 を説 明 す る こ とに よ り, そ の 説 明過 程 を効 率 化 す る方 法 で あ る.
■ キ ー ワー ド抽 出 文 書 か らい くつ か の 重 要 な単 語 を 自動 的 に 取 り出す こ と.取
り出 した キ ー ワ ー
ドは索 引 に 利 用 で き る の で,索 引付 け と も密 接 に 関連 す る.基 本 的 に は単 語 の 出 現 頻 度 に基 づ い た もの が 多 い.例 TFIDF法
え ば,広
く使 わ れ て い る索 引付 けの 手 法 で あ る
は,あ る 文 書 D にお け る あ る単 語 W の 出現 頻 度 を,そ の 単 語 W を含 む
文 書 の 頻度 で 割 っ た もの に よ り,そ の単 語 W の 重 要 度 を算 出 す る に これ に よ り, そ の文 書 内 で は よ く現 れ る単 語 で あ り,他 の 文 書 で は現 れ な い 単 語 を抽 出 で きる. 出現 頻 度 以 外 を利 用 す る方 法 と して は,文 書 が もつ タ グ な どの構 造 を利 用 す る方
法 を は じめ,さ
ま ざ ま な方 法 が 提 案 され て い る.
■情報検索 人 間 が 与 え る キ ー ワ ー ド(ク エ リ と呼 ば れ る)に 関 連 した情 報 を,情 報 源 か ら 取 り出 す 方 法 に 関 す る研 究 分 野.新
聞記 事 な どの 文 書 を対 象 と した 文 書 検 索,画
像 を対 象 と した画 像 検 索 な どが あ る.検 索 対 象 をそ の 特 徴 で索 引付 け して,そ
の
索 引 間 に 定 義 さ れ た 類 似 度 を基 に,ク エ リ と類 似 した 情 報 を検 索 す る ア プ ロ ー チ が よ く使 わ れ る.広
く研 究 され て い る文 書 検 索 で は,検 索 対 象 で あ る文 書 の 表 現
に ブ ー リア ンモ デ ル とベ ク トル モ デ ルが あ る.ブ ー リ ア ンモ デ ル で は,あ が 文 書 中 に 存 在 す る か 否 か の 2値 で 表 現 す る.一 方,ベ 語 の 重 要 度 をTFIDF法
な ど で計 算 して,そ
る単語
ク トル モ デ ル は,あ
る単
の 値 に よる 連 続 値 の ベ ク トル で 表 現
す る.ブ ー リ ア ンモ デ ル で は,ク エ リ に対 してANDやORの
検 索 を行 い,ベ
ク
トル モ デ ル で は,ク エ リの ベ ク トル と検 索 対 象 の ベ ク トル の 余 弦 を類 似 度 と した 検 索 が 行 わ れ る.
■人工知 能 コ ン ピ ュ ー タ に知 的 な処 理 を させ よ う とす る研 究 の こ とを 意 味 し,主 に ア ル ゴ リズ ム,ソ フ トウェ ア の研 究 が 多 い.研 究 分 野 は,推 論,認 知 モ デ ル,知 識 表 現, 機 械 学 習,プ
ラ ンニ ン グ,自 然 言 語 処 理,知 能 ロ ボ ッ ト,コ ン ピュ ー タ ビ ジ ョ ン な
ど多 岐 に わ た る.推 論 の ア ル ゴ リ ズ ム や 知 識 を い か に コ ン ピュ ー タ上 に 記 述 す る か とい う よ う な基 礎 的 ・理 論 的 な研 究 か ら,専 門 家 の 知 識 を コ ン ピ ュ ー タ上 に プ ロ グ ラ ム して 専 門家 の 推 論 を実 現 す る エ キ ス パ ー トシス テ ム を は じめ と す る 多 く の 実 用 シ ス テ ム の 開発 まで,こ
れ まで さ ま ざ ま な研 究 が され て きた.お
おむね の
傾 向 と して,人 工 知 能 の 初 期 段 階 で は 人 間 の 認 知 モ デ ル を 目指 して い た が,徐 に コ ン ピ ュ ー タ独 自 の 知 的 処 理 の 実 現 に研 究方 向 が 移行 して き て い る.ま
々
た,「 知
的」 と は何 か の 定 義 は 一般 に は難 しい た め,人 工 知 能 が 実 現 され た か ど う か の 判 定 も困 難 を と も な う.さ
らに,人 工 知 能 に よ り得 られ た大 きな 知 見 と し て,人 間
に と って 容 易 な こ とが コ ン ピ ュー タに と っ て は 難 し く,反 対 に 人 間 に と っ て 難 し
い こ とが コ ン ピュ ー タ に は意 外 と簡 単 な場 合 が 多 い こ とが 挙 げ られ る.
■探 索 主 に 人工 知 能 に お い て,状 態 と遷 移 可 能 な 状 態 間 の 道 が 与 え られ た場 合 に,あ る 出 発 点 か ら道 をた ど っ て 目標 点 を見 つ け る 手 続 き を探 索 とい う.探 索 の ア ル ゴ リズ ム に は,し
らみ つ ぶ しに 目標 点 を見 つ け る もの や,知 識 を利 用 して 目標 点 ま
で の 最 適 な パ ス を見 つ け る もの が あ る.目 標 点 ま で の パ ス が存 在 す る と き に は必 ず そ の パ ス を見 つ け る性 質 を完 全 性 とい う.
■ 適 合 フ ィー ドバ ック ユ ー ザ が 一 度 クエ リを 与 え,そ の 結 果 得 ら れ た検 索 結 果 の 内 容 を判 定 して も ら い,そ
の ユ ーザ の 評 価 を基 準 と して,さ
ら に よ り良 い 検 索 結 果 を提 示 す る よ う に
動 作 す る仕 組 み で あ る.ユ ー ザ に と っ て クエ リの修 正 は難 しい が,検 索 結 果 の 評 価 は容 易 で あ る 場 合 が 多 い の で,適 合 フ ィー ドバ ッ ク はユ ー ザ に とっ て負 担 の 少 な い検 索 性 能 向 上 方 法 で あ る.
■ ヒ ュー リス テ ィ ッ ク 理 論 的 に そ の 正 しさ が 証 明 され た知 識 で は な く,経 験 的 に得 られ て い る,必 ず し もい つ も正 し くは な い よ う な知 識 を意 味 す る.例
え ば,「 半 ズ ボ ンを は い て,ラ
ン ドセ ル を背 負 っ て い る 人 は,小 学 生 で あ る」 とい う よ うな ル ー ル は,経 験 的 に ほ とん どの 場 合 に は正 しい が,ご で,ヒ
く まれ にそ の よ う な大 人 が い る か も知 れ ない の
ュ ー リス テ ィ ッ ク と言 え る.人 工 知 能 にお い て ヒ ュ ー リス テ ィ ッ クは,原
理 的 に は 非 常 に 解 きに くい よ う な問 題 を 解 決 す る た め に用 い られ る重 要 な 知 識 で あ る.
■論理 プロ グラミ ング 述 語 論 理 を基 に事 実 ・規 則 を記 述 して,定 理 証 明 を行 うこ と に よ りプ ロ グ ラ ム を実 行 す る プ ロ グ ラ ミ ン グの 枠 組 み を い う.プ ロ グ ラ ム 自身 が 宣 言 的 に 記 述 で き
る た め,そ
の プ ロ グ ラ ム は理 解 しや す い と言 わ れ る が,高 級 言 語 で あ り処 理 速 度
は一 般 に速 くは ない.フ
ラ ンス で 開 発 さ れ たPrologが
最 も普 及 して い る論 理 プ ロ
グ ラ ミ ン グ言 語 で あ り,特 に論 理 的 な ア プ ロ ー チ を と る人 工 知 能 研 究 者 の 間 で広 く使 わ れ て い る.
■ル-ル 「IF a THEN 理 式 で あ り,a
b」 の 形 式 で 記 述 さ れ る 規 則 を 用 い た 知 識 表 現 の 一 つ. a,bは を 条 件 部,b
を 結 論 部 と い う.「 a が 成 り立 つ 場 合 に,b
論
が 成 り立
つ 」 と 解 釈 す る.人
間 の 専 門 家 の 推 論 を コ ン ピ ュ ー タ で 実 現 す る エ キ ス パ ー トシ
ス テ ム に お い て,そ
の 専 門 知 識 を 表 現 す る た め に ル ー ル が 多 用 さ れ て お り,そ
の
ル ー ル の 集 合 を ル ー ル ベ ー ス と 呼 ぶ.
■Webオ
ン ラ イ ン シ ョ ップ
イ ン ター ネ ッ ト上 で 買 い 物 が で きるWebサ 能,仕 様 な ど の 情 報 を 表 示 す るWebペ
イ トの こ と.商 品 に 関 す る価 格,機
ー ジ を見 る こ と に よ り,ユ ー ザ は,気
に
入 っ た商 品 を仮 想 の 買 い物 か ご に 入 れ て い き,ク レ ジ ッ トカ ー ドで 決 済 す る もの が 多 い.通 信 販 売 と 同様 に 店 舗 を必 要 と しな い た め,低 能 に な る こ と,24時
コ ス トで 商 品 の 売 買 が 可
間 い つ で も ど こで も イ ン ター ネ ッ トにア クセ ス で きれ ば 買 い
物 が で きる こ と な どが 利 点 で あ る.
■Webペ
ージ
HTMLやXMLで
記 述 さ れ,イ
ン タ ー ネ ッ トで 公 開 さ れ て い る フ ァ イ ル の こ と.
イ ン タ ー ネ ッ トに接 続 さ れ て い れ ば,世 公 開 さ れ て い るWebペ わ れ る が,「Webペ
界 中 か らWebブ
ー ジ を 閲 覧 で き る.よ
ラ ウザ を使 っ て す べ て の
く 「ホ ー ム ペ ー ジ」 と い う 用 語 が 使
ー ジ 」 の 方 が 適 切 な 呼 び 方 で あ る.
【 用 語 集:第
3章 】
■ エ ー ジ ェン ト 利 用 者 の 代 理 と して 賢 く 自律 的 に ふ る ま う ソ フ ト ウ ェ ア.従 が 人 間 の 思 考 過 程 に 注 目 し て い る の に 対 して,エ い に 注 目 して い る.特
来 の 人工 知 能 研 究
ー ジ ェ ン ト研 究 で は 知 的 な ふ る ま
に 利 用 者 の 情 報 ア ク セ ス を支 援 す る エ ー ジ ェ ン トの こ と を
情 報 エ ー ジ ェ ン トと 呼 ぶ.ま
た,キ
ャ ラ ク タな どを介 して利 用 者 との イ ン タフ ェ ー
ス の 働 き を す る エ ー ジ ェ ン トの こ と を イ ン タ フ ェ ー ス エ ー ジ ェ ン ト,複
数の コ ン
ピュ ー タに 移 動 し なが ら情 報 処 理 を行 うエ ー ジ ェ ン トを モ バ イル エ ー ジ ェ ン トと 呼 ぶ.マ
ル チ エ ー ジ ェ ン トシ ス テ ム は 複 数 の エ ー ジ ェ ン トか ら 構 成 さ れ,そ
れ ら
の 相 互 作 用 を 通 し て 処 理 が 進 め ら れ る.
■オン トロジ 概 念 の 統 一 的 な 意 味 体 系.あ
る 問 題 領 域 に お け る デ ー タ の 記 述 様 式,語 彙,関 係 な
ど を 一 階 述 語 論 理 な ど の 形 式 的 記 法 で 表 現 した も の で,世 の 中 に存 在 す る す べ て の も の を 系 統 立 て て 説 明 す る こ と を 目 指 す も の で あ る.情
報 統 合 を行 う際 に は 統 合 す る
情 報 源 ご と に個 別 の 用 語 が 用 い ら れ て い る こ とが あ り,意 味 レベ ル で の 統 合 を 困 難 に し て い る.統
一 的 な オ ン トロ ジ を 用 い て,そ
れ ぞ れ の 情 報 源 で の 用 語 を変 化 す る こ
と で 意 味 レベ ル で の 情 報 統 合 が 可 能 に な る.オ
ン トロ ジ開発 の具 体 例 と しては ス タ
ン フ ォ ー ド大 学 のOntolingua(http://www.ksl.stanford.edu/software/ontolingua/) が あ げ ら れ る.ま ンバ ラ大 学AIAI研
た ビ ジ ネ ス モ デ ル や 企 業 モ デ ル に 特 化 した オ ン トロ ジ と して,エ ジ 究 所 のEnterprise
Ontology(http://www.aiai.ed.ac.uk/project/
enterprise/enterprise/ontology.html)や,ト
ロ ン ト大 学 で 開 発 さ れ たTOVEOntol-
ogy(http://www.eil.utoronto.ca/tove/toveont.html)な
ど が あ る.
■関係 データベ ース リ レ ー シ ョ ナ ル デ ー タ ベ ー ス と も呼 ば れ る.一 プ ル)と
し て 表 現 し,そ
の 集 合 を 表(テ
つ の デ ー タ を 複 数 の 属 性 の 組(タ
ー ブ ル あ る い は リ レ ー シ ョ ン)と
して表
現 す る.デ
ー タ ベ ー ス は 表 の 集 合 と し て 表 現 さ れ る こ と に な る.デ
ー タベ ー ス の
操 作 は 厳 密 な 数 学 理 論 に 基 づ く関 係 代 数 と し て 定 式 化 可 能 で あ る.1970年 の エ ドガ ー ・コ ッ ドに よ り提 案 さ れ た.OracleやMicrosoft る よ う に,現
在,最
Accessな
にIBM ど に見 られ
も 広 く利 用 さ れ て い る デ ー タベ ー ス の 形 式 で あ る.
■ デ ィ レ ク トリサ ー ビ ス Yahoo!(http://www.yahoo.co.jp/)に
代 表 さ れ る よ う に,Webペ
カ テ ゴ リ ご と に 分 類 し て 提 供 し て く れ る 検 索 サ ー ビ ス.ソ よ っ て ペ ー ジ 収 集 を 行 うサ ー チ エ ン ジ ン と異 な り,URLは 登 録 さ れ て い る.し
た が っ て 登 録 さ れ て い るURLの
ー ジ のURLを
フ トウ ェ ア ロ ボ ッ トに 主 に 人 手 で 収 集 さ れ,
数 は 少 な い が,そ
の分厳選 さ
れ た 情 報 を 検 索 す る こ と が で き る,
■ ポ ー タル サ イ ト イ ン タ ー ネ ッ ト の 入 口 と な るWebサ
イ ト.Webブ
示 さ れ る よ う に 設 定 さ れ る こ と が 多 い.サ く,ニ
ュ ー ス な ど の 情 報 提 供,メ
ー ル,チ
ラ ウ ザ 起 動 時 に,最
初 に表
ー チ エ ン ジ ン機 能 や リ ン ク 集 だ け で な ャ ッ ト,掲
示板 な どの サ ー ビス も提 供 し
て い る.Yahoo!(http://www.yahoo.co.jp/)やExcite(http://www.excite.co.jp/) な どの サ ー チ エ ン ジ ン系 サ イ
ト,Netscape(http://www.netscape.co.jp/)やMi+
crosoft(http://www.msn.co.jp/home.htm)な www.jp.aol.com/)や
リ クル ー
ど の ブ ラ ウ ザ 系 サ イ ト,AOL(http:// ト(http://www.isize.com/)な
どの コ ンテ ン ツ系 サ イ
ト,So-net(http://www.so-net.ne.jp/)やNIFTY(http://www.nifty.com/)な
ど の
プ ロ バ イ ダ 系 サ イ ト な ど,さ
ま ざ ま な も の が 存 在 す る.
■ ミ ドル ウ エ ア OSと
ア プ リ ケ ー シ ョ ン ソ フ ト ウ ェ ア の 中 間 で 動 作 す る ソ フ ト ウ ェ ア.多
くの
ア プ リケ ー シ ョン ソ フ トウ ェ ア で 共 通 して利 用 され るデ ー タベ ー ス管 理 や通 信 の た め の モ ジ ュ ー ル を ま と め た も の で あ る.代
表 的 な ミ ドル ウ ェ ア と し て は,オ
ジ ェ ク ト指 向 の ソ フ ト ウ ェ ア モ ジ ュ ー ル を 連 携 させ る も の と し てCORBAが
ブ
あ る.
■ メ デ ィエ ー タ 米 国 ス タ ン フ ォ ー ド大 学 のGio
Wiederhold教
授 に よ り提 唱 さ れ た,デ
ータベー
ス や ア プ リケ ー シ ョ ンソ フ トウ ェ ア な ど複 数 の 異種 独 立 情 報 源 を統 合 す る た め の ソ フ ト ウ ェ ア モ ジ ュ ー ル.従
来 の デ ー タベ ー ス統 合 で は統 一 的 な統 合 ス キ ー マ を
設 計 し,そ れ に 合 わ せ て す べ て の デ ー タベ ー ス を 統 合 す る と い う 中 央 集 権 的 な ア プ ロ ー チ が と ら れ て い た.こ
れ に 対 し て メ デ ィ エ ー タ を 使 っ た ア プ ロ ー チ で は ,個
別 情 報 源 の 出 力 を ラ ッパ ー に よ り変 換 し,メ 法 が 用 い ら れ て い る.メ
デ ィ エ ー タ に よ り統 合 す る と い う 手
デ ィ エ ー タ は 複 数 存 在 す る こ と も 可 能 で あ り,要
求 に応
じて 適 当 な メ デ ィ エ ー タ を 組 み 合 わ せ る こ と で 自 律 分 散 的 な 情 報 統 合 が 可 能 に な る.メ
デ ィ エ ー タ を 用 い た 代 表 的 な シ ス テ ム と し て は,ス
MMIS(http://www-db.stanford.edu/tsimmis/),南
タ ン フ ォ ー ド大 学 のTSI
カ リ フ ォ ル ニ ア 大 学 のSIMSや
Ariadne(http://www.isi.edu/info-agents/ariadne/index.html)な
ど が あ る.
■ ラ ツパ ー ソ フ トウ ェ ア モ ジ ュ ー ル を 外 部 モ ジ ュ ー ル と 相 互 作 用 可 能 に す る た め の 付 加 ソ フ ト ウ ェ ア の 総 称.情 たWebペ
報 抽 出 ラ ッパ ー は 指 定 さ れ た 情 報 をHTMLな
ー ジ か ら抽 出 す る 機 能 を 有 し て い る.例
ラ ッパ ー は,ホ
テ ル のWebペ
報 を 抽 出 し て くれ る.情 る こ と が 多 い.Webペ
え ば,ホ
ー ジ か ら ホ テ ル 名,住
報 の 抽 出 に はHTMLに ー ジ がXMLに
所,料
どで 記 述 され
テルに関する情報抽 出 金,電
話 番 号 な どの 情
お け る タ グの位 置 関係 が 利 用 され
よ り記 述 さ れ る よ う に な れ ば,ラ
ッパ ー に
よ る 情 報 抽 出 作 業 は よ り容 易 に な る.
■SQL(Structured IBMが
Query
Language)
開 発 し た 関 係 デ ー タ ベ ー ス 操 作 用 言 語.ア
て 標 準 化 さ れ て い る.最 行 か ら構 成 さ れ,SELECT行
も 基 本 的 なSQL文
メ リ カ 規 格 協 会 やJISに
はSELECT行,FROM行,WHERE
に は 検 索 す べ き 属 性 の リ ス ト,FROM行
の 対 象 と な る リ レ ー シ ョ ン,WHERE行 も デ ー タ ベ ー ス の 更 新 を 行 うSQL文
おい
に は 検 索 の 条 件 を 指 定 す る .こ と し てINSERT(挿
入),DELETE(削
に は検 索 れ以外 に 除),
UPDATE(書
き換 え)な
ど が あ る.OracleやMicrosoft
タ ベ ー ス 管 理 シ ス テ ム で は,SQLを
■Webブ Web情
Accessな
どの 商 用 の デ ー
用 い て デ ー タ ベ ー ス プ ロ グ ラ ミ ン グ を 行 う.
ラ ウザ 報 を 閲 覧 す る た め の ソ フ トウ ェ ア.Microsoft
Navigatorが
代 表 的 なWebブ
報 を 解 釈 し,コ
Internet ExplorerやNetscape
ラ ウ ザ で あ る.HTMLやXMLで
記 述 さ れ たWeb情
ン ピ ュ ー タの デ ィス プ レイ上 で 適 切 に レイ ア ウ トして 表 示 し て く
れ る.
■WWW情
報統合
イ ン タ ー ネ ッ ト上 に 分 散 し て 存 在 す るWeb情 ら を 組 み 合 わ せ て 利 用 者 に 提 供 す る こ と,情 の 情 報 源 の 付 加 価 値 を 高 め る こ と が で き る.例 報 と ホ テ ル な ど の 宿 泊 情 報 を 統 合 す れ ば,イ
報 源 か ら 関 連 情 報 を 収 集 し,そ 報 を 統 合 す る こ と に よ り,そ え ば,鉄
れ
れ ぞれ
道 や 航 空 機 な どの 交 通 情
ン タ ー ネ ッ ト上 で 旅 行 の プ ラ ン ニ ン
グ が 可 能 に な る.
■XML(eXtensible Webペ
埋 め 込 む.従
り 正 式 に 勧 告 さ れ た.文
2月 にW3C(http://
書 自体 の 中 に そ の 構 造 を 記 述 す る タ グ を
来 のHTMLと
異 な り,利 用 者 が 独 自 の タ グ を 埋 め 込 む こ と が 可 能 で
た が っ て,XMLを
ベ ー ス と し た さ ま ざ ま な デ ー タ交 換 フ ォ ー マ ッ トの 標
準 化 が 進 め ら れ る こ と に よ り,イ 配 信,電
Language)
ー ジ な ど を 記 述 す る た め の 文 書 構 造 記 述 言 語.1998年
www.w3.org/)よ
あ る.し
Markup
子 商 取 引,デ
ン タ ー ネ ッ ト上 で の よ り高 度 な 文 書 管 理,情
報
ー タ 交 換 や ア プ リ ケ ー シ ョ ン統 合 が 実 現 で き る よ う に な る.
よ り 詳 し い 情 報 はhttp://www.w3.org/XML/よ
り入 手 で き る.
【 用 語 集:第
4章 】
■ 位 置 依 存 型 サ ー チ エ ンジ ン
WWW文
書 を地 理 位 置 を条 件 と して 検 索 可 能 とす る サ ー チ エ ンジ ンで,例 え ば,
あ る 地 理 位 置 を指 定 す る とそ の 場 所 に 関 連 した レス トラ ン情 報 や 市 民 情 報 が 書 か れ たWebペ
ー ジが 出 力 さ れ る もの.地 域 ポ ー タル サ ー ビス な ど と も呼 ば れ る.地
図表 示 を と も な う もの が 多 い.一 般 にWWW文
書 に は,そ の 内 容 と 関連 した 地 理
位 置 を定 義 した メ タ情 報 と して の 位 置 情 報 を持 た な い た め,な 置 情 報 を付 与 す る必 要 が あ る.デ
ん らか の 方 法 で位
ィ レ ク トリ型 サ ー チ エ ン ジ ンで は,人 手 で位 置
情 報 を付 与 す る こ とが で きる.一 方 ロ ボ ッ ト型 サ ー チ エ ン ジ ンで は,自 動 的 に位 置 情 報 を付 与 す る こ とが必 要 で,高 速 か つ 正 確 な付 与 技 術 の 開 発 が 課題 とな って い る.
■ 位 置 依 存 型 情 報 検 索(Location
Based
検 索 者 の現 在 位 置 を 条件 に用 い た検 索.広
Search) い 意 味 で は,検 索 条 件 の 地 理 位 置 が
検 索 者 の 現 在 位 置 と異 な る ケ ー ス もあ り得 る が(例
え ば,日 本 に居 て ニ ュ ー ヨ ー
クの情 報 を検 索 す る こ と),モ バ イ ル 情 報 検 索 とい う意 味 で の位 置 依 存 型 検 索 の 検 索 条 件 の 位 置 は利 用 者 の位 置 と一致 す る.こ の検 索 は 大 き くPUSH型 に分 類 す る こ とが で き る.位 置 依 存 型 情 報PULLモ
とPULL型
デ ル で は,利 用 者 は 自分 の 現
在 地 の 緯 度 経 度 な どの位 置 情報 を検 索 条 件 と して検 索 サ ー バ に送 る と,検 索 サ ー バ側 は位 置 情 報 を キ ー に検 索 を行 い,結 果 を利 用 者 に提 供 す る,サ ー バ は,コ テ ン ッ を位 置 情 報 化,す
ン
な わ ち緯 度 経 度 な ど の位 置 情 報 を属 性 と して 付 与 して,
デ ー タベ ー ス に保 持 してお く必 要 が あ る,一 方,位 置 依 存 型 情 報PUSHモ
デ ル は,
利 用 者 が 情 報 源 に近 付 くこ とで 情 報 を取 得 す るモ デ ル で あ る.情 報 源 は一 定 の エ リア 内 に対 して位 置 関 連 情 報 を 「 放 送 」 し,ユ ーザ は そ の エ リ ア に 入 っ た 時 点 か ら情 報 を取 得 し始 め る こ と に な る.ど ビス を実 現 す る た め に は,ユ こ とが 必 要 で あ る.
ち らの 方 式 を とる に せ よ,使 い や す い サ ー
ーザ が位 置 情 報 の 測 位 や 入 力 を意 識 し ない で で き る
■位 置情報 サー ビス 本 章 に お い て 最 も重 要 な単 語 の 一 つ が位 置 情 報 で あ る.位 置 情 報 と は,検 索 者 お よ び検 索 対 象 の地 理 的 な位 置 を表 現 した 情 報 で,緯 度 経 度,住
所 な どが これ に
あ た る.モ バ イ ル情 報 検 索 は,検 索 者 が 動 け る こ とが 特 徴 で あ る ゆ え,検 索 者 の 位 置 情 報 の利 用 が 一 つ の 特 徴 と な る.一 方,所 在 地 等 の位 置 情 報 を持 っ た情 報 は 位 置 関 連 情 報 と呼 ば れ る.地 域 にあ る レス トラ ン の情 報 や イベ ン ト情 報 な どが こ れ にあ た る.た い.こ
だ し,位 置 関連 情 報 は略 され て 広 く位 置 情 報 と呼 ば れ る こ と も多
の位 置 情 報 そ の も し くは位 置 関 連 情 報 を提 供 す る サ ー ビ ス が,一 般 に位 置
情 報 サ ー ビ ス と呼 ば れ て い る.モ バ イ ル情 報 検 索 は,位 置 情 報 サ ー ビス の代 表 的 な もの で あ る.な お,こ
の 意 味 で の 位 置 情 報 サ ー ビス を正 確 に表 現 す る英 語 表 現
は存 在 しな い が,近 い 意味 で “Location Based Service”(位 置 に も とづ く情 報 サ ー ビス)と い う用 語 が 頻 繁 に使 わ れ て い る.
■位 置 情 報 プ ラ ッ トフ ォ ー ム 位 置 情 報 サ ー ビ ス を 実 現 す る た め に は,一 般 に ユ ー ザ の 位 置 情 報 が 測 定 さ れ,通 信 を 介 し て そ の 位 置 情 報 が 情 報 シ ス テ ム 側 に 伝 え ら れ る 必 要 が あ る.こ べ き 点 は,ユ
ー ザ の 位 置 はGPSや
こで 注 意 す
通 信 基 地 局 利 用 な ど複 数 の 方 法 に よ っ て測 位 さ
れ う る こ と を 前 提 と し て 考 え る 必 要 が あ る こ と と,測 定 さ れ た 位 置 情 報 は プ ラ イ バ シ ー に 十 分 気 を つ か う必 要 が あ る と い う こ とで あ る.言 測 位 方 法,移
動 通 信 の 方 式 の 差 異 に と ら わ れ ず,共
い 換 え る と,端 末 の 種 類 や
通 の イ ン タ フ ェ ー ス で し か も安
全 に ユ ー ザ 端 末 の 位 置 情 報 を得 ら れ る こ とが 必 要 と な る.こ に,端
末 の 位 置 情 報 を 管 理 し,ア
ク セ ス の た め の 共 通 プ ロ トコ ル を 提 供 す る シ ス テ
ム が 位 置 情 報 プ ラ ッ トフ ォ ー ム で あ る.位 る 代 表 的 な 機 関 に,DLPコ Location
Application
置 情 報 プ ラ ッ トフ ォー ム に つ い て議 論 す
ン ソ ー シ ア ム,LIFな
Platform:http://www.dlp.gr.jp/)コ
と し た200社
ど の 団 体 が あ る.DLP(DoCoMo ン ソ ー シ ア ム は,NTTド
以 上 の 団 体 が 参 加 す る も の で,LISAP(Location Protocol)と
② 自 己 位 置 通 知,③
の機 能 を実 現 す る た め
い う 通 信 プ ロ トコ ル を使 っ て,主
自 己 位 置 登 録,④
コモ を 中心
Information
Service
と して ① 自 己 位 置 検 索,
第 三 者 位 置 検 索 の サ ー ビ ス が 提 供 され て い
る.LIF(Location
Inter-operability
エ リ ク ソ ン,モ で,イ
ト ロ ー ラ,ノ
Forum:http=//www.locationforum.org/)は,
キ ア の 大 手 無 線 通 信 機 器 メ ー カ 3社 が 設 立 し た 組織
ン タ ー ネ ッ ト側 の ア プ リ ケ ー シ ョ ン か ら シ ン プ ル か つ 安 全 に ワ イ ヤ レ ス ネ ッ
ト ワ ー ク の 端 末 の 位 置 情 報 を 取 得 す る た め のMobile
Location
Protocolが
現 在 提
案 さ れ て い る.
■通 信基地局 利用測位方式 携 帯 電 話 な ど の通 信 基 地 局 の設 置 位 置 を利 用 して,端 末 の 位 置 を測位 す る 方 法 で あ る.国
内 で もPHSを
は じめ と し て,PDC,cdmaOne等
の 各 方 式 に お い て,
基 地 局 利 用 測 位 方 式 が 実 用 化 され て い る.こ の 方 法 で最 も シ ン プ ル な もの に,基 地 局 の通 信 領 域(セ
ル)を 使 っ た もの が あ る.例
え ば,PHSで
は,セ ル の 半 径 を
最 大 数 百 メ ー トル と小 さ く設 定 して い る の で,簡 単 な 地 図 表 示 な どの ア プ リ ケ ー シ ョ ンの 利 用 に手 頃 で あ る.セ ル サ イ ズ よ り も さ らに 精 度 の 良 い 測 位 結 果 を得 る た め に は,複
数基 地 局 の 情 報 を利 用 す る 方 法 が あ る.例
到 達 す る 電 波 の時 間差 を利 用 す る方 法(TDOA:Time 波 の 受信 角 度 を利 用 す る方 法(AOA:Angle
え ば,異
な る基 地 局 か ら
Difference Of Arrival),電
Of Arrival)な
どの 方 式 が あ る.
■モ バイル情報検 索とユ ビキ タス情報検 索 携 帯 端 末 や ワ イヤ レス通 信 の 発 達 は,情 報 検 索 に も影 響 を与 えて い る.モ
バイ
ル コ ン ピュ ー テ ィ ン グ とは文 字 ど お り動 き 回 る こ とが で きる コ ン ピ ュ ー テ ィ ン グ で あ るが,モ
バ イ ル環 境 下 で も情 報 検 索 は行 わ れ て い る.か つ て の 情 報 検 索 の イ
メー ジ は,一 般 の 人 の手 か ら遠 い 存 在 で あ っ た.し か し,現 在 は終 電 近 くの 駅 の ホ ー ム で,ほ
ろ酔 い 気 分 の 会 社 員 が携 帯 電 話 で 終 電 の 時 間 を調 べ て い て も何 も違
和 感 は な い.サ
ーチ エ ン ジ ン と並 ん で モ バ イ ル は,情 報 検 索 を強 く 日常 の タス ク
へ と転 換 させ た とい え る だ ろ う.そ の 技 術 群 を 育 み,モ
して こ の 流 れ が,本 書 に順 に紹 介 さ れ る 一 連
バ イ ル情 報 検 索 と い うジ ャ ン ル を形 成 して い る の で あ る.こ
の こ とか ら,本 書 で は利 用 者 が 動 き回 りな が ら利 用 す る情 報検 索 の サ ー ビ ス と技 術 を モ バ イ ル情 報 検 索 と呼 ん で い る.な
お,モ バ イ ル と しば し関連 付 け て語 られ
る言 葉 にユ ビ キ タス が あ る.ユ ビ キ タス とは 「遍 在 」 を意 味 し,い た る所 で計 算 機 環 境 を利 用 で き る こ と はユ ビキ タス コ ン ピ ュー テ ィ ン グ と呼 ば れ て い る.こ
れに
な ら う と,情 報 キ オ ス ク端 末 の サ ー ビス や(残 高 を 調 べ る とい う意 味 で の)銀 行 の キ ャ ッシ ュ デ ィス ペ ンサ ー な ど は,至 る 所 で 情 報 検 索 を提 供 して い る の で,ユ ビキ タ ス情 報 検 索 を実 現 して い る と み な す こ とが で きる.
■GPS(Global
Positioning
System)
モ バ イル 情 報 検 索 を実 現 す る上 で,検 索 者 の 位 置 の 測 位 は,最 も重 要 な 要素 技 術 で あ る.GPSは
人 工 衛 星 を使 って 測位 を可 能 とす る シス テ ム で,米 国 国 防 総 省 が
配 置 して い る複 数 の 衛 星 か らの 電 波 を受 信 して,受 信 機 側 で 位 置 を計 算 し,緯 度, 経 度,高 度 お よ び 時 間 を知 る こ とが で きる.も
と も と軍 事 目 的 で 開発 され た もの
で あ る が,民 間利 用 に も開 放 され て い て,現 在 広 くカ ー ナ ビゲ ー シ ョ ンシ ステ ム な どで 利 用 され て お り,2001年
暮 れ に は 日本 国 内 に お い て も初 のGPSを
携 帯 電 話 の 発 売 が 予 定 さ れ て い る.GPSに の 六 つ の 円 軌 道 に 四 つ ず つ 計24個
内 蔵 した
使 わ れ て い る 衛 星 は 地 上 約20,000km
配 置 され てお り,最 低 4個 の衛 星 を捉 える こ と
に よ り,時 間 を含 め た 測 位 が可 能 に な る.民 間 利 用 に送 出 す る信 号 に は,当 初 か らSAと
呼 ば れ る故 意 の 精 度 劣 化 が 運 用 され て い た が,こ れ が2000年
に な り,測 位 精 度 が10m程 入 が 予 定 さ れ て い る.GPS受
5月 に廃 止
度 に ま で 向上 した.現 在 も精 度 を向 上 させ る 方 式 の 導 信 機 は,ナ
ビゲ ー シ ョ ンだ け で な く,緊 急 時 の 位 置
特 定 な ど多 様 な 用 途 に 期 待 され て お り,小 型 軽 量 化,省
電 力 化,感
度 向 上 な どが
求 め られ て い る.こ れ に対 して,携 帯 電 話 等 を用 い た ネ ッ トワ ー ク支援 型GPSな どが 開 発 され て い る.
索
引 コ ン パ ク トHTMI.
ア行
サ行
位置依存型情報検索 位置情報の処理
101
96
サー チ エ ン ジ ン
位置 情 報 プ ラ ッ トフ ォー ム
100
109
位置 情 報 リポ ジ トリ 一 階述 語 論理 3S い ま ど こサ ー ビ ス
54
12 16
6
ン ソ ー フ ス
実体化
イ ンタ フェ ー スエ ー ジ ェ ン ト
オ ン トロ ジ
再現率
自己 組織 化 マ ップ
106
エージェン ト
95
77
述語
21 30
条件知識
72 6,28,66
45 39
条 件 リス ト
状態
力行
45
情報工一ジェン ト カー ナ ビゲ ー シ ョン システ ム
環境 の セ ンシ ン グ
S7
38
環境 モ デ ル
関係学習
30
完全照合方式
2 6
機械学習
28
帰納学習
28
クエ リプラ ンナ
67
5
初期状態
45
30
9f
セ ン シ ング
37
相関ルール
15 96
タ行 タス クエ ー ジェ ン ト
知識源
28
77
28
通信基地局利用測位方式
45
効果知識
情報検索
測位方式
帰納 論 理 プ ロ グ ラ ミ ング
訓練例
情報可視化
77
14,22
ス タ イル シー ト
関 係 デ ー タベ ー ス
行為
87
45
97
デ ィ レ ク ト リ型 サ ー チ エ ン ジ ン
効 果 リス ト
39
デ ィ レ ク ト リサ ー ビ ス
54
構造 デー タ
2
適 合 性 ブ イ ー ドバ ッ ク
7
黒板
73
ここの サ ー チ
適 合 率12,50 105
テ キ ス トマ イ ニ ン グ
14
8
デ ー タ ベ ー ス か ら の 知 識 発 見 デ ー タ マ イ ニ ン グ 転 置 フ ァ イ ル 統 計 的 手 法
13
モ バ イ ル エ ー ジ ェ ン ト モ バ イ ル 情 報 検 索
13
3
85
モ バ イ ル ツ ー ル 向 け 位 置 情 報URL
29
問 答
■ ナ 行
17
■ ヤ 行
ナ ビ ゲ ー シ ョ ン
ユ ビ キ タ ス 情 報 検 索
44
ナ ビ ゲ ー シ ョ ン プ ラ ン ニ ン グ ナ ビ研 フ ォ ー マ ッ ト
87
44,45 ■ ラ 行
99 ラ ッ パ ー
■ ハ 行
55
ロ ボ ッ ト型 サ ー チ エ ン ジ ン
バ イ ア ス
33
ハ イ パ ー リ ン ク
■ 英 数 字
30
半 構 造 デ ー タ
4
ARIADNE
ピ ア ツ ー ピ ア
11
BIG
非 構 造 デ ー タ
2
CC/PP
副 目 標
42
部 分 照 合 方 式 プ ラ ン
7
39,45 37
72 95
DLP
100
GML
99
GPS
プ ラ ン ニ ン グ エ ー ジ ェ ン ト ベ ン ダ 記 述
66
gnutella
プ ラ ン ニ ン グ
37
11 96
G-XML
34
99
HTML
ポ ー タ ル サ イ ト
54
4
HTML
55
ILP
30
■ マ 行 INSPEC マ ル チ エ ー ジ ェ ン トシ ス テ ム ミ ドル エ ー ジ ェ ン ト 無 意 味 語
76
メ タ デ ー タ
iモ ー ド
10
65
目 標 状 態
LIF
100
markup
algebra
NVML 45
OEM
モ バ イ ル イ ン タ ー ネ ッ ト ア ク セ ス モ バ イ ル イ ン フ ォサ ー チ
46
NaviPlan
37
103
85,91
99
93
KeyGraph
2
メ デ ィ エ ー タ
17
iナ ビ リ ン ク
79
6
メ タ サ ー チ エ ン ジ ン
目 標
88
44 99 63
OEM-QL POIX
64 99
60
9
98
RETSINA
ROC解
析
service
combinator
SGML
語
TREC
Warren
WWW情
63
79
ー チ エ ン ジ ン
45
14
95
WWW
11
93
57
Web マ イ ニ ン グ WML
2
ペ レ ー タ
66
9
WebSQL Webサ
TSIMMIS U-オ
60
デ ィ エ ー タ
SQL言
59
WebSPAM
23
4
SIMSメ
WAP
WebL
76
53 報 統合
XML
4
XML
55
54
7
<著者 紹 介 >
河野浩之 学歴 京都 大 学 工 学 部数 理 工 学 科 卒 業(1985) 京都 大 学 大 学 院工 学 研 究 科博 士後 期 課程 (1990)
現在 京都大学大学院情報学研究科助教授 山 田誠 二 学歴 大 阪 大学 基 礎 工学 部 制 御 工 学 科卒 業 (1984) 大阪大学大学院基礎工学研究科博士課程修工(1989) 現在 東 京 工業 大 学 大 学 院総 合 理 工 学研 究 科助 教 授
北村泰彦 学歴 大 阪 大学 基 礎 工 学 部情 報 工 学 科卒 業 (1983) 大 阪 大 学大 学 院 基礎 工 学 研 究 科博 士 課程 修 了(1988)
現在 大阪市立大学大学院工学研究科情報工学専攻助教授 高橋克 巳 学歴 東 京 工 業大 学 理 学 部 数学 科 卒 業(1988) 東京大学情報理工学系研究科電子情報学専攻博士課程在籍中 報 流 通 プ ラ ッ トフ ォー ム研 究 所 現在 日本 電 信電 話 ㈱NTT情 イ ン ター ネ ッ トの 知 的 情 報 技 術
情報検索 とエー ジ ェン ト 2002年3月10日
第 1版 1刷 発 行
著 者 河 野 浩 之 山 田誠二 北村 泰彦 高橋 克 巳 発行者 学校法人 東 京 電 機 大 学 代 表 者 丸 山 孝 一 郎
発行所 東 京 電 機 大 学 出 版 局 〒101-8457 東 京 都千 代 田区 神 田錦 町2-2 振 替 口 座 00160-5-71715 電 話(03)5280-3433(営 (03)5280-3422(編
印刷 東 京 書 籍印 刷㈱
〓Kawano
Hiroyuki,
Yamada
Seiji,
Kitamura
製本 渡辺製本㈱ 装丁 右澤康之
Takahashi Printed
in
Yasuhiko, Katsumi2002 Japan
*無 断 で 転 載 す る こ と を 禁 じ ます 。 *落 丁 ・乱 丁 本 は お 取 替 え い た し ま す 。 ISBN4-501-53440-O 〓
C-3004
< 日本 複 写 権 セ ン タ ー 委 託 出 版 物 >
業) 集)
IT技 術 関連 図書 ギガ ビッ ト時代のLANテ
キス ト
ネ ッ トワ ー カ ー の た め の イ ン トラ ネ ッ ト入 門
日本 ユ ニ シ ス情 報 技 術研 究 会 編 B5変 型 240頁 企業情報 システムやイ ン トラネッ トで重要な位置 を 占めているLANを 技術 的な観点か ら平易 に解説。最 新技術 も網羅 し,LAN全 体の理解に役立つ。
マル チ メデ ィア ビギナ ーズテ キス ト 第 2版
日本 ユ ニ シ ス 情 報 技 術 研 究 会 編 B5変
型 194頁
イ ン トラ ネ ッ トの 背 景 か ら,イ ン ター ネ ッ トや 既 存 シ ス テ ム との 関 連,さ らに ア プ リケ ー シ ョ ン 構 築 や セ キ ュ リテ ィ ま で,技 術 的 観 点 か ら網 羅 。
コン ピュータ音楽 歴 史 ・テ ク ノ ロ ジ ー ・ア ー ト カ ー チ ス ・ロ ー ズ
松 本紳/小 高 和 己 共 著 B5変 型 186頁 マルチメディアを構成する技術 を幅広 く網羅 し,そ の 原理,応 用,利 用方法 を技術 的な観 点から解説 した。
B5判
X.500デ
ISO15408
LDAP/X.509公
ィ レ ク ト リ入 門
第 2版
開 鍵 証明 書/デ ィジタ ル署 名
柳 龍 也 他 訳
デ ジ タ ル オ ー デ ィ オ の 「聖 典 」 と して コ ン ピ ュ ー タ 音 楽 の 基 礎 的 理 論 か ら,MIDI音 響心理 学等 を解説 した フ ァ ン待 望 の 解 説 書。
情 報セ キ ュ リテ ィ入 門
大 山 実 他 著 B5変 型 192頁 イ ンターネ ツトの検索サー ピスで注 目のLDAPや 分 散デ ィレク トリに ついて,X.500の 標準化 に携わ っ た著者が解説。デ ィジタル署名の技術と して電子商取 引の基盤 となるX.509公 開鍵証明書についても詳解。
内 山 政 人 著 B5変 型 272頁
シ ス テ ム 開 発 の 体 系
Webサ
JISXO160/共
Webサ
通 フ レーム98対 応
著/青
1074頁
欧 米 で の 情 報 セ キ ュ リテ ィ に 関 す る 優 れ た 成 果 の 一 つ 「ISO15408」 に 基 づ いて,イ ンタ ー ネ ッ トや コ ン ピ ュ ー タ シス テ ム に 必 要 と され る情 報 セ キ ュ リテ ィ の 取 り組 み を 詳 細 に解 説 した 一 冊 。
イ ト入 門 シ リー ズ イ
ト
開発や取 引の現場 における作業を細分化 し,範 囲と内 容 を定義。実務で活用できるよ う具体 的に解説 した。
エ ン ジ ニ ア リ ン グ 入 門 T.A.パ ウエ ル 他著/篠 原稔 和 監 訳 B5変 型 296頁 Webサ イ トにソフ トウェア開発方法論 を適用 した初 の本格 的テキ ス ト。Webサ イ トのデザ イン/構 築に 必要な すべての知識 を網羅。
XMLコ
WWWに
日本 ユニ シス 情 報技 術 研 究 会 編 B5変 型 280頁
ンテ ンツの作 り方
川 俣 晶 著 A5判 136頁 会 話 形 式 を 用 いて 解 説 し,イ
ン ター ネ ッ トの 最 新 技
術 を 楽 し く読 め る よ う 工 夫 した 構 成 とな って い る 。 XMLの 入 門 に最 適 に 一 冊。
*定 価,図
お け るXMLの
活 用
日本 ユ ニ シス 情 報 技 術研 究 会 編 B5判 228頁 イ ンターネッ ト上で の商取 引を具体 的なモデル にあ げて,XMLの ビジネスでの活用法 を技術 的に解 説。
書 目録 の お 問 い合 わ せ ・ご要 望 は 出 版局 ま で お 願 い致 し ます.
C-7 2
デ ータ通 信 図書/ネ
ス ペク トラム拡 散通信
モバ イル コ ン ピュータの デー タ通信
次 世代 高 性 能 通信 に 向け て 山内 雪路 著 A5判 168頁
山 内 雪 路 著 A5判
ッ トワー ク技 術解説 書
288頁
モ バ イル コ ン ピ ュ ー テ ィ ン グ 環 境 を 支 え る 要 素 技 術 で あ るデ ー タ通 信 プ ロ トコ ル を 中 心 に,デ 技 術 全般 を平 易 に 解 説 した 。
ータ通信
デ ィジタル移 動通信 方式 第 2版 基 本 技 術 か らIMT-2000ま
次世代 の無線通 信 システム の基幹技術 にな るスペク トラム拡散通信 につ いて,そ の特徴や原理 をで きる だけ平 易に解 説。
デ ィジタル放送 技術
で 松 尾 憲 一 著 A5判
山 内 雪 路 著 A5判
160頁
デ ィ ジ タ ル 映 像,音 響 機 器,デ ィ ジタ ル 通 信 に も 関 連 す る デ ィ ジ タ ル テ レ ビ ジ ョ ンの 基 礎 技 術 を現 場感
160頁
移 動 体 通信 シス テ ム の 理 解 の た め に,デ 復 調 技 術 か らIMT-2000ま でを解説。
MATLAB/Simulinkに
ィ ジ タル 変
よる
CDMA サ イバ ネ ッ トシ ステ ム(株)・ 真 田 幸俊 共 著 A5判 186頁 次 世代移動通信方式と して注 目されているCDMAの 複雑なシステムを,ア ルゴリズム開発言語 「MATLAB 」 とブロック線 図シミュ レータ 「Simulink」を用い て解説。
覚 で 平 易 に 解 説 。 放 送 関 連 の エ ン ジニ アの テ キ ス ト としても最適。
高周波の基礎 三輪 進 著 A5判 168頁 高周 波を学ぶ初学者 向けに基礎知識 も取 り上げて解 説 した書籍。ペー ジ見開きの右側 に図 面,左 側に解 説を掲載 し,1章10ペ ー ジで構 成 した。章末には練 習問題を収録。
理 工学講 座
理工 学講 座
電 気 通 信 概 論 第 3 版 通 信 シ ステ ム ・ネ ッ トワー ク ・
通 信 ネ ッ ト ワ ー ク
マ ル チ メデ ィア通 信 荒谷 孝 夫 著 A5判 226頁 2色刷 全面的に見直 し,特 にイ ンター ネ ッ ト・ISDN等 マ ルチメデ ィア通 信につ いて大きく書き改めた。
荒 谷 孝夫 著 A5判 234頁
理工学 講座
理工 学講 座
ア ン テ ナ お よ び 電 波 伝 搬
画 像 通 信 工 学
電話網,移 動通 信,ISDN等 の仕組み と構 成要素 に ついて,工 学的 な立場か ら解説 した。
三 輪 進 ・加 来 信 之 共 著 A5判
176頁
ア ンテ ナ と 電 波 伝 搬 の 主 要 な 項 目を 平 易 に解 説 。 解 説 と関連 図 表 を 見 開 き に 配 して,見 や す さ ・わ か り や す さ に 配 慮 した 。
*定 価,図
村 上 伸 一 著 A5判 210頁 画像 を中心 に した最新の各種通 信 システム を、そ の 構成原理 と主要技術 につ いて 基礎技術か ら解説。
書 目録 の お 問 い合 わ せ ・ご 要 望 は 出 版 局 ま で お 願 い致 しま す.
C-63
情報科学図書 情報科学セ ミナー
情報科 学 セ ミナ ー 遺 伝 的 プ ロ グ ラ ミ ン グ CD-ROM(C/LISPに よ るGPプ
遺 伝 的 アル ゴ リズ ム の 方 法 ロ グ ラム)
伊 庭 斉 志 著 A5判 272頁 遺 伝的 アルゴ リズムか ら進 化し,人 工生命の難問 に も挑戦 できる遺伝的 プログラミングの解 説書。
メ ラニー ・ミ ッチ ェル 著 伊 庭 斉 志 監訳 A5判 272頁 GAや この領域 に関する面 白い研究 や高度な 例題 を 幅 広 く網羅 し,入 門書 と してわか りやす く解 説。
情 報 科 学 セ ミナ ー
情 報科 学 セ ミナー
量 子 コ ン ピ ュ ー タ
人 工 生 命 と 進 化 シ ス テ ム
西 野哲 朗 著 A5判 154頁 量子 コンピュータの根底にある考え方 を,計 算機 科 学の立場か ら平易に解 説。
ATR進 化 シス テ ム研 究 室 編 A5判 236頁 人 工生命研究 の総本 山といえるATR人 間 情報通 信 研究所 で進 め られている研究 を平易 に解 説。
情 報 科 学 セ ミ ナー
情 報科 学セ ミナー
ス イ ッ チ ン グ 理 論 と 応 用
数 理 科 学 概 論
足 立 暁 生 著 A5判 200頁 科 向 け の 教 科 書 で あ る 。 例,例 題,問 題 に よ り込 み 入 っ た 理 論,技 法 も理 解 しや す い よ う に配 慮 し た 。 特 に,計 算 機 科 学 へ の 橋 渡 しを 意 識 して 編 集 した 。
桜 井 明 著 A5判 186頁 自然現 象や 社会現象を数式化 して研究す る学問で あ る数理科学 の全体 像を初めて明 らか にす る。基礎 と 手法,さ らに実際例と して物理,統 計,心 理,経 済, 社会科学,言 語,芸 術と広範な分野 につ いて言及。
ニ ュ ー ラ ル コ ン ピ ュ ー タ
ニ ュ ー ラ ル シ ス テ ム
ブ ー ル 代 数 の 基 礎 とそ の 応 用 分 野 を 扱 う大 学 専 門 学
脳 と神 経 に学 ぶ
人工知 能研 究の 行 き詰 ま りを打 破 したニ ュー ラル (ニュー ロ)コ ンピュー タについて,最 初 に日本に紹 介 し,今 日に至 るまで,こ れ以 上の入門書はない と いわれるロ ングセ ラー。
に お け る カ オ ス 合 原 一幸 編 著 A5判 378頁 カオス工学をリー ドす る国内外16名 の研究者が,最 先端の研究 を盛 り込んで 「 脳 」,す なわちニ ュー ラ ル システム とカオ スの関係 を理論 ・実験の両 面か ら 解 説 した。
情 報科 学セ ミナー
情 報科 学 セ ミナー
ア ル ゴ リ ズ ム 論 理 論 と 実際
オ ブ ジ ェ ク ト指 向 シ ス テ ム 分 析 3つ の モデ ル に基 づ くア プ ローチ
G.ブ ラ ッサー ル/P.ブ ラ ッ トレー 共 著 足 立暁 生 訳 A5判 434頁 広 い範囲 の様 々な問題 を取 り上げ,そ れぞれ に対 し アル ゴリズ ムの基礎的な考察や応用の意味 を記述。
デ ビ ッ トW.エ ンブ レイ 他共 著 畠山正 行 監 訳 A5判 370頁 オ ブジェク ト指向の対象を,プ ログラム開発の静 的 な分野 にとどめず,よ り広大な世界の モデ リングと 記述法 とと らえ,シ ステム全体の分析 に用 いた。
合 原一 幸 著 A5判 236頁
*定 価,図
書 目録 の お 問 い合 わ せ ・ご要 望 は 出版 局 ま で お 願 い 致 し ます.
D-58