スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

図書館総合展2日目 その2

図書館総合展2日目その2

2日目2つ目のフォーラムは
「EX Libirisが実現するサービスの統合化と利用者環境の向上」です。
裏番組の貸出履歴も魅かれていたのですが、こちらを選びました。

司会:増田さん@ユサコ
2001年からEL社の総代理店をやっており、総合展では今年もEL社のサービスについて講演をいただく。講師はTamar Sadehさん(タマ・サデさん)もともとソフトウェアのエンジニアをやっておられて、今はEL社のマーケティングディレクターとして、オープンプラットフォーム戦略を担当している。

Tamar さん
ある論文を紹介するところから始めたい。1977年のノーベル物理学賞を受賞したフィリップ・ウォレン・アンダーソンの論文
P. W. Anderson More Is Different, " Science New Series, Vol. 177, No. 4047 (Aug. 4, 1972), pp. 393-396
●この論文の一部を取り出して紹介されたのですが、どの部分だか特定できていません。すみません。わかる方がいたらお知らせください。最悪、増田さんに聞いてみるか・・・

学術文献の総数がどれだけあるか。これは非常に難しい。出典が違うと数が違う。学術雑誌の定義や関係性もはっきり決まっていないのではっきりはわからない。
学術機関では次のようなものを導入している。200から600のデータベース。抄録や索引データベースそれからフルテキストのデータベース。20000から 90000タイトルのジャーナル。例えばハーバードは90000タイトル契約している。電子ブックも登場していてさらに拡大中である。また音楽資料、画像資料、統計、リサーチレポート、データセットなど他にもいろいろある。学術機関が導入するものはエンドレスに増えていく。

それでは、どのようにして各機関はそうしたリソースへのアクセスを可能にするか。昔は静的なHTMLで個別にリンクをはっていた。それが自動生成されるようになった。
●ここでハーバードのSFXとMetalibの例示

1999年にSilverplatterが新しい試みを始めた。インターネット上の学術コンテンツの新たなナビゲート手法。図書館、出版社、ディストリビュータ、技術開発者との協力で大きなリポジトリを作ろうというもの。しかしこれは失敗した。
 ←まず市場が準備できていなかった。データプロバイダがデータを出したがらなかった。それから技術もまだ不十分だった。さまざまな機関からのすべてのデータを集めて、1つのところに落とし込むことが10年前はできなかった。

その他にも大規模プロジェクトがある。
デンマークのDTUが行っているDADS ●http://www.dtic.dtu.dk/infosog/dads.aspx
スウェーデンルンド大学のELIN  ●http://www.lub.lu.se/en/about-lub/organisation/lund-university-libraries-head-office/information-about-elin.html
そしてOhio link ●http://www.ohiolink.edu/
例えばDADSには80ミリオンの論文がある。

他の手段として、いわゆるメタサーチがある。EL社のMetalibは1500機関が使っていて人気はある。しかしよい点悪い点がある。
メタサーチの長所
 ・単一の窓口になりうる。シングルポイント。
 ・検索のスコープをデータベースやカテゴリによって絞ることができる。
 ・常に最新のデータが得られる。常にDBにアクセスして探しているから。
 ・データの重複もない
 ・導入が容易。

メタサーチの短所
 ・すべてのリソースがメタサーチで対象にできるわけではない。
 ・比較的遅い。それはリソースのレスポンスに依存するから。
 ・取得するレコード数に制限がある場合がある。
 ・異なるDBからの結果を統合することの難しさ。

で、今日ではどうなのか?さまざまな出版社から出る大量の情報を提供する他の方法があるのではないだろうか。

ユーザは単一インターフェースを志向している。技術も10年前より格段に進歩した。情報プロバイダも発見されやすさを意識している。昔よりデータ・メタデータが提出されやすくなっている。
→巨大な統合されたデータベースを作る時期に来ているが、しかし賢明に注意深くやる必要がある。

Wisely and carefullyとは?
 ・利用者が誰なのか
 ・機関を核として機関が必要なものを提供する必要
 ・利用者にフォーカスをして考える必要
 ・リコメンデーションも必要。関連資料へのリンクツールとか関連のある適切なサービスを提示するもの

→データはそこにある。しかしそのニーズは適切な技術によってサポートされるべきである。

近年多くの試みがある。SS社のsummon、OCLCのworldcat、ebscoのdiscovery service、そしてEL社のPrimo Centralである。
●Primoの検索結果一覧の例を提示
DBからの論文と蔵書が同じ画面で、関連するものが適切に提供されるようになっている。

Primo Central
学術情報の集中インデクスとして機能する。論文、電子ブック、他に広がり、グローバルかつ地域的に重要な学術アイテムを対象とする。EL社がホストし、メンテナンスを行う。Primoのライセンスを持つ全てのカスタマーが使うことができる。Primoによって、統合した検索結果の表示、関連度によるソートを行うことができ、メタサーチではないので、スピードも速い。集中インデクスであるということはつまり次のことを意味する。
・メンテナンスが継続される
・情報プロバイダからの同意を得る
・コンテンツをハーベストしノーマライズして提供する

次世代(Next Generation)のディスカバリーツールを通して集中インデックスが利用者に成功するディスカバリーを提供する。そしてこの集中インデクスは図書館ににユーザのサーチを知るためのツールを提供するべきである。次世代のシステムは洗練されたツールを提供しなければいけない。
そしてデリバリーについては、現在と同様に情報プロバイダから提供され、リンクリゾルバを通して、フルテキストが提供できる。Primo Centralを使うと図書館内も外も両方のソースを探すことができる。Primo Centralがメタデータを持っている。ユーザからは図書館内のデータか外のデータかを意識しないでいいことになる。Primo CentralはPrimoのアーキテクチャに対応しておりPrimoのテクノロジーでさまざまな学術情報にアクセス可能となる。図書館のカタログや Primo Centralの関連がある部分(=購読している部分?)そしてそれ以外のリソースにもアクセスできる。Primo Centralはデータ統合のパワーを持っている。コストパフォーマンスがよく、リモートリソースへのアクセスを可能にする。Primoのアーキテクチャにフィットしいる。機関がユーザに提供する検索環境をコントロールできる。

利用者から見ると大量のデータ+Googleタイプの検索+関連度ランキングという事になる。一方でユーザは結果リストの最初だけ見るので、関連する資料を見失う可能性が出てくる。そのため利用者が必要な資料の発見を支援することが必要となってくる。

ファインダビリティの強化のための新しい方法。
検索はスタートに過ぎない。検索結果リストを活用する。つまりファセットブラウジングや新しいサーチの提案。それからユーザが明示的・暗示的に出す意見をインプットとできる。資料を評価したり、その他の関連資料を発見する支援として。

Webは多角的に変化しつつある。単に情報を提供する場所でなく利用者から情報を得る場所にもなっている。

●Amazonの例を紹介。
カスタマーレビュー、システムが他の人が一緒に何を買ったか、他に何を買ったか、最終的に買った人がどれだけいるかなどを提示。タグ付け、レーティング、レビューに対する評価、ユーザのディスカッションの場所もある。ユーザが作るリスト→利用者を理解し、効率的サービス→売り上げ拡大

利用者にとっては、資料の評価が簡単になる。関連する資料を見つけるのが簡単。なにより楽しい。自分が参加することを楽しいと感じることができる。

そこで学術分野に目を移してみる。
利用者からの明示的な貢献としては、引用、レビュー、タグ付け、評価などがある。Primoをみるとレビューができる、タグ付け、レーティングもできる。 Natureがこれに関してプロジェクトを開始した。科学者・学者にレビューを書いてもらうというもの。しかしこれは失敗した。研究者は別の論文を書くことでレビューしたいと考えているからだろう。
Nielsen, M. ”Doing science in the open", physicsworld.com, 2009
http://physicsworld.com/cws/article/indepth/38904

暗示的なものとしては次のようなものがある。Circulation(流通)のデータ、検索プロセスの傾向、利用者のアクション(閲覧、ダウンロード、送信、ブクマ、印刷、保存)。これをどう使っていくことができるか。コレクション構築、資料の評価、トレンド分析(3ヶ月、6ヶ月後の動向分析ができる)、関連度ランキング、リコメンデーションなどに活用できる。

利用に基づく評価とはどういうことか。これまでは活用してこなかったものである。authorshipからreadershipへの移行が起きている。タイムリーに評価が得られる。引用を元に分析すると、引用されるまで1年とか2 年とか時間がかかる。しかし利用に基づく評価はそんなに待つ必要がないし、h-indexやImpact Factorがカバーできないような新しいタイプの資料もカバーできる。ただしこれはそうした既存の指標に取って代わるものではない。既存の指標に変わるものではなく、追加の指標として使うものである。

Library thingの例示。リコメンドをだしている。
ドイツの大学(BLB):貸し出しを受けた人の情報を集めて、リコメンドを提示。
●すみません。どこの大学だったか具体的にメモを取りきれず。

利用実績を使う際の課題としては次のようなものがある。
 ・プライバシーの問題
 ・包括性:真に使えるものになるためにはコレクションの包括性が必要。
 ・正当性:利用データが信頼に足るか。validity
 ・標準化:さまざまなソースから情報を得るので、同じ形で得る必要がある。
 ・量が必要:少数では意味がない

最初の課題に戻ってみる。一貫性を持って、数えていくにはどうしたらよいか。
COUNTERプロジェクトの紹介
出版社主導のプロジェクト。2002年に開始。100以上の出版社が参加し、15,000以上のフルテキストがある。定義しているのはレポートと実務指針。そしてCOUNTER準拠の利用統計を転送するメカニズムとしてSUSHIがある。これはNISOの規格になっている。

それでは、この統計をどう使っていくか
UKSG(英国逐次刊行物グループ)のUsage Factor projectがある。2006-2007に実施。実験を行い、モデル化をし、問題の特定をしようとしている、一貫性や定義の問題、たとえば論文の出版年や利用年をどのように定義するか。論文の出版日といっても様々ある。アーカイブに入った日か、出版された日か。そうした定義が必要。

もう一つのプロジェクトとして、MESUR
これはロスアラモス研のプロジェクトで、OpenURLを開発した、ヴァン・デ・ソンペルが関わっている。1 billionの利用トランザクションを出版社、アグリゲータ、図書館から取得し、メトリクスを調査しようというもの。
図書館からの情報はSFXのログで提供される。目的は利用に基づく指標を調査し、その正当性を検証することと、学術コミュニティをマッピングすること。39の評価指標をを調査し、3つが重要なものとして出てきた。
・人気:どのぐらいのリンクが張られているか、ジャーナルからのリンク、ジャーナルへのリンク、その数。
・最短経路:ネットワーク上の距離と強さ
・プレステージ:どれだけ一流の雑誌がリンクしているか。
http://public.lanl.gov/herbertv/papers/jcdl06_accepted_version.pdf

引用ベースの分析と比べると、かなり信用できるのではと考えている。こうした研究結果から図書館で使えるツールを提案したい。
→bX

bX は学術資源の新しいリコメンドサービス。OpenURLのフレームワークに基づいて開発されている。OpenURLのログを分析、データマイニングを行いリコメンドするもの。2009年5月にベータリリース。ホスティングサービス。既に170機関が購読中。呼んでいる論文に関連した論文をSFXのメニューとして出したり、Metalibの検索結果、それからxerxesから出すこともできる。もちろんPrimoのVer.3からもリコメンドを見る事ができる。

なぜリゾルバのログを使うのか。標準化された手順で利用者が求めるパスを提示できる。情報プロバイダ、機関を超えて提供されている。すべての機関で同じログが出てくる。そしてたくさんあるので、統合していく基礎となる。リゾルバの仕組みを復習するとリンクリゾルバはハブとして機能するものであるということ。利用者の動きを見てみると、たとえばebscoで何かを検索し、SFXでフルテキストを見る。次いでプロクエストから検索したり、 OCLC FirstSearchから検索をしたりする。SFXのログでは、同じセッションでどれをクリックしたかが記録されている。そのため、それを取り出すと関連性がわかる。つまり同じセッションで探した論文間には関連性があり、それがSFXのログからわかる。
多くの人の、多くの機関のログを集めて分析をすると非常に複雑なグラフが出てくる。これをarticle relationshipsと読んでいる。bXはOpenURLで探した論文の情報を ContextObjectで送る。そうするとそのグラフ(article relationshipsから関連性を見て一番近い論文を出してくる。bXへはAPIを通してリクエストする。結果はXML、TEXT、ATOM、 RSSで返す。

簡単にまとめるとOAI-PMHをつかってリンクリゾルバのログをハーベストする。するとそのログを元に、リレーションシップグラフを構築し、推奨文献リストを作成する。

bXはWeb2.0のサービス。関連性の高い、信頼性のあるリコメンドを提供する。引用と違って何年もかからない。最新の国際的で高品質なデータを元にしている。そしてSaaSとして提供されている。

最後に一つ紹介して終わりたい。
Jeffrey M. O'Brien "The race to create a 'smart' Google"
http://money.cnn.com/magazines/fortune/fortune_archive/2006/11/27/8394347/
webは検索から発見へ。検索は何かを探すものだが、発見は知らなかったものがやってくる。

More is differnt!

<質疑応答>
きんとうさん?@筑波大学:bx、ベータが取れるのはいつごろか。どれぐらいの規模のデータが集まっているか。

T:ベータだからうまく言ってないというものではない。もっと包括的なデータ、テストが必要と考えており、年末までデータ収集は行っている。進行中のプロジェクトである。Google Scholarは2004年から動いているが、まだベータである。ベータで続いていく場合もある。ユーザのクリック数は何千万と集まっている。 Boston Collegeなど。どれだけ使っているかというと、90%までいかないがよくなってきている。bXを使うだけでなくデータを提供するという貢献もできる。

新開さん:紀伊国屋書店
リコメンドのコントロールをどう考えているか。それとEL社の他のアプリケーションとの整理はどうなっているのか。

T:リコメンドとして表示できる数はデフォルトでは3つ。20まで同時に表示する事ができるが多ければよいというものではない。図書館側で決めればよい。bX はAPIで提供されており、リクエストがあればそれに返していくので、どのアプリを使うかはユーザが決めればよいことである。もしbXを使うアプリを作りたいということであれば、当然bXを買う必要がありますけど。

●感想等
情報としてそんなに目新しいことはなかったが、EL社のしたたかな戦略を感じたプレゼン。ちなみにアジアパシフィック担当のvice presidentのOdedも来ており、会場の反応をチェックしていた。

私の理解によればEL社の製品は
・安定したAleph。しかし作りは伝統的で古い。
・売れているSFX。
・Metalib。数は出ているかも知れないが、遅いなど評判は?
・その他いろいろあるが、インパクトはそんなにない。
・Primoは次世代製品として、ちょっと出遅れ?
→これまでは安定したコア製品であるAlephを中心にその周りにいろいろ作る事で、図書館のサービスをトータルにサポートできるような製品ラインナップを用意することで成長してきた。
といった感じ。
そうした課題や市場に対して打てる手を着実に打ってきているなあと。つまり
・古くなったAlephをデジタルの時代に向けてURMに移行させていこうと動き出す。
・売れ筋SFXを使った新しい(しかも時代のニーズみたいなものを取り込んだ)サービスbXの提供。
→売れ筋をベースにさらに売り上げを上げることをもくろむ
・評判?のMetalibはやはり横断検索の限界を示していそう。そこで次世代Primoを売りたいという思惑と、MetalibのフェードアウトをかねてPrimo Centralを立ち上げ。これによって蔵書とEJとかDBをシングルポイントで提供し、かつ性能もよくなるというメリットを売り込むか。

当然bXだって何年か前から開発していたんだろうし、先をみた開発等もしつつ、SFXベースで足元の商売もするという堅実さ。数年後の製品ラインナップは URMとPrimo(その2つと連携してSFXやbX、Verdeが動く。)という構成か。URMとPrimoの出来が今後を左右するのは間違いない。 Primoは現時点ではいまいちな感じだが、次のバージョンでどうなるか。

「海外のベンダーに依存するな」とかいう話もあったようですが、日本のベンダーにこうした戦略やある程度の展望を持った開発を行ってる、行えるところがどこまであるのだろうか。ベンダーに依存しきってしまうなら海外でも国内でも同じ事。ベンダーとどう協力して、どうやって図書館サービスをよくできるか、という事に役立つのであれば海外とか国内とか関係ない。そういう点で(別のエントリで書きますが)NTTデータ九州さんとかリコーさんには期待したい。


trackback


この記事にトラックバックする(FC2ブログユーザー)

-

管理人の承認後に表示されます

コメント

非公開コメント

検索フォーム
アクセスカウンター
RSSリンクの表示
リンク
ブクログ
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。