Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

The NExT Search Center: User Generated Content を解析

日時: 2013年12月6日(金) 場所: 国立情報学研究所19F (1901/1902/1903) A/P Min-Yen KAN (准教授 靳 民彦) Web IR / NLP Group (WING) シンガポール国立大学 情報アクセスシンポジウム 2013
by

Min-Yen Kan

on 28 April 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of The NExT Search Center: User Generated Content を解析

シンガポール国立大学
(ケントリッジ キャンパス)
シンガポール
シンガポール国立大学
(NUS)
南洋理工大学
(NTU)
シンガポール経営大学
(SMU)
(例) シンガポールの研究基金機構
National Research Foundation
(シンガポール研究基金)

Media Development Authority
(メディア開発局)

International Research Centres
(国際研究センター)
情報学部
教員数:
110名以上の教員
2つの学科
計算機科学科 / 情報システム学科

学生数:
約2,200人の学部生
約550人の大学院生


1900年代初期に設立
3万人の学生
The Search Center:
User Generated Content を解析

A/P Min-Yen KAN (准教授 靳 民彦)
Web IR / NLP Group (WING)
シンガポール国立大学
情報アクセスシンポジウム 2013
和訳: 杉山一成
http://bit.ly/18iYhaW からスライドのダウンロード可
1965年建国
人口: 500万人以上 (増加中)
1年中、暑く湿度が高い
User Generated Content (UGC)
読者によって作られたコンテンツ
Web2.0 の特徴
世界中のUGC

日本の Mixi, Gree, Line を含む
NUSにおける研究センターの管理組織
Interactive and Digital Media Institute (IDMI)
NUS IDMI
Centres
シンガポール国外の有力大学との連携
5年間にわたって、各センターに、1,000万シンガポールドル(約8億円)の研究費を配分
5-6人の教員がシンガポール国外の大学と共同研究
中国-シンガポール ディジタルメディア研究所

対象: 自然言語学習とそれを支援するもの
共同研究機関: 中国科学院
ユビキタス技術の具現化
対象: 実際の遺跡
共同研究機関: 慶応大学
対象: インターネットに接続されているもの、
センサーネットワーク
共同研究機関: 浙江大学
Sensored-Enhanced Social Media (SeSaMe)
対象: User Generated Content
共同研究機関: 精華大学
NExT Search Center
COSMIC:
Centre of Social Media Innovations for Communities
対象: ピラミッド内部
共同研究機関: インド工科大学デリー、南洋理工大学

WING は2つの研究センターに参加
本日は、NExT プロジェクトを対象にお話します。
中国語のUGC
http://idmi.nus.edu.sg
http://www.comp.nus.edu.sg/
http://csidm.sg/
http://cutecenter.nus.edu.sg/
http://www.nus.edu.sg/
http://sesame.comp.nus.edu.sg/
http://cosmic.nus.edu.sg/
http://next.comp.nus.edu.sg/
オンラインソーシャルネットワーク (OSN) のアカウントの統一

低コスト、拡張可能な方法で、同一人物に対してのOSNアカウントを同定し、
マージする

Muthu Kumar
– Researcher Productivity
Ankur Khanna
– ParsCit
Michael Yue, Patrick Chen
– Scientific
Paper Summarization
Bang Hui Lim
– Discourse Parsing
Jun Ping Ng
– Temporal Analysis and
Summarization
Aobo Wang
– Informal Chinese
Understanding
Jovian Lin
– Mobile App Recommendation
Tao Chen
– Weibo Analysis
Xiangnan He
– Web 2.0 Importance


Kazunari Sugiyama
– Recommender Systems in Digital Libraries
Dongyuan Lu
– Cross Platform Social Media
Graduate Students
Undergraduates and Interns
Research Staff
我々の目標: 自然言語処理と情報検索技術の電子図書館
への応用
... 5 PhD alumni and over 60 undergraduate alumni
プラットフォーム をまたいだ解析
OSNを使う際に、どのようにセッションを検出するのでしょうか?
人々は、どのような目的で、自分たちが属するOSNを使うのでしょう?
なぜ、また、どのように、人々はプラットフォーム間を切り替えていくのでしょうか?

北京、
中国
北京の北西地域
中国のIT拠点と教育拠点の本拠地
NExT with Tsinghua Univ.
CSIDM with Chinese Academy of Sciences,
Institute of Automation
異なるニュースポータル
ニュースの異なる側面間の意見の相違を検出
フォーマルか、インフォーマルか
国内か、海外か
中国語か、英語か
使われている技術
機械翻訳
語、または文のアラインメント
(多言語の) 固有名認識
評判分析
コメントからニュースへのアラインメント
Jun Ping Ng
– Temporal Analysis and
Summarization
Aobo Wang
– Informal Chinese
Understanding
Jovian Lin
– Mobile App Recommendation
Tao Chen
– Weibo Analysis
Xiangnan He
– Web 2.0 Importance


Kazunari Sugiyama
– Recommender Systems in Digital Libraries
Dongyuan Lu
– Cross Platform Social Media
Graduate Students
Research Staff
Muthu Kumar
– Researcher Productivity
Ankur Khanna
– ParsCit
Michael Yue, Patrick Chen
– Scientific
Paper Summarization
Bang Hui Lim
– Discourse Parsing
Undergraduates and Interns
... 5 PhD alumni and over 60 undergraduate alumni
100を超えるロゴ、300を超える製品、100を超えるブランド、ユーザ情報
3か月にわたる、100万の画像を伴った、約300万のマイクロブログ

NExTの将来計画: 研究用の大規模なデータセッ群**
ブランド、または製品を追跡するためのデータセット
イベントの検出と追跡のためのデータセット
映像中のイベント検出と共有のためのデータセット
その他: 画像/映像のアノテーション: 人物と位置の解析 ...
約100のイベント、100を超える最近の話題
200万を超える画像を伴った、約500万のマイクロブログ
タスク: データ収集とフィルタリング、イベント検出、重要なイベント検出
We cannot share raw data, but we plan to share analytics
Study analytics that are useful for sharing
Work on framework on sharing of analytics across different social observatory systems

**Analytics
どのようにするのでしょうか?
ユーザ名を、できる限り注目する
ユーザ名はOSNにおいて、どこにでもあるので、それらを、できる限り使用するようにする

アバター、位置名、リンクしているURL、プロファイルの文字列も、意味を持つ。しかし、解析するためのコストが大きい(ネットワーク上でのやりとりを必要とする)
Short Message Service
個人、そしてプライベートでメッセージを送るために、いまだに、よく使われているサービス
驚くべきことに、SMS の使用については、ほとんど知られていない
世界最大のオープンアクセスSMSコーパス
ご清聴ありがとうございました!

Jun Ping Ng
– 時制解析と要約
Aobo Wang
– インフォーマルな中国語の理解
Jovian Lin
– スマートフォンアプリケーションの推薦システム
Tao Chen
– 中国版SNS, Weibo (微博) の解析
Xiangnan He
– Web 2.0 コンテンツの重要さ
の解析



Kazunari Sugiyama (杉山 一成)
– 電子図書館における推薦システム
Dongyuan Lu
– クロスプラットフォーム・ソーシャルメディア

大学院生
研究員

Muthu Kumar
– 研究者の生産性
Ankur Khanna
– ParsCit
Michael Yue, Patrick Chen
– 学術論文の要約
Bang Hui Lim
– 談話における構文解析
学部生とインターン生

5人の博士課程修了生と60人以上の学部卒業生
**解析結果
データそのものを共有できませんが、解析結果を共有する予定です。

共有するのに有用な解析結果の研究

異なるソーシャル観測システムにわたる解析結果を共有する枠組みに関する研究
新浪微博
(シナ ウェイボー)
Twitter + Facebook といった
プラットフォーム
北京市 海淀区
精華大学との共同研究
プロジェクト、NExT

中国科学院の自動化研究所との
共同研究プロジェクト、CSIDM
Recommending Mobile Apps using Twitter Data
概要
シンガポール、NUS、WING の紹介

NExT プロジェクトの概要

2つの研究プロジェクトの詳細
1) 画像のツイート
閑話休題: NExT プロジェクトのデータ収集
2) 携帯アプリの推薦

WING におけるその他の研究
発表予定:
Upasna Bhandari,
Kazunari Sugiyama
, Anindya Datta, and Rajni Jindal: "Serendipitous Recommendation for Mobile Apps Using Item-Item Similarity Graph,'' AIRS 2013
http://www.nextcenter.org/
Full transcript