• 文字サイズ
  • 小
  • 中
  • 大
  • 情報・システム研究機構

過去のNewsの一覧

過去のNewsの一覧

2019年10月16日

【採用情報】社会データ構造化センター特任研究員募集(〆10/31(木)17時)

情報・システム研究機構 データサイエンス共同利用基盤施設 
社会データ構造化センター特任研究員(特定有期雇用職員) 募集要項

1.職名:特任研究員(特定有期雇用職員)
  経歴、業務の実績により、審査を経て特任助教、特任准教授等の称号を与えることがあります。

2.募集人員:1名

3.勤務地:
  〒190-0014 東京都立川市緑町10-3 データサイエンス棟2階

4.所属:
  情報・システム研究機構 データサイエンス共同利用基盤施設 社会データ構造化センター
  URL:http://csds.rois.ac.jp/

5.職務内容:
  「社会調査関連事業」に関わる業務・研究。主として以下の(1)、(2)または(3)の研究開発・支援業務に従事する。
 (1)社会調査データの共有・公開やその準備に関わる研究
 (2)社会調査等の設計やそのデータ解析法の研究
 (3)(1)や(2)の内容に関連して、大学等に所属する研究者との共同研究やその支援のための活動

6.資格・条件:
  資格:職務内容についての研究・業務の経験があり、博士号を取得している者。
  条件:職務内容について、自ら調査・アンケート等を企画・設計し、論文執筆、学会発表、成果の広報を行うことに強い興味を持ち、研究開発成果の外部公開に積極的に関わる意欲を持つこと。なお、国籍は問わないが、日本語での十分なコミュニケーション能力が必要とされる。

7.雇用期間:2019年11月1日以降の可能な限り早い時期~2020年3月31日(試用期間無し)
  ※着任日は応相談
  ※業務の評価結果、業務の状況及び予算等により契約を更新することがあります。契約の更新は年度ごとに行うこととします。なお、雇用契約期間は最長で着任から10年を超えることはできません。また、本雇用契約締結前に情報・システム研究機構と2013年4月1日以降継続して有期雇用契約がある者は、当該契約期間を通算して10年を超えることはできません。

8.待遇
 (1)勤務日:週5日(月~金)
    ※土・日曜日、祝日法に基づく休日、12月29日~1月3日は休日
 (2)勤務時間:裁量労働制(1日7時間45分(9時00分~17時30分、休憩45分)を基本とし、労働者に委ねる)
 (3)休暇:情報・システム研究機構特定有期雇用職員就業規則に基づき付与
    年次有給休暇
    年次有給休暇以外の休暇
 (4)給与:情報・システム研究機構特定有期雇用職員就業規則に基づき支給
    基本給:月額30万円~40万円程度(経験・能力に応じ算定)
    通勤手当:支給要件を満たした場合に実費相当額を支給
    支給日:毎月末締め、原則当月17日
 (5)社会保険:文部科学省共済組合、雇用保険及び労災保険に加入

9.提出書類:
  封筒に「社会データ構造化センター特任研究員応募書類」と朱書の上、下記12.へ簡易書留にて送付、もしくは、書類送付先に記載があるメールアドレスにPDFにて送付してください。メールにて送付の場合は、件名を【社会データ構造化センター特任研究員応募書類】とし、暗号化等のセキュリティ対策については応募者の責任で実施してください。
 (1)履歴書(学歴、学位、職歴、受賞歴、連絡先メールアドレスを記入、写真添付)
 (2)研究業績一覧(①学位論文、②原著論文、③その他の論文(講演・報告等)、④著書・解説書等、⑤特許・ソフトウェアに分類して記載する。なお、②と③は査読を受けたものと受けていないものを区分する)
 (3)主要な学術論文のコピー(3編以内)
 (4)これまでの研究概要と研究の抱負等(A4版用紙1枚程度、社会調査等の設計や解析に関する実績や興味等を必ず記述すること。必要に応じて図を加えても可)
 (5)本人の能力等に関する所見を求め得る方1名以上の氏名と連絡先(メールアドレス)

10.選考方法:
   書類選考の後、必要に応じて面接日をご連絡します。
   面接試験等、来訪に係る旅費等は応募者の負担とします。

11.応募締切:2019年10月31日(木)(必着) 
   ただし適任者が見つかり次第、公募を終了することがあります。

12.書類送付先:
   〒190-0014 東京都立川市緑町10-3 データサイエンス棟
   情報・システム研究機構 本部事務部企画連携課 データサイエンス推進係
   E-mail:ds_suishin+ atmark+ rois.ac.jp ( + atmark+ は@に置きかえてください。)
   TEL:042-512-9254

13.雇用者の名称:
   大学共同利用機関法人 情報・システム研究機構  機構長  藤井 良一

14.その他:
  ※上記記載以外の待遇・勤務条件の詳細は、次の規則をご覧ください。
   情報・システム研究機構特定有期雇用職員就業規則

  ※お問い合わせは、上記12.まで、なるべくメールでお願いいたします。件名は「社会データ構造化センター特任研究員応募」としてください。

  ※本公募に提出された個人情報については、選考の目的に限って利用し、選考終了後は、職員として採用される方の情報を除き、すべての個人情報は責任をもって破棄します。職員として採用される方については、人事、労務、給与関係処理等採用手続き及び所内の各種手続きに使用させていただきますので、あらかじめご了承願います。

  ※情報・システム研究機構では、男女共同参画への取り組みとして、女性研究者の積極的登用を行っています。本公募においても、業績(研究業績、教育業績、社会貢献等)の評価において同等と認められた場合には、女性を積極的に採用します。

添付ファイル
2019年9月17日

【採用情報】企画連携課データサイエンス推進係 事務補佐員(有期雇用職員)(〆11/29(金)17時)

大学共同利用機関法人 情報・システム研究機構
事務局本部事務部 企画連携課データサイエンス推進係 事務補佐員(有期雇用職員)募集

1.職名:事務補佐員(有期雇用職員)

2.募集人員:1名

3.勤務地:〒190-0014 東京都立川市緑町10-3 データサイエンス棟2階

4.契約期間:2019年12月1日~2020年2月29日(試用期間なし)
 (採用日は応相談。当初3ヶ月契約。勤務状況、勤務実績等により、2020年3月30日まで契約を更新することがあります。また、契約期間は、勤務実績等を考慮のうえ、当初の採用日から最長3年間を限度として、年度毎に更新することがあります。ただし、本雇用契約締結直前に情報・システム研究機構と有期雇用契約がある者は、当該契約期間を通算して5年を超えることはできません。)

5.職務内容:データサイエンス共同利用基盤施設の運営に係る事務及び同施設に係る庶務業務全般

6 応募条件:
(1)パソコンの基本操作及びMicrosoft Office の各アプリケーションを用いて、データの加工・編集等を行い資料作成ができること。
(2)協調性があり、積極的に業務に取り組む意欲があること。
(3)国立大学法人等において関連する事務経験があると望ましい。

7.勤務条件:
(1)就業日等:週5日勤務(月曜日~金曜日)
    時間外勤務、土・日、祝祭日に勤務を命ずる場合があります。
(2)就業時間:
    1日7時間45分(9:00~17:30)、休憩1時間(12:15~13:00)
(3)給与等:
    日給(学歴、経験に応じ、7,852円~10,028円の間で決定)
    ※採用日までに関係就業規則等の改正があった場合は合わせて上方改定します。
    賞与、通勤手当、住居手当、時間外勤務手当、休日給等は、該当する場合に支給します。
(4)社会保険等:厚生年金保険、健康保険、雇用保険に加入
(5)その他:
    勤務条件の詳細については、情報・システム研究機構有期雇用職員就業規則を参照してください。
    https://www.rois.ac.jp/pdf/yuki.pdf

8.応募方法:
    履歴書(所定の様式を下記からダウンロードのうえ、作成してください。写真貼付。必ずメールアドレスを記入。)及び職務経歴書を下記宛に郵送してください。郵送の際、封筒の表には必ず「DS事務補佐員 応募書類在中」と朱書してください。

9.応募期限:
 2019年11月29日(金)17時必着(随時選考。採用者が決まり次第締め切ります。)

10.選考方法:
    書類選考のうえ、必要に応じて面接を実施します。
    なお、面接を行うこととなった場合、日時は後日連絡します。

11.問合せ先・書類送付先:
    〒190-0014 東京都立川市緑町10-3 データサイエンス棟2階
    情報・システム研究機構本部事務部企画連携課データサイエンス推進係(担当:昨間)
    TEL:042-512-9254 E-mail:ds_suishin@rois.ac.jp

12.個人情報の取扱い:
    提出いただいた書類は、採用選考のために限って利用し、選考終了後は、採用された方の情報を除き、すべての個人情報は責任を持って破棄します(採用された方の個人情報については、引き続き、採用後の雇用管理のために利用します。)。

13.雇用者名称:大学共同利用機関法人 情報・システム研究機構  機構長  藤井 良一

14.その他:
(1)当機構の情報は、ホームページをご覧ください。
   情報・システム研究機構:https://www.rois.ac.jp/
   データサイエンス共同利用基盤施設:https://ds.rois.ac.jp/
(2)面接を行うこととなった場合の交通費は、自己負担となります。
(3)所定の履歴書様式は、下記「DOWNLOAD」をクリックしてダウンロードしてください。

添付ファイル
2019年9月13日

【プレスリリース】「日本文化とAIシンポジウム2019」開催ならびに参加申込受付開始のお知らせ(2019/09/13)

令和元年9月13日

「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」
 11月11日に開催、参加申込スタート

情報・システム研究機構 データサイエンス共同利用基盤施設(以下、ROIS-DS) 人文学オープンデータ共同利用センター(センター長:北本朝展)ならびに同機構 国立情報学研究所(所長:喜連川優)、人間文化研究機構 国文学研究資料館(館長:ロバート・キャンベル)は、「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」(参加無料)を11月11日(月)に開催いたします。このシンポジウムでは、AI(人工知能)を活用してくずし字を読み解く研究の過去・現在から未来までを議論するとともに、世界に広がるくずし字研究の最前線をご紹介します。
 このたび、本シンポジウムのウェブサイトを開設し、参加申込の受付を開始いたしました。多くの皆さまのご参加をお待ちしております。


 日本では、古典籍・古文書・古記録などの過去の資料(史料)が千年以上も大切に受け継がれており、数億点規模という、世界でも稀にみる大量の資料が現存しています。その多くが「くずし字」で書かれておりますが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが喫緊の重要な課題となっています。
 そこで、ROIS-DS人文学オープンデータ共同利用センター、国立情報学研究所、国文学研究資料館は、AI(人工知能)を活用してくずし字を読み解く研究の、過去・現在から未来までを議論し、世界に広がるくずし字研究の最前線をご紹介するシンポジウム「日本文化とAIシンポジウム2019」を開催いたします。
 AIに関する多数のコンペティションで世界的に注目を集めているKaggle[1]では、10月14日(月)まで「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」と題するコンペを開催中です。本シンポジウムには、このコンペの入賞者も集結し、開発したくずし字認識アルゴリズムを解説する予定です。さらに、木簡からくずし字まで、日本の文字文化の研究に取り組む第一線の研究者をお招きし、研究の最先端をご紹介する講演やデモを行います。
 くずし字を読み解く技術がいまどこまで進んでいるのか、その可能性を体感するまたとない機会です。皆さまのご参加をお待ちしております。

「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」

 ←ポスターのダウンロードは左の画像をクリックしてください

【日時】2019年11月11日(月) 9:30受付 10:00開始

【場所】一橋講堂 東京都千代田区一ツ橋2丁目1−2 学術総合センター2F

【参加方法】ウェブサイトから事前申込(参加無料)
      http://codh.rois.ac.jp/symposium/japanese-culture-ai-2019/
      ※シンポジウム登壇者への個別取材も調整いたします。

【プログラム】

10:00-10:10     開会挨拶
         北本 朝展(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)
10:10-11:50     セッション1-日本の文字文化とAI
        ◆木簡情報のオープンデータ化と文字画像DB連携の強化
         馬場 基(奈良文化財研究所)
        ◆東京大学史料編纂所における字形データの蓄積経緯と花押データへの展開
         井上 聡(東京大学史料編纂所)
        ◆新たな検索機能提供のための調査研究活動―次世代デジタルライブラリーを中心とした近年の取組紹介―
         青池 亨(国立国会図書館電子情報部電子情報企画課次世代システム開発研究室)
        ◆市民参加とAI―「みんなで翻刻」開発者の立場から
         橋本 雄太(国立歴史民俗博物館)
11:50-13:10     休憩
13:10-14:25     基調講演-AIによるくずし字認識の展望
        ◆文字認識研究の過去・現在・未来
         内田 誠一(九州大学大学院システム情報科学研究院)
        ◆過去からの挑戦状-くずし字認識の未来-
         佐々木 孝浩(慶應義塾大学附属研究所斯道文庫)
14:25-14:55     セッション2-くずし字データセット100万文字公開とデジタル人文学研究
        ◆NIJL-NWプロジェクトとくずし字データセット
         山本 和明(国文学研究資料館)
        ◆デジタル人文学研究とAIくずし字認識
         北本 朝展(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)
14:55-15:25     講演者によるデモンストレーション
15:25-16:00     セッション3-Kaggleコンペティション
        ◆世界中のアイデアを集めるくずし字コンペの開催
         カラーヌワット・タリン(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)
        ◆世界中のAI研究者がくずし字に挑んだ結果
         Alex Lamb(モントリオール大学MILA)ほか(調整中)
16:00-17:40     セッション4-Kaggle授賞式、Kaggle入賞者講演、ディスカッション
         ロバート・キャンベル(国文学研究資料館)
         喜連川 優(国立情報学研究所)
         Kaggle入賞者
17:40-17:45     閉会挨拶

 

【関連プレスリリース】

「くずし字」の認識に世界のAI研究者・技術者が挑戦 ―全世界的コンペティションをKaggleで7月から開催―
https://ds.rois.ac.jp/post-3451/

 

【本件に関する問い合わせ】

大学共同利用機関法人 情報・システム研究機構
本部広報室
TEL:03-6402-6214 E-mail:koho@rois.ac.jp

大学共同利用機関法人 情報・システム研究機構 国立情報学研究所
総務部企画課 広報チーム
TEL:03-4212-2164 E-mail:media@nii.ac.jp

大学共同利用機関法人 人間文化研究機構 国文学研究資料館
古典籍共同研究事業センター 管理係
TEL:050-5533-2988 E-mail:cijinfo@nijl.ac.jp


[1] Kaggle(https://www.kaggle.com/)は、米国に本拠地を置くKaggle社(Google傘下)が運営する、世界最大規模の機械学習コンペティションプラットフォーム。Kaggleのコンペティションでは、(1)企業や研究者が解決したい課題を出題し関連データを提供、(2)世界中のAI研究者・技術者がその課題を解決するアルゴリズム(計算手法)を提出、(3) 提出されたアルゴリズムの性能をランキングして上位入賞者を決定、(4) 上位入賞者はコンペの成果を出題者に提供し賞金を獲得、という流れで研究開発をオープンに進める。
コンペ「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」の進捗状況は下記サイトで随時閲覧できる。
 本コンペのページ(https://www.kaggle.com/c/kuzushiji-recognition
 ROIS-DS人文学オープンデータ共同利用センター(CODH)のウェブサイト(http://codh.rois.ac.jp/competition/kaggle/

2019年8月21日

【プレスリリース】国立極地研究所が所蔵する写真のデジタルアーカイブを公開しました(2019/08/19)

令和元年8月19日

 国立極地研究所が所蔵する写真のデジタルアーカイブを公開しました

8月1日、情報・システム研究機構は同機構の国立極地研究所が所蔵する写真のデジタルアーカイブを公開しました。
https://ads.nipr.ac.jp/image/

 このデジタルアーカイブは、主に国立極地研究所アーカイブ室(以下、アーカイブ室)が所蔵してきた貴重な画像のうち約14,000枚を、情報・システム研究機構 データサイエンス共同利用基盤施設 極域環境データサイエンスセンター(PEDSC)がアーカイブし、データベース化したものです。画像の内訳は、南極の画像約12,000枚、北極の画像約1,500枚の他、極地研究所の活動に関する写真となり、第1次南極地域観測隊以来の記録写真(行動の記録画像、南極の地形画像等)のほか、北極の動植物や過去の研究プロジェクトに関する記録画像・映像を高画質で閲覧できます。

南極画像例1 動けない宗谷
(1958年1月21日)
南極画像例2 重力測定
(1988年1月14日)
北極画像例1 シープマウンテン
ノースフォーク峠 ユーコン準州 カナダ
(1972年7月10日)
北極画像例2  マーモット
ヘレン湖 バンフ国立公園 アルバータ州 カナダ
(1976年8月24日) 

 

 アーカイブ室は、この他にも多数の写真を所蔵しており、今後もPEDSCと共同してそれらの写真をデータベース化し、順次公開する予定です。
 ※なお、アーカイブ室のウェブサイトで公開されている画像も利用可能です。各ページのコンテンツの利用に当たっては、サイトポリシーをご覧ください。

【本件に関する問い合わせ】

大学共同利用機関法人 情報・システム研究機構
本部広報室
TEL:03-6402-6214 E-mail:koho@rois.ac.jp

大学共同利用機関法人 情報・システム研究機構
国立極地研究所 広報室
TEL: 042-512-0655 E-mail: kofositu@nipr.ac.jp

2019年7月24日

【採用情報】ライフサイエンス統合データベースセンター有期雇用職員募集(〆8/2(金)17時)

募集を締切りました。応募いただき、ありがとうございました。

大学共同利用機関法人 情報・システム研究機構
データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター 有期雇用職員募集

1.職名:事務補佐員(有期雇用職員)

2.募集人員:1名

3.勤務地:〒277-0871 千葉県柏市若柴178-4-4 東京大学柏の葉キャンパス駅前サテライト6階

4.契約期間:2019年9月1日~2019年11月30日(試用期間無し)
 (採用日は応相談。当初3ヶ月契約。勤務状況、勤務実績等により、2020年3月30日まで契約を更新することがあります。また、契約期間は、勤務実績等を考慮のうえ、当初の採用日から最長3年間を限度として、年度毎に更新することがあります。ただし、本雇用契約締結直前に情報・システム研究機構と有期雇用契約がある者は、当該契約期間を通算して5年を超えることはできません。)

5.職務内容:ライフサイエンス統合データベースセンターの運営に係る事務及び研究者との連絡調整・支援業務等に係る業務

6 応募条件:
(1)パソコンの基本操作及びMicrosoft Office の各アプリケーションを用いて、データの加工・編集等を行い資料作成ができること。
(2)協調性があり、積極的に業務に取り組む意欲があること。
(3)国立大学法人等において関連する事務経験があると望ましい。

7.勤務条件:
(1)就業日等:週5日勤務(月曜日~金曜日)
    時間外勤務、土・日、祝祭日に勤務を命ずる場合があります。
(2)就業時間:
    1日7時間45分(9:00~17:45)
    休憩1時間(12:00~13:00)
(3)給与等:
    日給(学歴、経験に応じ、7,049円~9,491円の間で決定)
    賞与、通勤手当、住居手当、時間外勤務手当、休日給等を該当する場合に支給
(4)社会保険等:厚生年金保険、健康保険、雇用保険に加入
(5)その他:
    勤務条件の詳細については、情報・システム研究機構有期雇用職員就業規則を参照してください。
    https://www.rois.ac.jp/pdf/yuki.pdf

8.応募方法:
    履歴書(所定の様式を下記よりダウンロードのうえ、作成してください。写真貼付。必ずメールアドレスを記入。)及び職務経歴書を下記宛に郵送してください。郵送の際、封筒の表には必ず「DB事務補佐員 応募書類在中」と朱書してください。

9.応募期限:
 2019年8月2日(金)17時必着(随時選考。採用者が決まり次第締め切ります。)

10.選考方法:
    書類選考のうえ、必要に応じて面接を実施します。
    なお、面接を行うこととなった場合、日時は後日連絡しますが、応募多数の場合は、面接に至らないこともありますのでご了承願います。

11.問合せ先・書類送付先:
    〒277-0871 千葉県柏市若柴178-4-4 東京大学柏の葉キャンパス 駅前サテライト6F
    大学共同利用機関法人 情報・システム研究機構 データサイエンス共同利用基盤施設
    ライフサイエンス統合データベースセンター事務室(担当:土田)
    TEL:04-7135-5508 E-mail:dbcls-jimu@dbcls.rois.ac.jp

12.個人情報の取扱い:
    提出いただいた書類は、採用選考のために限って利用し、選考終了後は、採用された方の情報を除き、すべての個人情報は責任を持って破棄します(採用された方の個人情報については、引き続き、採用後の雇用管理のために利用します。)。

13.雇用者名称:大学共同利用機関法人 情報・システム研究機構  機構長  藤井 良一

14.その他:
(1)当機構の情報は、ホームページをご覧ください。
   情報・システム研究機構:https://www.rois.ac.jp/
   データサイエンス共同利用基盤施設:https://ds.rois.ac.jp/
   ライフサイエンス統合データベースセンター:http://dbcls.rois.ac.jp/
(2)面接を行うこととなった場合の交通費は、自己負担となります。
(3)所定の履歴書様式は、下記「DOWNLOAD」をクリックしてダウンロードしてください。

添付ファイル
2019年7月10日

【プレスリリース】「くずし字」の認識に世界のAI研究者・技術者が挑戦(2019/07/10)

「くずし字」の認識に世界のAI研究者・技術者が挑戦
-全世界的コンペティションをKaggleで7月から開催-

 日本は、古典籍、古文書、古記録などの過去の資料(史料)を千年以上も大切に受け継いでおり、数億点規模という世界でも稀なほど大量の資料が現存しています。日本の歴史・文化の研究や、過去の災害などの自然現象の解明を進めるには、これらの資料をデジタル化・オープン化するとともに、その内容を読み解く必要があります。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが重要な課題となっています。

 そこでこの社会課題の解決にAI(人工知能)を活用する方法を探るため、この7月から10月にかけて、世界最大規模の機械学習コンペプラットフォームである「Kaggle(カグル)」で、「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」と題する全世界的なコンペを開催します。コンペを通して画期的なくずし字認識手法の開発が進むだけでなく、くずし字データセットを通して日本文化への関心が世界的に高まる効果も期待できます。

 本コンペは、情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(センター長:北本朝展、以下、CODH)ならびに同機構 国立情報学研究所(所長:喜連川優、以下、NII)、人間文化研究機構 国文学研究資料館(館長:ロバート・キャンベル、以下、国文研)が主催します。


 日本は、古典籍、古文書、古記録などの過去の資料(史料)を千年以上も大切に受け継いでおり、数億点規模という世界でも稀なほど大量の資料が現存しています。日本の歴史・文化の研究や、過去の災害などの自然現象の解明を進めるには、これらの資料をデジタル化・オープン化するとともに、その内容を読み解く必要があります。ところが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっており、大量のくずし字をどう読み解くかが重要な課題となっています。

 現在、くずし字をきちんと読める人は全国で数千人程度と推定されており[1]、これらの人々だけで膨大な資料を翻刻[2]するには限界があります。この課題を解決するために、2つの方向で研究が進められてきました。第一が市民参加型翻刻システム[3]の開発です。専門家と市民が共に参加する翻刻システムを使い、市民がくずし字を翻刻しながらスキルを向上させることで、くずし字を読める人々の数をもっと増やすことを目指します。第二がコンピュータ(機械)の活用です。機械が文字を読み取る光学的文字認識(OCR)の活用による翻刻の自動化には、これまでいくつもの研究グループが取り組んできました。しかしくずし字は文字の種類が多く、連続した手書き文字の分割が難しく、レイアウトが多様で、本ごとにスタイルが異なるため、実用レベルのくずし字OCRの研究開発は難航しています。

 一方、画像解析の分野における深層学習(機械学習)の活用を中心とした、近年のAIの飛躍的な発展を取り入れることで、新方式のくずし字OCRに向けた研究開発が進む可能性も高まっています。そこでくずし字OCRの性能向上に向けたアイデアをオープンに募集するため、CODH、NII、国文研は、この7月から10月にかけて、世界最大規模の機械学習コンペプラットフォームである「Kaggle(カグル)」[4]で、「くずし字認識:千年に及ぶ日本の文字文化への扉を開く(Kuzushiji Character Recognition: Opening the Door to A Thousand Years of Japanese Literate Culture)」[5]と題するコンペを開催します(図1)。

 


図1 Kaggleコンペティションの流れ

 

 このコンペでは、国文研がCODHと協力して整備し公開中の「くずし字データセット」をコンペ用に改良して提供します。参加者は、3ヵ月というコンペ期間内に、与えられた画像内に書かれたくずし字をすべて認識して出力する「くずし字OCRアルゴリズム」を開発します。そして上位に入賞したアルゴリズムは世界中で自由に使えるよう、コンペ後に公開する予定です。

 くずし字認識に関するコンペとして、国内学会などが小規模に開催した例[6]はありますが、今回は世界的な規模のコンペを開催するため、情報学の分野で世界的に知名度が高く、全世界300万人以上のAI研究者・技術者が参加するKaggleのプラットフォームを活用します。日本の組織によるKaggleコンペの開催はリクルート、メルカリに次ぐ3例目ですが、研究目的での開催は今回が初めてです。またKaggleの歴史の中でも、人文系データを対象とするコンペは今回が初めての開催となります。Kaggle社の関係者も「これまで開催された337件のコンペと比べても、本コンペは新しい領域を開拓するものであり、急速に進化するコンピュータビジョン技術の人気を踏まえれば、Kaggleコミュニティが興奮するようなコンペとなるだろう」とコメントしています。

 コンペを通して画期的なくずし字認識アルゴリズムが見出せれば、AIによる翻刻支援や、AI文字認識を活用した全文検索など、過去の日本文化を読み解く新技術の研究開発が活発化することが期待できます。そして専門家の作業の一部をAIが支援できれば、専門家は資料の高度な読み解きに集中しやすくなります。このような新技術は、過去の資料を大規模にデジタル化・オープン化し、それを機械や市民が大規模に翻刻し、文理の研究者が過去の世界に関するデータを分析し、その成果を社会に還元するという、データ駆動型[7]の日本文化研究を進めていく上で不可欠になると考えられます。

 コンペに関する詳細な情報は、Kaggleウェブサイト上でコンペ開始日(7月中旬予定)から公開されます。参加者は、3か月後の10月に設定される締め切りまでにアルゴリズムを提出します。その後、主催者はKaggleと協力して入賞者(5位まで)を決定し、11月11日に東京で開催するシンポジウム「日本文化とAI」で表彰式を行う予定です。

 

【参考資料】

北本 朝展、 カラーヌワット タリン、 宮崎 智、 山本 和明、 "文字データの分析‐機械学習によるくずし字認識の可能性とそのインパクト‐"、 電子情報通信学会誌、Vol. 102、No. 6、pp. 563-568、 2019年6月、 http://doi.org/10.20676/00000349

 

【本件に関する問い合わせ】

大学共同利用機関法人 情報・システム研究機構
本部広報室
TEL:03-6402-6214 E-mail:koho@rois.ac.jp

大学共同利用機関法人 情報・システム研究機構 国立情報学研究所
総務部企画課 広報チーム
TEL:03-4212-2164 E-mail:media@nii.ac.jp

大学共同利用機関法人 人間文化研究機構 国文学研究資料館
古典籍共同研究事業センター 管理係
TEL:050-5533-2988 E-mail:cijinfo@nijl.ac.jp


[1] 中野三敏 『和本のすすめ』岩波新書 (2011)による。参照:国立情報学研究所プレスリリース「江戸時代の文字の字形データセットを国文研との協働で構築 機械と人間の学習のためのオープンデータとして公開」(https://www.nii.ac.jp/userimg/press_20161117.pdf)
[2] くずし字の翻刻とは、くずし字を人間が読み、くずし字に対応する現代日本語の文字を入力する作業のこと。
[3] 「みんなで翻刻」(https://honkoku.org/)は、国立歴史民俗博物館の橋本雄太助教を中心に、京都大学古地震研究会や東京大学地震研究所などが協力して構築を進める、市民参加型翻刻システムのこと。CODHも各種の共同研究で協力体制にある。
[4] Kaggle(https://www.kaggle.com/)は、米国に本拠地を置くKaggle社(Google傘下)が運営する、世界最大規模の機械学習コンペティションプラットフォーム。Kaggleのコンペティションでは、(1)企業や研究者が解決したい課題を出題し関連データを提供、(2)世界中のAI研究者・技術者がその課題を解決するアルゴリズム(計算手法)を提出、(3) 提出されたアルゴリズムの性能をランキングして上位入賞者を決定、(4) 上位入賞者はコンペの成果を出題者に提供し賞金を獲得、という流れで研究開発をオープンに進める。
[5] Kaggleコンペに関する詳細情報については、下記のサイトで提供する。
  本コンペのページ(https://www.kaggle.com/c/kuzushiji-recognition
   ※コンペ開始日に公開予定
  CODHのウェブサイト(http://codh.rois.ac.jp/competition/kaggle/
[6] 第23回 PRMUアルゴリズムコンテスト くずし字認識チャレンジ2019 (https://sites.google.com/view/alcon2019)は、2019年5月31日から8月31日まで、電子情報通信学会パターン認識・メディア理解研究会が開催(CODH後援)。Kaggleコンペティションと同様のデータセットを用いるが、問題の難易度が異なる。
[7] データ駆動型研究とは、機械学習(AI)による大規模処理なども活用しながら、(ビッグ)データの収集と分析から得られる証拠に基づき、新しい知見や知識を獲得することを目指す研究方法である。

2019年7月10日

【Press Release】Worldwide Competition to Develop AI for Historical Japanese Character (Kuzushiji) Recognition(July.10, 2019)

Worldwide Competition to Develop AI for Historical Japanese Character (Kuzushiji) Recognition
-The Competition, hosted on Kaggle, will start in July-

 Japan has classical books, documents, and other historical records that date back over a thousand years. However, while these documents may number in the hundreds of millions, most modern Japanese speakers cannot read kuzushiji, or cursive Japanese script. Despite ongoing efforts to digitize and release historical documents, reading the vast quantity of kuzushiji remains a serious issue in research on Japanese culture and in explaining historical disasters and other natural phenomena from the past.

 To explore ways of using artificial intelligence (AI) to help resolve societal issues, a global competition entitled “Kuzushiji Character Recognition: Opening the Door to A Thousand Years of Japanese Literate Culture” is being held on the world’s largest machine learning platform “Kaggle” from July to October 2019. The competition will not only advance the development of innovative kuzushiji recognition methods but also heighten global interest in Japanese culture through the kuzushiji dataset.

 The competition is hosted by the Research Organization of Information and Systems' Center for Open Data in the Humanities (CODH, Director: Asanobu KITAMOTO) at the Joint Support-Center for Data Science Research, along with the organization's National Institute of Informatics (NII, Director General: Masaru KITSUREGAWA) and National Institutes of Japanese Literature (NIJL, Director General: Robert CAMPBELL) at the National Institute for the Humanities.


 Japan has classical books, documents, and other historical records dating back over a thousand years. However, while these documents may number in the hundreds of millions, most modern Japanese speakers cannot read kuzushiji, or cursive Japanese script. Despite ongoing efforts to digitize and release historical documents, reading the vast quantity of kuzushiji remains a serious issue in research on Japanese culture and in explaining historical disasters and other natural phenomena from the past.

 It is estimated that only a few thousand individuals across Japan are able to properly read kuzushiji[1], and there are limitations in how many of the existing documents these individuals can transcribe[2]. Therefore, research is being conducted in two directions to assist in resolving this issue. The first is in the development of a participatory transcription system[3]. Citizens, together with experts, participate in the system not only for transcribing kuzushiji, but also for learning skills to read it better, thereby increasing the number of people who can read kuzushiji. The second is the use of computers for automatic recognition. A number of groups have tried automatic transcription using optical character recognition (OCR) for machines to read characters. However, kuzushiji OCR for practical use remains challenging for machine learning systems, due to vast amount of character types, difficulty in cleanly separating characters, diversity in layout, and variations in writing style between books.

 On the other hand, rapid advancement of AI using deep learning (machine learning) in computer vision technology opens up new possibilities to develop innovative methods for kuzushiji OCR. To collect ideas in an open manner to improve the performance of kuzushiji OCR, CODH, NII, and the NIJL are hosting a competition entitled “Kuzushiji Recognition Challenge: Opening the Door to A Thousand Years of Japanese Literate Culture[4]” from July to October, 2019, using the global machine learning competition platform Kaggle[5] (Figure 1).


Figure 1  Overview of the competition

 

 The competition provides a modified version of Kuzushiji Dataset, an open dataset prepared by NIJL and curated by CODH. During the three-month competition, participants will develop kuzushiji OCR algorithms to recognize kuzushiji from raw images. The algorithms selected as winners will be shared as open source after the competition.

 Similar competitions have been held in Japan in the past, but on a smaller scale hosted by a domestic academic society[6], but to extend the competition to a global scale, this competition will be hosted on internationally recognized Kaggle platform, wherein more than three million AI researchers and engineers worldwide participate. This is the third Japanese organization, after Recruit and Mercari, to host a Kaggle competition, and the first Japanese organization to host a research competition. Moreover, in the history of Kaggle, this is the first competition for a humanities-related data. A person in Kaggle commented, “Even with our 337 competitions to date, this competition covers an area that has not yet been explored on Kaggle. Based on the rise of computer vision techniques, the competition could be very exciting for our community to tackle.”

 Developing an innovative method to recognize kuzushiji through this competition could lead to research and development to support new technologies to understand Japanese culture in the past, such as AI-based transcription, full text search on AI-based character recognition. If AI can help some of the tasks that have been done by experts, they can focus more on high-level interpretation of historical documents. Hence this kind of new technologies will be essential in data-driven research[7] for Japanese culture; namely, digitizing historical documents for open access, transcribing historical documents both by machines and by citizen, analyzing data of the past world through collaboration of researchers in the natural sciences and humanities, and returning research results back into the wider society.

 Detailed information on this competition can be found on Kaggle website on the launch day in the mid of July, 2019. Participants can submit algorithms over a period of three months until October deadline, after which the organizers will work with Kaggle in selecting the top five entries. These winners will be awarded at the “Japanese Culture and AI” symposium to be held in Tokyo on November 11.

 

Reference

Asanobu KITAMOTO, Tarin CLANUWAT, Tomo MIYAZAKI, Kazuaki YAMAMOTO, "Analysis of Character Data: Potential and Impact of Kuzushiji Recognition by Machine Learning", Journal of IEICE (Institute of Electronics, Information, and Communication Engineers), Vol. 102, No. 6, pp. 563-568, June 2019 (in Japanese)
http://doi.org/10.20676/00000349

 

Media contact:

PR office, Headquarter, Research Organization of Information and Systems
TEL: +81-(0)3-6402-6214 E-mail:koho@rois.ac.jp

Publicity Team, National Institute for Informatics, Research Organization of Information and Systems
TEL: +81(0)3-4212-2164; E-mail: media@nii.ac.jp

Center for Collaborative Research on Pre-modern Texts, National Institute of Japanese Literature
TEL:+81-50-5533-2988; E-mail:cijinfo@nijl.ac.jp


[1] From “Wahon no Susume” Mitsutoshi Nakano, Iwanami Shinsho, (2011). Also refer to the press release from National Institute of Informatics entitled “Edo Jidai no Moji no Jikei Dataset wo Kokubunken tono Kyoudou de Kouchiku Kikai to Ningen no Gakushuu no tame no Open Data toshite Koukai” [Dataset of Pre-modern Character Shapes Published as Open Data for Human and Machine Learning in Cooperation with the National Institute of Japanese Literature] (https://www.nii.ac.jp/userimg/press_20161117.pdf).
[2] Transcription of kuzushiji is a process whereby humans read kuzushiji and input the corresponding contemporary Japanese character.
[3] “Minna de Honkoku” (https://honkoku.org/) is a participatory (crowdsourced) transcription system mainly developed by Yuta Hashimoto, Assistant Professor of the National Museum of Japanese History, in cooperation with the Kyoto University Paleoseismology Study Group and Earthquake Research Institute at the University of Tokyo. This group also collaborate with CODH in a joint research project.
[4] For further details, see following websites.
      The competition website (https://www.kaggle.com/c/kuzushiji-recognition)
          #The competition page will be released on the launch day
      CODH website (http://codh.rois.ac.jp/competition/kaggle/)
[5] Headquartered in the US (and owned by Google), Kaggle (https://www.kaggle.com/) is the world’s largest platform for machine learning competitions. Competitions at Kaggle are held in an open research and development process wherein (1) corporations or researchers submit challenges they wish to solve and related data; (2) AI researchers and engineers worldwide submit algorithms to solve the challenges; (3) the submitted algorithms are ranked by performance, and winners are determined; and (4) winners share the outcome of the competition with the host and obtain the prize.
[6] The 23rd PRMU Algorithm Contest, 2019 Kuzushiji Recognition Challenge (https://sites.google.com/view/alcon2019) runs from May 31 to August 31, 2019, and is hosted by the IEICE Society of Pattern Recognition and Media Understanding (supported by the CODH). While it uses a similar dataset with the Kaggle competition’s, the difficulty of the challenge is different.
[7] “Data-driven research” is a research method for acquiring new knowledge from evidences obtained from the collection and analysis of (big) data, often by large-scale data processing such as machine learning (AI).  

2019年6月24日

【フィリピンの調査事情に関する講演会(英語)のお知らせ】2019年6月28日(金)共催(社会データ構造化センター)

令和元年6月研究会 公益財団法人 日本世論調査協会 調査研究委員会

【日時】2019年6月28日(金)16:30~18:00

【場所】日本新聞協会 7階大会議室
    東京都千代田区内幸町2-2-1

【定員】60名

【主催】世論調査協会、ROIS-DS共同利用基盤施設 社会データ構造化センター、専修大学ソーシャル・ウェルビーイング研究センターによる共同研究会

【詳細】ここをクリックしてください

添付ファイル
2019年3月20日

【採用情報】極域環境データサイエンスセンター事務補佐員募集(〆4/12(金)17時)

募集を締切りました。応募いただき、ありがとうございました。

大学共同利用機関法人情報・システム研究機構データサイエンス共同利用基盤施設

「極域環境データサイエンスセンター」事務補佐員募集

 

1.職名:事務補佐員(短時間雇用職員)

2.募集人数:1名

3.勤務地:〒190-0014 東京都立川市緑町10-3 データサイエンス棟1階

4.契約期間:2019年5月1日以降の早い時期
  (当初3ヶ月契約。勤務状況、勤務実績等により、2020年3月31日まで契約を更新します。また、契約期間は、勤務実績等を考慮のうえ、当初の採用日から最長で2022年3月31日を限度として、年度毎に更新します。ただし、本雇用契約締結直前に情報・システム研究機構と有期雇用契約がある者は、当該契約期間を通算して5年を超えることはできません。)

5.職務内容:極域環境データサイエンスセンター関連のデータ整理と事務作業に係る業務

6.応募条件:
  ①高校卒業以上又はそれと同等以上の学力を有する方。
  ②パソコンによる作業(ワード、エクセル、電子メール)ができること。
  ③英語力があることが望ましい。

7.勤務条件:
  ①就業日   週3日勤務(月,水,金など,応相談)
         土、日、祝祭日、年末年始(12月29日~1月3日)は休日
         時間外勤務、土・日、祝祭日に勤務を命ずる場合があります。
  ②就業時間  6時間/日程度(始業、終業時刻については9:00~17:30の間で応相談)、休憩45分(12:15~13:00)
  ③給与等   時間給制(学歴、経験に応じ、985円~1,293円の間で決定)
         通勤手当、時間外勤務手当、休日給等を該当する場合に支給
  ④社会保険等 社会保険、雇用保険及び労災保険については、法令及び規則に基づき加入
  ⑤その他   勤務条件の詳細については、情報・システム研究機構短時間雇用職員就業規則を参照してください。
         http://www.rois.ac.jp/pdf/tanjikan.pdf

8.応募方法:履歴書(所定の様式をhttps://ds.rois.ac.jp/link/ からダウンロードのうえ、作成してください。写真貼付。
       必ずメールアドレスを記入。) 及び職務経歴書を下記宛に郵送してください。郵送の際、封筒の表には必ず
       「極域環境データサイエンスセンター 事務補佐員 応募書類在中」と朱書してください。

9.応募期限:2019年4月12日(金)17時必着(随時選考。採用者が決まり次第締め切ります。)

10.選考方法:書類選考のうえ、必要に応じて面接を実施します。なお、面接を行うこととなった場合、日時は後日連絡しますが、
       応募多数の場合は、面接に至らないこともありますのでご了承願います。

11.問合せ先・書類送付先:
  〒190-0014 東京都立川市緑町10-3 データサイエンス棟2階
  情報・システム研究機構本部事務部企画連携課データサイエンス推進係(担当:昨間・秋元)
  TEL:042-512-9254 E-mail:ds_suishin[ at ]rois.ac.jp ※[ at ]は@に置きかえること

12.個人情報の取扱い:
  提出いただいた書類は、採用選考のために限って利用し、選考終了後は、採用された方の情報を除き、すべての個人情報は
  責任を持って破棄します。(採用された方の個人情報については、引き続き、採用後の雇用管理のために利用します。)

13.雇用者名称:大学共同利用機関法人 情報・システム研究機構 機構長 藤井 良一

14.その他:
  ①当機構及び当施設等の情報は、ホームページをご覧ください。
   情報・システム研究機構:http://www.rois.ac.jp/
   データサイエンス共同利用基盤施設:https://ds.rois.ac.jp/
   極域環境データサイエンスセンター:http://pedsc.rois.ac.jp/ja/
  ②面接を行うこととなった場合の交通費は、自己負担となります。

2019年2月25日

【お知らせ】第3回人間・社会データ構造化シンポジウム:チュートリアルセッション関連質問の受付

第3回人間・社会データ構造化シンポジウムへご参加の皆さまへ

先日は、第3回人間・社会データ構造化シンポジウムにご参加いただき、ありがとうございました。
シンポジウム内で実施した牧野弁護士・森弁護士によるチュートリアルセッションに関して、大変活発な議論が行われたため、当日すべてご質問にお答えをすることができませんでした。
そこで、牧野弁護士・森弁護士へのご質問を受け付けさせていただき、後日質問に対する回答を報告書などの形で公開させていただきたく存じます。
つきましては、チュートリアルセッションに関して、ご質問のある方は、以下のフォームよりご登録をください。

質問受付フォームURL:
https://goo.gl/forms/DzdtHz1futivGJ0F2
締め切り:2019年3月4日

なお、すべてのご質問にが回答いただけるわけではないことを、あらかじめご承知おきください。
また、牧野先生に年度末に向けて報告書を作成いただく関係で、質問の期限を3月4日とさせていただきます。
締め切り以降もご質問の登録は可能ですが、以降の質問については、回答ができない場合がございますので、お早目のご登録をお願いいたします。