【シンポジウム開催報告】「日本文化とAIシンポジウム2019」(2019/11/13)

【シンポジウム開催報告】「日本文化とAIシンポジウム2019」(2019/11/13)

2019年11月13日

「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」開催

 11月11日、情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(以下CODH、センター長:北本朝展)ならびに同機構 国立情報学研究所(所長:喜連川優)、人間文化研究機構 国文学研究資料館(館長:ロバート・キャンベル)は、公開イベント「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」を、東京都千代田区にある一橋講堂で開催しました。
 日本では、古典籍・古文書・古記録などの過去の資料(史料)が千年以上も大切に受け継がれており、数億点規模という、世界でも稀にみる大量の資料が現存しています。その多くが「くずし字」で書かれていますが、現代のほとんどの日本人は「くずし字」で書かれた過去の資料を読めなくなっているため、大量のくずし字をどう読み解くかが喫緊の重要な課題となっており、、今回のシンポジウム開催に至りました。
 CODHらは、独自のくずし字認識アルゴリズムの開発に取り組むとともに、AIに関する多数のコンペティションで世界的に注目を集めているKaggle(カグル)で、10月14日まで「くずし字認識:千年に及ぶ日本の文字文化への扉を開く」と題するコンペティションを開催しました。本シンポジウムの後半には、国内だけでなく、スペインなど海外に居住するこのコンペティションの入賞者が登場し、それぞれ開発したくずし字認識アルゴリズムを解説しました。また、シンポジウム前半では、木簡からくずし字まで、日本の文字文化の研究に取り組む第一線の研究者が最先端研究を紹介する講演やデモなどが行われました。さらに、CODHを中心に開発し、この日に一般公開されたAIくずし字認識サービス「KuroNet」や、ついに100万文字の大台を越え、AIくずし字認識の精度向上にも貢献する「日本古典籍くずし字データセット」(作成:国文学研究資料館、加工・公開:CODH)についても紹介がありました。
 220名を超える来場者で埋まった会場では、熱心にメモを取りながら講演を聴講する参加者の姿が散見されました。また、展示ブースでは、古典籍に見入ったり、「KuroNet」による翻字を体験したりする来場者の姿が見られ、実際にくずし字を読み解く技術がいまどこまで進んでいるのか、その可能性を体感していただくよい機会となりました。


盛況な会場内の様子


◆各種メディアにも取り上げられました。

 NHK WEB:AIで“くずし字”の解読に挑む
 Yahoo!ニュース:古典・古文書の難読「くずし字」、AIが瞬時に解読…精度90%も

◆開催案内「日本文化とAIシンポジウム2019 ~AIがくずし字を読む時代がやってきた~」