「ROIS-DS-JOINT 2024」成果報告一覧表

「ROIS-DS-JOINT 2024」成果報告一覧表

採択課題一覧表にもどる

一般共同研究

001RP2024 鄭 躍軍(同志社大学)
Web調査による社会データ収集のバイアスの実験的検証

 本研究の目的は、登録モニター型Web調査を焦点に、1)Web調査の困難と課題の論理的整理;2)他の調査モードとの対比によるWeb調査の各種バイアスの検証;3)Web調査における回答結果の信憑性の影響要因の特定など、の研究取組を遂行することによって、Web調査を用いた社会データ収集の固有のバイアスの検証と回避方法を模索することにある。
1)について、Web調査における諸課題の回避方法をレビューし、信頼できるWeb調査の理論的な仕組みと留意事項をまとめ、学術論文や研究レポートなどで公表した。
2)について、Web調査の欠点を回避するための手がかりを実証的に発見するために、複数の実験的なWeb調査を実施し、バイアス問題の解決に不可欠な情報を得た。
3)について、本研究の成果及び一連の調査データの公開を遂行することにより、Web調査法の標準化を図るための具体的なヒントを与えることができた。
 最終年度の2024年度は、 2022年度~2023年度に実施した3つの登録モニター型Web調査データの分析を進めた上で、大学生を対象とした価値観Web調査、生活と環境に関する意識Web調査を新たに遂行した。特に、標本抽出の仕組み、不良回答検出用質問の効果、回答時間の影響、基本属性の不一致などを中心に分析を行い、Web調査における不良回答の検出基準を検討した。一連の成果は学術論文、研究発表、研究報告書などの形式で公表された。一部のWeb調査結果を研究リポートとして以下のURLにて公表してある。https://cns-ceas.doshisha.ac.jp/survey/04/index.html
また、共同研究者とともに、郵送調査により全国範囲の生活と環境意識調査を実施し、約500人分のデータを回収した。今後、比較分析を進め、Web版と紙筆版による実験調査の特徴を抽出する予定である。

002RP2024 吉野 諒三(同志社大学)
意識の国際比較研究のためのオープンデータサイエンスの促進

2025年7月下旬に吉野諒三研究代表が急逝したことに伴い,DS施設側受入担当教員が代理で報告している。
 本課題は申請2年度目の継続課題であり,2024年度申請時の研究背景・目的として次のような点を挙げていた。
(引用始)本研究では、統計数理研究所を中心に過去40年ほどにわたり収集してきた「意識の国際比較」データの一般公開促進とデータ解析の促進を通じて、人文社会科学のオープンデータサイエンスを展開する。本計画では統計的に信頼性の高い調査データ群を公開すると同時に、単なる回答分布数字の大小比較に出すことなく、各国固有の標本抽出調査や、各国の文化や歴意を背景とした言語の差違(質問文の表現)などを念頭に、統計数理研究所を中心に過去半世紀以上に渡り蓄積してきた「国際比較可能性」についての深い知見を国内外に啓蒙すべく、共同研究を展開する。これにより、官民学の社会調査研究者・利用者にデータ活用の利便を供与し、また活用における法律・倫理等の啓蒙をも図り、結果として、一方で実証的調査データに基づく学術研究の発展と、他方で実証的証拠に基づく政策立案の促進につながることが期待される。(引用終)
 研究目的を達成するための2024年度以降の具体的な研究計画・方法については主に以下の流れに沿って計画を立てた。ただし、各データの公開順番は、関連資料の整備状況なども勘案して、最終決定していくこととした。
2024年度 1.ハワイ日系人調査 2.米国西海岸日系人調査
2025年度 3. ハワイ日系人時系列比較調査,4.ブラジル日系人調査
 2024年度は代表者逝去に伴い,実質的な活動としては,代表者が管理していた素データ類の引き継ぎ,分担者が協力して過去に整理していたコードブック等付帯情報・文書類の確認および簡単な整理等を進めたが,2024年度中に公開予定とした1,2のデータ公開には至らなかった。また特に直接的に本共同研究に基づく学会発表等も行うことはできなかった。
 次年度以降に共同研究課題としてではなく,社会データ構造化内のプロジェクトとして,センター長主導の下で上記4データセットの公開・共同利用準備を進めることとした。

003RP2024 原 圭一郎(福岡大学)
南極エアロゾル・雲観測データの長期変動解析とデータライブラリーの整備

各担当者により,観測データの解析・試料の分析が進められた.処理されたデータは共有のサイトに保存され,関係者間で利用できる状態になっているが,公開に向けたデータの最終チェックとデータ論文や学術論文の執筆を行っている状況である.下記に示す一部の論文は,年度内に国際誌へ投稿できたが,査読者のコメントに基づいて修正中あるいは査読者による審査中の状態である.

Hirasawa, N. et al.: Spatiotemporal variations of Be-7 concentration of the surface air in the Antarctic region of the Australian to Indian sector, Journal of Geophysical Research Atmosphere. (Revised)

Keiichiro Hara, Kano Osato, Masanori Yabuki, Kazuo Osada, Naohiko Hirasawa, Masataka Shiobara, and Takashi Yamanouchi, Antarctic Haze Phenomena at Syowa Station, Antarctica: Seasonal features and impacts on atmospheric chemistry, npj Climate and Atmospheric Science (Under Review)

また,年度内に論文の投稿までは至らなかったが,一部のデータ論文(偏光OPC,筆頭著者:小林)については,執筆した論文原稿を英文校閲にかけるところまで進んでおり,近日中に投稿する予定である.さらに,一部の論文(筆頭著者:猪股)については,論文草稿が共著者間に回覧された状況にあり,近日中に英文校閲を経て,国際誌へ投稿されると期待される.

004RP2024 辻 雅晴(旭川工業高等専門学校)
南極産菌類の菌株データベースの構築と公開

南極域の菌類は、近年の急激な地球温暖化により生息域の大幅な縮小が懸念されているが、その低温に特化した特徴から新たな微生物資源としても注目を集めている。しかし昭和基地周辺から分離された菌類は日本の微生物保存機関にわずか5種8株しか保存されていない。
そこで本研究では、微生物資源として注目を集めながらも日本では、ほとんど保存されて来なかった南極産菌類について、統一した菌株番号を付与したのちに保存する。さらにその菌株は誰がいつ、どこの試料から分離したのかという基礎的なデータを本研究はR5年度〜R7年度の3年間をかけて、南極・昭和基地周辺の試料から分離した菌株の種名、菌株番号と併せて管理し、データベースの構築し、共同利用、データサイエンスへの利活用の促進を図ることを目的とした。
R6年度は、南極・昭和基地周辺の試料から分離した菌株のうち、当初の計画通り700株について、菌類のマーカー遺伝子であるITS領域および26S rRNAのD1/D2領域の塩基配列をPCR法により増幅を試みた。その結果、700株中633株について遺伝子の増幅に成功した。PCRにより遺伝子の増幅に成功した621株をキャピラリーシーケンサにより、塩基配列を決定した。
その結果、122株は子のう菌類であり、13属18種に分類できた。267株は担子菌類であり、9属12種に分類できた。残り232株は細菌類であったため、細菌類のマーカー遺伝子である16S rRNAをPCR法により増幅し、その遺伝子配列を決定することで、細菌類であることを確認した。
種同定した菌株については、イーストペプトンデキストロース液体培地(YPD、Difco)およびポテトデキストロース液体培地で10℃、1週間攪拌培養した。攪拌培養した各菌株は、2mLクライオチューブに1mL分注し、そこに1mLの5%トレハロース含有20%グリセロール溶液を加え、NIPRから始まる4桁の菌株番号を付与した後、-80℃のディープフリーザに保存した。
菌株番号、種名、試料の採取場所、マーカー遺伝子の配列情報を1つにまとめ、データベース化している。データベースは、2024年10月から国立極地研究所 生物圏研究グループのHP(https://www.nipr.ac.jp/biology/)上で公開を開始した。

005RP2024 金井 雅之(専修大学)
多様な調査方式に対応した国際共同調査のマネジメントとデータ共有

 昨年度に実施した研究ミーティングで共有された各国・地域における多様な調査方式の実態および社会科学データのマネジメント・アーカイブに関する動向を整理し、ガイドラインの策定に向けた方向性を確認するための研究ミーティングを、2025年2月6・7日に専修大学生田キャンパスを拠点にハイブリッド形式で開催した。日本、韓国、台湾、インドネシア、タイ、モンゴル、フィリピン、ベトナムの8ヶ国すべてからの参加者が、対面もしくはオンラインで参加した。
 議論の結果、こうしたガイドラインはすでに国際機関や国、研究機関などで公表されていることと、情勢が流動的で情報が古くなる可能性も考えられることから、このプロジェクトとして新たなガイドラインを策定することは見送ることにした。
 ただし、昨年度のミーティングで報告された各国・地域からの情報は有益である。そこで、最終年度である2025年度に公開シンポジウムなどの形で対外的に発信するとともに、論文や報告書の形で出版することを検討することにした。

006RP2024 渡辺 健太郎(立教大学)
新規手法により取得された社会調査データの二次分析に求められるメタデータに関する基礎的研究

本研究では、新規手法により取得された社会調査データの二次分析に求められるメタデータについて検討した。手続きとしては、まず内閣府の「全国世論調査の現況」データを独自に加工・集計し、日本における調査モードのトレンドについて検討した。次に、当該トレンドに関する研究デザインについて検討するため、2024年分までのJournal of Survey Statistics and Methodology(JSSM)のSurvey Methodologyセクション掲載論文を対象とした分析を行った。
「全国世論調査の現況」データの分析からは、近年の動向として、ミックスモードの増加が顕著であることが明らかになった。具体的には、2019年には全体の約4%を占めるに過ぎなかったミックスモードが、2022年には約38%を占めるようになった。この増加傾向は調査主体によらず確認された。
上記を踏まえ、JSSMにおけるmixed-modeおよびmixed modeをキーワードに含む計20本の研究論文を対象とした分析を行った。具体的には、各論文の従属変数をTotal Survey Errorにおける誤差のカテゴリによってコーディングし、それらの関連パターンについて分析した。その結果、以下の3点が明らかになった。第1に、ミックスモードを扱う論文の90%は無回答誤差を扱っている。第2に、ミックスモードの無回答誤差を扱う論文の61.1%は、同じ論文の中で、誤差以外の従属変数についても分析を行っている。第3に、誤差以外の従属変数のうち、58.3%を占めるのは経済的コストである。これに接触回数や回答期間を加えると、経済的・人的・時間的コストが91.7%を占める。
以上をまとめると、日本でもミックスモードが普及しつつあることによって、新たな調査モードの無回答誤差に関する問いが重要性を増すと考えられると同時に、それが「どの程度コストを生じさせるか/減少させるか」という問いもあわせて重要になるものと考えられる。しかし現状では、二次分析に利用可能な社会調査データアーカイブで取り扱われているのは、基本的な調査設計に関するものにとどまる。そのため、コストに関する情報がメタデータ(パラデータ)に含められるようになることで、新たな調査モードについての多面的評価が可能になると考えられる。

007RP2024 塚原 東吾(神戸大学)
オランダ系航海日誌の研究: 気象記録の復元を中心としたデータ科学的研究

これまでの研究の経緯としては、松本淳が研究代表者として2014〜18年度に実施した科学研究費で研究分担をしていた塚原が、オランダでの現地調査中に、オランダ国立文書館に19世紀からのオランダ海軍艦艇の航海日誌が大量に残っていることを発見したことから始まっている。続いて2019〜22年度科学研究費においては、オランダ人研究者の助力を得て、これら資料の解析とデジタイズを開始した。これらにおいては、南シナ海や西太平洋を日本まで航行していたオランダ船舶の航海日誌の気象観測情報がわかるものであり、同海域における⻑期的なモンスーン変動像の解明に使用するための研究を進めることができた。
オランダは東インド会社を擁し、多くの船舶が南シナ海及び西太平洋を航行していたものの、その詳細な航海実態はわかっていなかった。本研究では、オランダ船による航海日誌から、航路と航海時期が把握できた。中でもそれら航路にける気象観測記録をデジタイズすることができた。これらのことから、オランダ側の研究者との更なる研究協力が展望されている。またこれらの成果をもとに、塚原と松本との長年の研究協力者である久保田尚之(北海道大学)にデジタイズした資料を提供し、幕末期に日本を襲った台風の記録についての再現を行った。これはe-Journal GEO誌(ウェッブ出版)に公開され、2024年度の日本地理学会賞(論文発信部門)を受賞している。
このようなオランダ海軍の航海日誌の研究と共に、19 世紀中盤に日本に船籍を移した、オランダで製造された幕末の蒸気船・咸臨丸や開陽丸の調査・研究も進めている。特に新規に発見された、佐賀藩の日進(丸)の航海日誌も分析の対象に加えて、その記録を、まだ一部だが、データベース化することができたことは、今後の大きな成果につながるものである。
だがこれは膨大なオランダ船の航海日誌資料や、日蘭交流史における重要な記録(データ)の一部の解明ができたに過ぎない。この研究は、データサイエンスの面からも、歴史記録を科学的に(気象学・気候学の対象として)分析することができるものであり、この研究の継続は強く期待されるが、今回はやむをえない状況(情報研側の事情)で、継続の申請を断念せざるをえなかったことは、たいへん残念な結果に終わったものである。

008RP2024 藤 浩明(京都大学)
機械学習による地磁気永年変化推定

 現在の地球主磁場の時間一階微分で表される狭義の「地磁気永年変化」は,磁気異常の定義や宇宙天気予報の基礎となる地球主磁場基線値の将来予測に重要な役割を果たす。本研究では,五年程度の地磁気永年変化短期予測に機械学習法がどの程度位有効か,という問題を解く為に,代表的なニューラルネットワークであるRecurrent Neural Network (RNN)を地磁気永年変化予測に応用し,仏IPGPの研究者が開発したMCMモデル(Ropp et al., 2020)を教師データとする再予報を2015年から2020年に対して行なった。その際,誤差逆伝播則を使用するRNNに必ずと言って良いほど現れる「過学習」問題を回避する為に,拡張カルマンフィルタ(Extended Kalman Filter: EKF)をRNNの訓練過程で用いた。その結果,過去に研究代表者/研究分担者らが行なったデータ同化法(Minami et al., 2021)に比べ計算量を圧倒的に減らせ,かつ,それと同等かそれ以上の予測精度を持つ事がわかった為,次世代地球磁場標準モデル(IGRF-14)の候補モデルを本研究で開発したEKF-RNN法で作成し,国際地球電磁気・超高層物理学協会(International Association of Geomagnetism and Aeronomy: IAGA)に提案した。
 この過程で,主として以下の二つの成果が得られた:

EKF-RNNを新たに開発した事により,従来のRNNに憑き物であった「過学習」問題を回避する事に成功し,RNNの最適化問題を初期値問題にのみ集約することを可能にした。また初期値についても,使用した教師データと再予報結果に依存した形ではあるが,グリッドサーチにより最適化に成功し,IGRF-14の候補モデルを作成する際もこの初期値セットを用いる事ができた。地磁気永年変化推定に機械学習を用いる日本の試みは,IAGAのIGRF-14作成タスクフォースにおいても一定の評価が得られている。

教師データのMCMにはガウス係数が時系列として与えられているが,EKF-RNNにガウス係数そのものを予測させるのか,それともその高階差分を用いた方が良いのかを四階差分までの範囲で調べた所,二階差分が最も良い予測精度を与える事が分かった。これは,MCMの二階差分に特徴的な六〜七年周期の変動が含まれている為である。すなわち,本研究で用いた機械学習法は,教師データが特性周期を持っている場合,正しくそれを検知する事が証明された。今後は,この特性周期の基となる物理過程の解明が課題となる。

009RP2024 高田 豊行(理化学研究所)
疾患モデルマウス系統のゲノムアセンブル情報高度化とゲノムアノテーション

本研究の目的は、申請者がAMED-NBRP ゲノム情報等整備プログラムなどの支援を受けて取得した、マウス系統5種類のゲノム配列情報を使用して、高度なゲノム情報解析を行い、高品質な染色体レベルのゲノム配列情報を整備しアノテーションを行うことにより、当該系統でこれまで未知であった構造多型や多重遺伝子族などのゲノム構造の特徴を明らかにする事である。今年度は継続申請の3年目(最終年度)であり、これまでに検出されたゲノム多型情報を基に疾患関連の原因因子の探索に必要なゲノムアノテーションを行うと共に、成果報告としての論文作成をめざした。
昨年度までに疾患および健常のモデルマウス系統、計5種類(FLS/Shi(非アルコール性脂肪肝炎)、NC/Nga(アトピー性皮膚炎)、STR/OrtCrlj(遺伝性変形性関節症)、JF1/Ms(ヒルシュスプルング病)、およびMSM/Ms(健常型))を対象にした長鎖(40kbp以上のゲノムDNAを精製して解析)と短鎖(常法による250bp ペアエンド解析)のゲノム解読情報を使用して、ROIS-DSゲノムデータ解析支援センターの協力によりデノボアセンブル解析を行い、全ゲノムレベルのコンティグ配列情報を取得した。これらコンティグ配列情報を基にして、対象のマウス系統5種類のスキャホールド情報をマウス染色体(常染色体1-19およびX)に対応させ、参照ゲノム配列と染色体レベルで比較可能な配列情報を整備した。さらに、この情報を用いて全ゲノムを対象にゲノム多型の検出を行い、SNV、Indelさらには50塩基以上の構造多型(SV)を高品質なゲノム情報基盤として整備した。
 本年度の成果として、これまでに得られた情報を申請者が運営している理研・マウスゲノムデータベース(MoG+; https://molossinus.brc.riken.jp/mogplus/)から一部コミュニティに公開すると共に、一部の系統間(JF1/MsおよびMSM/Ms)でのゲノム多型に関する論文作成をめざした。当該系統間での詳細なゲノムアノテーション情報の整備に時間を要したため、今年度内での論文の完成には至らなかったが、引き続き他の系統も含めたゲノムアノテーション情報の整備を進め本研究の完遂をめざす予定である。

010RP2024 加藤 千尋(信州大学)
宇宙天気研究に利用する昭和基地宇宙線観測データ公開方法の拡張とデータ解析手法の改良

本年度,南極昭和基地の観測装置フルシステム化が完了し,取得データの量が増えた。一方,中性子計での観測データ解析に新手法を取り入れるための改良計画が進行中であり,これについては次年度に現地作業を予定している。こうしたことを踏まえ,データベース用サーバーの構築を勧めているが,フルシステム化に伴う準備作業に人手と時間が必要であったことももあって,年度内の完成には至らなかった。現行のサーバーについては関連する計算機群について,セキュリティーの関係から入れ替えを強く推奨されたため,データ公開サーバーの改修に優先させて通信用PCの購入に計画を変更した。その際,データ取得環境の更新にかかる試験用を含めて2台とした。
中性子計計数率のモニタリング用データをよりリアルタイムで取得するためのシステムで最大で2分毎程度の頻度でモニタ用データを取得できることを確認し,受け入れ側の整備後に転送頻度を上げることとした。その他,昭和基地での観測データについて年毎のアーカイブデータの公開を行っている。
中性子モニターとミューオン計による観測データの統合解析ならびに解析手法の改善によって,解析した宇宙天気現象(StarLink衛星を墜落させたことからStarLinkイベントと呼ばれている)について,先行論文で延べられていた「2本のフラックスロープが時間差で地球に到達した」のうち1本について地球到達時の軸方向を推定することができた。これを含む解析結果は名古屋大学ISEE研究集会で報告された。
予算執行については,昭和基地での観測装置の拡張準備に関係する旅費の他,先に述べたPCの購入と宇宙線データ解析結果の投稿かかる費用に変更,ほぼ全額の執行となった。

011RP2024 臼田 裕一郎(防災科学技術研究所)
歴史ビッグデータを活用した災害可視化研究

2024年度は、計画していた3点(①、抽出した古文書地名の地図上の位置を確定し、災害年表マップにマッシュアップ可能な状態に整える、②、災害事例データベースとの連携(災害事例データの量的充実:事例の追加、災害の様態、被害実態の記載)に向けた調査、③、引き続き安政江戸地震を対象に、文献からのテキストデータを抽出し、地名、日時、災害の様態の整理)について、以下の成果を得た。
については、2023年度に引き続き、安政江戸地震の切絵図に記された場所を明確にするため、基盤情報となる江戸切絵図の町家部分(人口密集地域)の分類と着色を実施し、2024年度はすべて江戸切絵図のデータの整備が完了した。データセットは、「江戸切絵図」町家領域データセット(https://codh.rois.ac.jp/edo-maps/rekichizu/)として、すでに全データを公開し、「江戸切絵図」町家領域Gepshapeレポジトリ(https://geoshape.ex.nii.ac.jp/edo/machiya/)として現在のマップ上で閲覧することが可能である。江戸時代後期(1800〜1840年ごろ)の江戸の空間を想定・再現した「れきちず」(https://rekichizu.jp/)上でも統合され、江戸時代の地図と一緒に町家の範囲を把握することが可能となった。
については、検討を行い、災害年表マップは、市区町村単位で災害イベントデータを保持しており、江戸切絵図の空間解像度と現状では異なる解像度を有している。この空間解像度の差をシームレスに移行し、災害イベントデータと安政江戸地震のより町家単位の詳細な被害を紐づける手法の開発を要する。
については、宇佐美(2001)と「みんなで翻刻」に詳細な安政江戸地震の町丁目単位などの被害情報が掲出されていることを確認しており、②の空間解像度の解消を検討することでデータを整理し、れきちずと連携をすることが可能であると判断した。
2024年度の研究により、安政江戸地震に適用可能な基盤データセットの整備が完了した。それぞれのデータがどのような解像度を有しているか、関係者とのヒアリングを通して、明らかにすることができたため、今後は解像度の異なるデータの可視化と活用により焦点が絞られた。

012RP2024 坊農 秀雅(広島大学)
ゲノム編集ターゲット選定のための公共データベース利用技術開発

2024年度は、DBCLS主催のTogothon(毎月開催)への参加により公共データベース利用技術開発のために必要な情報収集と研究ディスカッションを行った。昨年度2回参加したバイオハッカソンで開発を始めた、非モデル生物でのパスウェイ情報利用に関するシステム構築を今年度さらに発展させ、ゲノム編集ターゲット選定に資するリソースづくりのデータ解析基盤技術として開発を進めている。
また、公共データベースを利用する技術を複数開発した。ゲノム編集ツールの一種である「シトシン塩基エディター(CBE)」が起こす意図しないRNA編集のリスクを分析するソフトウェアとリスク推定するためのAI予測ツールをDNA言語モデルを用いて開発を行った。本成果は同じく2023年度のバイオハッカソンでの議論がきっかけとなったものであり、Internation Journal of Molecular Sciences誌に査読済み論文として出版された。本研究によってCBEを利用したゲノム医療の安全性評価の向上が期待される。
さらに、酸化ストレスと深く関連するパーキンソン病をターゲットにこれまで研究が進んでいない遺伝子を公共遺伝子発現データベースから探索するパイプラインを構築し、NPJ Parkinsons Disease誌に査読済み論文として出版された。

013RP2024 田中 和明(麻布大学)
ゲノム解析によるニホンカモシカの遺伝的多様性の調査およびY染色体遺伝子マーカの開発

ニホンカモシカ(Capricornis crispus)は日本列島に固有のウシ科動物で、特別天然記念物として保護されているにもかかわらず、全国的な遺伝学的研究は十分に行われていない。本研究では、父系調査を目的としてY染色体遺伝子マーカーの開発を行うため、2022年度から2024年度までROIS-DS-JOINT研究によるゲノム情報の分析支援を受けた。2022年度には、雄1個体のショートリードNGS(360.5Gb)配列をもとに全ゲノムアセンブリを実施し、近縁なヤギ(Capra hircus)のリファレンスゲノム(GCA_015443085.1)を参照して、XYを含むすべての染色体に対応するscaffoldを構築した。2023〜2024年度には、利根川を挟んで東西の個体群から合計25個体を対象にマルチプレックスNGS解析を実施し、平均38Gbのデータを取得した。得られたデータをbwaで参照配列にマッピングし、GATKにより多型を同定した。東西で固定された多型およびマイナーアレル頻度20%以上の多型のうち、Y染色体scaffold内に67カ所のSTR構造を確認し、350bp以下の増幅産物が得られるPCRプライマーを設計した。さらに、絶滅が危惧される紀伊半島の2個体のNGSデータを追加し、Y染色体上の多型を再抽出した結果、多型性を示す15個のSTRマーカー遺伝子座を完成させた。紀伊半島では、群馬県とはアレルサイズが大きく異なる遺伝子座が確認され、これらを組み合わせることでY染色体ハプロタイプの構築が可能であることが示された。この成果は、日本動物学会第95回長崎大会で口頭発表した。今後は全国調査に活用する予定である。また、ゲノム解析の過程で、ニホンカモシカの一部個体においてミトコンドリアDNA(mtDNA)配列が得られない原因を明らかにした。すなわち、核に移行したmtDNA配列(NUMT:Nuclear mitochondrial DNA)が、真のmtDNAと同時にPCR増幅されることで、塩基配列の解読に干渉していたことが原因であった。これにより、この問題を回避した効率的なmtDNAの分析が可能となった。この技術を用いた研究成果の一部は、Zoological Scienceに2025年3月に掲載された(https://doi.org/10.2108/zs240006)。

014RP2024 波多 俊太郎(北海道大学)
空中写真や衛星画像データを用いた宗谷海岸氷床縁辺部湖沼のインベントリ作成

【南極氷床全域の氷河湖インベントリ作成】
昨年度の試行結果および今年度の文献調査により、現段階での南極氷床沿岸部の氷床縁辺湖抽出には光学衛星を用いた目視判読が最適であることが判明した。これに基づき、今年度は南極氷床沿岸部の全領域にわたって氷床縁辺湖の抽出作業を実施した。
Quantarctica内で提供される露岩地域情報とGoogle Earthを用いて、研究対象地域を何許期氷床沿岸部から18地域を設定した。全地域での衛星画像e利用可能面積を向上させるため、2017-2022年の夏季(12, 1, 2月)に取得された光学衛星Sentinel-2の衛星画像に雲除去アルゴリズムを適用し、利用可能画像から10 m解像度のコンポジット画像を作成した。画像抽出・コンポジット画像作成・雲マスク等の解析はGoogle Earth Engineプラットフォームを利用した。出力したコンポジット画像をQGIS上で表示し、各地域ごとに目視判読により氷河湖を抽出した。マッピングの対象とした湖の判読基準は、氷床と露岩に接する湖のうち、i) 水面が確認できるもの、に加え、ii) 水面は確認できないが湖氷と判断できるものとした。
本研究によって、18地域にわたって氷河湖の抽出を完了し、南極氷床の氷床縁辺湖インベントリが作成された。抽出した湖について校正・精度評価を行うとともに、メタデータの整備を行っている。インベントリの概要は論文として出版予定であり、インベントリはデータセットとしてまとめて公開を予定している。

015RP2024 吉沢 明康(新潟大学)
オミクス解析のための自動簡易アノテーションツールと系統情報表示ツールの開発

今年度は昨年度に引き続いて、実装作業等を進めた。
1) 昨年度に概ね実装を終えたBidirectional Best Hit (BBH) オーソログ推定ツールについては、共同研究者の熊本大グループの要望に応じて追加データの計算やバグ修正などを行った。またBBHの結果を「信頼する」基準、BBHの結果や他生物種の遺伝子アノテーションの結果を統合する基準を、熊本大の研究を基に検討した。熊本大グループは論文執筆中であるが、これは実験主体の論文であり完成が大幅に遅れて25年度に持ち越しになっている。
2) 上記BBHツールの入力インターフェースで用いる予定の、付加情報の一定基準を満たす生物種のみを系統樹上に表示するツールについては、昨年度から継続して必要ライブラリを調査し、取得したファイルから必要情報を抽出するスクリプトなどを作成した。特に生物種の遺伝子総数情報はTogoGenomeから取得することによって、(車輪の再発明を回避し)計数処理を完了した数値を得られることを期待しているが、昨年度のHomo sapiensのデータに続き、Escherichia coli K-12などでも遺伝子数が表示されないなどの問題を発見した。現在、Togothon Slackの専用チャンネルで担当者にバグレポートを行う形で、利用のためのTogoGenomeの整備を進めている。
3) global alignmentアルゴリズムを用いた、オーソログ間での残基の対応づけ・追加アノテーション機能については、ローカル環境で試行を行い、人間が操作するならばそのような対応付けやアノテーションが可能であることを確認したが、熊本大グループではこの機能を直ちに利用する予定はないとのことであったため、それ以上の検討は今年度は中止している。
4) 新規配列を既存オーソログクラスターにアサインする方法の基礎的検討については、過去のDS-JOINT研究で利用していたKEGG OCの更新が止まっており、それを利用するよりも更新の続いているeggNOGなどを利用するほうが適切ではないか、という疑問がある。またeggNOGには同様の処理を行うユーティリティeggNOG-Mapperが既に存在し、これの実装は研究や開発ではなく単なる作業になるため、今後の方針を慎重に検討中である。

016RP2024 田村 啓太(大阪大学)
植物のリファレンス遺伝子発現データセットの作成とオルソログ推定手法の検証

共通の祖先遺伝子から種分化によって分岐した対応関係にある遺伝子群はオルソログと呼ばれ、それらの機能は保存されることが多いため、オルソログ推定は遺伝子の機能推定において有用な手法である。そのためのツールとしてOrthoDB、OMA、植物においてはEnsembl Plantsなどが存在するが、ツール間で結果が異なることがしばしば生じる。そこで実例としてシロイヌナズナとダイズを対象とし、昨年度構築したこの2種について複数のオルソログ推定ツールの結果を一覧で比較できるウェブツールを用いて、一次代謝および二次代謝のさまざまな生合成経路に関わる遺伝子を例に、どのような条件においてツール間でオルソログ推定の結果が一致するケースとそうでないケースが生じるのか特徴を見出すための検討を行った。そのための追加の情報として、DIAMONDを用いたタンパク質配列相同性検索を同種内および異種間で行った結果もスコアとともに表示できるようにした。研究期間中にOrthoDBのバージョンが11から12にアップデートされ、これまでNCBI Gene IDをクエリとして取得できていたOrthoDBの結果が一部で取得できなくなるなどの変化が生じたため、OrthoDB側がアップデートしても結果が取得できるようにウェブツールの改修を行った。本ウェブツールの効果的な使い方について、今後さらなる検討を行っていきたい。

017RP2024 戸張 靖子(麻布大学)
ジュウシマツの家畜化に伴う行動進化の遺伝的基盤の解明

鳴禽類ジュウシマツは、コシジロキンパラからつくり出された飼い鳥で、コシジロキンパラよりも不安や恐怖に対する感受性が低く、ヒトに対して攻撃行動をとらず、求愛に用いる歌を構成する音要素の並び方が複雑である。多くの鳥類は暗闇では滅多にうたわないが、ジュウシマツは暗闇でもうたってしまう。本研究では、野生コシジロキンパラと家禽ジュウシマツの形質の違いに関連する遺伝子の探索をおこなった。
雄ジュウシマツ23個体と台湾野生由来の雄コシジロキンパラ15個体のre-seq data(150PE、8Gb分)とならびにジュウシマツの参照ゲノム配列を用いて各集団の多型(SNP)dataを取得し、ジュウシマツとコシジロキンパラの二集団間で強く分化した(SNP-level Fst>=0.9)染色体区間(3768 site)を選び、選択候補領域とした。それらの領域には言語発達の遅れに関連するthyroid hormone receptor beta (THRb)やretinitis pigmentosa GTPase regulator (RPGR) などの遺伝子群が検出された。RPGRには非同義置換がおこっていた。鳥類では甲状腺ホルモンが学習能力の向上に関与していることや、鳴禽類の歌行動を制御する特別な神経回路にはTHRbが発現していることが報告されている。よってTHRbは、ジュウシマツの家禽化と複雑な歌の学習能力の獲得に関連する遺伝基盤の一つであるかもしれない。ニワトリでは、RPRGが正の選択を受け、赤色野鶏に比べて、家禽の網膜ではRPGR発現の増加が示されている。RPGRの過剰発現はマウスにおいて重度の視細胞変性につながり、RPGRの変異はイヌとヒトにおいて重度の進行性視力低下をもたらす。RPGRがジュウシマツにおける視力の低下(暗闇でもうたってしまう)の関連遺伝子かもしれない。
window-level Fst/πに基づく探索では、当該ゲノム領域が約23.3Mb分(上位5%)検出され、その上に466遺伝子が存在し、そのうち382遺伝子でそのCDS領域がoverlapしていた。CDS上にSNPがある遺伝子は335で、そのなかでhumanに対応付けられた遺伝子は290であった。それらの中には、細胞外マトリクス(16 genes)、脳の発達(24 genes)、甲状腺ホルモン代謝(7 genes)に関連した遺伝子群が検出された。
 今年度、新たにdataを追加し、コシジロキンパラ31個体、ジュウシマツ52個体分のre-seq dataについて同様の解析を行った。SNP-level Fstによる解析からは二集団間で強く分化した領域を2149 siteに絞り込むことに成功し、これらの多くは28個のコード領域上に偏在していた。また、window-level Fst/πに基づく探索からは、約24Mbのゲノム領域が検出され、当該領域上には392個のコード遺伝子が存在していた。現在、これらのコード遺伝子の詳細な特徴抽出と、それに基づいたジュウシマツの家禽化との関係性の推定を進めている。

018RP2024 野村 俊一(早稲田大学)
保険数理と現代的モデリング手法との融合

(野村・松森)保険金支払備金の算出に動的因子モデル(DFM)を用いた新手法を提案した。DFMは、従来法では対応が難しい損害発生パターンの時間的変動を捉えることができる。損害発展係数(LDF)の多変量時系列にDFMを適用することで、損害の発展傾向を柔軟かつ構造的に把握でき、変化の要因を可視化・説明可能にする。2つの保険種目に適用し、時系列的な変化を精度高く捉える能力を実証した。
(大塚)低所得世帯における生活リスクへの備えと保険・共済加入行動を分析した。前研究に基づき、世帯属性や相談行動の違いに着目し、アンケート調査を実施した結果、加入勧奨の機会の有無が加入に影響すること、共済加入には相談相手の存在が関係する可能性があることを確認した。一方で、共済加入の動機として家族の絆や助け合い志向は支持されず、掛金の安さが主因であると考えられる。
(清水)
1.Shimizu et al. (2020)で提案された将来死亡率予測の新しいモデルであるSurvival Energy Modelにおいて、モデル内で設定すべき重要な関数をノンパラメトリックに推定する手法を提案し、関数主成分分析の手法を応用して将来予測を行い、その性能の良さを示した。
2.サイバーリスクのインシデント予測において、古典的な損害保険リスクモデルの有用性を示した。特に、リスク量を陽に記述することによって,モンテカルロに頼らざるを得ないリスク尺度の計算において、計算量(計算時間)を大幅に削減可能であることを示した。
3.遅れ(delay)を含む確率微分方程式に対して、係数に含まれるパラメータの擬似最尤推定量を提案し、その一致性、漸近正規性を示した。特に、SIARモデルなどの感染症モデルにノイズを含めたモデルとしての拡張モデルとして用いることができる他、保険におけるIBNR推定などの発展的応用にも利用可能である。
(白石)感染症データは、感染から診断確定までの時間差があるため、報告遅れという現象が生じることが知られている。本研究はCOVID-19における実効再生産数の予測に関して、この報告遅れを加味したリアルタイムの予測手法を、保険リスク評価においてよく知られているチェーンラダー法を応用して開発した。

019RP2024 鐘ケ江 弘美(農業・食品産業技術総合研究機構)
大規模言語モデルを利用した植物形質オントロジーの自動構築

農研機構や公設試などには膨大な農業情報が蓄積されているが、これらを効率的・横断的に利用するためには、語彙の統一が重要である。そこで、本研究では、農作物データ作成に用いられるオントロジーの自動構築を支援する技術を開発することにより、植物形質情報を整理・統合し、データの相互運用性を向上させることを目的として研究を進めた。
最初に、海外から公開されている既存のオントロジーを活用するために、大規模言語モデル(LLM)を活用したオントロジーの効率的な翻訳手法について検討した。具体的にはPlant Breeding Ontology(https://agroportal.lirmm.fr/ontologies/PBO)の日本語化を進めるために、LLMを含むいくつかの手法で語彙を翻訳した。その翻訳案は手法ごとに異なっており、また、オントロジーとしては不適切である場合もあったため、専門家が選択あるいは修正することにより、効率的に日本語化を進めた。その成果は、「The Plant Breeding Ontology (PBO): towards an ontology for the plant breeding community」というタイトルにてプレプリントサーバーBioHackrXiv上に公開した。
次に、LLMを用いて形質名に関する語彙を抽出する手法について検討した。形質名が記載されている日本語の論文や報告書のPDFファイルを抽出する際にも、LLMを活用して効率化を図った。これらのPDFファイルからLLMを用いて語彙を抽出すると同時に、マニュアルでも語彙の抽出を行い、自動での語彙抽出との精度の比較に用いた。語彙抽出の精度を向上させるため、事前知識として既存のオントロジーの情報を追加することにより、適切な出力を得るために必要なプロンプトを開発した。今後は、収集した標準語彙から、オントロジーを構築する手法について検討予定である。

020RP2024 金澤 雄一郎(国際基督教大学)
パンデミック後における楽観性、現在の幸福感、信頼・信頼に値することとは

次年度以降に本調査を実施する準備として,さまざまな対象についての(Trust)/信頼性(Trustworthiness)をテーマとする国際比較調査の構想を練り,調査仕様策定の準備を進めた。
(1) 調査の基本的な枠組
金澤-Kwantes間で理論的な枠組の準備を進めた。ここでは主に日本とカナダの間の国際比較を想定した検討を行った。
(2) パイロット調査仕様の検討
2025年3月にはKwantesが来日し,金澤を含めDS受入教員の前田との間で,パイロット調査仕様検討や,その調査票内容に関する打合せを行った。特に新型コロナ蔓延によって信頼性がどのような影響を受けたかを知るためのっ方法としてSynthetic Contro1 Methodの応用が真剣に話し合われた。
(3) 調査票内容の再検討(カナダ・日本)
(2)の検討に基づき,大学院生等に調査票素案の詳細な検討を依頼し,調査票の改善に関するフィードバックを得た。
(4) カナダ側と日本側で,過去にそれぞれの大学で実施された標本数250程度の自由記述式で回答された職場の同僚と上司に対する信頼性(Trustworthiness)パイロット調査の再分析を行った。具体的にはKwantesと金澤により、すべての標本に対して基本の三点(ability, benevolence, integrity)およびそれ以外の要素の存在・不存在に再分類する真摯な試みが行われ、両者の間で一定の合意を得ることができた。
 現状での成果は,パイロット調査の実施を行ったところまでであり,25年度以降にパイロット調査の分析および,本調査の仕様検討等を進める。
 2025年度にも同じテーマでの共同研究の申請を検討している。

021RP2024 新堀 淳樹(名古屋大学)
研究データの可視化・検索向上を目指したメタデータマネジメントの実践

2021年4月に、内閣府・統合イノベーション戦略推進会議によって、「公的資金による研究データの管理・利活用に関する基本的な考え方」がまとめられた。2021年6月2日には、それに基づいて、文部科学省から各研究機関に「研究データ基盤システム(NII Research Data Cloud)を中核的なプラットフォームとして位置付け、産学官における幅広い利活用を図るため、メタデータを検索可能な体制を構築する。(2023年度まで)」とする通知が行われている。この通知には、各研究機関でのデータポリシーの策定や研究データへのメタデータの付与なども含まれており、大学における研究データ管理体制整備が喫緊の課題となっている。
以上のような急激な状況変化を踏まえ、昨年度の共同研究で宇宙地球科学分野のデータに対して、2023年度では  ①研究分野のメタデータスキーマから一般的・共通的なメタデータスキーマへの変換の実装  ②共通メタデータスキーマに基づくメタデータの機関リポジトリへの登録
実施したが、2024年度は、この実践を名古屋大学、九州大学に加えて京都大学への展開を検討・実施し、他大学へも適用できるようにスケーラビリティ及び相互互換性を確保した手法の開発を行った。  これまでの事前調査結果に基づいてメタデータマッピングテーブルや変換のためのXSLTファイルのプロトタイプを作成し、名古屋大学と九州大学図書館においてSPASE2.4.0メタデータから学術リポジトリに登録に必要なJPCOAR1.0.2メタデータに変換を行った。そして、変換したメタデータを学術リポジトリに自動で登録するためのパイプラインを構築した。その結果、名古屋大学宇宙地球環境研究所と九州大学国際宇宙惑星環境研究センターが管理している太陽地球物理学分野の地上観測データに自動登録スクリプトを適用したところ、特に大きな問題なく自動で機関リポジトリに登録することができた。この時に登録したメタデータの件数は、284(名大)/180(九大)件であった。一方、SPASE、JPCOARメタデータスキーマともにバージョンアップが行われたため、SPASE2.6.1とJPCOAR2.0のメタデータスキーマに対応してマッピングテーブルのアップデートとXSLTプログラムの改修を行った。また、DOI付与の観点から、JaLC2.0メタデータ生成ツール、及びJaLC2.0からJPCOAR2.0メタデータに変換するためのマッピングテーブルを作成した。本取り組みの成果がオープンアクセスリポジトリ推進協会のウェブサイト(https://schema.irdb.nii.ac.jp/ja/case-study)においてJPCOARメタデータの活用事例として紹介された。

022RP2024 塩田 さやか(東京都立大学)
実環境下における時系列情報のプライバシー匿名化に関する研究

本研究では、音声に対するプライバシー保護技術の開発とその有効性の検証を進めている。昨年度から継続して行っている研究の中で、まず畳み込みニューラルネットワークを用いた音声処理モデルに対し、秘密鍵を用いて音声特徴量を変換することで、音声データの非可逆な秘匿化を行う手法を提案し、その頑健性やモデル性能への影響を評価した。この手法は、モデルの精度をほとんど損なうことなくプライバシー保護が可能であることが実証されており、実用性の高いアプローチとして評価されている。

加えて、音声認証分野においては、話者の声道長に基づく変動を模擬したデータ拡張手法を提案し、話者の多様性を考慮した学習による認証精度の向上を図った。これは、単なるデータ拡張ではなく、実際の個人差に近い擬似話者データを生成することで、より現実的な状況下でも性能を維持できるモデル構築に寄与している。

さらに、音声プライバシー保護のための暗号的手法の堅牢性向上を目的として、複数のランダム直交行列を組み合わせて用いる秘密鍵生成手法を検討した。これにより、従来の単一鍵に比べて攻撃耐性を高めつつ、効率的な処理が可能な暗号化が実現され、時系列情報を持つ音声データに対する鍵空間の拡張という観点からも大きな意義がある。

本研究の特徴は、既存の音声モデルアーキテクチャや公開済み学習済みモデルとの高い互換性を維持しつつ、性能を損なわない保護手法の設計にある。音声タスクでは特徴量抽出の方法が性能に大きく影響するため、データを暗号化しても従来の処理パイプラインがそのまま使用可能であることが極めて重要である。本研究では、音声認識・話者照合・環境音分類など多様なタスクに対して実験を行い、それぞれにおける課題を整理しながら、汎用性と頑健性を両立するプライバシー保護の実現を目指している。

これらの成果は、音声認識・話者認証・環境音分類といった複数のタスクへの応用を通じて検証されており、音声情報の安全な利活用を支える基盤技術として、今後の展開が期待される。現在は、さらなる応用範囲の拡大やリアルタイム処理への対応、ならびにモバイル端末やクラウド環境での実装可能性の検討も進めており、社会実装に向けた応用研究を強化している。

023RP2024 福島 敦史(京都府立大学)
質量分析オミックスデータの解釈を促すエンリッチメント解析基盤の構築

本研究の目的は、質量分析オミックスデータを用いたパスウェイエンリッチメント解析のための新たなデータベース構築とアプローチ法の開発であった。申請時に、以下の目標を設定した:

1)エンリッチメント解析用データベースの包括性と精度の向上
2)統計的手法の改善による偽陽性リスク低減
3)解析結果の解釈を容易にするツールの開発

1)では、質量分析オミックスデータの再解析および過去文献(論文のサプリメントデータ含)からの情報抽出とを組み合わせ、新規のカテゴリ「分子セット」を定義・整備することを目的とした。当面ヒトを対象生物種として、「がん」に関連する公的利用可能な質量分析オミックスデータの収集を試みた。
【メタボローム】
公共のレポジトリデータベースMetaboLightsを探索し、分子セット構築に使えるデータを絞り込んだ。その際、生成AIを利活用できるか検討した。具体的には、ChatGPT/Gemini + RでMetaboLightsのメタデータ整理の自動化を進めた。結果としてISA-TAB形式ファイル(i_, s_)をChatGPT/Geminiに読ませて、メタデータ中の必要なTitle, Description, factor value(例 疾患、健常)を抽出できた。
【プロテオーム】
文献調査により、「プロテオフォーム(アイソフォーム)により機能が異なるタンパク質もしくはタンパク質ファミリー既知例」10例のうち、2例(p53 family, protocadherin)について論文から情報抽出を試みた(残り8例についても継続予定)。
【グライコーム】
分子セットの構築を検討するためにデータ収集を行った。これまでに集めたがん関連のデータ20件に加えグリコサミノグリカンに関連するデータを収集した(glycoPOSTより7件, PRIDEより33件, MassIVEより12件)。

2)および3)は、本研究期間内では達成するに至らなかったので継続的に研究開発を進める。次年度以降に実施する予定であるデータ再解析では、確立されているjPOST、GlycoPost、MetaboLightsを含め公共データベースおよびメタボロームとプロテオームで統合しうるメタデータ記述のために統制された語彙(例. ヒトプロテオーム機構Proteomics Standards Initiative, HUPO-PSIによる語彙等)を利活用する計画である。

024RP2024 川畑 拓矢(気象研究所)
アンサンブルデータを用いた気象現象の理解

今年度は、線状降水帯等の豪雨に対するデータ同化研究およびアンサンブルを用いてこれらを解析する手法のレビューを行い、非線形性を取り入れるデータ同化システムの必要性と、従来のアンサンブル感度解析の限界を確認した。
まず広く利用されている局所アンサンブル変換カルマンフィルタ(LETKF)が,非線形性が強い場合に摂動観測法によるアンサンブルカルマンフィルタ(Stochastic EnKF)より解析精度が劣る理由を,理論的な考察によって明らかにした.そして両者を組み合わせたhybrid EnKFを提案し,Lorenz 96 モデルによるデータ同化実験によって,観測演算子が強い非線形性を持つ場合の高頻度データ同化においては,hybrid EnKFがどちらのEnKFより高い解析精度を持つことを示した.この結果を査読付き論文として発表した.
ただし,hybrid の割合を決めるパラメータと解析誤差分散の大きさを調節するパラメータの値を,経験的に決めなければならないという問題点があった.そこでLETKFやStochastic EnKFにガウス摂動を追加し、これによって解析精度の低下を緩和するとともに、その大きさを情報理論に基づいて自動的に設定する手法を開発した.具体的には,解析過程において観測データが持つ情報量(相互情報量)が観測過程における相互情報量と等しくなるように設定するものである。さらに上記の研究成果から,LETKFやStochastic EnKFの解析アンサンブルは互いに無相関のモードに分解できることがわかっているので,主要モードの予報アンサンブルや解析アンサンブルの情報エントロピーを最大エントロピー法によって推定することにした.これらを実装してLorenz 63 モデルによるデータ同化実験を行い、有望な結果が得られた。
つぎに、従来のアンサンブル感度解析における原価を突破する新たな解析手法を開発した。まず、既存手法では十分に検討されていない豪雨の時間変化の要因を解析するため、アンサンブル特異値解析を4次元に拡張した。気象モデルは要素が多く、相互作用も複雑であるため、大気の非線形性を簡略に表現できるLorenzモデルを用い、「4次元一般化アンサンブル特異値」解析手法を構築した。この手法を用いて時間方向の状態場も解析対象とすることで、時間的変化を大きくもたらす小さな初期誤差を特定できることを確認した。さらにこの手法を一般化する定式化を行った。これにより、4次元データ空間内で関心のあるターゲットを柔軟に設定でき、現象の要因解析や感度解析をより自在に行うことが可能となった。

025RP2024 野津 了(広島大学)
魚類のゲノム編集育種を加速するためのオーソログ情報の整備

本研究は水産有用魚種におけるゲノム編集の実践化に資するオーソログ情報の整備を目的としており、特にシンテニー情報を取り入れたオーソログ推定により重複遺伝子や遺伝子の欠失情報を考慮したより頑健な情報の整備を目指している。本年度はオーソログ推定のパイプライン化を進めるにあたり、大規模な遺伝子配列セットに対しての網羅的なオーソログ推定を検証した。まず、メダカとトラフグの全コーディング遺伝子を対象にオーソログ推定を実施した。推定には各遺伝子の最も長いペプチド配列を代表として選抜したプロテオーム配列セットを用いた。メダカおよびトラフグの配列セットはそれぞれ22059本、22062本であった。各魚種の配列セットに対して配列類似性検索を実行し、得られたビットスコアを用いて各配列の検索結果(組み合わせ)においてCスコアを計算した[Cスコア=スコア(A, B)/max(スコア(A,), スコア(,B))]。今回の検証ではCスコア>= 0.9 の条件を満たすアンカーを用いてシンテニーブロックを構築した。両種間におけるシンテニー推定では18400本のアンカーにより、543個のシンテニーブロックが構築された。18400本のアンカーのうち、17143本が配列類似性検索における相互ベストヒット(RBH)に由来していた。RBHに由来しないアンカーのうち、172の組み合わせはNCBI Orthologsにおいてオーソログとして登録されていることを確認した。すなわち、残りのアンカーに関しては新規のオーソログ情報になると期待される。また、Cスコアの条件は満たしたものの、シンテニーブロックには組み込まれなかったアンカーのうち、264の組み合わせはオーソログの登録を確認した。さらに、配列類似性検索ではヒットが得られなかったメダカの882配列のうち、26配列はトラフグとのオーソログ関係が登録されていた。これらの結果から、データベースに登録されているオーソログ情報は、配列類似性、ゲノム位置、系統情報などの根拠に基づき、その根拠の種類や裏付けの程度に差がある可能性が示唆される。したがって、整備した情報を提供する際には、各オーソログの推定根拠を明示することも重要だと考えられる。次年度はオーソログ推定結果の表示方法を検討するとともに対象魚種の拡大を進め、整備したオーソログ情報の公開へ繋げる。

026RP2024 賀茂 道子(名古屋大学)
「日本人の国民性調査」にみるジェンダー平等意識の定着とその促進要因

本年度は、引き続き、「日本人の国民性調査」における、保守的な意識を問う項目と「ジェンダー平等」意識を問う項目の関連性を中心に分析を行った。その結果、岩盤保守層と言われる、「#3.9首相の伊勢参り」、「#9.6日本人と西洋人の優劣」、「#7.4個人の幸福」の項目すべての回答で保守的傾向を示す層と、「#6.5男女の能力差」において「差あり」と答える層の関連性がみられた。
次に、全国で最もジェンダー平等意識が高いとされている沖縄に着目した。(『日本人の県民性 : NHK全国県民意識調査』NHK放送出版協会、1979年など)その要因として日本本土とは異なる歴史的背景が関係しているのではないかとの仮説を立てた。
「日本人の国民性調査」における沖縄のサンプルサイズは小さく、統計学的に差が確認できるデータはなかったものの、傾向として、2013年までは沖縄は日本全国平均よりも「男女の能力差」で「差あり」と答える比率が低くなっていた。一方で「#4.10他人の子供を養子にするか」では、全国平均よりも「養子にする」傾向が高かった。
現地で聞き取り調査をしたところ、沖縄は門中という親戚間の結びつきは強いが、それは家父長制とは異なるものであること、また女性が中心となって実行する祭りなど、古来より、社会において女性の指導的役割が確立されていることが分かった。加えて、沖縄は地上戦による男性労働力人口減少により、女性が社会で重責を担わざるを得ない面もある。共働き率、女性社長率も高い。これらが、沖縄のジェンダー平等意識につながっているのではないかと考えられる。可能であれば、この後オリジナル調査を実施して検証を行いたい。
本共同研究を通して、保守的傾向とジェンダー平等意識の関連性だけでなく、女性の方が保守的であり、かつ女性の保守的傾向とジェンダー平等意識が男性以上に結び付いていることが三重クロス表(性×保守意識項目×ジェンダー平等項目)の確認で明らかになった明らかになった。歴史的な背景に目を転じれば、占領期にGHQが女性解放と女性教育に力を入れた理由に、社会の半数を占める女性は男性よりも保守的傾向が強く、それが子どもを通して再生産されるとのGHQによる見立てがあった。こうした占領政策推進の前提条件が、統計的に有意な数値で実証できたことは大きな成果である。今後は、歴史的背景を史料で補完しつつ、データ分析において精査を加えたうえで、論文化を考えている。

027RP2024 藤井 陽介(気象庁気象研究所)
海洋データシステムにおけるアルゴフロート観測データやその誤差の インパクト評価に関する研究(3)

海洋データ同化システムとは、データ同化手法により海洋数値モデルに観測データを融合させ海洋の状態を推定するシステムであり、海洋予測や季節予報において数値モデルに与える海洋の初期状態を作成するのに利用される。そして、海洋データ同化システムで利用される最も重要なデータの一つがアルゴフロートによる観測データである。アルゴフロートは全球の海洋に展開されており、10日毎の水温・塩分鉛直プロファイルを自動で観測している。観測されたデータは衛星を通じてフロートを管理する機関に通報され、厳重な品質管理を受ける。しかし、2015-2021年に製造されたフロートの15%程度が投入から1、2年後に故障し、高塩の系統誤差を生じていると報告されている。
本研究では上記問題の影響を受けたデータの除外など品質管理のレベルが異なったデータセットを用いた同化実験を、気象研究所、ヨーロッパ中期予報センター(ECMWF)などで実施した。その結果を解析したところ、より高い品質管理レベルの観測データセットを用いることにより、高塩分化トレンドが緩和され、衛星による海面高度観測データともより整合的になることを確認した。この結果についてまとめた論文を本年8月に学術誌Frontiers in Marine Science投稿し、12月に受理された(Ishikawa et al. 2024)。
また、本研究では、国連海洋科学の10年プロジェクトsynergistic Observing Network for Ocean Prediction (SynObs)の枠組みで実施された複数の海洋予測システムを用いた海洋観測インパクト実験の結果を用いて、アルゴフロート観測データのインパクト解析を行った。その結果、衛星の海面高度データに加えアルゴデータを同化することにより、海面高度の精度がさらに改善することを確認した。この結果についてまとめた論文についてもFrontiers in Marine Scienceに本年6月に投稿し10月に受理された(Fujii et al. 2024)。また、本研究については10月に開催された第10回国際データ同化ワークショップ、および、11月に開催された国際シンポジウムOceanPredict’24でそれぞれ発表した。

028RP2024 高槻 泰郎(神戸大学)
気候が社会・経済に与える影響の解析―近世日本の日射量と物価変動―

 本研究の目的は、人文学オープンデータ共同利用センターの市野美夏氏が、立正大学の増田耕一氏らと共に復元を進めている近世日本における日射量のデータと、申請者が髙橋秀徳氏と共に復元を進めている江戸時代の物価データとを突合し、日射量が日本の江戸時代における社会・経済に与えた影響を解析することにある。研究目的を達成するための具体的な研究計画・方法については主に以下の流れに沿って計画を立てた。
2024年度
(1) 物価データの拡充
国文学研究資料館所蔵「近江国蒲生郡鏡村玉尾家文書」所収の「万相場日記」「大坂相場帳」などより、米・肥料・穀物(小麦・大麦・大豆など)・衣料品原材料の価格などを復元する。また、各地の作柄に関する情報も抽出する。
(2) 気象データと物価データの突合作業
既に1830年代については、この作業を進めており、国際誌への論文も投稿済みであるが、この作業を他の年度に拡張し、かつ米以外の穀物についても分析の範囲を広げていくことがここでの主たる作業となる。
(1)について、国文学研究資料館での調査を計3回(延べ6日間)にわたって行い、これまで空白となっていた1830年代における大坂の日次米価が記された「大坂相場帳」の撮影が進んだ。非常に強い癖のある墨書であり、かつ、ほぼ完全に日次のレコードであるため、デジタルデータ化は途中までしか進まなかったが、2025年度にこれを実施することで、古気候データとの照合を高解像度で行うことを可能にするデータの基盤が獲得できる。
(2)については、受入教員の市野美夏氏、共同研究者の増田耕一氏らと共に国内外での研究発表、論文投稿を進め、Scientific Report誌への投稿を行い、審査を待っている状況にある。2025年度には、(1)で復元された米価データを使って、1830年代以外の年代についても分析を拡張していく予定である。

029RP2024 山口 敦子(東京都市大学)
知識グラフと文献情報を融合した,希少疾患における生成AI出力の事実チェックシステムの構築

PubMedから希少疾患の論文を収集する方法を検討し,2023年度のPubMedに含まれる全論文で,その手法を試した.具体的には,その論文につけられているMeSH terms および,アノテーションツールを用いてつけた病名のアノテーションを用い,希少疾患の論文であるかどうかを判定することとした.さらに,希少疾患の論文であると判定された論文群について,情報を集約し,それをJSON形式で保持する手法および検索手法を提案した.この結果については,国際会議論文にまとめ,現在投稿中である.
さらに,それらを大規模言語モデルで利用するための手法を検討し,その一つについて,プロトタイプとして実装を行なった.しかしながら,2023年度の希少疾患の論文のうち,100万件を選んで試したが,時間がかかりすぎ,とても希少疾患全論文に試せる速度でないことがわかった.大規模言語モデルに巨大なデータをどう組み込んでいくかは今後の課題である.

030RP2024 栂 浩平(広島大学)
セイヨウミツバチのデータ駆動的研究に資するリファレンス遺伝子データセットの作成

背景:セイヨウミツバチは送粉者として1,000億円の価値を持つ農業昆虫であり,高度な社会性(カースト分化)を示す昆虫である.女王バチは長寿な動物としても有名で,産業および学術的な重要性から多くの公共トランスクリプトームデータが存在する.しかし,ミツバチ研究コミュニティでは,公共遺伝子発現データを大規模に活用してセイヨウミツバチの生命現象を包括的に理解しようとする研究はほとんど行われていない.これはデータ駆動型研究の視点やスキルを持つ研究者が少ないためである.
研究目的:本研究では様々な発生段階・組織に由来する公共RNA-Seqデータを利用して,セイヨウミツバチのリファレンスとなる遺伝子発現データセットを作成する.加えて,他の幅広い生物種とのオーソロジー関係も整理することで,遺伝子配列における他種との共通性や相違を発見できるようにする.本年度は以下の項目を実施した:
選定したデータセットの有用性を発現比較解析によって示す.
モデル昆虫やヒト,長寿動物とのオーソロジー関係を明らかにする最適な手法を検討する.
結果:女王の卵巣発達に関連する遺伝子としてvitellogenin(vg)遺伝子に注目した.これまでに精査してきたRNA-Seqのデータセットに対してiDEPによる共発現解析(WGCNA)を行い,vgと共変動する遺伝子を探索した.その結果,vgと共発現する220個の転写産物を検出した.それら遺伝子の文献調査を行うとキイロショウジョウバエや線虫で寿命に関わることが知られる遺伝子が5個含まれていた(Klf15,AGO2,Desat1,Mhc,yellow-c).これらの遺伝子がvgと共発現することで,産卵と寿命の両方を制御している可能性が示唆された.
さらに220の転写産物のリストを特徴づけるためにMetascapeによるエンリッチメント解析を行ったところ,モノカルボン酸の代謝プロセスに関与する遺伝子群が有意に多く含まれていることが判明した.この結果から,脂質代謝が女王バチの長寿と産卵能力に重要な役割を担っている可能性が考えられる.
今後の展望:遺伝子配列を他の長寿動物を含む動物と比較することで,長寿と産卵の両者の能力を向上させる分子メカニズムをより詳細に明らかにできると期待される.

031RP2024 池原 実(高知大学)
南極コアのデジタル化とデータベース構築:AI深層学習による自動岩相解析への布石

本研究の主要な目的は、南極海などで得られた堆積物コアの各種デジタルデータの取得とそれらのデータベース化、および、その公開システムを構築することである。そのため、以下の項目を実施し成果を得た。
南極海の堆積物コアの基礎情報(採取位置、水深など)、および、すでに取得済みのデジタルデータ(コア断面イメージ、X線CTイメージ、帯磁率データ、地球化学連続データ等)を集約した。情報をまとめた堆積物コアは、高知大学で保管されている南極海のコア(リュツォホルム湾、トッテン氷河沖含む)、南極観測事業で取得された南極湖沼コアなどであり、50地点を超える。
集約したコア地点情報はADSに登録することでコア採取地点と基礎情報を可視化(コミュニティ公開)する方針とした。そのため、集約したコアの地点を示すマップ、コア断面のデジタルイメージ、X線CTイメージを閲覧できるポータルサイト(ウェブ公開システム)を試作した。
南極観測で採取した湖沼コアの非破壊計測とサンプリング作業を高知大学で実施し、新たにコアのデジタルデータを取得した。
2025年2月20日に「南極堆積物コアのデジタル化とAI解析に関するワークショップ」と題する研究集会を高知大学海洋コア国際研究所にてハイブリッド形式で開催し、9件の話題提供と議論により、本研究に関連する情報収集と進捗状況の確認を行った。参加者は約40人(現地参加約20人、オンライン参加約20人)であり、うち35才以下の若手が15人を占めた。
2025年3月11-12日にハイブリッド形式で行われた極域データサイエンスに関する研究集会 IIIにて、本課題の進捗状況について報告した。
 

032RP2024 門叶 冬樹(山形大学)
新たなアプローチによる宇宙線生成核種のデータセット構築とデータ解析

本研究は、地球に入射してくる高エネルギーの宇宙線が地球大気と衝突して生成する宇宙線生成核種Be-7の長期連続観測データの整備によりデータセット化を進めてデータ解析環境を整え、太陽活動による変動について調べることを目的としている。宇宙線生成核種Be-7は主に大気上層の圏界面で生成されエアゾルに付着して地表に降下して来る。観測は地表にエアーサンプラーを設置して大気を吸引して大気中浮遊塵をろ紙に日単位で捕集し、ろ紙サンプルをゲルマニウムガンマ線検出器により核種分析しBe-7の放射能を測定してデータとしている。従って、データセットは地表空気の単位体積(m3)当たりの放射能(mBq)濃度についての時系列データである。本年度は以下のように研究を進めた。

1.連続観測の体制整備とデータセットの更新蓄積:
図1(下段)は、2003年から現在まで約21年間アイスランドで連続収集したサンプルの分析データセット(総数2286)であり太陽黒点数の推移(上段)とともに示している。収集サイトの事故(2020年10月から2022年9月)とエアーサンプラー故障(2023年2月から9月)によるデータ欠損はあるが、2023年10月より科研費国際研究B(代表 門倉昭)の協力のもとに新たな同型エアーサンプラーを設置してサンプリング収集を再開した。現在まで順調に連続観測データが得られておりデータセットの更新蓄積が進んでいる。

図1.アイスランドにおける21年間のBe-7濃度変動(下段)と太陽黒点数の推移(上段)

2.アイスランド観測データの再解析データセットの作成:
データセットとしてデータベース化するにあたり、保存していた2013年までの約10年分(1434個)元データファイルについて2014年以降のデータファイルと同一データ分析を行い約21年間の計数誤差付きのデータセットを作成した(図2)。10年間の元データと再解析データのピアソンの相関係数は、0.966であり再解析データセットは元データを再現していることを確かめた。

図2. 再解析アイスランド観測データセット

3.今後の研究
再解析データセットによる時系列解析手法の開発およびデータベースの管理・公開について検討を進める。

034RP2024 大久保 慎人(高知大学)
超精密観測時系列記録から有意な信号抽出のための解析技術の確立と活用

本課題の前身である,「微小な地殻ひずみ信号検出のための解析技術の確立と超精密観測記録の活用(2021年度課題:015RP2021, 2022年度課題:018RP2022, 2023年度課題:015RP2023)」で得られた知見の研究内容の取りまとめを行なった.これまで,経験的モード分解法(EMD, Empirical Mode Decomposition)およびアンサンブル経験的モード分解法(ensemble Emprical mode decomposition; ノイズを付加したアンサンブル平均処理により小振幅の信号抽出を改善した手法)を用い,様々な地殻活動観測機器(ひずみ計)による微小な地殻ひずみ連続観測記録や超伝導重力計による重力の時間変動記録から有意な信号の分解を進めてきた.例えば,地震動帯域の変動と潮汐変動とが,非対称な振幅や振幅が飽和したデータ時系列であっても,ある程度の信号分離ができることを示した.地震のような過渡的変動を含む記録では,複数の固有モード関数間への信号の染み出しとその際に生じるメキシカンハットウェーブレット状の偽像が生じるが,逆に瞬時的に振幅・周波数が変動するこの偽像を,Hilbert変換を用いて変動開始時間の決定に利用する手法への応用も示した.これらの(E)EMDの得手不得手を整理した上で,多数の現象が同等の振幅・周波数帯域で重畳している記録から興味のある個々の現象のみを抽出する,信号分離の処理ストラテジとして,信号処理関連学会のジャーナルへの論文投稿を準備した.研究経費として,論文の雑誌掲載料を挙げていたが,出版までは至らなかった.
また,これまでEMDを行う際のエンベロープ推定に利用してきたCubic-spline補完を,Akima spline補完に変更することで,メキシカンハットウェーブレット状の偽像の発生を抑えることが可能であることがわかった.上記Hilbert変換を用いた変動開始時間の決定に対して,どのような影響があるかを引き続き検討することとした.
さらに,本課題で開発した手法を共同研究者が携わっている連続観測記録のルーティン解析に取り入れるため,システムとしての実装試験を行い,試験運用も始めた.

035RP2024 久保田 好美(国立科学博物館)
後期更新世における全球表層水温データベースの構築と水温変動の要因解明

後期更新世は、氷期・間氷期に特徴づけられる時代であり、こうした大規模な全球変動に伴う水温変動の俯瞰的な解析は、海洋の長期変動の理解につながるとともに、気候モデルの評価に必須である。そこで本研究では,プロキシ(間接指標)データのより深い理解を目指し,これまでに公表された後期更新世(過去40万年間)の表層水温データを統合し、気候モデル等での比較が容易なデータベースを構築することに加え、水温の長期的な変動要因について明らかにすることを目的とする。プロキシデータは同じ海域で得られたデータであっても、プロキシ(有孔虫や円石藻)の違いによって水温の変動幅や位相が異なることが知られている。2024年度は、観測水温データと直接比較できる堆積物の最表層部であるコアトップ(=堆積物の最も新しい時代)のプロキシデータについて、さらに解析を進めるため、計716地点の観測水温を集積し,有孔虫Mg/Caデータとの比較を行った。有孔虫のMg/Caデータは、表層に生息し、かつ古水温復元でも多用される、Globigerinodes ruber (293点),Trilobatus sacculifer(183点),Globigerina bulloides (120点),Neogloboquadrina pachyderma (120点)の4種を用いた。水温の観測データとして、月毎のデータから、年平均,季節平均(ある一定の水温以上,あるいは以下を平均)(先行研究で実施),水温の年間標準偏差,最大値,最小値の要素を計算し、有孔虫のMg/Caデータから飼育実験で求められた水温換算式で導かれる値(プロキシの理論値)とどの程度一致しているかを検討した。
 観測水温の年間標準偏差,最大値,最小値については、プロキシの理論値との有意な相関が得られなかった。一方、観測水温の年平均,季節平均については、高い相関が得られた(季節平均水温で、種によりr=0.71~r=0.93)。緯度方向や、経度方向に傾向があるかどうかを検討するため、観測水温の季節平均とプロキシの理論値の差について、地理的な分布を調べた。その結果、寒冷な海域を好むG. bulloides とN. pachydermaについては、中緯度から高緯度にかけて、系統的なずれが確認され,補正が可能であることが示された。一方、温暖な海域を好むG.ruber と、T. sacculiferについては、系統的な差は確認されたなかったが、海域ごとにパターンがあることがわかった。今後は、さらに、観測水温,塩分,pHを変化させて,最も相関の高い季節(季節平均),深度、地理的にパターンが異なる原因等を明らかにする統計手法を検討する予定である。

036RP2024 邵 帥(法政大学)
19世紀以降の気象変化に対する日本古民家の適応史

今年度の研究成果の3点を以下のとおりまとめる。
①古民家の立地選択に関する資料の充実
②GISの活用による水系環境に関する統計と分析
③主成分分析を通じて立地と気候・環境の相関関係の検証

本研究では、高知県(高知市、安芸郡、香美市、室戸市吉良川町)および徳島県(美馬市、名西郡、鳴門市、徳島市)において現地調査を実施し、文献のみで捉えきれない民家の劣化状況、周辺地形との関係、気候環境に応じた実態を記録した。一次資料としての精度と信頼性を向上させるとともに、市立、県立図書館所蔵の報告書や地誌を通じて、地域の生業(藍の栽培・加工)が古民家の立地選択に与えていた影響についても具体的に検討した。

次に、昨年度に実施した標高・傾斜角・傾斜方向の地理情報に基づく分析を踏まえ、今年度は水系環境に注目し、古民家から河川および海岸線までの距離に関する統計処理と可視化を行った。徳島県内では、大半の古民家が河川から300m以内に位置しており、水資源へのアクセスの便利さが立地選定における要因であったことが示唆される。一方、海岸線から500m以内に位置する古民家はわずか1割にも満たなく、津波や台風による強風などの自然災害への対策として、沿岸から距離を取る選択がなされていたことが推察される。

加えて、古民家の立地選定を左右する特性の強弱・程度を把握するため、主成分分析を実施し、自然環境および気象条件に基づく9つの影響要因から主要要因をさらに抽出した。その結果、「標高」と「降水量」が最も強い影響を持ち、「河川からの距離」と「傾斜方向」がそれに続く主要要因として特定された。一方、「海岸からの距離」の影響は比較的小さいものの、考慮すべき要因の一つであることも明らかになった。これにより、伝統的建築が自然環境・気候条件に応じてどのように立地を選択してきたかを、定量的かつ客観的に示すことが可能となった。

以上のように、昨年度の文献収集とデータ整備の成果を基盤としつつ、今年度は現地調査、空間統計、主成分分析を組み合わせることで、古民家の環境適応性に関する理解を一層深めることができた。また、建築・気象・地理空間の各分野を横断する本研究の手法は、住環境研究における新たな定量的アプローチを提示するものであり、今後の気候変動下における住環境の再考に資する知見を提供するものと期待される。

037RP2024 マルコフ コンスタンティン(会津大学)
深層学習を用いたデータ同化による熱中症リスクの分析と予測

本研究は2023年のプロジェクトを発展させ、PM2.5などの環境汚染要因の予測と分析の範囲を拡大します。PM2.5は人間の健康に直接的な影響を及ぼすため、近年の研究は主に、深層学習やAI技術を活用し、精度、効率性、および適応性の向上を目指しています。
主要なモデリング手法では、LSTMアーキテクチャとグラフニューラルネットワーク(GNN)または畳み込みニューラルネットワーク(CNN)を組み合わせるケースが一般的です。また、一部の研究では、予測精度を向上させるため、気象データ、地上観測データ、衛星画像を統合しています。しかし、現在の主流のモデル学習の枠組みは、依然として従来の教師あり学習に基づいています。
近年、基盤モデルとしての大規模言語モデル(LLM)の台頭により、ゼロショット学習や少量のデータでファインチューニングを行うアプローチが注目されています。この流れの中で、時系列データに対する大規模な事前学習モデルも登場しています。その代表例のひとつが、大規模な交通データセットで学習された OpenCity モデルです。このモデルは、標準的なLSTMベースのモデルよりも優れた性能を示し、さらにゼロショット環境でも競争力のある精度を達成しています。
この交通予測の成功に着目し、我々はドメイン適応とファインチューニングを用いて、PM2.5予測向けにモデルを調整しました。この手法では、モデルのバックボーン部分を凍結し、出力レイヤーと埋め込みパラメータを学習することで、交通データとPM2.5観測データの分布の違いを補正しました。
予備実験の結果、OpenCity モデルは適応やファインチューニングなしでも MAE(平均絶対誤差)4.3 の精度で 東京圏の複数地点 におけるPM2.5濃度を予測可能であることが確認されました。さらにファインチューニングを施した場合、この誤差は 2.8 まで低減しました。
2025年に予定されている最終研究では、この有望なアプローチをさらに詳しく検討し、環境科学における基盤モデルの可能性を切り拓くことを目指します。

038RP2024 吉見 憲二(成蹊大学)
人文社会科学系学生のためのデータサイエンス教育スキームに関する研究

データサイエンスには広範な専門知識が不可欠であり、リテラシーレベルのデータサイエンス教育において、学生がこれらの技術を実践的に習得する機会が限られ、応用・エキスパートレベルへの教育展開の妨げとなっている。2024年度の研究では、人文社会科学系の学生が機械学習のモデルや分析結果をより深く理解し解釈できるよう、社会調査データを活用したデータサイエンス教材を新たに開発した。社会データ構造化センターが公開している「環太平洋価値観国際比較調査」データを用い、機械学習による分類モデルを構築し、日本とアメリカの国民性の差異に影響を与える要因を検証した。この分析の過程を教材化し、人文・社会系学生向け教材としての課題を検証するため、学生(経営学部5名、社会学部5名)を対象とした教材評価を目的としたセミナーを開催した。併せて、セミナーでは東京大学が公開している「リテラシーレベルモデルカリキュラム対応教材」を題材にフォーカスグループインタビューを行った。ヒアリングの結果からは、説明の省略に対する不満が指摘された。短時間でソフトウェア導入から結果解釈まで扱ったため、本質的でない部分を省略したことで作業の意味理解が不十分となり、その後の理解に悪影響を与える傾向が見られた。こうした結果は、高校「情報」未履修者など前提知識不足の学習者には、公開教材の充実だけでは不十分であり、前提知識を考慮した準備やサポートが必要であることを示唆している。対策として、汎用的な教材の充実だけでなく、学習前提の異なる複数のタイプの学習者を想定した教材を準備する必要性が明らかとなった。
そこで、本共同研究プロジェクトでは、2025年度の共同研究課題として、学習者のプロファイルを考慮した、前提知識習得のためのカリキュラムと機械学習教材のあり方を検討し、効果的な学習教材の開発に取り組む予定である。
 さらに、本共同研究プロジェクトでは、上述の教材の開発と併せて、公開されているデータセットに関するテキストデータの分析と可視化についても取り組んだ。とくにコロナ禍の期間のデータが公開されたことを受けて、コロナ禍の政策に対する事後評価を多面的に行った。こうしたアプローチは先行研究の事後検証を公開データから行うといった実践的な教材作成にもつながる観点のものと評価することができる。

040RP2024 橋本 真美(地震予知総合研究振興会)
地震計アレイ観測による南極昭和基地周辺の微小地震及び氷震の震源推定

本研究の目的は,南極昭和基地周辺での微小地震・氷震活動を明らかにすることである.2024年度は①震動現象の検出と②震動源の位置推定についてさらに解析を進めた.①震動現象の検出については,ウェーブレット変換を入力データとして機械学習によりイベントを検出することに取り組んでいる.STA/LTAトリガにより切り出された波形に連続ウェーブレット変換を行なって得たスカログラムを入力データとした.Convolutional Autoencoderによって自己教師学習を行い,スカログラム画像の特徴量を抽出したあと,K-Meansによるクラスタリングを実施した.クラスタ数はシルエット分析により21とした.分類されたクラスタの波形とスカログラムをマニュアルでチェックするために.クラスタリング結果から誤ってラベル付けされたと思われるデータを取り除いて純度を高め、正解ラベルを付けて教師データを生成するツールを開発した.今後はラベル付したデータを教師として,あらたにConvolutional Neural Networkを学習し,連続波形データへ適用してイベント検出を試み,②の震動源の推定へとつなげる. ②震動源の位置推定については,一部の観測データに極性の反転が生じていたため補正をして再解析を行った.震源位置推定には地震波の伝播速度が必要であり,波の種類によって違うため,震動の軌跡(particle motion)を描画するツールを開発し波の震動方向を調べた.また,昭和基地とみずほ基地の間で実施された地震波速度構造探査の結果(Ikami and Ito, 1984)をもとに一次元P波速度構造を作成した.オングル島でも同様の探査が実施されているが(Ito and Ikami, 1984)深さまでは議論されておらず前者の速度構造を採用した.Particle motionからP波の可能性が高いと判断したイベントに対しては一次元速度構造に対してray tracingを行い,P波が検出できないイベントについては水平方向のみの伝播を仮定して,尤度関数を用いて尤震源位置を推定した.推定したイベントの位置と発生時期を図に示す. 本研究で開発したツールのソースコードはgit上で管理しており,容易に共有できる状態となっている.また,本研究の成果はJpGU2025に投稿済みでポスター発表を予定している.

041RP2024 寺内 菜々(筑波大学)
褐藻類の走光性・走化性の系統プロファイリングによる複合的走性の制御因子の探索

走光性を示す褐藻配偶子は、空間的に近接した眼点(葉緑体内)および後鞭毛基部側の膨張部(パラフラジェラボディ:PFB)を持つが、走光性を示さない褐藻類では消失している。新奇青色光受容体(ヘルムクローム)は、PFBに局在する。
配偶子が走光性を示す2種(シオミドロ目)、走光性を示さない3種(コンブ目)を用いた系統プロファイル解析では、212遺伝子(オルソグループ)が候補として抽出された。その中で、新奇Ca2+結合タンパク質(CABAF1)が前鞭毛の軸糸に局在し、前鞭毛の運動を制御する可能性があることを学術論文として発表した。次に、新たに公開された多数の褐藻類のゲノム情報の導入を試みたが、1) 走光性の有無が不明な生物種が含まれる点、2) アノテーション情報の品質が疑われる場合がある点などの問題が生じた。そこで代替策として、離散値系統プロファイル解析で使用する生物種の系統を修正した(dataset1)。すなわち、走光性を示す生物種では、約1億年前にシオミドロ目・コンブ目を含むクレードと分岐したヒバマタ目1種(Fucus distichus)を追加した。走光性を示さない生物種では、褐藻類で祖先的なアミジグサ目1種(Dictyota dichotoma、約1億8千万年前に分岐)を追加した。その結果、80遺伝子(オルソグループ)が候補として検出された。さらに褐藻配偶子のトランスクリプトームデータを導入した結果、走光性を示すムチモ(チロプテリス目)、Hormosira(ヒバマタ目)の配偶子で発現している20遺伝子(オルソグループ)まで絞り込むことに成功した(グループ1)。グループ1には、ヘルムクローム、CABAF1が含まれていた。グループ1内で選定した4個の遺伝子について抗体を作製して細胞内局在を検証した結果、遺伝子XがPFBに局在することが示された。双方向ベストヒットに基づくオーソログ解析では、dataset1に含まれる生物種以外の走光性を示す大部分の褐藻類(8種)においても遺伝子Xのオーソログが存在するが、走光性を示さない褐藻類(4種)では遺伝子Xが消失していることが示唆された。以上から、CABAF1・遺伝子Xは、ヘルムクロームと協調して働く走光性関連遺伝子である可能性が考えられた。
今後は、CABAF1および遺伝子Xについて、褐藻シオミドロを用いてゲノム編集により走光性への影響を検証する。また、褐藻類における遺伝子Xの分子進化過程を解明する。さらに系統プロファイル法の手法の改善を検討し、新たな走光性関連遺伝子を検出することを目指す。

042RP2024 宮川 創(筑波大学)
日琉諸語の言語類型アトラスLAJaRの開発と分析

 昨年度までに、数十地点の文法データを収集した。しかし、その精査、利用可能なデータセットとしての整備、データセットの利用可能性の例示が未完了であった。以上を踏まえた上での当課題の本年度の成果は、大別して(1)入力済みデータの精査、(2)データセットの公開、(3)デモサイトの公開の三点に集約できる。
 (1) 入力済みデータの精査:昨年度までおよび今年度に数十地点の文法データを入力したが、一部の作業者のデータに誤りが多発していることが発覚した。データの質を公開に耐えうるべく向上させるため、データの精査を行い、入力済みの値を修正した。
 (2) データセットの公開:入力したデータにメタデータを付し、GitHubにおいてcsv形式で公開した。当初の予定通りCC-BY international 4.0 のライセンスで公開したため、データの転用が容易である。メタデータには、作業者、各言語の概要、各地点の座標、各値の参照文献を記載し、利用者がデータ原典の参照を容易に行えるようにした。
 (3) デモサイトの公開:(2)で述べたデータセットは機械可読ではあるが人間にとって全体像が把握できないため、データの規模や質を可視化するためのデモサイトを公開した。このデモサイトでは、文法項目を選択して、各地点にどのような値が分布しているかを地図上に散布されたアイコンで確認することができる。

以上に述べたとおり、本課題では、日琉諸語を対象とした初めての文法データセットを公開することができた。また、その利用方法についてもデモを行った。

今後の課題としては、まず、本年度までにデータセット自体の作成を完了したが、このデータセットを利用したデータ駆動型の研究を行えなかったことが挙げられる。また、文法記述が豊富な一部地域(九州、沖縄、関東)に地点が集中してしまい、北陸、中国、四国などのデータが欠落していることも課題である。

043RP2024 伊藤 伸介(中央大学)
公的統計におけるリンケージデータの利用可能性と秘匿措置に関する研究

本研究は、大規模データのさらなる利活用の可能性を追究することによって、わが国における大規模データの利活用に関する展開方向を模索することを目的としている。そのため、本研究では、大規模データの秘密保護に対する法的・制度的措置あるいは技術的措置について国際比較を試みるだけでなく、利用可能なわが国の公的統計のミクロデータを主な対象として、ミクロデータに対する秘匿措置の方向性を探究することを指向している。
 2024年度については、研究代表者の伊藤が、共著論文「事業所・企業系の公的統計を対象にした合成データの生成技法に関する検討—経済センサスを例として—」を刊行した。わが国の事業所・企業系の統計調査においては、事業所や企業を対象にした匿名データが現在作成されていないだけでなく、事業所・企業系の統計調査の場合、一般公開型ミクロデータの作成が困難である。そのため、合成データが作成可能であれば、テストデータ等へのニーズに応えることが可能になることから、本稿では、経済センサス活動調査の個票データをもとに、攪乱的手法であるミクロアグリゲーションのMDAV(=Maximum Distance to Average Vector)法,CART(=Classification And Regression Tree),さらには深層学習モデルの1つであるCTGAN(=Conditional Tabular GAN)も用いて生成された合成データの有用性および秘匿性について定量的な評価を行い、各種の合成データの生成技法の可能性を検討した。
さらに、研究代表者の伊藤は、共著論文「差分プライベートな国勢調査データの有用性に関する定量的な評価研究」も刊行した。アメリカセンサス局は、公表された人口センサスに対する「データベース再構築攻撃」に伴う個体情報の特定化のリスクへの対策として、2020年人口センサスにおいて、Top downアルゴリズムによる差分プライバシーの方法論を適用した統計表を公表しただけでなく、2020年センサスの一般公開型ミクロデータの公開においても、差分プライバシーを採用している。こうした状況を踏まえ、わが国の国勢調査でも差分プライバシーの方法論の適用可能性を追究するために、本稿では、令和2年国勢調査の個票データを用いて作成した集計表をもとに、各種の差分プライバシーの実現手法を適用した場合の有用性を定量的に評価した。
こうした公的統計データの秘匿措置や合成データ作成に関する海外の動向を踏まえつつ、わが国の公的統計における秘匿措置の適用可能性を追究することは、わが国における公的統計を対象にした統計表の公表やミクロデータの作成・提供を議論する上で有意義であると考えられる。

044RP2024 岩田 直也(名古屋大学)
西洋古典学のためのAI駆動型テクスト解析とデータベース拡張技術の研究

本共同研究では、2024年8月に西洋古典に特化したAI対話システム「ヒューマニテクスト」(Humanitext Antiqua)の一般公開を実現し、当初は22名の著者・約400作品のデータのみであったが、現在では約100名の著者・1000作品に拡大している。これにより、大規模言語モデル(LLM)の技術を活用したRetrieval Augmented-Generation(RAG)の枠組みで、多様な西洋古典文献との高度な連携が可能になった。本研究は、このデータベース拡張に寄与するとともに、それぞれの著者に専門研究上の適切なジャンルを割り振り、著者名や作品名に不慣れな利用者でも、興味・関心に合った作品へ効率的に辿り着ける検索環境を整備した点に特色がある。さらに、メタデータフィルターの機能強化により、ジャンルや著者、作品の除外設定も可能となり、一層精緻な検索操作を実現している。
とりわけ強調すべきは、いわゆる「コンテクスト指向翻訳」の方法論を開発し、従来の翻訳依存型検索を超えて、より正確かつ広範な文脈探索を実現したことである。従来の専門家訳をそのままベクトル化するアプローチでは解決が難しかった曖昧語の取り扱いや、複数作品にまたがる概念の正確な抽出に効果を発揮している。本研究において提示した新手法は、論文として別途報告しているとおり、実験評価において高い精度を示した。
加えて、ヒューマニテクストの基盤となるLLMも頻繁にアップデートしてきた。現時点では「google/gemini-2.5-pro-preview-03-25」を選択的に用いており、これらのモデル更新が総合的な精度向上に寄与している。しかしながら、今後はローカルLLMのファインチューニングを進めることによる独自展開と安定運用が課題となる。また、倫理面の検討は十分とはいえず、今後は教育用途への展開と並行しながら、学術的かつ社会的責任を伴う運用ガイドラインを策定する必要がある。
以上の成果は、単に西洋古典研究分野におけるAI活用を推進するのみならず、人文学全般におけるテクスト解析基盤の高度化に寄与すると考えられる。今後は、より多様な研究者・学習者と連携しながら本システムの応用可能性を拡張し、人文学研究の新たな地平を切り拓くための具体的方策を検討していく予定である。

045RP2024 櫛田 達矢(理化学研究所)
哺乳類表現型語彙の日本語整備とオントロジーアライメントおよびそれを活用したバイオリソース検索システムの構築

哺乳類表現型オントロジーMPの日本語訳の整備と更新
全14,226件のMP語彙に対して日本語訳をつけたMP日本語オントロジーを完成させ,米国ジャクソン研究所のウェブサイトからmp-international.owlとして公開した.またEBIのOntology Lookup Service (OLS)から日本語での階層表示と検索を可能にした.
MPを用いたバイオリソースの表現型アノテーション
MP日本語オントロジーを活用して,理研BRC が保有する6,598件の実験マウスのうち,表現型情報を持つ4,474件に対して,計25,571件のMP語彙のアノテーションを実施した.
MP表現型語彙を用いたバイオリソース検索システムの開発
上記のアノテーションデータをRDF形式で理研BRCのRDFストアに格納し,バイオリソースアドバンスド検索システムにより,日英のMPオントロジー階層を使った実験マウスの絞り込み検索を可能にした.上記1,2,3の成果は,本研究実施報告書の6.研究成果の③学会等への発表の1-2,及び4-7件目に該当する.
整備したMP表現型語彙の評価とフィードバック
MP日本語訳の妥当性を確認した.また英語のみのMPに比べて,表現型アノテーションにおける日本語オントロジーの使いやすさが評価された.さらに上記のバイオリソースアドバンスド検索システムの動作確認,不具合調査,新規の検索機能の検討を行った.
表現型語彙の利活用の検討
マウス以外の哺乳類の実験材料に対して,MP日本語オントロジーを用いた表現型アノテーションの普及とその有効性を示す目的で,ラットalleleに対するMP日本語データの整備と更新及び,これを活用した疾患モデルラットの推定手法を検討した(2025年度第72回日本実験動物学会総会で発表予定).
MPと先天性異常用語集のマッピングデータの作成
日本先天異常学会が作成する日英対訳の実験動物先天異常の用語集とMP間の語彙マッピングを進め,これまでに先天異常用語約480語(全体の約70%)についてマッピングが完了した(2025年度第65回日本先天異常学会学術集会で発表予定).
医科学研究に活用が期待されるバイオリソースの探索手法の検討
外部機関が提供する表現型および疾患オントロジーデータから作成したMPと疾患の関係データと,マウスとMPの関係データを用いて,疾患およびマウスが持つMPの類似度を算出,この類似度に基づく疾患モデルマウス候補の探索を行い,従来の疾患関連遺伝子を用いた手法では発見できなかった209疾患に対する179件の疾患モデルマウスの候補を発見した(研究成果③の3件目に該当).

046RP2024 石井 智士(立教大学)
全天画像から雲の時空間分布を作成するシステムの開発および長期的な雲分布変動の研究

本研究では、空の画像から客観的な指標に基づいて雲を検出し、2次元の雲分布を時系列データとして公開することを目的とする。夜間に取得された画像は日中に比べてコントラストが悪いため、カウント値に閾値を設定して晴れている領域と雲の領域を単純に区別することは困難である。そこで、2024年度は夜間に撮影された画像に写る星像を検出することで、その周辺に雲があるかどうかを判別する手法を確立した。本研究では、南極昭和基地で稼働しているオーロラモニタリング用カラーデジタルカメラで撮影された画像データを用いて雲分布を導出した。南極昭和基地上空ではオーロラが発生し、局所的に空の明るさが変化するため、カウント値のみで星像を検出することが難しい場合がある。本手法では、星像のカウント値だけでなく、星像の幅も判定基準に設けることで、雲による散乱で星像がぼやけ、像が広がった場合には雲があると判定し、オーロラが発生していても雲を検出することを可能にした。ただし、激しく明るいオーロラが発生した場合にはカウント値が飽和してしまい、解析が不可能であった。
これまで雲分布の情報は気象庁により雲量という全天に占める雲の割合として記録されていた。本手法では、画像に写る星像を使用してカメラの光学校正を行うことで、方位角・天頂角において約0.1°の精度で星の位置を推定した。つまり、画像の各画素に対応する方位角・天頂角が分かっているため、どの方位角・天頂角に雲があったかという詳細な空間分布情報を記録することが可能である。
2008~2022年に南極昭和基地のカラーデジタルカメラで取得されたカラー全天画像データを解析し、昭和基地上空における夜間の雲分布を導出した。本手法の雲検出精度を検証するために、星の検出率を雲量に換算した値と気象庁の雲量値とを比較したところ約70%の時間で雲量値の差が2に収まった。導出した雲分布はIUGONETプロジェクトに参加し、2次元の時系列データとしてCDF形式で公開する準備を進めている。
2024年度の成果は、2024年度ROIS-DS-JOINT共同研究集会、極域データに関する研究集会Ⅲ、および第1回【ROIS-DS】研究報告会で報告した。

047RP2024 Thomas AGOTNES(University of Bergen)
Verifiying Anonymity and Pseudonymity

The research was mainly carried out at the Center for Juris-Informatics (CJI) during two periods, one week in October 2024, and one week in February 2025. There were four main collective project group meetings, in addition to several smaller meetings coordinating the collaborative effort:
October 1st, 2024, CIJ. Attendants: Ågotnes, Galimullin, Murakami, Omori, Satoh, Tojo.
October 4th, 2024, CIJ. Attendants: Ågotnes, Galimullin, Murakami, Omori, Satoh, Tojo.
February 17th, 2025, CIJ. Attendants: Ågotnes, Galimullin, Murakami, Omori, Satoh, Tojo.
February 20th, 2025, CIJ. Attendants: Ågotnes, Galimullin, Murakami, Omori, Satoh, Tojo.
Separate individual meetings include: Ågotnes and Satoh (CIJ, several instances), Ågotnes, Satoh and Omori (CIJ, September 30th), Ågotnes and Kawamoto (Zoom, October and April), Ågotnes and Galimullin (Bergen, many instances).

The research has focused on implementing the milestones for the first year set out in the project description:
Identify important privacy-related concepts needed for data-analysis at the Center for Juris-Informatics.
Develop and study formal logical formalizations of pseudonymization and other concepts, based on point 1.
Find axiomatic bases for logics for reasoning about privacy. This opens the door to machine reasoning about privacy.
The key privacy-related concept that was identified was the notion of anonymous public announcements, which occur, e.g., when someone makes an (pseudo-)anonymous post online. Depending on the background knowledge of other agents, such a pseudo-anonymous announcement might actually not be anonymous. Furthermore, we show that intentionally anonymous public announcements, where it is assumed that the announcing agent does not want to reveal his or her identity, can in fact reveal more information – contrary to intuition. The notion of anonymous public announcements has been formalized as a modal logic, and axiomatic bases for resulting logics have been developed and shown to be sound and complete.

The following are concrete outcomes of this research so far, in the relatively short time since the start of the project in the fall of 2024:
The research paper Intentionally Anonymous Public Announcements, by T. Ågotnes, R. Galimullin, K. Satoh and S. Tojo, submitted to the 10th International Conference on Logic, Rationality and Interaction (LORI). If accepted the paper will appear in the conference proceedings published in Springer’s Lecture Notes in Computer Science (LNCS) series. The acceptance notification is expected on May 30th.
The research pre-print Anonymous Public Announcements, by T. Ågotnes, R. Galimullin, K. Satoh and S. Tojo, uploaded to Arxiv. URL/DOI: https://doi.org/10.48550/arXiv.2504.12546 The paper will be submitted to a journal, pending the acceptance decision for the first paper mentioned above.
In addition, several other publications involving also other project members are planned, in particular a survey paper on logic and anonymity.

As far as we know this is the first attempt to formalize the logical underpinnings of anonymous public announcements in the literature, thereby bridging the fields of dynamic epistemic logic on the one hand, and privacy and security on the other. There is a rich potential for further research and transfer of techniques and results in both directions, if the project is allowed to continue.

049RP2024 土肥 栄祐(国立研究開発法人国立精神・神経医療研究センター)
症状・所見に重きをおいた非典型例も含めた徴候データベースの開発と、生成AIを用いた公開・共有可能な症例データベース構築

2024年度、日本の臨床症例報告を対象とした「症状・所見に重きをおいた非典型例も含めた徴候データベースの開発と、生成AIを用いた公開・共有可能な症例データベース構築」の研究に取り組みました。この過程で、臨床医や医学生によるエキスパートチェックにおける非効率性を含めた課題も明らかとなり、効率的な作業体制の為の業務フロー構築と新たなツール開発を行いました。

1: 大規模言語モデル(LLM)を活用した症例報告からのテキスト抽出と構造化プロセスを最適化し、データ処理の労力を削減。
⇨ 約1000件の難病・希少疾患の症例報告のテキストデータの抽出を行った。
2: LLMによる自動アノテーションシステムをプロンプトエンジニアリングとAPIを活用することで開発し、初期のドラフトアノテーションを自動化。
⇨ 現在はLocalで作動するLLMモデルをGPU48Gへ増設した環境にて構築中。
 3: PubAnnotationを用い統一的なアノテーション検証手法により、品質管理プロセスを標準化。
4: TextAEを用いたグラフィカルユーザーインターフェース(GUI)により、アノテーションの追加・削除・修正を直感的に行える操作環境に関し、馴染みのない臨床医・医学生向けの操作マニュアルを作成。

上記に加え、自動アノテーションの際に、同時に抽出される症状・所見に対し、アノテーションチェックを行う際に、そのアノテーションが最適なものか?またアノテーションがなされていないものには、その用語が無いのか?アノテーション機能の不全なのか?の判断が困難という課題が残されていた。通常、臨床テキストへの症状・所見に対しては、HPO(Human Phenotype Ontology)を用いるが、アノテーションチェックに参画する臨床医・医学生は、これに十分慣れていないという課題があった。これに関し、非公開の成果へ続く。

2024年度は、これらを総合して、個々の臨床テキストに対するアノテーション体制に必要な、汎用的なシステム運用とツール開発を達成することができた。品質の高いコーパス作成に加え、これを用いた自動アノテーターの開発、またオントロジーの編集や臨床よりのオントロジー可視化・編集システムの開発へ進む為の準備が整った。

050RP2024 西村 耕司(京都大学)
レーダーインバージョン観測のためのアンテナ空間特性精密推定技術の開発

本研究では,同期・計測機構の設計,数値シミュレーションおよび装置開発を軸に据えて研究を進めました.数値シミュレーションの面では,これまでに得られていた理論的検討をもとに,2次元モデルを用いた電磁界の伝搬およびアンテナ指向性の推定に関する解析を実施しました.特に,近傍界データから遠方界特性を推定する際の精度に対して,観測点間隔や測定高さ(Z方向)の分解能が与える影響を詳細に調査し,1次元スキャンによる推定精度の限界と,必要なZ層数の目安を導出いたしました.この成果は,今後の実験設計において測定点の配置やドローンの飛行経路を最適化するために極めて有用な知見となります.時空間同期機構に関しては,別記致します.
なお,上記一連の成果は,2025年3月に開催された「極域データサイエンスに関する研究集会」において口頭発表を行い,理論検討,数値実験,および実装可能性の各側面について報告を行いました.複数の参加者との活発な意見交換を通じて一定の評価を受けたものと考えております.
本研究は現在も継続中ですが,提案する技術は大気レーダーの領域にとどまらず,電波望遠鏡,衛星通信アンテナ,さらに航空機・宇宙機に搭載されるレーダーなど,長期運用を前提とする多様な電波装置への展開が期待されております.学術的な波及効果に加えて,産業応用においても多くの可能性を有しています.最後に,本共同研究で得られた成果を基盤とし,2025年度より科学研究費補助金(西村耕司代表,基盤A)「航空気象擾乱検出のための干渉計インバージョン型レーダーの開発と実証」が採択されたことを,ここに付記いたします.

051RP2024 齊藤 昭則(京都大学)
南極昭和基地大型大気レーダーによる電離圏沿磁力線不規則構造の観測

南極昭和基地大型大気レーダー (PANSY レーダー) を用いた南極電離圏における沿磁力線不規則構(Field Aligned Irregularity; FAI)の研究を行っている。本研究では、FAI の空間構造を高分解能に推定できるイメージング手法を検討・適用し、FAI の解析を行う。その結果、実データに適用できるレーダーイメージング手法の確立、及び FAI の高分解能な空間構造推定が可能になり、先行研究では明らかにされなかった南極域 FAI の空間的性質の解明が期待される。
2024年度は ①イメージング手法の確立、 ② FAI 観測の実施、及び③ FAI データの解析 を行った。

イメージング手法の確立
 従来用いていた CLEAN 法、マッチング追跡ではビームパターンの影響を十分に抑圧することができなかったため、本年度はイメージング手法として Douglas-Rachford アルゴリズムを採用した。Douglas-Rachford アルゴリズムは交互方向乗数法(Alternating Direction Method of Multipliers; ADMM [Boyd et al. (2011)])の近似形であり、凸最適化問題に対して繰り返し処理を行うことで解を得る。FAI 解析においては、FAI 位置推定という凸最適化問題の局所解、つまり FAI 位置の逐次的な推定を行う。
 上記手法の妥当性評価を行うため、点ターゲットによるシミュレーションを行った。その結果、ビームパターンの影響を抑圧しつつ擬似ターゲットの位置において解を得ることができ、従来手法からの推定精度の向上を確認した。

FAI データの解析
 2021年11月に実施した FAI 観測のデータに対して、上記の Douglas-Rachford アルゴリズムを適用した。その結果、実データに対してもシミュレーション同様に FAI の解を得ることができたものの、時間方向に対して空間的に連続ではなかったため得られた解が妥当であるとは考えにくく、手法のパラメータ見直しが必要と考えられる。

FAI 観測の実施
 2025年2月に FAI 観測を実施した。2025年度にデータ解析を行うべく、データ整理中である。

 上記のとおり、イメージング手法の検討及び実データへの適用を実施することができた。一方で、採用した手法の改善が必要であるため、次年度はその改善と③で実施した観測の実データ適用を行う。また FAI 観測においては、観測精度向上のため、これまで使用している FAI アレイ、流星アレイの他にメインアレイを追加で使用することを検討する。

052RP2024 アントニア カライスル(Waseda University)
Old Problems, New Faces: Modernizing Sangaku for a Contemporary Audience

本研究の主な目的は、CODH-ROISとWIASにそれぞれ所属する二つのプロジェクト、すなわち「れきちず」プロジェクト(CODH-ROIS)と算額アーカイブプロジェクト(WIAS)を統合するためのリソースを作成することでした。具体的には、江戸時代の地図を現代形式で再現したRekichizu上に算額データをマッピングし、新規ユーザーが算額の問題に意味のある形で取り組めるよう補助資料を提供することを目指しました。「れきちず」は当初関東地域のみを対象としていましたが、現在では沖縄と北海道を除く日本全国をカバーするまでに拡大しています。申請時点では関東地域の算額データ(約300件)を展示する計画でしたが、「れきちず」の拡張により、2025年5月初旬の算額アーカイブ初期公開時には全国約500件のリストを表示できるようになりました。
リソース作成に関しては、以下の目的で資金が使用されました:
1. 算額アーカイブのインフラを構築し、個別の算額エントリーへのリンクや画像・メタデータの閲覧を可能にしました。このインフラはIIIFを基盤とし、Canopy IIIFで可視化されています。約500件のリストを含むアーカイブの暫定公開は2025年5月初旬を予定しており、共同研究プロジェクトの資金の一部はアーカイブのデザイン要素の提供に充てられました。
2. 算額データのマッピングは、利用可能なメタデータと画像リソースの照合に依存しています。共同連携資金の一部は、江戸時代の算額旅行日記である『道中日記』のメタデータと画像データを照合するために専門の古文書学者を雇うために使われました。
3. 栃木、群馬、福島、岩手の算額に関する図解や内容、解答を含む書籍を収集し、支援を行いました。
算額アーカイブは画像とメタデータを収蔵しますが、専用の江戸時代地図には算額が奉納された場所にピンが表示されることが決定されました。この地図は算額アーカイブのホームページからリンクされ、「れきちず」地図上のピンの内容はユーザーを算額アーカイブへ誘導します。

インフラ整備に加え、算額の数学問題をより理解しやすくするための補助資料の提供も計画されました。算額は漢文で書かれているため、現代の読者が理解できるように現代日本語への翻刻が必要です。この変換作業は専門的知識を要するため、プロジェクトの主要な費用として見込まれていました。しかし、協力者は報酬を受け取らずに貢献を申し出てくれました。さらに、約50問の既存の解答や書き起こしがオンラインの様々な資料で見つかりました。そのため、これらの資料を内部で新たに作成するのではなく、将来的に可能であれば、算額アーカイブのインフラを調整し、コミュニティが直接貢献できる仕組みを整えることにしました。
これにより、参加は双方向的になります。まず、私的な研究コミュニティが解答を投稿することで算額アーカイブに関わることができ、新規ユーザーはその資料を集めることで算額という現象に意味のある形で関わることが可能になります。

053RP2024 髙橋 彰(大阪大学)
地域まちづくりを次世代に継承するためのコミュニティアーカイブ教育モデルの構築

研究背景と目的
本研究は、地域まちづくりにおける世代間のギャップを埋めるため、デジタル技術を活用した「コミュニティ・アーカイブ教育モデル」の構築を目指している。2024年はその初期段階として、スマートフォンアプリ「メモリーグラフ(メモグラ)」の教育現場での有用性と改善点を明らかにすることを目的とした。
実施概要
飛騨市古川町で「町並み未来編集部」と題したプロジェクトを実施し、メモグラを活用して過去の町並み写真と現在の景観を結びつける取り組みを行った。飛騨市立古川中学校の「マイプロジェクト」として、12名の中学生が参加した。
メモグラは、現在の風景に過去の写真を重ね合わせ、透過率を調整できるカメラアプリである。写真の撮影位置を地図上に登録する機能を持ち、専門家でなくても活用できる点が特長である。
活動プロセスと成果
プロジェクトは4段階で実施した。
第1段階(7月):「挑戦状」と「SOS」という2種類の宿題を提示した。「挑戦状」は撮影位置が判明している過去の写真の現在の場所を特定する課題、「SOS」は位置未特定の写真を調査する課題である。この過程で地域住民との対話が生まれた。
第2段階(9月):写真と同じアングルからの撮影枚数を競うゲーム形式のワークショップを実施し、中学生の町並み景観への関心を高めた。
第3段階(11月):中学生が考案したテーマに基づき、写真撮影とストーリー構築を行い、各チームがオリジナルのまちあるきルートを開発した。
第4段階(2025年3月):成果報告会で中学生が活動成果を発表し、自らが案内役となってまち歩きイベントを実施した。中学生の視点による町の魅力を地域住民と共有することができた。
課題と今後の展望
今昔写真のアーカイブにおける写真精度のばらつき、ワークショップの遠隔管理の難しさ、運営における市役所職員の負担増加などの課題も明らかになった。一方で、町並み景観の記録・保管の意義を中学生が実感し、"懐かしい写真"に関する年長者の知識と若年層の技術操作能力を活かした世代間交流が促進され、新しいまちあるきルートの開発という具体的な形に結び付いたことは成果といえるた。次年度以降、「そうば」(周囲との調和)の精神を次世代に継承する仕組みとして発展させ、タウントレイル形式で成果を発信していく予定である。

054RP2024 箕輪 昌紘(北海道大学)
汎用型氷レーダーによるデータ取得, 解析, 可視化手法の確立

本研究では,氷河氷床の氷厚や基盤地形,氷床内部構造を測定するのに重要な氷レーダーによるデータ取得,データ解析,データ可視化手法を目的とするものである.本年度は,これまでに開発をしたレーダーシステムを2024年9月に南米や11月にヒマラヤの氷河で運用し,運用試験やデータ取得,データの可視化手法について確立をした.大深度での観測に向けて,新規で送信アンプ,送受信アンテナを購入し,レーダーシステムを改良した.また,航空機搭載に向けLiDARシステムとの統合も行った.ハードウェア,ソフトウェアの開発を推進するために,2024年8月,2025年1月には信楽や立川に集まり議論,実験を行った.研究進捗は極域シンポジウムや国内研究集会で発表した.システムの開発状況については技術報告書を準備中であり,年度中に国内誌に投稿予定である.
 今後は特に送信アンプの変更をし,より大深度での観測が実現することを目指す.また,航空機搭載に向け,処理能力やサンプリング速度の高いソフトウェア無線に置き換えるなど改良を進める.また,アンテナ搭載用の架台や電波法への対応など,実務的な作業を進める.さらに,取得データの信号処理や可視化についても開発を進め,周波数フィルタリング,空間フィルタリング,マイグレーション,振幅補正といった処理関数の実装を行う予定である.開発したソフトウェア,ハードウェアの情報は,github等を通して公開予定である.

055RP2024 吉田 崇紘(東京大学)
組成データの特性を考慮した空間解析・空間統計手法

本研究の目的は、組成データ解析(Compositional Data Analysis: CoDA)と空間解析・空間統計の接続を図り、新たな指標・モデリングの提案を行うこととしている。本年度の成果を計画時の項目毎に下記にまとめる。これらの成果により、国際会議で3件、国内学会・研究会で4件の発表を行った。
〔I〕地域特化係数の修正提案:組成データ解析の対数比変換の考え方を導入し地域内の産業組成を考慮した地域特化係数を開発した。日本の都道府県別の産業別従業者データに適用し、その解釈の仕方や結果提示の方法を検討した。地域の産業の地域対全国の大小関係に加えて、地域の産業間の大小関係を一つの指標で同時に考慮することにより従来の地域特化係数に比べ情報の多い指標を作成できた。
〔II〕ミクセルにおける誤差評価指標の提案:地理的に加重されたアプローチとクリギング手法を導入し、サンプルに対する組成土地被覆分類の空間的誤差変動を推定することを提案した。テストデータとして、ワシントンD.C.(米国)の高解像度分類画像をChesapeake Bay Land Use Land Coverデータベース2022年版から取得し、植生、不透水面、土壌、水クラスの組成土地被覆データを作成した上で、組成土地被覆分類の誤差は、Aitchison距離をグローバルな基準指標として計算し、Aitchison距離をローカルな基準指標に拡張することで誤差の空間的異質性を探索するための地理的に加重複合誤差分析を開発した。加えて、土地被覆率推定値とサンプル間の誤差の空間的自己相関を調査するために、クリギング法を適用した。
〔III〕空間的相互相関を考慮したモデリングの提案:固有ベクトル空間フィルタリング法を組成データのモデリングに適用し、誤差項の空間相関を緩和する方法を提案した。テストデータには米国の郡単位の所得階級データを利用した。提案モデルは、空間的な隣接関係を表す行列から抽出した固有ベクトルを説明変数に加えることのみで空間相関を捉えることができる簡便性が利点である。分析結果から、空間相関を測るMoran’ I統計量でも誤差項の空間相関を緩和ができたこと、予測精度が向上したことを確認した。

056RP2024 増田 耕一(立正大学)
近世東日本の天候と人口動態の連関についての探索的研究

 近世日本の気候と人間社会の連関のうち、東北地方の冷夏による凶作・飢饉があることは既に知られているが、その時空間的な構造はまだ明確でない。本研究の受け入れ教員 市野は、日記の毎日の天気記録をもとに、日本全国の多地点について月の時間分解能で日射量の復元推定をしてきた。共同研究者の黒須、高橋は、福島県の郡山の市街地とその近くの3つの村の人別改帳にもとづいて人口動態を研究してきた。本研究は両者を関連づけて気候が人間社会におよぼす影響や人間社会の応答を考える研究の初期的な段階である。
 現在の郡山市に含まれる守山には、守山藩の『御用留』という日記がある。帝塚山大学の川口洋教授を代表とする科学研究費プロジェクトの一環として、その日記から天気情報が抽出された。本研究ではそのうち1821-1850年 (うち2年分欠損) のグレゴリオ暦5月から10月までの毎日の天気情報を利用し、市野の既往研究と同じ方法で天気を分類し、気象庁による福島の1981-2010年の日射量観測値と昼の天気概況とに基づいてパラメータを決定して、日射量を推定した。守山の暖候期の日射量の年々変動は、既往の18地点と比較すると、日光を含む関東から近畿にかけての地点と相関が高く、川西 (山形県) を含む東北地方の他地点との相関はそれほど高くない。
 既往の18地点に守山を含めた19地点の、6月から9 月までの各月の日射量について、空間構造と時間構造を分離するための主成分分析をした。各月の第1主成分の固有ベクトルはいずれもほぼ全域で負であるが、東北地方北部では0に近い。第1主成分スコアが正であることは、東北地方南部から九州にかけての広域で日射が少ないことを示す。1836年にはその状態が6月から9月まで継続していた。なお、東北地方北部では、日射は平年なみだが、災害年表資料から寒冷であったことがわかっている。1833年は東北全域の冷夏だが第1主成分スコアは大きくない。残念ながら第2主成分の固有ベクトルは解釈困難だが、昨年度の研究で実施した近代の日照時間の主成分分析を参考にすると、おそらく1833年は日射が東北日本で少なく西南日本で多いパターンだったとみられる。
 1830年代について、郡山の人口動態および会津若松の米価と、守山、日光、川西の日射とを時間軸上にならべて比較検討した。夏の日射が少なかった1833, 1836, 1838年には米価が高く、食料不足であった。死亡率は、1836年の冷夏を受けて1837年に高くなったが1838年には平常にもどった。「欠落」(届けのない転出) の率の増加はそれより遅れ、1838年に最大となり1839年に低下した。その解釈は今後の課題であるが、ここまでの結果を論文投稿中である。

057RP2024 庄 建治朗(名古屋工業大学)
古日記天気記録の時間分解能と空間代表性に関する研究

 本研究では、近世日本の古気候復元に広く⽤いられる日記天気記録から気象・気候に関する情報を最大限に引き出すため、明治・大正期の測器による気象観測データと照合可能な日記天気記録を用い、定性的な天気記述を定量的な気象変数に変換する手法を開発するとともに、その復元精度と時間分解能、空間代表性を評価することを目的とした。
 そのため、前年度までの共同研究で蓄積した、照合する古天気記録と気象観測データに追加する形で、今年度は特に時別日照時間の観測データの整備を進めた。気象観測データの整備は、近畿(京都)および東京周辺を対象地域として、国立情報学研究所で運営するウェブサイト「デジタル台風」の歴史的データアーカイブ(http://agora.ex.nii.ac.jp/digital-typhoon/data-archive/)により、IIIFビューアで手書き気象観測原簿の画像データを閲覧しながら観測データをデジタル化する作業を進めた。古天気データについては、明治・大正期の12日記について毎日の天気に関する記述を抽出整理するとともに、人文学オープンデータ共同利用センターが運営する歴史資料に関する知識と経験の共有システム「れきすけ」(https://rksk.ex.nii.ac.jp)への登録を行った。
 古天気記録と気象観測データとの照合にあたっては、前年度までの研究で導入した「詳細率」と「重複率」という2つの指標を利用した。「詳細率」は、天気記録の詳細さの程度を数値化したものであり、「重複率」は、2つの天気カテゴリーに対応する気象変数の分布が重なり合う部分の割合で定義され、天気記録と気象要素との対応関係の強さを表す。この指標を用い、古天気記録の「晴」「曇」「雨」の天気カテゴリーと対応の良い気象観測データを探索したところ、気候モデルへの古天気データ同化によく用いられる雲量については、古天気記録に夜間の状況はほとんど反映されておらず、ほぼ昼間の状況のみが反映されていることが明らかとなった。また、時間帯別の日照時間データとの対応を分析したところ、同じ時間帯の雲量データとの対応よりも重複率が小さく、天気記録との対応が良いことが分かった。このことから、気候モデルへの同化に際し、雲量より日照時間を用いる手法を検討する必要があることが示唆された。

058RP2024 杉浦 幸之助(富山大学)
南極・昭和基地および北極・ニーオルスンのライブカメラデータを活用して視程を自動的に推定する手法の検討

 視程は視界がどの程度まで明瞭かを示す指標であり,南極や北極での研究活動や作業活動を行う際に,視程の情報は重要な役割を果たしている.視程が悪い場合,遠くの地形や障害物が見えず,安全な移動が難しくなる可能性があるためである.視程の定期的な監視が必要であり,これによって,緊急時には早急に行動を調整することが可能になる.南極や北極での活動においては,視程の把握は安全性や効率性を確保する上で欠かせない要素である.一方,近年,CCTVカメラデータを画像処理することにより,コントラストに着目して視程を推定する手法が提案され,また機械学習を活用した画像認識に関する研究も進んでいる.そこで本研究では,インターネット上で公開されている南極・昭和基地と北極・ニーオルスンのライブカメラの画像データを用いて,視程を自動で推定する手法について評価することを目的とした.
 視程を自動で推定するにあたり,インターネット上で公開されている南極・昭和基地および北極・ニーオルスンの2024年度ライブカメラの画像データを自動で1期間ごとにパソコン上に取り込み,保存した.そして2024年6月13日から2025年2月5日までの日中の画像データを対象に,視程の悪化が顕著な画像を選出した.視程が悪い場合にはコントラスト感度の評価値が下がり,視程が良い場合にはコントラスト感度の評価値が上がることを利用するため,画像をグレースケールに変換し,解析対象とする領域を切り出して,コントラスト感度の評価値を算出した.一方で,ライブカメラ画像にうつる目印(構造物など)までの距離をGoogle Maps API ver3を用いてあらかじめ算出しておき,画像から目視で視程を求めた.最終的に,コントラスト感度の評価値と視程との関係を解析して推定式を求めた.ただし,ライブカメラ画像にうつる目印の数がニーオルスンでは極端に少ないために視程の区分が,<320m,320m,370m,370m<と4区分,昭和基地でも,<80m,80m,90m,100m,110m,120m,450m,800m≦の8区分と少ないために,得られた推定式は定性的な関係を示しているものの,現時点では実用には厳しいことが明らかになった.今後は,画像にうつる目印の数を増やすこと,できるだけ一直線上に目印を配置することなどで改善が見込まれるのではないかと考えられる.

059RP2024 村田 健史(信州大学)
過去に学び将来に活かす地域災害情報WebGISアプリケーション社会展開

2021-2023地域災害情報WebGISプロジェクトでは、過去災害データベースの設計、データ登録インターフェースの構築、ROIS-DS人文学オープンデータ共同利用センター(CODH)が作成した歴史的行政区域データセットと当該災害データの可視化Webの構築を行った。2024-2026地域災害情報WebGISプロジェクトでは、これまでに構築したWebアプリケーションの一般社会における利活用を推進する。そのための手順として、1)自治体レベルでの過去災害データベースの構築、2)地域ニーズに基づいたWebアプリケーションのカスタマイズ、3)地域科学館などでの一般展示・公開の3つを提案した。
2024年度は、科学館を対象として上記の3点を進めるため、宮城県・仙台市科学館および福岡県・北九州市環境ミュージアムとの議論を進めた。本報告書では仙台市科学館との議論について報告する。同科学館は2025年4月にリニューアルオープンを行うため、新しい展示内容に即したデータベースおよびコンテンツ(アプリケーション)について具体的に検討した。同科学館は仙台市・宮城県を中心に東北地方全域からの来館者があり、地域の中心的な位置づけとなる科学館である。とくに仙台市内のほぼすべての小中学校の理科郊外授業を行っており、若年世代への科学教育が重要な視点となることが分かった。年間で約10回の会合を持った結果、科学館からはリニューアルに際して「防災コーナー」の一角を専用スペースとして提供を受けることになった。専用スペースには3台のディスプレーを壁に埋め込む形で設置し、そのうちの1台を「研究開発コーナー」として本案件等の技術開発・研究開発中のコンテンツ・データベース・アプリケーションを展示できることとなった。
研究開発コーナー展示の過去災害データベースについては2011年3月11日に発生した東北地方太平洋沖地震による東日本大震災の爪痕(つめあと)を展示したいという科学館からの要望に応えるためのデータベースを、現状の歴史的行政区域データセットと当該災害データの可視化Web用データベースに追加する新たに構築することとなった。展示アプリケーションとしては同科学館から要望に応じ、申請者らが東北大学研究棟屋上に設置している映像IoTシステムによるリアルタイム映像(ストリーミング映像)と地域災害情報WebGISアプリケーションを組み合わせたアプリケーションを開発することとなった。研究開発コーナーは2つのディスプレー(メインディスプレーおよび拡張ディスプレー)から構成されており、映像とWebGISアプリを連動可視化する。そのために、2024年度は2つの異なるWebアプリケーションを位置情報(緯度・経度・高度)をキーとしてリアルタイムに同期させるためのツール(STARS同期)を開発し、GithubにおいてOSSとして公開した。

採択課題一覧表にもどる


共同研究集会

001RM2024 津田 卓雄(電気通信大学)
中間圏・熱圏・電離圏 研究集会


2024 年 9 月 17-20 日に中間圏・熱圏・電離圏 (MTI) 研究集会を含む 4 研究集会 (「 MTI 研究集会」, 「超小型衛星を利用した超高層大気研究の将来ミッションの検討」, 「第 1 回 STE (太陽地球環境) 現象報告会」, 「太陽地球環境データ解析に基づく超⾼層⼤気の空間・時間変動の解明 〜 IUGONET プロジェクト 15 年の歩みとその将来 〜」)を合同で開催した. MTI 研究集会では, 招待講演を中心とした口頭発表セッションと若手や学生を中心としたポスター発表セッションを開催した. 飯⽥佑輔氏 (新潟⼤学) による招待講演では, 太陽大気研究への深層学習の応用についてご紹介をいただいた. 杉本憲彦氏 (慶應義塾大学) による招待講演では, 金星大気大循環モデルへの観測データの同化研究についてご紹介をいただいた. 西村嘉祐氏, 池田将平氏 (ソフトバンク株式会社/ALES 株式会社) による招待講演では, 国内 3300 点以上のソフトバンクの独自の GNSS (Global Navigation Satellite System) 観測基準点から得られる高密度の電離圏データについてご紹介をいただいた. 当該データは, 東北大学を中心としたコンソーシアムを通じて利用可能な状況となっている. 上記の招待講演に代表されるような研究発表と関連する議論・情報交換を通じて, 参加者と共に, 太陽地球惑星関連の科学分野における最新観測データの大規模化やデータサイエンスの最前線に関する理解を深めた. また, 研究集会の一環として, 開催場所である九州工業大学の超小型衛星試験センターの見学会を実施した. 小型衛星の運用数で 7 年連続世界一という実績を有する九州工業大学の小型衛星の開発・運用の現場に直接触れることができ, 若手・シニア問わず, 非常に貴重な機会となった. 以上のように, 研究集会全体を通じて活発な議論が行われ, 今後の発展につながる研究集会となった.

003RM2024 阿部 修司(九州大学)
太陽地球環境データ解析とデータサイエンス ~IUGONETプロジェクト15年の歩みとその将来~

2024年9月17日から20日にかけて、九州工業大学戸畑キャンパスにおいてハイブリッド形式で、研究集会を行った。研究集会では、大学間連携プロジェクト「超高層大気長期変動の全球地上ネットワーク観測・研究(Inter-university Upper atmosphere Global Observation NETwork:IUGONET)」の概要とデータ公開・解析基盤の開発・運用、プロジェクト活動を通じた国際ネットワークの構築とサイエンス成果、メタデータ可視化向上とDOI付与、将来計画などについて講演が行われた。また、プロジェクト発足当時に活躍されていた先生・開発員から、当該分野におけるデータ体制整備の歴史や、IUGONETの発足の背景、メタデータフォーマット選定について、今後のIUGONETへの期待、などの講演があった。さらに、様々な分野で活躍されている研究者や学生から、それぞれの分野の最先端の研究成果に加えて、データサイエンスへの取り組みの現状と今後に関して講演していただいた。あわせて、学生・若手へのデータサイエンス教育の一環として、Pythonベースのソフトウェアによるデータ解析講習会を実施した。長年実施してきたプロジェクト活動を総括し、様々な研究分野の現状を把握することで、これからのIUGONETが進むべき方向を多くの研究者との間で共有でき、大変有意義であった。また、本研究集会を他3集会との合同集会として開催したことで、それぞれの分野からの意見交換や議論をおこなうことができ、有意義な分野間の研究交流強化や連携の芽生えを促進することが出来た。他方で、データ解析講習会については、直近で起こった2024年5月の巨大宇宙嵐イベントを題材としたため、データの収集状況や議論の進め方などに難しい点があった。これは、データ駆動型サイエンスにおけるリアルタイム性や、分野間における対応状況の違いをどう吸収するかを検討する一助になったと考える。全体として大変有意義な研究集会であった。

004RM2024 大向 一輝(東京大学)
Linked Open Dataに基づく歴史・文化研究推進に向けたLinked Pasts Japanワークショップの開催

本研究集会では、2024年12月9日から12日にかけて、国際シンポジウム「Joint Symposium of Linked Pasts 10 and Linked Pasts Japan 1」を、NII・一橋講堂にて開催した(https://codh.rois.ac.jp/conference/linked-pasts-10/)。参加者は現地参加が研究代表者・受け入れ教員を含めて28名、オンライン視聴者も含めると計50名であった。
シンポジウムは、一方向的な発表形式ではなく、「アクティビティ」という枠を複数設け、参加者同士が特定のテーマについて議論するという形式で開催した。「アクティビティ」の話題提供者を事前に募り、最終的には計8個のアクティビティが組織された(一つは話題提供者体調不良のためキャンセル)。それぞれのアクティビティにおける論点は以下である。

Japanese Toponym Platforms for the Past and the Present – GeoLOD, GeoNLP, Geoshape, Rekichime, and Rekichizu
Using and Linking RDF Resources for Japanese Calendar Dates in Linked Data
Linked Data for earthquake observation data and its application to historical earthquakes
Map and Present your data with Peripleo
Exploring Network Models of Language, History, and Culture in Local Communities
A Network of Linked Places: Spatial Network Construction using Pleiades, World History Gazetteer, and GeoJSON
How People Think about People in the Past? Concepts and Methods Implemented in Historical People LOD Projects
Challenges for Connecting Japanese and Global Linked Pasts Infrastructure and Communities

テーマからもわかるように、Linked Open Dataに関連して時空間情報や人物情報、自然災害データ、言語など多様な論点について話題提供がなされ、Linked Pasts Japan設立の趣旨でもある活発な情報・意見交換の機会を持つことができた。具体的な内容については今後、可能な範囲で動画公開などを通して発信していく予定である。
Linked Pasts Japanの活動として最も大きなものは上記のシンポジウムの開催であるが、加えて、2024年9月に東京大学にて開催されたThe 13th Conference of Japanese Association for Digital Humanities(JADH2024)においてパネル報告を行った。ここでは、Linked Dataベースの時間情報基盤やクラウドソーシングによるアノテーションの試みなどの発表が行われ、Linked Pasts Japanの活動を国内外に発信する機会となった。また、学会発表としては2025年7月にポルトガル・リスボンで開催されるDH2025(https://dh2025.adho.org/)でも、昨年のシンポジウムの内容も踏まえたポスター発表が採択されており、日本における歴史・文化研究とLinked Data活用の動向についての発信を行う予定である。
さらにLinked Pasts Japanコミュニティとしては、今年度から始動したDHコンソーシアムプロジェクト(DiHuCo)の地図・地誌類領域(https://codh.rois.ac.jp/dihuco/)との連携を進めており、引き続きLinked Dataを基盤とする歴史情報基盤の整備とその利用についての研究活動のハブとしての活動を継続・発展させていく。

005RM2024 西川 泰弘(高知工科大学)
極域ペネトレータ(投下型センサー)で取得したインフラサウンド・地震データの解析・共有・公開に関する共同研究集会

本研究課題では、2024年9月26,27日の二日間、データサイエンス共同利用基盤施設1F大会議室において、「極域ペネトレータ(投下型センサー)で取得したインフラサウンド・地震データの解析・共有・公開に関する共同研究集会」を実施し、15件の発表と議論が行われた。
研究発表は氷河のインフラサウンド・氷震レビュー、南極地域観測隊のインフラサウンド・地震の研究レビューから始まり、第64,65次南極地域観測隊(JARE)で行われたペネトレータ設置や地震・インフラサウンド観測結果報告を行い情報の共有を行ったあと、JARE66での観測計画の報告に続いた。JARE66の観測計画は研究集会中に氷震、極域観測の専門家を交えて、機器の設置場所や設置方法などの調整が行われた。続いて、過去のDS共同利用の採択案件(柿並・山本代表)による、既存のインフラサウンド地震モニタリング観測のデータベース及び一般共同研究のデータベースの紹介が行われ、JARE64,65での取得データ及びJARE66で取得されるペネトレータの包括的観測データの共有・公開について話し合いが行われた。公開場所は国立極地研究所の極域科学計算機システム(Polaris)を第一候補とし、JARE66の取得観測データ状況を見て決定することとなった。
 他にも本研究集会では、株式会社PenetratorのCEOを招き、商業利用やJAXA宇宙戦略基金を利用しての産学連携のペネトレータ研究について話し合われたことや、4名の大学院生が参加するなど、来年度以降のペネトレータの活動に関しても積極的な議論が行われた。

採択課題一覧表にもどる