メニュー
ページトップ

機械学習を⽤いた学際分野の俯瞰的分析:学術論⽂の⽂章と図の分類と可視化

2025.06.27
令和6年度 学際共創プロジェクト【デジタルヒューマニティ部門】

機械学習を⽤いた学際分野の俯瞰的分析:学術論⽂の⽂章と図の分類と可視化

研究代表者: 菅原 裕輝(人文学研究科)
研究分担者: 森田 邦久(人間科学研究科)、大塚 淳(ZEN大学)、中島 悠太(D3センター)


研究の背景

現代の学術研究は専門分化(細分化)と学際化が同時に進行し、知識は深く掘り下げられる一方で分野間の相互交流によって新たな領域が生み出されている。伝統的に学問の体系は、一元的・階層的なモデルで理解されてきた(例:コントの学問序列、論理実証主義による全科学の統一)。これらの統一・還元的な見方は知の構造を簡明に示す利点があるものの、多元的で相互循環的に発展する現代の知のあり方を十分に説明しきれない可能性がある。明治期の西周『百学連環』においては、学問同士を有機的に連関させる環状モデルが示されたが、21世紀の現在では学問領域は一層多様化・変容し、その構造はかつてない複雑さを帯びている。このような状況下で、学術分野全体の俯瞰的理解(ひいては、知の構造の解明)を試みるには、新たな分析視座と手法が求められる。

近年のデータサイエンスや機械学習の発展により、大規模なテキストや画像データを計算機で分析し、そこから知見を得ることが可能になってきた。学術論文のデータも例外ではなく、デジタル人文学の文脈では、膨大な論文テキストや引用関係を解析して科学知識の構造を明らかにする試みが現れている。本研究もこの潮流に位置づけられ、機械学習技術を用いて学際的な研究領域を俯瞰し、専門分野の細分化と学際的統合のダイナミズムを明らかにすることを目指す。

研究の目的

本研究の目的は、機械学習を活用して学術論文の文章テキストと図データを分類・可視化し、学際領域における知の構造を包括的に解明することである。具体的には、異なる学問分野間で知識がどのように関連づき、融合し、新たな研究領域や概念が生み出されているのかをデータ駆動型で検出・可視化する点にある。特に、学術論文に含まれるテキスト情報(タイトル・要旨・本文など)と図情報を統合的に分析し、従来は個別に扱われてきた知識の言語表現と視覚表現の両面から、学際分野に特有の特徴や傾向を明らかにすることを目指した。これにより、従来型の階層モデルでは捉えがたい学問分野間の横断的な知識の流動や構造を明らかにし、学際研究を理解する新たな視座を提供する。

本年度の成果について、詳しくは活動報告書(PDF)をご覧ください。