24 |
総合雑誌『太陽』の本文の様態と電子化テキスト
|
|
|
|
Abstract:
国立国語研究所 ; 東京大学大学院 ; 国立国語研究所では総合雑誌『太陽』(1895-1928)のコーパス(「太陽コーパス」)作成を進めている。その一部をなす『太陽』1901年12冊分の本文の電子化テキストを試験的に公開し,批判を得たい。『太陽』の本文は,現代の総合雑誌とは異なる様態を種々示しており,それらは,電子化に際して相応の問題を生じる。そうした雑誌本文の様態を整理し,その様態に応じて必要になる仕様を策定し,その仕様にしたがって電子化テキストを作成する。基本となるデータには,XML形式を採用し,この形式を通して,データの保守,変換,検索等も行う。
|
|
Keyword:
XML形式; 「太陽コーパス」; 明治大正期文献; 電子化テキスト
|
|
URL: http://id.nii.ac.jp/1328/00002048/ https://repository.ninjal.ac.jp/?action=repository_uri&item_id=2064 https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=2064&item_no=1&attribute_id=54&file_no=1
|
|
BASE
|
|
Hide details
|
|
|
|