DE eng

Search in the Catalogues and Directories

Hits 1 – 17 of 17

1
『昭和話し言葉コーパス』の設計と構築
Abstract: 専修大学 / 国立国語研究所 研究系 音声言語研究領域 客員教授 ; 国立国語研究所 研究系 音声言語研究領域 ; 国立国語研究所 研究系 音声言語研究領域 ; Senshu University / Invited Professor, Spoken Language Division, Research Department, NINJAL ; Spoken Language Division, Research Department, NINJAL ; Spoken Language Division, Research Department, NINJAL ; 国立国語研究所基幹研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,2016年度より『昭和話し言葉コーパス』(SSC: Showa Speech Corpus)の構築を進めてきた。2021年3月にその構築作業が完了し,コーパス検索アプリケーション「中納言」で一般公開を開始した。『昭和話し言葉コーパス』は,1950年代から1970年代にかけて国立国語研究所で作成された録音資料群を再編成し,現代の技術で話し言葉コーパスとして整備したものである。過去の音源を現代の技術でコーパス化したという点において,日本語では従来存在しなかったタイプのコーパスであると言える。また,現代の話し言葉コーパスと連結し,比較・対照することによって,話し言葉の経年変化を探るための「通時音声コーパス」として利用できる点で,画期的である。本稿では,今回構築した『昭和話し言葉コーパス』について,そこに収録されている録音資料群の出自や当時の国立国語研究所の状況,コーパス構築の過程とアノテーション,さらに予備的な分析結果について述べる。 ; Construction of the "Showa Speech Corpus" (SSC) began in 2016, and was completed in March 2021 and made available to the public online through the corpus search application Chunagon. The SSC consists of a collection of recordings made from the 1950s to the 1970s by the National Institute for Japanese Language and Linguistics. Thus, it is a speech corpus made with modern technology, but with old recordings as its content. The SSC is innovative in that it can be used to explore the changes in spoken language over time (i.e., as a "diachronic speech corpus") by linking, comparing, and contrasting the SSC with modern spoken language corpora such as the Corpus of Spontaneous Japanese (CSJ) and the Corpus of Everyday Japanese Conversation (CEJC). In this paper, we describe the origins of the recorded materials stored in the SSC, the process of corpus construction and annotation, and the results of the preliminary analysis.
Keyword: annotation; diachronic change of spoken language; diachronic speech corpus; Research in the Colloquial Japanese; Showa Speech Corpus (SSC); 『昭和話し言葉コーパス』(SSC); 『談話語の実態』; アノテーション; 話し言葉の経年変化; 通時音声コーパス
URL: https://repository.ninjal.ac.jp/?action=repository_uri&item_id=3539
https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=3539&item_no=1&attribute_id=54&file_no=1
http://id.nii.ac.jp/1328/00003522/
BASE
Hide details
2
『BCCWJ 節境界ラベルデータ』Ver 1.0
佐藤 理史; 丸山 岳彦; Satoshi SATO. - : 国立国語研究所, 2021
BASE
Show details
3
医学書テキストに現れる文末表現の特徴 : 単語N-gramを用いた分析
In: https://pj.ninjal.ac.jp/corpus_center/lrw2020.html (2020)
BASE
Show details
4
「通時音声コーパス」の可能性と問題点 : 『昭和話し言葉コーパス』の構築と分析
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details
5
複数の脚本コーパスに現れた終助詞の比較分析
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
BASE
Show details
6
脚本テキストに基づくコーパス文体論の可能性 : テレビドラマ脚本に注目して
In: https://pj.ninjal.ac.jp/corpus_center/lrw2018.html (2018)
BASE
Show details
7
『現代日本語書き言葉均衡コーパス』の文境界修正
小西 光; 中村 壮範; 田中 弥生. - : 国立国語研究所, 2015
BASE
Show details
8
〈著書紹介〉 益岡隆志,大島資生,橋本修,堀江薫,前田直子,丸山岳彦 編『日本語複文構文の研究』
丸山 岳彦. - : 国立国語研究所, 2014
BASE
Show details
9
語りかける書きことばの表現
加藤 祥; 柏野 和佳子; 立花 幸子. - : 国立国語研究所, 2014
BASE
Show details
10
『現代日本語書き言葉均衡コーパス』におけるサンプリングの原理と運用
丸山 岳彦; 山崎 誠; 柏野 和佳子. - : 国立国語研究所, 2011
BASE
Show details
11
『現代日本語書き言葉均衡コーパス』に含まれるサンプルおよび書誌情報の設計と実装
丸山 岳彦; 山崎 誠; 柏野 和佳子. - : 国立国語研究所, 2011
BASE
Show details
12
『現代日本語書き言葉均衡コーパス』における収録テキストの抽出手順と事例
柏野 和佳子; 丸山 岳彦; 稲益 佐知子. - : 国立国語研究所, 2009
BASE
Show details
13
語彙密度を利用した『現代日本語書き言葉均衡コーパス』テクスト分類の試み
佐野 大樹; 丸山 岳彦; 山崎 誠. - : 国立国語研究所, 2009
BASE
Show details
14
『現代日本語書き言葉均衡コーパス』における書籍サンプルの多様性
柏野 和佳子; 丸山 岳彦; 秋元 祐哉. - : 国立国語研究所, 2008
BASE
Show details
15
『現代日本語書き言葉均衡コーパス』におけるサンプル構成比の算出法(2) : コーパスの設計とサンプルの無作為抽出法
丸山 岳彦; 秋元 祐哉. - : 国立国語研究所, 2008
BASE
Show details
16
コーパス日本語学の射程
丸山 岳彦; 田野村 忠温; Takehiko MARUYAMA. - : 国書刊行会, 2007
BASE
Show details
17
『現代日本語書き言葉均衡コーパス』におけるサンプル構成比の算出法 : 現代日本語書き言葉の文字数調査
丸山 岳彦; 秋元 祐哉. - : 国立国語研究所, 2007
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
17
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern