[[CH127]]

**◆第127回 人文科学とコンピュータ研究会発表会 [#mbe8dfef]

主査: 耒代誠仁~
幹事: 鹿内菜穂、中村覚、西岡千文、橋本雄太~


&color(red){※重要・ご注意※};~
&color(red){第127回研究会は、新型コロナウイルスの影響に鑑み、オンラインで実施することにいたしました。};~

【参加費(聴講)】~

,種別,金額
,研究会登録会員,無料
,学会正会員,2000円
,学会会員学生,500円
,学会非会員学生,1000円
,非会員,3000円

情報処理学会人文科学とコンピュータ研究会(IPSJ SIG Computers and the Humanities)では、下記の通り第127回研究会発表会の開催を予定しております。歴史、地理、芸術、民俗、文学、言語、社会などなど、様々な人文科学の諸領域での情報資源の記録、蓄積、分析、提供や応用に関わる研究発表をお考えの方はぜひ奮ってご応募ください。

********************~
 日時    2021年8月28日(土)~
 会場    オンライン開催~
 発表申込締切 %%2021年7月13日(火)%% &color(red){2021年7月20日(火)};~
 原稿提出締切 2021年8月3日(火)~
********************~


***(1)募集内容 [#a0a62584]

- 口頭発表のみ 8件程度
-- ショート:15~20分程度の持ち時間(質疑を含む)~
-- ロング:20分~25分程度の持ち時間(質疑を含む)~

※ロング/ショートいずれも2~8pの予稿の提出が必要となります(この範囲であれば枚数は自由です)。~
※予稿のフォーマットは[[情報処理学会のページ>https://www.ipsj.or.jp/kenkyukai/genko.html]]をご参照ください。~
※今回は一般口頭発表のみの募集と致します。

***(2)申込方法 [#va3ee4f5]

- [[申込書のページ>https://ipsj1.i-product.biz/ipsjsig/CH/]]をご利用ください(なお、原稿提出はこちらのページから行っていただきます)。
- 「研究会への連絡事項」欄に「ロング」「ショート」の別を、必ずご記入ください。
- 投稿システムで申込後、「講演申込完了のお知らせ」という件名のメールが自動配信されます。
- 担当幹事より、「講演申込受理のお知らせ」という件名のメールで、整理番号とパスワード、原稿執筆の詳細が届き、正式受理となります。
- 正式受理の連絡がない場合は照会先までご連絡ください。
- 先着順にて、定足数に達し次第、締め切りとさせていただきます。
- お申込み後、原稿提出時の発表ご辞退はお控えいただくようにお願いします。

***(3)参加方法 [#ee495b63]

//[[参加申込は5月7日に開始しました。>https://www.ipsj.or.jp/kenkyukai/event/ch126.html]]研究発表会当日(5月22日)までお申し込み頂けます。
参加申込は8月17日頃の開始を予定しています。研究発表会当日(8月28日)までお申し込み頂けます。
//参加者はマイページへの参加登録が必要です。手順につきましては、下記の「CH127参加要領」をご参照ください。~
[[参加申込を8月13日に開始しました。>https://www.ipsj.or.jp/kenkyukai/event/ch127.html]]研究発表会当日(8月28日)までお申し込み頂けます。
//参加申込は8月17日頃の開始を予定しています。研究発表会当日(8月28日)までお申し込み頂けます。
参加者はマイページへの参加登録が必要です。~
//手順につきましては、下記の「CH127参加要領」をご参照ください。~

***プログラム [#o1845f95]

2021年8月28日(土)

12:50-13:00 開会挨拶

13:00-14:10 セッション1

 13:00-13:25  (ロング)
 (1) デーヴァナーガリー文字OCRの開発
 ○加藤隆宏(東京大学大学院人文社会系研究科)
 ・友成有紀(国士館大学)
 ・谷口力光(東京大学大学院人文社会系研究科)
 ・大澤留次郎((株)凸版印刷情報コミュニケーション事業本部)
 ・藤巻聡((株)凸版印刷情報コミュニケーション事業本部)
 ・岡田崇((株)凸版印刷総合研究所)
 ・橋本江美((株)凸版印刷総合研究所)

> 本研究「デーヴァナーガリー文字OCRの開発とサンスクリット文献データベースの構築」では、ヒンディー語、サンスクリット語、ネパール語などの諸語に用いられるインド系文字の一つ、デーヴァナーガリー文字を読み取るための光学文字認識(OCR)ソフトウェアを開発し、その技術を用いて読み取った文献群のデータベースを構築することを目標としている。本発表では、その前半部分となるデーヴァナーガリー文字OCRの開発について、(1)データ分析の材料となる「字形データセット(教師データ)」の作成方法、(2)文字出現頻度表の分析、(3)完成したAI-OCRの読み取り結果の評価という三つの点を考察してまとめる。

 13:25-13:50 (ロング)
 (2) 「内閣大庫」史料文献のデジタル化・管理システムと利活用の可能性
 ○林玟君(台湾中央研究院歴史語言研究所デジタル文化センター)

> 本稿では1937年台湾に渡り、中央研究院歴史語言研究所を収蔵する「清代内閣大庫」史料文献のデジタル化過程を紹介したい。「中央研究院歴史語言研究所内閣大庫档案」が中国明清時代(明:1368-1644、清:1644-1911)の政治制度・社会・経済・軍事・法律を研究する方面の上に重要な詔令・題奏・移会・賀表・三法司案巻・実録稿本・各種黄冊・簿冊、内閣の各庁房処と修書各館の档案や試題・試巻など大量かつ多言語(満・蒙・蔵・朝鮮・シリア等々)重要な史料文献を有している、具体的には、制詔・誥敕・題奏本章・史書・朝貢國表章その他デジタルデータベースおよび公開・発信でも史料画像二十七萬件以上のデジタルアーカイブを有している。 本報告では、この「清代内閣大庫档案」の構築に向けた取り組みについて報告する。研究では、「内閣大庫史料の由来経緯、史料復元作業・長期保存とデジタル化の方法」、「デジタル文献公開の意義と課題、データと公開の形式、データの品質保証・管理と利活用」、「内閣大庫文献データの相互運用性とオンライン教育プロモーション」という三つ軸として、デジタル化と長期管理また歴史情報研究の展開と利活用を目指している。なお、データベースにおける各種制限を改善し、デジタル歴史学と文献学に役立つシステムの革新的発展することへ繋げていきたい。

 13:50-14:10 (ショート)
 (3) 小篆の部品図形の不統一性から見る字書資料の参照関係
 ○鈴木俊哉(広島大学)

> 大徐本説文解字は北宋初期に成立したが、現存する宋本説文解字は避諱の状況から南宋の孝宗期の刊本と考えられてきた。一方、南宋で成立した説文解字五音韻譜は20世紀中はほぼ明刊本しか流通しなかったこともあり、研究対象として用いる場合は基本的には宋本説文解字より後代の資料と位置付けられてきた。 今世紀に入り、ほぼ完本の宋本五音韻譜の影印が出版された。これも、避諱の状況から孝宗期の刊本と考えられる。すると、現存の宋本説文解字と宋本五音韻譜の前後関係あるいは参照関係に興味が持たれる。これを考える材料として、同一のデザインとなる筈の部品図形を持つ小篆字形を集めるためのツールを作成し、得られた部品図形のばらつきからこの2者の関係を議論することを試みた。

14:10-14:20 休憩

14:20-15:35 セッション2

 14:20-14:45 (ロング)
 (4) ロシア音符方式舞踊表記法からのバレエの復元とデジタル化
 ○村上綾菜(お茶の水女子大学)
 ・佐藤真知子(お茶の水女子大学)
 ・和家尚希(マイクロソフト)
 ・笹渕一宏(マイクロソフト)
 ・中村美奈子(お茶の水女子大学)
 ・伊藤貴之(お茶の水女子大学)
 ・池内克史(マイクロソフト)

> 19世紀末ロシアで考案されたステパノフ表記法による舞踊譜は,世紀転換期のロシアにルーツを持つ舞踊作品を探究することのできる,歴史的に貴重な資料である.その一方で,当表記法は現在ほとんど使われておらず,読解できる者も限定的である.そこで本プロジェクトでは,舞踊譜に記された踊りを誰もが理解し視覚的に楽しむことを目標に,コンピュータを用いた踊りの再現に取り組んでいる.本発表では,当表記法によるバレエの基本動作の譜例に焦点を当て,3DCGアニメーション表現を行なった結果について報告する.その上で,スコア上で想定されている運動特性とCG化による出力結果との相違点から,ステパノフ表記法においてどのような動きが暗黙知として仮定され,いかなる情報がスコアの上から欠落しているのか,それをどのように補完するのかについての検討も報告する.

 14:45-15:10 (ロング)
 (5) Universal Dependenciesによるアイヌ語テキストコーパス
 ○安岡孝一(京都大学)

> 書写言語としてのアイヌ語は、カタカナ・キリル文字・ローマ字(ラテンアルファベット)など、多彩な文字と記法によって記述されてきた。その一方、抱合語としてのアイヌ語は、日本語や欧米諸語とは全く異なる文法構造を持ち、これらの言語向けの文法記述手法は、アイヌ語に太刀打ちできない。ならばUniversal Dependenciesは、どうだろう。言語横断的な文法構造記述として設計されたUniversal Dependenciesは、書写言語としてのアイヌ語を、どの程度ちゃんと記述できるのだろう。本発表では、カタカナ・キリル文字・ローマ字で書かれたアイヌ語を、Universal Dependenciesで記述する際の困難さについて、考察する。

 15:10-15:35 (ロング)
 (6) 応用言語学と自然言語処理のリーダビリティ判定に対するアプローチの違い
 ○江原遥(東京学芸大学)

> リーダビリティ判定は、テキストを入力として、そのテキストの読みやすさを自動的に判定する手法である。応用言語学の分野においては、語彙テストの結果をもとに個々の学習者が所与のテキストを読解可能か判定する個人化リーダビリティ判定の研究が活発に研究されている。また、自然言語処理の分野においても、リーダビリティ判定の研究は盛んにおこなわれており、近年は、特に第二言語学習者向けの性能評価用のデータセットも整備されてきている。しかし、この2つのアプローチの研究は、双方のコミュニティで活発かつ継続的に研究されているにもかかわらず、相互の引用がほとんどない。本発表では、まず、両系統の手法を機械学習の観点から分類し、機械学習の観点からは両系統の手法の性能比較が可能であることを示す。そして、相互の引用が少ない理由について、両アプローチでの問題設定・目的の違いから考察する。そのうえで、応用言語学の手法を用いた自動リーダビリティ判定器を作成したところ、ニューラル言語モデルなどを駆使した既存手法より高精度かつ高速であったという実験結果について報告する。

15:35-15:50 休憩

15:50-17:50 企画セッション「コロナ禍を通して得た大学教育/人材育成に関する知見」

17:50-18:00 閉会

***お問い合わせ先 [#d158c6e0]
ch-madoguchi■jinmoncom.jp(@を■に変更しています )

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS