このブログを検索

2020/03/23

2017-2020 科研(基盤B)ICNALE対話モジュール開発プロジェクト 進捗報告

最終更新日 2020/3/26

2020年3月末日をもって,本科研事業は終了します。3年間の研究期間において,当初の予定通り,アジア圏英語学習者のL2インタビューコーパス(ビデオデータ+書き起こしデータ)を完成させ,公開することができました。ICNALE Spoken Dialogueは,現時点で,アジア圏学習者を対象としたものとしては,世界最大級の英語インタビューコーパスの1つとなっています。事業終了にあたり,科研費の支援に改めて深謝します。

2017~19年度 科研(基盤B)「アジア圏英語学習者自然対話コーパスICNALE-Dialogue開発と分析」(17H02360)

◎このエントリの位置付け
本エントリは,報告書「科学研究における健全性の向上について」(日本学術会議,2015年3月6日)の(2)-1および(2)-5アで指摘されている「研究ノート」の電子版として位置付けています。その都度の準備の状況・実験の過程・問題点などを時系列的に記録し,誤記の修正などを除き,過去の内容は変更しないこととします。

◎事業目的
ICNALEプロジェクトにおける独話型発話の収集(Monologue)をふまえ,新規に,自然対話(Dialogue)データの構築・分析を行う。

◎2019年度の進捗(概要)
03月 LCSAW Proceedings刊行,ICNALE SD1.0 (202003 version)公開,ウェブサイト更新
02月 LCSAW Proceedings刊行準備,タスク別Individual データ作成
01月 公開用追加データコーディング,ICNALE Online上での追加データ公開(全データ公開完了)
12月 ICNALE SDの紹介論文が韓国英語教育学会誌に掲載
11月 論文修正ほか
10月 マレーシアデータの受領。書き起こし回し。オンライン検索サイトデータ増補完了。論文投稿。
09月 国際シンポ準備・開催
08月 オンラインシステム公開のためのデータ整形・韓国でのデータ収集・マレーシア収集開始

07月 ランカスターシンポ,収集済みデータのコーディング完了
06月 LCSAW開催準備。プログラム作成。ウェブサイト作成等。
05月 パキスタンデータ収集完了,中国データ収集開始,台湾(2期)・中国(国内)書き起こし完了,第1回研究会実施
04月 タイ,台湾(1期)書き起こし受領

◎2018年度の進捗(概要)
03月 台湾(2)の属性データ収集完了・送金事務完了・ICNALE Online Spoken Dialogue稼働開始,公開用データ整理
02月 台湾(2)のデータ収集完了,各種送金事務
01月 中国データのトライアルへのフィードバック・論文執筆
12月 フィリピン40書き起こし完了
11月 インドネシア書き起こし完了
10月 研究書籍購入。海外データ収集の継続(フィリピン1がほぼ完了)。
09月 ENS20+JLE100の動画データ&スクリプトデータの整理完了。オンライン検索システム開発業者に引き渡し。海外協力者への機器発送他。
08月 インドネシアデータの一部が収集完了。既存データのコーディング。海外協力者募集(2回目)・新規協力者への機器セット発送。
07月 中国人データ継続取得
06月 検索システム拡張作業発注

05月 中国人留学生インタビュー協力者募集開始・論文投稿
04月 海外3か国の実験準備・ウェブサイト全面更新

◎2017年度の進捗(概要)
03月:日本モジュールN=97のデータ整理終了。あわせてNSモジュールN=20の収集を完了
02月:Barlow教授ミニレクチャー開催,追加10本分書き起こし発注
01月:書き起こし納品(英語・日本語N=21)
12月:データ収集(N=4) 書き起こし第3次発注(英語・日本語N=21)
11月:データ収集(N=8 ※累計N=77)
10月:データ収集(N=9)
09月:学会発表等,書き起こし第2次完了(INHIK49 英語N=52+INHIK50 日本語N=66)
08月:国際シンポ実施,収録済みデータの書き起こし発注準備
07月:データ収集継続(N=60が完了),書き起こし第1次完了(INHIK46 英語N=14),シンポ論文集準備
06月:データ収集開始(N=21が完了)
05月:シンポジウムの一般発表公募,プログラム確定,対話データ収集謝金にかかる事務折衝作業
04月:研究文献購入,シンポジウム(LCSAW3)企画・講師交渉


=========================================================================

◎月次進捗報告
(2020年3月)
3/4 Individual Data作成作業第1次修了(日英中台)
3/5 Individual Data作成作業第2次開始(日英中台以外)
3/9  Individual Data作成作業第2次修了
3/12 LCSAW Proceedingsの編集完了・図書館に公開依頼(3/17~公開)
3/23 Individual Dataの検証修了
3/24 ICNALE SD V1.0 (202003 version)公開,ウェブサイト更新
3/26 Individual Dataの統計情報取得。公開データに追加(Excelシート内)
フィルタを使うことで,たとえば<A2>の<中国人>の<ロールプレイ>と<絵描写>の<語彙密度(TTR)>の比較,といったことが即座にできる(はず)。

(2020年2月)
2/13 タスク別Individual Data作成用作業マニュアル準備と作業指示

2/20 LCSAW Proceedingsの改訂版受理期限
2/23 LCSAW Proceedingsのrevised paperに採択通知
2/25 タスク別Individual Dataの作成作業開始(大学院生雇用)

(2020年1月)
1/10 追加データのコーディング完了
1/14 上記タグ付け作業を終了。データを業者に返送。
1/17 追加データ公開が完了 
1/19 LCSAW Proceedingsのレビュー結果発送
1/21 タスク別Individual Data作成のための院生雇用の伺い書提出(2月~3月に実施予定)

(2019年12月)
12/4 KATE論文の修正版を再提出(受理)
12/10 追加データのタイムコーディングおよびオンライン公開作業開始

12/19 KATE論文の追加修正依頼→対応

12/20 LCSAW Proceedings 投稿締め切り
12/24-26 KATE論文公開にかかる確認作業


(2019年11月)
11/26 KATE論文のレビュー返信,修正作業開始
11/27 追加データのタイムコーディングおよびオンライン公開作業見積依頼

(2019年10月)
2019/10/1  
・タイムコーディングデータ納品
・Sketch Engineのアカウントを復活(サブスクリプション延長)し,POSタグ付け
・当初単一ファイルで実施したが容量オーバーになったため,国別にテキストファイルを作った上でPOSタグ付与。業者に送信。
=======================================
10/1時点でのデータ収集状況の確認
対象=アジア圏10か国(シンガポール→マレーシアに変更)+ネイティブ
(A)データのオンライン公開済み+ICNALE Onlineにデータ格納済み:ネイティブ,日本
(B)データのオンライン公開済み+ICNALE Online 格納作業中:中国,インドネシア,フィリピン,台湾,タイ,パキスタン,香港
(C)データ収集完了,オンライン公開待ち:韓国
(D)データ収集作業継続中:マレーシア
========================================
2019/10/15
・マレーシアデータ20件が収集終了(★これで全データ収集が完了!)
2019/10/16
・マレーシアデータのダウンロードおよびmp4変換(一晩かかる)
・オンライン検索サイト業者より,タグ付けデータの作り直し依頼。対応して返送。
・同上業者より,リンク先のビデオデータにリンクが張れないので別の箇所にアップしてほしいとの依頼。30GBぐらいあるので明日以降対応と返答。
2019/10/17
・朝,mp4化したマレーシアデータのうち,インタビュー部分を音声ファイル(mp3)化。書き起こし業者の見積もりに出す。
・見積もり受け取り(¥145,046 11/5納品予定)
2019/10/18
・マレーシアのビデオデータとアンケートデータの照合。欠損1を確認し,先方に連絡。
・マレーシアデータのアンケートの欠損分が届き,収集完了
2019/10/19
・マレーシアデータのインタビュー部分とL1部分をそれぞれ統合し,One Driveにアップロード(全29GB)
・業者よりビデオデータを業者サーバーに挙げてほしいとの依頼。FTP試みるが失敗。IP通してもらう。
2019/10/20
・公開の全ビデオデータを業者のサーバーにFTPでアップ(29GB)
======================================
10/22 現在の状況
(1) ビデオデータ公開:全10か国地域+NS完了
(2) 書き起こし: 現在最終のマレーシアを作業中(11月冒頭上がり予定)
(3) 書き起こしへのタスクコードのタグ付け:韓国+マレーシア以外終了
(4) 書き起こし公開:韓国+マレーシア以外終了
(5) オンラインシステムへの搭載:韓国+マレーシア以外終了
=======================================
2019/10/31
・論文を完成・投稿。

(2019年9月)
2019/9/6 
韓国データの整理完了・書き起こしに発注
2019/9/10 
台湾データの内容照会(切れている・・・英語インタビューのファイルが2分割だったことがわかり,再度統合処理の上,オンラインのデータを差し替え)
2019/9/25  
韓国データの書き起こしの納品
2019/9/29 
アジア圏国際学習者コーパスシンポジウムLCSAW開催。基調講演でICNALE紹介を行う。
2019/9/30 
LCSAW参加者への連絡,大学で会計作業(立て替え払い分の領収書提出),ProceedingにかかるISSN再発給手続き(紙→電子onlyへ変更),Proceedingsのテンプレをアップ

(2019年8月 ※夏季休暇に入ったので集中的に作業を行っています)
2019/8/1
・7/31納品の中国(+25追加分)のタスクコーディング開始
2019/8/2
・韓国より4本目インタビューデータ到着
・中国追加分のタスクコーディング完了(※360本分のタスクコーディングが完了)
・パキスタン分含めて385本のビデオファイルを整理(シンプルな命名に変更)
・ビデオファイルをonedriveで公開(30GBの容量のうち26GBを使用)





・発話者属性データのアップデート(パキスタン+中国追加分)
・ICNALE Onlineのタイムコーディング作業の受書発行を依頼(教務課宛)
・同上の作業用データを業者に発送
・あわせてICNALE Onlineの検索系の変更をまとめ,作業依頼を提出(トピックベースからタスクベースに変更)
2019/8/3
・音声データの整理
・ビデオと音声のlength情報の抽出とベースファイルへの情報転記
・秒情報を抽出(※分・秒データに定数86400をかけて「数値表示」に変換)
・学生発話部分のテキストファイル(中国50人+台湾後半25人)を作成
・既存のテキストファイルとあわせて1行目の[Utterance No Code]行を一括削除
・Wordsmith Toolsで解析し,語数情報・語長情報を抽出。秒数データとあわせてspeed fluencyに相当するWords per minute情報を計算
※8/5納品予定のパキスタンデータを除き,公開準備が整う(パキスタンデータ処理完了後に公開予定)
・シンガポールでのデータ収集のめどがつかないため,マレーシアの教員にinvitationを送る
2019/8/4
・シンガポールの代替をマレーシアで採る可能性を探り,フィリピンの協力教員に可否を問い合わせ
2019/8/5
・パキスタン書き起こしデータの納品

2019/8/6
・終日,パキスタンデータのタスクコーディング作業
2019/8/7

・オンラインのICNALEサイトを大幅に改修・ICNALE Spoken Dialogue V0.9を公開
2019/8/8
・ベトナムダナン着。GloCALL2019でICNALE Spoken Dialogueを使ったタスクタイプ差(認知資源配分タイプ差)によるCAF変化について報告

・パキスタンデータをタイムコーディング用に提出
・科研残金確認
現在残金 130万
今後出金予定(※書き起こしは1本5000円検討)
__________________________________________
・マレーシア収集・書き起こし(30本) 30+15=45万
・韓国収集・書き起こし(20本) 30+10=30万
・オンライン搭載(50本)5万+5万=10万?
・LCSAW講師謝金 12万
・LCSAW茶菓代金  3万
・残金予想 30万(出張,図書他に充当)
_________________________________________

2019/8/17
タイムコーディング業者より前回のタグコーディングデータが届く
2019/8/19 
韓国チームAより8本が提供
2019/8/20
タイムコーディング業者より前回分のタイムコーディングデータが届く
2019/8/28 
LCSAW発表者の参加確認リマインダ
IDNの当方のタスクコーディングミスを修正(業者指摘による)
2019/8/29 
韓国チームBより12本が提供

(2019年7月)
2019/7/1 科研研究会(2回目)開催

2019/7/4 収集済みデータのタスクコーディング作業を再開。下記は予定。
_________________
日本100 済み
NS 20 済み
香港30 済み
インドネシア 30
フィリピン 40
タイ 40
台湾 50
_______________
2019/7/4 LCSAWのプログラムを更新(abstが揃う)
2019/7/4-6 韓国英語教育系学会連合大会で招聘講演:ICNALEについて紹介,また,韓国の研究者3名に新規にICNALEデータ収集への協力を依頼(資料送付済み)。7/12までに回答受け取りの予定。
2019/7/7 作業の遅れている韓国チームに再度督促(収集できたのは6本か?)

2019/7/9 中国四川より25人分のデータを受領。整理を開始。
2019/7/11 中国追加25人分+パキスタン25人分のデータを書き起こしに発注(8月中旬受領予定)
2019/7/11 韓国で依頼の3名のうち1名より断りあり(他の人の紹介を依頼)
2019/7/12 書き起こしの納品予定確定
・・・・・・・・・・・・・・・・
■ 料金(税込):¥317,952
■ 納期:
第一次納品: 2019年 7月31日 (水) 21:30 (JST)   {中国(CHN)ファイル}
最終納品: 2019年 8月5日 (月) 21:30 (JST)  {パキスタン(PKN)ファイル}
・・・・・・・・・・・・・・・・
2019/7/12 コーディング必要ファイル数190。本日現在終了分70/190。(1日10本として後12日)
2019/7/16 韓国の研究者に収集依頼
2019/7/19 5名程度の協力の返答
2019/7/24 オンラインシステム業者に再見積もり依頼(データ数増加,ビデオの容量問題問い合わせ)
2019/7/29 タスクコーディング完了,発話者習熟度属性コーディングも完了
2019/7/29 韓国研究者Aに状況確認メイル+韓国研究者Bより返信あり

(2019年6月)
2019/6/10 韓国協力者より返信あり。結局取れた数は2~3本のみか?早急に別の協力者探しの必要性。

2019/6/10 韓国とシンガポールに再度協力者依頼を実施(韓国6,シンガポール2)
2019/6/20 LCSAWのオンライン公開

(2019年5月)
2019/5/1 LCSAW4のCFPを各MLに発送

2019/5/3 中国データ取得用にオンラインフォームをエクセルに作り替えて送付
2019/5/13  中国データの受け渡しテストとしてbaidu driveを実験。
2019/5/14 パキスタンからのデータが到着,同日変換作業
2019/5/16 中国データ(トライアル)をbaidu driveで受け取るがDL不可。
2019/5/18 中国留学生の協力でアカウントの貸与を受け,DLに成功。
2019/5/18 稼働中のICNALE Online(Essays)の中国人のA2レベルの学習者のアルバイト(PTJ)作文のマージデータのミス(一部データ重複)が確認され,差し替え業務が完了
2019/5/18 次期のオンライン公開作業用の見積もりが届く
2019/5/20 中国にフィードバックを送信
2019/5/20 LCSAW第1次締め切り(11+1名)。月末まで念のために延長。
2019/5/22 LCSAW研究会概要決定・告知(日本語教育)
2019/5/23 LCSAW4懇親会会場問い合わせ・JASELE申し込み
2019/5/24 パキスタンへの送金事務作業開始
2019/5/24 LCSAW4の招待者へ初メイル。仮プログラム作成。
2019/5/30 科研研究会(1回目)

~~ 5/24現在 予算執行見通し ~~~

◎期初 370万
4~5月の出金:38万(書き起こし1),32万(書き起こし2:台・中),10万(書籍),韓国出張(7.5万)
◎現在 270万
今後の主な出金予定(予定分275万:不足は一般研究費より充当)
(収集関係:195万)
パキスタン書き起こし:20万
中国収集+書き起こし:55万
韓国収集+書き起こし:50万
シンガポール収集+書き起こし:50万
(オンラインシステム関係)
第2次アップロード:30万

第3次アップロード:20万
(LCSAW開催経費:20万)
講師謝金:15万
会場費:5万
(主な出張:60万)

GloCALL(ベトナム)20万
JASELE(青森)8万

JACET(名古屋)3万
Bruno? 30万
~~~~~~~~~~~~~~~~~~~


(2019年4月)

2019/4/1 最終年度年度開始
2019/4/5 タイ・台湾書き起こし納品
2019/4/10 上記にかかる経理処理
2019/4/17 上記データのエクセル化開始(タイを先行)
2019/4/17 韓国とパキスタンに状況確認&中国に依頼メイル
2019/4/17 台湾B(25本)と中国(25本)の音声ファイルをリネーム。書き起こし見積もり依頼。
2019/4/18 書き起こし条件を確認して発注指示。パキスタンから返信あり対応指示。4月リリース用に,280本のテキストファイルと音声ファイルを整理。
(テキストファイル整理)
・話者ごとにテキストファイルを生成。UTF-8 with BOB
・ファイルネームに話者の習熟度レベルを付与し,ICNALEの命名規約に合わせる。
(音声ファイル整理)
・ファイルネームを規約にあわせて変換。
・THAのmp4はmp3に変換。
・あわせてすべての音声ファイルを再度mp3(普通音質)に変換。
・「真空波動拳Lite」で音声ファイルのlength情報をとり出せたがCSV化する際にスタックしたため,手作業でlength情報をエクセルシートに転記し,計算式で秒単位に変換。例:2'30→150。
2019/4/19 ICNALE Spoken Dialogue Baby 0.3の公開開始(ダウンロード)

2019/4/20 ビデオデータの整理開始:英語タスク部とL1振り返り部が一体化しているものとわかれているものがあるので,今回,結合処理に決定。unitemovieを使用し,圧縮済みmp4ファイルを話者ごとに統合。その後rename処理。
2019/4/23 ICNALEのWritten Essaysについてユーザーから寄せられた問題点の確認と対応(CHN_PTJ_A2_mergeファイルの問題を確認。ファイルを作り直してデータを更新)
2019/4/23 SDのファイルネームルールがsoundとmovieで不統一だったので統一(INT/RFLに)。シンガポールと韓国の研究者に新規参加勧誘メイルを発送。
2019/4/24 4月分の会計執行確認

===========================
本年度:3,700,000
英語テープ起こし(竹プラン)381,733
英語コーパス学会春季大会出席 18,760
ICNALEサーバー 54,000
INHIK71 (CHN+TWN)  321,527
Amazon:全37点  84,889
現在残金:2,839,091
=============================
2019/4/28 昨年度の科研実績報告書を作成・送信
2019/4/28 中国・韓国の研究者募集のconfirmationとシンガポールへの協力依頼メイル発送,9月のKobe ConferenceについてTony McEnery氏と相談


◎各国データ収集状況(2019/10/1現在)

================================
A:現在収集中

(シンガポール)
---2019---
★4/28 SNU Ooi氏にメイルで協力依頼
★4/30 Dr. Hongに依頼したとの通知あり
★5/3 Dr. Hongに再度こちらから依頼
★5/10 協力不可の返事

(シンガポール→マレーシア)
★8/3 マレーシアに収集国を切り替え,同国ユーザーに協力依頼
★8/4 一名返信あり(詳細説明し,8/8までに意思確認を依頼)
★8/4 フィリピンチームリーダーに紹介を依頼(8/8まで)
★8/7 返信者にリマインダー送信,返信(収集計画)あり。10/10完了予定。
★8/26 チームAよりトライアル送信,即日フィードバック送信
★8/27 チームBよりトライアル送信,即日フィードバック送信
★9/30 現在総計9人が事前アンケートに回答


~~~~~~~~~~~~~~
B:収集完了分
(日本)責任者:石川@神戸大 100本収集完了・書き起こし完了・公開完了
---2018---
★2018//31  合計97名分のデータ収集
★2018/4/15 合計97名分の書き起こし・音声データの公開完了 
★2018/5/15  合計100名に増量し,Baby 1.0として公開完了


(中国:国内分) 責任者:石川@神戸大 25本収集完了
---2018---
★11/1 前期に申し込み済みでインタビュー未了者にreminder発送
★11/1 新規申込者に連絡
★11/7 追加の2本収集
★11/14 追加の2本収集
---2019---
★1/26 過去の参加者に友人紹介の依頼メイル発送
★1/28 データ収集再開
★2/28 国内収集分25本が完了
★4/15 書き起こし発注


(中国:現地分)責任者:
Vicky, Li Linzhen (李琳幀)@西安理工科大学
---2019---
★3/4 西安理工科大学に協力を依頼(返事待ち→紹介者あり)
★4/17 協力依頼メイル発送
★4/23 督促メイルを発送
★4/28 督促メイルを発送
★4/30 返信あり
★4/30 オンラインフォームに中国国内からアクセス不可を確認
★5/3 オンラインに代わるエクセルシートを送信
★5/3 返信確認
★5/3 属性調査用google driveが使えないためフォームをエクセルに作り替えて送付
★5/13 同じくgoogle driveが使えないため中国データの受け渡しテストとしてbaidu driveを実験。
★5/16 中国データ(トライアル)をbaidu driveで受け取るがDL不可。
★5/18 中国留学生の協力でアカウントの貸与を受け,DLに成功。
★5/20 中国にフィードバックを送信。本収集開始。
★6.27 インタビュー25本が終了
★7/4 データ投函
★7/9 データ受領
★7/11 整理後,書き起こしを発注

(韓国A)10本予定→8本完了
責任者:Sue Woo (Konyang University)
---2018---
★9/5 オンラインフォーム不調の届け出(解決)
★9/18 ファーストインタビュー受け取り
★9/23 フィードバック送信(カメラポジション)
★10/4 参加者リスト連絡(返信あり)
★11/1 reminder発送
★11/1 試験期間で遅れている。12月までに完了予定。
★12/17 これまでに6本終了。追加8人継続実施予定。
---2019---
★1/22 状況確認問い合わせ
★1/23 時間がかかるとの返信あり
★4/17 状況確認メイル送信
★4/22 再度送信
★4/23 返信あり,オンラインストレージで1本が送られてくる。現状6本とのこと。
★5/21 状況確認メイル出すが返信なし。
★5/24 再度送信,返信なし
★6/10 予定数終了との連絡
★7/29 USB送付を依頼

★8/6 送付完了の有無を確認
★8/19 online driveで8本分が送付される
★8/27 終了確認。送金手配。

(韓国B)10本予定→12本完了
責任者:Tecnam Yoon (Chuncheon National University of Education)
---2019---
★7/16 協力打診
★7/19 協力の回答(5~6本)
★7/19 必要書類等送付
★7/30 第1インタビュー終了
★8/2 4本終了
★8/6インタビュー本数の増加を依頼,快諾(10本に)
★8/28 10本目完了。同日2本増加を依頼,快諾(12本に)
★8/29 12本目完了(プロジェクトBとあわせて20本になる)
★8/30 送金手配。

(香港)30本完了
責任者:Charles Lam  Assistant Professor @Hang Seng Management College 
---2018---
★9/1大学での承認手続き中(資料送付済み)
★9/20 香港側で研究承認が取れる
★9/26 機器送付アドレス通知
★9/28 機器送付手続き
★10/3 機器送付。
★10/24 照会(文言換えて良いか,香港は禁煙施行済だがそのままで良いか,ロールプレイで彼女にしたいか・・・の質問は削除で良いか)→同日回答
★10/26 試行版2本が終了
★10/26 フィードバック送信(残響取り,待ち時間短縮etc),同日確認メイルあり。
★12/10 これまでに20人終了。

★12/10 相談の結果2月までに30人取得することに。
---2019---
★1/26 ドライブ上で29本を確認。終了予定日を尋ねるリマインダ発送。
★2/2 規定数完了
★2/4 アンケートとの照合終了,送金準備。

(台湾:Dr Lan-fen Huangの紹介による2名
(チームA)責任者:Ariel Yi-ju Wu  Assistant Professor @Chinese Culture University★8/26 呼びかけ
---2018---
★8.27 参加意思確認
★8/28 希望機器確認
★8/31 マスク+ICを発送(事務預け)
★9/19 上記が先方に到着。12-1月にデータ収集完了予定。
★9/27 収集計画確認メイルを当方より送信。
★10/28 1st インタビューの確認サイトを通知してリマインダ発送。
★10/30 返信あり。被験者募集中。1月までに取る予定。

---2019---
★1/9 トライアルデータ受領
★1/10 フィードバック送信(ロールプレイの行い方,被験者の習熟度等)
★1/14 長いインタビューが良いかの確認質問(即日返信)
★1/21 インタビュー終了。1/24までにアップロード予定。
★1/22 ネームリスト送信依頼
★1/25 ダウンロード完了(25本)・ファイル変換完了(1本音声ファイルが欠損していたが動画より抽出)
★1/26送金手続き開始
~~~~~~~~~~~~~~~~~~~~~
作業メモ
1)m4aの音声ファイルは"123apps"で変換。ビットレート128kbps ステレオ。
2)動画movはmp4に変換。前回導入のwondershareを継続使用。
~~~~~~~~~~~~~~~~~~~~~


(チームB)責任者:Yen-Liang (Eric) Lin, Associate Professor, National Taipei University of Technology
---2018---
★8/26 呼びかけ
★8/31 参加意思確認・希望機器確認
★8/31 送付先住所照会中
★9/1 3点セットを送付(事務預け)
★9/27 機器パック受領の確認を求めるメイルを当方より送信。
★10/4 まだ受け取っていないという返事
★10/4 データ上,9/8に到着済みなので再確認を要請。EG179526748JP
★10/7 再度確認を送信(返信なし)
★10/28 再度督促。返事あり(機器が出てこなかったので大学のビデオで撮影予定とのこと)
★10/29 神戸灘郵便局にEMSの受領者の調査依頼
★11/16 郵便局の回答を先方に通知(返事待ち)
★12/21 トライアル受領
★12/26 フィードバック送信(インタビュワーは同一人物で,ロールプレイは圧迫気味に,フォローアップ質問で発話を引き出す)
---2019---
★1/11 状況確認報告依頼
★1/19 データ25人分受け取り
★1/22 フィ―ドバック(名前リストの提供依頼)
★1/26 アンケート未了につき,督促(2/10までに受領なら年度内に支払い)
★2/21 アンケートデータ受領
★2/22 事務に送金依頼
★3/1 システム入力,送金作業開始


(インドネシア) 30本収集完了・書き起こし完了
責任者:Prihantro @ Universitas Diponegoro
---2018---
★8/24 ファーストインタビュー完了。
★9/27 現在30本データが収集が完了
★9/27 ワークショップ開催可能性について相談。(時期があわず今回見送り)
★10/3 謝金送金法について神戸大事務と協議
★10/16 書き起こし発注。11月中旬あがり予定。
★10/22 神戸大事務より送金手続き開始。
★11/1 アンケートデータとの紐づけにかかる連絡
★11/4 紐づけ確認終了
★11/15 書き起こし(INHIK66) 納品


(フィリピン)

チームA(20名) 21本終了。

責任者:Jessie S. Barrot  Professor / College Dean@ National University, Philippines
★ビデオ撮影機器を手配・今週中に発送予定。
---2018---
★8/31 パック発送(事務預け)
★9/24 不着の届あり。
★9/24 調査の結果税関留め置きになっていることが判明。対応を依頼。(返事待ち)
★9/27 返事を督促
★9/27 返事あり,郵便局でpick-up予定。
★10/5 ファーストインタビューデータ受領。
★10/7 フィードバックを返信。
★10/27 予定の20本のうち,17本が終了。(TaskとReflectionが切れていないので当方で作業が必要)
★11/6 データ(21人分)受領。
★11/12 アンケートデータdue(学生告知済み)
★11/14 紐づけのエラーについて照会,解消。
★11/15 謝金送金手続き開始。
★Jessieデータは分量バランスのために扱いを保留中

チームB(30名) 40本終了・書き起こし発注・納品済み

【総括】Joan Y. Agdeppa@International College of Manitoba, University of Manitoba, Canada

【収集1】Karizza P. Bravo-Sotelo @Mapúa University, Philippines
【収集2】Rafael Paz @Polytechnic University of the Philippines ★ビデオ発送手配。

---2018---
★8/31 パック発送

★9/4 発送済み通知と手順説明

★9/12 Agdeppa氏経由でMapuaからの質問状到着(データ権利関係)。返信発送。

★9/19 Mapuaの承認が取れる。

★9/20 当方より条件再確認メイル。

★9/27 First interview予定問い合わせ。

★9/27 Mapuaからさらにオンラインアンケートとインタビュープロトコルの提出依頼。即日対応。Poly Uの承認は取れている。

★10/3 ファーストインタビュー準備中。サンプルデモファイルへのアクセス不可との連絡。ファイル自体を送信。同日受領確認。

★10/24 各チーム20本,合計40本が終了。アンケート未了を確認。至急取ることに。
★10/28 Mapuaの14人からアンケート収集。Mapuaの18a動画とPolytechの参加者名リストを再度要請。返信あり(18番ビデオの紛失を確認→データ回復を試みてダメなら除去予定)
★10/28 音声データを書き起こしに回す
~~~~~~~~~~~~~~~~~~~~~
作業メモ
1)Mapuaのm4aの音声ファイルはmp4 to mp3 converterで変換。ビットレート128kbps ステレオ。
2)動画movはmp4に変換。前回導入のwondershareを継続使用。
~~~~~~~~~~~~~~~~~~~~~
★11/19 ビデオの日本への発送を確認(送り状を確認)
★11/19 先方依頼に応じ,プロジェクトへの参加の証明書を発行・送付
★11/19 神戸大より送金プロセス会誌
★11/26 ビデオが日本に到着。課税されていたので,貸与品の返却であることを申し出し,非課税対応に。
★11/27 ビデオ等を受け取り。
★12/5 書き起こし(41本)納品完了。

(タイ)(チームA)20本終了。

Rinda Warawudhi    Assistant Professor  @Burapha University Chon Buri, Thailand

---2018---
★詳細計画返事待ち(8/29)
★返信あり(9/7)。機器不要。9/20までにトライアル完了予定。その後1か月で20本収集予定。

★9/27 トライアル未着のため督促メイル送信。

★9/27 返信あり。機器トラブルで9/20インタビューは中止。10/4に取り直し。

★10/4 ファーストインタビュー受け取り

★10/7 フィードバック送信。

★10/28 状況確認メイル発信。11月初旬に次のインタビュー。その後2週間以内にアップロード予定。
★11/2 五人分の音声データ受領。謝金関係も確認。
★11/6 ビデオ20本,音声17本を受領。音声の不足3本について照会。
★11/14 関連付け欠損データの確認
★11/15 神戸大より送金手続き開始



(チームB)21本終了。

Dr. Kemtong Sinwongsuwat @ Prince of Songkla University-Hat Yai (スーパーバイズ)

Mr, Kornsak Tantiwich (Tap) Prince of Songkla University-Hat Yai(インタビュー

---2018---
★9/14に参加意向伺い

★9/27 再度参加意向確認状の督促。

★9/27返信。機器は不要。ファーストデータは11/5予定。
★10/20 ファーストデータ受領,同日付フィードバック送信
★10/28  初回本番(11/5)インタービューに向けての注意を再送信
★11/6 第1回インタビューとして5本を受領

★11/23 データ受領確認。送金手続き開始。

(チームC)
Dr. Payungsak Kaenchan @ Mahidol University
★詳細回答受理。機器送付不要。実施要項説明(8/29)
★データはMahidolではなく Nakhon Pathom Rajabhat Universityで取る
---2018---
★9/5 承認手続きの関係で書類送付依頼あり。同日発送。
★9/27 状況確認メイル データが取れるのは中間試験期間以後の見通し。
★10/5 20人の被験者確保できたとの通知
★10/5 実施前にonline protocolを見るよう依頼
★10/24 学生の1名からonline questionnaireの不調申し出。調査したが問題なくその旨回答。
★10/26 問題解消。
★10/28 ファーストインタビューを送るよう再度依頼。
★10/31 大学で承認が下りなかったので別大学で検討。
★11/8 別大学でも承認下りずプロジェクト離脱。



(パキスタン) 20本(25本中)
責任者:Moazzam Ali
----- 2018 ------
★8/1 返信あり。2回試行。初回はノイズ多く破棄。2回目は時間が予想以上にかかって途中で学生が授業に出たので中断。→無音室使用許可取得して計画練り直し。8月中に初回データを取りたい。★8/9 データ収集予定の再確認
★8/14 当方より計画確認通知と,オンライン調査の念押し。
★9/27 再度状況の確認と督促。
★10/7 ファーストインタビュー結果受け取り。即興質問が多かったので厳密にプロトコルブックに従うようフィードバック。
★10/8に追加インタビュー実施予定とのこと。
★10/19 4人分終了(音声のみドライブで確認)

★11/19 15人分修了との報告(未確認)+アンケートサイト動作不良報告,「11月中に終えたい」
★11/19 サイトURL再通知とアップロード依頼(アップロード未了)
------ 2019 -------
★1/11 確認依頼メイル送信(返信なし)
★4/17 状況確認メイル送信
★4/18 返信あり,4/23に追加インタビューしてコンプリート予定。
★4/24 確認メイルあり。インタビュー終了。本日郵便局よりビデオ発送とのこと。
★4/24 質問表未回答のため,質問票リンクを送信。
★4/28 状況確認メイル送信。
★5/14 パキスタンからのデータが到着,同日変換作業
★5/24 パキスタンへの送金事務作業開始
★7/11 書き起こし発注


(中国チームC)途中解散
Clark Cheung @ Central China Normal University
--2018---
★10/16 怪我等で今年度は難しいとの連絡あり★4/23 再度参加意思を問い合わせ
---2019---

★4/27 時間がかかるが可能との返事。8月末期限を示して再度以降確認。
★5/3 現在 返信なし(※チームBが立ち上がればCは解散検討)
★5/8 期限を延長を求められる
★5/24 最終年度のためお断りを出す
====================================================================


◎月次進捗報告

【2019年3月】
2019/3/24 納品済みのフィリピン,香港,インドネシアデータをエクセルのtranscriptシートに移してデータクリーニング

・・・・・・・・・<transcriptデータクリーニング作業メモ>・・・・・・・・・・・・
1)ワードの書き起こしデータをエクセルに張る(空行が各行で入ることもあるがままで)
2)IDN_001等,発話者コードはその時に一緒に振る
3)【重要】発話順序が復元できるよう作業用のIDN_000001 .... 0000002 ....等を振る
4)作業後,発話列でソート
5)[T]は左列に[T]を,[E](Examinee)は左列に[S]を
6)その後発話列の[T]と[E]を削除
7)Turnで並べ替えてTurnコード欠損列を出す(前からのつながりの一部や,[T]のコーディング落ちなど)
8)適切な発話者コードを追加
9)[...]だけで1行になっている行は削除
10)発話行には下記のようなタグが入っているので発話行を別列に転記
[Overwrapping] [overwrapping] [Overlapping] [Uncertain] [Unclear] [Japanese]  [ph] [X?] 補い,別語示唆
11)Excelの置換機能で[*]で処理する。
※秀丸の正規表現でやると失敗する(消えすぎる)ので注意
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・

2019/3/3 台湾2の支払事務を実施。
2019/3/1 ICNALE Online運用版に移行
・修正内容:トップ画面のグレイアウト外し,About データの差し替え,ポップアップ画面内の改行追加(S/Tの切れ目がわかるようい),ポップアップ画面の名称をSentence→Transcriptに

【2019年2月】
2019/2/21 今年度最終分の台湾2のデータ



【2019年1月】

2019/1/10 台湾のトライアルデータへのフィードバック送信

【2018年12月】
2018/12/25 ICNALE Online検証版アップ
2018/12/21 Elsevier論文に修正採択通知
2018/12/5 フィリピン40本の書き起こしが納品
【2018年11月】
2018/11/30
送金手続き完了
PHL:JOAN AGDEPPA(40本)
PHL:JESSIE S. BARROT(20本)
THA:RINDA WARAWUDHI(21本)
THA:KORNSAK TANTIWICH(21本)

2018/11/16 資金計画
======================================
現時点残金 B科研:230万 運営費交付金:50万?
支出予定 ▲280万
(書き起こし費)
・フィリピン(40人)▲28万(確定)

(収集費)220万?
・タイ (40人)▲42万(確定)
・フィリピン (40人)▲40万(確定)
・韓国(20人)▲30万 ?
・台湾 (40人)★60万 ?
・香港 (20人) ★30万 ?
・パキスタン(20人)★20万 ?
(出張費)
・マルタ 35万?

※書き起こしについては(収集が順調にいった場合に)予算不足になりうるため,次年度回しを検討。
========================================
2018/11/15 インドネシア書き起こし受領
2018/11/15 フィリピンA,タイAに送金開始

【2018年10月】
2018/10/26 フィリピンチームBの20本を書き起こしに
2018/10/27 フィリピンチームA 17/20完了
2018/10/26 香港開始
2018/10/22 インドネシア送金手続き

2018/10/16 インドネシア書き起こし発注

【2018年9月】
2018/9/26 ENS20+JLE100のタスクコーディング済み発話データの整理が終了。業者に送信。

2018/9/25 ENS20+JLE100の動画データの整理が終了。業者にFTPで送信。
2018/9/3 台湾にparcel 発送

【2018年8月】
2018/8/31 資金執行状況の確認
執行済み(入力済み・引き落とし前分含む):225万
執行残:345万
今後の主な支出予定
・パキスタン,台湾,フィリピン,韓国,インドネシアでの収集謝金 150万程度
・タスク切り替えタイミングの音声データへのタグ付け作業経費 20万程度
・後期海外学会発表 35万程度×2回

2018/8/29
下記,現状をアップデート

2018/8/27 新規協力者内定
(香港)Charles Lam  Assistant Professor @Hang Seng Management College
(台湾)Ariel Yi-ju Wu  Assistant Professor @Chinese Culture University

(台湾)Yen-Liang (Eric) Lin, Associate Professor, National Taipei University of Technology
(フィリピン)Jessie S. Barrot  Professor / College Dean@ National University, Philippines
(フィリピン)Joan Y. Agdeppa(連絡)International College of Manitoba, University of Manitoba, Canada
(フィリピン)Karizza P. Bravo-Sotelo (実施)Mapúa University, Philippines
(フィリピン)Rafael Paz(実施)Polytechnic University of the Philippines ★ビデオ発送手配。
(タイ)Rinda Warawudhi    Assistant Professor  @Burapha University Chon Buri, Thailand
(タイ)Dr. Payungsak Kaenchan @ Mahidol University

2018/8/26 全国英語教育学会関連発表聴講メモ
夏苅佐宣先生「スピーチタスクの繰り返しとフィードバックのもたらすもの」
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
・同一タスク・類似タスクの反復でCAFはどう変化するか?
(関連研究)
Bygate, M., Skehan, P., Swain, M. (Eds.). (2001). Researching pedagogical tasks, second language learning, teaching and assessment. London: Longman.
・同一タスク反復効果検証

Thai & Boers (2015)
・4/3/2型反復→F大きく向上,A不変,X不変
・2/2/2型反復→F不変,A向上,C向上

Lambert et al. 2017
・タスクセット(対話,物語,意見表明)×相互実施(聞き手/話し手)×パートナー代えて6回
・4回反復時までは流暢性向上(以降は頭打ち)

Natsukari (2012)
・同じトピックについてのプレゼンを1学期間反復
・流暢性向上(語数アップ,非流暢性現象低下)

文法的正確性の見方
・義務的生起箇所分析 obligatory occasion analysis
・石川補注:センテンスないしパッセージ内で,調査対象とする文法表現(例えば過去形)が使われるべき箇所に関して,そのうちいくつで,学習者が当該文法表現を使えているかを示す比率。I <thought> that it <was> cold and I <had >to go there.なら,3/3=100%。OOAは使用すべき箇所での過小使用のみを扱う指数であり。使用すべきでない箇所での過剰使用を加味した指標はtarget-like use analysisという。参考:http://www.u.tsukuba.ac.jp/~ushiro.yuji.gn/ SLA用語集

実験結果
・反復練習により流暢性はWPMで60語台から100語台まで上昇したが,AとCは不変だった。
・・・・・・・・・・・・・・・・・・・・・・・・・・・・・
◎プロジェクトへの示唆→ICNALE Spokenの反復データ収集計画について,SLA研究をふまえた説明が必要

2018/8/26 協力者関係
フィリピンより1名の協力者を確保。台湾では過去の協力者より2名の紹介を受けて再度コンタクトを行う。

2018/8/26 協力者募集追加
香港:5名(Form A)
韓国:9名(Form B)
フィリピン:3名(Form A)
中国:11名(Form A)
台湾:10名(Form B)
タイ:7名(Form A)
※9月5日期限

2018/8/25
オンライン検索システム開発企業への発注指示詳細の提出
コーディングアルバイト募集可否の照会

2018/8/10-25
発話データへのコーディング(タスクタイプタグの付与)

2018/8/24 インドネシアデータ追加受領
20人中7本終了

2018/8/14 インドネシア初回データ収集完了

2018/8/9 インドネシア初回データ収集
避難訓練により延期


2018/8/9 パキスタン協力者に予定の再確認メイル送付
インタビュースケジュール提出の再依頼

2018/8/7 データ変換作業開始
収集済みの日本人のインタビュー動画データ(1個2GB)を順次圧縮してmp4に変換(1個70MB程度)
※変換パラメタセットの記録

解像度 240*160 ビットレート 128kbps

2018/8/7 ICNALE Onlineの新システムの開発作業指示書を策定・業者に指示出し

2018/8/6 韓国共同研究者よりインタビュースケジュールの通知あり
(1) The first Interview for a pre-check: Will send the data by 9/21.
(2) The other interviews (19 interviews): Will send the data by 11/09.
※参考:インドネシアスケジュール
(1) The first Interview for a pre-check: Will send the data by (august 14th).
(2) The other interviews (19 interviews): Will send the data by (September 29th).

【2018年7月】
2018/7/11 中国人留学生データ11名分の取得を完了(前期までに20名を確保予定)
2018/7/3- ICNALE Onlineのメンテナンス作業開始(Edited Essaysのデータ追加&Spoken Dialogue用のフレームワーク開発)
2018/7/3 インドネシアでのデータ収集予定の再調整が完了
 (1) The first Interview for a pre-check: Will send the data by (august 14th).
 (2) The other interviews (19 interviews): Will send the data by (September 29th).
2018/7/3 インドネシア・韓国・パキスタン担当者にデータ収集予定を再確認(返事待ち)。

【2018年6月】
2018/6/24 国立国語研究所宇佐美科研会議
・会議にあわせて,会話分析の概要メモ作成
========================================
会話分析の概要メモ(石川慎一郎 2018/6/24)
※Wikipediaの記述,および,西阪仰氏の関連サイトの記述を整理しました。

※本項目に対するWikipediaの記述は学術的に極めて正確なもので,おそらくは西阪氏ないし門下生の手によるものではないかと思われます。専門家による学術情報の社会的共有に深く敬意を表します。

(2つの起源)
A:会話そのものを研究対象とする(UC Barkley ゴフマン)
B:社会メンバーによる秩序構成の営みをボトムアップ的に記述(ガーフィンケルの「エスノメソドロジー」)

(サックスによる会話分析の創始)
・サックス:LA自殺防止センターへの相談電話分析→本名の言及を避ける特殊な会話上の方法を見つけ出す→会話分析へ

(会話分析の手法)
・会話の完全な転写
・ジェファーソンによる記法が標準

(会話分析の鍵概念)
●会話は連続的であり,やりとりのペアで構成される
・行為連鎖(sequence organization)(発話によってなされる行為は連鎖的に行われる)
・順番交替(話し手は無意識のうちに終結予告を出す→次の発話は,指名された人か,次に話し始めた人か,旧発話者(継続)かのどれか。1つの発話の終わりごとにこの手続きが繰り返されている)
・隣接ペア(挨拶―挨拶/質問ー回答など。第1成分→第2成分)
・拡張連鎖(先行連鎖:前振り・前置き,挿入連鎖:入れ子的な意図確認・情報確認,後続連鎖:付け足し)

●会話では,デフォルトの反応が存在する
・優先構造(preference):肯定的応対の優先性(依頼に対しては拒否より受託のほうがやりやすい)

●会話では,トラブルがあってもその中で解決される
・修復:「トラブル源」認識→「修復の開始」(会話のループの外に出る合図)→「修復操作」→会話のループに戻る。自己開始修復と他者開始修復

●会話では,常に相手への配慮が働いている
・認識原則(epistemics)(知っているかどうか(新情報かどうか)確認してから話すなど,相手の知識状態(status)を考慮し,相手に配慮(recipient design)して,自身の認識的な態度(stance)が決まる。英語では文型で,日本語では終助詞で表現)
・表現選択(formulation; word selection)(相手の知識状態により,人・場所・時間に対する優先的言及方法が変わる)・行為形成(発話の字面の裏に意図された行為(依頼・命令・質問など)を読み取る。行為は発話連鎖内の位置やデザインで変化)

●会話では,言語以外の要素も重要
・マルチモダリティ:視線,身体の向き[PCから顔を上げない/上半身だけ振り返る/椅子ごと振り返る],プロソディ(文末をあえて下げずに会話継続),身体的行為(指差し,ジェスチャー、うなずき),道具(会話の際に使っているもの)

●会話分析は,自然会話にも特殊会話にも適用可能
・制度的場面(通例,ノールールの日常会話を対象とするが,誰がどれだけ話すかがある程度決まっている制度的会話(教育・法・医療)を研究することも)

基本文献
Sacks, H. Schegloff, E.A., Jefferson, G. 1974 A Simplest Systematics for the Organization of Turn-Taking for Conversation. Language50 (4)
Sacks H. 1992 Lectures on Conversation
Schegloff, E. A. 2007 Sequence Organization in Interaction

======================================
2018/6/21 検索システムの再見積もり受領→発注処理
2018/6/15 インタビュー新規2名(現在5名完了)/検索システム再見積もり依頼
2018/6/14 JALT-Voc SIGのための依頼原稿が脱稿 英文校閲に回す
2018/6/3 中国人留学生14名の実験日程調整と告知
2018/6/2 ICNALEを用いた研究報告がGLOCALL2018@Sizhou. Chinaで採択
2018/6/2 ICNALE論文の英文校閲あがり・再送

【2018年5月】
2018/5/31 ICNALEデータによる論文(2本)を投稿
2018/5/28 韓国側で実験パック受けとり(※先方学内で留め置きになっていて20日かかる)
2018/5/22 パキスタン側で実験パック受け取り確認(※税関留め置きになって課税対象となり30日かかる)


2018/5/21 オンライン検索システム見積もり(1次)受け取り・内容検討して継続審議へ
2018/5/15~ 中国人留学生申し込み受付(14件)
2018/5/14 中国人留学生インタビュー(1件目)
2018/5/7 韓国へ実験パック送付
2018/5/3 科研初年度実績報告書オンライン提出










【2018年4月】
2018/4/26 中国人留学生用実験協力者募集開始
2018/4/26 インドネシア側で実験パック受け取り(所要6日間)
2018/4/20 パキスタン・インドネシアへ実験パック送付
2018/4/13 新ウェブサイト公開・新データ公開(Spoken Dialogue Baby(初年度に収集した日本人97人分)が初公開,また,Edited EssaysのESL圏B1_1学習者データを追加)
2018/4/9-13 ICNALEウェブサイトの全面更新
・ページの整理
・4モジュールの解説の追加
・階層化ナビの新設によるサイトの全体構造の可視化
・新しいTerms of Useの掲載
・第3回シンポジウム記録の英語化
・オンライン検索サイト用のguide.htmlの情報の整理(A to Zのグロッサリ化)
・ソースの整理(書式のspanタグなどをすべて除去してhtmlをシンプルに変更)
・CEFRの習熟度関連付けの根拠サイトなどのdead linkの整理(※ETSによってTOEFLのB2基準が引き下げられていたことを確認し,新たに注記を加える)


旧サイト


新サイト

2018/4/10 プロトコルブックの改訂を行い,インドネシア・パキスタンに送付
2018/4/9 パキスタンより受託の回答
2018/4/6 インドネシアより受託の回答
2018/4/5 海外共同研究者にデータ収集への継続協力依頼発送(韓国は前回協力者から不可の返事があったため,別の研究者に照会中)
2018/4/5 LCSAW事業(シンポ・論文集)の拡張として,日本文体論学会との共催でシンポ開催を決定。発表予告を出す。
2018/4/3 補助金請求にかかる事務作業(オンライン)

【2018年3月】
2018/3/22 Focus on Language 2018(ドイツ,フライブルグ)で構築中のICNALE Spoken Dialogueについて口頭研究発表
2018/3/21 日本モジュールN=97のデータの整形・切り分け・コーパス化の作業が完了
2018/3/20 NSデータの取得が完了。


※収集したNSインタビューデータシートの一部

2018/3/20 神戸大学オンラインアーカイブでのLCSAW3の公開が完了 こちら
2018/3/15 LCSAW3論文集の寄稿者への発送,国会図書館への納本,神戸大学電子アーカイブへの登録申請



2018/3/12 LCSAW3 論文集納品
2018/3/8 神戸大学×シンガポール南洋工科大学でのジョイントシンポジウムでICNALEについて紹介。報告
2018/3/1 NSデータ収集の打ち合わせ@JR大阪グランフロントナレッジキャピタル


【2018年2月】
2018/2/28 10本分の書き起こし完了
2018/2/19 現在97本完了しているものの,春休みに入り,残り4本(スペア含めて101で収集予定)の収集が難航中。予算執行期限との関係で,97本目までの10本分を先行して書き起こし発注。あわせて残り4名の募集に努める。
2018/2/16 LCSAW3 論文集初校が出る。同日付でオンライン修正報告ページを作成し,執筆者に校正依頼。
2018/2/8 オークランド大学Michael Barlow教授神戸ミニレクチャーを実施。実施報告
2018/2/6 LCSAW3論文集発注(データ送信)

【2018年1月】
2018/1/31 LCSAW3修正論文投稿期限(修正論文を回収)

2018/1/31 LCSAW3論文集用に,ICNALE Spoken Dialogueの概要を示した巻頭論文を執筆
2018/1/29  LCSAW3論文集見積もり依頼
2018/1/14 LCSAW3論文集投稿論文に対し,フィードバックを作成・送信
2018/1/10 LCSAW3論文集投稿期限(投稿論文を回収)
2018/1/05 データ収集再開
2018/1/05 年末発注データの納品(累計87本の文字書き起こしが終了)

【2017年12月】
12/16 INHIK51-52発注(英語・日本語21本 ※累計87本)

12/18現在87本。年度内に13本を追加し,国内モジュールをコンプリート予定。








【2017年11月】
11/29 後期データ収集分を含め,累計データがN=77になる。

【2017年10月】
10/1 英語コーパス学会で基調講演(ICNALEプロジェクトの進捗を報告)
10/17 神戸大学特別講義「神戸大学の研究最前線」で講義(ICNALEプロジェクトの紹介)
10/28 文体論学会で基調講演(ICNALEを用いた学習者産出文体研究の可能性について報告)

【2017年9月】
9/8-9 GloCALL学会にて研究発表
9/6 INHIK50納品(日本語66本)
9/25 INHIK49納品(英語52本)

【2017年8月】
8/4 国際シンポLCSAW3開催。70名の参加を得て盛会裏に終了。報告こちら
8/8 前期最終実験の終了
8/10 前期分のまとめの事務処理
・クオカード支払い台帳提出(建て替え払い14名分+前期実験52名分=66名分の実験及び支払い事務が終了)
・クオカード残:第2次購入分40人分―研究室保管3人分ー事務保管35人分=残38人分
8/11-12 既存のICNALEのデータ整理・プロジェクトウェブサイトの情報更新
8/12 66本のファイルのうち,日本語インタビュー部分を切り分けていなかったmp3データをaudacityで分割
(範囲指定→Ctrl Bでトラックマーク付与→複数ファイルとして書き出し)




・TSKa(インタビュー本体)とRFLa(L1の振り返り)の2種にわけ,全てのデータに発話者の習熟度属性情報を付与してrenaming
・書き起こし完了分の14本を除く52本について新規作業発注
8/13 引き続き,日本語リフレクション部分を発注。
(参考)mp3と長さの関係について(128kbpsの場合)60sec=960KB=0.96MB
※今回送付の日本語リフレクションデータ521MB → 521/0.96=約543分
8/14 ・英語書き起こし指示書の英訳と業者への送付
・ビデオデータの整理:連番付与,分割ファイル統合など(66人分)




===========================
記録1 (特記事項ありデータ)
#002 冒頭箇所でビデオカメラが作動不良。中途より録画開始。
#010 途中でマスクがきつく気分が悪くなったため,本人申し出により一時停止。マスクを外し,休憩後再開(ファイル結合処理済み)
#013 マスクが途中で落下。つけなおしてインタビュを再開(ファイル結合処理済み)
#048 ロールプレイ冒頭で被験者が実名を出したため一時中断してそこから取り直し(ファイル結合処理済み)
#059 同上理由
===========================

==========================
記録2 動画ファイル編集方法
元データ(movファイル)の品質を落とさずに加工するため,複数ソフトを試用した結果,最終的に,フリーウェアの動画音声ファイル結合ツールであるUnitemovie V2.11およびCutmovie(http://red.sakura.ne.jp/~anonymouse/)をプロジェクトで使用することに決定。
同ソフトはQuick TimeのAPIをそのまま利用してノンロス加工を行う。
なお,音声については,従前どおりAudacityで処理,
ソフトウェア著作権者表示 Copyright (C) 2002-2007 AnonyMouse Under GPL
===========================



-------------------------------------------------------------------
【2017年7月】
7/10 LCSAW3用のポジションペーパー締め切り
7/11 上記印刷にかかる見積もり依頼
7/12 データ収集状況の中間報告(第1次データ取得 2017年度前期)
申込者延べ数 N=60
実験終了者数 N=37
第1次書き起こし発注済数 N=14















全体のバランスは次第に良い感じになってきています。A2が相対的に多いですが,日本人英語学習者の実態という点ではおよそ妥当なものではないかと考えます。

7/13 LCSAW3ポジションペーパー業者入稿
==================
7/12 入稿(7/13に延期)
7/21 校正提出(PDF)
7/27 校正お戻し
7/28 校正予備日
7/31 校了
8/1 印刷
8/2 製本
8/3 製本・発送
8/4 納品
==================

7/14 第1次データ納品
ワードファイル形式で14本分が納品されました。
1) ENG_20170619_01.mp3
2) ENG_20170619_02.mp3
3) ENG_20170619_03.mp3
4) ENG_20170619.mp3
5) ENG_20170621.mp3
6) ENG_20170621.mp3
7) ENG_20170623.mp3
8) ENG_20170623.mp3
9) ENG_20170623.mp3
10) ENG_20170623.mp3
11) ENG_20170623.mp3
12) ENG_20170623.mp3
13) ENG_20170623.mp3
14) ENG_20170623.mp3
■ 合計収録分数:475
■ 納期:2017年 7月14日 (金) 15:00 (JST)

7/15 大学英語教育学会東アジア英語教育研究会
納品されたばかりのデータの一部を大急ぎで加工し,表記研究会でICNALE Dialogueの紹介を行いました。納品されたワードファイルをエクセルに落として,1ターン1行形式に整形し,インデックスをつけて,タスク別,話者別(インタビュワー,受験者)など,さまざまな形でデータを取り出せるようにしています。ざっと見ただけですが,非常におもしろいターン転換などが観察され,分析が楽しみです。












7/21 LCSAW 論文集(Position Papers)校正・戻し
7/31 データ収集N=60に
※現時点での能力バンド分布(前期中の申し込み済み・収録未了分含む)








-------------------------------------------------------------------

【2017年6月】
6/2 新しいオンライン検索システムのエントリーページのデザイン作成


モジュールの命名,全体のイメージ図の作成は極めて重要な作業です。先月から全体の構造の再定義を行っており,現段階では上記のような概念図を定め,そのまま,それを検索システムのエントリに使用することを考えています。要は,コアモジュールとペリフェラルモジュールの違い,Edited Essaysの位置付けが直観的にわかるような構造概念図が必要になると思われます。

6/5 被験者募集チラシ作成・大学生協内掲示開始・オンライン調査票作成・申込者対応



ようやく,データ収集の準備が整い,募集に入りました。早速申し込みがあり,今後,データ収集を体系的に開始していきます。

6/5 撮影用機材購入
複数方向からの音声を高い精度で記録し,かつ,記録用の画像を同時に残せるものということで,各種機種を検討した結果,Zoom Q4を選定し,発注手続きを行いました。


6/6 OPIプロトコル検討メモ(文献3本の読解)
◎SST Manual(アルク 2000)
※日本にOPIを広めた重要なテスト。10年前に研修を受講。最近は電話テストに移行。

(概要)
・全体10-15分
・ウォームアップと初期評価→一枚絵を使ったレベルチェック(プローブ)→ロールプレイ→連続画を使ったレベルチェック(プローブ)→ワインドダウン
・レベルチェック=下限推定(この程度までは正確に話せる・維持できるというレベル)
・プローブ=上限推定(補助具を使って限界レベルまで高次の産出を引き出す(pushing))
※上下限推定で注目すべき特徴・・・答えられない,日本語使用,ためらい・言葉探し・連続的あやまり,混乱の身振り,連続性・一貫性の棄損
・評価=言語機能+内容の広がり
・高次の発話がどの程度維持できるか:瞬間(peak),ある程度(mountain),かなり継続(mesa)

(試験官側発話の留意点)
Yes/No, Either A or Bは初級限定で。
クローズエンド(what, where...)
オープンエンド(why, how)
    比較と対比(中級以上)
  仮定法(上級に限った例外的用法)
・個々の質問は論理的につながりを持つこと
・affirm, reconfirm, tag, interest, surprise, supportを示す
・過剰にゆっくり話さない,返答を訂正しない,返答を遮らない,せかさない,自分の意見を言わない

(ウォームアップ)
・家族・学校での暮らし・学校への好き嫌い・好きな場所・趣味
・なぜその趣味が好きになったのか,なぜその学校を選んだのか,前の学校との違い,先週末やったこと

(ロールプレイ)
・Now we are going to do role play. Please read this card, and when you are ready, I'll begin....
・ユーモアや楽しさがあっていいがほとんどの発話は被験者にさせること
 ・絵描写とは違う内容にすべき
・レッド(初級下・中 ※特段に低い人のみ),ブルー(初級上~中級下)~イエロー(中級中~)
・日本語カードを被験者に渡し,試験官側の発話でスタート(May I help you?など)
・イエローで4分,レッドは1分,その他2~3分ずつ
・ブルーでは被験者に主導権を握らせる
・イエローでは複雑な利害対立を前提。試験官は最初から手伝わない,交渉に応じない
・全体11-13分(初中級は絵描写で考え込んで長くなりがち)

(絵描写)
・絵描写にはfollow-up questions,
・中級=Tell me about/ Do you like..?/ What's the dif between A and B? What happens when you...?
・上級=こんな経験はあるか? 自分の町の変化,~を買うのに苦労したことは? ~と~を比較する,どうやって~を避ける? What do you think about X? 

◎山内博之(2005)『OPIの考え方に基づいた日本語教授法:話す能力を高めるために』ひつじ書房
※日本語教育のみならず,英語教育や,OPI的なデータ収集法の研究にとってきわめて有用な参考書
・ACTFL 最長30分
・遂行能力はタスクと場面でダブルで見る
・中級=意味ある内容を模倣でなく創造+日常場面
・上級=詳細説明・叙述+ほぼインフォーマル
・超級=裏付けある意見表明・仮説構築+フォーマル,インフォーマル
・言語の質は,文法・語彙・発音の3観点で
・言語能力は社会言語学的能力(敬語,くだけた表現)・語用論的能力(相槌,ターン,ハイライト)・流暢性(ブレイクダウン発生頻度の少なさ)の3観点で
・場面+話題+言語機能=総合的タスク(p.16)
・レベルチェック(できることの確認)→probe/突き上げ(できないことの確認)
・出来ないことを示さなければ能力上限が決まらない
・言語的挫折データ
・被験者の得意分野での発話に影響されないよう
・スパイラル突き上げ(話題は同じでレベルが上がる)eg 家族何人→親とどこが似ているか→核家族化への意見
・トリプルパンチ(ストレートに聞く→こちらの反論に再反論させる→仮定的状況を論じさせる)eg ~についてあなたの意見は?→もしそうすると・・・となってしまって問題では?→もし~すると・・・にどんな影響があると思いますか?
・意見とは裏付けのあるもの。トリプルパンチで裏付けを引き出す
・ロールプレイは場面持ち込み型と現実そのまま型,サバイバル型(忘れ物をしたので店に電話する)とエンジョイ型(友達の買った電気製品について
・上級ロールプレイ=話し方のスタイルを変え,裏付けを言わせる

Adlphs & Carter (2013) Spoken corpus linguistics: From monomodal to multimodal (Routledge)
※ジェスチャー分析を組み込む。音声+動画を記録する本プロジェクトの狙いにも関連。

Introduction
・発話コーパス研究はrelatively few
・発話には書き言葉と異なる言語使用パタンあり
・テキストだけ=monomodal
・テキスト+ノンバーバル言語=multimodal(textual, prosodic, & gestural)"new direction"
・monomodal分析では談話構成+会話のやりとり(discourse marker+MWU=発話に特徴的)
・multimodal分析ではテキストとジェスチャーのalignment
・頭と手をどう動かすか+プロソディを変化させて効果を生む

(Monomodal)
1 Making a start: Building and analyzing a spoken corpus
・London Lund(Svartvik, 1990
・CANCODE(McCarthy, 1998,英+アイルランドで500万語)
・Limerick Corpus of Irish English (Farr et al. 2004)
・Hong Kong Corpus of Spoken English (Chen & Warren, 1999, 2000, 2002)
・MICASE(Simpson et al., 2000)
・BNC Spoken
・COBUILD Spoken
・ICE
・English Profile Cambridge Learner Corpus
・研究の対象:語彙,文法,談話辞(discourse particle)
・研究ジャンル:法廷発話,メディア談話,言語習得,ヘルスケア会話
・研究焦点:語彙頻度から談話へ行くか,談話の質的分析で始めるか
・コーパス構築に関するSinclairの9理念:言語(の質)ではなく伝達機能で資料を選定,代表性,均一性,構築基準はシンプルに,タグは別に,途中で切らない,関連情報は別途で詳しく,均衡性,主題は外的基準で分類
・発話コーパス研究の3過程:記録,書き起こし(コーディング,マークアップ),管理と分析
・被験者,場所,状況についての情報を記録
・自然発話では記録し忘れと後で復元できない
・Video recordings of spoken interactions are becoming an increasingly important alternative to pure sound recordings (p.8)
・自然発話では1時間で1万語
・メタデータ(ヘッダ情報
・同意と匿名化
・録音への同意と公開への同意は別
・一度公開されてしまうと公開撤回の要求には答えられない
・音声変換は有効だが音韻分析には不適かもしれない
・動画内の顔にはshadow/ blur/ pixellate処理できるが表情研究などはやりにくくなる
・書き起こし記法も乱立
・Network of European Reference Corpora (NERC):Cobuildで使用
・TEI: BNCで使用
・London-Lundはプロソディも書き起こし
・Linear 直線的記載(発話順)vs Column 表型記載(発話者別)vs Line-aligned 一列式連鎖記載(楽譜風)
・分析実例(LIKE)
・書き言葉頻度の5倍
・discourse markerとしての用法
・1)直接話法を導く(she was like "I don't want..." 発話動詞の代わり),2)比較と説明(新情報を導き議論を展開する)

Corpus & spoken interaction: MWU in spoken English
・慣用連語
・BNC spokenの高頻度MWU 
・of the / in the / I don't know/ a lot of / the end of the/ at the end of the (day)
・you know, I thinkなども高頻度=discourse marker
・対面(face)の保護,意図的な韜晦などの用法も

From concordance to discourse: Responses to speakers
・response token(相手の話に対する軽い相槌)
・CANCODEではyeah yes right/ oh year oh right/ I don't know oh I seeなど
・20代女性の場合,機能は,convergence> engaged> continuer > info receipt

Case studies
・研究Ⅰ:香港の学生コーパスとCANCODE比較
・学生はDMとしてのand so yeah right you know well now 等を過小使用するがbut I think because yes は過剰使用
・研究Ⅱ:英語講義
・actually again lightなどが多用される

(Multimodal)
Sound evidence: prosody and spoken corpora
・De Cock(1998)音声がなくて書き起こしだけならyou knowが文字通りの意味かDMか判断不能
・どこまでコーディングするか?
・London-Lund :tonality(音調的境界を確定)+tonicity(音調上の核を確定+pitch rangeの3つ
★参考 tonicity: [All] cats don't like [dogs]・・・どちらにアクセントあるかで意味が転換(深沢2000)
Halliday (1967) がtonicity/tonalityを提唱 (安田2005の解説より
・Santa Barbara:tonalityと時間情報のみ
・phrseologyの視点
チャンクの証拠としての音韻的連続性
・研究Ⅰ I don't know whyを例に,イントネーションのかたまりとphraseのかたまりの重なり・ずれを4区分で分類
・研究Ⅱ I thinkの左右のポーズ分析

Moving beyond the text
・ジェスチャーの重要性
・Kress 2011 Multimodality, first and foremost, refuses the idea of the 'priority' of the linguistic modes; it regards them ad partial means of making meaning.
・Nottingham Multimodal Corpus 25万語 大学講義(50%)とゼミの院生・教員間討論(50%)
・講義は1時間,ゼミは30分~90分
・2台のカメラで話者2人を撮る マイクは1つ (撮影で緊張して「自然さ」が損なわれる可能性も)
・倫理の問題はより複雑に(細かいうなずきや身振りをマスクしてしまっては研究に使えない)
・動画にコーディングするソフトもある(Transtool Tractorなど)
・動画とテキストをタグで関連付ける
・Digital Replay System (参考1)(参考2)で連動分析可能

Developing a framework for analyzing 'headtalk' and 'handtalk'
・back channelにはcontinuer(談話継続), convergence(同意・不同意) engaged (情意)information receipt(情報伝達を確認)の機能
・頭を下げるうなずき(nod)なども同様のback channelとして解釈可能,言語・非言語連動解釈
・短く小さいnod,やや長く小さいnod,短いが大きいnod,長く大きいnod,以上の組み合わせ型nodの5タイプに分けて分析
・nodの大きさ(intensity)は物理的な頭の移動量(amplitude 振幅角度)で計測
・眼球・頭部トラッキングソフトを使用
・手の動きの大きさは画面上に等間隔に垂直線を引いてゾーンを仮定してコーディング(腹の中央に中心座標)
★所感 膨大な手間と作業だが,得られた結果はわりと少ない(ような気もするが・・・)

Future directions

6/7 実験準備
・実験用プロトコル作成
・イラスト依頼,謝金交渉

6/8
・イラスト制作者への謝金支払いにかかる税法上の対応について事務と相談
・イラスト(1枚目)のラフを受領,修正指示

6/9
・イラスト(1枚目)のラフの修正を承認。仕上げ作業に移行。
発注者の期待を上回る出来栄えで,依頼先(本学漫画研究会)の高いパフォーマンスに感銘を受けました。

6/12 プロンプトイラスト(1枚目)納品。

6/12 LCSAW3発表者宛reminder発送。広報依頼(ML,大修館,ひつじ,くろしお,研究社)

6/13 実験参加者申し込み20名超過。実験参加者用承諾書作成・公開。 

6/17 実験準備継続
1) 被験者は本日までに33名が確保され,それぞれ7月までにインタビューをアサインしています。

2) 実験用具セットの作成・仕上げ
・マスク
ノーマスク撮影+デジタル的なマスキングも検討しましたが,音声学者の助言も受け,口の映像が見えたほうがよいこと,デジタルマスキングでは匿名化効果が限定的であることをふまえ,物理的なマスク撮影法を採用することにしました。演劇用の白マスク5ケを購入。手作業で切り取りを行い,加工しました。これに伴い,眼鏡使用被験者には,可能な場合はコンタクトレンズで来室するよう伝えました。
・シナリオ

テスター側発話のシナリオを作成し,英文校閲を受けて確定しました。OPIは当意即妙の対応が特徴ですが,本データは,ICNALE全体の開発理念と整合を取る形で,統制性の高い(自由度の相対的に低い)実験過程管理を目指しています。
・ピクチャーカード,ロールプレイカード
それぞれ作成し,ラミネート加工し,本番実験に備えました。
・デモインタビュー
イントロ(2分) ピクチャー1(3分) ロールプレイ1(3.5分) ピクチャー2(3分) ロールプレイ2(3.5分) クールダウン(2分)だと17分。15~30分とされている標準実施時間内におさまりました。
・時間管理
発話量研究の観点から,モジュールごとの時間をある程度統制すべく,ストップウォッチの使用を予定しています。



・6/17 JACET関西支部大会
名古屋市立大学の佐々木みゆき先生のご講演をうかがい,産出者(佐々木先生実験の場合は作文執筆者)による事後プロトコルをきちんと取る必要を改めて痛感し,インタビュープロトコルを修正。インタビューの最後にL1によるリフレクションセッション(個々のタスクについて「こういえばよかった」「なぜうまくいえなかったか」を振り返ってもらう)を追加しました。週明けからの実地データ取得で改訂版のプロトコルを実施予定です。

・6/19 初回データ収集
ようやくデータ収集にこぎつけました。初日は4名。久しぶりのOPIの聞き手役でしたが,かつてテスター講習で習ったことが鮮明に思い出され,楽しく行うことができました。実際に行ってみると,1人のセッションは予想よりかなり長く,40分前後になりました。OPIとしては異例の長さですが,1人の学習者の産出能力の下限と上限を余すことなく取り出せたのではないかと考えています。終了後,「こんなに長い間英語を話したのは生まれて初めてで面白かった」と言ってくれた学生が多く,うれしい驚きでした(※実験としてだけでなく,こういうトレーニングが教育的な意味でも重要だな,と再確認する機会となりました)。



なお,被験者席の後ろのスクリーンはビデオに背景が映りこまないために設置したものです。夏休みまでに50名の取得を目標にインタビューを重ねていきます。
なお,実際に回してみると,やはり被験者により,発話量に大きな差があるため,当初の方針を変更し,タスクごとの決め打ちでの時間管理(時間が来れば途中で打ち切るなど)は行わないことにしました。

・6/23 第1週として14名分のデータ収集が終了。
軽微なトラブルが3件。
(A) ビデオ機器不良による一部画像データの撮影失敗(同時に音声録音もしていたので音声データは確保) 
(B)  マスクが顔を圧迫してつらいのでいったん止めたいというリクエスト(20秒後に再開)
(C) マスクのゴムひもが途中で切れて付け直す(同じく20病後に再開)
また,紙製マスクに被験者の化粧品がついて想像以上に汚くなってしまう問題を確認。
以上のほかは問題なく進捗。

・6/24 音声データの加工
・中断が起こった上記(B)および(C)の音声データをAudacity上でつないで復元。
・書き起こしのために日本語部分をカットした音声データを作成

・英語部分の実験時間はほぼ安定していることが確認されました。
ほぼ30分程度です。この後日本語でのリフレクションが5分ほど続きます。

・6/26 書き起こし見積もり・2週目収集開始
日本語部分を切り分けないデータを「日英混在書き起こし」で見積もり取得したところ,544分で,短期納品が28万,長期納品が22万となりました。長期納品の場合も1本あたり1.6万となり(1分単価385円),こちらの予想を超えていたので,英語のみの書き起こしを優先する方向で見積もりを取り直すことに。
また,本日より第2週目のデータ収集がスタートしました。プラスチック製のマスクを新たに購入し,こちらで加工(下部きり取り)して新規に使用しました。また,実験場に,除菌用のアルコールとティッシュを用意し,気持ちよく受けていただけるよう改善しました。

・6/27 書き起こし作業書の作成と見積もり取り直し
英語のみデータ480分程度で再度見積もりを依頼し,発注しました。


-------------------------------------------------------------------

【2017年5月】
◎2017年5月の作業報告
・5/1 LCSAW3にかかる一般研究発表公募の告知
・5/20 上記締め切り,選考
・5/20 プログラム仮案作成,講師への謝金支払い関係事務作業の依頼



・5/22 プログラム(第1案)確定・広報開始
・5/23 プログラム修正
・5/23 被験者謝金支払いに関する大学宛の要望書作成・提出(実験準備)

・5/25 LCSAW3のポジションペーパー用テンプレートの公開。あわせて,ポスター発表関係の情報と交通案内をサイト上で公表。
・5/30 被験者謝金支払いの許可が当局より下りる(今後早急に被験者募集に入る予定)。
・5/31 校閲データの整理・公開にあわせ,ICNALEデータセットの全体構成を更新。新しい概念図は下記。




従来はSpoken/ Writtenの2モジュール構造でしたが,新たに下位構造を設け,収集済みのモノローグデータと,今後作成する対話データをそれぞれ適切に分類できるようにしました。また,現在収集中の作文校閲データはこれまでProofreadというモジュール名で呼ばれていましたが,本来,"proofreading"は作文のみならず,口頭産出にも適用可能な概念です。そこで,旧The ICNALE Proofreadを,新規にThe ICNALE Edited Essays(略称The ICNALE-EE)と改称し,名称上の齟齬を改称しました。今後,萌芽プロジェクトでEEの,基盤プロジェクトでDialogueの開発をそれぞれ進めていきます。なお,EEについては,V0.3を6月1日リリースしました。こちらからダウンロードいただけます(要登録)。


-------------------------------------
【2017年4月】
◎2017年4月の作業報告
4/1 採択決定
4/25 関連基本図書の発注(中高教科書+研究書約30冊)
4/25 キックアップシンポ用の会場予約(8月4日 神戸大学百年記念館)
4/26 LCSAW講師依頼(4名)
4/28 検定教科書の内容確認