嶋田研で作成し,公開しているもしくは公開予定のデータやツールです.

金鷲旗/玉竜旗大会の戦評自動生成システム

西日本新聞社との「記事の自動生成システム」に関する共同研究の成果として,令和元年度の金鷲旗/玉竜旗大会の戦評自動生成システムがTwitter上で稼働しています.
本システムに関する情報が7月23日(火)の西日本新聞朝刊と7月28日(日)の西日本新聞朝刊「オピニオン:AIのある未来へ」に掲載されました.
システム開発は本研究室の塩田 宰くんが担当し,技術的には田川 and 嶋田 (2018)の前半部分の内容を本共同研究のために改良したものが利用されています.

Kyutechディベートコーパス

2名1組のペアに対するディベートコーパス(合計4名での対話)です. このコーパスのデータは前半が討論(ディベート)で後半が合意形成になっています. それぞれが5対話あり,合計で10対話が収録されています. 討論・合意形成とも20分間の対話です.
※本研究は科研費 17H01840 および 20K12110 の助成を受けたものです.

対話データ [Download] Version 1.0版
※データの詳細については,上記データファイル中の塩田宰の修士論文をご確認ください.

コーパスそのものには音声情報,顔情報,姿勢情報を数値化したデータも存在しますが,サイズが大きいため(10GB程度),テキスト(発話)データだけを公開しています. マルチモーダルなデータが必要な場合は 九工大・嶋田 までお問い合わせください.
ライセンス:
 本コーパスは自由にご利用頂けます.ただし,改変や再配布等は禁止します.

本コーパスに対して,ご意見やご要望がありましたら,下記までご連絡ください.
■九州工業大学 大学院情報工学研究院 知能情報工学研究系
 嶋田 和孝(

Kyutechコーパス

4人の話者による意思決定タスク対話です.参加者は架空のショッピングモールの経営者という役割で,ショッピングモールのレストラン街に新規出店するレストランを3件の候補の中から1つ選択します. 対話の前にショッピングモールの情報,ショッピングモールのある市の人口などの統計情報,隣接する町や市の統計情報,候補店の情報,既存店の情報などが書かれた資料が渡されます. その資料を10分黙読したのち,20分の対話を行います.
書き起こした各発話にはその発話のトピックが振られています. また,議論内容の要約データも含まれています.
※本研究は科研費 26730176, 17H01840, 20K12110 の助成を受けたものです.
対話データ・対話資料一式 [Download] Version 3.0版
トピック単位の参照要約と抽出要約を含むデータです(Ver.1.0 および Ver.2.0 のデータは含んでいませんのでご注意ください.)
発話の単位はVer1.0と同じです.
対話データ・対話資料一式 [Download] Version 2.0版
※抽出要約と対話行為タグを含む Version 2.0 です.
ただし,対話行為については Version 1.0 と発話の単位が少し異なりますのでご注意ください(長い発話単位).
対話データ・対話資料一式 [Download] Version 1.0版
※参照要約を含む Version 1.0 を公開しました(2016/9/25).
ライセンス:
 本コーパスは自由にご利用頂けます.ただし,改変や再配布等は禁止します.

本コーパスに対して,ご意見やご要望がありましたら,下記までご連絡ください.
■九州工業大学 大学院情報工学研究院 知能情報工学研究系
 嶋田 和孝(

雑談対話コーパス

4人の参加者による対話データです.参加者はある1つのトピック(今年のプロ野球など)を与えられ,それについて雑談をしています. 対話データには,盛り上がり度,笑いの有無,各発話の重要度などのタグが振られています.
対話データ一式 [Download]
ライセンス:
 本コーパスは自由にご利用頂けます.ただし,改変や再配布等は禁止します.

本コーパスに対して,ご意見やご要望がありましたら,下記までご連絡ください.
■九州工業大学 大学院情報工学研究院 知能情報工学研究系
 嶋田 和孝(

Tatara: アノテーションツール

下記の論文で発表されたアノテーションツールを公開予定でしたが,作成者の卒業などに伴い,公開を取りやめております. 申し訳ありません.ご理解のほどをよろしくお願いいたします.