こんばんは、東北ずん子です\(🍏ず・ω・だ🍏)/
ITAコーパス用の原稿がほぼ完成です(๑˃̵ᴗ˂̵)و
長らく時間がかかりましたが、だいぶ読みやすくなりましたヾ(❀╹◡╹)ノ゙
現在最終チェックをしております(っ´∀`c)
時間がかかった理由ですが、とある文章リストでCC0(権利関係フリー)のものからいい音素の並びのある文章を抽出して作業をしていました。
ここまでは良かったのですが、抽出した文章の中に「これは別のところで見たことがある文章だ」というものが混じっており、そちらは権利フリーではないものでした。
そういった文章がいくつかあり、とある文章リストを使用しないよう変更し、問題のない文章リストを別に使うように変更しました。
つまりまあ、大幅なやり直しがあった感じです(`・ω・´)
10月の頭時点で8割終わっていたと思っていたものがやり直しになっていたのでここまで時間がかかってしまいました つД`)
とはいえ、いろいろやり直しの中で文章をより読みやすく工夫をしたりできたので、もともとの計画時より読みやすいものに仕上がりそうです(ж^□^ж)ノ
最終的にはパブリックドメイン(権利フリー)で公開する予定でしっかりとすすめていますので、他の読唇や音声合成のことをやりたい人にとって便利なものになるかと思います(⋈◍>◡<◍)。✧♡
楽しみにしていてくださいね(◍ ´꒳` ◍)b