講義動画の文字起こしをAIで機械的に行う

講義の録音・録画が進んだことによって、そのまま文字起こしができるとよいのではないかということをここ数日試している。

人手を使った文字起こしをお願いすると1時間13800円(東京反訳、納期一番ながいケース)とまあまあ良いお値段なので、機械的にAIをつかって安価にできないだろうかというのを試す。とりあえず無料のものの例としてYouTubeの自動字幕と、有料のものとしてTRASC(1時間2000円)を比較してみる。

TRASCの他にもRimo Voice(1時間2400円)を試したのだが、TRASCは辞書機能があって、よみがなと変換したい表記の一覧を教師として与えることができるので、2社試した限りではTRASCかなという気がしている。AI文字起こしはエンジンを3社比較できるようだ(1時間1800円)。日本語ならAmiVoiceがよさそう(三つあるのだからいいとこ取りしてマギシステムみたいにやってくれると精度があがりそうだが、そういうわけではなくどれか一つを選ぶ形式)。

無料の物の例(Youtubeの自動字幕機能)

Youtubeから字幕データをダウンロードして、タイムコードを除去したテキストが下記の通り。スライド2枚分、900字弱。

8次にプライス愛想もですねえといろんな決め方があるんですけれども
簡単に決めるんだったら例えばいくらかかって作ったのでいくらで売れなきゃいけない
みたいな京見方もあるしあとは強豪がいくら出しているのでこの位っていうのもあるし
8いくら以上だと思わさすがに買ってくれないからこのくらいにしなきゃダメだよねと
いうようなと
これでまあこの辺なんとなくでの君方なんですね
で8それ以外にもいろいろ決め方が開く風がいっぱいありますよっていうようなお話に
なってきます
ねあと安くすりゃいいっていうようなわけでもないですよとやいうようなところで
8
ものによっては高いほうが氷が売る気になってくれるとかですね
8利幅がおい製品の方頑張ってくるとそれみたいなものもありますので
8やすくすればいいというわけではないというところはてぃ威嚇スって非常にその0系
の抗菌が大きいでえっに価格
競争しないいうようなことがまあ非常に重要になっています
8セッティングの仕方はいろいろありますけどまぁ例えば定期購入してくれるんだっ
たら10%値下げしていただけますよとかあるいはそうですね
あえて高い価格をつけることによってマート研二的な商品
例えば何百万したからこれ買ったんだよいうようなところだと安くしない方がいいと
いうような
あとは成果報酬型の設定するご満足いただけないようであれば何日以内であれば返金し
ますよとか
8最初の導入の部分はやすくしておいて後から消耗品で稼ぐというような形でインク
ジェットプリンターは1万円で売るけれども
インクは偽変ですよとまあそういうような売り方です
あとは年会費か月謝かによってもその負担感覚っていうのが変わってきます
基本的にですね支払回数が多いほうが負担を感じやすくなるので年会費で払って
もらえると割とその痛みを感じないというようなところがあります
この辺税金なんかも一緒でして江藤
例えば消費税と所得税っていう意味で言うと消費税てやっぱり1日に数回払っちゃっ
たりするので
なのでちょっと値上げしようとするとすごく8国民の反発が見たところはその金額が
いくらかって言うだけじゃなくて
8どのくらいの頻度で洗うかっていうところで痛みを感じやすいかアホみたいなところ
a
いることですね

なんとなくの中身は想像できるけど、詳しい内容はぱっと頭に入ってこないレベルだろう。

有料のものの例(TRASC、試用中、一部辞書で補正)

次にプライスですね。
いろんな決め方があるんですけれども簡単に決めるんだって。
例えばいくらかかって作ったのでいくらで売らなきゃいけないみたいな決め方もあるしあとは競合がいくら出してるのでこのくらいっていうのはあるしいくら以上だとさすがに買ってくれないからこのくらいにしなきゃダメだよねと言うようなところでこの辺なんとなくでなく決め方ですね。
それ以外にもいろいろ決め方が工夫がいっぱいありますよというようなお話になってきますね。
安くすればいいというようなわけでもないですよと言うようなところでものによっては高いほうが郡が売る気になってくれるとかですね。
利幅が多い製品の方を頑張って売ろうとするみたいなものもありますので安くすればいいというわけではないというところは注意が必要ですし価格設定価格センシティビティと非常に利益への貢献が大きいので安易に価格競争をしないというようなことが非常に重要になって。
セッティングの仕方はいろいろありますけど例えば定期購入してくれるんだったら10パーセント値下げしますよとかあるいはそうですね。
あえて高い価格を付けることによって犬儒的な商品例えば何百万下から買ったんだよと言うようなところだと安くしないほうがいいというような場合は成果報酬型の設定にするご満足いただける内容であれば何日以内であれば返金しますよとか最初の導入の部分は安くしておいて後から消耗品で稼ぐと言うような形でインクジェットプリンターは1万円で売るけれどもインクは千円ですよと。
そういうような売り方。
あとは年会費か月謝かによってもその負担感覚というのが変わってきます。
基本的に支払い回数が多い方が負担を感じやすくなるので年会費で払ってもらえると割とその痛みを感じないようなところがあります。
この辺税金なんかも一緒でして例えば消費税と所得税という意味でいうと消費税ってやっぱり1日に数回払っちゃったりするのでなのでちょっと値上げしようとするとすごく国民の反発が出るみたいなところはその金額がいくらかっていうだけじゃなくてどのくらいの頻度で払うかいうところで痛みを感じやすいかどうかみたいなところにも効いてくる。

TRASCの原稿に手動で朱入れ

動画を確認せずに、文字起こしだけを見ながら文章の意味を最低限とれるように修正してみる。

次にプライスですね。
いろんな決め方があるんですけれども。
簡単に決めるんだって、例えばいくらかかって作ったのでいくらで売らなきゃいけないみたいな決め方もあるし、あとは競合がいくら出してるのでこのくらいっていうのはあるし、いくら以上だとさすがに買ってくれないからこのくらいにしなきゃダメだよね、とか。

それ以外にもいろいろ決め方が工夫がいっぱいありますよというようなお話になってきますね。安くすればいいというようなわけでもないですよと言うようなところで、ものによっては高いほうが小売りが売る気になってくれるとかですね。利幅が多い製品の方を頑張って売ろうとするみたいなものもありますので安くすればいいというわけではないというところは注意が必要ですし、価格設定は非常に利益への貢献が大きいので安易に価格競争をしないというようなことが非常に重要になってきます。

価格のセッティングの仕方はいろいろありますけど例えば定期購入してくれるんだったら10パーセント値下げしますよとか。
あえて高い価格を付けることによって顕示的な商品、例えば何百万したから買ったんだよと言うようなところだと安くしないほうがいいというような場合。
成果報酬型の設定にする。ご満足いただけない内容であれば何日以内であれば返金しますよとか。
最初の導入の部分は安くしておいて後から消耗品で稼ぐと言うような形でインクジェットプリンターは1万円で売るけれどもインクは千円ですよと。そういうような売り方。
あとは年会費か月謝かによってもその負担感覚というのが変わってきます。基本的に支払い回数が多い方が負担を感じやすくなるので年会費で払ってもらえると割とその痛みを感じないようなところがあります。
この辺、税金なんかも一緒でして、例えば消費税と所得税という意味でいうと消費税ってやっぱり1日に数回払っちゃったりするので、ちょっと値上げしようとするとすごく国民の反発が出る。その金額がいくらかっていうだけじゃなくてどのくらいの頻度で払うかいうところで痛みを感じやすいかどうかみたいなところにも効いてくる。

無駄なしゃべりを削ったり、区切り位置を修正するのが主で、意味がとれない部分の修正は900字ぐらいのこの原稿では3カ所(郡→小売り、犬儒的→顕示的、ご満足いただける→ご満足いただけない)だった。否定をとれない(ちゃんと動画ではご満足いただけないと言っている)のはちょっと困るが、まあ読めば修正できるだろう。

学生向けサービスとしてよいだけでなく、自分のしゃべりが構造的かどうかがわかるので学びがあるという印象。

授業資料を教師データにしたい

専門用語については、スライド資料に文字データがあるのだから、それを教師として使用することで文字起こしの精度を上げることができるはず。ということでAIに与える辞書を作りたい。Pythonさわったことがなかったのだが、2,3日でとりあえずなんとかなった。作業手順は以下の通り。

  1. pptxをtxtに変換(pptx2mdを使ったが、マークダウンにする必要はない。クラウドでやってくれるサービスもいろいろある。cloudconvertなど)
  2. そこから用語を抽出。形態素解析だと複合語が全部ばらばらになってしまうので、専門用語を抽出できるらしいtermextractを使った(ウェブでもやってくれるのでとりあえずそれを使った)。ただしあまり精度がよくなくて、4000弱のデータから結局手作業で800ぐらいに絞った。普通に手作業でやってもよかったかも。。
  3. 漢字→読み方を推定。Pykakasiが完璧な仕事をしてくれた。

TRASCに読み込ませられるのは500語までなので、毎回適用させる辞書を変える必要があるかも。とりあえず複数回登場する語300ほどあったので、残り200あたりを各回固有につかうことにした。

まだ数回分しかできてないので洗練させられていないが、とりあえずここまで。

タイトルとURLをコピーしました