教師データ整形
投稿:豊田太郎
英語圏ではAI生成したコントのみを投稿するYoutubeチャンネルが5.8万の登録者数を達成するなど、目覚ましい進捗が見られます。 https://www.tiktok.com/@netaai_tiktok/video/7427091549193817352 https://www.tiktok.com/@netaai_tiktok/video/7425200588641668360 上記ネタの教師データはさらば青春の光, ファイヤーサンダー, Aマッソ, 相性はいいよね, うしろシティ,かもめんたる, シティホテル3号室, 等です。バラシまでかなり駆け足になっているのは、tiktokのエンゲージメント率を低下させないための処置です。 ネタにおいて頻用される構文を、一つずつ手作業でLLMに理解できる形式に書き換え、それらを統計データに基づいた順序で出力するという半自動型のお笑いAIの生成について私は研究しています。 「あれ?このボケを使っているネタを他に3個見た事があるぞ?」という経験がおありでしょうが、まさにそのように頻出する表現を大量にラベル付けして運用するという発想です。 https://github.com/tarotoyota/agent 現状、十分な専門性と十分な資金をもってお笑いAIの開発に取り組んでいる団体は日本に存在しません。 断言しますが、当分まともなエンジニアや資本はこのレースに参入しません。ただでさえ少ない日本人AIエンジニアは今日、お笑いを自動化するよりも儲かる目標をたくさん持っています。 お笑い史はAI史の中に姿を消すわけですが、この転換点の今日、一緒にお笑いAIを作る仲間を募集します。 AIお笑い史に名を残す試みが、人力お笑い史に名を残す試みの何倍現実的か考えて下さい。このレースは今ガラガラです。 作業内容は、お笑いにおける構文を、特定のルールに従って数式のように書き換えるだけというものです。 プログラミング未経験者でも問題ありません。 詳しくは tarotoyotagithub gmail com までお知らせください。