言葉が人間から離れる瞬間

リリース当時あまりに高度な文章を生成するために、フェイクニュースなど悪用されるのではと騒がれた、自然言語処理のツール「GPT-2」。

イーロンマスクらが投資したことでも有名な人工知能の研究機関OpenAIが開発したことでも話題になりました。

「危険すぎる」と話題の文章生成AI「GPT-2」の最新版がリリース、実際に使えるデモサイトも登場
人工知能を研究する非営利組織のOpenAIが開発したAIによる文章生成ツール「GPT-2」は、高精度のテキストを簡単に自動生成できるといわれており、開発陣が「あまりにも危険過ぎる」と危惧するあまり論文公開が延期される事態にまで発展しました。そんなGPT-2は2019年2月、5月、8月と段階的にパラメーターを増やしたモデルが公開されてきましたが、ついに15億個ものパラメーターを持つ最新版がリリースされました。

それがどれほどのものか?

数日前にGPT-2を活用した日本語の小規模データセットが、Hugging Face社(自然言語処理に特化した米国のディープラーニング開発企業)のサイトにリリースされていたので早速ためしてみました。

GPT-2自然言語生成ツールのセットアップ

Google Colabが使える方は以下をコピーして試してみてください。

Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
view raw gpt-2.ipynb hosted with ❤ by GitHub

こちらのウェブサイトに日本語を入れて試すこともできます。

モデル構築している方のサイトも興味深いです。

自然言語処理が進化して、人間が書いた文章かAIが書いた文章かは見分けがつかなくなることって、ホモデウスの入り口というか、ちょっと怖い体験ですね。

当然OpenAI側もこうした自動生成された文章を検出するAIも開発しているのですが、結局AIが生成して、AIが検知するって、人間はどこかに置いてけぼりにされる未来がホラー感満載。

とはいえ、そんな杞憂してばかりではなく、まずは体験して思考してみること。大事。

早速みていきましょう。

「創庵とは」はなにか?をGPT−2に聞いてみた

創庵とは、宋時代の徽宗の私室を復興させることを目的として、南宋時代の建築様式’, ‘創庵とは、中国南宋の儒学者、徽宗復斎の弟である紹宗復斎’, ‘創庵とは、江戸時代中期(宝暦時代)に、江戸浅草新伝馬町8番地…

もしこれが、wikipediaに書き込まれていたとしたら、疑いもなく受け入れてしまいそうな自然な言語生成。恐ろしい。創庵ということばだけで、これだけそれらしく膨らませるなんて。

もう一度聞きます。

創庵とは『山海経』などの経典において、その原本(古写経)’, ‘創庵とは、日本天台宗の開祖である大覚禅師の教えである禅を説く’, ‘創庵とは、江戸時代中期の臨済宗寺院であった。明治以降、東京妙心寺が廃’

やはり言葉ヅラから、どうしても仏教的ななにかにつながるのが興味深い。

尻切れ具合がまた、なんともリアルというか。

もっと違う角度からせめて来ないかな。次は「創庵という会社」という単語から生成してみます。

創庵という会社を作っており、その息子から土地を購入し、土地の借家、家賃’, ‘創庵という会社があった。現在、同社では、日本の伝統文化を大事にしたいと考え、’, ‘創庵という会社を立ち上げた。当初は無尽の社員が社内に集まり、社員は様々な部署’

というか、息子から土地を購入って、生々しいな。日本の伝統文化を大事にするあたりは共感もてるけど、無尽の社員ってなんだろう?頼母子講かなにかか?

日本のウィキペディアから学習しているせいで、結構危険な実名と紐づいたりして、ここにペーストできないパターンが数回。

別の視点で行ってみましょう。

「幸せとは」なにか?をGPT−2聞いてみた。

幸せとはなんだと。」という発言をした。また、同じ番組内では同年10月21′, ‘幸せとはかけがえのない愛と幸せに満ちている。ラプラスは自分が愛する家族’, ‘幸せとは何か「未来に向かって生きる」こと。未来への願いは、現実から「今の生活’

なんだろう。それっぽい言葉をマッシュアップしている感じ。

「ブログを書き続けるということ」について

最後に「ブログを描き続けるということ」について

ブログを書き続けるということがコンセプトである。2015年10月1日に3作目のCD『Love you’, ‘ブログを書き続けるということと、自分自身の創作活動を支援することに決めた。2016年12月15日’, ‘ブログを書き続けるということも併せて述べている。また、8月10日に1st EP「T’

ぷはっw

3作目のCD『Love you’」ってなんだそりゃ。

Love youの続きも気になる。

人工知能によって生成される文章がただの言葉遊びの域をでない感もあって、妙な安心感もある反面、精度があがって違和感を感じなくなったら、本当に怖い。

いつの間に自分のブログもAIが勝手に書き足すような時代も、きっとすぐくるし、もうすでに多くの情報がAIによって自動生成されているんだろう。

こうやってわざとAIも下手に書いてきているのかもしれない。など、色々勘繰りながら、まだこうして牧歌的なネタにできる時代があっという間に終わってしまう未来に向けて、いま書いておく。

自分の文章すらが、下手になってきて、AI的になってきた。飲み込まれる。。2016年3月….

Photo by Amador Loureiro on Unsplash