今年もそろそろ年の瀬ですね。
2022年を振り返ってみると、本当に様々なことが起きた激動の一年でしたが、IT業界、WEB開発業界においても変化の大きい一年だったと感じています。
その中でも特に世間を賑わせた技術といえば、そう画像生成AIの急速な発展です。
特にここ半年ほどの技術の進歩は凄まじく、日々新しいサービス・アルゴリズムが発表されている状態です。
私もWEB開発者としてこのビッグウェーブに乗るべく、日々の業務に役立ちそうなAIをピックアップしてみました。
なお、本稿では『AI』 『機械学習』 『ディープラーニング』といった単語をシビアに分類せず用いることがありますが、それぞれの定義としては
AI ⊃ 機械学習 ⊃ ディープラーニング(深層学習)
という関係です。
この記事では最も狭義的な『ディープラーニング』に含まれる『AI』を主に紹介しますが、記事のタイトルとしてはざっくりと『AI』という表現にしました。
最初は今やディープラーニング界の寵児、Stable Diffusionです。
出力したいイメージを文章で指示すると、その通りの画像を自動生成してくれます。
AIが理解する言語は今のところ英語のみなので、この後紹介するDeepLも使って"呪文(プロンプト)"を編みましょう。
ちなみにこちらの写真は私が生成した「リモートワークを邪魔する猫(フェルメール作)」ですが、猫が邪魔される側になった上に大変有名な絵画の影響を受けてしまい、結果として想像以上に良い雰囲気の作品が仕上がってしまいました。違う、そうじゃない。
https://huggingface.co/spaces/stabilityai/stable-diffusion
他にも、入力した画像の「外側」を予想して生成する機能があるDALL・E 2や、コンセプトアート系に強いMidjourneyといった画像生成AIが存在します。
それぞれ少しずつ得意分野が違うので、目的に合わせて使い分けるのが良さそうです。
WEBクリエイターならみんなお世話になっている『先生』ことAdobe Sensei。
Photoshopなどに標準で組み込まれているAI機能群です。
不要な要素を自動的に塗りつぶす「コンテンツに応じた塗りつぶし」機能が有名ですが、ワンクリックで背景ごと削除できたり、古い写真を復元できたりと、日々アップデートで進化しています。
https://www.adobe.com/jp/sensei.html
Senseiの機能と似ていますが、動画から個人情報をマスキングする機能に特化したAIサービスも見つけました。
このMasking-AIは、車のナンバーや通行人の顔など、動画の中の個人情報に紐づく部分をAIに自動的にマスキングしてもらえるサービスです。
WEB制作というより動画制作の範疇になりますが、動画のマスキング作業をやったことがある人ならこの有難みがわかるはず。
こういう作業こそAIに任せたい仕事と言えそうです。
https://www.deep-consulting.jp/masking-ai/
ご存じ、自動翻訳の世界に革命を起こしたディープラーニング翻訳ツールDeepL。
英日でも日英でもその他の言語でも、極めて自然な文章に翻訳してくれます。
Google翻訳もかなり進化しましたが、文章のこなれ感はDeepLがかなり抜けている印象です。
ただ、たまに頓珍漢な文章を出したりセンテンスごと抜けたりするので、公に発表する文章であれば人の目のチェックはまだ必要でしょう。
英文でサポートに問い合わせるくらいの用途では「貼って出し」でガンガン使っていけます。
https://www.deepl.com/ja/translator
最近はオンラインMTGが当たり前になってきましたが、対面であろうとオンラインであろうと、人の発する音声というのはアナログデータなので、話した内容を簡単にコピペしたり保存することはできません。
...というのは過去の話で、最近はこのRimo VoiceのようなAIによる文字起こしの精度が格段に上がっているので、そろそろ議事録を人の手でまとめるという作業も要らなくなりそうです。
人物写真素材はモデルリリースに気を付けなくてはいけないことが多く、かといってフリー素材だと「どこかで見たことがある人」だらけになりがちです。
でもこのGenerated Photoを使えば他のサイトや広告と被ることはありません――なぜならここで提供される人物写真はすべて架空の人間の顔だから。
年齢や表情、メイクの有無などオープンワールドゲームのキャラメイクばりにオプションが豊富なので、試すだけでも面白いです。
画像生成AIが描いた絵がコンテストで入賞してしまったという出来事が象徴するように、いよいよAI製と人間製の区別がつかない時代がやってきました。
今までも、チェスや将棋など「AIが得意そうな分野」ではすでに人間を凌駕していましたが、恐ろしいのは「AIが苦手だと思われていた分野」、つまり新しいものを創造したり芸術性が求められたりといった領域で人間を超えようとしていることです。
ただし、あくまでAIというのは「人間の判断」を真似て動くものなので、そこに意思があるわけではないんですよね。
便利なツールとしては活用しつつ、必要以上に振り回されないように、ヒューマンビーイングとしての意思はしっかりと持ち続けていたものです。
とはいえ、かつて故星新一氏のショートショートに夢中な少女時代を過ごした身としては、AIを搭載したロボットが意思を持ってコミュニケーションするSFの世界にも早く出会いたいと思ったりします。