12.8 C
Japan
木曜日, 7月 7, 2022

【国内初】キーワードから約6秒で文章生成!日本語の文章執筆AI ”ELYZA Pencil”を一般公開

東京大学松尾研発・AIスタートアップ、株式会社ELYZA(イライザ)は、キーワードから約6秒で日本語の文章を生成できる大規模言語AIの開発に成功しました。また、同モデルを用いた文章執筆AI”ELYZA Pencil”(イライザ ペンシル)をデモサイトとして一般公開しました。

文章執筆AI”ELYZA Pencil”とは

2021年8月に公開し、5日間で13万人利用の反響を得たELYZA DIGESTに次ぐ第2弾の大規模言語AIが公開されました。

ELYZA Pencil”は、キーワードを数個入力するだけで、約6秒で日本語のタイトルや文章を自動生成する文章執筆AIです。ELYZA独自の大規模言語AIを用いることで高精度な生成型の文章執筆を可能にしました。今回の一般公開デモではニュース記事、ビジネス用のメール、職務経歴書の生成機能を提供します。

今後、ELYZAはホワイトカラーが持つ「書く」業務を生成型の文章執筆AIでサポートしていきたいと考えています。 「書く」「まとめる」「読む」「答える」などの多様なホワイトカラー業務を大規模言語AIでサポートすることにより、全国民のホワイトカラー業務10%以上をAIへ代替できる可能性があるのではないかと想定しています。

“ELYZA Pencil”の公開は、キーワードから文章生成できる日本語の大規模言語AIとして、国内初の一般公開となります。

“ELYZA Pencil”は、下記URLより登録不要で利用できます。
▶︎https://www.pencil.elyza.ai/

AIによる文章執筆の例は以下になります。

社内検証で東大生に比べ執筆時間は56分の1。流暢性は同水準という結果

ELYZA Pencilによる文章生成の速度や精度評価を行うために、以下の観点でAIと人間(東大生)の執筆について比較検証を行いました。

検証概要

・選定したキーワードを用いて「東大生3名」と「ELYZA Pencil」で文章を生成
・ニュース記事・職務経歴書・メールの執筆の平均スコアを比較
・「速度」「流暢性」「正確性」「キーワード含有率」の観点で評価

評価結果

●「速度」の比較
 ELYZA Pencilの執筆平均速度は「6.4秒(※)」で、東大生の作業時間の56分の1
 ※ニュース記事、メール文、職務経歴書を10回ずつ作成した際の平均所要時間
●「流暢性」の比較
 ELYZA Pencilは東大生とほぼ同じ水準で執筆できることがわかった
●「正確性」の比較
 正確性を示す事実と異なる記載をした率では、東大生が「20%」、ELYZA Pencilが「27%」となった
●「キーワード含有率」の比較
 東大生が「100%」、ELYZA Pencilが「94%」であった

東大生と ELYZA Pencilの「速度」「流暢性」「正確性」「キーワード含有率」の比較

ELYZA Pencilは「正確性」「キーワード含有率」については東大生に負けるものの、「速度」は56分の1と圧倒的なスピード差をつけ、「流暢性」では同等水準の結果となった。

どのような「未踏」への挑戦なのか

文章作成・メール作成・記事作成など高度に言葉を扱うホワイトカラーとAIのさらなる共存

この度公開した”ELYZA Pencil”で用いられている文章執筆AIを改善していくことで、言葉を扱うホワイトカラーの生産性を向上させていくのが目標です。

具体的には、デスクワークにおける文章作成、顧客対応におけるメール作成、メディア運営における記事作成など、あらゆるホワイトカラー業務で発生する「書く」業務について、多数のユースケースでの活用を想定しています。

実用化まで一歩届いていなかった言葉を扱うAI、近年のブレイクスルーにより実用化へ

音声認識や画像認識分野における技術の発展により、対話の音声データや紙のスキャン画像から「テキストデータに変換できる」段階までAI活用が進んでいます。一方、そのテキストデータを「言葉として理解し活用するための技術」(NLP)が「人間に遠く及ばない」精度にとどまっていたため、ホワイトカラー業務を代替/サポートする上では不十分なことが多く実用化が一部の領域に限定されていました。

そのような中、2018年秋にブレイクスルーが起き、Googleより大規模言語AI「BERT」が発表され、2019年にはNLP分野で「人間を超える」精度を達成しました。そのため、英語ではNLPの最先端技術を実用化したサービスや事例が誕生しています。

一方、日本語では言語特性に依存する技術的な難易度の高さや公開されているデータ量の問題から、NLPの最先端技術の実用化が遅れていました。

ELYZAは、この状況に問題意識を持ち、2020年にBERT以降の大規模言語AIと同社独自の大規模データセットを活用した日本語特化AIエンジン「ELYZA Brain」を開発しました。その後、ELYZA Brainの改良を行いつつ、日常・ビジネスの場でよく発生する「文章生成」という問題設定に特化し、この度、文章執筆 AI”ELYZA Pencil”をお披露目するに至りました。

”ELYZA Pencil”は、大規模言語AIを用いて高精度な生成型の文章執筆AIを作る試みとなります。結果として、キーワードを入れるだけで約6秒で精度の高い文章を生成することが可能になりました。

AIを用いた文章の生成には大きくテンプレート型と生成型の2つが存在しますが、”ELYZA Pencil”では、難易度の高い生成型を採用することで、多様な種類の文章を臨機応変に執筆することができるようになりました。

技術の詳細

”ELYZA Pencil”はAIが一から文章を作成する「生成型」

イライザは日本語特化の大規模言語AIを独自に開発しており、”ELYZA Pencil”では「生成型」と呼ばれる、成功例が国内ではまだ少ない技術を用いています。さらに生成型の中でも、意図した文章を生成する方向に制御する技術として「キーワードを元にAIが一から文章を生成する形式」を取っています。

AIによる文章生成はテンプレート型生成型の大きく2種類のモデルがあります。それぞれの特徴は下記画像をご参照ください。

”ELYZA Pencil”では、テンプレート型と比べて技術的難易度の高い生成型を採用しています。多様な文章を生成可能な大規模言語AIを元に構築をしており、状況に応じて臨機応変に文章を生成することを可能にしています。

また、特定の業務に特化させることが可能で、生成文の多様性と制御可能性の両方の観点から実用に足るAIとなっています。さらに”ELYZA Pencil”ではキーワードを指定することにより、執筆したい内容のコントロールを行いやすくしているのも特徴です。

なぜ高精度の生成型文章生成モデルを作れたのか

今回の取り組みでは、ELYZA独自の日本語の大規模言語AIを活用することで、高精度な文章執筆AIを開発しました。当AIモデルの構築には、最先端の自然言語処理技術の知見に加え、大量の日本語テキストを集め学習させることが必要ですが、この要件を満たす企業は国内に多くありません。

東京大学・松尾研究室に出自を持ち、最先端技術の社会実装を目指す同社では、BERTが登場した2018年以降大規模言語AIの研究開発を進めており、2020年にはBERT以後の大規模言語AIと弊社独自の大規模データセットを活用した日本語特化AIエンジン「ELYZA Brain」を開発しました。

その後も、「ELYZA Brain」の改良だけでなく、タスクに特化した改善を継続的に実施しており、その活動の成果の1つとして今回の”ELYZA Pencil”の公開に至りました。

”ELYZA Pencil”一般公開の背景

なぜ同AIモデルを社会へ公開するのか

3年前まではAIによる自然な文の生成は難しい状況にありました。その後、大規模言語AI「BERT」が2018年10月に登場し状況が変わり、英語では大規模言語AIをベースに人間並みの文の生成をはじめとした、読解・要約・翻訳などができるモデルが登場しつつあります。

上記のように大規模言語AIでは大きく技術が進んでおり、最新技術を扱える技術力・ノウハウと大量のテキストデータを掛け合わせることで、主にホワイトカラー領域における大幅な業務効率化ができる可能性があります。

しかし、他のAI技術と同様に、海外と比較して日本では大規模言語AIの理解が遅れており、結果として実用化も遅れています。今回の文章執筆AIはあくまでも大規模言語AIで起きている大きな変化の一部ですが、そのパラダイムシフトをより多くの方に体験・理解してもらうことで、日本における大規模言語AIを活用したホワイトカラー業務のDXを少しでも前に進めることができればという思いで公開しました。

今後の展望

今回、ELYZAはキーワードを数個入力するだけで約6秒で日本語のタイトル・文章を自動生成する「書く」AIを一般公開しました。

大規模言語AIが可能とするのは「書く」ことだけでなく「文章をまとめる」「文章を読んで整理する」「質問に答える」など様々です。

同社では、全国民のホワイトカラー業務の10%以上をAIへ代替できる可能性があると想定しており、今後、ホワイトカラーが行っている「書く」業務をはじめ、「まとめる」「読む」「答える」といった業務をAIでサポートできる世の中にしていきたいと考えています。

また、テキストを大量に保有してる企業との共同研究も積極的に行い、大規模言語AIの社会実装も加速させていく予定です。

株式会社ELYZAについて

株式会社ELYZAは、「未踏の領域で、あたりまえを創る」という理念のもと、日本語の大規模言語AIに焦点を当てて企業との共同研究やSaaSプロダクトの開発を行なっています。「まとめる、書く、読む、答える」といったこれまで難しいとされていた自然言語処理を実用化し、ホワイトカラー業務のDXを推進していきます。

<会社概要>

社名株式会社ELYZA
設立2018年9月
代表者代表取締役 曽根岡侑也
所在地〒113-0033 東京都文京区本郷3-15-9 SWTビル
URLhttps://elyza.ai/
Facebook コメント
PORT編集部https://port.creww.me/
PORT by Crewwは、Creww株式会社が運営する、社会課題をテーマに、新規ビジネス創出を目指すスタートアップ、起業家、復業家、 企業をつなぐ挑戦者のためのオープンイノベーションメディアです。
- Advertisment -

Featured

EBRU、アーティストや職人が手仕事で制作するBluetoothイヤホンの製作事業で注目!

【スタートアップスタジオインタビュー】アーティストや職人が手仕事で制作するBluetoothイヤホンで注目されているのが、佐藤怜さんが2021年4月に創業した株式会社EBRU。様々なウェアラブル製品が生み出されており、日常的に体に装着し続けても負担にならず、なおかつデザイン性や個性を表現できる製品開発が日進月歩で進んでいます。こうした動きに拍車がかかる中、Bluetoothイヤホンに注目した ‶アート×音楽×ファッション” な取り組みが話題に。株式会社EBRUの佐藤怜さんに、事業の特徴や今後の課題などについてお話をお聞きしました。 #EBRU #Bluetooth #イヤホン #スタートアップスタジオ #Creww #大挑戦時代をつくる

【募集】浜松市で実証実験&事業化を目指しませんか。全国からスタートアップを募集

【オープンイノベーションインタビュー】国土縮図型都市である静岡県浜松市では、本日より「令和4年度実証実験サポート事業」のプロジェクト募集を開始!全国のスタートアップに対して1年間、市内実証実験フィールドの提供や広報活動、最大200万円の助成、法制度に関するアドバイスを実施。さらに「トライアル発注制度」を新設して実験後の出口支援も強化するという。具体的にどのようなスタートアップを募集するのか。浜松市産業部スタートアップ推進課主幹の新村仁氏に話を伺った。 #募集 #浜松市 #アクセラレータープログラム #アクセラレーターインタビュー #オープンイノベーション #スタートアップ #CrewwGrowth #大挑戦時代をつくる #Creww

【公募】循環炭素社会を目指し、スタートアップや起業家予備軍を含む研究者らを助成!

【オープンイノベーションインタビュー】循環炭素社会の構築を目的として誕生した一般社団法人カーボンリサイクルファンドは、民間からの寄付金を原資にシード/アーリーステージのスタートアップにとって必要な見返りを求めない“GAPファンド”として、循環炭素社会の実現に向けてイノベーションを起こそうとする大学・企業等の研究者(研究チーム)に助成金を交付している。そんな同団体が開催する助成活動について、イノベーション部/部長代理 鹿島淳氏に話を伺った。 #募集 #カーボンリサイクルファンド #アクセラレータープログラム #インタビュー #オープンイノベーション #スタートアップ #CrewwGrowth #大挑戦時代をつくる #Creww

【Creww ×メリービズ】管理部門の働き方を先進的にする、スマートバックオフィス

さまざまなスタートアップから次々と誕生している、バックオフィス業務のSaaSサービス。Crewwは、それらのサービスを複数導入することで、管理部門における新しい働き方とキャリアを創出し、社会に広めていくための「スマートバックオフィス化」を進めています。そこで、Crewwが導入している「バーチャル経理アシスタント」を提供する、メリービズの長谷龍一氏と、Creww取締役の高橋彗に、バックオフィスをデジタル化することの価値について話を伺いました。
Facebook コメント