ABEJA和NEDO公开征集的 “后5G信息通信系统基础设施增强研究与开发项目/后5G信息通信系统开发” 通过了法学硕士开发项目计划

Abeja · 02/01 10:00

人とAIの協調により「ゆたかな世界を、実装する」株式会社ABEJA（本社：東京都港区、代表取締役CEO：岡田陽介、以下「ABEJA」）は、国立研究開発法人新エネルギー・産業技術総合開発機構（以下「NEDO」）が公募した「ポスト5G情報通信システム基盤強化研究開発事業※1／ポスト5G情報通信システムの開発」に当社提案の「LLM※2の社会実装に向けた特化型モデルの元となる汎化的LLM」が採択されましたことをお知らせいたします。

ABEJAは、主にLLMの構築に必要となる計算リソースについて、7億円規模の助成金の交付を受ける予定です。

ABEJAは、LLMの社会実装に必要不可欠となる精度および計算コストパフォーマンスの飛躍的な向上を目的に、日本語LLMおよび周辺技術（RAG※3、Agent※4）の研究開発を行います。

また、LLMの利活用の推進や社会全体におけるAI技術革新の加速、次世代の研究者や技術者の育成に貢献できるよう、開発したLLMおよびソースコードや開発ノウハウなどを適宜公開してまいります。

なお、当社の事業化においては、デジタル版EMS「ABEJA Platform」に2023年より搭載している「ABEJA LLM Series」と合わせ、広く提供を行う予定です。ビジネスモデルは、オープンソースソフトウェア(OSS)※5におけるディストリビューションモデル※6を想定しており、公開するLLMの利活用に伴い必要となるサポートを有償で提供する予定です。

ABEJAは、2018年より生成AIの一つであるLLMにおける研究開発を進め、2023年3月以降は、「ABEJA LLM Series」をABEJA Platformに搭載し、顧客企業に提供してまいりました。現在は、顧客企業のLLMの実装を実現すべく、サポート領域をより広範囲に拡大し、戦略策定やビジネスプロセスの構築、ビジネスプロセス上での運用まで、一気通貫で顧客支援を担うとともに、更なるサービスの拡充を図り、LLMの研究開発を継続して進めております。

ABEJAはこのたびの採択を受け、当該事業は、当社の経営理念である「ゆたかな世界を、実装する」を実現する上でも意義のある取り組みであり、社会全体におけるLLMの実装を加速させる一助を担うと考えております。

現在、世界中の企業がLLMを中心とする生成AIから生み出される巨大な価値の享受を目指し、様々な取り組みを開始しています。実際、LLMの市場規模は急速な拡大が見込まれており、日本での対話AIビジネスの市場規模は楽観的なシナリオで2023年度の140億円から2027年度には6,905億円（年間平均成長率165.0％、CAGR：2023年度-2027年度）に成長すると予想されており（出所：株式会社シード・プランニング「2023年版対話AIビジネスの現状と将来展望」）、ABEJAにおいてもベースシナリオとして2,000億円規模の市場を見込んでおります。

LLMの利活用により産業構造に大きな変革が生じることが期待されている一方、現状では、LLMの利用時に大規模な計算リソースの消費が不可避となるため、投資対効果を勘案すると適用範囲に制約が生じ、LLMの社会実装の妨げの一因となっています。また、LLMが抱える課題の代表的なものとして、最新の情報や更新された情報に対応しない「知識のカットオフ」や、事実に基づかない不正確な情報を生成する「ハルシネーション」があります。これは、LLMの知識が膨大な量の「既存の」データに基づいており、「学習データに存在する不備や誤情報も学習する」というLLM特有の性質に基づくものです。LLMの精度向上には、誤った情報や偏った情報を含むデータを排除し、正確で信頼性の高いデータを学習させることが必要不可欠です。対処手法として、学習済のLLMに新たなデータセットを用いて追加学習させる「fine-tuning」がありますが、都度大規模な計算リソースを消費し、コストや時間がかかります。このため、一部のエンタープライズ企業の適用に限られているのが実情です。2023年にOpenAIが、「GPT-3.5 Turbo」のfine-tuning機能を発表しましたが、対応可能なデータ量は4,096トークン、50MB以下のファイルに限定されており、実用性に課題があります。

こうした現状の課題解決に有望視されている手法に、「RAG（Retrieval-Augmented Generation）」があります。RAGは、LLMと外部のデータベースや情報源（以下「外部データ」）を結びつけ、LLMが外部データの知見を組み込んだ回答を生成できる技術です。fine-tuningを都度行うことなく、外部データを入れ替えるだけで、外部データに関連する高精度な回答を行うことが可能となります。また、「Agent」の最適化を行うことで、入力された内容を基にLLMが自律的にAPIやツール活用など必要なアクションを計画・実行できるようになります。

ABEJAは、RAGによる精度の向上およびAgentの最適化が、計算コストパフォーマンスを向上させ、経済的合理性や適用範囲の拡張性をもたらし、LLMの社会実装を強力に推進すると考えております。現在用いられるRAGには、技術進歩の余地があると捉えており、LLMおよび周辺技術（RAG、Agent）の研究開発に統合的に取り組むことで、実用性の高い先駆的な手法を実現してまいります。なお、LLM単体の研究開発においては、オープンソースの既存LLMをベンチマークとし、公開時にJGLUE※7の全項目で、トップスコアを達成することを目標としています。

ABEJAは、今後、日本が国際的なAI分野において重要な役割を担い、国際社会における情報処理技術の新たなスタンダードの確立をすることを視野にいれております。

ABEJAは、生成AIを利活用する企業や組織の増加、社会におけるAI技術革新の大幅な加速、そして次世代の研究者や技術者の育成を目的に、研究開発で得られたLLMおよびソースコードや開発ノウハウなどを社会に提供することでLLMの社会実装を推進し、ABEJAの企業理念である「ゆたかな世界を、実装する」の実現に努めてまいります。

事業概要

公募事業名	ポスト5G情報通信システム基盤強化研究開発事業／ポスト5G情報通信システムの開発
当社応募事業名	LLMの社会実装に向けた特化型モデルの元となる汎化的LLMに関する研究開発
実施期間	2024年2月～2024年8月
目　的	・LLMの社会実装に向け、汎用的な活用を見据えた日本語LLMと周辺技術（RAG、Agent）の研究開発・研究開発で得られた成果物（LLM、ソースコード、開発ノウハウなど）を公開し、生成AIの利活用、社会におけるAI技術革新の加速、次世代の研究者や技術者の育成を推進する・国際的なAI分野において、日本が重要な役割を担い、国際社会における情報処理技術の新たなスタンダードを確立する
概　要	・特化型の元となる汎化的なLLMの研究開発 - オープンソースのLLMをベンチマークとし、評価でトップスコアを達成 - 周辺技術（RAG、Agent）の精度を向上し、データ活用を推進・社会実装に向け、自社ビジネスに関連させた展開を図り、一部モデル・ノウハウ等の成果物も公開・提供 - 研究開発したLLMと周辺技術（RAG、Agent）を、現在提供しているサービスと合わせて広く提供 - 研究開発で得られた成果物（ソースコード・モデル・開発ノウハウ）を公開
NEDO公表内容	採択結果公表ページ URL：https://www.nedo.go.jp/koubo/IT3_100304.html

■ 全体概要図（イメージ）

■ 実施スケジュール

用語について

※	用　語	内　容
1	ポスト5G情報通信システム基盤強化研究開発事業	日本国内におけるポスト5G情報通信システムの開発・製造基盤強化を目指し、中核となる技術を開発する事業。ポスト5G情報通信システムとは、第5世代移動通信システム（5G）より更に超低遅延や多数同時接続といった機能が強化されたポスト5Gに対応した通信システムを指す。https://www.meti.go.jp/policy/mono_info_service/joho/post5g/index.html
2	LLM	Large Language Modelの略称で、生成AIの領域の一つである大規模言語モデル。
3	RAG	Retrieval-Augmented Generationの略称。外部のデータベースや情報源を結びつける技術。この技術の活用により、LLMが外部のデータベースや情報源の知見を組み込んだ精度の高い回答を生成できるようになる。
4	Agent	Agentは、自律的なアクションを計画・実行できるようにする技術。この技術を用いることで、LLMが自律的に意思決定をして、入力された内容を基にAPIやツールの活用などのアクションを計画し実行できるようになる。これにより、自律的に学習データに含まれていない外部データを用いた回答を作成することが可能になる。
5	オープンソースソフトウェア(OSS)	利用者の目的を問わず、無償でソースコードを使用、調査、再利用、修正、拡張、再配布が可能なソフトウェアの総称。
6	ディストリビューションモデル	OSSの提供会社または他のコミュニティで開発した、OSSを組み込んだモデルに必要になる保守やバグ、セキュリティなどアップデートに関するサポートを行うビジネスモデル。ABEJAは、このたびの事業化において「Red Hat Enterprise Linux(RHEL)]の手法を想定。
7	JGLUE	日本語の一般的な言語理解能力を測るためのデータセット群。LLMモデルを様々な観点から評価する。

■ 株式会社ABEJAについて

ABEJAは、「ゆたかな世界を、実装する」を経営理念とし、「ABEJA Platform」を基盤に顧客企業の基幹業務のプロセスを変革し、ビジネスの継続的な収益成長の実現に伴走する「デジタルプラットフォーム事業」を展開しています。2012年の創業時よりABEJA Platformの研究開発を進めており、これまで多種多様な業界・業態の300社以上のデジタル変革をABEJA Platform上で実現してきました。また、「Human In the Loop」をはじめとする高度なノウハウやアプローチを用いて、デジタル変革に必要不可欠な「人とAIの協調」を実現し、戦略的かつ効率的に顧客の基幹業務を変革し、さらにはビジネスモデルの革新に取り組んでいます。

本社：東京都港区三田一丁目1番14号 Bizflex麻布十番2階

設立：2012年9月10日

代表者：代表取締役CEO 岡田陽介

事業：デジタルプラットフォーム事業

URL：https://abejainc.com

株式会社ABEJA（总部：东京都港区；代表董事兼首席执行官：冈田洋介；以下简称 “ABEJA”）是由国家研究与开发公司新能源和工业技术开发组织（以下简称 “NEDO”）提出的 “后5G信息通信系统基础设施增强研发项目*1/后5G信息通信系统开发”（以下简称 “NEDO”）通过人类与人工智能的合作 “实现一个富裕的世界” 很高兴地宣布，“LLM” 已被选中。

ABEJA计划获得7亿日元的补助金，主要用于建造法学硕士所需的计算资源。

ABEJA进行日本法学硕士和外围技术（RAG*3，Agent*4）的研究和开发，目的是显著提高准确性和计算成本效益，这对于LLM的社会实施至关重要。

此外，我们将酌情披露已开发的LLM、源代码、开发知识等，以便我们可以促进LLM的利用，加速整个社会的人工智能技术创新，并为下一代研究人员和工程师的发展做出贡献。

此外，在我们的商业化过程中，我们计划将其与 “ABEJA LLM系列” 一起广泛提供，后者自2023年以来已安装在数字EMS “ABEJA平台” 上。该商业模式假设开源软件 (OSS) *5 采用分发模式*6，并计划为即将发布的 LLM 的使用提供必要的收费支持。

自2018年以来，ABEJA一直在推动LLM（一种生成式人工智能）的研发，自2023/3年起，“ABEJA LLM系列” 已安装在ABEJA平台上并提供给客户公司。目前，为了实现对客户公司的LLM的实施，我们已将支持范围扩大到更广泛的范围，并负责通过战略制定、业务流程构建和业务流程中的运营一直为客户提供支持，我们正在努力进一步扩展我们的服务，继续推进LLM的研发。

ABEJA最近已被采用，我们认为该项目是实现我们 “实现富裕世界” 管理理念的一项有意义的举措，将有助于加快LLM在整个社会的实施。

当前，世界各地的公司正在启动各种举措，目的是享受以LLM为中心的生成式人工智能所产生的巨大价值。实际上，在乐观的情景下，LLM的市场规模预计将迅速扩大，日本对话人工智能业务的市场规模预计将从2023财年的140亿日元增长到6905亿日元（平均年增长率165.0％，复合年增长率：2023-2027年）（资料来源：种子规划有限公司 “2023年对话人工智能业务的现状和未来前景”），同时也是基于ABEJA的预测假设市场规模为2000亿日元。

尽管预计LLM的利用将导致产业结构发生重大变化，但目前，使用LLM时大规模计算资源的消耗是不可避免的，因此，考虑到投资回报率，就会对应用范围进行限制，这是阻碍LLM社会实施的原因之一。此外，LLM 面临的典型问题是无法响应最新信息或更新信息的 “知识截止”，以及 “halcination”，后者生成不基于事实的不准确信息。这是因为LLM知识基于大量的 “现有” 数据，它基于LLM的独特特性，即 “甚至学习数据中存在的不完整性和错误信息”。为了提高LLM的准确性，必须消除包含不正确或有偏见信息的数据，并学习准确可靠的数据。作为一种应对方法，有 “微调”，即使用已经学习的LLM的新数据集进行额外的学习，但是每次都会消耗大量的计算资源，这既昂贵又耗时。出于这个原因，现实情况是它仅限于某些企业公司的应用程序。OpenAI在2023年宣布了 “GPT-3.5 Turbo” 的微调功能，但是可以处理的数据量仅限于4,096个令牌和50 MB以下的文件，因此在实用性方面存在问题。

“RAG（检索增强生成）” 是一种被视为有望解决当前此类问题的方法。RAG是一种将LLM与外部数据库和信息源（以下简称 “外部数据”）联系起来的技术，并允许LLM结合外部数据中的知识生成答案。只需替换外部数据，无需每次都进行微调，就可以执行与外部数据相关的高精度答案。此外，通过优化 “代理”，LLM将能够根据输入内容自主计划和执行必要的操作，例如使用API和工具。

ABEJA认为，通过RAG和优化代理提高准确性将提高计算成本性能，带来经济合理性和应用范围的可扩展性，并有力地促进LLM的社会实施。我们认为，目前正在使用的RAG还有技术进步的空间，我们将通过整合LLM和外围技术（RAG，Agent）的研究和开发，实现具有高度实用性的开创性方法。请注意，在LLM独立研发中，现有的开源LLM用作基准，目标是在发布时在所有JGLUE*7项目中获得最高分。

ABEJA正在考虑日本未来将在国际人工智能领域发挥重要作用，并在国际社会中建立信息处理技术的新标准。

ABEJA通过向社会提供通过研发获得的LLM、源代码、开发知识等，促进LLM的社会实施，其目的是增加使用生成式人工智能的公司和组织的数量，大幅加速社会中的AI技术创新，培养下一代研究人员和工程师，并努力实现ABEJA的企业理念 “实现一个宽敞的世界”。

业务概述

公开发行企业名称	后5G信息通信系统基础设施提升研究与开发项目/后5G信息通信系统开发
我们申请的企业名称	研究和开发广义法学硕士作为社会实施法学专业模型的基础
实施期	2024/2 到 2024/8
目的	・研究开发日本法学硕士及周边技术（RAG、Agent），着眼于LLM的社会实施的通用用途・披露通过研发获得的可交付成果（LLM、源代码、开发知识等），促进生成式人工智能的利用，加速社会人工智能技术创新，培养下一代研究人员和工程师・日本将在国际人工智能领域发挥重要作用，并在国际社会建立信息处理技术的新标准
概述	・作为专业化源泉的广义法学硕士研究与开发 -使用开源 LLM 作为基准在评估中获得最高分 -提高外围技术（RAG、Agent）的准确性并提高数据利用率・在社会实施方面，我们的目标是与自己的业务相关的发展，同时披露和提供一些模型和专有技术等可交付成果 -我们提供我们研究和开发的各种法学硕士和外围技术（RAG、Agent）以及我们目前提供的服务 -发布通过研发获得的可交付成果（源代码、模型、开发专有技术）
NEDO 出版物详情	收养结果发布页面网址：https://www.nedo.go.jp/koubo/IT3_100304.html

■ 总体概述图（图片）

■ 实施时间表

关于条款

※	条款	内容
1	后5G信息通信系统基础设施增强研发项目	一家开发核心技术的企业，旨在加强日本国内后5G信息通信系统的开发和制造基础设施。后5G信息通信系统表示与后5G兼容的通信系统，与第五代移动通信系统（5G）相比，具有进一步增强的功能，例如超低延迟和多个同步连接。https://www.meti.go.jp/policy/mono_info_service/joho/post5g/index.html
2	哈哈	它是大型语言模型的缩写，大规模语言模型是生成式人工智能的领域之一。
3	抹布	检索增强生成的缩写。连接外部数据库和信息源的技术。通过利用这项技术，LLM将能够根据来自外部数据库和信息来源的知识生成高度准确的响应。
4	代理人	代理是一种使计划和执行自主行动成为可能的技术。通过使用这项技术，LLM可以自主做出决策，计划和执行行动，例如根据输入的内容使用API和工具。因此，可以使用学习数据中未包含的外部数据自主创建答案。
5	开源软件 (OSS)	一个通用术语，指无论用户的目的如何，都可以免费使用、研究、重用、修改、扩展和重新分发源代码的软件。
6	分发模型	由 OSS 提供商或其他社区开发的一种商业模式，提供与包含 OSS 的模型所需的维护、错误、安全和其他更新相关的支持。ABEJA假设这种商业化采用 “红帽企业 Linux（RHEL）] 方法。
7	JGLUE	一组用于衡量日语一般语言理解能力的数据集。LLM 模型是从不同的角度进行评估的。

■ 关于株式会社ABEJA

ABEJA的管理理念是 “实现一个宽敞的世界”，并且正在开发 “数字平台业务”，该业务将基于 “ABEJA平台” 改变客户公司的核心业务流程，并继续实现业务利润增长。自2012年成立以来，我们一直在促进ABEJA平台的研发，到目前为止，我们已经在ABEJA平台上为不同行业和业务类别的300多家公司实现了数字化转型。此外，利用 “Human In the Loop” 等先进的专业知识和方法，我们实现了 “Human AI 协调”，这对于数字化转型至关重要，可以从战略上高效地转变核心客户运营，并且还在努力创新商业模式。

总部：东京都港区三田1-14 Bizflex 麻布十番二楼

成立时间：2012/9/10

代表：代表董事兼首席执行官冈田洋介

业务：数字平台业务

网址：https://abejainc.com

声明：本内容仅用作提供资讯及教育之目的，不构成对任何特定投资或投资策略的推荐或认可。更多信息

ABEJA、NEDOが公募した「ポスト5G情報通信システム基盤強化研究開発事業／ポスト5G情報通信システムの開発」に、LLM開発事業案が採択

ABEJA和NEDO公开征集的 “后5G信息通信系统基础设施增强研究与开发项目/后5G信息通信系统开发” 通过了法学硕士开发项目计划

风险及免责提示

声明