2025年6月24日公開のRAG Ready Converterで生成AI精度向上
ベストカレンダー編集部
2025年6月24日 12:11
RAG Ready Converter公開
開催日:6月24日
全てのデータをRAG Readyに変換する「RAG Ready Converter(β)」のリリース
株式会社スニフアウト(本社:東京都新宿区、代表取締役:津本海、以下「スニフアウト」)は、あらゆる形式のファイルをRAG(Retrieval-Augmented Generation)が扱いやすい形式へ変換する新システム「RAG Ready Converter(β)」を2025年6月24日10時01分に公開いたしました。本システムは、画像、Excel、PowerPoint、PDFなどの様々なファイル形式を、LLM(Large Language Model)が情報欠如なく認識可能なテキストに変換することで、RAGの精度を劇的に向上させることを目的としています。
この「RAG Ready Converter」に関する詳細情報は、次のリンクからご覧いただけます:[RAG Ready Converter LP](https://rag-ready-converter.sniffout.net/)
背景と課題
近年、生成AIの導入を目指す企業が増加しており、文書検索システムの構築などに取り組んでいます。しかし、最初から高い精度を実現できている企業は非常に限られています。その理由の多くは、RAG Readyではないデータが原因です。RAGはテキストデータを前提に設計されているため、画像や図表、フローチャートなどが混在している場合、非テキスト情報が欠落し、検索や生成精度が大きく低下することが知られています。
このような課題に対処するため、スニフアウトは、画像やPowerPoint、Excel、フローチャートなど、あらゆるファイルをRAGで取り込むことができるテキストデータに自動変換する独自技術を開発しました。この技術は現在特許出願中です。
RAG Ready Converterの概要
「RAG Ready Converter」は、画像、Excel、PowerPoint、PDFなどの多様なビジネスファイルを、スニフアウトの独自特許技術を使用して、RAGで読み込むことができるテキストデータに変換するシステムです。このシステムを利用することで、これまでRAGで取り扱うことができなかった様々なデータを扱うことが可能になり、RAGの精度が劇的に向上します。
具体的なデータ変換の事例としては、以下のようなものがあります。
- 画像: 画像内で説明されている内容を、情報欠如がないようにマークダウンやプログラムなどを使用して正しく論理構造ごと伝えることができます。
- Excel: Excelファイル内で罫線などによって表現される情報や情報の構造も含めて、情報欠如がない形でテキストに変換可能です。
- PowerPoint: PowerPoint資料内の全体の構造などを通してユーザーに伝えている情報も、情報欠如がないようにテキストに変換できます。
RAG Readyデータとは
RAG Readyデータとは、画像や表、フローチャートの矢印関係など、本来テキストではない論理構造の情報がテキストのモーダルで表現されており、情報欠如が起こらないように設計されたRAGに最適化されたテキストデータを指します。あらゆるデータをこのRAG Readyなデータに変換することで、RAGでも非テキストの情報構造を誤解なく利用でき、関連コンテキストを即座に取得し、事実に基づく高精度な回答生成が可能になります。
このように、RAG Ready Converterは、生成AIの精度向上に寄与する重要なツールとなることが期待されます。
RAG Ready Converterの特長
「RAG Ready Converter」には、以下のような特長があります。
- RAGの精度向上: クローズドベータで協力いただいた企業様での精度試験において、以下のような結果が得られました。
| 項目 | Before | After |
|---|---|---|
| RAGの精度* | 56% | 92% |
| 取扱可能ファイル率* | 22% | 91% |
*RAGの精度は、事前に準備したサンプルQAデータに合致した意味合いの回答を行った割合を集計したものです。また、取扱可能ファイル率は、テキストで構成されているRAGで正しく認識することが確認できたデータの割合です。この実験対象のうち69%(91-22)のデータがExcelやPowerPointなど、読み取りが難しかったデータであり、RAG Ready ConverterによってRAGで正しく認識できるようになったことを示しています。
- APIとGUIでの利用が可能: APIでの提供が基本ですが、GUIで操作することができるプレイグラウンドも用意されています。これにより、RAG関連サービスを提供しているベンダーや生成AIに取り組むエンジニアからビジネスサイドの方まで、幅広く利用できる形となっています。
利用方法と企業情報
「RAG Ready Converter」を利用したい方は、以下のウェブサイトから使用することが可能です。新規会員登録し、クレジットを購入すると利用が開始できます。
「RAG Ready Converter」Webページ: https://rag-ready-converter.com
株式会社スニフアウトの企業情報は以下の通りです。
- 所在地: 東京都新宿区新宿二丁目11番7号 第33宮庭ビル4階409号室
- 代表者: 代表取締役 津本海
- 事業内容: 生成AI活用支援、RAG導入コンサルティング
- URL: https://www.sniffout.net/
本件に関する報道関係のお問い合わせは、以下の情報をご利用ください。
- 広報担当: 株式会社スニフアウト
- E-MAIL: info@sniffout.net
- お問い合わせフォーム: https://sniffout.net/contact
まとめ
「RAG Ready Converter」は、あらゆる形式のファイルをRAGが扱いやすい形式へ変換するための新しいシステムで、生成AIの精度を向上させることが期待されます。特に、さまざまなデータ形式をRAG Readyなデータに変換することで、情報欠如を防ぎ、高精度な回答生成を実現します。今後、このシステムが多くの企業で活用され、生成AIの導入が進むことが期待されます。
| 項目 | 詳細 |
|---|---|
| システム名 | RAG Ready Converter(β) |
| リリース日 | 2025年6月24日 |
| 提供形式 | APIおよびGUI |
| 変換可能ファイル形式 | 画像、Excel、PowerPoint、PDFなど |
| 精度向上の実績 | RAGの精度が56%から92%に向上 |
| 取扱可能ファイル率の向上 | 22%から91%に向上 |
このように、「RAG Ready Converter」は生成AIを活用する企業にとって、非常に重要なツールとなるでしょう。