社内データ学習機能

ChatGPTと自社文書でRAGを構築

社内の様々なファイルやWebページ、Notionページを学習させることで、社内問い合わせに的確に回答するチャットボットを作成可能。 学習機能は何度でも無料で利用可能かつ操作性に優れており、組織内のデータの更新に追従します。

無料で始める
RAG illustration
多様な社内資料を想定

学習できるデータの種類

ファイルから学習

社内の各種ファイルから学習を行うことができます。ファイルはアップロードされると瞬時に学習され、すぐにボットの応答に反映されます。
マニュアル、 議事録、 契約書、 報告書、 ⼿順書、 FAQ、 規約・規程などあらゆる社内文書を想定しており、テキストファイル(.txt)、 マークダウンファイル(.md)、 PDFファイル(.pdf)、 Wordファイル(.docx)の形式に対応しています。

Files

Webから学習

WebページのURLを入力するだけで、そのページのテキストを抽出し、学習を行います。不要なHTMLタグは自動的に除外されるので、ノイズによるボットの回答精度の低下を防ぎます。
自社のホームページやFAQサイト、ブログ記事などを想定しています。

Web
Notion

Notionから学習

Notionで社内Wikiの構築や社外向けマニュアルを運用している場合、それらのページを学習対象とすることができます。 ご利用のNotionアカウントと連携するとそのアカウントが管理するページを自動的に取得。そこからチャットボットに与えたいものを選択し、学習を行います。
今後はNotion側で内容の変更があった場合にその差分を自動的に取得し、再度学習を行う機能も追加予定です。

Notion
利用者目線に立った機能

社内データ学習機能の特徴

自社データ・社内ファイルを用いたチャットボットの学習は無料で行えます。ファイルサイズ・文字数・学習回数などに制限はなく、内部資料の更新や追加があっても常にチャットボットを最新に保つことができます。

チャットボットの学習は管理画面上で行えます。特別な設定やチューニングは不要で、ファイルアップロードなど直感的な操作のみで完結。また、チャットボットの作成や学習機能は管理者様のみがアクセス可能です。

学習に利用したデータはOpenAIなど外部の企業に利用されることはありません。社内資料のデータの保存はベクトルデータベース内のみに限定され、ストレージやその他のデータベースには保存しない構成となっています。

チャットボットが質問に回答する際は、どの文書のどの箇所を参照したかを提示します。学習の元データにはURLを紐づけられるので、社内の共有フォルダなどのオリジナルファイルにすぐにアクセス可能です。

新技術を採用

ChatGPTとRAG

ChatGPTなどのLLMに独自のデータを与えたうえで回答を生成させる仕組みは
RAG (Retrieval-Augmented Generation) と呼ばれ、Dooxではこの技術を活用しています。

ChatGPTのみの利用

  • オープンな情報を元にした受け答えのみしかできない
  • LLMが最後にアップデートされた時点までの情報しか学習していない
  • 誤った回答をしてしまうハルシネーションの問題がある
Without RAG illustration

ChatGPTをRAGで拡張

  • 社内情報などクローズドな情報を活用した受け答えができる
  • LLMへの質問の際に情報を与えるため、最新のデータでも回答に反映される
  • どの情報を元に回答されたかを提示可能で、回答の根拠やソースが明確
With RAG illustration
無料で始める