社内ChatGPT構築を無料で実現する完全ガイド
オープンソースラボ編集部 ・ 2026年6月12日
社内ChatGPT環境は、OSSツールを組み合わせることで完全無料・データ社外流出なしで構築できます。具体的には「Ollama(LLMのローカル実行)+Open WebUI(チャット画面)」の2本柱が最短ルートです。この記事では、非エンジニアの担当者でも全体像をつかめるよう、前提知識から具体的な手順、ツール選定の考え方、つまずきポイントまで順を追って説明します。
社内ChatGPT構築に必要な前提知識
なぜ社外サービスではなく自前構築なのか
ChatGPT(OpenAI)やClaude(Anthropic)などのクラウドサービスは、入力した内容がサービス提供会社のサーバーに送信されます。個人情報・顧客データ・社内機密文書を含む質問を行うと、情報漏洩リスクが生じる点が中小企業でも問題になっています。
自前でサーバーやPCにLLMを立てる「ローカル構築」または「セルフホスト」なら、データは社内ネットワークの外に出ません。料金もモデル利用分は完全無料(電気代・ハードウェアコストのみ)なので、月額数万円になりがちなChatGPT Teamの代替として注目されています。
最低限必要なハードウェア
| 用途規模 | 推奨CPU/GPU | RAM | ストレージ |
|---|---|---|---|
| 個人・小規模検証(3〜7Bモデル) | 現行世代のCore i5以上 / GPU不要 | 16GB以上 | 20GB以上の空き |
| 5〜20人の部門利用(13Bモデル) | Core i7以上 or NVIDIA RTX 3060相当 | 32GB以上 | 50GB以上の空き |
| 全社利用・高速応答(70Bモデル) | NVIDIA RTX 4090 or A100相当 | 64GB以上 | 100GB以上の空き |
GPUがなくてもCPUのみで動きますが、応答速度は大幅に落ちます。まずは手元のPCで試し、利用者が増えてから専用サーバーに移行する流れが現実的です。
OSS活用の商用利用・ライセンス確認
今回紹介するツールのライセンスは以下の通りです。商用利用の可否を事前に必ず確認してください。
| ツール | ライセンス | 商用利用 |
|---|---|---|
| Ollama | MIT | ⭕ 無料で可能 |
| Open WebUI | Other(Apache 2.0ベースのカスタム) | ⚠ 利用規約要確認 |
| LibreChat | MIT | ⭕ 無料で可能 |
なお、LLM本体(Llama 3、Qwen 2.5など)にも個別のライセンスがあります。商用利用の場合はモデル提供元の利用規約も合わせて確認してください。
ステップ別:構築の全体像と手順
社内ChatGPT環境は大きく3つのステップで構築します。
ステップ1:Ollamaでローカルにモデルを動かす
OllamaはGitHubスター数173,889(2025年時点)を誇るローカルLLM実行ツールのデファクトスタンダードです。Go言語で開発されており、macOS・Windows・Linuxすべてに対応しています。
インストールと起動の手順(概要)
- ollama.comから自分のOSに合ったインストーラーをダウンロードして実行
- ターミナル(コマンドプロンプト)で以下を入力してモデルを取得・起動
ollama run qwen2.5:7b
これだけでモデルがダウンロードされ、コマンドライン上でチャットが始まります。qwen2.5:7bの部分をllama3.2やgemma3などに変えるだけで別モデルを試せます。日本語精度を重視する場合はQwenシリーズが比較的良好です。
OllamaはOpenAI互換APIをローカルで提供するため、http://localhost:11434に対してAPIリクエストを送ることができます。この仕組みがフロントエンドとの連携を簡単にする要となります。
ステップ2:Open WebUIでChatGPT風のUIを追加する
コマンドラインでのチャットは社員への展開には向きません。Open WebUIを導入すると、ブラウザ上でChatGPTとほぼ同じ操作感のインターフェースが手に入ります。GitHubスター数は141,109と急速に伸びています。
Dockerを使ったインストール(最短手順)
Dockerが入っている環境であれば、以下の1コマンドで起動できます。
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main
ブラウザでhttp://localhost:3000にアクセスするとセットアップ画面が開きます。Ollamaが同じPCで起動していれば自動的にモデルが認識されます。
Open WebUIの主な機能
- マルチユーザー管理・権限制御(RBAC):社員ごとにアカウントを発行し、管理者・一般ユーザーの権限を分けられます
- RAG(文書へのQ&A):PDFや社内ドキュメントをアップロードして内容に基づいた回答を得られます
- 会話履歴の保存:チャット履歴がサーバーに保存されるため、業務の記録として残せます
- 完全オフライン運用:インターネット不要で動作します
ステップ3:社内ネットワークに公開する
ローカルのPCで動かしたOpen WebUIを、同じ社内LAN上の別PCからもアクセスできるようにするには、サーバーのIPアドレスを確認し、ファイアウォールでポート3000を開放するだけです。たとえばサーバーのIPが192.168.1.100なら、社員はhttp://192.168.1.100:3000にアクセスすれば利用できます。
よりセキュアに運用したい場合は、NginxやCaddyをリバースプロキシとして前段に置き、HTTPS化することを推奨します。
用途別:UIツールの選び方
チャットUIはOpen WebUIだけではありません。自社の状況に合わせて選ぶことが大切です。
LibreChatはGitHubスター数38,915のMITライセンスOSSで、OpenAI・Anthropic・Google Gemini・DeepSeekなど複数のAPIプロバイダーを1つの画面で切り替えられる点が最大の特徴です。「ローカルLLMだけでなく、特定の用途ではClaude APIも使いたい」という柔軟な運用に向いています。エージェント機能やMCP対応も備えており、開発チームの利用に特に向いています。
その他の選択肢として、シンプルさを重視するならNextChatやLobeHub、社内文書との連携を最初から重視するならAnythingLLMなども検討に値します。
| ツール | 主な強み | 向いている組織 |
|---|---|---|
| Open WebUI | 機能が豊富・オフライン完結・RAG対応 | データを外に出せない企業・全社展開 |
| LibreChat | 複数LLMプロバイダー対応・MIT・エージェント | 開発部門・API使い分けたいチーム |
| NextChat | 軽量・すぐ使える・Vercelデプロイ可 | 個人・小規模な素早い検証 |
| AnythingLLM | 社内文書Q&A特化・オールインワン | 社内ナレッジ検索を主目的にする組織 |
上の図は主要3ツールのGitHubスター数の推移を示しています。OllamaとOpen WebUIはここ1〜2年で急速に支持を集めており、エコシステムの成熟度・情報量の多さという面でも有力な選択肢です。
つまずきやすいポイントと対処法
実際の導入でよく発生する問題を事前に把握しておくことで、スムーズな構築につながります。
1. モデルの日本語精度が低い
デフォルトで勧められるLlama 3系は英語に最適化されており、日本語の文章生成精度が落ちることがあります。日本語利用の場合はまずqwen2.5:7bやgemma3:9bなど、日本語データを多く含むモデルで試してください。モデル名の後ろに:7bのようにパラメータ数が書いてあり、数字が大きいほど精度は高くなりますがPCへの負荷も増します。
2. Open WebUIがOllamaに接続できない
Dockerコンテナ内からホストのOllamaに接続するには、URLをhttp://host.docker.internal:11434と指定する必要があります。localhostと書いても接続できない点に注意してください。上記のDockerコマンドに含まれる--add-host=host.docker.internal:host-gatewayオプションがこれを解決します。
3. 応答速度が遅すぎる
CPUのみで7Bモデルを動かすと、1トークンあたり数秒かかることもあります。まず3bや4bのより小さいモデルで試し、速度が許容範囲かを確認してください。予算があればNVIDIA製GPUを追加するのが最も効果的な高速化策です。
4. ストレージ不足でモデルのダウンロードが止まる
7Bモデルで4〜5GB、13Bモデルで8〜10GB程度の空きが必要です。事前にディスク容量を確認し、必要に応じてOllamaのモデル保存先を大容量ドライブに変更してください(環境変数OLLAMA_MODELSで変更可能)。
5. セキュリティ・ユーザー管理の甘さ
Open WebUIをデフォルト設定のまま社内公開すると、初回アクセスした人が管理者になれる状態になっています。必ず最初に管理者アカウントを作成し、その後WEBUI_AUTH設定で認証を有効にしてから社員に展開してください。
よくある質問
Q. 完全無料で使い続けられますか?APIキーは必要ですか?
Ollama+Open WebUIの組み合わせでローカルモデルのみを使う場合、APIキーは一切不要で、料金も発生しません。ただし、Open WebUIからOpenAIやAnthropicのクラウドAPIに接続する機能を使う場合は、各サービスのAPIキーと利用料金が別途かかります。
Q. ITに詳しくない社員でも使えますか?
Open WebUIのチャット画面はChatGPTとほぼ同じ操作感です。ブラウザでURLを開いてログインするだけで使えるため、エンドユーザー側の学習コストはほぼゼロです。構築・保守にはDockerやLinuxの基本的な知識が必要で、この部分は情報システム担当者や外部ベンダーのサポートが現実的です。
Q. GPT-4やClaude Sonnetと比べて性能はどうですか?
無料で動かせるオープンモデル(7B〜13B規模)の性能は、GPT-4oやClaude 3.5 Sonnetには及びません。一般的なQ&A・文章要約・翻訳・コード補助などの業務では十分実用的ですが、複雑な推論や高度な文章生成では品質の差が出ます。「機密データを外に出せない用途」と「高性能が必要な用途」でツールを使い分ける運用が現実的です。
Q. 社内文書を読み込ませてQ&Aさせることはできますか?
Open WebUIにはRAG(Retrieval-Augmented Generation)機能が標準搭載されており、PDFやテキストファイルをアップロードしてその内容に基づいた回答を得ることができます。より本格的な社内ドキュメント検索システムを構築したい場合は、AnythingLLMのような文書Q&A特化ツールも選択肢になります。
まとめ:まず小さく始めて段階的に拡張する
社内ChatGPT構築の最短ルートは、Ollama+Open WebUIをローカルPCに入れて動作確認することです。費用はゼロで、最短1〜2時間で動く環境が作れます。その後、利用者の反応を見ながらサーバー移行・HTTPS化・ユーザー管理強化を段階的に進めていくのが失敗の少ない進め方です。
複数のLLMプロバイダーを使い分けたい場合はLibreChat、音声入力を組み合わせたい場合はWhisperとの連携も検討してみてください。OSSコミュニティは非常に活発で、半年前は難しかった機能が今では標準搭載されているケースも多くあります。まずは手元で動かしてみることが、自社に合った活用法を見つける一番の近道です。


