設定・操作
Table of Contents
- Monadic Chat Console
- GPT Settings
- Monadic Chat Info Panel
- Session Panel
- Speech Panel
- PDF Database Panel
- Dialog Panel
Monadic Chat Console
Start
Monadic Chatを起動します。初回起動時はDocker上での環境構築のため少し時間がかかります。
Stop
Monadic Chatを停止します。
Restart
Monadic Chatを再起動します。
Open Browser
Monadic Chatを使用するためにデフォルト・ブラウザーを開いてhttp://localhost:4567
にアクセスします。
Quit Monadic Chat Consoleを終了します。Monadic Chatが起動している場合は、Monadic Chatを先に停止するため、少し時間がかかります。
GPT Settings
API Token
ここにはOpenAIのAPI keyを入れます。有効なAPI keyが確認されると、Monadic Chatのルート・ディレクトリに.env
というファイルが作成され、その中にOPENAI_API_KEY
という変数が定義され、その後はこの変数の値が用いられます。
Base App
Monadic Chatであらかじめ用意された基本アプリの中から1つを選択します。各アプリでは異なるデフォルト・パラメター値が設定されており、固有の初期プロンプトが与えられています。各アプリの特徴については Base Appsを参照してください。
Select Model
OpenAIが提供するモデルの中から1つを選びます。各アプリでデフォルトのモデルが指定されていますが、目的に応じて変更することができます。
Max Tokens
Chat APIにパラメターとして送られる「トークンの最大値」を指定します。これにはプロンプトとして送られるテキストのトークン数と、レスポンスとして返ってくるテキストのトークン数が含まれます。OpenAIのAPIにおけるトークンのカウント方法についてはWhat are tokens and how to count themを参照してください。
Context Size
現在進行中のチャットに含まれるやりとりの中で、アクティブなものとして保つ発話の最大数です。アクティブな発話のみがOpenAIのchat APIに文脈情報として送信されます。インアクティブな発話も画面上では参照可能であり、エクスポートの際にも保存対象となります。
Temperature
Top P
Presence Penalty
Frequency Penalty
以上の要素はパラメターとしてAPIに送られます。各パラメターの詳細はChat APIのReferenceを参照してください。
Initial Prompt
初期プロンプトとしてAPIに送られるテキストです。会話のキャラクター設定や、レスポンスの形式などを指定することができます。各アプリ の目的に応じたデフォルトのテキストが設定されていますが、自由に変更することが可能です。
Initiate from the assistant
このオプションをオンにすると、会話を始める時にアシスタント側が最初の発話を行います。
Start Session
このボタンをクリックすると、GPT Settiingsで指定したオプションやパラメターのもとにチャットが開始されます。
Monadic Chat Info Panel
Monadic Chat Info
関連するウェブサイトへのリンクとMonadic Chatのバージョンが示されます。API Usage
をクリックするとOpenAIのページにアクセスします。API Usageで示されるのはAPI使用量の全体であり、Monadic Chatによるものだけとは限らないことに注意してください。バージョン番号の後の括弧には、Monadic Chatをインストールした際の様式に応じて、DockerもしくはLocalが表示されます。
Current Base App
現在選択している基本アプリの名前と説明が表示されます。Monadic Chatの起動時にはデフォルトのアプリであるChat
に関する情報が表示されます。
Session Panel
Reset
Reset
ボタンをクリックすると、現在の会話が破棄され、初期状態に戻ります。アプリの選択もデフォルトのChat
に戻ります。
Settings
Settings
ボタンをクリックすると、現在の会話を破棄しないで、GPT Settingsパネルに戻ります。その後、現在の会話に戻るにはContinue Session
をクリックします。
Import
Import
ボタンをクリックすると、現在の会話を破棄し、外部ファイル(JSON)に保存した会話データを読み込みます。また、外部ファイルに保存された設定が適用されます。
Export
Export
ボタンをクリックすると、現在の設定項目の値と会話データを外部ファイル(JSON)に保存します。
Speech Panel
NOTE: 音声認識機能を使用するにはGoogle ChromeまたはMicrosoft Edgeブラウザを使用する必要があります。
Automatic Language Detect
この設定をオンにすると、音声認識と音声合成の際に、使用言語を自動で検知します。このとき、合成音声のボイスはデフォルトのものが使用されます。この設定をオフにすると、音声認識と音声合成の言語をLanguage
セレクターで指定できます。また、合成音声のボイスをVoice
セレクターで指定できます。
Language
Automatic Language Detect
がオフのとき、ここで音声認識と音声合成に使用する言語を指定できます。指定できる言語はOSとブラウザーによって異なります。音声認識はWhisper APIを通じて行われるため、Whisper API FAQに記載されている言語のみが可能です。
Voice
Automatic Language Detect
がオフのとき、ここで音声合成に使用するボイスを指定できます。指定できるボイスはOSとブラウザーによって異なります。
Rate
音声合成の際の発話スピードを0.5から1.5の間で指定することができます(デフォルト:0.0)。
PDF Database Panel
NOTE: このパネルはPDF読み込み機能を備えたアプリを選択しているときだけ表示されます。
Uploaded PDF
ここには、Import PDF
ボタンをクリックしてアップロードしたPDFのリストが表示されます。PDFをアップロードする際に、ファイルに個別の表示名を付けることができます。指定しない場合はオリジナルのファイル名が使用されます。複数のPDFファイルをアップロードすることが可能です。PDFファイル表示名の右側のゴミ箱アイコンをクリックするとそのPDFファイルの内容が破棄されます。
Dialog Panel
Buttons on Message Boxes
Copy the message text to the system clipboard
Play text-to-speech of the message text
Delete the message text
Edit the message text (Note: This deletes all the messages following it)
Current status of the message (Active)
Current status of the message (Inactive)
Use easy submit
Auto speech
Use easy submit
がオンの時には、Send
ボタンをクリックしなくても、キーボードのEnterキーを押すと自動的にテキストエリア内のメッセージが送信されます。もし音声入力中であれば、Enterキーを押すか、Stop
ボタンをクリックすることで、自動的にメッセージが送信されます。Auto speech
がオンの時には、アシスタントからのレスポンスが返ってくると自動的に合成音声での読み上げが行われます。
Use easy submit
とAuto speech
が両方ともオンの時には、キーボードのEnterキーだけで音声入力開始と音声入力停止を行うことができ、それに応じて動的にメッセージ送信とレスポンスの音声合成が行われるので、ユーザーとアシスタントとの間で音声による会話が実現します。
Role
テキストエリア内のメッセージがどのRoleによるものかを指定します。デフォルトはUser
です。それ以外の選択肢はAPIに対して先行文脈として送信する会話データを調整するために用います。User (to add to past messages)
を選ぶと、ユーザーからのメッセージが会話に追加されますが、APIには直ちに送信されず、後で通常のUser
Roleによるメッセージが送信されるときに、文脈の一部として一緒に送信されます。Assistant (to add to past messages)
のRoleも基本的にこれと同様です。System (to provide additional direction)
は会話自体の設定を追加したいときに用います。
Send
このボタンをクリックするとテキストエリア内のメッセージがAPIに送信されます。
Clear
このボタンをクリックするとテキストエリアをクリアします。
Voice Input
このボタンをクリックすると、マイクを通じての音声入力が開始され、ボタン上の表示がStop
に変わります。Stop
ボタンをクリックすると音声入力を停止します。音声入力中はボタンの右側に音量のインジケーター表示されます。