メインコンテンツまでスキップ

外国語で作成したコーパス学習データを利用したい

はじめに

本書では、日本語以外の外国語で作成したコーパス学習データの利用方法について説明します。
以下の手順を順に実施することで、外国語で作成したコーパス学習データを利用することができます。

  • 外国語のワークスペース登録

  • 外国語の初期メッセージの登録

  • 外国語のデフォルトメッセージの登録

操作説明

外国語のワークスペース登録

  • CB3の管理画面を開きます。

  • 左のメニューから「ワークスペース」をクリックします。

  • 登録ボタンをクリックします。

外国語のワークスペースの登録が可能である場合、登録ボタンをクリックした時に以下のように言語設定欄が表示されます。

  • 言語選択欄で、登録するコーパス学習データの言語を設定してください。

  • その他の設定項目は日本語で作成する場合と同様です。詳細は機能説明書「CB3_機能説明書_管理者編【ワークスペース】」をご確認ください。

外国語の初期メッセージの登録

  • 左のメニューから「設定」をクリックして基本設定画面に遷移します。

  • 「画面表示設定画面」タブをクリックし、画面表示設定一覧画面に遷移します。

初期メッセージからチャット画面に最初に表示されるメッセージを登録します。

  • 言語選択欄に使用したい言語を設定します。

  • 初期メッセージ入力欄にその言語の初期メッセージを入力します。

※初期メッセージは言語毎に保存設定できます。

外国語のデフォルトメッセージの登録

回答の確信度がしきい値以下の場合に表示するメッセージを言語毎に登録します。

  • 言語選択欄に使用したい言語を設定します。

  • デフォルトメッセージ入力欄にその言語のデフォルトメッセージを入力します。

1つの言語にデフォルトメッセージを複数登録した場合、その中から1つが表示されます。

※デフォルトメッセージは言語毎に保存設定できます。

その他留意点(Tips)

チャット画面で外国語コーパスが使用できない場合の確認点

外国語コーパスを使用するためにチャット画面で設定が必要となります。

外国語で作成したコーパス学習データを利用するには、チャット画面での言語設定とコーパス学習データの言語が一致している必要があります。

設定値ごとの動作

  • チャット画面での言語設定
コーパス学習データの言語 チャット画面での言語設定
日本語 英語 中国語(簡体字)
日本語 日本語のまま質問、回答が行われます。 英語のまま質問し、日本語の回答が返ってきます。 中国語のまま質問し、日本語の回答が返ってきます。
英語 日本語のまま質問し、英語の回答が返ってきます。 英語のまま質問、回答が行われます。 中国語のまま質問し、英語の回答が返ってきます。
中国語 日本語のまま質問し、中国語の回答が返ってきます。 英語のまま質問し、中国語の回答が返ってきます。 中国語のまま質問、回答が行われます。
  • ブラウザの言語設定
ブラウザの言語設定
日本語 英語 中国語(簡体字)
チャット画面のユーザーインターフェースが日本語になります (※1)チャット画面のユーザーインターフェースが英語になります

(※1)ブラウザの言語設定が日本語以外に設定されている場合、チャット画面のユーザーインターフェースはすべて英語になります。

外国語ワークスペースの制約

外国語ワークスペースは日本語のワークスペースと比べ、使用するうえで以下のような制約があります。

  • 正規化機能は利用できません。

  • 同義語辞書は利用できません。

  • 外国語ワークスペースを使う場合にはチャット画面からワークスペースを指定する必要があります。

チャット画面での言語設定とワークスペースの言語が一致しない場合の設定

設定画面内の基本設定タブにある外国語対応機能設定で「可能な限り回答」のスイッチを切り替えることで、チャット画面での言語設定とコーパス学習データの言語設定が異なった場合の動作が変わります。

  • 可能な限り回答がオフの場合:言語が異なる旨のエラーを表示
    日本語のコーパスに中国語で質問したとき等で意図しない回答が返されることを防ぐことができます。
    ユーザーとワークスペースの言語が一致しない場合に、以下のメッセージを表示します。

    • ユーザーの言語が日本語の場合 :
      言語が一致していません。設定されている言語をご確認ください。
    • ユーザーの言語が日本語以外である場合 :
      The languages do not match. Please check the set language.
  • 可能な限り回答がオンの場合:可能な限り回答
    ユーザーの言語設定とワークスペースの言語設定が異なる場合でも質問文をそのまま解釈して返答することができます。
    こちらに設定する場合、デフォルトメッセージに言語が異なる可能性を指摘するものを設定することをお勧めします。