コンテンツにスキップ

コロケーション分析

TCSEは、検索語と頻繁に共起する語を発見するためのコロケーション分析を提供しています。自然な語の組み合わせを理解し、語彙力の向上に役立ちます。

アクセス方法

  1. N-gram をクリックしてNグラムモードに切り替える
  2. 検索語を入力する
  3. Colloc 2 または Colloc 3 タブをクリックする

  4. Colloc 2: 2語のコロケーション(検索語を含むバイグラム)を表示

  5. Colloc 3: 3語のコロケーション(検索語を含むトライグラム)を表示

N-gram モードの Colloc 2 / Colloc 3 タブ

ソートオプション

コロケーション結果は、さまざまな統計的指標でソートできます:

指標 説明
MI(相互情報量) 2つの語がどの程度強く結びついているかを測定する。値が高いほど、特定性の高い強いコロケーションを示す。
t-score 結びつきの強さと頻度のバランスをとる指標。頻度が高く信頼性のあるコロケーションを見つけやすい。
Freq(頻度) 単純な共起頻度数。
DP(Delta P) 方向性のある結びつき指標。語Aが与えられたとき、語Bの出現確率が全体の確率と比べてどれだけ高いかを示す。

MIスコア順のコロケーション結果

ヒント

  • MIスコアは出現頻度が低いが強く結びついた組み合わせを見つけやすい
  • t-scoreは学習者に役立つ、頻度が高く信頼性のあるコロケーションの発見に適している
  • 異なるソートオプションを試すと、語の組み合わせに関するさまざまな視点が得られる
  • コロケーションをクリックすると、トランスクリプトコーパス内でのその用例を検索できる