コンテンツにスキップ

コロケーション分析

TCSEは、検索語と頻繁に共起する語を発見するためのコロケーション分析を提供しています。自然な語の組み合わせを理解し、語彙力の向上に役立ちます。

アクセス方法

  1. Collocation をクリックしてコロケーションモードに切り替える
  2. 検索語を入力する
  3. Colloc 2 または Colloc 3 タブをクリックする

  4. Colloc 2: 2語のコロケーション(検索語を含むバイグラム)を表示

  5. Colloc 3: 3語のコロケーション(検索語を含むトライグラム)を表示

コロケーションモードの Colloc 2 / Colloc 3 タブ

ソートオプション

コロケーション結果は、さまざまな統計的指標でソートできます:

指標 説明
MI(相互情報量) 2つの語がどの程度強く結びついているかを測定する。値が高いほど、特定性の高い強いコロケーションを示す。
t-score 結びつきの強さと頻度のバランスをとる指標。頻度が高く信頼性のあるコロケーションを見つけやすい。
Freq(頻度) 単純な共起頻度数。
DP(Delta P) 方向性のある結びつき指標。語Aが与えられたとき、語Bの出現確率が全体の確率と比べてどれだけ高いかを示す。

MIスコア順のコロケーション結果

レンマベースの集約

コロケーション結果はレンマ(基本形)ごとに集約されます。つまり、同一語のすべての活用形が1つのエントリにまとめられます。例えば "make" で検索すると:

  • "make + mistake" (freq=109) — "make a mistake", "makes mistakes", "made a mistake" などを統合
  • "make + decision" (freq=218) — すべての活用形を統合

これにより、語同士の真のコロケーション強度をより正確に把握できます。レンマにマウスオーバーすると、集約されたすべての表層形が確認できます。行をクリックすると、レンマ検索構文を使ってすべての用例を検索します。

コロケーション・ネットワーク

コロケーション関係の視覚的な概観を得るには、Network タブを使用してください。詳しくはコロケーション・ネットワークを参照してください。

ヒント

  • MIスコアは出現頻度が低いが強く結びついた組み合わせを見つけやすい
  • t-scoreは学習者に役立つ、頻度が高く信頼性のあるコロケーションの発見に適している
  • 異なるソートオプションを試すと、語の組み合わせに関するさまざまな視点が得られる
  • コロケーションをクリックすると、トランスクリプトコーパス内でのその用例を検索できる
  • レンマのセルにマウスオーバーすると、集約されたすべての表層形を確認できる