モデルの評価

モデルの品質を理解することは、良好な分割結果を得るために不可欠です。

メトリクス

train コマンドは学習後に3つの主要なメトリクスを出力します:

Accuracy = (TP + TN) / Total Instances

すべての文字位置のうち、正しく分類された割合（境界と非境界の両方を含む）です。モデル品質の最も広範な指標です。

Precision = TP / (TP + FP)

モデルが予測した境界のうち、正しかった割合です。高い適合率は、誤った境界（過分割）が少ないことを意味します。

Recall = TP / (TP + FN)

実際の境界のうち、モデルが検出した割合です。高い再現率は、見逃された境界（不足分割）が少ないことを意味します。

	境界と予測 (+1)	非境界と予測 (-1)
実際の境界	True Positive (TP)	False Negative (FN)
実際の非境界	False Positive (FP)	True Negative (TN)

モデル	正解率	適合率	再現率	学習コーパス
japanese.model	94.15%	95.57%	94.36%	UD Japanese-GSD
korean.model	85.08%	–	–	UD Korean-GSD
chinese.model	80.72%	–	–	UD Chinese-GSD

精度が不十分な場合は、以下を検討してください: