プレースメント用のスピーキングテストは,大勢が短時間で受験でき,判定が簡便で,信頼性や妥当性の高いテストが理想である。そこで,筆者らはテストタスクと,ルーブリックと音声サンプルによる判定ツールの開発に着手した。テストの信頼性や妥当性を検証するため,開発した判定ツールを用いて初級から上級の受験者32名の「断り」のタスク結果を日本語教師4名に判定してもらう実験を行った。判定結果は,プレースメント時の読解などの受容能力より産出能力を示す作文と,リスニング要素を含むSPOTとの相関が高かったことから基準関連妥当性を一定程度満たしていると言える。判定者間の一貫性や相関も高く,受験者1名あたりの判定時間が1~2分であったことからも,本タスクと判定ツールは,簡便で一定の信頼性も確保できていると言える。ただし,中級の判定は初級や上級より難しいことがうかがわれた。